Gen lúa mỳ ngày nay được tập hợp thành ít chuỗi hơn nhưng lớn hơn ADN và che phủ các đoạn mà các lần tập hợp trước đây không đề cập đến, như các đoạn phức tạp lặp đi lặp lại hình thành nên khoảng 80% chuỗi ADN.
Lúa mỳ có bộ gien rất lớn và phức tạp được tạo ra bởi sự lai giống của ba loại cỏ có liên quan mật thiết, trong đó mỗi loại có bộ gien lớn riêng. Đây thực sự là một vấn đề phức tạp gây khó khăn cho các nhà khoa học trong nhiều năm nay.
Đạt được dấu mốc này là một nỗ lực lớn của các nhà nghiên cứu Anh nhằm xác định và hiểu rõ gien lúa mỳ và nhìn sâu vào mối liên kết giữa chúng để hỗ trợ các chương trình lai giống. Trong phát triển mới nhất, hàng tỷ thành phần cần được sắp xếp và tập hợp trong 3 tuần để hoàn thiện trên một trong các siêu máy tính lớn nhất của Anh.
Để tập hợp bộ gien lúa mỳ, Bernardo Clavijo, trưởng nhóm Nghiên cứu và Phát triển thuật toán tại TGAC đã tiến hành biến đổi chủ yếu với một phần mềm gọi là DISCOVAR, trong một hợp tác được thiết lập bởi Federica Di Palma, Giám đốc Khoa học của TGAC. Để đảm bảo tất cả tính phức tạp của chuỗi ADN được bảo quản trong quá trình tập hợp, Federica đã kiểm tra kỹ lưỡng phần mềm.
Số liệu ban đầu công bố là nguồn thông tin mới đối với các nhà nghiên cứu lúa mỳ thế giới và các nhà lai giống phản ánh các nguyên tắc thành lập của Quỹ Lúa mỳ trong việc chia sẻ dữ liệu và tìm kiếm hỗ trợ thông qua hợp tác để giải quyết thách thức lớn toàn cầu nuôi sống dân số gần 10 tỷ người vào năm 2050. Dữ liệu sẽ được công bố rộng rãi vào ngày 12/11/2015. Bộ dữ liệu đầy đủ, với các gien đã được xác định, sẽ được công bố từ cơ sở dữ liệu Ensembl của Viện Tin học sinh học châu Âu (EBI) vào cuối năm nay. Đây là cột mốc quan trọng trong dự án nghiên cứu do BBSRC tài trợ với sự phối hợp của TGAC, JIC, Viện Tin học sinh học châu Âu và Nghiên cứu Rothamsted.