Validation of genotyping-by-sequencing analysis in populations of tetraploid alfalfa by 454 sequencing.

Rocher, S., Jean, M., Castonguay, Y., et Belzile, F.J. (2015). « Validation of genotyping-by-sequencing analysis in populations of tetraploid alfalfa by 454 sequencing. », PLoS ONE, 10(6: Article number e0131918), p. 1-18. doi : 10.1371/journal.pone.0131918  Accès au texte intégral (en anglais seulement)

Résumé

Le génotypage par séquençage (GBS, pour genotyping-by-sequencing) est une technologie à haut débit relativement peu coûteuse qui repose sur le séquençage de nouvelle génération et s’applique aux espèces orphelines sans génome de référence. Combiner la réduction de la complexité du génome et le multiplexage avec des code‑barres génétiques constitue une façon simple et abordable de caractériser la variation allélique entre les échantillons ou les populations de végétaux. Nous avons effectué le GBS sur des banques de gènes ApeKI avec de l’ADN de 48 génotypes de chacune des deux populations hétérogènes de luzerne tétraploïde (Medicago sativa spp. sativa) suivantes : le cultivar synthétique Apica (ATF0) et une population dérivée (ATF5) obtenue après cinq cycles de sélection récurrente visant une tolérance supérieure au gel. Nous avons obtenu près de 400 millions de lectures des deux pistes d’un séquenceur Illumina HiSeq 2000, que nous avons analysées au moyen du pipeline UNEAK (Universal Network-Enabled Analysis Kit) conçu pour les espèces sans génome de référence. Après avoir appliqué des filtres au niveau de l’ensemble complet des données, nous avons obtenu 11 694 loci à polymorphisme mononucléotidique (SNP, pour single nucleotide polymorphism). Environ 60 % de ces loci présentaient une correspondance significative avec le génome synténique de Medicago truncatula. La fiabilité des rapports alléliques et des appels de génotypes fondés sur les données du GBS a été analysée directement à l’aide du séquençage 454 sur un sous-ensemble de loci SNP cotés dans huit échantillons de plante. Dans la présente étude, la profondeur de séquençage n’a pas suffi à l’obtention de dosages alléliques exacts chez les tétraploïdes, mais des appels de génotypes fiables fondés sur le dosage allélique des diploïdes ont été obtenus grâce à l’utilisation de filtres de qualité additionnels. L’analyse en composantes principales des loci SNP dans les échantillons de plantes a révélé qu’une faible proportion (< 5 %) de la variabilité génétique analysée par GBS permet de distinguer ATF0 d’ATF5. Nos résultats confirment que l’analyse des données du GBS à l’aide du pipeline UNEAK est une méthode fiable pour la recherche pangénomique de loci SNP chez les polyploïdes allogames.

Date de modification :