paSNPg: A GBS-Based Pipeline for Protein-Associated SNP Discovery and Genotyping in Non-Model Species.

Fu, Y.B. et Dong, Y. (2015). « paSNPg: A GBS-Based Pipeline for Protein-Associated SNP Discovery and Genotyping in Non-Model Species. », Journal of Proteomics & Bioinformatics. doi : 10.4172/jpb.1000368  Accès au texte intégral (en anglais seulement)

Résumé

Le génotypage par séquençage a récemment permis la mise au point d’une approche génomique pour explorer la variation génétique pangénomique d’une population et pour l’étude de la génomique évolutionnaire d’espèces non modèles. Pour faciliter l’acquisition de données sur la variation génétique associée à des fonctions dans des populations naturelles, nous présentons un pipeline de génotypage par séquençage désigné paSNPg (protein-associated SNP discovery and genotyping) pour la découverte de SNP et le génotypage chez des espèces non modèles. Le pipeline a été développé par l’expansion de l’outil publié npGeno et permet d’assembler des contigs nucléaires à partir de données brutes de génotypage par séquençage, de séparer des contigs associés à des protéines de tous les contigs assemblés selon les séries de données de séquences PEP (Predictions on Entire Proteomes) publiées, et de faire l’appel de paSNP dans tous les échantillons analysés d’après les contigs associés à des protéines. La mise à l’épreuve du pipeline avec deux séries de données de génotypage par séquençage, Arabidopsis thaliana et Oryza sativa, a révélé son utilité potentielle dans l’exploration de la variation génétique associée à des protéines dans l’ADN génomique d’espèces non modèles.

Date de modification :