Sélection de la langue

Recherche

RGAugury : pipeline pour la prédiction pangénomique des analogues de gènes de résistance (RGA) chez les végétaux

Li P, Quan X, Jia G, Xiao J, Cloutier S, You FM (2016) RGAugury: a pipeline for genome-wide prediction of resistance gene analogs (RGAs) in plants. BMC Genomics, 17(1):852.

Résumé

Les analogues de gènes de résistance (RGA), comme les protéines de liaison aux nucléotides (NBS), les protéines kinase de type récepteur (RLK) et les protéines de type récepteur (RLP), sont des gènes de résistance potentiels qui renferment des domaines et des motifs conservés précis. Ainsi, il est possible de prédire les RGA en fonction de leurs caractéristiques structurales conservées au moyen d’outils de bio-informatique. Des programmes informatiques ont été créés pour l’identification des domaines et motifs individuels des séquences protéiques des RGA, mais aucun de ces programmes ne permet une évaluation systématique des différents types de RGA. Il faut mettre au point un pipeline convivial et efficace pour la prédiction pangénomique et à grande échelle des RGA pour le nombre croissant de génomes de végétaux séquencés. Un pipeline intégratif, nommé RGAugury, a été créé pour automatiser la prédiction des RGA. Le pipeline identifie premièrement les domaines et motifs protéiques associés aux RGA suivantes : domaine de liaison aux nucléotides (NB-ARC), domaine de répétition riche en leucine (LRR), région transmembranaire (TM), sérine/thréonine et tyrosine kinase (STTK), motif lysine (LysM), superhélice (CC) et récepteur Toll de l’interleukine 1 (TIR). Les RGA candidats sont identifiés et classés en quatre familles principales en fonction de la présence des combinaisons de ces domaines et motifs : codant de NBS, TM-CC et RLP et RLK associés à la membrane. Toutes les analyses longues à effectuer du pipeline sont effectuées en parallèle, ce qui en améliore la performance. Le pipeline a été évalué au moyen du génome abondamment annoté de l’Arabidopsis. Au total, 98,5 %, 85,2 % et 100 % des gènes codant des NBS et des RLP et des RLK associés à la membrane ont été validés, respectivement. De plus, le pipeline a permis de prédire les RGA pour 50 génomes de végétaux séquencés. Une interface Web conviviale a été déployée pour faciliter les opérations de la ligne de commande et la visualisation et pour simplifier la gestion des résultats pour de multiples ensembles de données. RGAugury est un outil de bio-informatique qui permet l’identification pangénomique à grande échelle des RGA. Il est accessible gratuitement sur le site de Bitbucket : https://bitbucket.org/yaanlpc/rgaugury.

Signaler un problème sur cette page
Veuillez cocher toutes les réponses pertinentes :
Date de modification :