Danguy Des Deserts Alice

2021 Dec - Intégration du profil de recombinaison dans les modèles de prédiction de la valeur en croisement chez le blé tendre

L'amélioration quantitative et qualitative des espèces animales et végétales est une nécessité pour répondre à la croissance de la population (environ 9 milliards d'êtres humains en 2050), à la diversité des besoins et aux contraintes environnementales (diminution des intrants). Les 400 000 accessions conservées dans les banques de gènes sont un réservoir d’allèles utiles pour l’agriculture. Elles sont peu utilisées par les sélectionneurs à cause de leur faible valeur agronomique. L’introgression d’allèles favorables dans des fonds génétiques élites se fait par croisement entre des lignées performantes et des lignées donneuses d’allèles favorables, en ciblant dans la descendance les individus ayant recombiné dans les régions du génome qui contrôlent des caractères d’intérêt agronomique ciblé. Cette étape est d’autant plus délicate que la recombinaison est peu fréquente au sein des génomes et qu’elle varie le long des chromosomes depuis les télomères où elle est le plus intense vers les centromères où elle est absente. Les marqueurs moléculaires apportent un gain de précision et de temps dans ce travail.

Pour des caractères complexes comme le rendement, contrôlés par plus d’une centaine de Quantitative Trait Loci (QTL) à effets faibles, l’introgression n’est pas une stratégie envisageable. Par contre, il est possible de prédire la valeur génétique des individus grâce à un score moléculaire. Les effets des marqueurs répartis sur l’ensemble du génome sont estimés simultanément par ridge regression grâce à une base de données de phénotypes mesurés au champ et de génotypes. L’équation de prédiction obtenue est utilisée pour prédire la valeur génétique d’autres individus non évalués au champ. Par extension, nous pouvons également prédire la valeur d’un croisement. Le meilleur est celui qui a la plus grande probabilité de produire des individus qui cumulent un maximum d’allèles favorables, qui produit la descendance avec la plus grande variance génétique, la plus transgressive. La variance génétique de la descendance dépend de la complémentarité allélique au niveau des QTLs chez les parents et de la probabilité de recombinaison entre ces QTLs d’intérêt. Les modèles de prédiction de la variance d’un croisement peuvent prendre en compte la variation du taux de recombinaison le long du génome. En pratique, les généticiens utilisent l’information de recombinaison provenant d’une carte génétique construite sur une population bi-parentale. Notre hypothèse est que l’utilisation d’une information de recombinaison historique, estimée sur un panel de diversité, nous permettra d’être plus précis pour prédire les meilleurs croisements.

L’objectif du projet de thèse est de développer des outils d’aide à la prédiction des croisements les plus prometteurs en prenant en compte la variation de recombinaison historique le long du génome, pour permettre un gain génétique sur le long terme. Ces outils pourront être réutilisés dans le cadre de programmes d'amélioration variétale.

Dans un premier temps, l’étudiante estimera le taux de recombinaison à l’échelle du génome entier au sein de deux populations divergentes européenne et asiatique. Pour cela, elle disposera d’une collection de 4500 lignées du centre de ressources génétiques de l’INRA de Clermont-Ferrand (CRB) génotypées à l’aide d’une puce de 420 000 SNP dans le cadre du projet d’investissement d’avenir BREEDWHEAT. Elle comparera deux méthodes existantes (PHASE et nouvelles version de LDhelmet) en termes de précision d’estimation, de faux positifs et de temps de calcul. La deuxième étape consistera à introduire le taux de recombinaison dans le calcul de la valeur d’un croisement. L’étudiante formalisera plusieurs critères d’utilité. Elle les testera en termes de gain génétique pour plusieurs scénarios d’architecture génétique, en utilisant un taux de recombinaison ancestral estimé en début de thèse, ou en utilisant un taux de recombinaison biparental déjà disponible. La valeur d’un croisement sera également estimée de manière déterministe sur des descendances simulées d’individus existants et génotypés (production de crossing-overs in silico). La troisième étape visera à appliquer ces critères d’utilité dans des plans de croisements réalistes à budget fixé, et de comparer les gains génétiques sur le court terme et sur le long terme. L’étudiante les appliquera sur des caractères simulés et de vrais caractères mesurés dans le programme de sélection INRA-Agri-Obtentions sur un réseau d’expérimentation de 9 environnements depuis 2000. Elle l’appliquera également au cas de croisements élite X ressources génétiques grâce à des données obtenues dans 11 environnements et 2 modalités pour la tolérance à la sécheresse, au stress azoté et à la tolérance aux maladies dans le cadre du projet BREEDWHEAT sur un panel élite de 280 accessions et un panel exotique de 450 accessions. Il/elle comparera les différentes stratégies de prédiction pour des architectures de caractères, des tailles de populations et un nombre générations d’inter-croisements variables.

Le directeur de thèse de l'étudiante sera Gilles Charmet, directeur de recherche de l'équipe Diversité Génétique et Sélection (unité GDEC, INRA de Clermont-Ferrand). Le co-directeur de thèse sera Pierre Sourdille, directeur de recherche de l'équipe Génétique et Recombinaison (unité GDEC). Les encadrants seront Sophie Bouchet (équipe Diversité Génétique et Sélection, unité GDEC) et Betrand Servin (directeur de l'équipe Dynamique des Génomes et des populations, unité GenPhySE, INRA d'Auzeville-Tolosane). Elle bénéficiera de l'appui scientifique de Jean-Michel Elsen, chercheur émérite de l'équipe Modélisation Génétique et Génomique (unité GenPhySE). La thèse étant en partie financée par l'entreprise Florimont-Desprez, l'étudiante organisera chaque année une visite de travail dans les locaux de l'entreprise.
En pratique, la candidate sera inscrite à l’UCA. Elle sera hébergée dans l’unité GenPhyse. Elle viendra 2 jours tous les 2 mois à l’unité INRA GDEC de Clermont-Ferrand et Sophie Bouchet ira 2 jours tous les 2 mois à l’INRA de Toulouse. Ils (Elle, Bertrand Servin et Sophie Bouchet au minimum, avec Gilles Charmet, Pierre Sourdille et/ou Jean-Michel Elsen suivant le sujet de discussion) feront des visio-conférences toutes les semaines.

Accèes à ma thèse

Voir aussi

Equipe DiGen