2023-Mardoc Emile

Mardoc Emile

2023-Exploitation des outils du BigData pour l’intégration des données omiques en biologie évolutive

Exploitation des outils du BigData pour l’intégration des données « omiques » en biologie évolutive

 

L’explosion des données haut-débit dans les différents domaines de la biologie, et notamment pour ce qui concerne les approches « omiques » (génomique, transcriptomique, protéomique, métabolomique...), dont   le   volume   est   toujours   en   croissance   exponentielle,   implique   désormais   un   passage   à   l’étape indispensable de leur intégration pour permettre la compréhension la plus fine des processus biologiques complexes (déterminismes du développement des organismes, de maladies, mécanismes adaptatifs...).

Nous proposons d’implémenter ou développer, pour ces données massives, les outils du  BigData génériques qui permettent  le traitement de larges volumes de données de manière distribuée. Ceci doit permettre de :
(1) organiser et structurer les données afin d’en améliorer l’exploitation,
(2) développer un environnement intégré d'ingénierie ontologique permettant d’en extraire plus facilement l’information interprétable,
(3) filtrer les relations pertinentes entre les données pour une application (requête) afin de les hiérarchiser,
(4)   délivrer   à   l’utilisateur   une   carte   de   connaissances   avec   laquelle   il   peut   interagir  via  une   interface personnalisable.
Le projet a donc pour ambition le développement d’une infrastructure BigData pour identifier les signaux (associations de variants « omiques ») capturant les sources de variabilité biologique, technique et évolutive au sein d’un jeu de données « omiques », qui sera validée dans le cadre de la Thèse à partir des données « omiques » disponibles chez les plantes (céréales) disponibles dans l’équipe de recherche à des fins de recherche translationnelle pour le breeding.

Les   données   acquises,   intégrées   et   validées   pourront   être   considérées   comme   jeu
d’entrainement pour mener, au-delà de ce projet, des approches d’auto-apprentissage (ou ‘machine learning’) facilitant l’exploitation du déluge continu des données « omiques ».

Accès à ma thèse

Voir aussi

Equipe PaleoEvo