Chercheur : 
Reinharz, Vladimir

Établissement : 
Université du Québec à Montréal (UQAM)

Année de concours : 
2021-2022

L’acide ribonucléique (ARN) remplit plusieurs fonctions fondamentales dans tous les êtres vivants. Les molécules d’ARN entre autre portent l’information pour la transcription et affecte la translation et régulation de l’expression des gènes. Afin de pouvoir accomplir ce vaste éventail de fonctions, l’ARN adopte des structures tridimensionnelles complexes. Alors qu’une hypothèse forte est que la structure égale la fonction, les molécules sont dynamiques et des systèmes malléables. Elles sont également affectées par des facteurs épigénétiques, des centaines de petites modifications chimiques qui viennent subtilement changer la géométrie de la molécule d’ARN et peuvent avoir des conséquences drastiques sur sa fonction.

Lorsque vient le moment de prédire l’impact fonctionnel d’une mutation ou d’une modification chimique, trois contextes sont possibles. 1) il y a une structure de référence connue 2) il y a beaucoup de séquences fonctionnelles similaires de connues ou 3) nous n’avons que quelques séquences. Ce programme de recherche propose d’avancer sur ces trois fronts qui lorsqu’atteints se renforceront les uns les autres.

1) Nous allons représenter toutes les structures connues, en tenant compte des modifications chimiques, comme des graphes. Nous allons premièrement répertorier toutes les sous-structures qui sont conservées, et donc probablement importantes, à travers toutes les moléclues d’ARN. En regardant la diversité des séquences correspondantes à une sous-structure, un graphe en particulier, nous pouvons évaluer la résilience de la fonction aux mutations.  Ce modèle sera utilisé pour prédire l’impact potentiel de toutes les mutations connues dans l’ARN chez les humains.

2) Avec suffisamment d’exemples d’une séquence fonctionnelle, de beaucoup individus,  il existe des réseaux de nucléotides qui co-évoluent ensembles afin de maintenir des structures et fonctions spécifiques. De nouvelles méthodes statistiques seront créées afin d’exposer ces positions. Ces réseaux seront automatiquement corrélés avec les annotations fonctionnelles disponibles, afin d’exposer le support géométrique nécessaire entre autres aux interfaces ARN-molécules. Nous allons également étudier toutes les variations humaines délétères afin d’identifier celles dont l’effet provient de la déformation du réseau d’interactions supportant la fonction.

3) Avec une nouvelle séquence, un grand défi est de prédire la position de motifs structuraux qui influencent globalement la structure. Par exemple une structure en Y peut avoir les deux bras proches ou éloignés.  Nous allons développer deux nouvelles méthodes, une basée sur les graphes et le contexte structurel, l’autre sur des modèles génératifs d’hypergraphes, afin de prédire la location de ces interactions longue distance sur de nouvelles molécules d’ARN. Ces prédictions seront validées sur les ARNs d’un parasite, afin d’aider le développement d’un traitement qui tente de briser ces structures conservés.

Avec ce programme de recherche, nous voulons créer des fondations solides sur notre compréhension des motifs structuraux fonctionnels, leur résistance aux mutations et modifications chimique, leur diversité, et notre capacité à prédire des motifs complexes dans de nouvelles séquences. Les résultats et outils créés sont essentiels afin de comprendre les mutations causant des maladies, prédire l’impact fonctionnel de ces mutations dans un ARN, et développer de nouveaux traitements.