Livrable 1
1. Contexte scientifique
Le projet SnoBoard s'inscrit en livrable du projet ANR MetRibo visant à explorer les modifications différentiellement réalisées sur les ARN ribosomiques chez la plante Arabidopsis thaliana. Il a pour but de proposer un catalogue de modifications guidées par des petits ARN non codants de type C/D ou H/ACA (encore appelés guides). Les modifications ciblées dans le projet sont au moins les 2'-O-méthylations et, si possible, les pseudouridylations et les acétylations. Ce catalogue sera accessible par une interface web, mais aussi de façon programmatique (api, requêtes directes sur la base de données/connaissance).
Les données proposées seront curées et annotées (information de provenance, de qualité et correction).
2. Description de la demande
Le développement doit permettre de présenter sous forme de table et de graphiques:
- la liste des guides (snoRNAs à boîtes C/D et snoRNAs à boîtes H/ACA) présentant les caractéristiques attendues (annotation in silico) et/ou une évidence d'expression dans au moins une condition testée expérimentalement ;
- la liste des modifications et des cibles (cible: élément fonctionnel transcrit sur lequel la modification est réalisée) présentant une évidence expérimentale ;
- les interactions (duplex) entre les guides et les cibles, lorsque celles-ci ont pu être mises en évidence in silico ou expérimentalement ;
- la liste des clusters de snoRNAs (groupes).
Pour chaque guide, modification, cible et cluster, une fiche doit afficher des informations détaillées le/la concernant.
Le catalogue se concentrera sur A. thaliana mais des données conernant d'autres organismes seront intégrées à des fins d'analyses comparatives.
3. Organisation
3.1 Planning
Cette version doit être réalisée pour décembre 2023.
3.2 Personnes
Implémentation: Julien Touchais, Philippe Bordron.
Tests du traitement: Julien Touchais, Philippe Bordron, Christine Gaspin.
3.3 Ressources matérielles
Une VM fournie par la pf genotoul-bioinfo pour le déploiement dev, pre-prod et prod.
3.4 Ressources financières
Le développement de SnoBoard est financé l'ANR dans le cadre du projet Metribo.
4. Échéancier
- Septembre 2023: une première version du site en pré-prod.
- Décembre 2023: une première version publique du site.
5. Critères de validations
L'interface web est validé par JT, CG, et PB en navigant dessus et en testant les composants.
6. Suivi du projet
Les CR des réunions du projets sont disponibles là : https://nextcloud.inrae.fr/f/104651389
7. Revue de projet et modifications du planning et des ressources
7.1 Revue de projet 2023-11-20
Le site dépend de 3 composants: l'interface web, l'api et la base de données/connaissance.
Le développement de la partie web (JT) avance bien. Une api REST exploitant une base de donnée SQLite est en place. Les données incluses dans la base portent sur:
- les modification de 2'O methylation ;
- les snoRNAs à boite C/D.
Les données actuelles comportent des erreurs qui doivent être corrigées.
Cette version de préproduction est déployée sur https://snoboard.org et https://snoboard.toulouse.inrae.fr depuis mi-septembre.
Les codes sont versionnés et à jour La documentation de déploiement aussi.
Le couple REST + SQL présente quelques limites et performance et de modélisation (en particulier sur le polymorphisme associatif).
Un couple GraphQL avec une base de données orientée graphe (neo4j) est plus intéressante et est en cours de développement. Une première ébauche est fonctionnelle, mais la bibliothèque GraphQL neo4j qui a été utilisée pour sa facilité de mise en oeuvre devient bloquante pour personnaliser certaines requêtes comme le tri d'éléments de la table. PB travaille ce point spécifique.
Les données que nous voulons inclure dans la version finale doivent être corrigées et complétées par CG. Il s'agit:
- des modification de pseudouridylation ;
- des snoRNAs à boîtes H/ACA ;
- des groupes (clusters) de snoRNAs ;
- de la visualisation basique des structures secondaires d'ARN ;
PB doit ensuite les inclure.
Pas de modification de ressources pour ce livrable.
Décisions pour premier livrable.
Dans l'état, livrer ce livrable n'est pas envisageable. Nous décidons de repousser la livraison à fin janvier 2024 afin qu'elle intègre les données à jour et corrigées. La seconde API sera utilisée.
Pas de modification de ressources pour ce livrable.
7.2 Revue de projet 2024-02-07
Le développement de la partie web (JT) avance bien.
Ce qui a été fait:
- La position des snoRNA sur les chromosome est visualisable sur des caryotypes;
Ce qui manque:
- Les données des snoRNA à boites H/ACA et les modification de pseudouridylation sont manquantes ;
- La migration vers la base GraphQL est maintenant terminée. L'API côté serveur aussi. La migration côté client n'est pas terminée.
Décisions pour premier livrable.
Le livrable n'est pas prêt en l'état. Nous attendons de fixer une réunion avec les partenaires du projet Metribo pour définir une nouvelle date. -> 2024-03-15
Pas de modification de ressources pour ce livrable.
7.3 Revue de projet 2024-03-25
Ce qui a été fait:
- La migration vers l'API GraphQL est maintenant terminée. Le site utilise maintenant une api GraphQL plus flexible et une base de connaissance neo4j pour stocker les données.
Le site web a été présenté aux partenaires du projet Metribo le 2024-03-15.
- La logique d'affichage des snoRNA à boites H/ACA est prête.
Ce qu'il reste à faire
- Alimenter la base avec les données H/ACA
- Ajouter les mentions légales
Décisions pour premier livrable.
Il ne manque plus qu'à compléter les données. L'ajout des scaRNAs, sans leur structure a été demandé. Ce ne sera pas plus couteux.
Nous espérons publier le site à la rentrée -> nouvelle date 2024-09-15
Pas de modification de ressources pour ce livrable.
7.4 Revue de projet 2024-10-04
Le site dépend de 3 composants: l'interface web, l'api et la base de données/connaissance.
Ce qui a été fait
Une API GraphQL exploite une base de données neo4j. Les blocages qui empêchaient de personnaliser plus en profondeur l'API ont été contournés en grande partie.
La base de données permet:
- des modifications de pseudouridylation et de 2'-O-méthylations;
- des cibles modifiées;
- des snoRNAs à boîtes C/D, H/ACA et scaRNAs;
- des groupes (clusters) de snoRNAs ;
- les interactions entre un snoRNA et une cible qui provoque une ou plusieurs modification, ainsi que les duplexes qui se forment loes de ces interactions
La structure de la base de données et l'api correspondent aux attendus du livrable.
Elle contient des données curées provenant:
- de l'humain (snoRNA-db/LBME)
- de la levure (fournierlab)
- des partenaires du projet sur A. thialiana (seulement C/D Box + 2'O-methylation)
Il manque les données H/ACA + pseudourilation pour la partie partenaires et il est nécessaire de les vérifier.
Le site web permet:
- d'avoir une table de guide, cible et modification
- de filter et chercher dans cette table
- d'obtenir une description de chaque guide, cible et modification
- de consulter les interactions qui existent entre les guide et les cibles, ainsi que les modifications guidés par ces interactions
- de consulter des statistiques générales sur guides, cibles et modifications pour chaque organisme
- de visualiser la structure schématique des snoRNAs à boite C/D et H/ACA (les scaRNAs ne sont pas gérés car trop complexes);
- de visualiser des structures secondaires d'ARN ;
- de visualiser la position des snoRNA sur les chromosome à l'aide de caryotypes
Les mentions légales sont disponibles.
Le développement de la partie web (JT) est terminée, même si quelques bugs sont encore à corriger.
Cette version est déployée sur https://snoboard.org.
Les codes sont versionnés et à jour La documentation de déploiement aussi.
Décisions pour premier livrable.
Les données demandent encore d'être complétées et nettoyées. Nous la séparons de ce livrable et la transférons dans un nouveau livrable. Ainsi ce livrable peut-être clos.
Pas de modification de ressources pour ce livrable.