Les données sous-tendent presque tous les aspects de la science, de la technologie et de l’industrie modernes, ce qui fait de la gestion et de l’accessibilité des données les principaux moteurs de l’innovation. Des outils tels que les systèmes de gestion des informations de laboratoire (LIMS) et les systèmes avancés de gestion des connaissances basés sur l’IA sont de plus en plus essentiels pour garantir que les données peuvent être utilisées et réutilisées efficacement par toutes les parties prenantes concernées. Reconnaissant cette importance, un consortium de scientifiques et d’organisations en 2016 a élaboré les principes de données FAIR comme guide pour s’assurer que les données sont gérées de manière à obtenir le plus grand impact.
Les quatre grands principes soulignent que les données doivent être :
- Findable, facile à découvrir grâce à un balisage et une organisation appropriés
- Unccessible, donc récupérable en toute sécurité, de préférence par des protocoles standardisés
- Interoper, accessible par divers moyens
- Reusable dans différents contextes
Nous avons constaté que la mise en œuvre des principes de données FAIR pour les LIMS comme LabVantage, les interfaces de langage d’IA comme Biomax AILANI et d’autres outils dans les industries de la recherche et des biosciences commerciales entraîne un certain nombre d’avantages notables. Tout d’abord, une collaboration efficace, qui améliore l’innovation et la découverte tout en économisant du temps et des efforts en améliorant l’accès aux données, ce qui peut, par exemple, aider à éviter les doublons. Les orientations FAIR améliorent également la qualité et la fiabilité des données ainsi que la durabilité des données à long terme.
Application des principes de données FAIR dans le LIMS
Les LIMS sont utilisés pour gérer le flux d’informations dans les environnements de laboratoire, du suivi des échantillons et de la collecte de données expérimentales aux rapports et au contrôle de la qualité. Alors que certaines personnes considèrent un LIMS comme un référentiel, l’alignement sur les principes FAIR les transforme en centres centraux de collaboration, garantissant que les données peuvent être facilement accessibles, comprises et utilisées par les membres actuels et futurs de l’équipe ou les partenaires externes.
Le LIMS doit rendre les données trouvables grâce à des métadonnées appropriées, des identifiants persistants (comme les URI) et des référentiels bien organisés. LIMS peut être conçu avec la génération automatisée de métadonnées, qui intègre des protocoles de génération de métadonnées dans le flux de travail du laboratoire. De cette façon, chaque échantillon, résultat et étape expérimentale est documenté avec précision.
L’accessibilité peut avoir une connotation d’accès ouvert à tous, mais dans le cadre de FAIR, cela signifie vraiment assurer des mécanismes d’authentification et d’autorisation appropriés sans imposer de barrières indues. Les LIMS ont besoin de contrôles d’accès sécurisés qui équilibrent l’accessibilité et la confidentialité, permettant aux utilisateurs autorisés de localiser et de visualiser les données tout en documentant les restrictions (par exemple sur demande ou par abonnement).
L’interopérabilité est l’une des principales exigences d’un LIMS. Les données sont plus utiles lorsqu’elles peuvent être intégrées et traitées sur diverses plateformes, outils et langues. En pratique, un LIMS conforme à FAIR répond aux besoins des laboratoires modernes en permettant un échange de données transparent entre toutes les plates-formes logicielles couramment utilisées, comme les cahiers de laboratoire électroniques (ELN) et les outils d’analyse de données.
Les données d’un LIMS doivent être décrites de manière cohérente et suffisamment détaillée pour garantir leur réutilisation. Un LIMS permet une capture de données standardisée, de sorte que toutes les données expérimentales - des lectures d’instruments aux détails de l’échantillon - suivent des conventions de nommage et des ontologies cohérentes. La réutilisation des données à des fins de réplicabilité ou pour éviter les doublons inutiles dépend de métadonnées complètes, de données de provenance et de données de licence.
FAIR Data améliore les interfaces linguistiques de l’IA
L’un des plus grands avantages des grandes bases de données interopérables est la possibilité de tirer parti des outils d’IA et d’apprentissage automatique, comme le LabVantage Biomax AILANI (Artificial Intelligence LANguage Interface). Cette classe d’IA permet de puissantes capacités d’intégration sémantique et de recherche qui peuvent faciliter l’identification et la livraison de données scientifiquement pertinentes.
Le respect des principes FAIR signifie qu’une interface en langage d’IA devrait permettre aux chercheurs en sciences de la vie de localiser et d’accéder plus facilement aux informations pertinentes. Il s’appuie sur des données bien organisées et cohérentes, ce qui rend les modèles d’apprentissage automatique plus efficaces. AILANI, par exemple, intègre et indexe des ensembles de données provenant de plusieurs sources, garantissant ainsi que les données précieuses ne restent pas cachées. Les méthodes d’apprentissage automatique peuvent ensuite être appliquées efficacement pour découvrir des modèles cachés, accélérer la validation d’hypothèses et même proposer de nouvelles directions de recherche.
L’interopérabilité repose sur l’utilisation cohérente de formats, de vocabulaires et de normes afin que différents systèmes - équipements de laboratoire, bases de données, logiciels analytiques - puissent « communiquer » efficacement entre eux. En normalisant les ontologies et les formats, AILANI garantit que les algorithmes d’apprentissage automatique peuvent analyser et comparer de manière significative divers ensembles de données - données génomiques, essais cliniques, bases de données de littérature, etc.
Les directives FAIR exigent également des normes de métadonnées claires qui permettent aux chercheurs de tirer parti de l’IA pour évaluer la qualité, la provenance et la pertinence des données, ce qui leur permet de réappliquer les résultats dans de nouveaux contextes. Garantir des descripteurs de qualité, des droits d’utilisation clairs et une documentation solide peut libérer le potentiel de réutilisation des données à de nouvelles fins, telles que la réaffectation de médicaments ou les études de stratification des patients.
Favoriser une meilleure science avec les données FAIR
L’adhésion aux principes de données FAIR présente de nombreux avantages dans les industries scientifiques, notamment pour la conformité réglementaire, la collaboration interdisciplinaire et la création de valeur à long terme. Ces normes sont intégrées dans des outils tels que la plateforme LabVantage LIMS et LabVantage Biomax AILANI, facilitant ainsi une recherche et une science industrielle plus efficaces et de haute qualité. La capacité accrue d’accéder et d’exploiter les ensembles de données massifs et croissants de chaque organisation alimentera la prochaine vague de découvertes et de progrès, et fera en sorte que les découvertes de pointe ne restent pas enterrées.