La sérendipité, le miracle des découvertes fortuites, est depuis longtemps reconnue comme un catalyseur essentiel de l'innovation. Parmi les plus célèbres, citons la vaccination contre la variole (y compris le concept même de la vaccination), les rayons X et la pénicilline.
Aussi révolutionnaires que puissent être ces découvertes, se fier uniquement aux rencontres fortuites n’est pas une approche durable pour alimenter la croissance et le progrès. Heureusement, les progrès récents de l’intelligence artificielle (IA) ont inspiré une meilleure façon de découvrir les liens cachés qui peuvent mener à des découvertes majeures : la recherche sémantique.
Dans notre dernier blog, nous avons exploré comment l’intégration transparente d’un moteur de recherche sémantique dans les flux de travail de R&D promet d’accélérer la médecine de précision. Dans cet article, nous allons approfondir la façon dont la recherche sémantique et les technologies de pointe associées peuvent favoriser l’innovation en nourrissant la sérendipité organisée.
La recherche pour de meilleures recherches
Jusqu’à il y a une dizaine d’années, la seule façon de chasser dans de vastes ensembles de données numériques était une technique connue sous le nom de recherche « lexicale ». Les moteurs de recherche recherchaient des correspondances littérales des termes de recherche : soit des doublons lettre par lettre, soit des variantes courantes. Par exemple, vous pouvez obtenir des correspondances incluant le nom « Sue » si vous recherchez « Susan ». Mais quand un moteur de recherche lexical peut reconnaître les mots en faisant correspondre des séquences de lettres, il ne comprend pas le sens derrière les mots.
Cette innovation a transformé la recherche en permettant aux ordinateurs de mieux comprendre le langage humain naturel. Tapez l’expression « Je reviendrai » dans un moteur de recherche aujourd’hui et vous n’obtiendrez pas seulement des résultats liés à Arnold Schwarzenegger et au film Terminator. Le moteur de recherche saura également que ces mots emblématiques ont quelque chose en commun avec « Hasta la vista, baby », « Go ahead, make my day » et « Houston, nous avons un problème ».
De cette façon, la recherche sémantique aide Google à nous donner plus de réponses que nous recherchons vraiment. Mais le niveau de recherche sémantique est limité du point de vue de la recherche. Cultiver un environnement plus fertile pour l’innovation dans la recherche pharmaceutique nécessite une application encore plus approfondie de cette technologie.
Révolutionner la recherche et la découverte sémantiques
Des formes avancées de recherche sémantique commencent à permettre aux organisations de R&D de faire de nouvelles avancées passionnantes tout en réduisant le temps nécessaire à la recherche et à l’analyse de l’information. L’exploitation de l’IA explicable, du traitement du langage naturel et d’une riche base de connaissances peut aider les chercheurs à identifier et à relier des points de données apparemment sans rapport, transformant ainsi des résultats inattendus en informations et opportunités précieuses.
« Nous sommes ravis de travailler avec Biomax pour gérer et partager efficacement les connaissances au sein de notre communauté scientifique et d’innovation », a déclaré Dorus van der Linden, responsable de la gestion et du partage des connaissances chez DSM, une société spécialisée dans la santé et la nutrition basée aux Pays-Bas.
« Sur la base de notre précédente recherche conventionnelle par mots-clés, nous n’avons récupéré que 45 % contre 95 % de nos documents de R&D avec la plateforme de recherche sémantique de Biomax. Des connaissances qui étaient autrement cachées et déconnectées sont désormais accessibles à nos scientifiques, ce qui nous permet d’économiser du temps et des ressources pour recueillir des informations pertinentes », a déclaré van der Linden.
De tels résultats sont rendus possibles par l’intégration de données sémantiquement structurées et non structurées provenant d’un large éventail de sources, y compris des initiatives de recherche exclusives, de la littérature scientifique, des bases de données de brevets et des essais cliniques, ainsi que des bases de données externes telles que ChEMBL, PubChem, UniProtKB, PDB et Open Targets. Cette intégration complète des données permet aux organisations d’exploiter un vaste bassin de connaissances, d’accélérer les cycles de développement et d’améliorer la qualité de leurs produits et services.
Dévoilement des liens cachés avec les graphes de connaissances
Les graphes de connaissances spécialisés conçus spécifiquement pour la recherche sont au cœur d’approches novatrices visant à favoriser la sérendipité organisée. Ces graphiques sont des réseaux structurés et interconnectés de concepts, d’entités et de relations qui représentent des connaissances du monde réel dans un format lisible par machine. Les graphes de connaissances permettent aux utilisateurs de découvrir des modèles, d’établir des liens et d’obtenir de nouvelles informations à partir de points de données apparemment sans rapport.
Les graphes de connaissances constituent des outils puissants pour l’intégration sémantique en fournissant une carte complète du paysage contextuel et en connectant des sources de données disparates. Le résultat est un graphe de connaissances international en croissance continue qui révèle les relations sémantiques entre divers points de données, permettant aux chercheurs de déduire des connaissances cachées à partir d’informations explicites.
Combler le fossé entre les données et les informations
La puissance d’un graphe de connaissances est encore renforcée lorsqu’il est utilisé comme une « couche sémantique » qui se trouve au-dessus de divers flux de données, lacs de données et entrepôts de données. Cette couche sémantique sert de système de gestion des métadonnées, fournissant l’identité, la classification et la contextualisation de tous les différents points de ces sources.
La couche sémantique joue un rôle essentiel pour permettre aux utilisateurs finaux d’accéder aux bonnes informations au bon moment à partir de grandes quantités de données d’entreprise et publiques grâce à des capacités d’interrogation et de réponse aux questions. En adhérant aux principes de données FAIR (Findable, Accessible, Interoperable, and Reusable), la couche sémantique facilite la réutilisabilité des actifs numériques généralement collectés dans le secteur des sciences de la vie, ce qui permet le développement rapide d’applications dédiées pour des cas d’utilisation spécialisés et la création de magasins de données analytiques bien compris pour le traitement en aval.
Favoriser la sérendipité organisée avec un moteur d’innovation
LabVantage Biomax comble l’écart entre la valeur actuelle que les organisations de R&D tirent des données et la valeur potentielle qu’elles peuvent obtenir avec AILANI (Artificial Intelligence LANguage Interface), une plateforme d’intégration sémantique et de recherche.
En intégrant des données structurées et non structurées provenant d’une multitude de sources, AILANI permet aux chercheurs d’accéder à une vaste base de connaissances qui serait autrement inaccessible et cloisonnée. La plateforme ne se limite pas à l’analyse de texte, des informations peuvent également être extraites de tableaux, de graphiques, de formules chimiques et d’autres images à l’aide de la reconnaissance optique de la structure. Son graphe de connaissances spécialisé, à son tour, révèle les relations contextuelles entre divers points de données, permettant aux chercheurs d’établir des liens et de tirer des enseignements d’informations apparemment sans rapport. Les données ne sont pas classées par ordre de popularité, mais par la quantité de preuves à l’appui qui leur sont associées.
La capacité de la couche sémantique à combler le fossé entre les données brutes et les informations exploitables amplifie encore le potentiel de sérendipité organisée. En rendant les ensembles de données complexes plus accessibles et plus compréhensibles, la couche sémantique permet aux chercheurs de découvrir des modèles cachés et de prendre des décisions éclairées, ce qui stimule l’innovation et la croissance.
Avec sa couche sémantique alimentée par un graphe de connaissances, AILANI change la donne en favorisant l’innovation en nourrissant la sérendipité organisée. En exploitant la puissance des technologies de pointe telles que l’IA explicable, le traitement du langage naturel, la reconnaissance optique de la structure et l’intégration sémantique, AILANI ouvre de nouvelles opportunités pour les organisations afin de tirer parti de connexions inattendues et d’informations impartiales.
Pour en savoir plus sur AILANI, regardez cette courte vidéo d’introduction. Si vous êtes prêt à adopter l’avenir de la prise de décision basée sur les données, contactez-nous dès aujourd’hui.