Rejoignez nos newsletters quotidiennes et hebdomadaires pour les dernières mises à jour et du contenu exclusif sur la couverture de l’IA de pointe. Apprendre encore plus
Les scientifiques croulent sous les données. Avec des millions d’articles de recherche publiés chaque année, même les experts les plus dévoués ont du mal à se tenir au courant des dernières découvertes dans leur domaine.
Un nouveau système d’intelligence artificielle, appelé OpenScholarpromet de réécrire les règles régissant la manière dont les chercheurs accèdent, évaluent et synthétisent la littérature scientifique. Construit par le Institut Allen pour l’IA (Ai2) et le Université de WashingtonOpenScholar combine des systèmes de recherche de pointe avec un modèle de langage affiné pour fournir des réponses complètes et fondées sur des citations à des questions de recherche complexes.
« Le progrès scientifique dépend de la capacité des chercheurs à synthétiser le corpus croissant de la littérature », écrivent les chercheurs d’OpenScholar dans leur papier. Mais cette capacité est de plus en plus limitée par le volume d’informations. OpenScholar, affirment-ils, offre une voie à suivre, une voie qui non seulement aide les chercheurs à naviguer dans le déluge d’articles, mais qui remet également en question la domination des systèmes d’IA propriétaires comme celui d’OpenAI. GPT-4o.
Comment le cerveau IA d’OpenScholar traite 45 millions de documents de recherche en quelques secondes
Au cœur d’OpenScholar se trouve un modèle de langage à récupération augmentée qui exploite une banque de données de plus de 45 millions d’articles universitaires en libre accès. Lorsqu’un chercheur pose une question, OpenScholar ne génère pas simplement une réponse à partir de connaissances pré-entraînées, comme le font souvent des modèles comme GPT-4o. Au lieu de cela, il récupère activement les articles pertinents, synthétise leurs conclusions et génère une réponse fondée sur ces sources.
Cette capacité à rester « ancré » dans la vraie littérature est un différenciateur majeur. Lors de tests utilisant un nouveau benchmark appelé ÉruditQABenchconçu spécifiquement pour évaluer les systèmes d’IA sur des questions scientifiques ouvertes, OpenScholar a excellé. Le système a démontré des performances supérieures en termes de factualité et d’exactitude des citations, surpassant même des modèles propriétaires beaucoup plus grands comme GPT-4o.
Une découverte particulièrement accablante concernait la tendance de GPT-4o à générer des citations fabriquées – des hallucinations, dans le langage de l’IA. Lorsqu’il a été chargé de répondre à des questions de recherche biomédicale, GPT-4o a cité des articles inexistants dans plus de 90 % des cas. OpenScholar, en revanche, est resté fermement ancré dans des sources vérifiables.
L’ancrage dans des documents réels et récupérés est fondamental. Le système utilise ce que les chercheurs décrivent comme leur «boucle d’inférence d’auto-rétroaction» et « affine de manière itérative ses résultats grâce à un retour en langage naturel, ce qui améliore la qualité et intègre de manière adaptative des informations supplémentaires ».
Les implications pour les chercheurs, les décideurs politiques et les chefs d’entreprise sont considérables. OpenScholar pourrait devenir un outil essentiel pour accélérer la découverte scientifique, permettant aux experts de synthétiser les connaissances plus rapidement et avec plus de confiance.
Dans la bataille David contre Goliath : l’IA open source peut-elle rivaliser avec la Big Tech ?
Les débuts d’OpenScholar surviennent à un moment où l’écosystème de l’IA est de plus en plus dominé par des systèmes fermés et propriétaires. Des modèles comme celui d’OpenAI GPT-4o et anthropique Claude offrent des capacités impressionnantes, mais elles sont coûteuses, opaques et inaccessibles à de nombreux chercheurs. OpenScholar renverse ce modèle en étant entièrement open source.
L’équipe OpenScholar a publié non seulement le code pour le modèle de langage mais aussi pour l’ensemble canalisation de récupérationun spécialiste Modèle à 8 milliards de paramètres affiné pour les tâches scientifiques, et un banque de données d’articles scientifiques. « À notre connaissance, il s’agit de la première version ouverte d’un pipeline complet pour un LM d’assistant scientifique – des données aux recettes de formation en passant par la modélisation des points de contrôle », ont écrit les chercheurs dans leur rapport. article de blog annonçant le système.
Cette ouverture n’est pas seulement une position philosophique ; c’est aussi un avantage pratique. La taille réduite d’OpenScholar et son architecture rationalisée le rendent bien plus rentable que les systèmes propriétaires. Par exemple, les chercheurs estiment que OpenScholar-8B est 100 fois moins cher à exploiter que PapierQA2un système concurrent construit sur GPT-4o.
Cette rentabilité pourrait démocratiser l’accès à de puissants outils d’IA pour les petites institutions, les laboratoires sous-financés et les chercheurs des pays en développement.
Pourtant, OpenScholar n’est pas sans limites. Sa banque de données est limitée aux documents en libre accès, laissant de côté la recherche payante qui domine certains domaines. Cette contrainte, bien que légalement nécessaire, signifie que le système pourrait manquer des découvertes critiques dans des domaines comme la médecine ou l’ingénierie. Les chercheurs reconnaissent cette lacune et espèrent que les futures itérations pourront intégrer de manière responsable du contenu en accès fermé.
La nouvelle méthode scientifique : Quand l’IA devient votre partenaire de recherche
Le Projet OpenScholar soulève d’importantes questions sur le rôle de l’IA dans la science. Même si la capacité du système à synthétiser la littérature est impressionnante, elle n’est pas infaillible. Dans les évaluations d’experts, les réponses d’OpenScholar ont été préférées aux réponses écrites par des humains dans 70 % des cas, mais les 30 % restants ont mis en évidence les domaines dans lesquels le modèle n’a pas réussi, comme l’omission de citer des articles fondamentaux ou la sélection d’études moins représentatives.
Ces limitations soulignent une vérité plus large : les outils d’IA comme OpenScholar sont destinés à augmenter, et non à remplacer, l’expertise humaine. Le système est conçu pour aider les chercheurs à gérer la tâche fastidieuse de synthèse de la littérature, leur permettant de se concentrer sur l’interprétation et l’avancement des connaissances.
Les critiques pourraient souligner que le recours d’OpenScholar aux articles en libre accès limite son utilité immédiate dans des domaines à enjeux élevés comme les produits pharmaceutiques, où une grande partie de la recherche est bloquée derrière des murs payants. D’autres soutiennent que les performances du système, bien que solides, dépendent néanmoins fortement de la qualité des données récupérées. Si l’étape de récupération échoue, l’ensemble du pipeline risque de produire des résultats sous-optimaux.
Mais même avec ses limites, OpenScholar représente un moment décisif dans le calcul scientifique. Alors que les modèles d’IA antérieurs impressionnaient par leur capacité à engager une conversation, OpenScholar démontre quelque chose de plus fondamental : la capacité à traiter, comprendre et synthétiser la littérature scientifique avec une précision quasi humaine.
Les chiffres racontent une histoire convaincante. Le modèle de 8 milliards de paramètres d’OpenScholar surpasse GPT-4o tout en étant d’un ordre de grandeur plus petit. Il correspond aux experts humains en matière d’exactitude des citations là où d’autres IA échouent 90 % du temps. Et ce qui est peut-être le plus révélateur, c’est que les experts préfèrent ses réponses à celles rédigées par leurs pairs.
Ces réalisations suggèrent que nous entrons dans une nouvelle ère de recherche assistée par l’IA, où le goulot d’étranglement du progrès scientifique ne réside peut-être plus dans notre capacité à traiter les connaissances existantes, mais plutôt dans notre capacité à poser les bonnes questions.
Les chercheurs j’ai tout libéré– code, modèles, données et outils – pariant que l’ouverture accélérera le progrès plutôt que de garder leurs avancées derrière des portes closes.
Ce faisant, ils ont répondu à l’une des questions les plus urgentes du développement de l’IA : les solutions open source peuvent-elles rivaliser avec les boîtes noires des Big Tech ?
La réponse, semble-t-il, se cache bien en vue parmi 45 millions de journaux.