Rejoignez-nous à Atlanta le 10 avril et explorez le paysage du personnel de sécurité. Nous explorerons la vision, les avantages et les cas d’utilisation de l’IA pour les équipes de sécurité. Demandez une invitation ici.
S&P mondiall’un des principaux fournisseurs de renseignements financiers, a discrètement annoncé mercredi le lancement de Benchmarks S&P IA par Kensho. Cette solution innovante vise à établir une nouvelle norme pour évaluer les performances des grands modèles de langage (LLM) dans des applications financières et quantitatives complexes.
Développé par la division axée sur l’IA de S&P Global, Kensho, l’outil d’analyse comparative évalue la capacité d’un LLM à gérer des tâches telles que le raisonnement quantitatif, l’extraction de données à partir de documents financiers et la démonstration de connaissances spécifiques à un domaine. Les résultats sont ensuite affichés dans un classement, offrant une vue transparente des capacités de chaque modèle.
« S&P AI Benchmarks a combiné la recherche et l’ingénierie de pointe en IA de Kensho avec les capacités de pointe en matière de renseignement financier de S&P Global », a déclaré Bhavesh Dayalji, directeur de l’IA de S&P Global et PDG de Kensho, dans une interview avec VentureBeat. « Nous espérons que la solution deviendra la norme de l’industrie pour comprendre les performances des LLM sur un raisonnement financier complexe et qu’elle encouragera une innovation plus large dans l’espace FinAI. »
Le lancement de S&P AI Benchmarks intervient à un moment charnière pour le secteur des services financiers, alors que de plus en plus d’institutions explorent le potentiel de l’IA générative et des LLM pour rationaliser leurs opérations et acquérir un avantage concurrentiel. Cependant, le manque de références standardisées a rendu difficile pour les organisations d’évaluer l’adéquation des différents modèles à leurs cas d’utilisation spécifiques.
Alimenter l’innovation et une prise de décision éclairée
« Les solutions de référence comme la nôtre sont essentielles pour aider les institutions et les professionnels de notre secteur à déterminer quels LLM ils doivent utiliser pour leurs cas d’utilisation particuliers », a expliqué Dayalji. « Et nous pensons que S&P AI Benchmarks va également alimenter l’innovation en aidant les professionnels de la finance à identifier les domaines dans lesquels chaque modèle fonctionne bien et comment il peut ajouter le plus de valeur. »
La méthodologie S&P AI Benchmarks a été développée et validée par une équipe diversifiée d’experts, comprenant des ingénieurs, des chercheurs, des universitaires et des professionnels de la finance issus de toutes les divisions de S&P Global. L’ensemble d’évaluation comprend 600 questions, conçues pour tester rigoureusement les performances d’un LLM dans trois catégories clés.
Une étape importante pour l’adoption de l’IA en finance
Les analystes du secteur estiment que le lancement de S&P AI Benchmarks pourrait marquer une étape importante dans l’adoption de l’IA au sein du secteur financier. À mesure que l’IA de plus en plus avancée imprègne le secteur financier, disposer d’un outil d’analyse comparative fiable et transparent sera essentiel pour les entreprises cherchant à prendre des décisions éclairées sur les modèles à déployer. La solution de S&P Global pourrait contribuer à accélérer l’adoption responsable des LLM et à stimuler l’innovation dans le domaine FinAI.
Pour l’avenir, S&P Global envisage que S&P AI Benchmarks joue un rôle crucial dans l’élaboration de l’avenir de l’IA dans les services financiers. « Notre vision est de voir les LLM devenir plus efficaces et mieux adaptés aux besoins des secteurs dans lesquels nous opérons à tous les niveaux, et des solutions comme la nôtre nous aideront à y parvenir », a déclaré Dayalji. « Nous encourageons tous les fournisseurs de modèles à participer afin que nous puissions continuer à faire évoluer notre cadre. »
Alors que le secteur financier évolue dans le paysage en évolution rapide de l’IA et de l’IA générative, des outils tels que S&P AI Benchmarks de Kensho sont sur le point de devenir des guides essentiels, aidant les organisations à exploiter la puissance de ces technologies tout en garantissant l’exactitude, la transparence et un déploiement responsable.