Points clés à retenir
Lorsque OpenAI a dévoilé sa dernière avancée, le ChatGPT-4o modèle, les passionnés de technologie étaient en effervescence. Les projecteurs ont brillé sur son « Mode Voix » innovant, qui présentait une gamme de voix émotionnelles conçues pour améliorer l’interaction de l’utilisateur. Pourtant, au milieu des applaudissements, un murmure de controverse a commencé à résonner. Une voix particulière, « Sky », a attiré l’oreille du bureau de Nerdspin, ressemblant étrangement à sa personne préférée. Scarlett Johansson représentation emblématique d’une IA dans le film de 2013 Son. Ajoutant de l’huile sur le feu, le fondateur d’OpenAI, Sam Altman, l’a postée avec effronterie sur X pendant la démo.
Scarlett JohanssonOpenAI la voix est tirée
En réponse au buzz croissant, OpenAI a décidé d’appuyer sur le bouton pause de la voix Sky pour répondre aux préoccupations des utilisateurs concernant le son familier. « Nous avons entendu des questions sur la façon dont nous avons choisi les voix dans ChatGPT, en particulier Sky », a annoncé la société lundi matin. « Nous travaillons à suspendre l’utilisation de Sky pendant que nous y répondons. »
OpenAI cet article de blog explore les subtilités de son processus de sélection de voix, soulignant son engagement envers l’authenticité. « Nous pensons que les voix de l’IA ne doivent pas délibérément imiter la voix distinctive d’une célébrité – la voix de Sky n’est pas une imitation de Scarlett Johansson mais appartient à une autre actrice professionnelle utilisant sa propre voix naturelle », précise le message. Cependant, la société reste discrète sur l’identité de ses talents vocaux afin de protéger leur vie privée.
Le voyage pour trouver les voix parfaites a commencé début 2023 lorsqu’OpenAI s’est associé à des directeurs de casting et des producteurs « bien connus et primés ». Après avoir passé au crible plus de 400 candidatures, ils ont méticuleusement réduit leur sélection à 14 candidats prometteurs. L’entreprise a engagé des conversations approfondies avec chaque acteur, discutant de la vision des interactions vocales homme-IA, des capacités, des limites et des risques potentiels de la technologie, ainsi que des garanties en place. Ce processus rigoureux a abouti à la sélection de cinq voix finales, chacune apportant une saveur unique à l’expérience ChatGPT.
Des sessions d’enregistrement ont eu lieu à San Francisco, où les acteurs choisis ont donné vie à leurs rôles avant que les voix ne soient officiellement intégrées à ChatGPT l’automne dernier. OpenAI promet que ce n’est qu’un début, avec l’intention d’introduire de nouvelles voix sur la plateforme au fil du temps.
« Nous soutenons la communauté créative et avons travaillé en étroite collaboration avec l’industrie du doublage pour nous assurer que nous avons pris les bonnes mesures pour diffuser les voix de ChatGPT », poursuit le blog. « Chaque acteur reçoit une rémunération supérieure aux tarifs du marché, et cela continuera aussi longtemps que leurs voix seront utilisées dans nos produits. »
Alors qu’OpenAI navigue dans ces eaux agitées, le monde de la technologie surveille de près. L’engagement de l’entreprise en faveur de l’innovation, de la transparence et des considérations éthiques place la barre haute, réaffirmant sa place à l’avant-garde du développement de l’IA. Quant à Sky, il reste à voir si nous l’entendrons à nouveau ou non, mais le dialogue qu’elle a suscité sur l’IA et la créativité résonnera certainement pendant un certain temps.