Kyutai, l’innovation en IA à la française

Publié le 10/02/2025 Modifié le 04/06/2025

Mille start-up en intelligence artificielle (IA) sont implantées en France. Parmi elles, le laboratoire français Kyutai, fondé par Xavier Niel (Iliad), Rodolphe Saadé (CMA CGM), et Eric Schmidt (ex-directeur général de Google France).

Un homme sur une scène présente l'innovation Moshi.
Un homme sur une scène présente l'innovation Moshi. - Source : Kyutai
Les 10 et 11 février 2025, Paris accueille le Sommet pour l’action sur l’intelligence artificielle (IA), réunissant décideurs, entrepreneurs et chercheurs du monde entier.
Portée par une stratégie nationale de 2,5 milliards d’euros via le plan France 2030, la révolution technologique de l’IA attire également de plus en plus d’investisseurs privés sur notre sol.
Illustration de la vitalité de l’écosystème tricolore avec le laboratoire français Kyutai, dont le premier projet a été présenté courant 2024. Baptisé Moshi, cet assistant vocal constitue une véritable prouesse technologique, en source ouverte (« open source »).

Le choix de la voix

Parmi les assistants virtuels, les plus connus sont actuellement Mistral AI, ChatGPT ou Gemini, avec qui l’on peut dialoguer par écrit. Ou encore Dall-E ou Midjourney, qui génèrent des images.
La voix, elle, était jusqu’à présent un chemin moins arpenté - des outils existent bien, mais ils ne s’appuient pas sur les dernières avancées de l’IA.
C’est pourquoi Xavier Niel (Free), Rodolphe Saadé (CMA CGM), et Eric Schmidt (ex-directeur général de Google France) ont choisi cette direction pour le premier projet dévoilé par Kyutai, le laboratoire d’IA qu’ils ont fondé à Paris en novembre 2023.
Avec une équipe de 8 chercheurs spécialisés (la plupart issus de grands acteurs), ils ont pu présenter en six mois et en investissant « seulement » 10 millions d’euros, Moshi, le premier assistant vocal nouvelle génération utilisable par le grand public.

Jusqu’à 70 émotions différentes

Bien qu’il s’agisse encore d’un prototype expérimental, Moshi est déjà capable de tenir une conversation orale en temps réel ou presque, avec une latence qui n’excède pas 200 millisecondes.
Si l’assistant ne comprend et ne s’exprime pour l'instant qu’en anglais, il sait compléter des phrases à partir des premiers mots. Au cours de sa présentation, il a ainsi pu poursuivre un discours de Xavier Niel à partir des dix secondes initiales, tout en restant fidèle à la pensée du fondateur d’Illiad.
Pour réussir cette prouesse, les équipes de Kyutai se sont appuyées sur un grand modèle de langage multimodal intégrant sept milliards de paramètres et baptisé Helium.
Ils ont en outre demandé à une artiste de prêter sa voix à Moshi, enregistrant avec elle pas moins de 20 heures d’audio. L’assistant est ainsi capable d’adapter son intonation aux demandes de l’utilisateur, et de présenter jusqu’à 70 émotions différentes.

Un projet éthique

Sur le plan technique, la solution dispose d’un modèle d’IA unifié qui lui permet dans un même temps de détecter les instructions sonores, de les comprendre, de générer une réponse et de la transcrire en voix, alors que cela constituait auparavant des opérations distinctes.
Kyutai se félicite également d’avoir réussi à réduire les besoins en calcul informatique, avec un assistant utilisable hors ligne sur un ordinateur et prochainement sur smartphone.
Surtout, le projet revêt une dimension éthique : d’une part avec l’ajout d’un filigrane qui permettra de repérer les discours produits par l’IA et d'agir contre la désinformation ou les usurpations d’identité, et d’autre part avec le soutien à la recherche car il s’agit d’un outil en source ouverte... sans s’interdire toutefois des discussions avec les entreprises et institutions, avec lesquelles le laboratoire imagine déployer des versions personnalisées de Moshi.

Avez-vous trouvé les informations que vous cherchiez ?

Votre avis nous intéresse

Nous vous recommandons de ne pas inclure de données à caractère personnel dans les champs suivants. Tous les champs sont obligatoires.

Merci pour votre réponse !

L'équipe de info.gouv.fr vous remercie pour votre réponse qui participera à l'amélioration du site !

À lire aussi