Expertise N° 0027

La multimodalité : quand l'IA voit, lit et entend

Les IA récentes ne traitent plus seulement le texte : elles analysent images, documents, audio et vidéo. Cette multimodalité élargit considérablement les usages — de l'analyse documentaire à l'accessibilité.

L'équipe Oxynel Pôle Innovation & IA

05 juin 2026 · 2 min de lecture

La multimodalité : quand l'IA voit, lit et entend — Pavel Danilyuk

On parle de multimodalité lorsqu'un modèle d'IA sait traiter plusieurs types de contenus — texte, image, audio, voire vidéo — au sein d'un même système.

Le principe

Kiosque Actualités Expertises Conseils Fiches À lire plus tard Mon espace