Expertise N° 0027

La multimodalité : quand l'IA voit, lit et entend

Les IA récentes ne traitent plus seulement le texte : elles analysent images, documents, audio et vidéo. Cette multimodalité élargit considérablement les usages — de l'analyse documentaire à l'accessibilité.

LO
L'équipe Oxynel Pôle Innovation & IA
05 juin 2026 · 2 min de lecture
La multimodalité : quand l'IA voit, lit et entend
Pavel Danilyuk

On parle de multimodalité lorsqu'un modèle d'IA sait traiter plusieurs types de contenus — texte, image, audio, voire vidéo — au sein d'un même système.

Le principe

Kiosque Actualités Expertises Conseils Fiches À lire plus tard Mon espace