Deux notions techniques conditionnent l'usage concret des LLM — et la facture : le token et la fenêtre de contexte.
Le token, unité de base
Les LLM ne lisent pas des mots mais des « tokens », et ne peuvent en traiter qu'une quantité limitée à la fois : la fenêtre de contexte. Ces deux notions déterminent le coût, la latence et ce qu'on peut réellement confier à un modèle.
Deux notions techniques conditionnent l'usage concret des LLM — et la facture : le token et la fenêtre de contexte.
Le token, unité de base