Mémo sur les deux notions qui déterminent coût, latence et capacité d'un LLM : le token (unité de texte) et la fenêtre de contexte (sa mémoire de travail).
Fiche synthétique
N° 0030
Mémo sur les deux notions qui déterminent coût, latence et capacité d'un LLM : le token (unité de texte) et la fenêtre de contexte (sa mémoire de travail).