Qu'est-ce qu'un agent IA · Définition simple

Quand on lit les communications sur l'IA, on tombe vite sur du jargon : LLM, agent, RAG, fine-tuning, MCP, prompt engineering, embeddings… À quoi tout cela correspond concrètement, et que faut-il retenir si on dirige une PME ?

Voici le glossaire essentiel, en langage métier, en 7 minutes de lecture.

LLM (Large Language Model)

Un LLM est un modèle d'intelligence artificielle entraîné à comprendre et générer du texte. C'est le moteur derrière ChatGPT, Claude, Gemini, Mistral. Concrètement, vous lui donnez du texte (une question, un document, des instructions), il produit du texte en retour.

Analogie : c'est un employé qui a lu une grande partie d'internet et qui peut rédiger, classer, résumer, traduire, expliquer. Mais qui ne sait rien spécifiquement de votre entreprise tant que vous ne le lui dites pas.

Les principaux en 2026 :

OpenAI GPT-5 / GPT-5 Pro : très polyvalent, écosystème ChatGPT, fortement intégré à Microsoft
Anthropic Claude 4.7 : excellent en raisonnement et code, très utilisé en automatisation
Google Gemini 2.5 : intégration Google Workspace, multimodal puissant
Mistral / Llama / Qwen : modèles open-source déployables en local

Agent IA

Un agent IA, c'est un LLM combiné à des outils et des règles d'action. Il ne se contente pas de répondre, il agit dans votre environnement.

Exemples concrets :

Un agent lit votre boîte mail, classe les messages, répond ou transfère selon des règles
Un agent cherche dans votre CRM, met à jour un statut, déclenche une notification
Un agent écoute un appel téléphonique, résume le contenu, crée une tâche dans votre planning

La différence-clé entre un agent et un chatbot : l'agent prend des décisions et agit, là où un chatbot se contente de répondre à des questions.

RAG (Retrieval-Augmented Generation)

RAG signifie « génération augmentée par récupération ». En clair : brancher un LLM sur vos propres documents.

Sans RAG, un LLM ne sait rien de votre entreprise. Avec RAG, vous lui donnez accès à votre wiki interne, vos contrats, vos comptes-rendus, vos procédures. Quand vous posez une question, le système va d'abord chercher les passages pertinents dans vos documents, puis demande au LLM de répondre en s'appuyant sur ces extraits.

Cas d'usage typiques en PME :

« Quelle est notre procédure pour onboarder un nouveau client ? »
« Quels sont les termes du contrat signé avec X en 2023 ? »
« Combien on a facturé en moyenne pour un projet de type Y l'an dernier ? »

Le RAG est la technique la plus utilisée en PME car elle ne demande pas de fine-tuning et fonctionne dès qu'on a accès aux documents.

Fine-tuning

Le fine-tuning, c'est spécialiser un modèle en l'entraînant sur vos données spécifiques. Le modèle ainsi obtenu « pense » comme votre entreprise.

C'est puissant mais coûteux (entre 5 000 et 50 000 CHF selon l'ampleur), et pas toujours nécessaire. Pour 90 % des cas PME, un bon RAG bien fait fait mieux et coûte 10× moins. Le fine-tuning ne se justifie que pour des cas très spécifiques (ton de voix très particulier, vocabulaire ultra-spécialisé, volumes très importants).

Prompt et prompt engineering

Un prompt, c'est l'instruction que vous donnez au LLM. « Résume ce document en 3 points » est un prompt simple. « Tu es un assistant administratif de régie immobilière à Lausanne. Classe ce mail entrant selon les catégories suivantes [...] » est un prompt structuré.

Le prompt engineering, c'est l'art de bien rédiger ces instructions pour obtenir le résultat voulu de façon fiable. C'est moins une science exacte qu'un savoir-faire qui s'acquiert par itérations.

Embeddings

Un embedding est une représentation numérique d'un texte qui permet à un ordinateur de comparer la similarité de sens entre deux phrases. Concrètement, c'est la brique technique qui permet à un RAG de chercher des documents pertinents même si vous ne les avez pas formulés exactement avec les mêmes mots.

Vous n'avez pas besoin de gérer les embeddings vous-même, c'est de la plomberie technique qu'une agence spécialisée installe. Mais savoir que ça existe aide à comprendre pourquoi un RAG bien configuré comprend vos questions même formulées approximativement.

MCP (Model Context Protocol)

Apparu en 2024 et devenu standard en 2026, le MCP est une norme qui permet aux LLM de se connecter facilement aux outils externes (votre CRM, votre messagerie, votre comptabilité). Anthropic l'a lancé, OpenAI et Google l'ont adopté.

Pour vous, dirigeant PME, ça signifie : connecter un agent IA à vos outils existants est aujourd'hui beaucoup plus simple et fiable qu'il y a 18 mois. Là où il fallait coder des intégrations sur mesure, MCP fournit un protocole standardisé.

Multimodal

Un modèle multimodal comprend plusieurs types de contenu : texte, images, audio, vidéo. En 2026, GPT-5 et Claude 4.7 acceptent par exemple :

Une photo de facture papier → l'agent extrait les données et les pousse dans Bexio
Un enregistrement audio de réunion → l'agent en fait un compte-rendu structuré
Une capture d'écran de tableau Excel mal formaté → l'agent reconstruit les données proprement

C'est un game-changer pour les PME qui jonglent avec des formats hétérogènes.

Token

Un token est l'unité de facturation des LLM. Très grossièrement : 1 token = ¾ d'un mot français. Une réponse de 100 mots = ~135 tokens. Les prix typiques en 2026 vont de 0,5 à 15 CHF par million de tokens selon le modèle.

Concrètement, une tâche moyenne (lire un mail, le classer, suggérer une réponse) coûte entre 0,001 et 0,01 CHF. Sur 100 mails par jour : moins d'un franc.

Hallucination

Quand un LLM invente une information fausse en la présentant comme vraie, on parle d'hallucination. C'est le problème n°1 à connaître quand on déploie un agent IA.

Solutions pratiques :

RAG bien fait : on force l'agent à citer ses sources internes
Validation humaine sur les actions sensibles (envoi, paiement, modification critique)
Garde-fous : règles strictes sur ce que l'agent peut et ne peut pas dire
Choix du bon modèle : certains hallucinent moins (Claude 4.7 Sonnet est souvent cité comme le plus fiable)

Ce qu'il faut retenir

LLM = le moteur, le « cerveau » qui comprend et génère du texte
Agent IA = LLM + outils + règles d'action (le truc qui fait vraiment le boulot dans vos processus)
RAG = brancher le LLM sur VOS documents (la technique-clé en PME)
MCP = standard qui simplifie les intégrations en 2026
Hallucination = le risque à gérer avec des garde-fous

Vous voulez voir comment ces concepts s'appliquent à votre cas concret ? L'audit finalyn.ia est gratuit, on vous montre quels concepts mobiliser dans votre contexte spécifique.

Qu'est-ce qu'un agent IA ? Définition claire pour décideurs PME

LLM (Large Language Model)

Agent IA

RAG (Retrieval-Augmented Generation)

Fine-tuning

Prompt et prompt engineering

Embeddings

MCP (Model Context Protocol)

Multimodal

Token

Hallucination

Ce qu'il faut retenir

Discutons de votre cas concret.

Qu'est-ce qu'un agent IA ? Définition claire pour décideurs PME

LLM (Large Language Model)

Agent IA

RAG (Retrieval-Augmented Generation)

Fine-tuning

Prompt et prompt engineering

Embeddings

MCP (Model Context Protocol)

Multimodal

Token

Hallucination

Ce qu'il faut retenir

Discutons de votre cas concret.

À lire aussi

API et webhook : qu'est-ce que c'est, et pourquoi ça change tout pour les PME

Claude 4.7, GPT-5, Gemini 2.5, Mistral : quel modèle IA pour quelle PME en 2026 ?