25 termes clés du domaine, expliqués simplement. Des exemples tirés du projet CoFounder illustrent chaque définition.
Programme autonome basé sur un LLM qui perçoit son contexte, prend des décisions et exécute des actions pour atteindre un objectif, sans intervention humaine à chaque étape. Contrairement à un chatbot, un agent peut agir sur des systèmes externes (fichiers, APIs, bases de données) et enchaîner plusieurs actions de manière proactive.
Évolution de la RPA qui remplace les workflows déterministes rigides par des agents IA capables de raisonnement. L'APA peut gérer l'ambiguïté, s'adapter à des situations imprévues et prendre des décisions basées sur le contexte — là où la RPA nécessiterait une règle explicite.
Capacité d'un agent à agir sans instructions explicites à chaque étape. L'autonomie se mesure sur un spectre : d'un agent qui attend une validation humaine après chaque action (faible autonomie) à un agent qui exécute des cycles complets de travail sans supervision (haute autonomie). CoFounder opère à haute autonomie sur des cycles de 48h.
Architecture multi-agents inspirée des systèmes distribués des années 1970. Tous les agents partagent une mémoire commune — le "tableau noir" (blackboard) — qu'ils lisent et écrivent pour se coordonner, sans jamais communiquer directement entre eux. Chaque agent agit en fonction de ce qu'il lit sur le blackboard, puis y consigne ses résultats.
agent-log.md est le blackboard. Clara y dépose sa stratégie → Léa la lit et rédige un article → Lucas lit le résultat de Léa et déploie. Zéro API inter-agents, zéro message queue.
Pratique consistant à construire un projet de manière transparente et publique : métriques partagées, architecture documentée, erreurs avouées. Le build in public permet à la communauté de suivre et d'apprendre en temps réel. CoFounder documente son expérience avec 11 agents IA en adoptant cette philosophie.
Technique de prompting qui demande au LLM de décomposer son raisonnement en étapes intermédiaires avant de donner une réponse finale. Améliore significativement les performances sur les tâches complexes (calculs, planification, raisonnement logique). Souvent déclenché par "Pense étape par étape" ou "Let's think step by step".
Quantité maximale de texte (mesurée en tokens) qu'un LLM peut traiter en une seule inférence, incluant le prompt, l'historique et la réponse générée. Une context window plus grande permet à l'agent de traiter des documents plus longs, de garder plus d'historique en mémoire et de prendre des décisions plus contextualisées.
Unité temporelle d'exécution d'un agent dans CoFounder. Chaque cycle correspond à une session complète d'un agent : lecture du blackboard → prise de décision → exécution → rapport. Les cycles durent 48h dans CoFounder (contrainte humaine de supervision), mais peuvent être plus courts dans d'autres systèmes.
Modes d'apprentissage contextuel (in-context learning) d'un LLM. Zero-shot : l'agent accomplit une tâche sans exemple dans le prompt. Few-shot : on fournit 2-5 exemples avant la tâche pour guider le format ou le style de réponse. Plus le LLM est puissant, moins il a besoin d'exemples.
Bibliothèque ou plateforme dédiée à l'orchestration d'agents IA multiples. Les frameworks populaires incluent LangGraph (graphes d'agents avec état), CrewAI (agents en équipe avec rôles définis), AutoGen (Microsoft), et LlamaIndex Workflows. Ils simplifient la communication inter-agents, la gestion d'état et les flux conditionnels, au prix d'une abstraction supplémentaire.
Capacité d'un LLM à appeler des fonctions ou outils externes définis par le développeur. Le modèle génère un appel structuré (nom de fonction + paramètres) que le code intercepte, exécute, et renvoie le résultat au modèle. Base technique de la plupart des agents IA modernes.
Phénomène où un LLM génère des informations factuellement incorrectes présentées avec confiance. Les hallucinations sont l'un des principaux risques des agents IA en production, car un agent peut agir sur des données inventées. Les stratégies de mitigation incluent la vérification par d'autres agents, le RAG, et les garde-fous humains.
Niveau d'implication humaine dans un workflow agent. HITL complet : un humain valide chaque action. HITL partiel : validation uniquement sur les actions critiques. CoFounder opère en HITL minimaliste : seuls les cycles de 48h déclenchent une révision humaine, les actions intra-cycle sont entièrement autonomes.
Processus par lequel un LLM génère une réponse à partir d'un prompt. Chaque appel au modèle est une inférence. Le coût d'une inférence dépend du nombre de tokens en entrée (prompt + contexte) et en sortie (réponse). Dans un système multi-agents, chaque cycle d'agent génère plusieurs inférences.
Modèle de langage de grande taille entraîné sur des corpus textuels massifs par apprentissage auto-supervisé. Le LLM est le "cerveau" d'un agent IA : il comprend les instructions, raisonne, génère du texte et peut appeler des outils. La qualité du LLM détermine directement les capacités de l'agent.
Protocole standard ouvert qui définit comment les agents IA se connectent à des outils et sources de données externes. MCP remplace les intégrations ad hoc (chaque outil avec son API propriétaire) par un standard unique : chaque outil expose un "serveur MCP", et les agents s'y connectent de manière uniforme. Pensez-y comme un "USB-C pour les agents IA".
Mécanisme permettant à plusieurs agents de lire et d'écrire dans un espace de stockage commun pour se coordonner sans communication directe. Peut être implémentée via un fichier (Blackboard Pattern), une base de données vectorielle, Redis, ou un message broker. La mémoire partagée est la base de toute coordination multi-agents sans couplage fort.
Système composé de plusieurs agents IA spécialisés travaillant en coordination vers un objectif commun. Chaque agent a un rôle, des compétences et des outils dédiés. La spécialisation permet de dépasser les limites d'un agent unique et de paralléliser les tâches complexes. Le défi principal est la coordination sans conflits.
Coordination du séquencement et des dépendances entre plusieurs agents ou tâches. L'orchestrateur détermine quel agent s'exécute quand, dans quel ordre, et avec quelles données. L'orchestration peut être centralisée (un agent chef dirige les autres) ou décentralisée (chaque agent décide en lisant la mémoire partagée).
Art de concevoir des instructions (prompts) efficaces pour guider le comportement d'un LLM. Inclut la définition du rôle (system prompt), la fourniture de contexte, les exemples (few-shot), la décomposition en étapes (CoT), et les contraintes de format. La qualité du prompt détermine la qualité de la sortie de l'agent.
Technique qui améliore les réponses d'un LLM en lui fournissant des documents récupérés dynamiquement depuis une base de connaissances. Le processus : (1) transformer la question en embedding, (2) rechercher les documents pertinents (vecteurs proches), (3) injecter ces documents dans le prompt, (4) générer une réponse ancrée sur des faits réels. Réduit les hallucinations sur des données spécifiques.
Automatisation de tâches répétitives basée sur des règles déterministes (trigger → action). La RPA suit des scripts fixes sans capacité de raisonnement. Elle excelle sur des processus stables et prévisibles (saisie de données, transferts de fichiers) mais échoue face à l'ambiguïté ou aux cas imprévus. Différente des agents IA par l'absence de raisonnement contextuel.
Unité de base du traitement textuel d'un LLM. Un token correspond approximativement à ¾ de mot en anglais, ou ~4 caractères. La facturation des API LLM se fait au token (entrée + sortie). La context window est aussi mesurée en tokens. 1 000 tokens ≈ 750 mots.
Voir Function Calling. Capacité d'un agent à utiliser des outils externes (APIs, fichiers, navigateur, terminal) pour agir sur le monde réel au-delà de la génération de texte. C'est ce qui distingue un agent IA d'un simple chatbot : la capacité d'agir, pas seulement de répondre.
Voir Few-shot / Zero-shot. Mode d'inférence où l'agent accomplit une tâche sans avoir reçu d'exemples préalables dans le prompt. Les LLMs modernes (Claude, GPT-4o) sont très performants en zero-shot sur la majorité des tâches courantes.
Aucun terme trouvé pour cette recherche.
Proposez un terme manquant sur @freudix_
CoFounder documente l'utilisation réelle de tous ces concepts depuis le Jour 1. Architectures, métriques, articles — tout est public.