Hermes Agent : IA persistante Nous Research 2026

Le projet Hermes Agent, publié par Nous Research en février 2026 sur GitHub, vient de franchir 134 000 étoiles selon le dernier inventaire de la liste awesome-hermes-agent (0xNyk, mai 2026). L’agent se distingue par une particularité absente des concurrents : il maintient une mémoire persistante entre les sessions et crée automatiquement ses propres skills à mesure qu’il rencontre de nouvelles tâches. Cette logique d’agent qui grandit avec son utilisateur tranche avec les outils stateless dominants jusqu’ici. Hermes Agent incarne une nouvelle classe d’IA opérationnelle qui mérite analyse, surtout pour les PME françaises qui cherchent un collaborateur IA de long terme.

Temps de lecture : 13 min

À retenir

Hermes Agent est un agent IA autonome open-source MIT créé par Nous Research, 134 000 étoiles GitHub en mai 2026.
Il maintient une mémoire persistante via MEMORY.md auto-curée et un modèle dialectique Honcho de l’utilisateur.
L’agent crée ses propres skills après 5 tool calls complexes et les améliore en cours d’usage.
Il fonctionne sur 7 backends (local, Docker, SSH, Modal, Daytona, Singularity, Vercel) et 20 plateformes messagerie.

Qu’est-ce qu’Hermes Agent et qui est Nous Research ?

Hermes Agent est un agent IA autonome open-source publié par Nous Research en février 2026. Le projet se définit comme l’agent qui grandit avec vous, par opposition aux assistants stateless qui repartent à zéro à chaque conversation. Il vit sur un serveur dédié, retient ce qu’il apprend, et devient progressivement plus efficace au fil du temps. Cette persistance change profondément la relation entre l’utilisateur et l’IA.

Le laboratoire derrière le projet

Nous Research est un laboratoire de recherche IA open-source connu pour ses modèles Hermes, Nomos et Psyche. Le projet est financé en partie par des dons communautaires et par des contrats de recherche avec des entreprises tech. La philosophie est explicite : tout le code est sous licence MIT, toutes les données restent sur la machine de l’utilisateur, aucune télémétrie n’est collectée, aucun lock-in cloud n’est imposé.

Cette posture tranche avec celle des grands fournisseurs cloud d’IA. Hermes Agent est délibérément conçu pour fonctionner sur un VPS à 5 euros mensuels aussi bien que sur un cluster GPU. Le modèle économique repose sur la diffusion massive de l’outil et la création d’un standard ouvert, plutôt que sur la facturation à l’usage. Cette approche rapproche Hermes du modèle qui a fait le succès de Linux dans les années 2000.

L’argument central : la boucle d’apprentissage fermée

L’argument unique de vente de Hermes Agent est la closed learning loop ou boucle d’apprentissage fermée. Cette boucle combine quatre mécanismes : la mémoire auto-curée avec nudges périodiques, la création autonome de skills après tâches complexes, l’auto-amélioration des skills en cours d’utilisation, et la recherche cross-session via FTS5 avec résumé LLM. Aucun autre agent open-source ne combine ces quatre dimensions à ce jour.

Cette boucle transforme l’agent en collaborateur qui développe une connaissance opérationnelle de l’utilisateur. Au bout de quelques semaines d’usage régulier, Hermes connaît vos projets, vos préférences techniques, vos clients, vos méthodes de travail. Il devient plus efficace qu’un nouveau stagiaire après six mois, sans le coût d’onboarding d’un humain. Cette promesse est ambitieuse mais les retours d’early adopters la valident largement.

Comment fonctionne la mémoire persistante d’Hermes Agent ?

La mémoire persistante d’Hermes Agent repose sur trois couches techniques distinctes qui se complètent. La première est un fichier MEMORY.md auto-curé par l’agent. La deuxième est le moteur de recherche full-text FTS5 sur l’historique des sessions. La troisième est le modèle dialectique de l’utilisateur fourni par le plugin Honcho. Cette architecture évite à la fois l’oubli total et la saturation du contexte.

Le fichier MEMORY.md auto-curé

L’agent maintient un fichier MEMORY.md texte simple qui contient les faits durables qu’il a appris sur l’utilisateur, ses projets et ses préférences. Le contenu est rédigé par l’agent lui-même, avec des nudges périodiques qui le poussent à persister les informations importantes. La curation est progressive : l’agent réécrit régulièrement le fichier pour consolider l’information, archiver les éléments obsolètes et garder une structure cohérente.

Cette approche présente plusieurs avantages opérationnels. Le fichier reste lisible et éditable par l’humain, contrairement aux bases vectorielles opaques. L’utilisateur peut auditer, corriger ou supprimer un fait à tout moment. La taille du fichier reste mesurée car l’agent compresse au fil du temps. Et le format Markdown permet une portabilité parfaite vers d’autres outils ou systèmes de notes.

FTS5 pour la recherche full-text cross-session

En complément de MEMORY.md qui contient les faits structurés, Hermes maintient un index FTS5 SQLite qui couvre toutes les sessions passées. Quand l’agent ne trouve pas l’information dans MEMORY.md, il interroge FTS5 avec une requête générée par le LLM, puis résume les extraits pertinents pour les injecter dans le contexte courant. Cette approche assure que rien n’est jamais totalement perdu, même les conversations qui n’ont pas été promues au rang de mémoire durable.

Le choix de SQLite FTS5 plutôt que d’une base vectorielle est cohérent avec la philosophie minimaliste d’Hermes. Aucune dépendance lourde, aucun service externe, un seul fichier portable. La performance reste excellente jusqu’à plusieurs millions de tokens d’historique. Cette discipline d’ingénierie rappelle celle décrite dans notre analyse de PageIndex RAG sans vecteurs, qui suit une logique similaire de simplicité contre complexité.

Couches mémoire d’Hermes Agent, configuration mai 2026
Couche	Technologie	Rôle
MEMORY.md	Fichier Markdown	Faits durables curés
FTS5	SQLite full-text	Recherche cross-session
Honcho	Plugin tiers	Modèle dialectique utilisateur
SOUL.md	Fichier persona	Personnalité agent

Honcho et le modèle dialectique de l’utilisateur

Le plugin Honcho ajoute une dimension supplémentaire : un modèle dialectique évolutif de l’utilisateur. Au lieu de stocker uniquement des faits, Honcho infère les croyances, les préférences et les motivations de l’utilisateur à partir des échanges. Ce modèle s’affine continuellement au fil des conversations et permet à l’agent d’anticiper les besoins implicites. Cette dimension comportementale dépasse la simple mémoire factuelle.

Pourquoi Hermes Agent crée-t-il ses propres skills automatiquement ?

La création autonome de skills est le second pilier différenciant d’Hermes Agent. Quand l’agent vient de réaliser une tâche complexe (typiquement plus de 5 tool calls enchaînés), il crée automatiquement un document de skill réutilisable. Cette routine peut être réinvoquée à l’identique lors de tâches similaires. Hermes apprend littéralement de son expérience, sans intervention humaine.

Le déclencheur des 5 tool calls

Le seuil de 5 tool calls n’est pas arbitraire. Au-dessous, la tâche reste suffisamment simple pour être recommandée directement par le LLM sans procédure formalisée. Au-dessus, le coût cognitif de retrouver la séquence justifie l’effort de capitalisation. L’agent identifie cette frontière automatiquement et déclenche la rédaction du skill en arrière-plan, sans interrompre l’utilisateur. Le skill est ensuite stocké dans le dossier personnel d’Hermes et indexé pour réutilisation.

Cette capacité change la trajectoire d’un agent sur la durée. Un Hermes utilisé sérieusement pendant trois mois accumule typiquement 40 à 80 skills personnalisés au métier de l’utilisateur. Un nouveau venu reçoit cet acquis cumulatif dès la première session. L’effet de levier est considérable pour les entreprises qui veulent capitaliser le savoir-faire de leurs experts dans un outil reproductible.

Le skill self-improvement en cours d’usage

La deuxième dimension est l’auto-amélioration. Quand Hermes utilise un skill et constate qu’il est obsolète, incomplet ou erroné, il patche le document automatiquement. Cette correction continue maintient la base de skills à jour sans intervention humaine. Une fois par jour ou par semaine, le hermes curator passe en revue l’ensemble des skills, consolide ceux qui se recouvrent et archive ceux qui ne servent plus.

Cette architecture rappelle celle des dépôts de skills humainement écrites, mais avec une dimension supplémentaire : la création automatique. Là où Matt Pocock fournit un set initial de skills statiques, Hermes ajoute la capacité de générer les siennes à partir de l’expérience. Les deux approches sont complémentaires et de nombreuses équipes installent les deux en parallèle.

En pratique

Pour installer Hermes Agent sur un VPS Ubuntu 24, exécutez la commande curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash. L’installeur configure uv, Python 3.11, Node.js, ripgrep et ffmpeg sans sudo nécessaire. Lancez ensuite hermes setup pour configurer votre fournisseur LLM, puis hermes pour démarrer la conversation. Temps total d’installation : 8 minutes sur un VPS récent.

Évaluez votre maturité IA en 5 minutes avec notre Diagnostic IA gratuit.

Quels backends de déploiement Hermes Agent supporte-t-il ?

Hermes Agent supporte 7 backends de terminal différents pour exécuter ses commandes shell : local, Docker, SSH, Singularity, Modal, Daytona et Vercel Sandbox. Cette diversité permet d’adapter le déploiement au profil de l’utilisateur : un développeur solo restera en local, une PME utilisera Docker, une grande entreprise déploiera sur SSH avec des serveurs internes, et un freelance choisira Modal ou Daytona pour la persistance serverless.

Modal et Daytona : la persistance serverless

Les deux backends Modal et Daytona offrent une fonctionnalité unique : la persistance serverless. L’environnement Hermes hiberne automatiquement quand il n’est pas sollicité et se réveille à la demande quand un message arrive sur Telegram ou Discord. Cette logique réduit drastiquement le coût d’exploitation : un agent hiberné consomme quasiment zéro ressource, mais reste prêt à reprendre instantanément la conversation.

Pour une PME française qui veut un agent disponible 24h sur 24 mais utilisé seulement quelques fois par jour, ce mode est idéal. Le coût mensuel descend souvent sous 5 euros par agent, contre 20 à 50 euros pour un VPS classique tournant en continu. Cette économie d’échelle permet de déployer un agent dédié par employé ou par projet sans exploser le budget IT.

La galaxie multi-canal messagerie

Côté entrée, Hermes Agent expose un gateway unique vers 20 plateformes de messagerie : Telegram, Discord, Slack, WhatsApp, Signal, Email, SMS, DingTalk, Feishu, WeCom, Weixin, QQ Bot, Yuanbao, BlueBubbles, Matrix, Mattermost, Microsoft Teams, Google Chat, Home Assistant, et plus. Cette ouverture massive distingue Hermes des outils mono-canal classiques. Une équipe internationale peut utiliser ses outils habituels sans imposer une nouvelle plateforme.

Cette philosophie multi-canal est cohérente avec celle des autres outils open-source de la galaxie Claude Code. La différence : Hermes intègre nativement la persistance et la création de skills, là où OpenClaw se concentre sur le multi-canal pur. Pour les équipes qui veulent passer d’OpenClaw à Hermes, une commande hermes claw migrate automatise le transfert complet des mémoires, skills et clés API.

Quelle différence entre Hermes Agent, Claude Code et OpenClaw ?

Hermes Agent, Claude Code et OpenClaw sont souvent confondus parce qu’ils sont tous trois des agents IA accessibles via messagerie. Les positionnements diffèrent pourtant fortement. Claude Code est un agent de coding spécialisé pour les développeurs. OpenClaw est un assistant personnel multi-canal généraliste. Hermes Agent est un agent self-improving avec mémoire persistante et création de skills autonome. Ces trois rôles ne se recouvrent que partiellement.

Claude Code, l’agent de coding sans mémoire durable

Claude Code excelle sur les tâches de développement logiciel : lire un dépôt, écrire du code, lancer des tests, déboguer. Il s’intègre nativement dans le terminal du développeur et dispose d’une connaissance approfondie des langages, frameworks et outils techniques. Sa limite : pas de mémoire persistante entre sessions, pas de création autonome de skills, pas de gestion multi-canal native sauf via Claude Code Channels en bêta.

Cette focalisation a un avantage : Claude Code reste prévisible, testable, et facile à intégrer dans une CI ou un workflow d’équipe. Les équipes qui veulent un agent de coding pur, sans complexité supplémentaire, préfèreront Claude Code. Notre guide n8n MCP Claude workflow builder détaille comment l’orchestrer dans des chaînes d’automatisation plus larges.

OpenClaw et Hermes : deux philosophies de l’agent personnel

OpenClaw et Hermes partagent la vocation d’agent personnel multi-canal. La différence est philosophique. OpenClaw mise sur le nombre de canaux intégrés (50+) et la facilité de connexion à WhatsApp, iMessage, Signal et autres plateformes grand public. Hermes mise sur la profondeur cognitive : moins de canaux directement supportés, mais une mémoire et un apprentissage continu qui transforme l’agent en collaborateur durable.

Comparatif Hermes Agent, Claude Code et OpenClaw, mai 2026
Critère	Hermes Agent	Claude Code	OpenClaw
Mémoire persistante	Native, auto-curée	Non native	Partielle
Création skills	Autonome	Manuelle	Manuelle
Canaux messagerie	20	2 (via Channels)	50 plus
Backends terminal	7	1 (local)	2 (local, Docker)
Modèles supportés	200 plus	Anthropic Claude	50 plus

Faut-il intégrer Hermes Agent dans une PME française ?

Pour une PME française qui découvre les agents persistants en 2026, l’intégration d’Hermes Agent répond à trois besoins métier précis. Capitalisation du savoir-faire, automatisation des tâches récurrentes, et accès permanent à un assistant qui comprend le contexte projet. Les premiers retours du terrain donnent des chiffres précis sur le retour sur investissement attendu à 6 mois.

Cas d’usage typiques pour une PME

Trois cas d’usage dominent les déploiements PME en 2026. Premier cas : assistant projet client persistant. L’agent retient le contexte de chaque dossier, les préférences du client, les jalons techniques, et accompagne le chef de projet sur la durée. Deuxième cas : automatisation reporting et veille. Hermes scanne quotidiennement les sources définies, agrège les informations, et envoie un brief Telegram chaque matin. Troisième cas : compagnon technique pour développeur ou expert métier solo.

Dans tous les cas, l’agent se déploie sur un VPS Hetzner ou OVH à 5 à 12 euros mensuels et se connecte à OpenRouter ou Nous Portal pour le LLM. Le coût opérationnel total reste sous 50 euros mensuels même pour des usages intensifs. Cette économie permet de tester Hermes sur plusieurs cas en parallèle avant d’industrialiser le plus rentable. Cette philosophie de pilote rapide est cohérente avec celle décrite dans notre guide hyperautomation PME, RPA et agents IA.

Le calcul du retour sur investissement à 6 mois

Pour un cas d’usage assistant projet client, une PME française type rapporte les gains suivants à 6 mois : 25 à 35 % de temps économisé sur les tâches de coordination client par projet, 40 % de réduction des oublis ou erreurs de suivi grâce à la mémoire persistante, et 15 à 20 % d’augmentation de la marge sur les projets accompagnés par Hermes. Sur 5 projets clients gérés en parallèle, l’économie annuelle dépasse facilement 25 000 euros pour un coût opérationnel sous 600 euros annuels.

Le retour sur investissement excède 4 000 % la première année dans cette configuration. Ces chiffres restent à confirmer sur votre cas précis, mais l’ordre de grandeur est typique des early adopters européens en 2026. Pour structurer cette transition, nos clients combinent souvent Hermes avec d’autres briques d’automatisation et de pilotage stratégique IA, comme détaillé dans notre offre SEO et GEO automatisée.

En pratique

Avant de déployer Hermes Agent en production, lancez un pilote de 6 semaines avec un seul collaborateur et un seul cas d’usage. Mesurez trois indicateurs : temps gagné par semaine, satisfaction de l’utilisateur, et qualité des outputs produits. Si les trois s’améliorent après 4 semaines de fonctionnement, étendez à l’équipe. Sinon, ajustez la configuration ou changez de cas d’usage avant de scaler le déploiement complet.

Les limites à connaître avant adoption

Trois limites doivent être anticipées avant tout déploiement. Premièrement, Hermes Agent reste un projet bleeding-edge avec des bugs réguliers et une documentation parfois en retard sur la fonctionnalité. Deuxièmement, la gestion de la mémoire persistante demande une discipline d’audit pour éviter que des informations sensibles ou erronées s’accumulent. Troisièmement, le multi-canal apporte une exposition élargie aux attaques par message malveillant qu’il faut sandboxer rigoureusement.

Cette adoption se combine avec des approches complémentaires détaillées dans nos analyses sur le format SKILL.md de Matt Pocock, la galaxie Free Claude Code et OpenClaw et le standard agent skills Addy Osmani. Ensemble, ces ressources composent la stack d’agents IA persistants la plus mature en 2026, accessible aux PME françaises sans budget cloud massif.

Méthodologie

Cet article s’appuie sur la documentation officielle NousResearch/hermes-agent, le site hermes-agent.nousresearch.com, la liste curée 0xNyk/awesome-hermes-agent et l’analyse YUV.AI Hermes Agent, toutes consultées en mai 2026. Les compteurs d’étoiles GitHub correspondent aux instantanés publiés à la date de rédaction.

À lire ensuite :

Questions fréquentes sur Hermes Agent et les agents IA persistants en 2026

Qu’est-ce que Hermes Agent et qui l’a créé ?

Hermes Agent est un agent IA autonome open-source MIT publié par Nous Research en février 2026. Le projet se définit comme l’agent qui grandit avec vous : il vit sur un serveur dédié, retient ce qu’il apprend via une mémoire persistante, et devient progressivement plus efficace au fil du temps. Nous Research est un laboratoire de recherche IA open-source connu pour ses modèles Hermes, Nomos et Psyche, et défend une philosophie de logiciel libre sans télémétrie.

Comment Hermes Agent maintient-il une mémoire persistante ?

Hermes utilise trois couches de mémoire complémentaires. Un fichier MEMORY.md texte simple auto-curé par l’agent avec des nudges périodiques pour persister les faits durables. Un index FTS5 SQLite full-text qui couvre toutes les sessions passées pour la recherche cross-session. Un plugin Honcho qui maintient un modèle dialectique évolutif de l’utilisateur. Ces trois couches évitent à la fois l’oubli total et la saturation du contexte.

Comment Hermes Agent crée-t-il ses propres skills automatiquement ?

Quand l’agent vient de réaliser une tâche complexe avec plus de 5 tool calls enchaînés, il crée automatiquement un document de skill réutilisable. Cette routine peut être réinvoquée à l’identique lors de tâches similaires. L’agent identifie le seuil de complexité, déclenche la rédaction en arrière-plan, et stocke le skill dans son dossier personnel indexé pour réutilisation. Un Hermes utilisé trois mois accumule typiquement 40 à 80 skills personnalisés.

Quels backends de déploiement Hermes supporte-t-il ?

Hermes Agent supporte 7 backends terminal différents : local, Docker, SSH, Singularity, Modal, Daytona et Vercel Sandbox. Modal et Daytona offrent une persistance serverless unique : l’environnement hiberne quand inactif et se réveille à la demande, réduisant le coût mensuel sous 5 euros. Un développeur solo restera en local, une PME utilisera Docker, une grande entreprise déploiera sur SSH avec des serveurs internes, et un freelance choisira Modal pour la persistance économique.

Quels modèles LLM Hermes Agent peut-il utiliser ?

Hermes supporte plus de 200 modèles via différents fournisseurs : Nous Portal natif, OpenRouter avec 200 plus modèles, NovitaAI, NVIDIA NIM avec Nemotron, Xiaomi MiMo, z.ai GLM, Kimi Moonshot, MiniMax, Hugging Face, OpenAI ou tout endpoint personnel compatible. La commande hermes model permet de changer de modèle sans modification de code ni lock-in. Cette flexibilité permet d’optimiser le ratio qualité-prix selon chaque cas d’usage.

Eric Christophe, dirigeant HDVMA, expert SEO et IA

Bloc auteur Eric Christophe, dirigeant HDVMA
	Eric Christophe, dirigeant HDVMA Expert SEO et automatisation IA. Accompagne PME et ETI françaises dans leur stratégie de visibilité Google et IA. Cas phare : BoatCible, +320 % de trafic organique en 18 mois, cité par ChatGPT et Perplexity. LinkedIn

Diag IA offert — 30 min
Nous contacter
Parler à Eric