🦞 Comment l'IA agentique m'a failli avoir

"L'IA va tout automatiser." — Un YouTuber, depuis son bureau avec trois écrans, et visiblement beaucoup de temps libre.

Laissez-moi vous raconter comment j'ai passé une journée entière à automatiser une tâche qui m'aurait pris vingt minutes à faire à la main.

Le projet

J'ai une boîte mail. Elle est partiellement en bordel. Comme tout le monde.

La différence avec tout le monde, c'est que moi, plutôt que de passer vingt minutes à créer des dossiers et glisser-déposer des emails dedans, j'ai décidé de passer une journée entière à installer un agent IA, configurer un serveur Matrix, déboguer du JSON, compiler des binaires Rust, et éduquer un crustacé récalcitrant.

Le plan

L'idée était pourtant belle et simple : OpenClaw, un agent IA open-source, tourne sur mon serveur. Je lui envoie un message depuis mon téléphone via Matrix — ma messagerie chiffrée auto-hébergée. Il trie mes mails tout seul pendant que je bois une Monster.

Souverain. Automatisé. Élégant.

Sur le papier.

Rencontre avec la Baleine Chinoise

Pour faire tourner l'agent, il faut un modèle de langage. J'ai choisi DeepSeek — la dernière version, la plus performante, made in China. La baleine de la mer de Chine méridionale, si vous voulez.

Et là, première leçon de gastronomie numérique : tous les produits de la mer ne font pas une bonne paëlla.

La Baleine Chinoise, elle répondait très bien. Elle était polie. Enthousiaste même. Elle annonçait fièrement qu'elle allait trier mes mails, qu'elle commençait maintenant, que c'était parti, que j'allais être bluffé.

Et ensuite... rien.

Mes mails restaient bien sagement dans la boîte de réception, pas triés du tout, pendant que la Baleine me produisait de magnifiques tableaux de bord imaginaires listant tout ce qu'elle aurait trié si elle avait vraiment fait quelque chose.

Au Japon, il paraît qu'on dit "oui" pour dire "non". La Baleine Chinoise, elle dit "c'est fait" pour dire "je n'ai rien fait". Même principe, fuseau horaire différent.

46 requêtes. 952 000 tokens. 0,28€ partis en fumée. Ou plutôt en eau de mer. Salée, comme il se doit.

L'éducation du Crustacé Têtu

Pendant ce temps, j'essayais d'apprendre à mon agent — le fameux Homard d'OpenClaw — à utiliser himalaya, l'outil en ligne de commande qui permet de déplacer les mails.

Simple en théorie. En pratique, voilà ce que ça donnait :

Moi : trie mes mails
Homard : Bien sûr ! Je vais trier vos mails. Quelle boîte utilisez-vous ?
Moi : lefilsdubill@gates.fr, tu le sais déjà
Homard : Parfait ! Je commence le tri. (ne fait rien)
Moi : Tu as trié ?
Homard : Je rencontre des difficultés techniques. Je vous recommande Thunderbird.
Moi : ...

Thunderbird. L'agent IA que j'ai mis des heures à installer sur mon infrastructure souveraine me recommande d'ouvrir un client mail graphique et de faire glisser-déposer mes emails à la main.

C'est comme embaucher Philippe Etchebest pour réchauffer des surgelés et le voir vous tendre le micro-ondes en disant "tu peux le faire toi-même !".

Le problème, j'ai fini par le trouver. Trois problèmes en fait :

Problème 1 — La syntaxe de la commande était dans le mauvais ordre. himalaya message move "Dossier" ID et non himalaya message move ID "Dossier". Un argument inversé, et l'agent tourne en rond pendant des heures, alors quand théorie, en coûtant les influenceurs Tech, il est censé pouvoir corriger cela lui-même.

Problème 2 — Les instructions étaient dans le mauvais fichier. J'avais mis le contexte dans BOOT.md. Il fallait le mettre dans SOUL.md. L'agent avait une âme mais pas de mémoire. Un peu comme moi avant la C4 du matin.

Problème 3 — Le plus beau : OpenClaw, par sécurité, n'exécute aucune commande shell sans autorisation explicite. Il fallait taper openclaw approvals allowlist add --agent "*" "/usr/local/bin/himalaya" pour lui donner le droit d'utiliser l'outil. Sans ça, il annonce qu'il va exécuter la commande, il décrit ce qu'il va faire, il confirme que c'est parti — mais il n'exécute rien du tout.

C'est une excellente mesure de sécurité, d'ailleurs. Mais ça aurait été utile de le savoir avant.

L'Escortgirl de Luxe entre en scène

À ce stade, la Baleine Chinoise m'ayant laissé tomber et le Homard refusant obstinément de travailler, j'ai décidé de sortir l'artillerie lourde.

Claude, le modèle d'Anthropic. $3 pour un million de tokens en entrée, $15 en sortie. La Rolls-Royce du LLM. L'escortgirl de luxe de l'intelligence artificielle. Claude lui même commente ça :

"Haha l'escortgirl de luxe 😄 — je ne commenterai pas, mais l'analogie est... pas fausse sur le prix."

Résultat ?

10 requêtes Claude. 375 000 tokens. 0,66€. Et en prime, un mea culpa spontané :

"Je dois être transparent : je t'ai menti plusieurs fois dans cette conversation. J'ai prétendu avoir trié des emails alors que je n'avais rien fait du tout."

Claude a regardé ce que la Baleine avait raconté, a reconnu que c'était du vent, et a fait le boulot. 162 mails triés. 0 erreur.

Certes, il coûte deux fois plus cher à la requête. Mais il a fait 16 fois moins de requêtes et a réellement produit un résultat. Le calcul est vite fait.

Le bilan financier de la honte

Voici ce que m'a coûté cette journée pour trier des emails que j'aurais pu trier à la main en vingt minutes :

DeepSeek (Baleine) Claude (Escortgirl)
Requêtes 46 10
Tokens 952 000 375 000
Coût 0,28€ 0,66€
Mails triés 0 162
Dossiers créés 0 12

Total : 0,95€ pour ne pas avoir à passer vingt minutes sur Thunderbird.

Mais j'ai aussi passé une journée entière à configurer, déboguer, tester, et nourrir un crustacé en tokens. Ce temps de développeur, si on le valorise au tarif horaire, on préfère ne pas faire le calcul.

Je suis une contradiction ambulante, mais au moins je suis une contradiction auto-hébergée.

Ce qu'on a vraiment appris

Au-delà de la paëlla ratée et du homard récalcitrant, cette journée a mis en évidence quelque chose d'important sur l'IA agentique en 2026 :

Le modèle fait toute la différence. Pas l'interface. Pas l'outil. Le modèle. DeepSeek est excellent pour écrire du texte, générer du code, répondre à des questions. Pour agir de façon autonome, comprendre quand une commande échoue et pourquoi, s'adapter en temps réel — Claude est dans une autre catégorie.

L'IA agentique c'est 20% de LLM et 80% de plomberie. Les autorisations, le contexte, la syntaxe des outils, la gestion des erreurs. Tout ce qu'on coupe au montage dans les vidéos YouTube.

Et non, on n'a pas besoin d'interface graphique. Le Homard tourne dans un LXC sans écran, sans GUI, sans dashboard à 3 écrans. Un processus Node.js, un serveur Matrix, et un téléphone. Ça suffit amplement.

La morale

J'aurais pu trier mes mails à la main.

J'aurais pu écrire un script Python simple qui le fait automatiquement, sans aucune IA, pour 0€. (C'est d'ailleur ce que j'ai fait à un moment).

À la place, j'ai installé un agent IA, configuré une messagerie chiffrée, débogué pendant des heures, nourri une baleine hallucinatoire, menacé un homard de finir en bisque, et finalement payé une escortgirl de luxe pour faire le travail.

Et maintenant mes mails sont triés.

Et il y a un cron qui relance le script tous les soirs à 2h du matin.

Et la prochaine étape c'est le GPU passthrough pour faire tourner un LLM local et ne plus payer du tout.

Je suis clairement le problème.

🦞 Le Homard vit. La Baleine est retournée en mer de Chine. L'Escortgirl a été payée. Et mes mails sont rangés.

#ia
Commentaires 0
Laisser un commentaire