calendar_month
arrow_backRetour au blog
IA & Transformation11 min de lecture

Lock-in IA : ce que le leak Conway change pour ta stratégie multi-modèles

Le leak du code de Claude Code a révélé Conway, un agent always-on. Voici ce que ça veut dire pour ta dépendance Anthropic, et comment garder ta souveraineté IA sans renoncer aux outils performants.

F

Flavien Bittar

8 mai 2026

Lock-in IA : ce que le leak Conway change pour ta stratégie multi-modèles

TL;DR pour les pressés

Anthropic a accidentellement leaké 512 000 lignes de code de Claude Code fin mars 2026. Dedans : un projet inédit appelé Conway, un agent always-on avec format d'extension propriétaire .cnw.zip. En parallèle, ils ont coupé l'accès aux harness tiers comme OpenClaw avec 24h de préavis. Le pattern est clair : la couche modèle reste compétitive, la couche d'exécution se ferme. Solution pour les opérateurs : Markdown local, multi-modèles par défaut, mémoire d'agent traitée comme une dette technique. La portabilité, ça se construit avant d'en avoir besoin.

Le mot d'un client qui m'a fait creuser

Mi-avril, un dirigeant de PME me dit : "Cowork a réorganisé tout mon Drive, mes mails, ma facturation. Je peux plus revenir en arrière."

Pas "je veux pas". "Je peux plus". La nuance fait toute la différence.

C'est le mécanisme classique de l'endowment effect appliqué à l'IA d'entreprise : une fois qu'un outil a absorbé tes process, le coût psychologique de partir devient supérieur au coût rationnel de rester. Sauf que dans le cas des agents apprenants, le coût de partir n'est plus seulement psychologique. Il devient technique, opérationnel, et bientôt structurel.

C'est exactement ce que le leak Conway nous oblige à regarder en face.

Ce qui a fuité (et qui n'aurait pas dû)

Le 31 mars 2026, Anthropic publie par erreur 512 000 lignes de code source de Claude Code sur npm via une packaging error. Le chercheur Chaofan Shou identifie le source map dans les heures qui suivent. Anthropic envoie un DMCA. Trop tard : le code est déjà mirroré sur plusieurs repos.

Au-delà du sujet sécurité, les chercheurs trouvent 44 feature flags cachés. Trois en particulier méritent attention :

  • Projet Conway : agent always-on, UI séparée du chat
  • Framework d'extensions CNW : format .cnw.zip propriétaire
  • Système de webhooks et mémoire persistante : pour des sessions qui durent des jours, voire des semaines

Conway agirait en continu sur déclencheurs externes (mail, ticket, deploy) sans que tu sois devant l'écran. Pas une feature de plus, une catégorie de produit différente. Cowork agit quand tu lui demandes. Conway agirait à ta place, en permanence.

Anthropic n'a rien annoncé. Mais le code parle.

La thèse : Anthropic prépare le prochain grand jardin clos

Mets bout à bout ce qui est sorti ces 6 derniers mois :

  • Claude Code (2024) — Devs, sur demande
  • Cowork (janvier 2026) — Non-techs, sur demande étendue
  • Channels (mars 2026) — Tous, pilotage à distance
  • Routines (avril 2026) — Tous, cloud-hébergé
  • Conway (test interne) — Tous, always-on

Le pattern n'est pas un modèle, c'est une couche d'exécution apprenante. Plus tu l'utilises, mieux elle te connaît. Mieux elle te connaît, plus elle a de valeur. Plus elle a de valeur, plus elle est dure à remplacer.

C'est du switching cost classique, version 2026.

Le mécanisme à comprendre : la portabilité des données est cadrée juridiquement (RGPD, etc.). Quand tu changes de fournisseur, tu peux récupérer tes fichiers. Mais la portabilité du contexte d'agent — comment il a appris à bosser pour toi pendant 6 mois — n'a aucun standard, aucune obligation, aucun framework. C'est le nouvel angle de capture, et personne n'en parle.

L'épisode OpenClaw de début avril confirme la stratégie. OpenClaw est un harness tiers, créé par Peter Steinberger. Il permettait d'utiliser un abonnement Claude Pro ou Max pour piloter Claude via une UI alternative. Le 4 avril 2026, Anthropic coupe l'accès. Justification officielle : leurs propres outils sont optimisés pour le prompt cache, les harness tiers contournent ces optimisations, donc charge serveur non soutenable.

Argument économique défendable. Un abonné Max à 200 $/mois pouvait théoriquement consommer plusieurs milliers de dollars en API direct via OpenClaw. C'est de l'arbitrage, pas une fonctionnalité.

Mais l'exécution a été brutale : moins de 24h de préavis, pas de période de grâce, pas de migration window. Steinberger, qui a depuis rejoint OpenAI, a parlé publiquement de "trahison des développeurs open source". Le signal pour les opérateurs est clair : la frontière entre "ouvert" et "captif" se déplace selon ce qui menace l'économie d'Anthropic. C'est leur droit. Mais c'est ton problème si t'as construit dessus sans plan B.

L'antithèse : Anthropic est aussi le plus ouvert des grands labos

Ce serait malhonnête de s'arrêter là. Anthropic joue ouvert sur des terrains où ils auraient pu fermer, et ça change la lecture stratégique.

Décembre 2025 : Anthropic donne le Model Context Protocol (MCP) à la Linux Foundation, dans une nouvelle entité appelée Agentic AI Foundation. MCP a maintenant plus de 10 000 serveurs publics actifs et est devenu le standard de facto adopté par OpenAI, Google et Microsoft. La gouvernance reste neutre, les mainteneurs continuent de prioriser l'input communautaire. Ils auraient pu garder ça propriétaire. Ils l'ont donné.

Sur le pricing, même nuance. Claude Opus 4.7 affiche 5 $/M tokens en input et 25 $/M en output. Mais avec prompt caching, les cache reads tombent à 0,50 $/M (90% de réduction). Le batch processing coupe encore 50% supplémentaires. À usage optimisé, t'es à 5% du sticker price. C'est pas du dumping, c'est pas non plus du tarif captif.

Et sur Mythos, le modèle interne "trop dangereux pour être déployé" : Anthropic publie sa Responsible Scaling Policy, définit ses propres seuils de capacité au-delà desquels un modèle nécessite des sauvegardes additionnelles avant déploiement. Tu peux trouver ça marketing, mais aucun autre labo majeur ne publie ses red lines aussi explicitement.

Donc voilà la lecture honnête : Anthropic verrouille la couche d'expérience (Conway, .cnw.zip, agents always-on) tout en ouvrant la couche de connectique (MCP, Responsible Scaling Policy publique). C'est sophistiqué. La bonne question n'est pas "Anthropic est-il méchant ?" mais "qu'est-ce qui est ouvert, qu'est-ce qui est fermé, et où je dois mettre mes œufs ?"

Le test d'inversion : qu'est-ce qui te bloquerait pour partir ?

Avant de te donner ma reco, voilà un exercice que je fais avec mes clients. Inverse la question. Au lieu de "comment je sais que je suis bien chez Anthropic ?", demande "qu'est-ce qui me bloquerait pour partir demain ?"

Réponses typiques que je récupère en audit :

  • "On a 18 mois de prompts custom dans la mémoire de l'agent." → Capture comportementale.
  • "Notre équipe est formée que sur Claude." → Switching cost humain.
  • "Toutes nos automations passent par Routines." → Lock-in d'infrastructure.
  • "Notre client final connaît que ChatGPT et Claude." → Lock-in marketing.
  • "On a optimisé tous nos prompts pour le tokenizer Claude." → Lock-in technique.

Si tu coches 3+ cases, t'es plus client. T'es captif. Et le jour où Anthropic décide de doubler les prix, de couper une feature, ou de pivoter (rappel : OpenClaw, 24h de préavis), tu manges.

Ce n'est pas un scénario catastrophe, c'est juste de la gestion de risque. Toute boîte sérieuse pense à sa redondance fournisseur. L'IA devrait être traitée pareil.

La synthèse pratique : 3 principes qui marchent

Je bosse avec des PME, des scale-ups, des artisans, des industriels. La question revient toujours : "On utilise quoi, comment on évite de se planter dans 18 mois ?"

1. Garde ton contexte en Markdown, localement

Tes process, guides, notes de réunion, prompts qui marchent : tout en .md sur disque ou dans un repo. Pas dans la mémoire propriétaire d'un seul outil.

Avantages concrets :

  • Lisible par n'importe quel modèle (Claude, GPT, Gemini, DeepSeek, Mistral, modèles locaux)
  • Versionné via git, donc pas de perte
  • Lisible dans 20 ans, indépendant des changements de fournisseur
  • Permet le multi-modèles sans réécriture

Structure que j'utilise avec mes clients : 4 dossiers seulement. Projets (actifs, court terme), Casquettes (rôles permanents), Ressources (process, guides, frameworks), Archives (terminé, gardé pour référence). Tu pointes ton agent dessus, peu importe l'agent. Si tu changes de fournisseur, ton contexte suit.

C'est pas sexy. C'est ce qui marche.

2. Multi-modèles par défaut, pas par exception

DeepSeek V4 Flash à 0,14 $/M input fait le job pour 70% des tâches courantes (classification, résumés, extraction simple). Opus reste devant pour le code complexe et les workflows agents. Mythos, quand il sortira en accès large, prendra la couche recherche profonde.

Construire ton stack autour d'un seul provider, c'est te mettre une corde au cou. Construire autour de 2-3 que tu switches selon la tâche, c'est de l'architecture. Le multi-modèles ajoute 1-2 jours de setup. Il te sauve potentiellement plusieurs semaines de migration plus tard.

Concrètement, ça veut dire : un router LLM dans ton code (LiteLLM, OpenRouter, ou ton propre wrapper), des prompts testés sur au moins 2 providers, et un benchmark interne sur tes propres tâches métier. Pas un benchmark MMLU, un benchmark tes tâches.

3. Méfie-toi de la mémoire des agents, pas des outils

Cowork, Conway, Microsoft Copilot, Salesforce Einstein, tous apprennent comment tu bosses. C'est leur valeur et leur mécanisme de capture. Pas un bug, le business model.

Si tu déploies un agent always-on chez un client, traite ces 3 questions dès le début :

  • Qui possède la mémoire (toi, ton client, le fournisseur) ?
  • Comment elle s'exporte si on veut changer ?
  • Qu'est-ce qu'on garde hors de l'agent (comme connaissance documentée) pour ne pas dépendre uniquement de sa mémoire ?

C'est pas un blocage. C'est une checklist. Tu peux toujours utiliser les outils. Tu sais juste où tu mets les pieds.

Le détail du tokenizer 4.7 : pourquoi la dépendance coûte sans prévenir

Si je devais garder un seul fait pour illustrer le déplacement silencieux des coûts, c'est celui-là. Opus 4.7 utilise un nouveau tokenizer qui peut produire jusqu'à 35% de tokens en plus pour le même texte, à prix sticker stable.

Donc même sans changer ton usage, ta facture peut augmenter de 35%. Pas par malveillance : c'est probablement un meilleur tokenizer, plus efficace pour le modèle. Mais c'est typique de ce qui arrive quand tu dépends d'une seule plateforme. Les changements internes ont un impact sur ton P&L sans que tu puisses réagir.

C'est pas un complot. C'est juste la réalité de la dépendance, dans n'importe quel marché.

Ce qu'il faut retenir

Anthropic n'orchestre pas un hold-up. Ils exécutent une stratégie business classique, plutôt mieux que la moyenne : capturer les développeurs avec Code, élargir aux non-techniques avec Cowork, créer la stickiness avec Conway, garder MCP ouvert pour rester crédibles sur l'écosystème.

Le problème n'est pas Anthropic. Le problème, c'est si tu construis ton activité dessus sans avoir pensé à ta sortie. Pas seulement les données, mais la mémoire opérationnelle, les process appris, les patterns extraits.

Ma reco aux clients en ce moment : utilisez Claude là où il est meilleur, c'est-à-dire à beaucoup d'endroits. Mais gardez votre savoir hors du jardin. Markdown local, multi-modèles dans le stack, agents traités comme des outils remplaçables et pas comme des collègues irremplaçables.

La portabilité, ça se construit avant d'en avoir besoin. Pas après.

À confirmer dans les prochains mois — Conway n'est pas encore sorti, Mythos non plus, l'industrie peut tourner. Mais le pattern est assez clair pour que je commence à câbler mes clients dès maintenant.

Si cet article t'a aidé à clarifier ta stratégie IA, on peut en discuter. Digital Easy fait des audits multi-modèles pour des PME et des scale-ups qui veulent l'IA sans la dépendance. Réserve un Discovery Call de 20 minutes.

FAQ

Questions fréquentes

help

Qu'est-ce que Conway exactement ?

Un projet d'agent always-on découvert dans le leak du code source de Claude Code en mars 2026. Conway aurait sa propre UI, un format d'extension propriétaire (.cnw.zip), et la capacité de tourner en continu en réagissant à des webhooks externes. Pas encore lancé publiquement à la date de cet article.

help

Anthropic prépare-t-il vraiment un lock-in ?

Pas explicitement. Anthropic a au contraire donné MCP à la Linux Foundation en décembre 2025, ce qui est un geste d'ouverture rare. Mais la couche d'exécution (Cowork, Conway, Routines, .cnw.zip) reste propriétaire et apprend ton contexte au fil du temps. Le lock-in est un effet de la stratégie, pas forcément l'objectif déclaré.

help

Comment réduire ma dépendance à Claude sans perdre en performance ?

Trois leviers : (1) garder ton knowledge en Markdown local, lisible par n'importe quel modèle ; (2) router tes tâches vers le modèle le plus pertinent (DeepSeek pour le simple, Opus pour le complexe, etc.) ; (3) traiter la mémoire des agents always-on comme une dette technique, pas comme un actif.

help

Quelle alternative à Claude Opus pour les tâches complexes ?

GPT-5 et Gemini 3 Pro sont les concurrents directs. DeepSeek V4 Pro pour un meilleur ratio coût/performance. Mistral Large 3 pour les contraintes RGPD. Le bon réflexe est de tester sur tes propres tâches métier, pas sur les benchmarks publics.

help

Le leak Claude Code est-il un problème pour les utilisateurs ?

Pas directement pour les utilisateurs finaux : le code leaké est côté client, donc pas d'impact sur la sécurité de tes données. Pour Anthropic, c'est plus embêtant côté propriété intellectuelle et révélation de roadmap.

Prêt à transformer votre écosystème numérique ?

Découvrez comment DigitalEasy accompagne les PME dans leur transformation digitale.

calendar_monthRéserver un Discovery Call