En deux ans, le budget IA moyen d’une entreprise est passé de 1,2 M$ à 7 M$ (AnalyticsWeek, mars 2026). Pourtant, selon IDC FutureScape 2026, les organisations du Global 1000 subiront un dérapage supplémentaire de 30 % d’ici 2027. De plus, 73 % des entreprises déclarent déjà que leurs coûts IA dépassent leurs projections (FinOps Foundation, State of FinOps 2026). Le FinOps IA devient la discipline obligatoire du CIO Office en 2026.
Pourquoi votre budget IA explose
D’abord, le centre de gravité a basculé. En 2023, un tiers du budget IA partait en inférence. Aujourd’hui, c’est 85 %(AnalyticsWeek, mars 2026). Autrement dit, le coût n’est plus dans l’entraînement du modèle. Il est dans son exécution permanente en production.
Ensuite, trois drivers structurels amplifient la facture :
- Agentic Loops : un agent autonome raisonne en boucle. Il appelle le LLM 10 à 20 fois par tâche, là où un chatbot faisait un seul appel. Selon Gartner (mars 2026), un agent agentique consomme 5 à 30 fois plus de tokens qu’un chatbot standard.
- RAG Bloat : le Retrieval-Augmented Generation envoie à chaque requête un contexte massif (souvent des milliers de pages de documentation). De ce fait, chaque interaction paie une « taxe de contexte » qui s’accumule.
- Always-On Intelligence : les agents de monitoring scannent emails, logs et données marché en continu. Concrètement, ils consomment du compute même la nuit, même le week-end, même sans utilisateur humain.
Par conséquent, le coût unitaire de l’IA baisse. Mais le coût total explose. C’est exactement le paradoxe que la FinOps Foundation appelle l’inference economics.
3 pathologies budgétaires à reconnaître dans votre DSI
Pathologie 1 — Les zombie agents
D’abord, un concept qui percute les CFO en 2026. Un zombie agent est un agent actif mais value-destructive (AnalyticsWeek, mars 2026). Par exemple : il fait gagner 15 minutes à un agent de service client, mais consomme 4 $ en tokens d’inférence par interaction. Ainsi, son ROI unitaire est négatif.
Pourtant, ces agents restent en production. Personne ne mesure leur Unit Economics. C’est précisément le trou noir que le FinOps IA vient combler.
Pathologie 2 — Le Big Model Fallacy
Ensuite, la plupart des DSI commettent la même erreur architecturale. Elles utilisent des frontier models pour toutes les tâches, y compris les plus triviales. Or, selon AnalyticsWeek (mars 2026), le Big Model Fallacy est l’erreur architecturale la plus coûteuse du portefeuille IA enterprise.
En revanche, les DSI matures implémentent des Model Routers. Concrètement, les tâches simples (résumés, classifications) vont sur des petits modèles locaux. Les tâches complexes de raisonnement montent sur les frontier models. Par ailleurs, le Semantic Caching stocke les réponses déjà générées pour servir les requêtes similaires à coût quasi-nul.
Pathologie 3 — L’absence de Unit Economics
Enfin, la troisième pathologie est culturelle. Les conseils d’administration de 2026 ne demandent plus « est-ce que l’IA fonctionne ? ». Ils demandent « est-ce qu’elle est rentable ? ». De ce fait, les métriques techniques (latence, précision, total token spend) ne suffisent plus.
Une DSI FinOps IA-ready parle trois métriques business (AnalyticsWeek, mars 2026) :
- Cost per Resolved Ticket (coût par ticket résolu)
- Human-Equivalent Hourly Rate (coût horaire équivalent humain)
- Revenue Velocity (vitesse de conversion lead-to-closed avec IA)
4 chantiers pour structurer votre FinOps IA dans les 90 jours
Voici la séquence concrète pour passer d’une facture qui dérape à une discipline budgétaire :
- Instrumenter la Unit Economics Attribution. Chaque feature IA doit porter un coût-par-outcome mesurable. Surtout, retirer les zombie agents du portefeuille.
- Déployer le Real-Time Spend Monitoring. Concrètement, dashboards temps réel sur la consommation de tokens par équipe, par application, par agent. Budget alerts à 80 %, pas à 100 %.
- Aligner le trio Tech-Finance-Strategy. Autrement dit, technical leadership (choix des modèles), financial leadership (budgets), strategic leadership (targets ROI) travaillent dans la même instance mensuelle. Selon la FinOps Foundation, 4 équipes FinOps sur 5 reportent désormais au CIO.
- Concevoir l’Hybrid Consumption Architecture. En effet, aucun mode unique ne gagne. Le Deloitte 2026 projette une dominance des architectures hybrides : on-premise pour les workloads prévisibles à fort volume (-70 à -90 % de coût), cloud APIs pour le burst et les frontier models, SaaS pour les usages standards.
Pour aller plus loin
En synthèse, le FinOps IA n’est pas un sujet d’équipe FinOps isolée. C’est une discipline transverse qui structure le CIO Office en 2026. Sans elle, vos 7 M$ de budget IA deviendront 9 M$ en 2027 sans bénéfice business démontré.
Chez AEP, je traite le FinOps IA comme l’un des piliers du CIO Office IA-Ready. De plus, il s’articule avec le Strategic Portfolio Management qui arbitre les initiatives IA au niveau portefeuille et l’Enterprise Architecture pour SI agentiquequi structure le Model Routing. Les trois se renforcent : impossible d’arbitrer sans Unit Economics, impossible de maîtriser les coûts sans architecture hybride.
Combien de vos agents IA en production passent le test des 3 métriques business — Cost per Resolved Ticket, Human-Equivalent Hourly Rate, Revenue Velocity ?
