Indice degli argomenti
Per gran parte della rivoluzione dell’intelligenza artificiale generativa, le organizzazioni hanno operato sulla base di un presupposto apparentemente logico: se l’IA aumenta la produttività, allora un maggiore utilizzo dell’IA dovrebbe produrre automaticamente più valore per il business. Questa convinzione ha guidato la prima fase dell’adozione enterprise dei large language model, trasformando il consumo di token in una sorta di metrica universale dell’innovazione. Dashboard di utilizzo, numero di prompt, chiamate API e attività degli agenti IA sono rapidamente diventati indicatori di progresso digitale, mentre dirigenti e team celebravano la crescita dell’adozione come prova tangibile della trasformazione in corso.
Con il passare del tempo, tuttavia, è emerso un paradosso sempre più difficile da ignorare. Molte organizzazioni stavano consumando quantità senza precedenti di intelligenza artificiale, ma faticavano a dimostrare ritorni economici proporzionati. I budget crescevano più rapidamente dei benefici misurabili, i costi di inferenza (l’elaborazione dei dati da parte del modello) aumentavano e le preoccupazioni relative alla governance iniziavano a moltiplicarsi. Il problema non era l’assenza di adozione. Al contrario, l’IA era ormai presente ovunque. Ciò che mancava era la capacità di collegare il consumo di intelligenza alla creazione di valore economico.
Questa tensione sta alimentando una delle trasformazioni manageriali più importanti del 2026. La conversazione si sta progressivamente spostando da ciò che potremmo definire Tokenmaxxing, ovvero la ricerca del massimo consumo possibile di IA, verso il ROImaxxing, la ricerca disciplinata di risultati economici misurabili. Dietro questo cambiamento si nasconde una presa di coscienza ancora più profonda: l’intelligenza artificiale sta diventando una nuova risorsa aziendale da allocare, governare e ottimizzare allo stesso modo del capitale finanziario, delle infrastrutture tecnologiche e del talento umano (News18, 2026).
La convinzione che ha guidato la prima ondata di AI enterprise
La prima fase dell’adozione aziendale dell’IA è stata dominata da una logica relativamente semplice. Se l’intelligenza artificiale rende i dipendenti più produttivi, allora un maggiore utilizzo dell’intelligenza artificiale dovrebbe produrre automaticamente risultati migliori. In questo contesto, il consumo di token è diventato un indicatore privilegiato perché facilmente misurabile. Mentre gli impatti reali sul business richiedevano mesi o anni per essere valutati, le metriche di utilizzo erano disponibili in tempo reale.
I dirigenti potevano monitorare immediatamente il numero di prompt generati, le chiamate API effettuate, i token consumati e il livello di attività degli agenti IA. Molto più complesso risultava invece misurare miglioramenti nella qualità delle decisioni, nella soddisfazione dei clienti, nell’efficienza operativa o nella crescita dei ricavi. Di conseguenza, molte organizzazioni hanno finito per ottimizzare ciò che riuscivano a osservare.
L’entità del fenomeno è diventata evidente nel corso del 2026. Secondo Insight (2026), Google elabora oggi oltre 3,2 quadrilioni di token IA al mese, un volume circa sette volte superiore rispetto all’anno precedente. Parallelamente, Meta monitora internamente circa 60 trilioni di token generati da oltre 85 mila dipendenti attraverso una piattaforma nota come Claudeonomics (Top1Markets, 2026). Questi numeri testimoniano quanto profondamente l’intelligenza artificiale sia ormai integrata nei processi aziendali. Tuttavia, mostrano anche come il consumo sia diventato una metrica di successo in sé, indipendentemente dai risultati generati.
Il punto critico è che il consumo rappresenta un input, non un output. Come osserva la teoria economica, aumentare il consumo di una risorsa non garantisce automaticamente una crescita proporzionale del valore creato. Acquistare più server non produce necessariamente software migliore. Allo stesso modo, consumare più intelligenza artificiale non garantisce decisioni migliori, processi più efficienti o vantaggi competitivi sostenibili.
Quando il consumo cresce più velocemente del valore
La debolezza fondamentale del Tokenmaxxing emerge proprio nel momento in cui le organizzazioni iniziano a confrontare costi e benefici. Con l’espansione delle implementazioni IA, molte aziende hanno scoperto che la curva della spesa cresceva molto più rapidamente della curva dei risultati.
Uber rappresenta uno degli esempi più citati. Secondo India Today (2026), l’azienda avrebbe esaurito il budget annuale destinato a Claude Code già entro aprile, dopo appena quattro mesi di attività. La spesa mensile per sviluppatore oscillava tra circa 150 e duemila dollari, a seconda dell’intensità di utilizzo. Parallelamente, alcuni fornitori hanno aumentato i prezzi associati al consumo di token, mettendo in discussione l’assunzione secondo cui i costi di inferenza sarebbero diminuiti indefinitamente nel tempo (Weixin, 2026).
Ancora più significativo è ciò che emerge dalle analisi sulla produttività. Una ricerca condotta da Jellyfish su circa 12 mila sviluppatori appartenenti a 200 organizzazioni ha rilevato che gli utenti più intensivi consumavano circa dieci volte più token rispetto agli utenti mediani, ma producevano soltanto il doppio dell’output misurabile (Jellyfish, 2026; Ghaffary, 2026). In termini economici, ciò significa che la produttività cresceva, ma il consumo cresceva molto più rapidamente.
Questa osservazione è fondamentale perché mette in discussione uno degli assunti centrali della prima fase di adozione dell’IA. Se il consumo aumenta di dieci volte e l’output soltanto di due, l’efficienza complessiva peggiora. L’organizzazione non sta massimizzando il valore creato; sta semplicemente aumentando il consumo di una risorsa computazionale. La lezione non è che l’intelligenza artificiale non funzioni. La lezione è che consumo e valore non sono sinonimi.
Perché il problema non era il budget
Molti osservatori hanno interpretato queste difficoltà come un problema di budgeting. In realtà, il budget era soltanto il sintomo di una questione più profonda.
La maggior parte delle organizzazioni ha costruito le proprie previsioni di spesa utilizzando modelli ereditati dal software enterprise tradizionale. Le licenze software tendono a essere relativamente prevedibili. Il consumo di IA, invece, è altamente variabile. Un numero limitato di utenti o di agenti autonomi in loop ricorsivi può generare una quota sproporzionata della spesa complessiva, rendendo estremamente difficile applicare modelli di pianificazione tradizionali.
A complicare ulteriormente la situazione è intervenuto il sistema di incentivi. Molte aziende hanno premiato il livello di utilizzo anziché il valore creato. Dashboard interne, classifiche di consumo e obiettivi di adozione hanno spesso incoraggiato i dipendenti a utilizzare più IA possibile, senza chiedersi se quell’utilizzo producesse risultati economicamente significativi.
Come spesso accade nei sistemi complessi, gli individui hanno ottimizzato la metrica utilizzata per valutarli (la Legge di Goodhart). Il risultato è stato prevedibile: maggiore attività, maggiore consumo, costi crescenti e risultati spesso inferiori alle aspettative. In altre parole, il modello di budgeting ha fallito perché era stato costruito sopra un modello di performance incompleto. L’equazione implicita del Tokenmaxxing — più token uguale più valore — si è rivelata molto meno robusta di quanto molti avessero immaginato.
L’emergere del ROImaxxing
Nel corso del 2026, numerose organizzazioni hanno iniziato a correggere la rotta. Secondo News18 (2026), aziende come Uber, Microsoft, Salesforce, Meta e DoorDash hanno introdotto misure per limitare o governare meglio il consumo di IA. Il cambiamento riflette una crescente attenzione verso l’efficienza economica e non semplicemente verso l’adozione tecnologica.
Amazon, per esempio, avrebbe eliminato le classifiche interne di utilizzo IA dopo aver osservato comportamenti opportunistici da parte dei dipendenti, che generavano grandi volumi di attività a basso valore esclusivamente per migliorare la propria posizione nelle classifiche (Sohu, 2026). Microsoft avrebbe ridotto alcune licenze Claude Code nel tentativo di rivalutare l’efficienza della spesa (Warren, 2026).
GitHub, dal canto suo, ha introdotto modelli di pricing basati sull’effettivo utilizzo di Copilot tramite l’introduzione di crediti IA dedicati, aumentando la trasparenza economica e la responsabilizzazione degli utenti (Rodriguez, 2026). Meta avrebbe persino eliminato alcune classifiche interne basate sul consumo di token, riconoscendo implicitamente che l’utilizzo non rappresenta necessariamente una misura di valore (Top1Markets, 2026).
Questi esempi segnalano una trasformazione più ampia della filosofia manageriale. Le organizzazioni stanno iniziando a trattare l’intelligenza come una risorsa economica e non come una commodity illimitata. La domanda non è più quanta IA utilizzino i dipendenti. La domanda è quale valore economico generi quell’utilizzo. Come osserva Yamini Rangan, CEO di HubSpot, le aziende che si concentrano esclusivamente sulla massimizzazione del consumo rischiano di massimizzare gli sprechi anziché il valore (SmarterX, 2026).
L’allocazione dell’intelligenza come nuova disciplina manageriale
La rilevanza di questo cambiamento va ben oltre i budget dedicati all’IA. Storicamente, le organizzazioni hanno imparato a gestire capitale finanziario, infrastrutture fisiche e talento umano. Oggi si trovano davanti a una nuova sfida: gestire l’intelligenza stessa.
L’intelligenza artificiale sta rapidamente diventando una risorsa allocabile. Modelli differenti offrono costi differenti, velocità differenti, livelli di ragionamento differenti e profili di rischio differenti. La domanda strategica non è più se adottare l’IA, ma come distribuire l’intelligenza all’interno di workflow, processi decisionali e attività operative per massimizzare il valore creato.
Questo implica che il vantaggio competitivo del futuro non apparterrà necessariamente alle organizzazioni che consumano più IA. Apparterrà alle organizzazioni che sapranno allocare l’intelligenza in modo più efficiente rispetto ai concorrenti.
La distinzione può sembrare sottile, ma è profondamente trasformativa. Segna il passaggio da una logica di adozione tecnologica a una logica di allocazione delle risorse. Così come le aziende mature non massimizzano semplicemente la spesa in capitale ma ne ottimizzano l’impiego, i leader dell’AI del futuro non massimizzeranno il consumo di token. Ottimizzeranno il rendimento economico ottenuto per ogni unità di intelligenza utilizzata.
La domanda strategica che i dirigenti dovranno porsi nei primi anni non sarà quindi:
“Quanta AI stiamo utilizzando?”
La domanda diventerà:
“Quanto valore economico stiamo generando per ogni unità di intelligenza consumata?”
È questa la domanda che segna l’inizio di una fase più matura dell’intelligenza artificiale enterprise. Una fase caratterizzata non soltanto da entusiasmo tecnologico, ma da disciplina economica, accountability, governance e risultati misurabili. In altre parole, l’era del Tokenmaxxing sta progressivamente lasciando spazio all’era del ROImaxxing, nella quale il vero vantaggio competitivo non deriverà dalla quantità di intelligenza consumata, ma dalla capacità di allocarla dove genera il massimo ritorno economico. (Foto di Brecht Corbeel su Unsplash)
Referenze
- Ghaffary, S. (2026, May 7). Engineers burn 10x more AI tokens for just 2x more output. Welcome to the backlash against tokenmaxxing. Business Insider. https://www.businessinsider.com/ai-tokenmaxxing-fails-as-productivity-strategy-jellyfish-2026-5
- India Today. (2026, May 29). Claude ate up Uber’s full year AI budget in 4 months? Here is what really happened. https://www.indiatoday.in/technology/news/story/uber-ai-spending-claude-code-adoption-budget-exhausted-by-april-2026-2918946-2026-05-29
- Insight. (2026, May 27). The Chatbot Era Is Over: How Google I/O 2026 Just Unlocked True Agentic AI. https://www.insight.com/en_US/content-and-resources/blog/agentic-ai-at-google-io-2026.html
- Jellyfish. (2026, April 15). Is tokenmaxxing cost effective? New data from Jellyfish explains. https://jellyfish.co/blog/is-tokenmaxxing-cost-effective-new-data-from-jellyfish-explains/
- News18. (2026, May 29). Corporate America Is Starting To Ration AI As Costs Explode Despite The Boom: What’s Happening. https://www.news18.com/tech/corporate-america-is-starting-to-ration-ai-as-costs-explode-despite-the-boom-whats-happening-10298113.html
- Rodriguez, M. (2026, April 27). GitHub Copilot is moving to usage-based billing. GitHub Blog. https://github.blog/2026-04-27-github-copilot-is-moving-to-usage-based-billing/
- SmarterX. (2026, April 21). Why No One Has Enterprise AI Agents Figured Out Yet. https://smarterx.ai/why-no-one-has-enterprise-ai-agents-figured-out-yet/
- Sohu. (2026, May 30). 亚马逊叫停AI用量排行榜,把烧Token当绩效考核可行吗 (Amazon ferma le classifiche d’uso dell’AI: è fattibile usare il consumo di token come valutazione delle performance?). https://www.sohu.com/a/1029741311_161795
- Top1Markets. (2026, April 7). Meta 8.5萬員工30天燒掉60萬億Token,這筆AI投資能換來什麼?(85.000 dipendenti di Meta bruciano 60 trilioni di token in 30 giorni: cosa può portare questo investimento in AI?). https://www.top1markets.com/cn/news/meta-token-competition-claudeonomics-ai-fm26
- Warren, T. (2026, May 14). Microsoft starts canceling Claude Code licenses. The Verge. https://www.theverge.com/tech/930447/microsoft-claude-code-discontinued-notepad
- Weixin. (2026, April 3). 警惕!从百模大战到算力通胀,Token成本暴涨300%,最终谁来埋单?(Attenzione! Dalla guerra dei cento modelli all’inflazione della potenza di calcolo: i costi dei token aumentano del 300%, chi pagherà alla fine?). http://mp.weixin.qq.com/
© RIPRODUZIONE RISERVATA
