GPT-5.4 cambia il modo di usare ChatGPT: più preciso dell’uomo nella gestione desktop

OpenAI ha annunciato GPT-5.4, nuovo modello di intelligenza artificiale disponibile su ChatGPT, API e Codex. La piattaforma introduce miglioramenti significativi nelle attività professionali, con particolare attenzione a ragionamento avanzato, sviluppo software, gestione di documenti e workflow automatizzati. Accanto alla versione standard debutta anche GPT-5.4 Pro, pensata per chi richiede prestazioni massime su task complessi.

Il nuovo modello integra i progressi sviluppati con GPT-5.3-Codex e amplia le capacità operative degli agenti AI. Il sistema supporta fino a 1 milione di token di contesto, caratteristica che consente di gestire progetti di lunga durata, analisi estese e sequenze operative articolate. Gli agenti possono pianificare, eseguire e verificare attività lungo intere catene di lavoro senza perdere coerenza.

Una delle novità più rilevanti riguarda le capacità native di utilizzo del computer. GPT-5.4 può operare su applicazioni, browser e ambienti software attraverso librerie come Playwright oppure tramite input visivi basati su screenshot e comandi di mouse e tastiera. Questo permette agli agenti di completare operazioni multi-step tra siti web e programmi, con intervento umano ridotto.

I benchmark mostrano miglioramenti evidenti. Nel test OSWorld-Verified, che valuta l’uso del desktop tramite immagini e input, GPT-5.4 raggiunge un 75,0% di successo, valore superiore sia al 47,3% di GPT-5.2 sia alla media umana del 72,4%. Nel benchmark WebArena-Verified, dedicato all’utilizzo del browser, il nuovo modello registra un 67,3% di successo rispetto al 65,4% della generazione precedente.

OpenAI ha lavorato anche sulla qualità delle risposte. Nei test interni basati su segnalazioni degli utenti, le affermazioni false risultano il 33% meno frequenti rispetto a GPT-5.2, mentre la probabilità che una risposta contenga errori scende del 18%. Il modello mostra miglioramenti anche nella creazione e modifica di contenuti professionali.

Nei test dedicati ai fogli di calcolo, GPT-5.4 raggiunge un punteggio medio dell’87,3%, contro il 68,4% del modello precedente, con le attività tipiche di analisi finanziaria. Nella generazione di presentazioni, i valutatori umani preferiscono i risultati del nuovo modello nel 68% dei casi, grazie a una grafica più curata e maggiore varietà visiva.

Un altro elemento chiave riguarda l’efficienza nell’utilizzo dei token. GPT-5.4 richiede meno token per risolvere problemi complessi rispetto a GPT-5.2, con tempi di risposta inferiori e costi più contenuti per gli sviluppatori. In Codex è disponibile anche la modalità /fast, che consente una velocità di elaborazione fino a 1,5 volte superiore mantenendo la stessa qualità di output.

Il modello introduce inoltre tool search, sistema che consente agli agenti di individuare strumenti e API solo quando necessario. In scenari con molti strumenti disponibili, questa funzione riduce il carico di contesto e migliora l’efficienza. In un test su 250 task con 36 server MCP attivi, l’uso di tool search ha ridotto il consumo totale di token del 47% mantenendo lo stesso livello di precisione.

Sul fronte della comprensione visiva, GPT-5.4 migliora anche la gestione delle immagini ad alta risoluzione. Il livello di input denominato original image detail supporta fino a 10,24 milioni di pixel o 6000 pixel di dimensione massima, mentre il livello high detail arriva a 2,56 milioni di pixel o 2048 pixel.

GPT-5.4 è disponibile da oggi su ChatGPT come GPT-5.4 Thinking per gli utenti Plus, Team e Pro, mentre GPT-5.4 Pro è destinato agli abbonamenti Pro ed Enterprise. Gli sviluppatori possono accedere al modello tramite API con il nome gpt-5.4 e alla versione avanzata gpt-5.4-pro. Il modello precedente GPT-5.2 Thinking rimarrà disponibile per tre mesi nella sezione Legacy prima della dismissione prevista per il 5 giugno 2026.