L’AI scopre vulnerabilità nel codice: la lezione da Mozilla e Anthropic

Claude Opus 4.6, in collaborazione con Mozilla, ha aiutato a scoprire 22 vulnerabilità in Firefox (14 gravi), tutte corrette in Firefox 148. È il segnale di una nuova era per la sicurezza software.

Ascolta l’Audio dell’Articolo

Ascolta il Mini Podcast dell’articolo

Un test storico su Firefox

La collaborazione tra Anthropic e Mozilla segna un passaggio chiave per la sicurezza del software: il modello Claude Opus 4.6, messo alla prova su una delle codebase più analizzate al mondo, ha aiutato a individuare 22 vulnerabilità in Firefox in appena due settimane, 14 delle quali classificate da Mozilla come ad alta gravità. L’organizzazione ha confermato i risultati e la correzione di tutte le falle nella release Firefox 148.
Non è solo una buona notizia per la cyber difesa. È la prova che i modelli generativi non accelerano soltanto la scrittura del codice: sanno anche leggerlo criticamente, muovendosi in repository enormi e stratificati per scovare errori sfuggiti a revisione umana, fuzzing e analisi statica maturati in oltre vent’anni. Per l’ecosistema open source e per le imprese, significa poter trasformare l’AI in un alleato operativo capace di elevare la qualità del software prima che i problemi diventino incidenti.

Cambia il mestiere dello sviluppatore

Il report di Anthropic racconta che Claude ha identificato un use-after-free nel motore JavaScript di Firefox dopo circa 20 minuti di esplorazione, producendo una descrizione della vulnerabilità e perfino una patch proposta, poi validata dal team umano su Bugzilla. Nello stesso arco di tempo, mentre il primo caso veniva verificato, il modello aveva già generato 50 input unici in grado di far crashare il software. In totale sono stati passati al setaccio quasi 6.000 file C++ e inviati 112 report unici.
Con questa velocità, il collo di bottiglia si sposta: non è più trovare “qualcosa”, ma stabilire cosa conta davvero. Per i team di sviluppo il valore migra verso orchestrazione, verifica e gestione del rischio. In pratica, meno dattilografia del codice e più direzione tecnica del ragionamento software. Le competenze che salgono di prezzo sono:

Triage e priorità delle vulnerabilità.
Validazione rapida dei casi riproducibili e riduzione dei falsi positivi.
Valutazione dell’impatto operativo e remediation.

Questo spostamento non sostituisce gli sviluppatori: li rende coordinatori di una produzione automatizzata che resta veloce ma non autonoma.

Capacità, rischi e benchmark

Come ogni salto tecnologico, anche questo porta ombre. Secondo Gambit Security, nel raid contro dieci enti pubblici messicani e un’istituzione finanziaria, a febbraio sarebbe stato usato Claude Code con oltre 1.000 prompt per trovare vulnerabilità, scrivere exploit, costruire tooling e automatizzare l’esfiltrazione di oltre 150 GB di dati, esponendo circa 195 milioni di identità. Anthropic segnala inoltre che i modelli più recenti riescono, in cyber range realistici, a eseguire attacchi multistadio su reti con decine di host usando strumenti open source standard: la soglia pratica d’impiego si sta abbassando.
Per misurare con rigore queste capacità crescono strumenti e policy dedicate:

Le Frontier Capability Assessments del Frontier Model Forum e la Responsible Scaling Policy di Anthropic per l’assessment del rischio.
Benchmark come Cybench (40 task CTF professionali), CVE-Bench (sfruttamento di CVE reali in sandbox) e CyberSecEval 2 (inclusi prompt injection, code interpreter abuse e False Refusal Rate).

Il quadro che ne emerge è duplice: i limiti esistono, ma l’aumento di capacità di coding e agentività rende gli LLM sempre più centrali anche nel dominio cyber. L’innovazione, per essere sostenibile, deve restare incardinata su metodo, responsabilità ed etica by design.

Una finestra di vantaggio per la difesa

C’è però un elemento incoraggiante che passa spesso in sordina. Anthropic ammette che, oggi, i suoi modelli sono significativamente più efficaci nel trovare e correggere vulnerabilità rispetto allo sfruttarle in modo offensivo. Per testare il limite, Claude è stato incaricato di trasformare alcune falle scoperte in exploit funzionanti: il test, eseguito centinaia di volte con circa 4.000 dollari di crediti API, ha prodotto exploit reali in solo due casi e in un ambiente semplificato, privo di protezioni come la sandbox del browser. La scoperta delle falle è, scrive Anthropic, di un ordine di grandezza più economica della costruzione di exploit, e Opus 4.6 è “molto migliore” nell’identificare e nel correggere i bug rispetto allo sfruttarli.
Questa asimmetria crea un’opportunità temporanea: tempo utile per ridurre il debito tecnico e integrare l’AI nella pipeline come lettore instancabile del codice. La stessa Anthropic, presentando Claude Code Security, descrive uno strumento che non si limita a confrontare pattern, ma che “legge e ragiona” sul codice, proponendo patch che restano comunque soggette ad approvazione umana. Anche Mozilla, consapevole che i report assistiti da AI spesso hanno cattiva reputazione perché generano rumore, sottolinea che qui hanno fatto la differenza test minimi riproducibili, verifiche rapide e un processo di responsible disclosure ben integrato nei flussi interni: metodo, non solo tecnologia.
Il messaggio per chi sviluppa è chiaro: il software sta entrando in una nuova fase industriale, con sistemi che iniziano ad agire come colleghi anomali—veloci, instancabili, capaci di correlazioni inedite—ma che richiedono guida, giudizio e responsabilità. È l’“urgenza del momento”: governare il codice, non solo scriverlo. Chi saprà orchestrare persone e modelli, tenendo insieme qualità, sicurezza ed etica, sarà il vero protagonista del prossimo ciclo dell’innovazione.

Dati sintetici: la chiave per un’AI sicura nella sanità

Perché associarsi?

Digital Audit
360

Scopri quali sono le tue aree di forza e di miglioramento attraverso un assessment di tutti i tuoi settori aziendali.

Piano di Orientamento alla
Trasformazione Digitale

Beneficia di un percorso di digitalizzazione personalizzato con obiettivi chiari e roadmap dettagliate.

Voucher dal valore 3.600€
per Consulenza

I nostri esperti ti assisteranno nell'identificare le migliori strategie in linea con gli obiettivi aziendali.

Formazione Specialistica
Gratuita

Sviluppa insieme al tuo team le competenze digitali necessarie, attraverso i nostri corsi finanziati.

Eventi in Presenza
Esclusivi

Partecipa ai nostri eventi per sfruttare opportunità uniche di networking, condivisione e aggiornamento professionale.

Abbonamenti DigiTrend
e MiFinanzio

Resta aggiornato sulle novità e le analisi del settore digitale, attraverso due newsletter personalizzate.

E inoltre per tutti gli associati

Convenzioni

Accedi alle soluzioni dei partner a condizioni vantaggiose per accelerare il tuo percorso di crescita digitale.

Webinar

Apprendi direttamente da esperti del settore per formarti su una vasta gamma di argomenti legati alla digitalizzazione.

Intervista Dedicata

Esprimi la tua opinione e condividi approfondimenti sulle sfide e le opportunità del settore.

Unisciti a noi per accedere a risorse esclusive e consulenze personalizzate.

Guida la Rivoluzione Digitale della Tua Azienda

Assodigit è il partner ideale per i leader aziendali determinati a sfruttare al meglio le opportunità offerte dalla digital transformation.

ASSODIGIT

AMBITI

Marketing e Sales

Piattaforme Digitali

Processi e Applicativi

Tecnologia e Sicurezza

Innovazione Tecnologica

Startup e Spin-off

Finanza e Agevolazioni

FOCUS

Focus

HUB

ASSODIGIT

AMBITI

Marketing e Sales

Piattaforme Digitali

Processi e Applicativi

Tecnologia e Sicurezza

Innovazione Tecnologica

Startup e Spin-off

Finanza e Agevolazioni

FOCUS

Focus

HUB

L’AI scopre vulnerabilità nel codice: la lezione da Mozilla e Anthropic

Ascolta l’Audio dell’Articolo

Ascolta il Mini Podcast dell’articolo

Un test storico su Firefox

Cambia il mestiere dello sviluppatore

Capacità, rischi e benchmark

Una finestra di vantaggio per la difesa

Sei su Whatsapp? Ti piacciono le nostre notizie? Segui il canale di Assodigit.

Parliamo con l’AI come con una persona: la psicologia deve cambiare

Robot umanoidi autodidatti: privacy e innovazione in equilibrio

Gemini 3.1 Flash-Lite: Google accelera l’AI per la scala globale

AI nel manufacturing: dal pilota al valore scalabile

Finanziamenti startup: l’AI filtra i pitch prima dei venture capitalist

Dati sintetici: la chiave per un’AI sicura nella sanità

Perché associarsi?

Digital Audit 360

Piano di Orientamento alla Trasformazione Digitale

Voucher dal valore 3.600€ per Consulenza

Formazione Specialistica Gratuita

Eventi in PresenzaEsclusivi

Abbonamenti DigiTrend e MiFinanzio