Anthropic ha appena annunciato il suo modello di intelligenza artificiale più potente di sempre. Hanno anche accidentalmente esposto al mondo questo modello prima che fosse pronto. Entrambi gli eventi sono accaduti contemporaneamente, e se questo non cattura perfettamente lo stato attuale dello sviluppo dell’IA, nulla lo farà.
Il modello si chiama Mythos. Secondo il report esclusivo di Fortune, è attualmente in fase di test interno come il gioiello della corona di Anthropic—la loro risposta a ciò che OpenAI sta preparando nei loro laboratori. Ma qui le cose si complicano: una violazione della sicurezza ha rivelato dettagli su Mythos prima che Anthropic potesse controllare la narrazione. Numerosi canali hanno confermato la fuga di notizie, e ora ci troviamo tutti di fronte a una situazione che è allo stesso tempo emozionante e spaventosa.
Cosa Sappiamo Davvero
Tagliamo il rumore. Mythos è reale. È in fase di test. Anthropic lo definisce il suo modello più potente finora, il che significa che è presumibilmente un passo oltre Claude 3.5 Sonnet. Qui finisce la certezza e inizia la speculazione.
La fuga è avvenuta, ma i dettagli sono vaghi. Non abbiamo benchmark. Non abbiamo una data di rilascio. Non abbiamo nemmeno un quadro chiaro di cosa significhi “più potente” in questo contesto. È più intelligente? Più veloce? Migliore nel ragionamento? Più capace di seguire istruzioni complesse? Tutto quanto sopra? La tua ipotesi vale quanto la mia.
Quello che sappiamo è che Anthropic non voleva che queste informazioni venissero rese pubbliche ancora. Quando un’azienda che ha costruito tutto il suo marchio sulla sicurezza dell’IA perde accidentalmente il suo modello più avanzato, non è solo imbarazzante—è un caso di studio nell’ironia.
La Domanda sulla Sicurezza a Cui Nessuno Vuole Rispondere
Quello che mi preoccupa è questo: Anthropic si è posizionata come l’azienda di IA responsabile. Sono quelli che parlano di IA costituzionale e allineamento e di garantire che questi sistemi non escano dai binari. Questa è la loro missione.
Quindi, quando non riescono nemmeno a mantenere il proprio modello segreto durante i test interni, cosa significa per la loro capacità di controllare ciò che accade dopo il rilascio? Se non possono proteggere le informazioni su Mythos, quanto possiamo essere sicuri della loro capacità di proteggere Mythos stesso?
Il report di MSN menziona specificamente i “rischi dell’IA potente” che sono emersi dalla fuga. Questo è abbastanza vago da significare qualsiasi cosa, ma specifico abbastanza da essere preoccupante. Non stiamo parlando di un piccolo imprevisto qui. Stiamo parlando di un’azienda che predica cautela che mostra accidentalmente le proprie carte prima ancora che il gioco inizi.
Perché Questo È Più Importante di Quanto Pensi
Tutti i principali laboratori di IA sono in una corsa agli armamenti in questo momento. OpenAI ha GPT-4 e qualsiasi cosa verrà dopo. Google ha Gemini. Meta sta facendo la sua parte con Llama. E Anthropic è stato il piccolo combattente con Claude, che colpisce più forte della sua categoria.
Mythos rappresenta l’offerta di Anthropic per rimanere in questa corsa. Ma la fuga cambia le dinamiche. I concorrenti ora sanno che Anthropic sta lavorando su qualcosa di più grande. I ricercatori e i sostenitori della sicurezza sanno che c’è un modello più potente in arrivo prima che qualcuno abbia capito come governare correttamente la generazione attuale. E il pubblico sa che anche l’azienda di IA “sicura” non riesce a mantenere i propri segreti.
Questo non riguarda solo un modello o un’azienda. Riguarda il divario tra ciò che i laboratori di IA possono costruire e ciò che possono controllare. Questo divario continua ad allargarsi, e fughe di notizie come questa lo dimostrano.
Cosa Succederà Dopo
Anthropic probabilmente rilascerà Mythos prima o poi, fuga di notizie o meno. Avranno pronta la loro documentazione sulla sicurezza. Pubblicheranno la loro ricerca sull’allineamento. Spiegheranno in che modo questo modello è diverso, migliore e progettato con maggiore attenzione rispetto a qualsiasi cosa venga prima.
E forse hanno ragione. Forse Mythos è davvero un passo avanti in termini di capacità e sicurezza. Ma questa fuga ha privato la loro capacità di controllare quel messaggio. Ora stanno giocando in difesa invece che in attacco, spiegando una violazione invece di celebrare un traguardo.
L’industria dell’IA si muove rapidamente, ma non si muove con cautela. Mythos ne è la prova. Stiamo costruendo sistemi più potenti più velocemente di quanto possiamo proteggerli, governarli o persino comprenderli. Anthropic lo sa meglio di chiunque altro—hanno letteralmente scritto il libro sulla sicurezza dell’IA.
Ma sapere qual è il problema e risolverlo sono due cose diverse. E in questo momento, con il loro modello più potente trapelato prima di essere pronto, Anthropic sta imparando quella lezione nel modo più difficile.
🕒 Published: