$13 miliardi. È questa la cifra che Microsoft ha investito in OpenAI, eppure eccoli qui, a diversificare i loro rischi portando Claude di Anthropic in Copilot. Se questo non ti dice tutto sullo stato attuale dell’affidabilità dei modelli AI, non so cosa lo farà.
L’ultimo aggiornamento di Copilot di Microsoft fa qualcosa che non avrei mai pensato di vedere: mette a confronto il GPT di OpenAI con Claude di Anthropic in un match aziendale al limite. La nuova funzione “Critique” fa sì che GPT rediga risposte mentre Claude le verifica. È come assumere due appaltatori perché non ti fidi di nessuno dei due per finire il lavoro da solo.
Perché ciò conta davvero
Ascolta, ho testato dozzine di strumenti AI e tutti hanno lo stesso brutto segreto: hallucinano. Inventano cose. Suonano sicuri mentre sono completamente nel torto. Microsoft lo sa, ed è per questo che non stanno più mettendo tutte le loro uova nel paniere di OpenAI.
Il Ricercatore Copilot ora consente agli utenti di scegliere tra GPT e Claude per compiti di ricerca. C’è anche una funzione di “Consiglio” in cui entrambi i modelli esprimono il loro parere su query complesse. Microsoft sta essenzialmente ammettendo che nessun singolo modello AI è abbastanza buono da solo.
E onestamente? Questa è la cosa più onesta che una grande azienda tecnologica abbia detto sull’AI negli ultimi mesi.
La vera strategia qui
Microsoft non sta più facendo favoritismi. Scommettono che il loro vantaggio non è avere il miglior modello, ma avere i migliori dati e integrazione. Hanno accesso alle tue email, documenti, calendari e all’intero flusso di lavoro tramite Microsoft 365. Questo è il fossato, non il modello.
Questo spiega perché hanno lanciato Copilot Cowork, un’agente AI aziendale costruito interamente sulla tecnologia di Anthropic. Non sono più legati a OpenAI. Sono agnostici riguardo al modello, ed è probabilmente così che ogni azienda dovrebbe pensare all’AI in questo momento.
Cosa significa per gli utenti
Se stai usando Copilot per la ricerca, ora hai delle opzioni. Vuoi il tocco creativo di GPT? Usalo. Hai bisogno dell’approccio più orientato all’analisi di Claude? Passa a lui. Vuoi che entrambi si confrontino? Lasciali sfidarsi in modalità Consiglio.
La funzione Critique è particolarmente interessante. GPT genera la risposta iniziale, poi Claude la rivede per verificarne l’accuratezza e segnala eventuali problemi. È come avere un paio di occhi in più, tranne che entrambi i paia di occhi sono artificiali e occasionalmente inaffidabili.
Ma due modelli AI inaffidabili che si controllano a vicenda? Potrebbe effettivamente sommarsi a qualcosa di più affidabile. Forse.
La verità scomoda
La mossa di Microsoft espone qualcosa che la macchina del clamore sull’AI non vuole tu sappia: questi modelli non sono così bravi come suggerisce il marketing. Se lo fossero, Microsoft non avrebbe bisogno di farli funzionare in parallelo e di farli controllare a vicenda.
Questa non è una funzione. È una soluzione alternativa.
Ogni strumento AI che recensisco su agnthq.com riceve lo stesso trattamento: lo testo finché non si rompe. E tutti si rompono. GPT inventa fonti. Claude diventa eccessivamente cauto e rifiuta di rispondere a domande semplici. Ognuno ha modi diversi di fallire.
Microsoft sta essenzialmente trasformando in prodotto la soluzione alternativa che gli utenti esperti hanno fatto manualmente: porre la stessa domanda a più modelli AI e confrontare le risposte.
Dovresti preoccuparti?
Se stai già pagando per Microsoft 365 Copilot (e non è economico), questo aggiornamento ti offre più strumenti con cui lavorare. La capacità di scegliere il tuo modello o avere più modelli che collaborano potrebbe davvero migliorare i tuoi risultati.
Ma se stai decidendo se investire in Copilot basandoti su questa notizia, metti il freno. Questo aggiornamento è Microsoft che ammette di avere bisogno di più fornitori di AI per fornire risultati affidabili. Questo non è esattamente un grande endorsement delle attuali capacità dell’AI.
La mossa più intelligente qui è osservare come si comporta questo nel mondo reale. Microsoft sta facendo l’esperimento costoso di far funzionare simultaneamente più modelli all’avanguardia. Lasciali scopri se funziona davvero prima di impegnare il budget della tua azienda in esso.
Per ora, l’approccio multi-modello di Microsoft è la cosa più pragmatica che stia accadendo nell’AI aziendale. Non è sexy, non è semplice, ma potrebbe essere davvero utile. E nel mondo degli strumenti AI, “davvero utile” è un bar più alto di quanto pensi.
🕒 Published: