L’intelligenza artificiale sta cambiando il modo in cui interagiamo con i computer. Una versione aggiornata di Claude 3.5 Sonnet, il modello IA di punta di Anthropic, è un esempio lampante di questa evoluzione: se la versione precedente si limitava al dialogo testuale, questo nuovo aggiornamento appena annunciato è in grado di interpretare le interfacce grafiche e interagire con le applicazioni in modo autonomo.
Un approccio che apre nuove possibilità per l’automazione delle attività digitali, “muovendosi” proprio come una persona farebbe al PC. Vediamo insieme come funziona questa tecnologia, e quali sono le sue reali applicazioni.
Come funziona l’interazione con il PC
Claude 3.5 Sonnet utilizza un sistema chiamato “Computer Use API” per interagire con il desktop. In pratica, l’IA osserva lo schermo attraverso screenshot e analizza ciò che vede, proprio come farebbe un utente umano. Quando deve interagire con un’applicazione, calcola la distanza in pixel per raggiungere il punto desiderato e simula le azioni necessarie: click del mouse, digitazione sulla tastiera, spostamenti del cursore.
Abbiamo addestrato Claude a vedere cosa succede sullo schermo e poi a utilizzare gli strumenti software disponibili per svolgere i compiti.
Anthropic
La principale innovazione di questa versione? Una capacità attesa da tanto: quella di utilizzare qualsiasi applicazione desktop. Non si tratta più solo di rispondere a domande o generare testo, ma di interagire attivamente con il software.
Il nuovo Sonnet 3.5, le applicazioni pratiche
Le possibilità di utilizzo sono numerose. Per esempio, Replit, una piattaforma di sviluppo software, sta già utilizzando Claude 3.5 Sonnet per creare un “verificatore autonomo” che valuta le applicazioni durante il loro sviluppo. Canva, la piattaforma online di editing grafico, sta esplorando modi per integrare l’IA nel processo di design e editing.
È tutto “wow” come sembra? No. Ci ruberà il lavoro? Nemmeno. È importante essere realisti sulle attuali capacità del sistema. In un test di prenotazione voli, Claude 3.5 Sonnet è riuscito a completare con successo meno della metà dei compiti assegnati. Anche attività apparentemente semplici come lo scrolling e lo zoom possono ancora risultare problematiche.
D’altra parte, lo ammette la stessa Anthropic:
L’uso del computer da parte di Claude rimane lento e spesso soggetto a errori. Incoraggiamo gli sviluppatori a iniziare con attività a basso rischio.
Quanto tempo passerà prima che Sonnet 3.5 si perfezioni? Ci metterà anni, mesi o settimane? Se ci pensate, conoscete già la risposta, o qualcosa che le si avvicina parecchio.
Qualche nota sulla sicurezza
Il tema della sicurezza è fondamentale. Anthropic, che passa per essere il “good boy” delle aziende AI, ha implementato diverse misure preventive:
- L’IA non viene addestrata sugli screenshot degli utenti;
- Non ha accesso al web durante l’addestramento;
- Sono stati sviluppati classificatori per evitare azioni ad alto rischio;
- Gli screenshot vengono conservati solo per 30 giorni, come misura di sicurezza.
Le prospettive future
Parallelamente allo sviluppo della nuova versione di Claude 3.5 Sonnet, Anthropic ha annunciato anche l’arrivo di una versione aggiornata di Haiku, il modello più economico ed efficiente della serie Claude. Un piccolo passo nel campo dell’IA accessibile a diversi livelli di utilizzo. Certo, questa roba consuma ancora tanto, troppo in termini di energia e risorse.
Anyway, mi sembra particolarmente interessante come questa tecnologia stia cambiando il nostro rapporto con i computer. Non stiamo più parlando di semplici script di automazione, ma di sistemi che comprendono e interagiscono con le interfacce grafiche in modo quasi umano.
Claude Sonnet 3.5: passi avanti bilanciati, ma in una direzione sorprendente
Come spesso accade nel campo dell’IA, il vero valore di questa innovazione si misurerà non tanto nelle sue capacità tecniche, quanto nel modo in cui riusciremo a integrarla utilmente nei nostri flussi di lavoro quotidiani. La sfida per il futuro sarà trovare il giusto equilibrio tra automazione e controllo umano, sfruttando al meglio le potenzialità di questa tecnologia senza perderne di vista i limiti e le responsabilità etiche.
Le capacità di Claude 3.5 Sonnet, di per sé non impressionanti, suggestionano comunque per la direzione che mostrano. Siamo ancora all’inizio di questo percorso tecnologico: cosa succederà di qui a poco?