Gli agenti di intelligenza artificiale iniziano a utilizzare computer e applicazioni come farebbero gli esseri umani. Un nuovo studio della National University of Singapore analizza però i limiti di questa tecnologia, concentrandosi sul modello Claude di Anthropic e il suo Computer Use.
I limiti del Computer Use di Claude, il modello di Anthropic
Claude rappresenta il primo modello AI in grado di interagire con le interfacce grafiche (GUI) attraverso mouse e tastiera, visualizzando screenshot del desktop. La tecnologia permette di automatizzare operazioni complesse tramite semplici istruzioni testuali, senza necessità di accesso alle API: in sostanza, utilizza il computer come una persona. Ma ci sono alcuni limiti.
I ricercatori hanno valutato le capacità dell’agente AI in diversi contesti:
- Ricerche web e acquisti online
- Flussi di lavoro tra applicazioni diverse
- Operazioni di produttività in ufficio
- Videogiochi
Le prestazioni sono state analizzate su tre dimensioni chiave: capacità di pianificazione, esecuzione delle azioni e valutazione dei risultati.
Claude ha dimostrato buone capacità nel gestire operazioni articolate e nel coordinare diverse applicazioni. Tuttavia, emergono errori basilari che un utente umano eviterebbe facilmente. In alcuni casi, il modello non è riuscito a completare task semplici come lo scorrimento di una pagina web o la modifica del formato di un testo.
La tecnologia mostra potenziale ma non è ancora pronta per un utilizzo diffuso in ambito aziendale. I comportamenti instabili e i possibili rischi di sicurezza richiedono cautela nell’implementazione. L’automazione tramite API resta la soluzione più efficiente per task ripetitivi su larga scala.
Gli agenti GUI possono tuttavia aiutare i team di sviluppo a prototipare rapidamente nuove soluzioni prima di investire risorse nella creazione di servizi dedicati. E la sperimentazione potrebbe migliorare alcuni di questi errori basilari. Anche se resta fondamentale la possibilità di avere di intervenire nei processi.
- Winston, Ted (Autore)
Ultimo aggiornamento 2024-10-06 / Link di affiliazione / Immagini da Amazon Product Advertising API
Rimani aggiornato seguendoci su Google News!
Da non perdere questa settimana su Techprincess
🎮 Che impatto avranno le elezioni americane sui videogiochi?
🚘 I gadget più strani delle case automobilistiche
🇨🇳 Un gruppo di ricercatori cinesi ha sviluppato un modello di IA per uso militare basato su Llama di Meta
🔍 ChatGPT si aggiorna e ora naviga sul web
Ma lo sai che abbiamo un sacco di newsletter?
📺 Trovi Fjona anche su RAI Play con Touch - Impronta digitale!
🎧 Ascolta il nostro imperdibile podcast Le vie del Tech
💸E trovi un po' di offerte interessanti su Telegram!