ReALM – indice
Che cos’è ReALM?
ReALM sta per “Risoluzione di Riferimento come Modellazione del Linguaggio”, una soluzione innovativa sviluppata dai ricercatori di Apple. Si tratta quindi di un nuovo modello linguistico (Large Language Model, LLM) che tratta il problema del riconoscimento dei riferimenti come un compito nel campo della modellazione del linguaggio.
ReALM converte efficacemente vari tipi di contesto in una rappresentazione testuale, che poi elabora come parte di un compito linguistico. Questo può includere:
- conversazioni – come messaggi di testo, comandi vocali a un assistente o email,
- elementi sullo schermo – ad esempio, foto, calendario, widget meteo o applicazioni e processi in esecuzione in background.
Cosa rende ReALM diverso dagli altri modelli di riconoscimento dei riferimenti? Prima di tutto, l’approccio – invece di fare affidamento sull’elaborazione delle immagini, ReALM opera nel dominio del testo. Questo lo rende molto più leggero ed efficiente, il che dovrebbe consentirgli di funzionare direttamente sui dispositivi mobili mantenendo la privacy degli utenti.
In che modo ReALM è migliore di GPT-4?
Il team di ricerca di Apple ha confrontato ReALM con i modelli di linguaggio più potenti attualmente sul mercato – GPT-3.5 e GPT-4 di OpenAI. I risultati sono stati impressionanti. Nei compiti di riconoscimento dei riferimenti, la variante più piccola di ReALM ha raggiunto un’accuratezza comparabile a quella di GPT-4! I modelli ReALM più grandi hanno persino superato GPT-4 nel riconoscere riferimenti a elementi visualizzati sullo schermo (http://arxiv.org/abs/2403.20329).
Cosa spiega questo vantaggio? Prima di tutto, ReALM è eccellente con le query specifiche del dominio, come quelle relative agli elettrodomestici intelligenti. Questo perché ReALM dimostra una comprensione più profonda del contesto affinando il modello per dati specifici del dominio.
Inoltre, a differenza di GPT-4, che si allena principalmente su immagini di oggetti reali, ReALM eccelle nel riconoscere elementi testuali e componenti delle interfacce utente delle applicazioni. Ed è la comprensione dell’interfaccia che è fondamentale per l’interazione fluida degli assistenti vocali con le applicazioni che utilizziamo oggi.

Fonte: DALL·E 3, prompt: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)
È questo l’inizio dell’era degli assistenti veramente intelligenti?
In effetti, l’integrazione di ReALM con Siri potrebbe aprire un intero nuovo capitolo nell’interazione uomo-computer. Con ReALM, Siri sarà in grado di comprendere comandi che includono riferimenti a elementi visualizzati sullo schermo dello smartphone, così come processi e applicazioni in esecuzione in background. Ma quando sarà disponibile questa opzione per gli utenti? Questo è ancora sconosciuto.
Ci rimane solo la speculazione basata sulle capacità tecniche del modello. Quindi, come potrebbe funzionare una Siri potenziata da ReALM? Ad esempio, se stai navigando su un sito di elenchi aziendali e vedi un’azienda che ti interessa, potresti semplicemente dire a Siri: “Chiama questa azienda”, e l’assistente – utilizzando ReALM per analizzare il contesto – troverà il numero di telefono dell’azienda che specifichi e avvierà la chiamata. Non devi nemmeno spiegare esattamente quale azienda intendi.
Questo è solo l’inizio delle possibilità di ReALM. Comandi come “Riproduci l’ultima playlist” consentirebbero un controllo intuitivo delle applicazioni multimediali e dei dispositivi per la casa intelligente. ReALM potrebbe anche consentire a Siri di comprendere il contesto delle conversazioni e la cronologia dei comandi, in modo che l’assistente risponda in modo adeguato alle richieste precedenti dell’utente. Questo è un passo verso agenti intelligenti che ci avvicina non tanto a un’intelligenza artificiale che comprende le nostre richieste, quanto a una che sa come eseguire i comandi.
E questo è solo l’inizio di ciò che ReALM può fare. Comandi come “riproduci l’ultima playlist” consentirebbero un controllo intuitivo delle applicazioni multimediali e dei dispositivi per la casa intelligente. ReALM potrebbe anche consentire a Siri di comprendere il contesto delle conversazioni e la cronologia dei comandi, in modo che l’assistente risponda in modo appropriato alle richieste precedenti dell’utente. Questo è un passo verso agenti intelligenti, avvicinandoci non a un’intelligenza artificiale che comprende le nostre richieste, ma a una che sa come eseguire i comandi.
Purtroppo, gli utenti di dispositivi Android dovranno aspettare. Attualmente, non ci sono informazioni sui piani di Google per aggiungere le capacità di Gemini a Google Assistant. È stata sviluppata un’app Google Gemini per dispositivi Android (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US), ma non è ancora disponibile al di fuori degli Stati Uniti.

Fonte: Google Play (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US)
Riepilogo
ReALM è l’approccio innovativo di Apple per risolvere il problema del riconoscimento del contesto da parte degli assistenti vocali. Invece di fare affidamento sull’elaborazione delle immagini, questo modello linguistico converte diversi tipi di contesto in una rappresentazione testuale, che poi elabora in un compito linguistico. Questo approccio garantisce non solo un’alta accuratezza di riconoscimento, ma anche la capacità di operare su un dispositivo mobile mantenendo la privacy degli utenti.
Consentire a Siri di accedere a ReALM può fornire interazioni vocali più naturali e contestuali, un passo importante verso assistenti veramente intelligenti. Con ReALM, Siri sarà in grado di rispondere istantaneamente a comandi relativi a elementi dello schermo, applicazioni e processi in background. Una cosa è certa: migliorare la consapevolezza contestuale degli assistenti è la chiave per creare interazioni vocali veramente intelligenti e naturali, e ReALM è senza dubbio un passo importante in quella direzione.

Se ti piace il nostro contenuto, unisciti alla nostra comunità di api laboriose su Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.
Robert Whitney
Esperto di JavaScript e istruttore che forma i dipartimenti IT. Il suo obiettivo principale è aumentare la produttività del team insegnando agli altri come cooperare efficacemente durante la programmazione.
AI in business:
- 6 fantastici plugin di ChatGTP che renderanno la tua vita più facile
- Navigare nuove opportunità di business con ChatGPT-4
- 3 fantastici scrittori di intelligenza artificiale che devi provare oggi
- Attori sintetici. I primi 3 generatori di video AI
- Quali sono i punti deboli della mia idea imprenditoriale? Una sessione di brainstorming con ChatGPT
- Utilizzare ChatGPT nel business
- Nuovi servizi e prodotti che operano con l'IA
- Post automatizzati sui social media
- Pianificazione dei post sui social media. In che modo l'IA può aiutare?
- Il ruolo dell'IA nel processo decisionale aziendale
- Business NLP oggi e domani
- Chatbot di testo assistiti da intelligenza artificiale
- Applicazioni di intelligenza artificiale nel business - panoramica
- Minacce e opportunità dell'IA nel business (parte 2)
- Minacce e opportunità dell'IA nel business (parte 1)
- Qual è il futuro dell'IA secondo il McKinsey Global Institute?
- Intelligenza artificiale nel business - Introduzione
- Cos'è l'NLP, o elaborazione del linguaggio naturale nel business
- Google Translate vs DeepL. 5 applicazioni della traduzione automatica per le imprese
- Elaborazione automatica dei documenti
- L'operazione e le applicazioni commerciali dei voicebot
- Tecnologia degli assistenti virtuali, o come parlare con l'IA?
- Che cos'è l'Intelligenza Aziendale?
- Come può l'intelligenza artificiale aiutare con il BPM?
- AI creativa di oggi e di domani
- Intelligenza artificiale nella gestione dei contenuti
- Esplorare il potere dell'IA nella creazione musicale
- 3 strumenti utili di design grafico AI. AI generativa nel business
- AI e social media – cosa dicono di noi?
- L'intelligenza artificiale sostituirà gli analisti aziendali?
- Strumenti di intelligenza artificiale per il manager
- Il mercato del lavoro futuro e le professioni emergenti
- RPA e API in un'azienda digitale
- Nuove interazioni. In che modo l'IA sta cambiando il modo in cui operiamo i dispositivi?
- AI multimodale e le sue applicazioni nel business
- Intelligenza artificiale e ambiente. 3 soluzioni di IA per aiutarti a costruire un'attività sostenibile
- Rilevatori di contenuti AI. Ne valgono la pena?
- ChatGPT contro Bard contro Bing. Quale chatbot AI sta guidando la corsa?
- Il chatbot AI è un concorrente della ricerca di Google?
- Prompt efficaci di ChatGPT per HR e reclutamento
- Ingegneria dei prompt. Cosa fa un ingegnere dei prompt?
- AI e cos'altro? Le principali tendenze tecnologiche per le imprese nel 2024
- AI e etica aziendale. Perché dovresti investire in soluzioni etiche
- Meta AI. Cosa dovresti sapere sulle funzionalità supportate dall'IA di Facebook e Instagram?
- Regolamentazione dell'IA. Cosa devi sapere come imprenditore?
- 5 nuovi usi dell'IA nel business
- Prodotti e progetti di intelligenza artificiale - in che modo si differenziano dagli altri?
- L'IA come esperto nel tuo team
- Team di intelligenza artificiale vs. divisione dei ruoli
- Come scegliere un campo professionale nell'IA?
- AI nelle risorse umane: Come l'automazione del reclutamento influisce sulle risorse umane e sullo sviluppo del team
- Automazione dei processi assistita dall'IA. Da dove cominciare?
- 6 strumenti di intelligenza artificiale più interessanti nel 2023
- Qual è l'analisi della maturità dell'IA dell'azienda?
- AI per la personalizzazione B2B
- Casi d'uso di ChatGPT. 18 esempi di come migliorare la tua attività con ChatGPT nel 2024
- Generatore di mockup AI. I 4 migliori strumenti
- Microlearning. Un modo veloce per acquisire nuove competenze
- Le implementazioni di intelligenza artificiale più interessanti nelle aziende nel 2024
- Quali sfide porta il progetto di intelligenza artificiale?
- Le 8 migliori strumenti di intelligenza artificiale per le imprese nel 2024
- AI nel CRM. Cosa cambia l'IA negli strumenti CRM?
- Il Regolamento sull'IA dell'UE. Come regola l'Europa l'uso dell'intelligenza artificiale
- I 7 migliori costruttori di siti web AI
- Strumenti no-code e innovazioni nell'IA
- Quanto aumenta l'uso dell'IA la produttività del tuo team?
- Come utilizzare ChatGTP per la ricerca di mercato?
- Come ampliare la portata della tua campagna di marketing AI?
- AI nei trasporti e nella logistica
- Quali problemi aziendali può risolvere l'IA?
- Come si abbina una soluzione di intelligenza artificiale a un problema aziendale?
- L'intelligenza artificiale nei media
- AI nella banca e nella finanza. Stripe, Monzo e Grab
- L'IA nell'industria dei viaggi
- Come l'IA sta favorendo la nascita di nuove tecnologie
- AI nell'e-commerce. Panoramica dei leader globali
- I 4 migliori strumenti per la creazione di immagini con intelligenza artificiale
- Le 5 migliori strumenti di intelligenza artificiale per l'analisi dei dati
- La rivoluzione dell'IA nei social media
- Vale sempre la pena aggiungere l'intelligenza artificiale al processo di sviluppo del prodotto?
- 6 maggiori errori aziendali causati dall'IA
- Strategia AI nella tua azienda - come costruirla?
- I migliori corsi di intelligenza artificiale – 6 fantastiche raccomandazioni
- Ottimizzare l'ascolto sui social media con strumenti di intelligenza artificiale
- IoT + AI, o come ridurre i costi energetici in un'azienda
- AI nella logistica. 5 migliori strumenti
- GPT Store – una panoramica dei GPT più interessanti per le imprese
- LLM, GPT, RAG... Cosa significano le sigle dell'IA?
- Robot AI – il futuro o il presente del business?
- Qual è il costo dell'implementazione dell'IA in un'azienda?
- Cosa fanno gli specialisti di intelligenza artificiale?
- Come può l'IA aiutare nella carriera di un freelance?
- Automatizzare il lavoro e aumentare la produttività. Una guida all'IA per i liberi professionisti
- AI per startup – migliori strumenti
- Costruire un sito web con l'IA
- Eleven Labs e cos'altro? Le startup di intelligenza artificiale più promettenti
- OpenAI, Midjourney, Anthropic, Hugging Face. Chi è chi nel mondo dell'IA?
- Dati sintetici e la loro importanza per lo sviluppo della tua attività
- Motori di ricerca AI di punta. Dove cercare strumenti di intelligenza artificiale?
- Video AI. I più recenti generatori di video AI
- AI per i manager. Come l'IA può rendere il tuo lavoro più facile
- Cosa c'è di nuovo in Google Gemini? Tutto ciò che devi sapere
- AI in Polonia. Aziende, incontri e conferenze
- Calendario AI. Come ottimizzare il tuo tempo in un'azienda?
- AI e il futuro del lavoro. Come preparare la tua azienda al cambiamento?
- Clonazione vocale AI per le aziende. Come creare messaggi vocali personalizzati con l'AI?
- "Siamo tutti sviluppatori". In che modo i cittadini sviluppatori possono aiutare la tua azienda?
- Verifica dei fatti e allucinazioni dell'IA
- AI nel reclutamento – sviluppo dei materiali di reclutamento passo dopo passo
- Sora. In che modo i video realistici di OpenAI cambieranno il business?
- Midjourney v6. Innovazioni nella generazione di immagini AI
- L'IA nelle PMI. Come possono le PMI competere con i giganti utilizzando l'IA?
- Come sta cambiando l'IA il marketing degli influencer?
- L'IA è davvero una minaccia per gli sviluppatori? Devin e Microsoft AutoDev
- I migliori chatbot AI per l'ecommerce. Piattaforme
- Chatbot AI per l'e-commerce. Casi studio
- Come rimanere aggiornati su ciò che accade nel mondo dell'IA?
- Addomesticare l'IA. Come fare i primi passi per applicare l'IA nella tua azienda?
- Perplessità, Bing Copilot o You.com? Confronto tra motori di ricerca AI
- Esperti di intelligenza artificiale in Polonia
- ReALM. Un modello linguistico innovativo di Apple?
- Google Genie — un modello di intelligenza artificiale generativa che crea mondi completamente interattivi a partire da immagini
- Automazione o aumento? Due approcci all'IA in un'azienda
- LLMOps, o come gestire efficacemente i modelli di linguaggio in un'organizzazione
- Generazione video con intelligenza artificiale. Nuovi orizzonti nella produzione di contenuti video per le aziende
- I migliori strumenti di trascrizione AI. Come trasformare lunghe registrazioni in riassunti concisi?
- Analisi del sentiment con l'IA. In che modo aiuta a guidare il cambiamento nel business?
- Il ruolo dell'IA nella moderazione dei contenuti