• Ultima modifica dell'articolo:Settembre 23, 2023
  • Categoria dell'articolo:news
Al momento stai visualizzando Intelligenza artificiale integrata con Alexa: un nuovo modello linguistico e ai conversazionale

Intelligenza artificiale integrata con Alexa: un nuovo modello linguistico e ai conversazionale

Con l’IA generativa per Alexa, stiamo anticipando un nuovo grande modello linguistico e una serie di capacità di intelligenza artificiale conversazionale che contribuiranno a offrire un’esperienza ancora più intuitiva, intelligente e utile con Alexa.

Negli ultimi anni, abbiamo spesso parlato di come stiamo vivendo in un’età dell’intelligenza artificiale (IA) dorata. Idee che sembravano fantascienza ancora poco tempo fa sono ora una realtà, e non c’è miglior esempio di questo di Alexa. Ciò che è iniziato come uno schizzo su una lavagna è diventato un paradigma di calcolo completamente nuovo, che ha cambiato profondamente il modo in cui le persone in tutto il mondo interagiscono con la tecnologia nelle loro case.

Con oltre mezzo miliardo di dispositivi venduti e decine di milioni di interazioni ogni ora, Alexa è diventata parte della famiglia in milioni di famiglie. Abbiamo sempre pensato a Alexa come a un servizio in continua evoluzione, e lo abbiamo migliorato costantemente dal giorno in cui l’abbiamo introdotto nel 2014. La nostra missione di lunga data è stata rendere una conversazione con Alexa naturale come parlare con un altro essere umano, e con lo sviluppo rapido dell’IA generativa, ciò che immaginavamo è ora ben a portata di mano. Oggi, siamo entusiasti di condividere un’anteprima anticipata di come appare il futuro.

Questa è una prima occhiata a un’Alexa più intelligente e conversazionale, alimentata dall’IA generativa. Si basa su un nuovo grande modello linguistico (LLM) che è stato creato su misura e ottimizzato specificamente per le interazioni vocali e per le cose che sappiamo i nostri clienti amano: ottenere informazioni in tempo reale, un controllo efficiente della casa intelligente e massimizzare il loro intrattenimento domestico. Crediamo che questo guiderà il futuro di Alexa, consentendoci di potenziare cinque capacità fondamentali:

Conversazione

Abbiamo studiato molto la conversazione negli ultimi anni e sappiamo che essere conversazionali va oltre le parole. In qualsiasi conversazione, elaboriamo tonnellate di informazioni aggiuntive, come il linguaggio del corpo, la conoscenza della persona con cui stai parlando e il contatto visivo. Per consentire ciò con Alexa, abbiamo fuso l’input dai sensori in un dispositivo Echo, come la telecamera, l’input vocale e la sua capacità di rilevare la presenza, con modelli di intelligenza artificiale in grado di comprendere quei segnali non verbali.

Ci siamo anche concentrati sulla riduzione della latenza in modo che le conversazioni fluiscano naturalmente, senza pause, e le risposte siano della giusta lunghezza per l’audio, non l’equivalente di ascoltare paragrafo dopo paragrafo letto ad alta voce. Quando chiedi le ultime notizie su una storia di tendenza, ricevi una risposta succinta solo con le informazioni più rilevanti. Se vuoi saperne di più, puoi fare domande di approfondimento.

Utilità nel mondo reale

Per essere veramente utile, Alexa deve essere in grado di agire nel mondo reale, il che è stato uno dei problemi irrisolti con i modelli linguistici su larga scala (LLM) – come integrare API su larga scala e invocarle in modo affidabile per compiere le azioni corrette. Questo nuovo LLM di Alexa sarà collegato a centinaia di migliaia di dispositivi e servizi del mondo reale tramite API. Migliora anche la capacità di Alexa di elaborare sfumature e ambiguità, in modo simile a quanto farebbe una persona, e di intraprendere azioni intelligenti. Ad esempio, il LLM ti consente di programmare complesse Routine interamente tramite comandi vocali: i clienti possono semplicemente dire: “Alexa, ogni sera alle 21:00, fai un annuncio che è l’ora di andare a letto per i bambini, abbassa le luci al piano di sopra, accendi la luce del portico e attiva il ventilatore in camera da letto”. Alexa programmerà automaticamente quella serie di azioni per avvenire ogni sera alle 21:00.

Personalizzazione e contesto

Un LLM per la casa deve essere personalizzato per te e la tua famiglia. Proprio come una conversazione con un’altra persona sarebbe modellata dal contesto, come le tue conversazioni precedenti o il contesto situazionale, anche Alexa deve farlo. La prossima generazione di Alexa sarà in grado di offrire esperienze uniche basate sulle preferenze che hai condiviso, sui servizi con cui hai interagito e sulle informazioni sul tuo ambiente. Alexa porta avanti anche il contesto rilevante durante le conversazioni, allo stesso modo in cui fanno gli esseri umani tutto il tempo. Le persone usano pronomi, frasi fatte e costruiscono il contesto dei luoghi, dei tempi o delle situazioni di cui parlano. Chiedi ad Alexa una domanda su un museo e sarai in grado di fare una serie di domande di approfondimento sulle sue ore di apertura, le mostre e la posizione, senza dover ripetere alcun contesto precedente, come il nome o il giorno in cui hai intenzione di andare.

Personalità

I clienti ci hanno detto più volte che amano la personalità di Alexa. Non vogliono un compagno meccanico e noioso in casa, e potrei sostenere che la personalità di Alexa è una delle principali ragioni dell’ampia adozione di Alexa. Come abbiamo sempre detto, la cena più noiosa è quella in cui nessuno ha un’opinione – e, con questo nuovo LLM, Alexa avrà un punto di vista, rendendo le conversazioni più coinvolgenti. Alexa può dirti quali film avrebbero dovuto vincere un Oscar, festeggiare con te quando rispondi correttamente a una domanda del quiz o scrivere una nota entusiastica per inviare le congratulazioni a un amico per il suo recente diploma.

Fiducia

Non dovrebbe esserci alcun compromesso tra affidabilità e prestazioni. I clienti di tutto il mondo hanno accolto Alexa in casa loro e, per essere veramente utile nella loro vita quotidiana, dobbiamo continuare a creare esperienze che amano e in cui hanno fiducia. Sebbene l’integrazione dell’IA generativa porti infinite nuove possibilità, il nostro impegno a guadagnare la fiducia dei nostri clienti non cambierà. Come per tutti i nostri prodotti, progetteremo esperienze per proteggere la privacy e la sicurezza dei nostri clienti, e per dar loro controllo e trasparenza.

Fino a quanto sappiamo, questa è la più grande integrazione di un LLM, servizi in tempo reale e una suite di dispositivi, e non è limitata a una scheda in un browser. E stiamo solo iniziando: con l’IA generativa, siamo in grado di potenziare diversi componenti fondamentali dell’esperienza di Alexa.

Uno di questi componenti riguarda il modo in cui i clienti iniziano un’interazione con Alexa. Questo si baserà sull’esperienza esistente, consentendo ai clienti che scelgono di iscriversi a Visual ID di avviare una conversazione con Alexa semplicemente voltandosi verso lo schermo su un Echo Show, senza la necessità di pronunciare una parola di attivazione. Il risultato è l’esperienza di conversazione più naturale che abbiamo mai creato. In secondo luogo, abbiamo creato un nuovo motore di riconoscimento del discorso conversazionale (CSR) utilizzando modelli di grandi dimensioni. Come esseri umani, spesso facciamo pause durante una conversazione per raccogliere i nostri pensieri o enfatizzare un punto, e identificare questi segnali è estremamente difficile per un’IA. Questo nuovo motore CSR è in grado di adattarsi a quelle comuni pause e esitazioni naturali, consentendo una conversazione più fluida e naturale. Infine, l’IA generativa ci ha permesso di migliorare la nostra tecnologia di text-to-speech, utilizzando un grande modello di trasformazione per rendere Alexa molto più espressiva e sensibile ai segnali della conversazione.

Ciò significa che Alexa si adatterà ai tuoi segnali e modulerà la sua risposta e il suo tono in modo simile alle conversazioni umane. Chiedi ad Alexa se la tua squadra ha vinto e risponderà con voce gioiosa se è così; se hanno perso, la risposta sarà più empatica. Chiedi ad Alexa un’opinione e la risposta sarà più entusiasta, come se un amico stesse condividendo un punto di vista.

Per dimostrare quanto siamo progrediti, ecco come parlava Alexa quando è stata lanciata lanciata per la prima volta:

Ecco come parlerà Alexa all’inizio del prossimo anno:

Federica

Da sempre appassionata di tecnologia applicata alla casa, ho deciso di creare questo sito per formare, informare e consigliare altre persone su questo mondo. Spero che i miei consigli vi siano utili!