Ce este inteligența artificială generativă și cum schimbă aceasta asistenții vocali?
Ce este un asistent virtual?
Un asistent virtual este un agent software care poate îndeplini o serie de sarcini sau servicii pentru un utilizator pe baza unor date de intrare, cum ar fi o comandă sau o întrebare. Interacțiunea dintre asistent și utilizator se poate realiza prin text, interfață grafică sau voce.
Ce este un asistent vocal?
Un asistent vocal este un tip de asistent virtual care este capabil să interpreteze vorbirea umană și să răspundă prin intermediul unei voci sintetizate. Asistenții vocali funcționează pe dispozitive conectate la internet precum smartphone-urile și boxele inteligente, și utilizează algoritmi de recunoaștere vocală și de procesare a limbajului pentru a asculta comenzi vocale specifice și pentru a returna informații relevante sau pentru a îndeplini funcții specifice, conform solicitării utilizatorului.
Asistenții vocali au fost concepuți inițial pentru următoarele tipuri de sarcini:
- dictare
- citirea cu voce tare a mesajelor text sau e-mail
- căutarea numerelor de telefon
- programarea întâlnirilor
- efectuarea de apeluri telefonice
- reamintirea întâlnirilor utilizatorului
În prezent, asistenții vocali sunt integrați în multe dintre dispozitivele pe care le folosim zilnic, cum ar fi smartphone-urile, computerele și boxele inteligente. Datorită gamei lor largi de integrări, asistenții vocali pot oferi un set de funcții foarte specifice sau pot fi flexibili pentru a ajuta în aproape orice situație la îndemână. Câteva dintre cele mai importante companii de tehnologie au încorporat asistenți vocali inteligenți în oferta lor de boxe, combinând capacitățile muzicale de înaltă calitate cu integrarea pentru casele inteligente.
Boxele inteligente Acer
Boxa inteligentă Halo Smart Speaker HSP3100G
Un plus de culoare pentru camerele de orice dimensiune, Acer Halo este plasată pe o bază luminoasă cu iluminare RGB pe care o puteți personaliza. Această boxă inteligentă funcționează pe baza tehnologiei de la Google Assistant.
Specificații Halo HSP3100G:
- Boxă inteligentă compactă și elegantă, cu Google Assistant
- Sunet DTS conceput profesional care proiectează sunet la 360°
- Asistent Google
- Două matrice de microfoane omnidirecționale de tip far-field; 1 x mufă audio de 3,5 mm
- Afișaj LED personalizabil; bază iluminată RGB care reacționează la muzică
Boxa portabilă inteligentă Halo Swing Smart Portable Speaker HSP5100G
O boxă Bluetooth și WiFi elegantă, dar neobișnuită, care sună tare în ciuda dimensiunilor sale compacte. O boxă excelentă pentru cei care au nevoie de muzică în mișcare.
Specificații Halo Swing HSP5100G:
- Audio DTS omnidirecțional
- Asistent Google, Bluetooth 5.2 și Wi-Fi 6
- Afișaj LED personalizabil cu ajutorul Acer Halo App care reacționează la muzică
- Design portabil rezistent la apă IPX5
- Port USB și încărcător dock care oferă până la 8 ore de muzică portabilă
Cele mai populare tehnologii de asistență vocală
Dintre produsele de pe piață, următoarele au obținut cel mai mare succes:
- Google Assistant. Această aplicație software de tip asistent vocal virtual a fost dezvoltată de Google pentru dispozitivele cu Android. Google Assistant poate efectua o varietate de sarcini, inclusiv să răspundă la întrebări, să ajusteze setările hardware de pe dispozitivul utilizatorului, să programeze evenimente și alarme și să joace jocuri.
- Siri. Asistentul virtual personal încorporat de la Apple, controlat prin voce, este disponibil pe dispozitivele care utilizează iOS, iPadOS, watchOS, macOS și tvOS. Siri utilizează o tehnologie de recunoaștere vocală care funcționează pe bază de AI.
- Alexa. Utilizat în principal prin intermediul liniei Amazon de boxe hands-free cunoscute sub numele de Echo, Alexa este un serviciu vocal bazat pe cloud care răspunde la solicitări simple în limbaj natural, precum "care este starea vremii astăzi?" sau "redă muzică pop pe boxa din sufragerie".
- Bixby. Asistentul virtual AI de la Samsung funcționează în principal pe dispozitive mobile, dar și pe unele frigidere inteligente. Bixby poate fi utilizat pentru diverse sarcini, inclusiv trimiterea de mesaje text, obținerea de informații meteorologice specifice locației, setarea de memento-uri pentru întâlniri și citirea articolelor de știri.
- Mycroft AI. Mycroft este un asistent vocal open source care poate fi rulat pe orice platformă, inclusiv desktop-uri, automobile și Raspberry Pi. Acesta se concentrează pe activarea vocală a oricărui dispozitiv pentru a-l transforma într-un asistent virtual inteligent.
Ce este inteligența artificială generativă?
Inteligența artificială generativă este un tip de inteligență artificială care învață din artefactele existente pentru a genera noi artefacte realiste care reflectă caracteristicile datelor de instruire. Aceasta poate produce o varietate de tipuri noi de conținut precum imagini, clipuri video, muzică, voce, text, programe software și design de produse.
Inteligența artificială generativă este capabilă să producă un conținut foarte realist și complex. Inteligența artificială generativă creează cel mai adesea conținut ca răspuns la solicitări în limbaj natural — nu sunt necesare cunoștințe de programare. Cazurile de utilizare la nivel de întreprindere sunt numeroase: tehnologia are aplicații potențiale în jocuri, divertisment, servicii pentru clienți, crearea de conținut, proiectarea de produse, dezvoltarea de software și multe altele.
Inteligența artificială generativă a ajuns pe prima pagină a ziarelor la sfârșitul anului 2022, odată cu lansarea ChatGPT de la OpenAI, un agent chatbot capabil de interacțiuni care par foarte umane. Instrumentul DALL-E 2 de la OpenAI generează în mod similar imagini pornind de la text în cadrul unei inovații legate de inteligența artificială generativă. Numărul cazurilor de utilizare a inteligenței artificiale generative este probabil să crească pe măsură ce oamenii și întreprinderile descoperă aplicații mai inovatoare pentru această tehnologie în munca și viața de zi cu zi.
Situația pieței asistenților vocali
Potrivit Business Insider, în primul trimestru al anului 2022, unitatea "Worldwide Digital" de la Amazon a avut o pierdere operațională de peste 3 miliarde de dolari, cea mai mare parte a acesteia datorându-se boxelor sale inteligente Echo și tehnologiei vocale Alexa. Pierderea a fost de departe cea mai mare dintre toate unitățile de afaceri ale Amazon. Rapoartele media despre reducerea investițiilor în Google Assistant de către Alphabet sugerează în continuare pierderile continue care au loc pe această piață.
Dar de ce aceste divizii de asistenți vocali nu sunt profitabile? Nu poate fi din cauza lipsei de adopție; Siri și Google Assistant sunt instalate pe sute de milioane de smartphone-uri. Au fost vândute peste 100 de milioane de dispozitive Echo cu Alexa, iar Alexa este, de asemenea, instalată pe un număr similar de dispozitive non-Echo. De asemenea, nu poate fi vorba de lipsă de utilizare; utilizatorii interacționează cu acești asistenți vocali de miliarde de ori în fiecare săptămână.
Se pare că este foarte greu să se construiască scenarii de monetizare în jurul asistenților vocali. Principala metodă de monetizare a acestor tehnologii a fost până în prezent reprezentată de către redevențele de la producătorii terți care integrează aceste asistenți în produsele lor. Următoarele canale, anticipate inițial ca fiind generatoare de venituri, au avut un succes limitat:
- Comerțul bazat pe voce nu a demarat. Spre deosebire de aplicațiile mobile și site-urile web, asistenții vocali nu pot afișa imagini ale produselor sau nu pot oferi descrieri detaliate ale acestora. De asemenea, incapacitatea utilizatorilor de a citi recenzii ale produselor este un factor limitativ.
- Strategiile de monetizare bazate pe publicitate nu sunt, de asemenea, viabile. În comparație cu alte canale digitale, reclamele vocale din mijlocul unei interacțiuni audio sunt mai intruzive și distrag atenția de la experiență.
- Dezvoltarea de aplicații terțe, cum ar fi Alexa Skills, au avut un succes limitat. În ciuda celor 150.000 de "abilități" (skills) din catalogul Alexa, utilizatorul tipic Alexa nu le-a instalat, utilizat sau abonat. Acest lucru înseamnă venituri limitate pentru dezvoltatorii Alexa Skill, precum și pentru magazinul Alexa Skills.
Poate cea mai mare provocare este faptul că utilizatorii consideră asistenții vocali, care sunt integrați în smartphone-uri, dispozitive inteligente, sisteme de automatizare a locuinței și mașini, ca fiind caracteristici ale acestor produse mai degrabă decât produse pentru care merită să se plătească.
Inteligența artificială generativă și următoarea iterație de asistenți vocali
Inteligența artificială generativă este următorul pas natural pentru tehnologiile asistenților vocali, permițând asistenților să ofere răspunsuri mai inteligente decât ceea ce este posibil prin modelele actuale de comandă și răspuns. Inteligența artificială generativă construită pe cele mai recente modele de limbaj de mari dimensiuni poate înțelege mai eficient solicitările utilizatorilor decât o pot face algoritmii de căutare sau alte modele mai vechi care utilizează, de asemenea, procesarea limbajului natural. Inteligența artificială generativă poate de asemenea să răspundă la întrebări cu informații mai exacte și mai personalizate. Asistenții vocali care încorporează inteligența artificială generativă pot înțelege mai bine solicitările utilizatorului și pot fi mai eficienți pentru utilizatori.
Asistenți vocali personalizați
Pot asistenții vocali AI să aibă o personalitate? Răspunsul este "da". Inteligența artificială generativă poate genera rezultate într-un mod care imită personaje fictive și chiar persoane din viața reală. Imaginați-vă că puteți discuta cu personajul istoric preferat sau cu o celebritate și că personajul respectiv își amintește conversațiile voastre — acest lucru aduce noi oportunități pentru asistenții vocali de a oferi servicii personalizate. O companie, Character.ai, a dezvoltat o platformă chatbot care transformă această idee în realitate.
Character.AI este o aplicație web care permite utilizatorilor să creeze și să discute cu agenți chatbot personalizați. Acești agenți chatbot, denumiți Characters, pot fi creații originale sau imitații ale unor figuri celebre, personaje fictive sau specialiști în anumite domenii. Platforma a fost lansată publicului în septembrie 2022 și a devenit foarte populară în rândul utilizatorilor.
Evoluția asistenților Alexa și Google Assistant
Modelul intern de tip LLM de la Amazon, "Alexa Teacher Model" este utilizat pentru a adăuga capacități conversaționale și funcționalități îmbunătățite pentru Alexa. În mod similar, Google a inițiat dezvoltarea asistentului Google reînnoit, începând cu versiunea mobilă a produsului. Noul Google Assistant va utiliza o tehnologie asemănătoare cu ChatGPT, îmbunătățind capacitățile de asistență, înțelegerea limbajului natural și gama generală de funcționalități.
Ne putem aștepta ca asistenții vocali din viitor să aibă un rol mai proactiv în interacțiuni. În loc să aștepte doar comenzile utilizatorului, asistenții vor colecta informații specifice contextului și apoi vor lua inițiativa făcând sugestii utile utilizatorului.