Cum Funcționează Inteligența Artificială: Recunoașterea Vorbirii - Vedere Alternativă

Cuprins:

Cum Funcționează Inteligența Artificială: Recunoașterea Vorbirii - Vedere Alternativă
Cum Funcționează Inteligența Artificială: Recunoașterea Vorbirii - Vedere Alternativă

Video: Cum Funcționează Inteligența Artificială: Recunoașterea Vorbirii - Vedere Alternativă

Video: Cum Funcționează Inteligența Artificială: Recunoașterea Vorbirii - Vedere Alternativă
Video: Editie speciala, Irinel Popescu, Inteligenta artificiala in medicina 2024, Septembrie
Anonim

Fiecare dintre noi se confruntă cu un fenomen atât de misterios precum inteligența artificială în viața de zi cu zi - el este cel care permite asistenților vocali și motoarelor de căutare să recunoască vorbirea umană și să ghicească dorințele utilizatorilor. Astăzi vom vorbi despre exact cum este aranjată această tehnologie și ce perspective așteaptă această zonă de dezvoltare în viitorul apropiat.

Inteligența artificială este un termen foarte larg, în cadrul căruia există deja mulți algoritmi și sunt încă în curs de dezvoltare, concepute pentru a efectua o gamă largă de sarcini practice. Dar de ce sunt capabile efectiv programele moderne de inteligență artificială și de ce principii sunt ghidați în timpul activității lor? Astăzi vom vorbi despre una dintre caracteristicile cheie ale minții mașinii, pe care fiecare dintre noi o întâlnim regulat în viața de zi cu zi - capacitatea asistenților vocali de a recunoaște vorbirea umană.

Recunoaștere vocală

Pentru a măsura vocea, programul folosește o serie de parametri de sunet: frecvența și lungimea undei sonore la un anumit moment în timp. De exemplu, când discutați cu popularul asistent vocal Alexa, software-ul împarte vocea dvs. în diapozitive de 25 de milisecunde și apoi transformă fiecare dintre segmente în semnături digitale. După aceea, blocurile de semnătură sunt comparate cu catalogul intern al sunetelor programului până când numărul de potriviri este suficient de mare pentru ca AI să „traducă” numerele într-o interogare alfabetică pe care o înțelege.

Image
Image

Urmăriți ecranul telefonului în timp ce utilizați Siri sau Google Assistant și veți vedea că vocabularul se schimbă pe măsură ce rostiți cuvintele. Acest lucru se întâmplă datorită faptului că, cu fiecare „pas” următor, software-ul compară și rezultatul obținut cu baza de date internă și creează cuvinte în funcție de potriviri. Potrivit lui Rohit Prasad, om de știință principal la divizia Alexa Amazon, „modelul lingvistic învață multe miliarde de cuvinte sub formă de text”. Ordinea cuvintelor joacă, de asemenea, un rol important: acest lucru poate fi remarcat și cu ajutorul motorului de căutare obișnuit Google, care oferă uneori date diferite pentru interogări identice, în care doar câteva cuvinte au fost reorganizate.

Video promotional:

Perspective de recunoaștere a vorbirii

Alan Black de la Institutul Carnegie pentru Tehnologia Limbii susține că, pentru toți profesioniștii din companiile mari, cel mai interesant este să găsească limita propriului sistem. „Când programul spune„ Nu pot face acest lucru”, atunci situația devine cu adevărat interesantă”, glumește el. Totuși, acesta este într-adevăr cazul: a răspunde la solicitările utilizatorilor imprevizibile este chiar una dintre principalele sarcini pe care cercurile studenților care concurează pentru Premiul Alexa - și aceasta este de până la 2,5 milioane de dolari - le investighează. Sarcina lor este de a crea un chatbot conceput pentru a comunica cu oamenii care pun întrebări consistente și semnificative. Informațiile în acest caz sunt actualizate la fiecare 20 de minute. Pare o sarcină destul de ușoară chiar și pentru un programator obișnuit,dar, în practică, comunicarea programului cu oameni reali este întotdeauna asociată cu abateri de la subiectul dialogului, expresii spontane și alte încălcări. Un program care învață să lucreze cu ei, precum și o persoană reală, va fi o descoperire uriașă pentru întreaga industrie AI.

Vasily Makarov

Recomandat: