Rețeaua Neuronală A Fost învățată Să Copieze Vocea Umană Aproape Perfect - Vedere Alternativă

Video: Rețeaua Neuronală A Fost învățată Să Copieze Vocea Umană Aproape Perfect - Vedere Alternativă

Video: RNA Kohonen 2024, Aprilie

2024 Autor: Keith Bush | [email protected]. Modificat ultima dată: 2023-12-16 14:44

Anul trecut, compania de informații artificiale DeepMind a împărtășit detalii despre noul său proiect WaveNet, o rețea neuronală de învățare profundă folosită pentru sinteza vorbirii umane realiste. Recent, a fost lansată o versiune îmbunătățită a acestei tehnologii, care va fi utilizată ca bază a asistentului digital digital Google Assistant.

Un sistem de sinteză vocală (cunoscut și sub denumirea de TTS) este de obicei construit în jurul uneia dintre cele două metode de bază. Metoda concatenativă (sau compilare) implică construcția de fraze prin colectarea de piese individuale de cuvinte înregistrate și părți înregistrate anterior cu implicarea unui actor vocal. Dezavantajul principal al acestei metode este nevoia de a înlocui constant biblioteca de sunet ori de câte ori se fac actualizări sau modificări.

O altă metodă se numește parametrul TTS, iar caracteristica sa este utilizarea seturilor de parametri cu care computerul generează fraza dorită. Dezavantajul metodei este că cel mai adesea rezultatul se manifestă sub forma unui sunet nerealist sau așa-numit robot.

WaveNet, pe de altă parte, produce unde sonore de la zero folosind un sistem de rețele neuronale convolutive în care sunetul este generat în mai multe straturi. În primul rând, pentru a instrui platforma pentru sintetizarea vorbirii „live”, este „alimentată” o cantitate imensă de eșantioane, în timp ce observă care semnale sonore sună realist și care nu. Acest lucru oferă sintetizatorului vocal capacitatea de a reproduce intonația naturalistă și chiar detalii, cum ar fi buzele smucitoare. În funcție de ce probe de vorbire sunt rulate prin sistem, acest lucru îi permite să dezvolte un „accent” unic, care pe termen lung poate fi folosit pentru a crea multe voci diferite.

Ascuțit pe limbă

Poate cea mai mare limitare a sistemului WaveNet a fost aceea că a necesitat o cantitate uriașă de putere de calcul pentru a rula și, chiar și atunci când această condiție a fost îndeplinită, nu a diferit în ceea ce privește viteza. De exemplu, a fost nevoie de aproximativ 1 secundă de timp pentru a genera 0,02 secunde de sunet.

După un an de muncă, inginerii DeepMind au găsit încă o modalitate de a îmbunătăți și de a optimiza sistemul astfel încât să poată acum să producă un sunet brut de o secundă în doar 50 de milisecunde, care este de 1000 de ori mai rapid decât capacitățile sale originale. Mai mult, specialiștii au reușit să crească rata de eșantionare audio de la 8 biți la 16 biți, ceea ce a avut un efect pozitiv asupra testelor care implică ascultători. Aceste succese au deschis calea pentru WaveNet să se integreze în produsele de larg consum, precum Google Assistant.

Video promotional:

În prezent, WaveNet poate fi utilizat pentru a genera voci englezești și japoneze prin Google Assistant și toate platformele care utilizează acest asistent digital. Întrucât sistemul poate crea un tip special de voci, în funcție de setul de eșantioane care i-a fost furnizat pentru formare, în viitorul apropiat, Google va implementa cel mai probabil suport pentru sintetizarea discursului realist în WaveNet în alte limbi, inclusiv luând în considerare acestea. dialectele locale.

Interfețele de vorbire devin din ce în ce mai frecvente pe o mare varietate de platforme, dar natura lor naturală pronunțată a sunetului dezactivează mulți utilizatori potențiali. Eforturile DeepMind de îmbunătățire a acestei tehnologii vor contribui cu siguranță la adoptarea mai largă a acestor sisteme de voce, precum și la îmbunătățirea experienței utilizatorului de la utilizarea lor.

Exemple de vorbire sintetizată în engleză și japoneză folosind rețeaua neuronală WaveNet pot fi găsite urmând această legătură.

Nikolay Khizhnyak

Recomandat:

Tumorile Lui îi Atârnau De Pe Față Ca Niște Pungi "- O Perspectivă Alternativă

Un bărbat în vârstă de 60 de ani și-a trăit cea mai mare parte a vieții cu tumori mari atârnate de pe față. Nepaleseul Krishna Prasad Bhattarai suferea de neurofibromatoză încă de la vârsta de 15 ani, ceea ce a cauzat creșterea unor tumori uriașe pe fața sa

Cine Construiește Așa ?! Cine Construiește Așa !!! "Sau Ghicitoarea Unei Case îngropate .. - O Perspectivă Alternativă

Gânduri pe tema primelor etaje completate ale clădirilor.Așa că, zile întregi, am trecut pe lângă o casă faimoasă din orașul nostru.- Salik.bizOh! ce bărbat frumos! Ce simetrie a podelelor!nAcest miracol a fost ridicat de arhitectul Afanasy Grigorievici Grigoriev - în continuare un citat din wiki - "Arhitectul de frunte al stilului Imperiului Moscova. Cunoscut pe

"Șah Turc" De Wolfgang Von Kempelen - O Perspectivă Alternativă

În 1770, primul mecanism de șah a fost construit de inginerul maghiar Wolfgang von Kempelen. Dispozitivul sub forma unui turc așezat a devenit cea mai cunoscută mașină de șah din istoria omenirii.Cum a fost „șahul turc”? Era format dintr-o cutie de lemn înaltă de 1 metru, cu o tablă de șah mare deasupra. Cutia stătea pe

Arhiepiscopul Pavel Din Ryazan: „Oamenii Cred în OZN-uri și în„ Indigo”pentru Că Sunt Leneși. - O Perspectivă Alternativă

Potrivit Vladyka, credința în „indigo”, OZN-uri sau alte alte prostii este destul de înțeleasă - oamenii au fost macinați și nu vor să urmeze calea evangheliei a muncii și corectării … „Astăzi, mulți oameni sunt gata să abandoneze Evanghelia sub orice pretext: să creadă în ceea ce

Povestea Dramatică A „orfanilor” Din Titanic - Michel și Edmond Navratil - O Perspectivă Alternativă

În noaptea de 15 aprilie 1912, Michelle, în vârstă de trei ani și Edmond, în vârstă de doi ani, s-au urcat pe ultima barcă care a plecat din Titanicul condamnat. Dar faptul că au părăsit nava pierdută nu a fost încă un final fericit al poveștii lor

Rețeaua Neuronală A Fost învățată Să Copieze Vocea Umană Aproape Perfect - Vedere Alternativă

Cuprins:

Video: Rețeaua Neuronală A Fost învățată Să Copieze Vocea Umană Aproape Perfect - Vedere Alternativă

Ascuțit pe limbă

Recomandat:

Tumorile Lui îi Atârnau De Pe Față Ca Niște Pungi "- O Perspectivă Alternativă

Cine Construiește Așa ?! Cine Construiește Așa !!! "Sau Ghicitoarea Unei Case îngropate .. - O Perspectivă Alternativă

"Șah Turc" De Wolfgang Von Kempelen - O Perspectivă Alternativă

Arhiepiscopul Pavel Din Ryazan: „Oamenii Cred în OZN-uri și în„ Indigo”pentru Că Sunt Leneși. - O Perspectivă Alternativă

Povestea Dramatică A „orfanilor” Din Titanic - Michel și Edmond Navratil - O Perspectivă Alternativă

Biografia Regelui Francez Louis XV - Vedere Alternativă

Oamenii De știință Au înregistrat Un Sunet Ciudat Din Marea Caraibelor - Vedere Alternativă

Regina Victoria A Marii Britanii - Vedere Alternativă

Danemarca A Alocat 428 De Mii De Dolari Pentru A Studia Trolls - Vedere Alternativă

Comorile Subacvatice Sau Aurul Crucierului „Edinburgh” - Vedere Alternativă

Bucăți De Carne Crudă Au Căzut Din Cer în Kentucky - Vedere Alternativă

Un Cunoscut Artefact Antic Numit Sulița Destinului - Vedere Alternativă

Una Dintre Cele Mai Strălucitoare Stele Din Univers A Dispărut Din Cer: A Fost și Nu A Devenit - Vedere Alternativă

În Australia, Papagalii Morți Cad Chiar De Pe Cer - Vedere Alternativă

A Venit Din Stele: Teoria Lui Darwin - Teorie îndoielnică A Originii Oamenilor? - Vedere Alternativă

Dispozitive De Viață - Vedere Alternativă

În SUA, Au Fost Publicate Documente Care Confirmă Experimentele Pe Extratereștri - Vedere Alternativă

Astronomii Au Găsit în Constelația Pești O „fugă” Jumătate-planetă-jumătate-stea - Vedere Alternativă

Tornada De Sardină - Vedere Alternativă

Un Medicament Care înlocuiește Sportul A Fost Testat Pe șoareci - Vedere Alternativă