Oamenii De știință Au Creat O AI De Auto-învățare Capabilă Să Joace Toate Jocurile - Vedere Alternativă

Cuprins:

Oamenii De știință Au Creat O AI De Auto-învățare Capabilă Să Joace Toate Jocurile - Vedere Alternativă
Oamenii De știință Au Creat O AI De Auto-învățare Capabilă Să Joace Toate Jocurile - Vedere Alternativă

Video: Oamenii De știință Au Creat O AI De Auto-învățare Capabilă Să Joace Toate Jocurile - Vedere Alternativă

Video: Oamenii De știință Au Creat O AI De Auto-învățare Capabilă Să Joace Toate Jocurile - Vedere Alternativă
Video: JOCURILE COPILARIEI 2024, Aprilie
Anonim

Dezvoltatorii sistemului revoluționar de auto-învățare a inteligenței artificiale AlphaGo Zero au anunțat crearea unei noi versiuni a acestei mașini, care poate învăța independent să joace orice joc de masă și să bată o persoană. Descrierea sa a fost prezentată în revista Science.

Adâncimile minții

Sistemul AI AlphaGo a fost dezvoltat de David Silver și colegi la sfârșitul lui 2014, iar activitatea sa a fost „testată” pe campionul european Fan Hui, care a pierdut toate cele cinci meciuri în fața mașinii. În martie 2016, AlphaGo l-a învins pe campionul mondial Go Sedol, Lee Sedol, într-o serie de cinci meciuri, dintre care doar unul s-a încheiat într-o victorie umană.

Silver și colegii săi au reușit să obțină aceste succese construindu-și AI pe baza a nu una, ci două rețele neuronale simultan - algoritmi speciali care imită activitatea lanțurilor de neuroni din creierul uman. Unul dintre ei este responsabil de evaluarea poziției actuale pe bord, iar al doilea folosește rezultatele analizei pregătite de prima rețea pentru a alege următorul pas.

Următorul pas logic în dezvoltarea AlphaGo a fost eliminarea principalului dezavantaj al tuturor rețelelor neuronale existente și a sistemelor de inteligență artificială - necesitatea de a le învăța ce ar trebui să facă folosind arhive de date uriașe prelucrate manual de o persoană sau cu participarea directă a unei persoane, așa cum s-a întâmplat în primele etape. dezvoltarea AlphaGo.

Silver și echipa sa au rezolvat această problemă prin crearea unei rețele neuronale fundamental bazate pe așa-numitele algoritmi de învățare a armăturii. Această rețea neuronală, spre deosebire de predecesorul său stelar, care a fost inițial instruit în jocuri cu voluntari și care avea unele strategii de joc primitive încorporate, și-a început activitatea ca un începător absolut cu o bază de cunoștințe zero.

Cu alte cuvinte, ea nu știa decât regulile jocului lui Go, condițiile inițiale și condițiile de victorie, iar apoi computerul a învățat independent să joace această strategie antică chineză, jucând cu sine și acționând prin încercare și eroare. Singura limitare în munca ei a fost timpul maxim pentru a se gândi la mișcare - a fost de aproximativ 0,4 secunde.

Video promotional:

După fiecare astfel de joc, sistemul AI a analizat toate mișcările sale și și-a amintit de cele care au adus una dintre „jumătățile” sale mai aproape de victorie și a intrat într-un fel de „listă neagră”, acei pași care pierdeau sincer. Folosind aceste date, rețeaua neuronală s-a reconstruit singură, ajungând treptat la nivelul la care a ajuns prima versiune a AlphaGo înainte de seria jocurilor cu Lee Sedol.

Trecerea la algoritmi de auto-învățare nu a permis doar AlphaGo Zero să-și depășească predecesorul și să-l învingă cu 100-0, dar a îmbunătățit multe alte aspecte ale activității sale. În special, procesul de pregătire a durat doar trei zile și aproximativ cinci milioane de jocuri, ceea ce a fost un ordin de mărime mai mic decât solicitările primei versiuni de AI.

Calea către excelență

Finalizarea cu succes a experimentelor cu AlphaGo Zero i-a determinat pe Silver și echipa sa să analizeze dacă o rețea neuronală similară poate fi folosită pentru a câștiga coroana campioanelor în alte tipuri de jocuri de strategie și de masă.

Pentru a face acest lucru, oamenii de știință au construit un alt element nou în AlphaGo Zero - algoritmi euristici pentru căutarea aleatorie a soluțiilor, precum și cod care a luat în considerare existența unei remize în unele jocuri. În plus, noua versiune de alpha și-a îmbunătățit continuu structura, în loc să fie actualizată în etape precum predecesorul său.

Aceste modificări relativ simple, după cum au arătat experimentele ulterioare, au sporit semnificativ viteza de învățare de sine a acestui sistem de inteligență artificială și l-au transformat într-o mașină universală capabilă să joace toate tipurile de strategii de masă.

Oamenii de știință și-au testat activitatea pe trei tipuri de jocuri - go, șah obișnuit și soiul lor japonez, shogi. În toate cele trei cazuri, noul creier al lui Silver a atins nivelul unui maestru în mai puțin de un milion de jocuri, obținând o selectivitate aproape umană în alegerea posibilelor mutări în doar 9-12 ore de antrenament pentru șah și 13 zile pentru a merge.

Anterior, ea a bătut cele mai sofisticate programe de calculator care joacă aceste jocuri - algoritmul Stockfish a renunțat la a patra oră a antrenamentului AlphaZero, în timp ce Elmo, actualul campion în shogi, a durat doar două ore. În cele din urmă, prima versiune a AlphaGo a început să cedeze „nepotului său” cu aproximativ 30 de ore de la antrenamentul său.

Următoarele „victime” ale AlphaZero, după cum au menționat oamenii de știință, pot fi jocuri pe calculator „reale”, precum Starcraft II și Dota 2. Luarea campionatului în astfel de discipline sportive, în opinia lor, va deschide calea pentru AI-ul de auto-învățare să pătrundă în zone mai puțin formalizate ale științei și culturii și tehnologie.

Recomandat: