Oamenii De știință Au Pregătit O Rețea Neuronală Pentru A Determina Sexul Unei Persoane Din Textul Scris - Vedere Alternativă

Oamenii De știință Au Pregătit O Rețea Neuronală Pentru A Determina Sexul Unei Persoane Din Textul Scris - Vedere Alternativă
Oamenii De știință Au Pregătit O Rețea Neuronală Pentru A Determina Sexul Unei Persoane Din Textul Scris - Vedere Alternativă

Video: Oamenii De știință Au Pregătit O Rețea Neuronală Pentru A Determina Sexul Unei Persoane Din Textul Scris - Vedere Alternativă

Video: Oamenii De știință Au Pregătit O Rețea Neuronală Pentru A Determina Sexul Unei Persoane Din Textul Scris - Vedere Alternativă
Video: You Bet Your Life: Secret Word - Door / Foot / Tree 2024, Mai
Anonim

O echipă de oameni de știință de la Universitatea Națională de Cercetare Nucleară „MEPhI”, Centrul Național de Cercetare „Institutul Kurchatov” și Universitatea de Stat Voronezh au dezvoltat o metodă care învață un computer să recunoască genul unei persoane dintr-un text scris de el cu o precizie de 80 la sută. Dezvoltarea științifică aparține domeniului lingvisticii computaționale. Cercetarea a fost realizată cu o subvenție de la Fundația Rusă pentru Știință. Rezultatele sunt publicate în revista Procedia Computer Science.

Numeroase studii științifice arată că un text scris reflectă inevitabil caracteristicile autorului său - sex, caracteristici psihologice, nivel de educație. Discursul este un instrument psihodiagnostic valoros folosit de specialiștii în resurse umane ale marilor companii, precum și de servicii de securitate.

Pe baza analizei vorbirii, este posibilă diagnosticarea prezenței anumitor boli la o persoană (demență, depresie) și o tendință de comportament suicid. Necesitatea de a stabili caracteristicile autorului textului crește și odată cu dezvoltarea comunicațiilor pe internet: este important ca companiile să știe ce grupuri de oameni le plac produsele și serviciile.

Oamenii de știință care lucrează în această direcție (lingviști, psihologi, specialiști în tehnologia informației), pe baza valorilor numerice ale diferiților parametri ai textului, construiesc modele matematice pentru diagnosticarea anumitor parametri de personalitate.

O echipă de experți a analizat eficiența diferitelor tehnologii de învățare automată folosind rețele neuronale pentru analiza textului.

Pe parcursul studiului, ei au comparat acuratețea rezolvării problemei identificării de gen a textelor pe baza a două abordări ale modelării bazate pe date: pe de o parte, algoritmi de învățare automată (suport vector machine și gradient boosting), pe de altă parte, învățare profundă a rețelelor neuronale (rețele neuronale convoluționale și rețele neuronale recurente cu memorie de scurtă durată).

„Am obținut rezultate ridicate în determinarea sexului autorului textului datorită modelelor avansate de rețele neuronale, în condițiile în care autorul nu își ascunde genul. Următoarea sarcină este de a determina sexul în termeni de ascunderea intenționată a acestuia”, spune Alexander Sboev, profesor asociat la MEPhI NRNU.

Așadar, în textele următoare, postate inițial pe un site de întâlniri, rețeaua neuronală găsește cu ușurință o captură în zece din zece cazuri, în plus, autorul pune în semn intenționat numele sexului opus în semnătură.

Video promotional:

Textul a fost scris de o fată: „Sunt un bărbat frumos, musculos, de 30 de ani. Lucrez pentru o companie mare de petrol și gaze într-o poziție bună, cu un salariu decent. Locuiesc în apartamentul meu din Moscova. Proprietatea are, de asemenea, o casă mică, dar drăguță, într-unul din satele din Italia. Sunt iubitor de sport, în special de fotbal. Îmi place să ies în weekend, urăsc să stau acasă. O fată care mi s-ar potrivi ar trebui să aibă o dispoziție modestă, aspect bun și o figură atractivă conform standardelor moderne. Ar trebui să-mi împărtășească interesele, nu ar trebui să fie geloasă și nu ar trebui să încerce să mă facă să mă simt geloasă. Nu o să o susțin pe fată, pentru că cred că ambele ar trebui să lucreze în familie. De asemenea, prefer să păstrez bugetul separat. Nu voi tolera trădarea”.

Textul a fost scris de un bărbat: „Bună ziua! Sunt extrem de nefericit, extrem! De ce te comporti așa cu noi ?! Și noi suntem oameni, toți suntem egali! Ești sexist? Nu voi mai lua asta! Îți voi sparge mașina peste tot, o voi picta. Stai, inuman. Voi termina astfel”.

Rezultatele acestui studiu au arătat că o abordare bazată pe utilizarea rețelelor neuronale convoluționale și metode de învățare profundă pentru recunoașterea genului persoanei care a scris textul este cea mai optimă.

Acum, un grup de cercetători lucrează la problema recunoașterii vârstei.

Recomandat: