Universul Lingvisticii Computaționale. O explorare a modului în care tehnologia transformă studiul limbilor și al literaturii

07 Aprilie 2025, 13:26
Într-o eră dominată de inteligență artificială și comunicare online, limbajul uman devine nu doar un mijloc de exprimare, ci și un teritoriu de cercetare științifică intensă.
Despre modul în care Procesarea Limbajului Natural (NLP) ajută mașinile să înțeleagă și să interacționeze cu limbajul uman, cum pot descoperi tehnicile computaționale avansate cine se află în spatele cuvintelor, chiar și în cele mai obscure lucrări literare (identificarea autorilor), despre impactul limbajului asupra stării noastre emoționale și cum analizele lingvistice pot ajuta în terapia psihologică, detectarea emoțiilor - inovațiile în recunoașterea și interpretarea emoțiilor din texte, un pas important în înțelegerea interacțiunilor umane, despre lingvistica istorică - modul în care limbile evoluează în timp și cum acest lucru reflectă schimbările socioculturale dar și perspectivism - felul în care diverse perspective influențează interpretarea limbajului și identitatea noastră - despre toate acestea am discutat astăzi la Știința 360, realizatoare Corina Negrea, o ”călătorie” fascinantă, unde știința și arta se intersectează, iar cuvintele devin punți între minți și emoții. ”
Cu Liviu Dinu, dr. în informatică, expert în lingvistică computațională, profesor în Departamentul de Informatică al Facultății de Matematică și Informatică din Universitatea București, director al Centrului de Cercetări și Tehnologii ale Limbajului din cadrul Universității din București (https://ro.wikipedia.org/wiki/Liviu_Petri%C8%99or_Dinu).
„E mai bine de un sfert de veac de când mă ocup de așa ceva”, spune profesorul Liviu Dinu cu modestia unui om care a fost martor și pionier al evoluției unui domeniu spectaculos: lingvistica computațională. Format sub îndrumarea academicianului Solomon Marcus, profesorul Dinu a dus mai departe o misiune: aceea de a face limba înțeleasă nu doar de oameni, ci și de mașini.
“Lui Solomon Marcus îi datorez totul. Era imposibil fără el.”
Profesorul Liviu Dinu este organizatorul seminarului Solomon Marcus (https://nlp.unibuc.ro/events.html), un eveniment științific de tradiție, care anul acesta, la centenarul nașterii mentorului său, va avea o desfășurare specială.
„E un seminar pe care l-am gândit de vreo 2-3 ani. Au fost două ediții și acum urmează ediția care, pentru mine, va fi ediția cea mai importantă, în jurul căreia am construit seminarul”, explică Liviu Dinu, iar invitatul special, Oliviero Stock, este „unul dintre părinții lingvisticii computaționale din Italia.”
Lingvistica computațională, procesarea limbajului natural și digital humanities nu sunt doar termeni tehnici, ci direcții care unesc știința cu viața cotidiană. În esență, totul se reduce la a înțelege mai bine cum vorbim, scriem, gândim și simțim prin limbaj – iar tehnologia ne poate ajuta în acest proces.
”Lingvistică computațională și procesare de limbaj natural - pentru mine înseamnă unul și același lucru în realitate. Din punctul meu de vedere, cei care spun că fac lingvistică computațională vin mai mult din partea universitară. Zona de procesare de limbaj natural vine mai mult din zona de inginerie și poate e un pic mai atrăgătoare, atrage mai mult industria.”
Un alt proiect ambițios coordonat de profesorul Dinu este cel legat de similaritatea limbilor. Încă din 2005, echipa sa lucrează la dezvoltarea unor metode proprii pentru a măsura cât de apropiate sunt limbile romanice. Nu e vorba doar de intuiții sau impresii personale, ci de o analiză științifică riguroasă susținută de algoritmi și date.
„Am început să lucrăm la acest proiect din 2005 și acum am primit și o finanțare și va fi un proiect frumos despre similaritatea limbilor. Vrem să facem similaritatea limbilor nu doar între română și celelalte limbi, ci între oricare două limbi romanice.”
Pe lângă efortul academic, Liviu Dinu are și o viziune clară despre limbă ca fenomen viu: „Limba se schimbă, este un organism viu... oamenii împrumută din prestigiu și din nevoie”. Așa se explică, de pildă, influențele din engleză asupra limbajului tinerilor de azi – un proces firesc, parte din evoluția oricărei limbi.
Prin activitatea sa didactică și de cercetare, Liviu Dinu a contribuit la formarea unor direcții moderne în educație: a fondat în anul 2000 masteratul de Natural Language Processing - Procesarea Limbajului Natural - la Facultatea de Matematică și Informatică din București, iar în 2019 a pus bazele programului de Digital Humanities la Facultatea de Limbi și Literaturi Străine. Din 2017, conduce Centrul de Tehnologii ale Limbajului (pe care l-a și înființat, (nlp.unibuc.ro), un hub de cercetare care dezvoltă soluții locale.
Depresia nu mai este doar un subiect de psihologie, ci a devenit și o temă de cercetare pentru specialiștii în inteligență artificială. Tehnologia poate detecta depresia analizând doar... limbajul. Cu rezultate spectaculoase, cercetările sale arată cum subtilitățile din textele scrise de oameni pot dezvălui semnale timpurii ale tulburărilor emoționale.
O întrebare care i-a ghidat pe cercetători: „Din ceea ce scriu oamenii, putem noi să tragem un semnal când sunt pe cale de a face depresie, nu când deja a apărut?” - Liviu Dinu și echipa sa au demonstrat că da – și chiar cu o acuratețe semnificativă.
Prin analizarea sintaxei – felul în care sunt structurate propozițiile, cuvintele folosite și ordinea lor – s-au observat diferențe clare între textele celor sănătoși și cele ale persoanelor aflate în pragul depresiei.
„Primele rezultate au fost spectaculoase. Se schimbă sintaxa atunci când ai probleme. Substantivele, verbele încep să fie folosite diferit”.
Un alt rezultat neașteptat: persoanele cu depresie pot părea, la suprafață, optimiste. Dar, spune cercetătorul, „sunt optimiști, legat de lucruri diferite, de priorități diferite”. Acest „optimism de fațadă” poate masca stări profunde de dezechilibru emoțional, ceea ce face cu atât mai valoroasă analiza automată, obiectivă, a textului. „Oamenii care au depresie au și momente de fericire. Dar și fericirea e diferită”, adaugă Liviu Dinu. Acest contrast între stările emoționale nu e ușor de surprins de un ochi uman, dar algoritmii pot distinge nuanțele cu precizie.
Cercetătorii au mers și mai departe, corelând depresia cu agresivitatea verbală.O descoperire care a surprins chiar și psihologii: persoanele cu depresie sunt adesea mai agresive în comunicare, iar acest lucru poate fi un semnal important în detectarea timpurie a afecțiunii.
“Am găsit o corelație între limbajul ofensiv și depresie. Cei care sunt agresivi în limbaj, sunt în această zonă de depresie.”
Un alt concept fascinant adus în discuție este rank distance, o nouă metrică dezvoltată pentru a compara texte. Ea ține cont de importanța poziției informației în mesaj. Aplicațiile sunt uimitoare: de la identificarea autorilor unor texte literare (inclusiv cine e în spatele Elenei Ferrante – autorul real ar fi Domenico Starnone), până la comparații între lanțuri de ADN.
“În domeniul similarității între limbi și în recunoașterea cifrelor scrise de mână, am obținut rezultate bune, deoarece am reușit, din punct de vedere computațional, să rezolvăm o problemă care nu era formulată explicit, ci era o întrebare deschisă în literatura de specialitate: dacă există o metrică ce poate avea anumite proprietăți care să permită calcularea ușoară a unui punct cu proprietăți de mediană. Cu rank distance am reușit acest lucru, iar acest demers ne-a ajutat să dezvoltăm ulterior un instrument care poate calcula și categorisi clar și eficient diverse subiecte. Această metrică a fost folosită și în vederea artificială, de către un fost student care a devenit ulterior un expert recunoscut în domeniu. El a demonstrat că rank distance funcționează bine și în comparația dintre imagini, obținând rezultate mai bune decât metricele standard utilizate până atunci.”