Contemporanul » Clubul Ideea Europeană » Cătălin Mosoia în dialog cu Gabriela Haja. Dicţionarul limbii române, din dragoste pentru cunoaştere şi limba română

Cătălin Mosoia în dialog cu Gabriela Haja. Dicţionarul limbii române, din dragoste pentru cunoaştere şi limba română

Visul oricărui cercetător este să-⁠⁠şi vadă opera împlinită, dar la o astfel de operă participă generaţii. Aceeaşi istorie o au şi dicţionarele Academiilor din Franţa sau din Spania. În plus, o asemenea lucrare, odată încheiată, trebuie reluată şi actualizată periodic, fiindcă lexicul este în continuă schimbare. De pildă, Dicţionarul Academiei Franceze a ajuns la a noua ediţie, începută în 1986, încă nepublicată integral

Trăim atât de multe emoţii şi petrecem atât de mult timp împreună, încât aproape că nu ne dăm seama că, de fapt, suntem în iubire cu limba română. Acesta a fost unul dintre gândurile care au venit natural după dialogul cu Dr. Gabriela Haja, responsabil pentru Departamentul de lexicologie-⁠⁠lexicografie din cadrul Institutului de Filologie Română „A. Philippide“ al Academiei Române.

Cătălin Mosoia: Sunteţi un cercetător norocos!

Gabriela Haja: Mă consider un cercetător norocos pentru că am participat la redactarea şi la încheierea primei ediţii a Dicţionarului limbii române, dicţionarul Academiei Române, început, în această formă, în 1905. E un mare noroc! E o şansă!

Alţi cercetători nu se întâlnesc cu o asemenea şansă?

Nu mulţi, pentru că lucrările de acest fel sunt speciale şi unice în felul lor. În România nu există un alt dicţionar de asemenea dimensiuni şi de o asemenea importanţă. Apoi, pentru că o astfel de lucrare se realizează de-⁠⁠a lungul unor decenii, în echipe mari şi cu eforturi pe măsură. Visul oricărui cercetător este să-⁠⁠şi vadă opera împlinită, dar la o astfel de operă participă generaţii. Aceeaşi istorie o au şi dicţionarele Academiilor din Franţa sau din Spania. În plus, o asemenea lucrare, odată încheiată, trebuie reluată şi actualizată periodic, fiindcă lexicul este în continuă schimbare. De pildă, Dicţionarul Academiei Franceze a ajuns la a noua ediţie, începută în 1986, încă nepublicată integral.

Aveţi sentimentul că i-⁠⁠aţi mulţumit şi pe cei care au lucrat la Dicţionarul limbii române înaintea dumneavoastră?

Cred că da! Ştiu că m-⁠⁠am străduit să ajung la cele mai bune definiţii, la cele mai bune articole. Dar satisfacţia nu-⁠⁠i a mea personală, eu sunt doar o parte dintr-⁠⁠un mare ansamblu. Redactările mele au fost revizuite de specialişti cu experienţă, care m-⁠⁠au şi format de altfel. Apoi, întregul material a fost verificat de membrii Comisiei de etimologii, înainte de a fi predat la tipar. Mulţumirea este că s-⁠⁠a încheiat o astfel de operă. Foarte important eveniment pentru o cultură să aibă un tezaur încheiat! Când compara Dicţionarul cu o catedrală, acad. Marius Sala se gândea, cred, la catedralele gotice…

Despre Dicţionarul nostru tezaur trebuie repetate o serie de lucruri importante. În primul rând, el este legat strict de istoria Academiei Române. Am sărbătorit, în 2016, 150 de ani de la înfiinţarea Academiei Române; tot atâţia ani au trecut de la primele cercetări lexicografice de o asemenea anvergură. În actul de întemeiere al Societăţii literare române, devenită în 1879 Academia Română, un obiectiv important era redactarea unui dicţionar reprezentativ al limbii române; al doilea era realizarea gramaticii limbii române, care implica şi unificarea ortografiei; în fine, alcătuirea unui tratat de referinţă despre istoria românilor. Toate – proiecte care aveau să aducă argumente ştiinţifice pentru unirea românilor şi pentru întemeierea noului stat, România.

Ce puteţi spune despre valoarea Dicţionarului tezaur al limbii române?

Dicţionarul limbii române (DLR), supranumit şi Dicţionarul tezaur al limbii române sau Dicţionarul Academiei, este o certificare ştiinţifică a identităţii naţionale. Acelaşi rol îl are Dicţionarul Academiei Franceze, acelaşi rol îl are Dicţionarul Academiei Regale din Spania, acelaşi rol îl are orice dicţionar tezaur al unei limbi realizat sub egida unei instituţii de tip academic.

Dicţionarul limbii române este comparabil ca importanţă cu Deutsches Wörterbuch – început de fraţii Jakob şi Wilhelm Grimm şi a cărui elaborare a durat peste 100 de ani, cu Dictionnaire de l’Académie Française ori Oxford English Dictionary (OED).

Academia Română a fost înfiinţată prin-tr-⁠⁠un statut care preciza, încă la 1866, când abia se obţinuse unirea principatelor, că din Academie vor face parte personalităţi de excepţie din toate ţinuturile locuite de români, Transilvania, Maramureş, Bucovina, Basarabia, Banat, Macedonia. Înfiinţarea Academiei a fost un gest de politică culturală, dar şi unul de politică lingvistică. În secolul al XIX-⁠⁠lea elitele politice, care erau şi oameni de cultură, ştiau că astfel pot modela istoria sau destinul unei naţiuni. Au ştiut să îşi aleagă bine modelele.

Dicţionarul limbii române, în cifre…

Lucrarea are 37 de volume, în prima sa ediţie, şi aproape 18.000 de pagini, 175.000 de cuvinte şi peste 1.000.000 de citate din texte româneşti, de la Scrisoarea lui Neacşu din Câmpulung (1521) (şi chiar anterioare acesteia, din textele slavo-⁠⁠române), până în prezent.

Care este structura dicţionarului?

Încerc o analogie. Dicţionarul limbii române (DLR) este de mai bine de zece ori mai mare decât Dicţionarul explicativ al limbii române (DEX) şi, fireşte, cuprinde mult mai multe cuvinte, fiindcă include toate arhaismele şi regionalismele, cuvinte populare, precum şi toate cuvintele limbii literare. În plus, fiecare sens şi subsens al unui cuvânt este argumentat şi ilustrat de citate extrase din texte româneşti scrise şi vorbite (înregistrate în atlase lingvistice, în glosare, în culegeri de folclor ori în răspunsurile la chestionare lingvistice, precum cel al lui Hasdeu), de la primele atestări până în prezent sau, mai precis, până la data tipăririi fiecărui volum. Pe lângă partea semantică, fiecare articol de dicţionar aduce informaţii privind uzul cuvântului, originea lui, valorile şi formele morfologice, variantele sale, acolo unde este cazul, sinonimele, dar şi relaţia semantică pe care o are, ierarhic, cu alte cuvinte.

Analizaţi inclusiv sensurile care apar la unii scriitori?

Desigur. Pentru că, în bună parte, Bibliografia DLR cuprinde opere literare, pe lângă vechi manuale şcolare, tratate de istorie, tratate juridice, publicistică literară şi cotidiană, traducerile făcute până în prima parte a secolului al XIX-⁠⁠lea şi multe altele. Am ajuns, în prezent, la circa 3000 de titluri. Luăm în considerare toate sensurile speciale, figurative sau sensurile nou introduse ori chiar creaţiile lexicale ale unor autori influenţi. Un exemplu este G. Călinescu (1899-⁠⁠1965), rafinat modelator de limbaj. Dicţionarul limbii române oglindeşte istoria culturii române văzută din perspectiva cuvintelor – şi reflectă limba vorbită în toate regiunile româneşti. Seria veche a dicţionarului, coordonată de Sextil Puşcariu (1877-⁠⁠1948), făcea trimiteri la cuvinte şi forme din celelalte graiuri româneşti (aromâna sau macedoromâna, meglenoromâna, istroromâna).

Dicţionarul are mari dimensiuni şi nu a putut fi realizat doar de o echipă. Până să ajungem la forma actuală, au fost mai multe încercări. Prima a fost al lui Bogdan Petriceicu Hasdeu (1838-⁠⁠1907), care a scris Etymologicum magnum Romaniae (1886-⁠⁠1893). Însă a ajuns doar până la cuvântul bărbat. Proiectul conceput de el nu putea fi realizat de un om. Hasdeu a vrut să fie exhaustiv, să lucreze toate cuvintele înregistrate în scris. Limbajul popular l-⁠⁠a interesat mult şi dicţionarul e foarte bogat din acest punct de vedere; a fost primul care a lucrat cu chestionare trimise pe teren. Partea etimologică este bine dezvoltată. De fapt, Hasdeu a lucrat monografic fiecare cuvânt, cu trimiteri la evoluţia şi influenţele mentalităţilor, cu numeroase citate din texte vechi şi folclorice. Pentru noi, cercetătorii limbii române, lucrarea lui rămâne una de referinţă, cu rezervele critice obligatorii în această întreprindere…

Cui a trimis chestionarele?

Preoţilor, notarilor, învăţătorilor şi de la ei a primit răspunsuri scrise. Toate acestea se află depozitate la Biblioteca Academiei Române din Bucureşti. O colegă de la Institutul nostru se ocupă tocmai de salvarea şi editarea acestor răspunsuri; sunt 9000 de pagini.

Bogdan Petriceicu Hasdeu a fost primul care a lansat chestionarele pentru dicţionar.

La noi, da. Înainte de el, au lucrat la primul dicţionar academic doi filologi, August Treboniu Laurian (1810-⁠⁠1881) şi Ion C. Massim (1825-⁠1877); ei aveau formaţie latinistă şi susţineau linia Şcolii Ardelene, exclusiva latinitate a limbii române, scrierea etimologizantă şi, din această pricină, dicţionarul lor, Dicţionarul limbei române (1871-⁠⁠1876), a fost respins de către comisia care a supravegheat lucrarea. Primul dicţionar finalizat al Academiei, publicat de Laurian şi Massim, a fost criticat aspru de cei care susţineau scrierea fonetică şi o dreaptă măsură în împrumuturile din latină sau din franceză. Cu toate acestea, este un dicţionar important pentru istoria culturii noastre şi foarte interesant pentru lexicografi.
După încercarea lui Hasdeu, dicţionarul a fost încredinţat unui savant recunoscut nu doar în ţară, Alexandru Philippide (1859-⁠⁠1933). Academia Română i-⁠⁠a solicitat lucrarea în cinci ani, iar el, ca unul care nu lucrase la un dicţionar, a acceptat.

Trebuie să fac o paranteză. Aceasta este eroarea oricărui venit din afara domeniului. Şi este, întrucâtva, de înţeles. Am avut nevoie de aproape zece ani ca să deprind tehnica de lucru la tezaur, să redactez şi să revizuiesc singură; până atunci, am lucrat în echipă cu un senior; la dicţionarele de felul celui explicativ sau al celor etimologice ori generale, se învaţă mai repede tehnica lexicografică, dar să lucrezi la tezaur e cu totul altceva.

Philippide a făcut câteva lucruri foarte importante: a gândit structura dicţionarului, metodologia de lucru şi a căutat modele europene care puteau să-⁠⁠i mulţumească spiritul critic, el fiind recunoscut drept unul dintre cei mai aspri critici în domeniul lingvisticii şi al filologiei.

Care a fost structura dicţionarului gândită de Alexandru Philippide?

Cuvântul titlu, încadrarea morfologică, urmează definiţia şi apoi citatele, fireşte, cu menţionarea sursei, indicaţii privind flexiunea, variantele lexicale, în fine etimologia. Un cuvânt poate avea un sens, în cazurile cele mai simple, sau, de cele mai multe ori, este polisemantic. Forma unui cuvânt şi înţelesurile sale sunt determinate strict de originea cuvântului.

O structură de arbore, dar la un moment dat trebuie să te opreşti. Unde sau când?

Ca lexicograf, construieşti arborele şi te opreşti când ajungi la frunze. Frunzele sunt sensuri speciale; te opreşti la sensurile speciale care au tendinţa de a intra în uzul general. Nu lucrezi, decât în rare cazuri, sensurile cu totul particulare; pentru că dicţionarul limbii s-⁠⁠ar transforma în dicţionarul limbajelor literare. Prin urmare, te opreşti în momentul în care sensurile intră în domeniul limbajelor individuale. Dicţionarul nu este al limbajelor, ci este al limbii române.

Cum simţi lucrul acesta?

Toată lumea vorbeşte despre simţul limbii, pe care îl ai sau nu… Criteriile ştiinţifice la îndemâna noastră sunt cele statistice. Observi în ce măsură o formă a unui cuvânt, un sens al unui cuvânt, apare în mai mult de un stil ori la mai mulţi autori. O personalitate ca aceea a lui Călinescu putea influenţa îndeajuns limba literară, încât să considerăm cuvinte create de el, dar alţi autori, mai puţin. Ar trebui oare să introducem în dicţionar cuvinte din limba spargă (inventată de poeta Nina Cassian) sau din limba leopardă a lui Virgil Teodorescu (1909-⁠⁠1987)? Nu. Cazul lui Mihai Eminescu (1850-⁠⁠1889) este cu totul altul, pentru că el a creat limba literară modernă şi urmărim cu atenţie maximă sensurile pe care le-⁠⁠a dat cuvintelor. Acum, că avem o ediţie electronică cvasicompletă a operelor sale, vom putea fi siguri că niciun cuvânt scris de el nu va lipsi din a doua ediţie a dicţionarului.
Alexandru Philippide a fost într-⁠⁠un fel nedreptăţit de istoria dicţionarului. Spun asta pentru că el a promis că în cinci ani termină dicţionarul. Nu l-⁠⁠a terminat. În cinci ani (1899-⁠⁠1904) a terminat o treime. Ceea ce este enorm! Şi mai ceruse îngăduinţă încă zece. Dar nu a fost înţeles. Nu poţi înţelege, dacă nu lucrezi efectiv. Cu toate că Philippide a trimis rapoarte foarte riguros argumentate şi bucăţi din manuscris spre revizie, când tensiunea dintre el şi Academie crescuse foarte mult, a refuzat să termine dicţionarul şi a reziliat contractul, unilateral. Philippide a avut şi el ambiţia unui dicţionar exhaustiv, care să cuprindă toate cuvintele, indiferent de forma lor, indiferent dacă sunt regionalisme, arhaisme sau neologisme. Manuscrisul dicţionarului a fost considerat multă vreme pierdut. A fost descoperit, în 1982, de colega noastră Carmen-⁠⁠Gabriela Pamfil şi se găseşte la Biblioteca Academiei din Iaşi, în fondul A. Philippide. Noi am digitizat acest manuscris, în formă scanată, şi e la dispoziţia specialiştilor, din 2015, în biblioteca electronică a DLR, realizată la Institutul nostru.

Spuneam că Alexandru Philippide a stabilit principiile şi metodologia de lucru. Altminteri spus, a stabilit etapele de lucru şi activităţile: să pornească mai întâi de la documentare, să fişeze un număr de lucrări – texte româneşti, de la cele mai vechi până la cele contemporane lui şi, pe baza acelor citate, să recupereze semantica unui cuvânt. El pornea de la principiul statistic în stabilirea listei de cuvinte lucrate şi a dimensiunii unui articol de dicţionar. Philippide a avut o intuiţie teribilă şi de foarte mare actualitate: în momentul în care tu, cercetătorul, ai reuşit să extragi toate contextele în care apare un cuvânt, este foarte posibil să rămâi blocat în prea marea masă de informaţii. Or, lucrul este extrem de actual astăzi, când lucrăm la schimbarea metodelor şi a mijloacelor de lucru la DLR.

Volumele dicţionarului publicate până la utilizarea calculatorului au fost scrise aşa cum se alcătuiau dicţionarele în secole de mult revolute, doar că noi nu foloseam pana, ci creionul şi stiloul – metodele erau aceleaşi. Fişele erau extrase manual şi apoi repartizate unui lexicograf spre verificare şi utilizare. Manuscrisele se făceau pe jumătăţi de coli A4, iar numărarea semnelor pentru verificarea îndeplinirii normei lunare se făcea manual şi prin aproximare. S-⁠⁠a întâmplat să influenţez direct informatizarea cercetării lexicografice la Iaşi. Când am fost angajată, în 1994, în departament exista doar o maşină de scris Optima, cu car mare, pe care am folosit-⁠⁠o să culeg cuvântul viaţă, în două exemplare – aceasta a fost prima mea sarcină. Dar eu deja lucrasem cu nişte calculatoare. Nu îmi mai amintesc ce model erau. Doar că ecranul era negru şi literele verde fosforescent, ca ochiul de pisică al radioului de acasă…

Cât timp aţi lucrat la cuvântul viaţă?

Nu foarte mult; eram abia angajată şi am cules cele o sută şi ceva de pagini de dicţionar, ca o dactilografă şi o ucenică. Colegii mei cred că au lucrat la viaţă mai mult de un an. Sunt verbe la care s-⁠⁠a lucrat doi sau chiar trei ani – de exemplu, vrea/voi, veni, lega, lăsa. Asta pentru că sunt foarte complexe semantic. Verbele înseamnă mişcare, interacţiune, proces. Substantivele nu sunt neapărat mai simplu de lucrat şi sunt mult mai numeroase, fiindcă tot ceea ce există şi ne este cunoscut are un nume, nu-⁠⁠i aşa? Dar semantismul lor e mai uşor de cuprins, fiindcă reperele sunt stabile.

Recapitulând, structura dicţionarului a fost gândită de Alexandru Philippide.

Într-⁠⁠adevăr. După ce Philippide a renunţat la dicţionar, la sfârşitul anului 1904, lucrarea a fost dată în sarcina lui Sextil Puşcariu, care în 1907 a tipărit prima fasciculă din litera A. Cu ajutorul colegilor lui de la Cluj, unde a înfiinţat, în 1919, Muzeul Limbii Române, Puşcariu a reuşit să ajungă până la cuvântul lojniţă. Cu alte cuvinte, a preluat cele aproximativ 500.000 de fişe culese de echipa lui Philippide, aşezate pe sensuri, cu definiţii scrise, deci a avut materialul brut bine organizat. Fireşte, el a îmbogăţit mult Bibliografia dicţionarului şi a realizat o operă admirabilă.

Înţeleg că la elaborarea tuturor acestor produse s-⁠⁠a ţinut cont de lucrul anterior.

Sextil Puşcariu este cel care a preluat de la Alexandru Philippide fişierul şi structura. Între Philippide şi Puşcariu e o certă continuitate. Puşcariu a putut publica destul de repede primul volum A-⁠⁠B, pe urmă C, pornind de la un material lexical deja structurat. Şi a lucrat cu o echipă de specialişti, e drept nu foarte mare, dar necesară, fiindcă un astfel de opus e dificil de îndeplinit solitar. Există o excepţie totuşi: francezul Émile Littré. Dar aceasta e o altă poveste.

De asemenea, este cu totul remarcabil faptul că, în anii ’50, când cenzura comunistă epura tot ceea ce amintea de Regalitate, conducerea Academiei a decis continuarea lucrării lui Sextil Puşcariu şi recuperarea întregii tradiţii lexicografice anterioare, precum şi păstrarea în mare parte a izvoarelor textuale folosite în exemple – inclusiv textele religioase şi literatura marilor autori. Se poate face, de altfel, un studiu asupra evoluţiei citatelor din volumele publicate după 1965. Încât da, s-⁠⁠a menţinut continuitatea în elaborarea Dicţionarului limbii române. S-⁠⁠a construit o tradiţie pe care se cuvine să o respectăm.

De unde proveneau banii?

Dicţionarul a fost susţinut financiar de Casa Regală, începând cu Etymologicum magnum Romaniae. Erau stipendii pentru cheltuieli, tipar, cumpărarea de cărţi, retribuţii pentru colaboratori. Tiparul se făcea la ziarul Universul, în general. Cât să însemne acum şase mii de lei, cât a solicitat Philippide pentru achiziţia de cărţi şi cheltuielile de întreţinere?…

Ce s-⁠⁠a întâmplat apoi?

A venit războiul. În 1948 Puşcariu a murit şi curând s-⁠⁠a întrerupt lucrul. Între timp s-⁠⁠a schimbat politica, s-⁠⁠a schimbat ortografia şi lucrarea a rămas în aşteptare timp de zece ani. Abia în anul 1958, după ce Academia Română a fost restructurată şi devenise Academia R.P.R., au fost numiţi lingvişti care să se ocupe de dicţionar. Acad. Iorgu Iordan (1888-⁠⁠1986) a fost cel care a preluat coordonarea lucrării, în 1949 şi i-⁠⁠a chemat alături, din 1958, pe acad. Ion Coteanu (1920-⁠⁠1997), lingvist de excepţie, şi, din 1965, pe acad. Alexandru Graur (1900-⁠⁠1988), care era un etimologist extrem de talentat. Ei au fost redactorii responsabili.

Iorgu Iordan, fost student al lui Philippide, i-⁠⁠a continuat, direct sau nu, principiile pe care, însă, le-⁠⁠a simplificat şi a renunţat la echivalarea în franceză a definiţiilor; de asemenea, a mărit considerabil lista lucrărilor de fişat, a stabilit nişte reguli precise şi a gândit lucrurile ca pentru echipe mari de lucru. În orice caz, Dicţionarul limbii române, în seria nouă, iniţiat de acad. Iorgu Iordan, este mai sistematic şi mai consecvent, mai unitar din punctul de vedere al normelor de redactare; noii redactori responsabili au reuşit să evite scăderile seriei vechi. Totuşi, seria lui Puşcariu avea capitolul privitor la etimologie mult mai dezvoltat şi mai explicit. În seria nouă, datele etimologice sunt abreviate la maximum şi asta i se impută.

După ce s-⁠⁠au creat echipele de lexicografi la Bucureşti, Cluj şi Iaşi s-⁠⁠au distribuit literele, la Iaşi au fost lucrate literele E, L, Ş şi V, W, X, Y.

Când a fost tipărit primul volum?

Primul volum din seria nouă a apărut în 1965. Echipa de la Bucureşti a fost întotdeauna mai mare şi mai harnică. S-⁠⁠a lucrat în formula actuală până în 2010. Sigur că, în timp, echipa de coordonatori s-⁠⁠a schimbat – din 2000, responsabilitatea lucrării a fost asumată de acad. Marius Sala (n. 1932) şi acad. Gheorghe Mihăilă (1930-⁠⁠2011).

Ce s-⁠⁠a întâmplat în 2010?

Ne-⁠⁠am pus problema că dicţionarul are 100 de ani vechime şi primele volume, primele litere au fost lucrate după alte norme şi că e nevoie să unificăm dicţionarul, să facem nu neapărat o a doua ediţie, deşi asta se conturează, ediţia a doua.

Lucraţi la o nouă ediţie?

Actualizăm şi completăm volumele seriei vechi după normele de redactare ale seriei noi. După 2011, colegii de la Bucureşti au încheiat un contract cu o firmă privată, care are ca obiect de lucru, între altele, crearea de interfeţe de scriere pentru dicţionare.

Dacă până în anul 2000 am lucrat cu mijloace tradiţionale, redactări manuscrise, culese în edituri, apoi, la calculator, e obligatoriu să schimbăm maniera de lucru. În lume, nu se mai fac dicţionare ca în Secolul Luminilor. Avem baze de date, o platformă de lucru şi un produs. Avem un lanţ tehnologic în lucrul cu mijloace informatice. Informatizarea înseamnă nu doar faptul că publici online un dicţionar, ci şi că lucrezi altfel şi cu alte resurse. S-⁠⁠a schimbat fundamental viziunea. Acesta este un start foarte important în lexicografia academică românească.

Un nou început…

În primul rând, vor fi mult mai precise rezultatele analizelor statistice. Când facem fişarea manual, ea este una selectivă şi ne poate scăpa un sens sau, mai grav, un cuvânt. De aceea trebuie să realizăm nişte corpusuri ale limbii române pe care le putem pune la punct folosind şi tezaurul digitizat până acum.

Ce este un corpus?

Un corpus înseamnă o colecţie imensă de text scris. Sau vorbit. Milioane de ocurenţe ale unui cuvânt. Big data! Despre asta vorbim. Dacă se poate, tot ce s-⁠⁠a scris în limba română. Pe de altă parte, nu-⁠⁠i destul să ai colecţia de text. Trebuie ca aceste texte să fie analizate morfologic, sintactic şi, pe cât posibil, semantic.

Când tu, lexicograful, ai un asemenea corpus, de fiecare dată când cauţi un cuvânt, reuşeşti să-l identifici cu toate contextele şi formele morfo-⁠⁠sintactice şi, eventual, cu sugestii semantice. În aceste condiţii, se schimbă maniera de lucru la un dicţionar: altfel te concentrezi asupra definiţiilor, altfel poţi modela dicţionarul, intrăm în altă eră. Este ca trecerea de la flaşnetă la CD player.

Cum vă imaginaţi că saltul acesta va influenţa cititorul de zi cu zi?

În primul rând, va avea acces la dicţionar. Pentru că, în prezent, acest dicţionar, atât de minunat, este cvasiinaccesibil, aş spune. Tirajele au fost limitate. În bibliotecile academice sau universitare, nu merge oricine. A fost tipărit într-⁠⁠un tiraj nu foarte mare, cu sprijinul Băncii Naţionale, ediţia facsimilată sau anastatică a DLR, reorânduită în 19 volume; e frumos editat, arată bine pe raft, e foarte bine să-⁠⁠l dăruieşti sau să-⁠⁠l primeşti în dar… însă nu este la îndemâna publicului larg, de fapt. Când ne-am gândit să digitizăm dicţionarul (încă de prin 2001), exact asta ne-⁠⁠am dorit: să devină cu adevărat public, să fie vizibil on-⁠⁠line. Cititorii de zi cu zi vor deveni mai informaţi şi, poate, mai înţelepţi ori, măcar, mai curioşi.

Credeţi că o să treacă 100 de ani până se va reuşi acest lucru?

Nu. În urmă cu zece ani, la Iaşi, profesorul Dan Cristea, de la Facultatea de Informatică, Universitatea „Alexandru Ioan Cuza“ din Iaşi, a iniţiat un proiect de transpunere în format electronic a Dicţionarului tezaur. În 2007 s-⁠⁠a alcătuit un consorţiu între Universitatea „Alexandru Ioan Cuza“ din Iaşi şi Academia Română, prin mai multe institute, Institutul de Lingvistică din Bucureşti, Institutul de Filologie din Iaşi, Institutul de Lingvistică şi Istorie Literară din Cluj. Cu alte cuvinte, toate institutele unde a fost elaborat Dicţionarul limbii române au fost prinse în acest proiect naţional şi lor li s-⁠⁠au alăturat Institutul de Cercetări pentru Inteligenţă Artificială de la Bucureşti, Institutul de Informatică Teoretică din Iaşi şi Facultatea de Informatică şi cea de Litere din Iaşi. A fost un moment de graţie prilejuit de reunirea grupurilor de lingvişti şi informaticieni. După trei ani, am ajuns, prin instrumentele construite de informaticieni şi cu efortul de corectură al lingviştilor, la prima variantă electronică a DLR: eDTLR.

Cum vă înţelegeaţi unii cu alţii?

A fost greu să găsim căi de comunicare între două domenii aparent incongruente. După ce mi-⁠⁠am susţinut doctoratul s-⁠⁠a întâmplat să asist la o şcoală de vară condusă de profesorul Dan Cristea (n. 1951), membru corespondent al Academiei Române, EuroLan, unde se discută tendinţele noi în cercetările din lingvistica computaţională. Am fost fascinată pentru că nu ştiam de existenţa acestui domeniu, dar, de cum l-⁠⁠am descoperit, m-⁠⁠am înscris imediat la masterul de lingvistică computaţională, tocmai ca să aflu cum mai poate fi gândită lingvistica, cum se analizează automat limbajul natural, ce înseamnă procesarea limbajului şi cum m-⁠⁠ar putea ajuta pe mine, lexicograful, să trec, de la fişa scrisă manual şi verificată de cinci ori, la alt nivel. Atunci s-⁠⁠au născut şi ideile de proiecte. Digitizarea dicţionarului este un proiect care a făcut primii paşi în perioada 2003-⁠⁠2005, la Institutul de Filologie Română. Noi am încercat, colaborând cu Facultatea de Informatică din Iaşi, să găsim maniera de digitizare a dicţionarului tipărit. În principiu, dai dicţionarul la cules literă cu literă, îl procesezi, prin diverse tehnici şi programe de analiză, şi apoi obţii produsul. Ne-⁠⁠am propus să încercăm altă manieră, să scanăm, să corectăm, să procesăm. Şi am găsit soluţia. Am publicat în 2005 o carte pe această temă – importantă, pentru că propune un model viabil. După aceea am găsit noi căi de comunicare, în 2008 aveam un consorţiu bine întemeiat şi în 2010 am pus la punct principiile informatice. S-⁠⁠a construit o „maşină“ care să recunoască structura unui articol DLR şi să o adnoteze corect. Prin urmare, un program care să recunoască structura dicţionarului, un program care ştie că această succesiune de litere reprezintă cuvântul titlu şi o etichetează ca atare, un program care ştie că ceea ce urmează este definiţie, iar nu citat şi înregistrează informaţia automat într-⁠⁠o bază de date structurată, un program care ştie că sensurile A., I., 1. se află în relaţie de subordonare şi care poate să mă ducă de la un nivel la altul fără eroare. Şi încă multe… Eventual, mă ajută să scriu un alt dicţionar.

Înţeleg că sunteţi fascinată de ceea ce înseamnă informatizare.

Cine nu ar fi? Peste tot în lume, la dicţionare lucrează lexicografi cu dublă specializare, lingvistică şi filologică, dar şi informatică. Au început să crească noile generaţii şi la noi.

Cum aţi cuprinde în câteva cuvinte problema digitizării dicţionarului?

Primele studii le-⁠⁠am realizat în 2003-⁠⁠2005, iar în 2007-⁠⁠2010 am ajuns la o primă formă: eDTLR. Rămâne să corectăm erorile de literă care au mai rămas şi să rezolvăm problemele pe care seria veche, mai inconsecventă, le pune programului de parsare. Decizia coordonatorilor DLR de a scrie dicţionarul direct în format bază de date reprezintă şi cea mai bună soluţie pentru viitor.

Când o să-⁠⁠l publicaţi?

Sunt mai multe lucruri de finalizat. Noi, lexicografii, avem dorinţa de a mai face o corectură a textului. Este nevoie de cel puţin o lectură şi de corecturi. Sigur că am putea să publicăm eDTLR şi aşa, dar într-⁠⁠un dicţionar ca acesta nu încape eroare de literă. Nu e permis. Nu putem. Dicţionarul Academiei este reper pentru cercetările lingvistice serioase. În tezele de doctorat din domeniul lingvistic nu se lucrează fără acest dicţionar sau nu ar trebui să se lucreze. Or, dacă introducem un zgomot, cum spun informaticienii, adică o eroare, ea este preluată progresiv, iar efectul poate fi dezastruos. Putem face următorul compromis: să publicăm paginile scanate, iar, în spate, să se afle formatul electronic, care permite consultări complexe.

De altfel, din 2010, la Institutul nostru se lucrează la cel mai amplu corpus de dicţionare româneşti în format electronic, pe scurt CLRE. Proiectul acesta e un efect al marelui eDTLR. CLRE cuprinde, în prezent, 160 de dicţionare, de la cel mai vechi (Anonimus Caransebensiensis, cca 1650) până la ultimul DEX. Suntem în faza de revizie a celor aproape 1 000 000 de cuvinte-⁠⁠titlu, cât are acum corpusul. Aceste cuvinte sunt puse în legătură cu intrările/articolele din Dicţionarul limbii române. Sperăm să avem mijloacele tehnice necesare publicării online a rezultatelor obţinute până în prezent. Vrem să lansăm acest corpus în 2018, pentru că e un an special.

Şi mai ales pentru că lucrările pe care noi le realizăm nu sunt numai ale noastre. Ele aparţin, de fapt, limbii române, pe care o slujim, care trebuie cunoscută şi pusă în valoare.

De unde vă alimentaţi această pasiune pentru cuvinte?

Iubesc enorm limba română. Apoi, am avut norocul să întâlnesc oameni extraordinari în acest domeniu, cercetători cu totul aparte, cu o excelentă pregătire profesională, cu lucrări semnificative pentru domenii ca filologia, istoria limbii literare, gramatica, semantica, lexicologia. Dar, mai cu seamă, mânaţi de o pasiune molipsitoare. Pentru că lucrul la dicţionar este pasionant: să urmăreşti istoria folosirii fiecărui cuvânt, evoluţia lui semantică, sensurile neobişnuite, farmecul textelor care te poate ispiti să întârzii asupra lor, în pofida verificării citatului… Se cere să ai deopotrivă răbdarea, precizia, fineţea restauratorului şi viziunea de ansamblu a arhitectului creator de mari structuri. Poate fi înrobitor şi poate fi foarte frustrant. Tu eşti o rotiţă măruntă într-⁠⁠un mecanism copleşitor şi nici nu te chemi autor, ci, simplu, redactor. Am colegi care au ostenit 50 de ani numai la Dicţionarul limbii române sau la alte mari dicţionare ale Academiei, cum este Dicţionarul general al literaturii române; şi nu au publicat nicio carte, nu sunt doctori în filologie, dar contribuţia lor este enormă. O ştim noi, cei care am lucrat sau lucrăm alături de ei.

Iubiţi limba română.

…Cuvintele au fost comparate cu banii. Fiindcă ele circulă asemenea monedelor. Adunate laolaltă, formează tezaure. Dar acum, când totul – inclusiv cercetarea – se măsoară numai în numere, în eficienţă economică, după indicatori care nu reprezintă prea mult pentru cercetătorul umanist, filolog al limbii române, mă gândesc că suma cuvintelor unei limbi nu face neapărat o operă. Că lipsită de conţinut, de sens, de valoare intrinsecă, o lucrare este ratată, inutilă, o risipă. Când am publicat prima carte, bunişoară, i-⁠⁠am arătat-⁠⁠o cu mândrie mamei. Care, înţeleaptă, a spus doar: Şi tu? Am meditat la întrebare şi mi-⁠⁠am propus să public doar ce cred că este cu adevărat important, cu încredere că ceea ce e valoros dăinuieşte.

Chiar spaţiul virtual devine sufocant din pricina milioanelor de cuvinte şi semne, care tot circulă, banale, între noi, cu viteze tot mai mari. Încât s-⁠⁠au dezvoltat noi instrumente, capabile să selecteze informaţia relevantă, să răspundă inteligent la căutările noastre, să extragă elemente utile din cele mai aparent nesemnificative mesaje. Pentru toate acestea e nevoie de resurse pentru prelucrarea limbajului natural. Pe lângă corpusuri monolingve ori multilingve, paralele, e nevoie de lexicoane şi mai ales de dicţionare complexe precum este Dicţionarul limbii române. Încât, da, e plin de sens lucrul la acest Dicţionar. Este o formă de iubire.

0

Cum am putea îmbunătăți acest articol?


+
=


Verify Human or Spambot ?

Despre Conte

Revista Contemporanul, înființată în 1981, este o publicație națională de cultură, politică și știință, în paginile căreia se găsesc cele mai proaspete știri privind evenimentele culturale, sociale și politice din România și din străinătate. De asemenea, veți fi la curent [...]

Vezi descriere completă

Scrie un comentariu

Your email address will not be published. Required fields are marked *

Sunt de acord cu termenii si conditiile Contemporanul.ro: Contemporanul.ro isi rezerva dreptul de a sterge/edita orice comentariu si de a interzice postarea comentariilor care depasesc limitele limbajului civilizat, comit atacuri la persoana precum comentariile cu tenta antisociala, caracter rasist sau xenofob.

*

Anticariat online

Pin It on Pinterest