Digitális örökség és mesterséges intelligencia: kultúramentés, korrajz és jóslatok a társadalom szolgálatában

Széleskörű szakmai érdeklődés mellett tartotta meg Digitális örökség és mesterséges intelligencia című online nyitókonferenciáját a Digitális Örökség Nemzeti Laboratórium (DH-LAB) május 20-án. Az eseményre közel 300 fő volt kíváncsi; az előadók és résztvevők a legszélesebb körben és országos lefedettséggel képviselték a tudományos és memóriaintézményeket, valamint a felsőoktatást. A digitális örökség téma különlegességét az adja, hogy ötvözi a társadalomtudományok, a bölcsészet és az informatikus szakma ismereteit és fejlesztéseit, ezáltal teljesen új kutatás-fejlesztési paradigmákat, célokat jelöl ki.

Noha a DH-LAB még csak az első konferenciáját tartotta a fél évvel ezelőtti indulása óta, mégis hatalmas érdeklődés övezte, amit egyfelől széleskörű partnerségnek, másfelől a keretei között zajló változatos kutatásoknak köszönhet. A nemzeti laboratórium 12 előadásán feltárult az együttműködések sokaságán alapuló intenzív szakmai munka, valamint a partnerség céljai. A nap során nyelvtechnológusok mutatták be a téma legújabb kutatási területeit, az alábbi intézmények képviseletében: BME, ELKH TK, ELTE Digitális Bölcsészet Tanszék, ELTE TáTK, Magyar Nemzeti Levéltár, MTA-KIK, Miskolci Egyetem, Monguz Kft, Semmelweis Egyetem – Szaknyelvi Intézet, Szegedi Egyetem.

Mit jelent a „digitális örökség”?

Jól tudjuk, hogy a világ információtermelésének óriási hányada az online térben keletkezik. A számítógépeken tárolt anyagokat gyakran egyetlen helyen tárolják, másolatáról, biztonságos megőrzéséről sokan egyáltalán nem gondoskodnak. Ha itt nem történik jelentős áttörés, félő, hogy a digitálisan létrejött (born digital) anyagok jelentős hányada örökre elvész. (Ha az élővilágban keresünk analógiát, mondhatjuk, hogy a digitálisan létrejött kulturális örökség túlnyomó része a „veszélyeztetett fajok” kategóriájába tartozik: az egyetlen példányban létező szöveg, videó, hangfelvétel stb. a pillanat tört része alatt válhat semmivé, bármekkora értéket jelentett a létrehozója, vagy mások számára.)

A „digitális termés” megőrzésére, megmentésére az egyik lehetséges válasz a „webaratás”: az interneten lévő tartalmak rendszeres összegyűjtése és tárolása. A robotok által learatott internet-termés azonban nemcsak a jövő generációk számára teszi majd lehetővé a mostani időszak tanulmányozását. A begyűjtött anyag a kutatók számára valóságos aranybánya: hírek és folyóiratcikkek, posztok és kommentek – ha elég sok összegyűlik ezekből, elkészíthető belőle egy nyelv modellje, elemezhetők köznyelvi és tudományos szövegek, vizsgálhatók társadalmi jelenségek – és a sort még folytathatnánk.

A magyar kultúra és a mindennapok digitális lenyomata

A konferencia két szekciója a már zajló kutatások eredményeiről számolt be, amelyekből megtudhattuk, hogyan lehet kezelni és elemezni napjaink sok millió írásbeli megnyilvánulását – például, hogy milyen reakciók jelentek meg a Covid járvány kapcsán a közösségi oldalakon, melyik védőoltással kapcsolatosan milyen jellemző megszólalásokat lehetett olvasni. Az érdeklődők olyan érdekes kérdésekre kaphattak választ, mint hogy hány milliárd szó kell egy szövegkorpuszba, hogy mesterséges intelligenciával lehessen a magyar nyelvre épülő szolgáltatásokat fejleszteni. A jövőbeli tervekről, a DH-LAB műhelyében zajló további nyelvtechnológiai kutatásokról szintén esett szó.

Egy másik szekció előadásai a levéltárakban őrzött, felbecsülhetetlen értékű kulturális örökség feldolgozásának innovatív módszereiről, a mesterséges intelligencia bevonásával hatékonyabbá tehető szövegtárak szolgáltatásrendszeréről, illetve az informatikai, számítógépes és jogi tudással egyaránt rendelkező adatgazdák képzésére vonatkozó tervekről szóltak. 

A rendezvény megnyitóján az ITM államtitkára, Bódis József azt hangsúlyozta, hogy a felgyorsult technológiai fejlődés számos kihívást támaszt világszerte – ezekre Magyarország egyik attraktív válasza a nemzeti laboratóriumok megalapítása volt. A DH-LAB-tól azt várják, hogy a legkorszerűbb technológiának a társadalomtudományok körébe való integrálásával mutasson föl széles körben használható eredményeket.

Az NKFIH egyik fontos feladata az újonnan alapított nemzeti laboratóriumok ösztönzése, támogatása, teljesítményük számonkérése. Örvendetes, hogy a DH-LAB ilyen rövid idő alatt már jelentős eredményekről tud beszámolni – hangsúlyozta Sebők Katalin, a Hivatal elnökhelyettese.

A DH-LAB konzorciumot vezető ELTE rektorhelyettese, Darázs Lénárd örvendetes jelenségként értékelte a bölcsészettudomány alapvető megújulását, melynek egyik érzékletes példája a digitális örökség szemantikus hálózati összefüggéseinek feltárása. Az ELTE a Digitális Bölcsészet Tanszék révén tagja az EU által létrehozott DARIAH kutatási szövetségnek, és az országban itt tették elsőként kötelezővé a hallgatók számára a digitális bölcsészet kurzuson való kötelező részvételt.

Az Irodalomtudományi Intézet igazgatója, Kecskeméti Gábor akadémikus beszélt a közeli, illetve a távoli olvasás fogalmáról. Ez utóbbi főleg a mesterséges intelligencia eszköztárának az irodalomtudományi kutatásokban való alkalmazása óta kapott nagy lendületet, mert hatalmas szövegmennyiségeken teszi lehetővé a különböző vizsgálatok elvégzését – az interreferenciák feltérképezésétől a szentiment elemzésekig.

A szervező: DH-LAB

A konferenciát szervező műhely, a 2020 őszén létrehozott Digitális Örökség Nemzeti Laboratórium (DH-LAB) egyfajta tudományos csomópont, amelynek mai nyitókonferenciáján a konzorcium tagjainak (Eötvös Loránd Tudományegyetem, Bölcsészettudományi Kutatóközpont, Magyar Nemzeti Levéltár, Miskolci Egyetem) – munkatársai mellett további együttműködő partnerek mutatták be a legújabb kutatásaikat, szakmai eredményeiket, terveiket. (A DH a Digital Heritage vagy Digital Humanities angol kifejezések rövidítése.)

A DH-LAB friss nemzetközi sikere

A „Why Digital Humanities Need Cultural Heritage and Vice Versa” című nyitó előadást Toma Tasovac, az EU égisze alatt létrehozott DARIAH (Digital Research Infrastructure for the Arts and Humanities) igazgatója tartotta. Ahogy az egyetem rektorhelyettese említette, az ELTE és a DARIAH közötti szakmai kapcsolat több éve kezdődött, de most egy friss esemény még inkább megerősítette a nemzetközi intézmény és az ELTE, azon belül a Digitális Bölcsészet Tanszék, illetve a DH-LAB között kialakított munkakapcsolatot: 2021. május 10-én a DARIAH és az ELTE formális együttműködési megállapodást kötött, így a jövőben az egyetemen zajló digitális bölcsészeti kutatások még jobban integrálódnak az Európai Unió innovatív projektjeibe.