Perspektívák: Irodalom, nyelv, kultúra – Konferencia

Az Eötvös József Collegium Magyar műhelye 2018. november 16-án és 17-én tudományos konferenciát szervezett alap-, mester-, osztatlan tanári, valamint doktori képzésben részt vevő hallgatók számára. A konferencia két napjának magas színvonalú előadásait rendkívül érdekes plenáris előadások is színesítették.

Az EJC Magyar műhelye által szervezett Perspektívák: Irodalom, nyelv, kultúra nevet viselő tudományos diákkonferencia az irodalomelmélet, filológia, textológia, nyelvelmélet és nyelvfilozófia, színháztudomány, fordítástudomány, funkcionális nyelvtudomány és számos más tudomány területén dolgozó fiatal előadásait fogadta be. Az így megvalósult kétnapos konferencia közel negyven hallgatónak biztosított lehetőséget, hogy bemutassa saját kutatását, eredményeit, és arra szakmailag tartalmas és építő visszajelzést kapjon mind a felkért szekcióvezetőktől, mind pedig a hallgatóságtól. A konferencia teret adott az előadás után felmerülő kérdések megválaszolására, gondolatébresztő beszélgetések kialakulására – melyek sok esetben a szekciók közötti kávészünetekben is folytatódtak.

Az konferencia a Találkozások című konferenciakötet bemutatójával kezdődött. A két nap sokszínű és széles perspektívát felölelő programsorozatáról árulkodnak a szekciók nevei is; a konferencia során Paradigma és átírás; Színház, film, képregény; Medialitás és irodalom; A nyelvtudomány alkalmazási lehetőségei; Modern perspektívák; Klasszikus magyar irodalom; Módszer és elmélet nevet viselő blokkokban adhatták elő a munkájukat a konferencia résztvevői. A két nap programját plenáris előadások is színesítették, melyek során neves kutatók mutatták be a munkásságukat. A plenárisok nem csupán a konferencia résztvevőit, hanem a Collegium lakóit is vonzotta, az előadások során nagyszámú érdeklődő közönség gyűlt össze. A pénteki napon Margócsy István Az irodalom társadalmi használata és kultikus szemlélete című, míg szombaton Prószéky Gábor A nyelvtechnológia mai kihívásai című előadásával gazdagodhattak az érdeklődők. A következőkben a második nap plenárisának fő gondolatait mutatom be.

IMG_0436

Prószéky Gábor – az MTA doktora, egyetemi oktató –  a nyelvtechnológia aktuális kihívásairól, a jelenleg folyó kutatásairól, valamint a mesterséges intelligencia jelenleg elért szintjéről és fejlődési útvonalairól beszélt. A nyelvtechnológia fogalma az informatika korában született, jelentése tágan a számítógéppel, technológiával megoldható nyelvi problémák témakörét takarja. A kutató röviden elmagyarázta, melyek azok a kulcsfontosságú kérdések a nyelvfelismeréses témakörében, melyekben az emberi elme és a mesterséges rendszerek, a gépek másként működnek. Az emberek a mondatokból ismerik fel az adott szavak szófaját, míg a gépek mindezt a szavak szövegbeni szintaktikai helyzete alapján végzik el. A gép csupán a betáplált szabályok és szótár anyaga alapján tud működni, míg az emberi beszéd során a statisztikai szabályok feloldódhatnak, és ezen változások értelmezésére az emberi elme képes. A számítógépes rendszerekben a mondat fő alkotóelemei a funkciós szavak, például a névelők, a különböző ragok, azonban a rag előtt megjelenő szó bármi, akár nem magyar eredetű szó is lehet, mely ragozva nyelvtanilag helyes szerkezetként jelenhet meg a rendszerekben. Erre remek példa Petőfi Sándor Deákpályám című versének részlete, melyben a latin eredetű szavak toldalékolása teszi érthetővé a művet:

Diligenter frequentáltam 
Iskoláim egykoron,
Secundába ponált mégis
Sok szamár professorom.

Látható, hogy léteznek olyan nehézségek, melyekkel a számítógépes rendszerek segítségével nem lehet megküzdeni. A gép nem ismeri a világot, a rendszer csupán egy „tudáskészletet” kap, amiben felismeri az előzetesen betáplált szavakat. A kutató szemléletes példán mutatta be a fenti állítását: a gép felismeri a tárgyas eseteket, a ’könyvet’, az ’lapot’ szó esetében gond nélkül alkalmazza az előzetesen betáplált szabályokat, azonban akkor, amikor tulajdonnév (Egri csillagok, Gárdonyi Géza) tárgyesetben lévő alakja kerül a szövegbe, akkor csakis a világ ismeretével és az ismereti viszonyok feltárásával válhat értelmessé a szöveg. Az emberek állandóan értelmezik a körülöttük lévő világot és valóságot, míg a rendszer csupán a szabályokat ismeri fel, de a kulturális közeg és a valóság változásai nem jelennek meg a rendszerben, azok értelmezésére nem képes a technológia. A kutató állítását megerősítve bemutatta az „Arany Toldija” és „Lavrentyij Berija” eseteket. Mind a két esetben a szószerkezet „ja” végződést kapott, azonban az egyének a világ ismerete által tudják, hogy az első eset egy birtokos szerkezetet, míg a második egy toldalék nélküli tulajdonnevet takar.

IMG_0349

A rendszerek, gépek – amennyiben képesek a kommunikációra –  csak a megszokott helyzetek és a nyelvtani szabályok szerint gyakran előforduló válaszokat képesek adni. A „Hol van Anna?” kérdésre – az általános nyelvtani szabályokat figyelembe véve – a válasz egy -ban/-ben ragos szó kellene, hogy legyen. Azonban a valóság teremthet más jellegű helyzeteket, amikor a válasz egy (ikes) ige lesz, vagy egy mondat, mint például: „Ma még nem láttam.” A gép szintén képtelen felismerni a metaforákat, átvitt értelemben használt szavakat. Míg a ‘király’ szó bírhat az ’uralkodó ember’ jelentéssel, addig kifejezhet egy érzelemteli felkiáltást is, melyet a gép – a valóság ismerete hiányában – már nem képes értelmezni.

A kutató ezt követően az automatizált szótárak alkalmazási hátrányairól beszélt. A szótárakban az „ad” szó után általában materiális jellegű szavak szerepelnek. Azonban a kutatásokból kiderül, hogy az ‘ad’ igét a legtöbb esetben nem materiális javak átadását leíró szövegkörnyezetben használják. Az emberek többsége például a ‘lehetőség’ szót és más, nem materiális fogalmakat társít a szóval. A szótárak új generációja képes kell, hogy legyen arra, hogy akár az interneten és bescannelt szövegben rákeressen az ‘ad’ szó használatára és előfordulási gyakoriságára, és így megmutassa az egyéb, nem materiális tulajdonságú fogalmakkal való kapcsolatot is. A nyelvtechnológia fejlődése ezáltal képes lenne mélyebb, a valóságot jobban leíró ismereteket is megjeleníteni, átadni.

A nyelvtechnológia úttörő lépése az volna, hogyha ha a gépek nem csupán a szavakat, hanem a jelentéseket is ki tudnák nyerni a szövegből. Az IBM Watson nevű rendszere egy élő kvízjátékban mutatta be a fejlődés lehetséges útvonalát. Watson emberekkel játszott az élő kvízműsorban, ahol a rendszernek értelmeznie kellett az elhangzó kérdést, az arra adható potenciális válaszlehetőségeket kikeresnie az adatbázisából, valamint még azt is mérlegelni kellett, hogy a kapott válasz helyességében mennyire biztos. Ennek megfelelően döntötte el a gép, hogy válaszol-e az adott kérdésre vagy sem. Az újítás, hogy a Watson nevű rendszer nem csak tartalmi, hanem ok-okozati kapcsolatok keresésére is alkalmasnak bizonyult.

IMG_0438

A számítógép és a pszicholingvisztika összekapcsolása a külső világ felismerését és a prediktív előrejelzést tenné lehetővé. A jelentés kinyerése a technológia fejlődésével képes „kinyúlni” a korpuszból a világba. A gépek így az adott szót, amivel találkoznak, hasonló jelentésű szavakkal térben közel képeznék le, melynek jelentősége abban áll, hogy a rendszer a statisztikai előfordulás, a megjelenés gyakorisága mellett a szavak előfordulásának a helyét is felismerné. A technológiai fejlődés eredményeként a rendszerek klasztereket képeznének, melyek neurális hálós rendszerré állnának össze.

A Prószéky Gábor által bemutatott munka és a Magyarországon jelenleg folyó kutatások eddig ismeretlen, illetve globálisan is felfedezés alatt álló területeket fednek le. A plenáris előadás remekül kiegészítette a két nap programját, valamint beszélgetésindítóként szolgált a résztvevők számára. Köszönjük a szervezőknek a munkát, reméljük, hogy egy év múlva újra megrendezésre kerül ez a színvonalas konferencia!

A fotókért köszönet a konferencia szervezőinek!

Forrás: Arcanum; Facebook