Publikációgyűjtemény tudásbázisának építése természetes nyelven

Hornyák Zsuzsanna Éva <>
Budapesti Műszaki és Gazdaságtudományi Egyetem

Mészáros Tamás <>
Budapesti Műszaki és Gazdaságtudományi Egyetem

A digitálisan elérhető publikációk közötti keresés során a kulcsszó alapú lekérdezések csupán felületes, nem minden esetben megfelelő relevanciájú eredményekkel szolgálnak. A dokumentumok tartalmára irányulú, intelligens keresésekhez a gépek által feldolgozható, részletesebb szemantikus leírásra van szükség. A szemantikus web technológiái erre a feladatra alkalmasak, ám még a publikáció gyűjtemények szerkesztői között sem széles körben elterjedtek.

Kutatásaink során egy olyan szoftver fejlesztésén dolgozunk, amelynek segítségével publikációk szemantikus reprezentációja hozható létre a hétköznapi felhasználók számára is kézenfekvő módon. A program segítségével megadhatóak egy adott cikk fontosabb állításai természetes nyelven, létrehozva egy úgynevezett szemantikus absztraktot.

Megjelenés szempontjából a szemantikus kivonat megegyezik a hagyományosan elkészülő kivonatokkal, azonban szövege egy kontrollált nyelvtanon alapul, amelynek segítségével a természetes nyelvű mondatok formális logikai reprezentációra fordíthatóak le. Ezen nyelvtanok dinamikusak, futási időben bővíthetőek, továbbá mondatstruktúrák mellett lexikai szabályok meghatározását is lehetővé teszik. A tárgyterületi tudás egységes leírása érdekében a nyelvtanon belül lehetséges ontológiákra hivatkozni, amelyek segítségével a nyelvi elemzés során egyértelműen azonosított fogalmak nyerhetőek ki a szövegből. A kontrollált nyelvű állítások gördülékeny elkészítését egy prediktív szövegszerkesztő felület teszi lehetővé megoldásunkban.

A programunk célja, hogy kutatók, illetve publikációs gyűjtemények szerkesztői számára egy általuk könnyen kezelhető eszközt adjunk a publikációk fontosabb információinak szemantikus leírására. Az így létrejövő formális leírások adatbázisán már intelligens, logikai kapcsolatok és állítások szerinti keresés válik elérhetővé a felhasználók számára.

Előadásunk során gyakorlati példákon mutatjuk be a Zotero publikációgyűjtő és -rendező szoftverbe integrált megoldásunkat.