Publikációgyűjtemény tudásbázisának építése természetes nyelven
Hornyák Zsuzsanna Éva
<>
Budapesti Műszaki és Gazdaságtudományi Egyetem
Mészáros Tamás
<>
Budapesti Műszaki és Gazdaságtudományi Egyetem
A digitálisan elérhető publikációk közötti keresés során a kulcsszó alapú lekérdezések csupán felületes, nem minden esetben megfelelő relevanciájú eredményekkel szolgálnak. A dokumentumok tartalmára irányulú, intelligens keresésekhez a gépek által feldolgozható, részletesebb szemantikus leírásra van szükség. A szemantikus web technológiái erre a feladatra alkalmasak, ám még a publikáció gyűjtemények szerkesztői között sem széles körben elterjedtek.
Kutatásaink során egy olyan szoftver fejlesztésén dolgozunk, amelynek segítségével publikációk szemantikus reprezentációja hozható létre a hétköznapi felhasználók számára is kézenfekvő módon. A program segítségével megadhatóak egy adott cikk fontosabb állításai természetes nyelven, létrehozva egy úgynevezett szemantikus absztraktot.
Megjelenés szempontjából a szemantikus kivonat megegyezik a hagyományosan elkészülő kivonatokkal, azonban szövege egy kontrollált nyelvtanon alapul, amelynek segítségével a természetes nyelvű mondatok formális logikai reprezentációra fordíthatóak le. Ezen nyelvtanok dinamikusak, futási időben bővíthetőek, továbbá mondatstruktúrák mellett lexikai szabályok meghatározását is lehetővé teszik. A tárgyterületi tudás egységes leírása érdekében a nyelvtanon belül lehetséges ontológiákra hivatkozni, amelyek segítségével a nyelvi elemzés során egyértelműen azonosított fogalmak nyerhetőek ki a szövegből. A kontrollált nyelvű állítások gördülékeny elkészítését egy prediktív szövegszerkesztő felület teszi lehetővé megoldásunkban.
A programunk célja, hogy kutatók, illetve publikációs gyűjtemények szerkesztői számára egy általuk könnyen kezelhető eszközt adjunk a publikációk fontosabb információinak szemantikus leírására. Az így létrejövő formális leírások adatbázisán már intelligens, logikai kapcsolatok és állítások szerinti keresés válik elérhetővé a felhasználók számára.
Előadásunk során gyakorlati példákon mutatjuk be a Zotero publikációgyűjtő és -rendező szoftverbe integrált megoldásunkat.