Szemantikusan annotált dokumentumok létrehozása szövegfeldolgozó eszközök segítségével

Héder Mihály <>
MTA SZTAKI ITAK

Ebben az évtizedben a Web-en tárolt szöveges tartalom mennyisége hatalmasra duzzadt. A dokumentumok struktúrája azonban keveset változott, legalábbis a tárolt szemantikus információk tekintetében. A felhasználók által nap mint nap olvasott - vagy épp írt - tartalom többnyire csupán a szöveg és a formázásra vonatkozó jelölőnyelv(ek) keveréke.

A létező annotáló rendszerek felhasználói csoportja a tapasztalat szerint többnyire csak szakértőkből áll. Tagadhatatlanul hasznos lenne tehát egy olyan szemantikus annotáló eszköz kifejlesztése, amely a mindennapi, szemantikus technológiákban nem jártas felhasználókat célozza meg.

Az előadáson bemutatásra kerül, hogy az egyszerű szabály alapú elemzésektől kezdve az esemény- és információkeret-felismerésig milyen lehetőségek kínálkoznak a felhasználó támogatására a tartalom létrehozása közben. Ezek a háttérben dolgozó szövegbányászati eszközök a kinyert információ alapján egyszerű szöveges javaslatokat és kérdéseket fogalmazhatnak meg a felhasználó felé, majd a válasz függvényében annotációkkal láthatják el a szöveg kérdéses részleteit.

Áttekintésre kerülnek továbbá a különféle tartalmak szemantikus annotációinak kezelésével kapcsolatos legújabb eredményeket, elméleti megfontolásokat és korlátokat. Végül néhány alkalmazási lehetőség kerül bemutatásra, wiki oldalakon, blogokon, intézményi illetve könyvtári oldalakon.