Kulcsszavak a kulcsszavak?

Lengyelné dr. Molnár Tünde <>
Eszterházy Károly Főiskola

A kulcsszavak kivonatolásának elmélete és gyakorlata statisztikai és nyelvészeti eljárásokon nyugszik. A statisztikai módszerek a dokumentum strukturált reprezentációjára irányulnak,(1) a szignifikáns kifejezéseket pedig a szavak előfordulási gyakorisága és a hozzájuk rendelt pozitív vagy negatív súlyozás alapján állapítják meg.(2) Előadásomban bemutatásra kerülnek azok a statisztikai adatelemző módszerek, amelyek lehetővé teszik a szavak „átlagos viselkedésének” meghatározását, valamint a feltáró munkában jól hasznosítható hasonló tulajdonságokkal rendelkező szavak csoportosítási módszerei.
Korábbi kutatásaimban több felmérést is végeztem, hogy hogyan látják egy cikk lényegét az emberek, és különböző témájú cikkek esetén a leglényegesebb mondatok feltárására kértem a felmérésben résztvevőket. Jelenleg a kutatás kiterjesztésén dolgozom, és a cikkek kivonatolásán túl a kulcsszó meghatározások automatizálásához gyűjtök adatokat. Előadásomban ismeretem annak a 2014-es felmérésnek az eredményét, melyben kitöltők a cikkek lényegének kiemelésén túl a megjelölték a kulcsszavakat. Hogy választ kapjunk arra a kérdésre, kulcsszavak-e a kulcsszavak? a felmérés eredményét összevetem a szerzők által megjelölt kulcsszavakkal.

(1) PRIBE, Torsten – KOLTER, Jan – KISS, Christine: Semiautomatische Annotation von Textdokumenten mit semantischen Metadaten. In: Wirtschaftsinformatik 2005. Eeconomy, egovernment, esociety. Heidelberg, 2005., p. 1319.
(2) Wordsimth tools. Definition of Key-ness [elektronikus dokumentum]. [http://www.lexically.net/downloads/version4/html/keyness_definition.htm] [2014.01.22]