Ungváry Rudolf
Az OSZK-tezaurusz és a közmûvelõdési könyvtárak Köztaurusza. Történet és fenntartás (vázlat)
Az OSZK és a közmûvelõdési könyvtárak átfogó tezauruszának gondolata már a nyolcvanas években fölvetõdött. Elkészülte 2000 végén több körülmény egybeesésének köszönhetõ:
az elmúlt évtizedekben több mint 50 magyarországi tezaurusz készült már el és ezek egy része gépi adathordozón is hozzáférhetõ;
rendelkezésre állt egy felhasználóbarát tezaurusz szerkesztõ program;
néhány közmûvelõdési könyvtár segítséget nyújtott az összegyûjtött lexikai állomány szerkesztésében és a tezaurusz használatát támogató kézikönyvek véglegesítésében.
ETO és tezaurusz
Az analítikus posztkoordinált indexelésre használt információkeresõ nyelvek nem teszik szükségtelenné a generalizáló prekoordinált osztályozásra használt osztályozási rendszereket. Az OSZK-tezarurusz/Köztaurusz nem helyettesítiheti az ETO-t.
A tezaurusz bevezetésével tehát nemcsak felesleges, de hátrányos volna megszüntetni az ETO használatát. Amit az egyik eszközzel el lehet érni, azt a másikkal nem és fordítva.
ETO ÉS TEZAURUSZ
Generalizáló, szintetikus, csoportosító feltárás
Eredménye:
osztályokba sorolás osztályozási rendszer szerint
Individualizáló, analitikus, indexelõ feltárás
Eredménye:
tartalmi leírás természetes nyelv szerint
Együtt eredményezik az optimális kereshetõséget
A tezaurusz és a tárgyszórendszer között valójában semmiféle lényeges különbség nincsen. (Tárgyszórendszeren itt természetesen nem a hagyományos Cutter-féle összetett tárgyszavas rendszereket értjük a maguk fõ-, al- és melléktárgyszavas szerkezetükkel, mert ezek valójában az ETO-hoz hasonló hierarchikus, prekoordinált használatot feltételezõ osztályozási rendszerek.)
A mai értelemben vett egyszerû tárgyszavas információkeresõ nyelvek legfeljabb abban különböznek a tezauruszoktól, hogy egyszserûbb a relációszerezetük, mivel elsõsorban csak lásd utalásokat alkalmaznak, kiegészítve viszonylag kevés lásd még kapcsolattal.
TÁRGYSZÓRENDSZER ÉS TEZAURUSZ
Csak a részletesebben megjelenített összefüggések dolgában különböznek.
Tárgyszórendszerben: lásd, lásd még
Tezauruszban: L (=lásd) / H (=helyett);
F (=általánosabb) / A (=speciálisabb)
T (=átfogóbb, egész) / P (=része, eleme)
R (=okozata, célja) / E (=oka, kiindulása)
X (=egyéb összefüggés)
M: Magyarázata, értelmezése
H: Használatára vonatkozó megjegyzés
A szótárak strukturáltságának különbözõ fokozatai vannak. Az egyszerû kulcsszójegyzék nem tartalmaz kapcsolatokat.
Kedélyállapot
KEDVEZMÉNY
Keeling-szigetek
KEGYELEM
KEGYHELY
KEGYKÉP
KEGYTÁRGY
Kéjelgés
KELET-ÁZSIA
KELET-EURÓPA
KELET-KUTATÁS
KELET-MAGYARORSZÁG
KELET-NYUGATI KERESKEDELEM
KELET-TIMOR
KELLÉKTERV
KELTA IRODALOM
KELTA NYELV
KELTÁK
KELTIKA
KÉMELHÁRÍTÁS
KÉMIA
Kémiai megnevezés
Kémkedés
KEMPING
Kempingezés
KENYA
KENYÉRCÍMKE
KÉNYSZERMUNKA
KÉNYSZERNEURÓZIS
Kép
KÉPERNYÕ
KÉPES LEVELEZÕLAP
KÉPES MAGAZIN
KÉPES SZÓTÁR
KÉPESKÖNYV
Képeslap
KÉPESSÉG
KÉPESSÉGVIZSGÁLAT
KÉPFELDOLGOZÁS
KÉPI DOKUMENTUM
Képi látás
KÉPLEMEZ
KÉPLETGYÛJTEMÉNY
KÉPREGÉNY
KÉPSZALAG
KÉPSZERÛ ÁBRÁZOLÁSÚ TÉRKÉP
KÉPTÁR
KÉPVERS
Képviselet
Képviselõház
Képzelet
KÉPZELETVILÁG
Képzelõerõ
Képzés
KÉPZÉSI TÁJÉKOZTATÓ
Az egyszerû tárgyszójegyzék legfeljebb néhány lásd kapcsolattal rendelkezik.
Kedélyállapot
L Lelkiállapot
KEDVEZMÉNY
Keeling-szigetek
L Kókusz-szigetek
KEGYELEM
KEGYHELY
KEGYKÉP
KEGYTÁRGY
Kéjelgés
LV Nemi aktus
Tiltott kéjelgés
KELET-ÁZSIA
KELET-EURÓPA
KELET-KUTATÁS
KELET-MAGYARORSZÁG
KELET-NYUGATI KERESKEDELEM
KELET-TIMOR
KELLÉKTERV
KELTA IRODALOM
KELTA NYELV
KELTÁK
KELTIKA
KÉMELHÁRÍTÁS
KÉMIA
Kémiai megnevezés
L Nevezéktan
Kémkedés
L Hírszerzés
KEMPING
Kempingezés
LV Kemping
Táborozás
Turista idegenforgalom
KENYA
KENYÉRCÍMKE
KÉNYSZERMUNKA
KÉNYSZERNEURÓZIS
Kép
KÉPERNYÕ
KÉPES LEVELEZÕLAP
KÉPES MAGAZIN
KÉPES SZÓTÁR
A szabványos tezaurusz gazdagon kimunkált kapcsolatrendszert tartalmaz.
Kedélyállapot
L Lelkiállapot
KEDVEZMÉNY
X Jegy
Keeling-szigetek
L Kókusz-szigetek
KEGYELEM
M: Büntetés elengedése vagy enyhítése
H: A bûnbocsátó isteni szeretet esetén a "gyónás" használandó
E Bírósági ítélet
Büntetés
X Amnesztia
Jogi rehabilitáció
= Gyónás
Szeretet
KEGYHELY
M: Csodásnak vélt esemény színhelyeként nagy tiszteletben tartott hely(ség)
H Búcsújáróhely
F Kultikus hely
X Búcsú
KEGYKÉP
F Ereklye
Kegytárgy
Szentkép
E Ikon
KEGYTÁRGY
A Kegykép
Rózsafüzér
X Egyházi épület
Egyházi hivatal
Ereklye
Templom
Kéjelgés
LV Nemi aktus
Tiltott kéjelgés
KELET-ÁZSIA
T Ázsia
P Délkelet-ázsia
KELET-EURÓPA
T Európa
P Délkelet-európa
X Nyugat-európa
KELET-KUTATÁS
H Orientalisztika
F Területkutatás
X Armenisztika
Japanisztika
Sinológia
Távol-kelet
KELET-MAGYARORSZÁG
T Magyarország
P Északkelet-magyarország
Az OSZK-tezaurusz/Köztaurusz készítésekor számos meglévõ magyarországi tezaurusz szókincsét használtuk fel, és teljes egészében támaszkodtunk a Nemzeti Könyvtár már elkészült tezauruszaira.
AZ OSZK TEZAURUSZ KELETKEZÉSE
NPA tezaurusz Oktatási tezaurusz Videotezaurusz Doktaurusz
Államigazgatási OMIKK tezaurusz
Formatervezési Taxaurus
Geohistaurusz
OSZK TEZAURUSZ 1.0 KÖZTAURUSZ 1.0
1. Társadalomtudományi rész 1. Társadalomtudományi rész
2. Természettudományi rész 2. Természettudományi rész
3. Taxaurusz 3. Taxaurusz
4. Geotaurusz és geohistaurusz 4. Geotaurusz és geohistaurusz
A tezauruszu nyitott rendszer, soha sincs végérvényesen készen. Könnyen módosíthatók, az állandó változtatások nem járnak azzal, hogy szerkezete szétesik.
A tezaurusz kialakítását a RELEX szerkesztõprogrammal végeztük. A segítségével a tezauruszállomány exportja és importja is megvalósítható, és az állomány a HUNMARC/USMARC adatcsereformátumban is rendelkezhésre áll. Ezáltal bármely, a fenti formátumok fogadására fölkészült könyvtár átveheti az állományt.
Példa a RELEX szerkesztõi ablakára:
Példa tezauruszcikk HUNMARC/USMARC formátumára:
150 ## $aÁllamigazgatás |
680 ## $aAz államhatalom felsõfokú rendelkezõ, végrehajtó, szervezõ, irányító tevékenysége |
687 ## $aAz igazgatás és Államigazgatás összetételek egy része a Közigazgatás- kezdetû lexikai egységeknél található |
667 ## $a[példánkban nincs értéke] |
084 ## $aUMLEX |
084 ## $aKözigLex |
084 ## $a084 |
084 ## $2OSZK Szakcsoportos rendszer |
084 ## $aT |
084 ## $2OSZK Kategóriarendszer |
450 ## $a[példánkban nem lehet értéke, mert a vezérszó deszkriptor] |
550 ## $ws$a[példánkban nem lehet értéke, mert a vezérszó deszkriptor] |
550 ## $wt$a[példánkban nincs értéke] |
550 ## $wu$a[példánkban nem lehet értéke, mert a vezérszó deszkriptor] |
550 ## $wv$aIgazgatás |
550 ## $wg$aIrányító tevékenység |
550 ## $wh$aFelügyelet |
550 ## $wh$aHadügy |
550 ## $wh$aKözigazgatás |
550 ## $wh$aKülügy |
550 ## $wh$aRendészet |
550 ## $wj$aÁllamjog |
550 ## $wj$aCivilizáció |
550 ## $wk$aÜgyvitel |
550 ## $wp$aKözjó |
550 ## $wr$aHatóság |
550 ## $aÁllamigazgatási eljárás |
A karbantartás
The thesaurus is a familiary product, fogalmazott Karen Spark Jones néhány évtizeddel ezelõtt. Más szóval tezauruszokat mindenki ismer, ennél fogva csinálhat is. Magyarországon eddig több mint ötven tezaurusz készült éppen ezért. Mindenki abból indult ki, hogy elég egy tezauruszt elkészíteni. Az eredmény siralmas. Ma alig fél tucat tezaurusz maradt lábon a több mind ötvenbõl.
Ennek oka nagyon egyszerû. Nem elég a tezauruszokat ismerni, még csak az sem elég, ha értünk hozzájuk. Szeretni is kell õket. Ami annyit jelent, hogy meg kell szervezni a fönntartásukat.
A tartalmi feltárás során ugyanis a tezaurusz szókincse változik, szükségképpen változik a lexikai egységek között bonyolult szemantikai szerkezet. Odafigyelés, átgondolt karbantartás nélkül még a legjobb tezaurusz is elõbb-utóbb tönkremegy.
Egy tezaurusz soha sincs befejezve, azt mindig bõvíteni és módosítani kell, és az új, módosított vagy törölt lexikai egységeknek ezernyi következménye van a relációhálózatban. Ezeket alaposan végig kell gondolni, mert különben a tezaurusz elõbb-utóbb szétesik. Ha nem akad az adott intézményben olyan ember, aki mindezt a személyes (vagy munkaköri) ügyének tekinti (netán élvezetet talál benne), ha nem állítanak fel legalább egy-két emberbõl álló szerkesztõséget a gondozására, akkor az egy idõ után használhatatlanná válik.
De még a sikeresen megõrzött tezauruszok sorsa is ahhoz az intézményhez kötõdik, melyben használják. Ha az intézmény megszûnik, alig fordul elõ, hogy tezauruszát másutt átvennék, mert a tezaurusz a gyûjtõkörhöz kötõdik. Amikor két ugyanolyan tárgykörû tezauruszt két intézményben használnak, a kettõ akkor sem marad azonos, ha eredetileg nem különböztek egymástól. Olyan ez, mint a nyelv: kicsit mindenki másképp beszéli.
A hazai szakmai köztudatba még alig egy-két tezaurusz épült be, és azok is külföldiek. A mûfaj folyton ismétlõdõ fölfedezése a néhány nemzetközileg ismert információkeresõ tezauruszhoz kötõdik. A kevésbé ismert tezauruszok száma ma már tízezres nagyságrendû, és nyilvántartásukra külön intézmények szakosodtak [5]. Ezeknek a nyelvileg, szükségképpen gondolatilag strukturált, rendkívül sok információt rejtõ szótáraknak fejlett, erõsen strukturált szakmaiszellemi infrastruktúrára van szükségük ahhoz, hogy megmaradjanak. Nemegyszer elõfordul, hogy az évek óta használt tezauruszt az új munkatársak félredobják, jobb esetben kiherélik, mert túl bonyolult, és attól kezdve csak kapcsolatok nélküli, primitív szójegyzéket használnak az indexelésre.
Magyarországon a dokumentációs és informatikai szakmán belül még az sem köztudott, hogy mi a különbség a fogalom és annak megnevezése között. Van, aki azt hiszi, a tezauruszok fogalomtárak. Vagy hogy egyáltalán lehetséges fogalomtárakat készíteni. Holott a fogalmak tára kizárólag a tudat. Amit pedig csinálni lehet, azok a szótárak. Ezek egyik fajtája a szabványosított nyelvek szótára, ennek meg egyik fajtája az információkeresõ nyelvek szótára, ennek meg egyik fajtája a deszkriptoros információkeresõ nyelvek szótára. Ez utóbbit hívják tezaurusznak.
Mindezen felismerésekbõl kiinidulva szerveztük meg az OSZK-tezaurusz/Köztauruszt használó könyvtárakkal az együttmûködõ karbantartást (cooperative maintenance). Az angolszász nyelvterületen már bevált módszer szerint tezauruszt közösen használó közmûvelõdési könyvtárak és a Nemzeti Könyvtár közös karbantartó felületen (felhasználói grafikus interfészen) keresztül tart egymással kapcsolatot, javasol módosításokat, és ezeket egymást felváltva maguk a résztvevõk vezetik be a tezauruszba, folyamatosan tájékoztatva a résztvevõket is meg a külvilágot is a tezaurusz változásairól.
A tezaurusz karbantartását a RELEX tezauruszkezelõ programmal véglik, mellyel az együttmûködõ karbantartásban résztvevõ könyvtárak mindegyik rendelkezik (lásd: Ungváry Rudolf: Tezaruuszkezelõ programok és a RELEX. In: Tudományos és Mûszaki Tájékoztatás, 48. évf. 2001. 1. sz. p. 3-15.)
Az alábbiakban a karbantartó felület néhány elemét ismertetjük.
KEZDÕLAP
A kezdõlapon mindig meg kell adni a javasolt változtatás típusát, mely mindvégig minõsíteni fogja a változtatástételt.
Változtatásokat csak az együttmûködésben résztvevõ könyvtárak kérhetnek. Válaszokat csak az együttmûködésre kijelölt karbantartók adhatnak. A kéréseket és válaszokat azonban bárki megnézheti, és a változtatások kumulált állománya is bárkinek rendelkezésére áll. Ennek célja az, hogy a karbantartás megismerése révén mások is kedvet kapjanak az OSZK-tezaurusz/Köztaurusz alkalmazására.
Példaképpen bemutatjuk a 16. kérdésre adott választ.
[a lap folytatása]
Külön lapon tekinthetõk át az addigi kérések és válaszok.
Az utolsó kérés A rá adott válasz
A listáról a kiválasztott kérés megjeleníthetõ.
Ugyancsak megjeleníthetõ a válasz is.