A besorolási adatcsere-formátum bővülése

Ungváry Rudolf <>
Országos Széchényi Könyvtár


A legutóbbi két évtized fejleményei

A besorolási adatcsere-formátumnak [authority format] vagy más néven metaadat-formátumnak [metadata format] több mint fél évszázados múltja van. A MARC-típusú formátum 1968-as megszületése óta fokozatosan tökéletesedett, és más változatai is kialakultak (Unimarc). Ami a legfontosabb: adatelem-választéka jelentősen bővült is. Az eltelt évtizedek bővülései elsősorban nem a formátum tételfejében megjelenő ún. entitásadatait (a személyneveket, testületi és, rendezvényneveket és címeket) érintette. Ezek a bibliográfiai leírás és a kereshető tárolás legalapvetőbb, klasszikus adatai, melyek rövid távon nem változnak. A bővülés egyrészt a relációadatokat, különösen pedig a tulajdonságadatokat jellemzi.

A formátum relációadat-választéka kezdetben csak a kézi katalogizálásban használatos „lásd” és „lásd még” relációtípusból állt. A fejlődés ezen a téren kétirányú.

Egyrészt rögzíthetővé váltak a formátumban a múlt század 50-es éveitől kialakuló tezauruszokban használt, és a rájuk vonatkozó szabványokban rögzített paradigmatikus relációtípusok. A MARC-formátumban a relációtípusok számára az induláskor elégnek bizonyult, hogy a „lásd” relációtípus számára a 4XX-es, a „lásd még” relációtípus számára pedig az 5XX-es hívójeltartományt jelöljék ki. A paradigmatikus relációtípusokat azonban nem csak a nagyobb számosságuk jellemzi, hanem az is, hogy felhasználási területtől függően rendkívül változatosak is. A MARC-formátumban e két követelménynek viszonylag bonyolult módon, ún. vezérlőalmező alkalmazásával lehetett eleget tenni.

Másrészt a formátumban idővel az is lehetővé vált, hogy a relációkat a 2XX-es, illetve a 3XX-es hívójel-tartományban szöveges formában adják meg. A szemanikai web világában ez a lehetőség idővel fel fog értékelődni.

A legjelentősebb bővülés a tulajdonságadatok terén játszódott le. Az entitásadatokkal szemben, melyek a bibliográfiai adatokra vonatkoznak, és ezért másodlagos vagy metaadatok, a tulajdonságadatok a tételfejben rögzített entitásadatokra vonatkoznak, és ezért metaadatok metaadatai, azaz harmadlagos adatok. Ilyen meta-metaadatok a 6XX-es hívójeltartományban rögzíthető megjegyzésadatok és a 0XX-es hívójeltartományban rögzíthető ún. információs adatok.

A megjegyzések ma már nem korlátozódnak a tételfejre vonatkozó név és szaktárgyszó tartalmára, meghatározására, hanem lehetőség van a használatra, a változásra, a forrásokra, a történeti kérdések megadására publikus, megjegyzések formájában, továbbá belső, technológiai jellegű, nem publikus megjegyzések közlésére is. Választékuk bővítésére a 6XX-es hívójeltartomány bőséges lehetőséget biztosít. Ezáltal a nem könyvtári gyűjteményi rendszerek (levél- és irattárak, továbbá a múzeumi rendszerek) igényei is kielégíthetők.

Különösen jelentős a bővülés ama tulajdonságadatok terén, melyek nem szöveges, leíró, hanem azonosító adatok. Ma már lehetőség van például a következő azonosító adatok kezelésére:

besorolási adatok nemzetközi szervezet (pl. ISO, OCLC) által szabványosított, más mezőben nem rögzíthető azonosítója (pl. webes hálózati forrásazonosítók, mint a Virtual International Authority File [VIAF] azonosítója, vagy a „remek URI”(„cool URI”).;

földrajzi helyek koordinátái (ennek segítségével a könyvtári online katalógusok mutatójából kiindulva közvetlenül hozzáférhetők a web földrajzi keresőrendszerei);

a besorolási adatot egységesítő vagy hitelesítő intézmény (ennek különösen irat- és levéltári vonatkozásban van jelentősége);

a besorolási adattal (elsősorban a földrajzi helyekkel és szaktárgyszavakkal) összefüggő időadatok (például geológiai korszakok, politikai események időadatai);

személyek, testületek, művek, pontos születési, megalakulási, keletkezési stb. adatai, lakcíme, tevékenységi helye, családi jellemzői stb. (ezáltal részletes személyi nyilvántartás, névtér valósítható meg).

A besorolási MARC-formátum segítségével ma már akár levéltári dokumentumokhoz használt besorolási adatok is kezelhetők, melyre példát mutatunk be.