Plágiumkeresés különböző nyelvek között

Pataki Máté <>
MTA SZTAKI

A felsőoktatásban és a tudományos életben is egyre gyakrabban találkozunk szó szerint lemásolt, plagizált tartalommal. Ennek felkutatására számos megoldás született már, ezek közül magyar nyelven a SZTAKI Elosztott Rendszerek Osztálya által üzemeltetett KOPI Plágiumkereső a legismertebb (http://kopi.sztaki.hu/). Az internet és az idegennyelv-tudás elterjedése azonban a plágiumok egy új formájának térhódítását is magával hozta. A legtöbb diák ma már elég jól beszél legalább egy idegen nyelven – tipikusan angolul – ahhoz, hogy külföldi oldalakon és tartalmakban is megtalálja az adott témába vágó irodalmakat és képes legyen azt lefordítani. Ez elvárás is felé, hiszen ma már egy olyan diploma, amelyik nem tartalmaz utalást a külföldi irodalmakra, a legtöbb egyetemen, illetve szakon, nem fogadható el. Ez a nyelvtudás megteremti a lehetőséget arra is, hogy a diák az idegen nyelvű anyagok feldolgozása helyett azt egyszerűen csak lefordítsa, és az adott forrás megjelölése nélkül, saját gondolataként, saját munkájaként adja be. Ilyen esetekben az oktatók hiába keresnek rá a gyanús részekre, a webes keresők egy magyar mondat beírásakor nem képesek az annak megfelelő angol tartalmakat előhozni. Ezért éreztük úgy, hogy ideje továbblépni az egynyelvű keresőktől és egy egyéves kutatásba kezdtünk, hogy miként lehetne egy magyar szövegről megállapítani, hogy az a diák saját munkája-e, vagy csak egy fordítás. Ennek a kutatásnak az eredményeit fogjuk demonstrálni az előadáson.