Google-di gitalizálás

Moldovan Istvan moldovan at OSZK.HU
2005. Jan. 9., V, 11:15:43 CET


> A Google-féle "digitalizáljunk minden könyvet" kezdeményezés szerintem
> teljesen utopisztikus.
> Sem technológiailag, sem szerzői jogilag, sem egyéb okokból nem
> kivitelezhető belátható időn belül.

Drótos Lacihoz csatlakozva, hadd vitatkozzak kicsit én
is András álláspontjával. Nem a vita kedvéért, hanem
azért, mert szerintem sem szabad abban a tévhitben
ringatni magunakt és bízva a biztos jövőben, hogy ez
az akció "utópisztikus" azaz kivitelezhetetlen.

András bizony a Neumann, a DIA digitalizálási technológiája
alapján gondolja, mondja amit mond. Mi viszont éppen
azt próbáltuk több fórumon is (pl. Minerva műhelykonferencia)
képviselni, hogy többféle alternatívája van a digitalizálásnak.
A DIA digitalizálása az irodalmi szakértőkkel és a szöveg
gondozásával lényegében egy önálló elektronikus kiadás,
a rendelkezésre álló legmunkaigényesebb (ergo legköltségesebb!)
technológia (SGML) felhasználásával.

Még a MEK is egy meglehetősen munka- és időigényes
folyamat keretében ellenőrzi, javítja, formázza
egységesre a különböző beérkezett dokumentumokat.
A DIA állománya közel 600, a MEK-é 2300, a 30 éves
Gutenberg projektté (amely jóval kevésbé munkaigényesen
dolgozik) 6-7000 kötet!

Ezek az elektronikus változatok biztosítják az eredeti
műben lévő információk, szolgáltatások teljes körű
elérhetőségét, talán a maximum ebben a Hungarológiai
Alapkönyvtár XML alapon készült művei, amelyekben
a különböző mutatók is működnek.

DE ezzel a technológiával nem lehet gyorsan, nagy
tömegben digitalizálni, márpedig a könyvekre, tartalmas
információra nagy igény van a Net-en, ha máshol nem
ezt a MEK felhasználói statisztikáiban látjuk.

Tehát a Google nem fog "pepecselni" kritikai kiadásokkal,
korrektúrával, mutatórendszerekkel, hanem olyan technológiát
használ, amellyel gyorsan, rövid idő alatt nagy tömeget
lehet kielégítő minőségben digitalizálni. Az eredmény
nem olyan "jó", minőség mint a fenti technológiákkal,
de gyors és nagy tömegű!

Megjegyzem ezt a féle technológiát alkalmaztuk
az OSZK-ban egy 24. óra pályázat kapcsán már az
Országos Hírlap digitalizálásánál.
   http://epa.oszk.hu/orszagos_hirlap
A kivitelezés részletes ismertetője:
   http://epa.oszk.hu/00200/00242/ismerteto.html

Itt még végeztünk durva szövegjavítást, időigényesebb
is volt a munka, mint anélkül. A FineReader hihetetlen
jó minőségben ismerte fel a sokszor nehezen olvasható
szöveget, az egyes PDF-ek, de az egész gyűjtemény is
már teljes szövegesen kereshető.

> Mi lehet tehát az üdvözítő megoldás, amit a Google megtehet?
> Az, amit jelenleg is tesz, hogy (a maga sajátos módján) katalogizálja az
> Interneten elérhető (általa, vagy más által digitalizált) elektronikus
> dokumentumokat.

Nem szükséges, hiszen a forrás-dokumentumokat a könyvtárak
már katalogizálták, az alap metaadatok rendelkezésre állnak.

A Google bizonyára nem a Corvinákkal és a több száz éves
kéziratokkal fog foglalkozni, hanem - jogvédettséget emlegetnek -
az elmúlt 50-70 év könyvtermésével. Ezek pedig többpéldányosak,
végiglapoztathatóak megfelelő állományvédelem mellett
és bizony a fenti technológiával tömegszerűen nagy tömeg
digitalizáltatható.

> Tószegi Zsuzsa - akitől sokat tanultam - egyszer azt mondta:
> - Most egy digitális világban élünk, ahol a digitális az érték,

A digitális önmagában nem érték. De amennyiben az Interneten
elérhetővé tesszük nagy tömegek számára a tudomány és a kulturális
örökségünk digitális változatát, ez már érték.

Erre láthatóan nagy erők mozdulnak a nagy világban,
szerintem nem szabad megnyugodnunk, hogy ez utópikus
és nem szabad lemaradnunk. Ti. a mi régi MEK-es
gondolatunkat hoznám végezetül; a Google digitalizálni
fogja a nagy amerikai egyetemek könyvállományát,
amely alapvetően angol nyelvű és az angolszász
kultúrát jelenti. De ne várjuk azt a szivességet tőle,
hogy helyettünk digitalizálni fogja a magyar kultúra
és tudomány értékeit is.

üdv

Moldován István
MEK



További információk a(z) Katalist levelezőlistáról