google projekt

Moldovan Istvan moldovan at oszk.hu
2005. Feb. 23., Sze, 09:06:36 CET


> Mit mond most az OSZK? És Moldován István?

Az OSZK nevében nem válaszolok, csak a sajátoméban,
ha már László, virtuális jó ismerősként kérdezett :-)

A francia tiltakozás egyrészt meglehetősen furcsa.
A francia nemzeti könyvtár Gallica projektjében
min. 50.000 nyomtatott kötet található digitális formában,
oldalanként letölthető PDF-ben (meglehetősen nehézkesen
kezelhetően :-( A tájékozódást kétségtelenül kissé nehezíti,
hogy a honlap csak francia nyelven elérhető ;-)
   http://gallica.bnf.fr

Másrészt azt mondom, ez a reakció várható volt.
Várható - remélhetőleg - folytatás is, külföldön, a franciáknál
legalábbis bizonyára. A Google féle projekt bizonyára
jelentősen az angolszáz irodalom jelenlétét erősíti,
bár nem valószínű, hogy sokat válogatnának, igy az
amerikai könyvtárak idegennyelvű (esetleg magyar!)
könyvei is felkerülhetnek.

Viszont az angolszáz túlsúly egészséges reakciója
szerintem, ha a más nyelvi kultúrák próbálják ellentételezni
ezt. Nagyon valószínű, hogy már tárgyalnak a franciák
kormányszinten, hogy milyen támogatással bővítsék
a Gallicát, hogyan ellensúlyozzák a Google terveit.

A kérdés, hogy vajon az IHM-ben, NKÖM-ben tárgyalnak-e
már hány millió Ft-ot adjanak az OSZK-nak a Hungarológiai
Alapkönyvtár további digitalizálására, esetleg a hazai
könyvtári szférának további jelentős digitalizációs
projektekre ;-)

Márpedig nem ártana, ha ilyen nemzetközi környezetben a
magyar nyelvű anyagokkal is mindinkább bővíthetnénk a háló
tartalmát, DE ami szintén fontos lenne, angol, francia,
német, egyéb nyelvű anyagokkal, amelyek a magyar kulturáról,
tudományról szólnak. Sajnos ebből még kevesebbet tudunk
felmutatni, mint magyar nyelvű forrásokból :-(

> A sok globalizációellenes és trösztellenes sirám helyett inkább azzal
> kellene foglalkozni, hogy 1. ők hogy csinálják (merthogy tanulni attól
> lehet, aki dolgozik), engem kifejezetten érdekelne a szkennelés
> automatizálása, a feldolgozás, a keresés. A képként bevitt szövegben
> való keresés megvalósíthatósága (egy MIT projektről volt erre utalás

A Google technikájáról itt lehet bővebben olvasni
   http://print.google.com/googleprint/library.html

Valami hasonló, amit itt az OSZK-ban az Országos Hírlap
digitalizálásával kiviteleztünk
   http://epa.oszk.hu/00200/00200/ohsite/

Drótos Laci említette, hogy az újdonság valamilyen lapozórobot,
amellyel gyorsan végiglapozzák a könyveket. A szkennelés után
az eljárás már ismerős, felismertetett kép, amely a szöveggel
együtt egy PDF-be kerül. Igy az egész teljes szöveggel is kereshető,
nem úgy mint a Gallicá-ban, ami az 1 oldal - 1 PDF file rendszerében
nagyon nehézkes. Ezzel a módszerrel meg lehet spórolni az időigényes
korrektúrát, elektronikus szerkesztést, esetleg tag-elést. Vannak
hátrányai, de nagy tömeget lehet rövid időn belül digitalizálni, szolgáltatni.

> 2. Hogyan lehetne magyar anyaggal többet, jobban, hatékonyabban
> csinálni uazt.?

Jó kérdés. Először is koncepció kell. A Hungarológiai Alapkönyvtár
meglehetősen nagyléptékű, de lehet, hogy több ilyen kell, más
területen is (jelenleg ennek folytatására sincs semmilyen forrás).
Azután nagyon fontosak az egységesen alkalmazott metaadatok,
ennek elterjesztésére többek között az NDA is törekszik. Az ő
segítségükkel a digitalizált állományok közösen is kereshetővé válnak.

Végül de nem utolsósorban állami támogatás, pénz kell. De előtte
még fontosabb annak felismerése, hogy ez nem kidobott pénz, hanem
befektetés a jövőbe, megtérülés! Ha pénz volt is alkalmanként, mintha
ez a koncepciózus felismerés még hiányozna. De hátha olvassák a Google-ről
szóló híreket az IHM-be és a NKÖM-ben is, a vállalkozók meg nélkülünk
úgysem igen tudnak lépni, mert az állomány, könyvek, folyóiratok
nálunk vannak, a Google példája is ezt mutatja  ;-)

üdv

istván



További információk a(z) Digilist levelezőlistáról