[KATALIST] RE: Katalóguscédulából MAR C rekord

Moldovan Istvan moldovan at mek.oszk.hu
2007. Nov. 17., Szo, 19:36:06 CET


Kedves Markó Tamás,

> A retro feldolgozás gyorsítása érdekében felmerült az ötlet, hogy a
> katalóguscédulákat szkenneljük be, OCR-rel alakítsuk szöveggé és ebből
> programmal MARC rekordokat állítsunk elő. Tud valaki róla, hogy ilyet
> sikerrel csináltak volna valahol?

Én az innsbrucki egyetemi könyvtár cédulakatalógusát tudom
ajánlani:

   http://webapp.uibk.ac.at/alo_cat/startpage.jsp

Egy időben nyomoztam ezek után egy kicsit és számos
német, osztrák, svájci könyvtár digitalizálta igy
a régi, cédulakatalógusát.

A litván nemzeti könyvtár éppen a budapesti Open Society
segítségével dolgozik egy ilyen projekten
  http://vaizdai.lnb.lt/about/structure_en.html

Ilyen katalógusa volt az Osztrák Nemzeti Könyvtárnak
is, de azóta konvertálták a rekordokat MARC-ba az ALEPH
rendszerükbe.

Egyszóval sokfelé találni olyan projekteket,
ahol a katalóguscédulákat képként szkennelik
be és első lépcsőben azokat teszik böngészhetővé.
Ha nem túl rosszak, kézirásosak, még egy durva
OCR felismerés is elvégezhető igy működik egy
teljes szövegű keresés. Az innsbrucki katalógusban
az olvasók maguk segíthetnek kijavítani sőt egyszerűen
struktúrálni a felismert szöveget.

Pesze ebből egy MARC rekord előállítása még jelentős
munka, de igy legalább a régi cédulakatalógusok is
elérhetővé tehetőek az interneten.

Király Péter kollégám, mint írta, pont ilyesfélével
kísérletezett az OSZK-ban 1999-ben, sajnos nem lett
folytatása.

Bocsánat, majd elfelejtettem. Egy jó hazai példát ismerek:

Gulyás Pál: Magyar írók élete és munkái. Cédulatár
  http://gulyaspal.mtak.hu/


Üdvözlettel

Moldován István




További információk a(z) Katalist levelezőlistáról