[KATALIST] RE: Katalóguscédulából MAR C rekord
Moldovan Istvan
moldovan at mek.oszk.hu
2007. Nov. 17., Szo, 19:36:06 CET
Kedves Markó Tamás,
> A retro feldolgozás gyorsítása érdekében felmerült az ötlet, hogy a
> katalóguscédulákat szkenneljük be, OCR-rel alakítsuk szöveggé és ebből
> programmal MARC rekordokat állítsunk elő. Tud valaki róla, hogy ilyet
> sikerrel csináltak volna valahol?
Én az innsbrucki egyetemi könyvtár cédulakatalógusát tudom
ajánlani:
http://webapp.uibk.ac.at/alo_cat/startpage.jsp
Egy időben nyomoztam ezek után egy kicsit és számos
német, osztrák, svájci könyvtár digitalizálta igy
a régi, cédulakatalógusát.
A litván nemzeti könyvtár éppen a budapesti Open Society
segítségével dolgozik egy ilyen projekten
http://vaizdai.lnb.lt/about/structure_en.html
Ilyen katalógusa volt az Osztrák Nemzeti Könyvtárnak
is, de azóta konvertálták a rekordokat MARC-ba az ALEPH
rendszerükbe.
Egyszóval sokfelé találni olyan projekteket,
ahol a katalóguscédulákat képként szkennelik
be és első lépcsőben azokat teszik böngészhetővé.
Ha nem túl rosszak, kézirásosak, még egy durva
OCR felismerés is elvégezhető igy működik egy
teljes szövegű keresés. Az innsbrucki katalógusban
az olvasók maguk segíthetnek kijavítani sőt egyszerűen
struktúrálni a felismert szöveget.
Pesze ebből egy MARC rekord előállítása még jelentős
munka, de igy legalább a régi cédulakatalógusok is
elérhetővé tehetőek az interneten.
Király Péter kollégám, mint írta, pont ilyesfélével
kísérletezett az OSZK-ban 1999-ben, sajnos nem lett
folytatása.
Bocsánat, majd elfelejtettem. Egy jó hazai példát ismerek:
Gulyás Pál: Magyar írók élete és munkái. Cédulatár
http://gulyaspal.mtak.hu/
Üdvözlettel
Moldován István
További információk a(z) Katalist levelezőlistáról