Re: [KATALIST] Re: [KATALIST] Digitalizálás [adalek a normako veteshez]

Pinter Laszlo lapinter at WITCH.PMMF.HU
2005. Jan. 6., Cs, 14:06:54 CET


Igaza van Drótos Lászlónak, én egyoldalú voltam. Csakis irodalmi muvek jártak a fejemben, és csakis olyanok, amelyeket nem képként szkenneltek(tem), hanem szövegként, ilyen-olyan szövegfelismero szoftverrel.
Igaza van abban is Drótos Lászlónak, hogy "elkerülhetetlen a hibák keletkezése és az egyéb jellegû
információvesztés a digitalizálás során", azonban az mondat folytatása már elgondolkodtató: "ezek korrigálását egy ésszeru határig érdemes végezni, amíg a költség/haszon arány ezt indokolja." Kicsit nehezen tudnám eltalálni, hol az "észszeru határ", és nehezményezem, hogy ide is beúszik a "költség/haszon arány". Mert ezt is ki dönti el? Ha pl. egy "gazdasági szakember", akkor valószínu úgy is jó lesz a digitalizálás, ha csak minden harmadik szó olvasható... Csak olcsó legyen...
De nagyon jó, hogy errol is szó esett, én egyoldalúan félrevittem a dolgot, tényleg. Bocsánat.

Pintér L.


Pintér László
PTE Pollack Mihály Muszaki Kar Könyvtára
7624 Pécs, Boszorkány u. 2.
Tel.: 72/503-650/3904; Fax: 72/503-650/3932
E-mail: lapinter at witch.pmmf.hu

----- Original Message ----- 
From: "Drotos Laszlo" <mekdl at iif.hu>
To: <KATALIST at LISTSERV.IIF.HU>
Sent: Thursday, January 06, 2005 1:42 PM
Subject: Re: [KATALIST] Re: [KATALIST] Digitalizálás [adalek a normako veteshez]


At 12:49 2005.01.06._, Pinter Laszlo wrote:


>Utoljára hagytam, de egyáltalán nem utolsó kérdés a filológiai: 
>errõl már volt vita több helyen, nem melegíteném föl. DE a 
>szövegromlás és a digitalizálás - sajnos - édestestvérek. 


Ezt a közkeletû állítást azért érdemes árnyalni:

A digitalizált szöveg lehet rosszabb, lehet jobb és lehet ugyanolyan, 
mint az eredeti. A képként szkennelt könyvek és újságok esetében 
például nincs szövegromlás. (Szerintem a Google is így fogja 
feltenni a sok millió könyvet az Internetre, és lesz hozzá egy
teljes szövegû keresõ, amivel a kilencvenvalahány százalék
pontossággal felismertetett nyers OCR-szövegben keresni lehet.)

A papíralapú magyar könyvek és újságok az utóbbi években hemzsgenek
a hibáktól, ahogy ezt gondolom mindenki tapasztalja. Ezeknek egy 
- a nyilvánvaló - részét most már mi is kijavítjuk a MEK-be kerülés 
elõtt, ahogy a DIA is teszi, így a digitális verzió többnyire jobb, 
mint a nyomtatott.

Másrészt elkerülhetlen a hibák keletkezése és az egyéb jellegû
információvesztés a digitalizálás során, ezek korrigálását egy
ésszerû határig érdemes végezni, amíg a költség/haszon arány
ezt indokolja. Más a mérce egy klasszikus irodalmi szövegnél és
például egy kertészkedéssel foglalkozó ismertetterjesztõ könyvnél,
vagy egy 19. századi napilapnál. Nincs hibátlan könyv és hibátlan
digitális könyvet sem lehet csinálni, de ez nem is cél. Ahol fontos,
ott úgyis létrejönnek alternatív digitális kiadások, különbözõ
minõségben. Legfeljebb a digitális dokumentumok minõségi címkézését
lehetne bevezetni, hogy orientálja a felhasználókat. Különbözõ
kategóriákat és jelzéseket lehetne alkalmazni, attól függõen,
hogy az adott digitális dokumentum milyen szintû ellenõrzésen 
(korrektúrán, lektoráláson, szerkesztésen, tudományos szintû 
szöveggondozáson stb.) esett át. Egy ilyen rendszer kialakítása
és elterjesztése az Akadémia elektronikus szövegekkel foglalkozó 
textológiai bizottságának lenne feladata. (Szerintem. ;-))

Drótos László
MEK-könyvtáros



További információk a(z) Katalist levelezőlistáról