[MEK-L] PDF gondok - zuros szoveg, tukornyomat - help
Moldován István
moldovan at oszk.hu
2019. Feb. 13., Sze, 16:17:08 CET
Kedves MEK barátok!
Rég nem írtunk, használtuk már ezt a listát, gondoltam
teszek egy próbát és hozzátok fordulok segítségért. Egy
nagy adag PDF könyv kapcsán olyan problémába ütköztünk,
amellyel még nemigen találkoztunk és segítségeteket kérném
a legjobb megoldás érdekében:
Egy régi jó partnerünk, a székelyudvarhelyi Erdélyi Gondolat
kiadótól karácsony előtt is, majd pár hete számos nyomtatásban
megjelent könyvük PDF változatát kaptuk meg.
A korábbi könyveik látszatra szép, rendes PDF-ek, azonban azt
fedeztük fel, hogy a karakteres PDF-ből kimásolt szöveg valami
zagyva karakterhalmaz, ergo nem másolható, indexelhető :-(
Valami ilyesmi
"577?6$1$8+???39*9?$*(:'?
?;6???<)**&3+?=3?1)???+?
A PDF adatlapja szerint a
PDF-et létrehozta: GNU Ghostscript 7.05
Alkalmazás: PScript5.dll Version 5.2
Lásd pl. http://mek.oszk.hu/19000/19050/
Az eredeti fájlok adatlapja szerint a forrás valamilyen DOC fájl,
de ezeket sajnos nem tudtuk megkapni eddig a kiadótól.
A nemrég érkezett könyvek még furcsábbak, közelebb vittek a rejtélyhez,
de meg nem oldották. Több mint 20 könyvet kaptunk, és ezek többségében
feje tetejére van állítva a szöveg és tükörbe van fordítva :-??
Felfedeztük, hogy az ebből kimásolt szöveg viszont tökéletes,
szép magyar ékezetekkel.
A feldolgozáshoz használt régi Adobe Acrobattal a szöveget sikerült
a talpára állítani és PDF-be nyomtatáskor beállítani a tükörszöveget,
ergo a végeredmény szép, olvasható képet adott a kimeneti PDF-ben.
Azonban az ebből kimásolt szöveg ettől "elromlott", és ugyanolyan
katyvasz lett, mint a korábbiakban, lásd mint fent :-??
Gyanítom, remélem, ezt már profi kiadványszerkesztők tudják
megfejteni, talán segíteni a megoldásban.
Egyelőre jobb híján az olvashatóra fordított szöveget
a kollégáim újra OCR-ezik és egy kétrétegű PDF-be mentik.
Ha valaki tud ennél jobb megoldást, a karakteres PDF olyan
megfordítását, ahol helyes szöveget kapunk a háttérben,
megköszönném.
Üdvözlettel
Moldován István
*****************************************************
Országos Széchényi Könyvtár
E-szolgáltatási Igazgatóság
E-könyvtári Szolgáltatások Osztály
1827 Budapest, Budavári Palota F épület, 315. sz.
Tel: (36)-1-224-3846
Mobil: (36)-20-400-8872
Fax: (36)-1-202-0804
E-mail: moldovan at mek.oszk.hu
URL: http://mek.oszk.hu
URL: http://epa.oszk.hu/
*****************************************************
--------- következő rész ---------
A non-text attachment was scrubbed...
Name: gondolat-tukor.jpg
Type: image/jpeg
Size: 132434 bytes
Desc: nem elérhető
URL: <https://listserv.niif.hu/pipermail/mek-l/attachments/20190213/16237eaf/attachment-0001.jpg>
További információk a(z) Mek-l levelezőlistáról