EK
Kiraly Peter
kiru at KTUD.ELTE.HU
1999. Sze. 10., P, 14:41:11 CEST
On Fri, 10 Sep 1999, Drotos Laszlo wrote:
> At 08:37 1999.09.09. +0200, Dudas Aniko wrote:
>
> >A PPKE BTK konyvtara szeretne megkezdeni a sajat elektronikus
> >konyvtaranak (tovabbiakban EK) kialakitasat.
>
> >- milyen formatumban erdemes a dokumentumokat szkenneles utan tarolni?
>
> Szerintem a szovegeket Word-ben erdemes a OCR programbol elmenteni
> elso lepesben. Ebben eleg egyszeru megoldani az oldalszamok es
Szerintem wordben meg korrekturazni is jobban lehet: vilagosabban
latszanak a szoveg formazasai (pl. sortores, tab, stb.). Tovabba en mindig
le szoktam ellenorizni nehany "regularis kifejezest" (a wordben:
mintaillesztes ill. pattern matching), pl.:
helyes kornyezetben vannak a konnyen keveredo '1', 'l', 'I' karakterek?
( erre: [a-z]1[a-z] ill. [0-9][Il][0-9] vagy altalanosabban:
[a-z][0-9][a-z] stb.)
tovabbi tipikus hibak: lll vagy IlI M helyett, um, uni, mu stb. keveredese
ii u: (ü) helyett stb. Ezekre erdemes kulon rakeresni.
Ezen felul lehetnek 'rejtett karakterek' is a szovegben, amiket az adott
betutipus nem tud megjeleniteni, vagy egy helyettesito karakterrel jelenit
meg (az ascii tabla elso husz vezerlokaraktere, illetve a tabla
masodik felenek nehany jele). Erdemes egy kulso keresovel ezekre rakeresni
- de ne binaris, hanem ascii alapu szoveg allomanyban (html, txt).
[most jut eszembe, hogy egyszer valaki mar felsorolt nehany gyanus ascii
kodot a listan.]
kiraly peter
További információk a(z) Mek-l levelezőlistáról