MEK 2.0-s formatumok

Drotos Laszlo kondrot at GOLD.UNI-MISKOLC.HU
2001. Júl. 5., Cs, 01:19:31 CEST


Lang Attila D. wrote:

> Kétféle ajánlás nem mindig jelent kétféle verziót, Laci. Inkább abban
> segít, hogy be tudd határolni, hova helyezendõ a szöveg a legkisebb
> munkát igénylõ, legegyszerûbb feladattól (Pistike "Helló, világ"
> programjának listája) a legbonyolultabbig (Enciklopédia Galactica).
> Leteszed egymás mellé a két ajánlást, és közébük helyezed a mûvet.
> Amelyikhez jobban igyekszik törleszkedni, azt kell alkalmazni hozzá.


Nagyon tetszik az a kovetelmenyrendszer, amit osszeallitottal.
Ha megengeded, akkor tovabbkuldene'm az Akademia Textologiai
Bizottsaganak, amelyikrol a multkor irtam, hogy az
elektronikus szovegek minosegevel kivan foglalkozni.

Azonban ez a ket "ajanlas" nem teheto egymas melle', nem
ugyanarrol a "mufajrol" van szo. A tied egy elmeleti osszefoglalo
a felmerulo szempontokrol es problemakrol, en pedig nagyon
konkret ajanlasokat probalok irni a HTML - kesobb pedig
majd a Word es PDF) formatumoknal hasznalando minimalis
kovetelmenyekrol. (Ettol me'g persze barki csinalhat
majd maximalis igenyu HTML, XHTML, XML stb. verziokat
egy-egy MEK dokumentumbol, ha van hozza' ideje, kedve
es tudasa.) Az en minimalis ajanlasomnak egy olyan
maximalis ajanlas lehetne a pa'rja, amely leirja azt,
hogy mit es hogyan lehet kihozni a HTML-bol es rokonaibol
ahhoz, hogy a vegeredmeny minel inkabb kozelitsen az
altalad leirt igenyekhez.



Nehany konkret megjegyzes a "Szakmai kovetelmenyek"-hez:

> Szövegeket elektronikusan a következõ okokból tárolunk:
>
> a) mert minél nagyobb olvasóközönséghez szeretnénk eljuttatni
> azokat, amit az Interneten tehetünk meg a leggyorsabban és a
> legolcsóbban;
>
> b) mert olyan kutatási, szövegkritikai célú adatbázist
> szeretnénk felépíteni, amelyben a lehetõ leggyorsabban és
> legolcsóbban lehet keresni, róla statisztikákat készíteni, belõle
> idézni;
>
> c) mert nagy mennyiségû szöveg hosszú távú tárolása így oldható
> meg a legolcsóbban, ha egyúttal annak olvasók általi
> hozzáférhetõségét és a természeti katasztrófákkal, illetve
> az emberi rongálással szembeni védettségét is szeretnénk
> biztosítani, ugyanakkor lehetõvé tenni a késõbbi
> újrafeldolgozásokat, nyomtatott vagy elektronikus újrakiadásokat.

A MEK eseteben eddig es a belathato jovoben az elsodleges
cel az a) pontban megfogalmazott feladat.

A b) ponttal nehany erre specializalodott muhely foglalkozik
ma'r Magyarorszagon. Keszul is a reszletes ajanlas az MTA
Textologiai Biztottsaganal az ilyen, tudomanyos igenyu
"elektronikus kritikai kiadasokra".

A c) pont sem erinti a MEK-et, nem akarunk az "orokkevalosagnak"
dolgozni es nem ujrapublikalas celjabol archivaljuk a szovegeket.
Utobbi inkabb kiadoi feladat, elobbi pedig esetleg az OSZK
feladata lehetne, de mindketto komoly eroforrasokat igenyel.

(Zarojelben jegyzem meg, hogy a MEK munkatarsai, illetve
a Szechenyi Konyvtarban letrehozott MEK Osztaly termeszetesen
reszt vehetnek b) es c) tipusu fejlesztesekben is, de ez
az Interneten nyilvanos es ingyenes szolgaltataskent 1994
ota mukodo Magyar Elektronikus Konyvtar celja't nem erinti,
az tovabbra is egy online "kozkonyvtar" lesz, minel tobb,
a nagykozonseget erdeklo szolgaltatassal.)


>  E célok megvalósításához a következõk szükségesek:
>
> a) olyan tárolási formátum, amely minél szélesebb felhasználói
> kör, illetve az általuk használt szoftverek számára értelmezhetõ
> és feldolgozható, azaz a legnagyobb kompatibilitást biztosítja a
> szó számítástechnikai értelmében;

Igy van. Mivel a MEK-nek ez az a) pont az alapveto celja, ezert
erre kell torekedni.



> Szövegtárolási módszerünk akkor tartalomhû, ha mindazon
> információkat, amik a szöveg tartalmával kapcsolatosak,
> hiánytalanul és egyértelmûen kinyerhetjük belõle. Ennek
> alapelve az, hogy minden tartalmi jellemzõnek saját, egyedi
> kóddal kell bírnia. Tartalmi jellemzõnek tekintendõk az alábbiak:
>
> - a szövegben a szerzõ által elhelyezett hangsúlymódosító és
> figyelemfelkeltõ jelek, kiemelések, betûtípus-változtatások,
> amelyek eltávolításával a közlés tartalmi hiányosságot szenvedne;

Kerdes, hogy ezeket ugyanolyan tipografiai megoldassal
kell-e visszaadni egy elektronikus kiadasnal, mint ahogy
az a nyomtatottnal van? Ha az egyik nyomtatott kiadasban
mondjuk ritkitva vannak szedve azok a szavak, amelyek
egy masikban doltbetusek (a szerzo meg mondjuk az eredeti
keziratban alahuzassal emelte ki oket), akkor az elektronikus
kiadasban jelolhetem ezeket pl. forditott aposztroffal?
(A MEK-ben levo ASCII text formatumu szovegeknel ilyen
karakterek koze szoktuk tenni ezeket a kiemelt szavakat.)


> - a szöveg tagolási rendszere, úgymint a bekezdésekre osztás, a
> táblázatok szerkezete, a versek versszakokra és sorokra osztása,
> a címek és alcímek, a jegyzetek, a tartalom- és irodalomjegyzék,
> a név- és tárgymutató, a kritikai apparátus stb. ebbéli
> mivoltának feltüntetése és megkülönböztetése a korpusz más
> részeitõl;

Ezek kozul tobb dolog ma'r inkabb egy konkret kiadasnak a resze,
nem maganak a mu"nek (pl. nev- es targymutato, tartalomjegyzek,
kritikai labjegyzetek). Az osszeallitasodban szamomra nem
vilagos, hogy mikor beszelsz a mu"rol es mikor egy konkret
kiadasarol? A MEK eseteben muveket akarunk elektronikusan
szolgaltatni, tehat itt nem erdekes, hogy egy adott nyomtatott
kiadasnal mi mindent tettek me'g hozza a szerkesztok es a
nyomdaszok ahhoz, amit a szerzo leirt. (Persze tobbnyire
egy konkret nyomtatott kiadast digitalizal az ember, de
a MEK szempontjabol ebbol csak a szerzo eredeti szovege
erdekes. En le is szoktam szedni minden ma'st (szerkesztoi
labjegyzetet, utoszot  stb.), reszben azert is, hogy a
kiado ne kifogasolhassa, hogy felhasznaltuk az altaluk
befektetett szerkesztoi munkat).


> Szépirodalmi mûvekben nem reprodukáljuk azokat a helyesírási
> hibákat, amelyeket a mû kiadása óta bekövetkezett helyesírás-
> változás, illetve a szerzõ vagy a nyomda nem megfelelõ helyesírás-
> ismerete eredményezett; kivéve a verseket, amelyeket hagyományosan
> betûhíven adunk vissza, és azt az esetet, amikor a szerzõ
> érezhetõen tudatosan, stilisztikai céllal alkalmaz sajátos
> helyesírást, amit ekkor szintén nem szabad megváltoztatni.
> Megtartjuk a korabeli helyesírást az olyan mûveknél, amelyek
> régisége indokolja a korhû reprodukciót, de a kifejezett
> sajtóhibákat csak speciális esetben, autográf kéziratoknál,
> õsnyomtatványoknál, kéziratos kódexeknél visszük át, amelyek
> betûhív reprodukciót igényelnek. Olyan esetekben, amikor
> az alkalmazott írásmódban nincs okunk kifejezett szerzõi
> szándékosságot látni, és a mû kora és/vagy irodalomtörténeti
> fontossága sem indokolja az eredeti mindenáron való megtartását,
> helyesebb, ha a mai olvasó igényét helyezzük elõtérbe és a
> szöveget inkább a mai szabályokhoz igazítjuk; ez megkönnyíti az
> interpretációt és nem okoz kárt az olvasó helyesírásérzékében.

Ezeket a szempontokat csak egy szakember tudja megitelni,
es a MEK-nel nem szaladhatunk egy akademikushoz vagy a
szerzohoz minden olyan szo'nal, amit ma ma'r maskent
kellene irni. Ha meg rabizzuk a szoveg digitalizalojara,
hogy a fenti szempontrendszer alapjan maga itelje meg,
hogy milyen helyesirast hasznal, abbol semmi jo nem lesz.
En azt gondolom, hogy - a nyilvanvalo sajtohibakon kivul
- csak a szakirodalmi szovegeknel szabad belenyulni a
helyesirasba, a szepirodalmi muveknel meg kell hagyni
ugy, ahogy az eredeti kiadasban volt, abbol nem lehet
baj.

Nehany konkret pelda:

- Amikor a Pallas Lexikont feltettuk a MEK-ben, en
bizony kicsereltem azokat a dupla massalhangzokat a
mai formajukra, amiket akkoriban hajlamosak voltak
- ba'r ma'r nem kovetkezetesen - me'g megkettozve irni.
Ezt a kereses megkonnyitese miatt tettem, ami egy
lexikonnal fontosabb szempont, mint a szoveghuseg.
(Pl. "öcscse" helyett "öccse" van a MEK valtozatban.)
Erdemes elolvasni egyebkent a Pallas errol szolo szocikke't:
http://www.mek.iif.hu/porta/szint/egyeb/lexikon/pallas/html/046/pc004665.html#2

- A MEK-ben levo Varnus Xaver konyveknel a "vajon" kerdoszonal
mindenutt a "vajjon" irasmod fordul elo, es mikor rakerdeztem,
azt mondta, hogy ragaszkodik hozza, mert o" me'g igy tanulta
es nem hajlando tudomasul venni a jelenlegi helyesirast.
(Vagyis itt hiba lett volna ezt onkenyesen javitani.)

- A nemreg korrekturazott Sztrogof Mihaly konyvben 9:4 ara'nyban
fordul elo a "Jekatyerinburg" es a "Jekaterinburg" irasmod.
Masik nyomtatott kiadast megnezve is hasonlo a helyzet, ba'r
az ara'ny kicsit ma's. (Szerintem itt nem kell nekunk donteni
Verne illetve a forditoja helyett, hanem meghagyni oket ugy,
ahogy a korrekturahoz hasznalt kiadasban vannak.)


>Az írásjel-használati szabályokat a szavakra vonatkozó helyesírási
>szabályokhoz hasonlóan alkalmazzuk vagy mellõzzük.
>Csak betûhív átírást igénylõ munkáknál tartjuk meg a helytelen
>írásjelhalmozásokat, mint például a gondolatjel vagy idézõjel
>mellé szabálytalanul helyezett vesszõt; a helyesírási vesszõhibát
>(amilyen a minõségjelzõ 'mint' vagy a 'stb.' rövidítés elé
>helyezett vesszõ);

Itt is azt gondolom, hogy a nem szepirodalmi szovegeknel
ugyan megengedheto az irasjelek "kiigazitasa", de irodalmi
muveknel nem. Ha pl. Mikszath minden "stb." ele' vesszot
tett, akkor en azt nem javithatom ki. Ugyanis mi nem
"elektronikus kiadasokat" hozunk letre (nincs is hozza
engedelyunk es szakertelmunk), hanem nyomtatott kiadasok
alapjan digitalizaljuk a muvet. (A szerzoi jogi torveny is
"sugarzasnak" minositi a muvek internetes kozzete'tele't,
es nem uj kiadasnak.)


> A bekezdések a tipográfia szabályai szerint sorkizártak és
> elválasztottak. Ha az elválasztásról lemondunk, a sorkizárást
> nem célszerû megtartani, mert a nagyra nyúló szóközöket a
> tipográfia kevésbé helyesli, mint az egérrágta sorokat.

Ez a tipografiai szabaly a nyomtatott kiadvanyokra vonatkozik.
Rovid sortavolsagnal es rovid szovegeknel valoban csunya
a szethuzott sor, de egy bizonyos sorhosszusag es szovegme'ret
utan ma'r nagyon ritkan fordul elo olyan hosszu szo, ami
elrontja az osszhatast. Egy kepernyon megjeleno regeny-szoveg
ma'r ilyen kategoriaba esik, so"t a monitoron a jellemzo
sorhosszusag 70-80 karakter, ami tobb, mint a nyomtatott
konyvek atlagos 50-60 karaktere. Raadasul pl. egy Word
dokumentumnal egyetlen gombnyomassal bekapcsolhato az
automatikus elvalasztas, ha valakinek ugy jobban tetszik
a kulalak. Vagyis nem latom indokoltnak a sorkiegyenlites
egyertelmu tiltasat minden olyan esetben, amikor nincs
elvalasztas. (So"t: inkabb az elvalasztast erdemes tiltani
az elektronikus szovegekben, mert csak a baj van vele,
peldaul a keresesne'l vagy a szoveg atformalasanal.)


>Nem elég, ha egy elektronikusan tárolt dokumentum követi az
>eredeti mû bizonyos jellemzõit és elvet másokat: arra is szükség
>van, hogy a könyvtár gondozói, munkatársai tisztában legyenek a
>dokumentumok mindenkori állapotával. Ezért ki kell dolgozni egy
>egységes jelrendszert, amelyben a mûvek feldolgozásakor és minden
>utómunka alkalmával rögzítik mind a tartalom-, mind a formahûség
>terén beállt állapotot. Ha a mûnek többféle, nem csupán belsõ
>tárolásában, de megjelenési formájában is különbözõ változata van,
>az állapotjegyzéket mindegyikhez külön csatolni kell.

Ez a gondolat tetszik! Az uj MEK bibliografiai adatformatumanak
kidolgozasa most folyik, es ebben lesznek olyan mezok, ahol
le lehet irni, hogy milyen "allapotu" az adott dokumentum,
milyen ellenorzeseken ment a't, milyen hianyok vagy kenyszeru
kompromisszumok vannak benne az eredeti nyomtatott valtozathoz
kepest. Egy egyseges rendszert kell majd kidolgozni ezeknek
az informacioknak a leirasara is...

Laci



További információk a(z) Mek-l levelezőlistáról