MEK 2.0-s formatumok

Drotos Laszlo kondrot at GOLD.UNI-MISKOLC.HU
2001. Júl. 9., H, 03:40:24 CEST


Nehany elmaradt valasz (elnezest a kesesert, nem nagyon voltam itt):

Lang Attila D. irta:

> > A mindenre jo, "legjobb es legszebb" formatum pedig me'g nem
> > szuletett meg, vagyis a "maximalis formatumu" dokumentumbol is
> > valoszinuleg tobb alternativa't kell/kellene kesziteni, hogy minden
> > igenyt kielegitsen.
>
>   Laci, figyelj, ellentmondasz Magadnak. Az elõbb azt mondtad, kérdés,
> hogy megéri-e a maximális formátum mellett minimálisat is csinálni,
> majd azt állítod, hogy a maximálisból többféle kellene. Márpedig az
> még nagyobb munka, a minimális formátumhoz kell a legkevesebb
> konvertálgatás!

Ugy ertettem, hogy ha tokeletes e-konyvekre torekedunk, akkor
nem erhetjuk be egyetlen formatummal, mert egyik sem tokeletes
minden szempontbol. Ez persze me'g nagyobb munka lenne, de
szerintem nem kell erre torekednunk szerencsere, mert a MEK-nek
nincs ilyen feladata.


> > hogy a leheto legkisebb legyen annak az ese'lye, hogy valaki
> > bosszankodni kezd egy MEK-bol letoltott dokumentumnal? (Erre
> > szolgalnanak ezek az ajanlasok, melyeket a HTML, Word es PDF
> > formatumokhoz allitanank ossze, es amiket igyekeznenk ezentul
> > betartani es javasolnank a kovetesuket azoknak, akik a MEK reszere
> > keszitenek anyagokat.)
>
>   De ez máris háromféle...

Igen, ez lenne a harom legfontosabb formatum az uj MEK-ben.
De ez nem jelenti azt, hogy mind a harom formatumban elkeszulne
minden konyv, hanem csak abban az egyben vagy kettoben, amelyik
legjobban illeszkedik a dokumentum jellegehez. (Egy lexikonnak
peldaul inkabb bongeszhetonek kell lennie, egy tudomanyos
disszertacio meg letoltheto formatumban is ele'g.)


> Ja, eszembe jutott még valami. Azt a kérdést már föltettem, s mint
> látom, agyrázkódást okoztam vele a szögnek, hogy ki fog konvertálni.
> De azután jön a másik kérdés: ki fogja azt ellenõrizni? Egy komoly
> konverzión átesett szöveget úgyszólván újra meg kell korrigálni, ha ez
> elsõ hallásra furcsa is.

A korrekturazast igyekszunk megszervezni legalabb a szepirodalmi
szovegek eseteben. A konvertalasbol adodo hibak csokkentesere
pedig eppen ezek a leendo ajanlasok szolgalnak, melyek kozul
most a HTML-rol folyik a vita. Ezekben kell olyan megoldasokat
javasolni, amik leegyszerusitik a konvertalast. Peldaul, ha
megegyezunk, hogy Word formatumu anyagokban a magyar betuket
Times New Roman CE betukkel irjuk, a franciakat (es egyeb
nyugati nyelveket) pedig Times New Roman-nal, akkor konnyu
lesz megkeresni egy szovegben, hogy vannak-e benne kulonleges
betuk.


> Abban a könyvben, amin éppen dolgozom, képlet is található. Nem
> bonyolult, de van benne emeletes tört, négyzetgyök, hatványkitevõ,
> alsó indexbe tett szám. A könyv 88%-ánál tartok, a képletet egyelõre
> kihagytam; már napok óta meg akarlak kérdezni Benneteket, mit
> csináljak vele, csak mindig elfelejtem. Most megkérdezem. Ha fölrakom
> a Wordhöz tartozó Microsoft Equationt és azzal megcsinálom a képletet,
> lehet azt olvasni Equation nélküli Worddel? Sose használtam, úgyhogy
> nem tudom. Vagy legyen képfile?

Ahogy korabban irtam, a 6.0-as Wordben a Ctrl/Shift/F9 egyideju
megnyomasaval belso kepformatumra lehet konvertalni minden ilyen
specialis objektumot. Ezutan ma'r minden programban, ami olvasni
tud Word file-okat, garantaltan helyesen jelenik meg a keplet
(raadasul a file merete is kisebb lesz).


> > Szerintem jo otlet szogletes zarojellel kiemelni a labjegyzetek
> > hivatkozasait a szovegben, jol is mutat es egyertelmu.

> Mint advocatus diaboli szívem szerint megkérdezném ugyan, hogy
> mégis miért pont szögletes zárójel, és mit tészen ez a jelpár a
> lábjegyzettel azon kívül, hogy nehezebben olvashatóvá teszi a
> hivatkozást, de félek, hogy beütöm a fejemet.

En csak azert tartom jo otletnek szogletes zarojelbe tenni
a labjegyzet hivatkozasi helye't mutato sorszamokat vagy
csillagokat a HTML formatumu dokumentumoknal, mert jol
kiemeli oket es olyan vizualis hatast kelt, mintha egy
kis negyzetben lenne'nek beleirva. Es mivel szogletes
zarojel ritkan fordul elo a magaban a szovegben, ezert
ez egy esetleges konvertalaskor is segit a hivatkozasok
helyenek megtalalasaban. Persze tudom, hogy ha XML-ben
dolgoznank, akkor erre a celra egy megfelelo "tag" volna
a tisztesseges megoldas, de nem XML-ben dolgozunk...


>   A magam részérõl, bár megesett már, hogy döbbent arcok meredtek rám
> emiatt, fekete hátteret használok minden géptípuson, minden
> szoftverben, minden célra jó tizennégy éve. Hozzá fehér betû a
> konyhafõnök ajánlata, pontosabban DOS-ban a 7-es kódú szín, Windowsban
> a 192, 192, 192-es árnyalat (255-ig terjedõ RGB-skála szerint).
>   A fekete háttér pihenteti a szemet, kényelmesebb vele az olvasás
> hosszú távon, mint a fehérrel. Tudom javasolni a kipróbálását.

Gya'szosan festene a MEK tiszta feketeben. :-) Persze
mindenki olyan szineket allit be a bongeszojeben, amilyet
akar es felulbiralhatja vele az eredeti szinbeallitast,
az LCD kepernyok pedig tobbnyire egy gombnyomassal valthatok
a't inverzbe, de nem tartom jo otletnek eleve egy szokatlan
sotet hatteret ajanlani az olvasonak. En csak egy olyan
helyet ismerek, ahol hosszabb szovegek vannak fekete hatteren:
http://www.terebess.hu/keletkultinfo/  Itt ketsegtelenul jol
mutat ez a nem tul vilagos, kicsit nagy Arial font, de ez
is csak bold betutipussal.


>> A nyomdai idezojelek problemaja megkerulheto, ha helyettuk irogep
>> idezojelet hasznalunk (lasd fent).

> Jó, csak magyarázd meg a szoftvereknek, hogy a HTML-tagekben marad a
> macskaköröm, a törzsszövegben pedig nem.

Nem ertem, miert gond, ha a szovegben is macskakorom van es
a HTML tag-ekben is? Egyenlosegjel es kettoskereszt is lehet
mindkettoben, megsem okoz gondot. Ha pl. a HTML tag-ek
eltavolitasa lenne a feladat, akkor ez a < es > jelek
alapjan egyertelmuen megteheto.

En szivesen eloirom a nyomdai idezojelek hasznalatat a
HTML ajanlasban, csak kerdes, hogy mege'ri-e, nem lesz-e
veluk tobb baja a felhasznaloknak, mint amennyi elony
szarmazik beloluk? Es ha eloirjuk, akkor melyik kodolast
hasznaljuk a 3 "szabvany" kozul, ha a jelenlegi Web-
bongeszok mindegyike ma'st tamogat? (A Word es PDF
formatumoknal nincs ezekkel gond, ott mindenkeppen
ajanlhatok.)


> És magyarázd meg az embereknek, hogy azért igazából a magyar
> nyelvben az idézõjelet nem így kell írni, tetszenek tudni, ez
> csak egy egyszerûsítés a számítógépek korlátai miatt...

Volt ma'r erre pelda egyebkent, a kozepkorban sokkal tobb
irott maganhangzo volt a magyar nyelvben, amiket a nyomtatas
terjedesekor a nyomdaszat korlatai miatt lecsokkentettek
a jelenleg hasznalt nehanyra.


> Azért mutogatok folyton a szabályokra, mert azok objektívebb mércét
> jelentenek, mint az, hogy nekem így tetszik, Neked úgy, õneki amúgy.
> Ezekbe lehet fogódzkodni.
>
>   A szövegállításról a tipográfiai szabályok azt mondják, hogy elsõ-,
> másod- és harmadsorban sorkizárt, elválasztott szövegeket tessenek
> használni, eltérések megengedhetõk a következõ esetekben:

Rendben van, de a szoban forgo HTML formatumnal nem lehet (nem
szabad) elvalasztast hasznalni. Akkor pedig ez a fenti szabaly
es ennek alesetei nem alkalmazhatok automatikusan.


>A b) pont fedi a teljesen köznapi célú szövegkeresést is, amikor arra
>vagyok csak kíváncsi, melyik mûben esik szó Arturo Uiról. Így például
>maximálisan formahû tárolás esetén, amint kifejtem, ezt nem lehetne
>megvalósítani.

Egy ilyen egyszeru keresest az a) pontban leirt szoveggyujtemenynel
is meg lehet tenni, amely csak a nagykozonsegnek szol. A b) pontban
szereplo tudomanyos kutatasra es statisztikara alkalmas szoveges
adatbazisban viszont peldaul olyan kerdesek is feltehetok lennenek,
hogy ha'ny ikes ige fordul elo Petofi verseiben rimke'nt? Ilyen
szintu tarolasra a MEK-ben nem vallalkozunk.


>> A c) pont sem erinti a MEK-et, nem akarunk az "orokkevalosagnak"
>> dolgozni es nem ujrapublikalas celjabol archivaljuk a szovegeket.
>> Utobbi inkabb kiadoi feladat, elobbi pedig esetleg az OSZK feladata
>> lehetne, de mindketto komoly eroforrasokat igenyel.

> De a MEK-es szövegek lehetnek újrakiadások tárgyai, természetesen
> kiadók által, a szükséges jogi kérdések rendezésével.

Igen, csakhogy ez megint nem a MEK celja. Ha egy kiado ugy
gondolja, hogy megsporolja a szovegbevitelt es elke'r egy
elektronikus konyvet a gyujtemenybol ujrakiadasra, akkor
ezt meg lehet targyalni a jogtulajdonossal (nem mi vagyunk
azok, mi csak szolgaltatunk), es utana a kiado feladata
olyan formatumba hozni a szoveget, ami egy papir- vagy egy
ma'sik elektronikus kiada'sra alkalmas. De a MEK-ben nem
akarunk "nyomdakesz" allomanyokat kesziteni es ta'rolni
ilyen celokra.


Bakonyi Geza irta:

>A gondolat nekem is tetszik, csak egy dolgot aruljatok el: a
>szepirodalmi szovegek digitalis verziojanak archivalasara _van_
>kidolgozott szabvanyos modszer (XML TEI) es a szoveghez tartozo
>biblografiai adatokra ugyancsak (TEI Header es ennek DC
>megfeleltetese). Mindennek letezik magyar verzioja is, amelyet
>a Neumann-haz hasznal. Miert kell valami mast kitalalni?

Az XML TEI az Attila altal megfogalmazott "szakmai kovetelmenyek"
b) esete're vonatkozik, amikor tudomanyos igenyu szoveges adatbazist
epit valaki SGML/XML alapokon.

A bibliografiai adatok ta'rolasanal pedig figyelembe vesszuk a DC
(Dublin Core) ajanlasat, de valoszinuleg ezt ki kell egesziteni
nehany tovabbi mezovel, ami a MEK szempontjabol fontos.

Az erdeklodoknek nehany cim:

http://www.tei-c.org/
http://etext.virginia.edu/TEI.html
http://dublincore.org/
http://www.mek.iif.hu/porta/szint/tarsad/konyvtar/forras/ungvary/html/5.htm
http://www.mek.iif.hu/porta/szint/tarsad/konyvtar/ekonyvt/orokke/html/index.htm#_Toc32


Laci



További információk a(z) Mek-l levelezőlistáról