MEK 2.0-s formatumok

Drotos Laszlo kondrot at GOLD.UNI-MISKOLC.HU
2001. Jún. 30., Szo, 19:56:52 CEST


Ismet csak azokra a reszekre reagalok, amikkel nem teljesen
e'rtek egyet:


Zsadanyi Nagy Csaba irta:

> > >  No de még föl se állítottuk azokat a maximális követelményeket,
> >
> > Rendben, kezdhetjuk azzal is, varom az otleteket.
>
> en javasolnam, hogy:
>
> a) ne word vagy pdf legyen a 'maximalista' file, hanem html,
> mert me'g az eltero bongeszotamogatottsag ellenere is a
> legszabvanyosabb, legtobb platformon hasznalhatobb es
> nagyon gyorsan 'lebutitott' (tehat univerzalis) text
> keszitheto belole
> b) ha mar html, akkor combos unicode-os xhtml, „
> - ”  idezojelekkel, acute-s, uml-os kodolassal stb.


Azt hiszem felreertes van: A MEK tovabbra is egy heterogen
file-archivum marad, amiben kulonbozo formatumu, onallo
- bongeszheto es letoltheto - dokumentumok vannak. Vagyis
nem egy Web-site es nem is egy full-text adatbazis. Nem
lesz minden dokumentumbol HTML vagy XML/SGML formatum,
mert hatalmas munka es nem e'ri meg (neha pedig meg sem
lehet csinalni, pl. egy PDF-ben levo e-book eseteben).
Az elkepzelheto es kivanatos is, hogy a fontosabb
dokumentumokbol legyen egy online olvasasra sza'nt
es egy letoltesre/nyomtatasra optimalizalt verzio.
Hogy mikor melyik a valtozat a "maximalista" minosegu,
az peldaul a dokumentum jellegetol fugg. Egy muszaki
szakkonyv Word vagy PDF valtozata valoszinuleg jobb
minosegu lesz, mint a belole keszult HTML verzio
(valodi kepletek, lapalji labjegyzetek, precizen
elhelyezett abrak, oldalszamokat tartalmazo
targymutato stb. miatt). Pontosabban az egyik a
kepernyon fog jol mutatni, a masik inkabb papiron.

Vagyis egyforman ki kell dolgozni az ajanlasokat
a HTML, a Word/RTF es a PDF formatumokra.
Ezt lehet felulrol: kituzunk mindegyiknel egy
*maximalis* minoseget, aztan megnezzuk, hogy
mit kell ebbol engedni ahhoz, hogy a jelenlegi
kompatibilitasi problemak minel kevesbe okozzanak
bosszusagot a felhasznaloknak. Vagy lehet alulrol
epitkezni: osszeszedjuk mindegyik formatumnal
azokat a *minimalis* megoldasokat, amelyek ma'r
elegendoek ahhoz, hogy a MEK-ben elofordulo
szovegek nagy tobbsegenel esztetikus es jol
hasznalhato kulalakot alakitsunk ki. En ez
utobbi modszert probaltam kovetni a HTML
formatumra kozzetett ajanlastervezetben,
de lehet a masik iranybol is indulni...


Gyulai Mihaly irta:

>> Ebbol ugy tunik, hogy az Alt-tal beirt idezojelek egyaltalan nem
>> jelentek meg, a HTML es az Unicode kodolas eseteben pedig irogep
>> idezojelek lettek. Valoban igy van?

>Nem tudom, miért mondod, hogy "Alt-tal beírt idézõjel", hiszen
>a szövegbevitel a szerkesztõprogramod dolga... a HTML forrásban
>a fenti szám szerepel, úgy, ahogy itt...

A szamitogepes billentyuzeteken nincsenek ezek a nyomdai
idezojelek, tehat csak valami trukkel vihetok be a szovegbe.
Vagy ki kell valasztani egy kis ablakban egy karaktertablabol,
vagy a szovegszerkesztovel lecsereltetni, vagy az Alt gombot
benyomva beutni a kodjukat. (Windows eseteben azt a kodot,
ami a http://mek.oszk.hu/temp/idezojel.htm tesztlapon az
elso oszlopban lathato.)



Gyulai Mihaly irta:

>Hiszen, extrém esetben, lehetne azt mondani, hogy egyetlen
>HTML oldal legyen az egész "Egri csillagok", és aki el
>akarja olvasni, az majd úgyis megvárja, amíg az egész
>letöltõdik...

Az oldalak ajanlott me'rete'ne'l a varakozasi ido csak
az egyik szempont, az is fontos, hogy egy gyengebb gepen
mekkora file-okat lehet megnyitni ugy, hogy azok ne
terhelje'k le nagyon. 4-5 eve max. 100 kbyte-os text
es HTML file-okat tartottunk elfogadhatonak a MEK-ben,
ezt szerintem most ma'r 200-300 kbyte-ra lehetne emelni
(egy 16 Mbyte RAM-mal rendelkezo Windows PC-n egy regebbi
bongeszovel is eleg jol lapozhato, keresheto ma'r egy
ekkora Web-oldal). Ez persze csak egy ajanlott maximum,
ha ertelmesen tagolhato kisebbre, akkor annak semmi
akadalya, ha pedig valamiert nem uszhato meg mondjuk
450 kbyte alatt egy kepeket is tartalmazo oldal, akkor
az sem tragedia.


Gyulai Mihaly irta:

>> Tovabba egy atlagos kep onmaga is lehet 100 kbyte...
>
>Ne legyen. Ne pazaroljuk a mások erõforrásait. Ha az a
>kép generálás, szkennelés, vagy hasonló mûvelet után
>100 kB, akkor közel azonos minõségben lehet 30 kB is...

Persze, igyekezni kell optimalis meretu kepeket
beletenni, de peldaul egy kepernyofoto nemigen
csokkentheto 80-100 kB ala' anelkul, hogy a
rajta levo betuk ne va'ljanak olvashatatlanna'.
(Hasonloan nehezen kicsinyithetok a terkepek.)


Gyulai Mihaly irta:

>>> Inkább ... a PNG formátum legyen ajánlott

>Az ajánlásban olyan dolgoknak kell szerepelniük, amiket a MEK
>elvár a jövõbeni beküldõktõl... feltételezem, nincsenek
>készenlétben tömegével az elkészült HTML dokumentumok,
>tömve GIF képekkel...
>A maximális igényû ajánlásba belefér a PNG. Az úgysem a
>fejletlen böngészõt használóknak készül...
>Az ajánlás tehát az új dokumentumokra vonatkozik.
>Az ajánlás legyen jövõbemutató.

Az ajanlas egyarant vonakozik azokra a HTML dokumentumokra,
amelyek jelenleg a MEK gyujtemenyeben vannak es amelyeket
nagyjabol egysegesiteni kellene, mielott attesszuk oket
a 2.0-as verzio gyujtemenyebe. Tovabba azokra, amelyeket
valahol talalunk az Interneten es elkerjuk oket, majd
kicsit szepitgetunk rajtuk. Valamint azokra, amiket a
MEK "onkentesei" keszitenek: szkennelnek vagy konvertalnak.

Ahogy fentebb irtam, nem "maximalis igenyu" es "jovobe
mutato" HTML ajanlast kell keszitenunk, hanem egy olyat,
ami jelenleg es kovetkezo nehany evben a leheto legtobb
felhasznalonak szep es jo eredmenyt biztosit nehany
kompromisszum a'ra'n. (Egy konkret dokumentumnal
lehetseges, hogy a HTML verzio lesz a "maximalis",
vagyis a legjobb minosegu, es mellette lesz mondjuk
egy kevesbe jol szerkesztett RTF file is. Mas
esetben pedig forditva. De nem a HTML ajanlasnak
kell "maximalistanak" lennie.)

>Most csak ötletszinten megemlítem, hogy ha a MEK HTML
>dokumentumokat akar online szolgáltatni, akkor meg
>lehet azt csinálni, hogy a felhasználó letöltés elõtt
>kiválasztja a számára megfelelõ képformátumot, és
>ekkor a MEK a kiválasztott HTML változatot jeleníti
>meg. Ha magyon spórolni akarsz a hellyel, akkor a
>HTML oldalakat generálni is lehet egyik formátumból
>a másikba, vagy valami közös forrásból...

Lehet, de kerdes, hogy erdemes-e? Ezt a megoldast
probalta a Digitalis Irodalmi Akademia is, ahol
SGML-ben ta'roljak a konyveket egy adatbaziskezelo
alatt, es ugy tervezte'k, hogy ezekbol majd
"ropteben" generalnak egy tetszoleges kinezetu
HTML oldalt, amikor a kliens leke'r egy dokumentumot
a szerverrol. Csakhogy ettol a szolgaltatas olyan
lassu lett, hogy vegul megiscsak legyartotta'k a
statikus HTML file-okat es ezeket szolgaltatja'k
(amelyek igy mellesleg nem is valami szepek, mert
utolagos szerkesztes, szepitgetes nelkul lettek
generalva). A GIF-file-okat PNG-be konvertalgatni
az oldal elkuldese elott teljesen lelassitana'
a letoltest, es tovabbra sem la'tom a PNG
tamogatasanak fontossaga't a MEK esete'ben.
Minden bongeszo ismeri a GIF-et es a belathato
jovoben ismerni is fogja. Legalabb ezzel nincs
kompatibilitasi problema, oruljunk neki.

(Minden tiszteletem a nyilt formatumoke, de ha
arrol van szo, hogy mit es hogyan szolgaltassunk
a MEK-ben ezentul, akkor nem lehet eltekinteni
az olyan nagyon elterjedt formatumoktol, mint
a GIF, a PDF, a Word, a ZIP stb., amelyek a
leginkabb ismertek a felhasznalok kozott,
szemben a PNG, a PostScript, a TeX es a GZIP
szabvanyokkal, amiknek a hasznalatat azutan
egyenkent kellene megmagyarazni a MEK havi
40-50 ezer olvasojanak.)


Peter Gabor irta:

>Ezen a listán új vagyok (annyira, hogy elõször rossz
>címre küldtem ezt a levelet, azt hiszem),

Ket peldanyban is megjott, ugyhogy valoszinuleg jo
volt a cimzes elsore is.


Peter Gabor irta:

>A Word doc semmiképp nem szerencsés, sokan nem szeretik
>+ csomó olyan formázás belekerülhet (meg makrók stb.)
>amik nehezítik az olvasását, feleslegesen növelik a
>méretét (a szerzõk javarésze ugyan ezt a formátum
>részesíti elõnyben, de tördelés során is rengeteg
>gondot okoz, fõleg ha más nyelvterületen írták).
>Akkor már inkább rtf.

Igazak, amiket irtal, de ha a Word formatumra is
elkeszul majd az az ajanlas, amely a legegyszerubb
es minden verzioban egyforman mukodo megoldasokat
javasolja, akkor a problemak jo resze kikuszobolheto.
A Word-ot nem lehet kihagyni (nemcsak azert,
mert a legelterjedtebb es az iskolaban tanitott
szovegszerkeszto, es a StarOffice-nak koszonhetoen
ma'r Linuxon is olvashato), hanem mert sok minden
ebben oldhato meg a legszebben vagy legkonnyebben.
Ha kapunk egy kepverseket tartalmazo verseskotetet,
vagy egy tablazatokkal, abrakkal es labjegyzetekkel
megtuzdelt, szepen formazott disszertaciot, akkor
nem erdemes mindenaron HTML-t eroltetni belole.
(Legfeljebb egy PDF verziot is lehet "nyomtatni.)

Az RTF persze jo "csereformatum", de csak akkor,
ha nincsenek a dokumentumban Word-verziofuggo
megoldasok (kulonben kiszamithatatlan kovetkezmenyek
lesznek), es nincsenek benne ke'pek (mert kulonben
10-100 Mbyte-os file-ok keletkeznek, amelyeket
nem lehet Interneten szolgaltatni). Tovabbi e'rv
a Word mellett, hogy ehhez vannak igen jo es
ingyenes nezegeto es nyomtato programok (lasd
a MEK Ruhatar menupontja alatt), mig az RTF-hez
tudtommal nem letezik ingyenes viewer, vagyis
meg kell venni egy Word-ot ahhoz, hogy valaki
el tudjon olvasni egy RTF konyvet a MEK-bol.


Peter Gabor irta:

>Van egy további gond is, ami nem technikai jellegû:
>a pdf pont úgy néz ki, mint a könyv. Ha nincs benne
>letiltva a nyomtatás, dokumentum megváltoztatása
>(de ha le is van, fel lehet törni, bár nem egyszerû),
>tulajdonképpen nyomdakész anyag. Nem hiszem, hogy a
>kiadók/jogvédõk jó szemmel néznék, ha nagy mennyiségû
>ilyen anyag az õ beleszólásuk nélkül ingyen (fõleg
>pénzért) megjelenne a neten. Hasonló a probléma
>szerintem a Word/WordPerfect docokkal, rtf-fel (hiszen
>azok kiadói feldolgozására jól bejáratott technikák
>vannak ? rengetegen élünk ebbõl). Ha az elsõdleges
>cél a szövegek közreadása, elolvashatósága, akkor
>ezek a formátumok túl sokat tudnak...

Igen, ez is egy erdekes szempont! A MEK-et eddig a
konyvpiac szereploi kulonosebb kotozkodes nelkul
"megturte'k" a halozaton (koszonet a kiveteleknek,
amelyek egyenesen tamogatjak!). Ennek az egyik oka,
hogy onkentesen tartozkodunk az uzleti bevetelt
jelento slagerkonyvek es -szerzok elektronikus
publikalasatol, es a fo hangsuly az oktatasi es
tudomanyos gyujtokoron van. A masik, hogy az
egyszeruen formazott elektronikus szovegek
nem jelentenek konkurrenciat a szepen nyomtatott
konyvek sza'ma'ra (egy illusztralt, kemenykotesu
"Egri csillagok"-nak nem vetelytarsa a MEK-ben
levo text verzio). De ha nyomdai minosegu
dokumentumokat akarunk ezentul szolgaltatni,
akkor ez az e'rv megszunik.

Laci



További információk a(z) Mek-l levelezőlistáról