MEK 2.0-s formatumok
Drotos Laszlo
kondrot at GOLD.UNI-MISKOLC.HU
2001. Jún. 26., K, 14:20:10 CEST
Va'rtam kicsit, hogy gyuljenek a velemenyek (koszonet ertuk!),
most megprobalok egyszerre valaszolni mindegyikre:
Lang Attila D. irta:
> Legyen egy "minimalis formatum", ami semmi egyebet nem
> biztosit, mint a szoveg olvashatova tetelet a leheto
> legnagyobb olvasokozonsegnek.
>
> De legyen egy "maximalis formatum" is, ami arra szolgal,
> hogy a szoveg a leheto legjobb es legszebb allapotban is
> elerheto legyen, barminemu ujrafeldolgozasra alkalmas
> formaban, nem torodve azzal, hogy az olvasokozonseg
> mekkora hanyada tudja ugy elerni.
>
> Van azonban egy kerdes, ami minden formatummeghatarozas
> utan felmerul: es ki fog konvertalni? Mert ha a szerzok,
> akkor az olyan is lesz, ha pedig a MEK mozgosit erre
> embereket, akkor az izraeli--arab konfliktus elobb oldodik
> meg, mint a MEK teljes anyaganak bekonvertalasa...
> Szoval ki fog Szerintetek konvertalni?
Itt a dolog le'nyege! A MEK-be a legkulonbozobb forrasokbol
es formatumokban erkeznek szovegek, es a legszelesebb
felhasznaloi kornek es felhasznalasi celokra szeretnenk
szolgaltatni azokat. A szukseges konvertalasokat mindenkeppen
a sajat, nem tul nagy "emberi eroforrasainkkal" kell megoldani,
a leheto legjobb eredmeny/elomunka raforditassal. Ha minimalis
es maximalis formatumot is csinalunk, az mindenkeppen tobb
munka. Meg lehet csinalni, csak kerdes, hogy mege'ri-e? Az
egyszeru text formatumot (ba'r en nagyon szeretem), ma ma'r
az internetezok tobbsege "lene'zi", csunyanak tartja (raadasul
a legelterjedtebb Internet Explorer 5-os kifejezetten uta'lja,
a legujabb szupergepemen kepes egy 150 kbyte-os text file-tol
lefagyni, foleg ha elinditok egy kerese'st a Ctrl/F-fel). A
mindenre jo, "legjobb es legszebb" formatum pedig me'g nem
szuletett meg, vagyis a "maximalis formatumu" dokumentumbol
is valoszinuleg tobb alternativa't kell/kellene kesziteni,
hogy minden igenyt kielegitsen.
Kerdes ezek utan, hogy - a realitasokat figyelembe ve've -
nem jobb-e olyan megoldasra torekedni, amely egyszerre
biztosit esztetikus es rugalmasan felhasznalhato elektronikus
szovegeket, es ugyanakkor csak a minimalisan szukseges
"extra'kat" tartalmazza, hogy a leheto legkisebb legyen
annak az ese'lye, hogy valaki bosszankodni kezd egy
MEK-bol letoltott dokumentumnal? (Erre szolgalnanak ezek
az ajanlasok, melyeket a HTML, Word es PDF formatumokhoz
allitanank ossze, es amiket igyekeznenk ezentul betartani
es javasolnank a kovetesuket azoknak, akik a MEK reszere
keszitenek anyagokat.)
Lang Attila D. irta:
> Nagyobb, szakirodalmi term=E9szet=FB anyagokn=E1l bevenn=E9m az
> aj=E1nl=E1sba a sitemapot =E9s adott esetben a t=E1rgymutat=F3t is.
Az ajanlas csak az altalanos elveket rogziti, minden egyeb
esetben a HTML-szerkesztojenek belatasara van bizva, hogy
milyen tobbletfunkciokat tesz bele. Ha egy konyvben van
targymutato, akkor termeszetesen azt erdemes megcsinalni
az elektronikus verzioban is, de nem irhatjuk ezt elo
ajanlaskent.
Lang Attila D. irta:
>Hozz=E1tenn=E9m, hogy csak relat=EDv fontm=E9reteket haszn=E1ljunk;
>nemr=E9g volt dolgom olyan weboldallal, ahol sok sz=F6veg volt
>tal=E1lhat=F3 apr=F3 bet=FBkkel, s nem lehetett =E1t=E1ll=EDtani a
>View/Text Size paranccsal, mert fixen bele volt k=F3dolva a m=E9ret.
Ez benne van az ajanlasban:
- A dokumentum k=FClalakj=E1t 800x600-as 256 sz=EDn=FB k=E9perny=F5re
kell tervezni, de =FCgyelni kell arra, hogy m=E1s felbont=E1sban
is j=F3l olvashat=F3 maradjon. Vagyis lehet=F5leg minden=FCtt
relat=EDv m=E9reteket adjunk meg (bet=FBm=E9ret, t=E1bl=E1zat-sz=E9les=
s=E9g
stb.),
Lang Attila D. irta:
>Bevenn=E9m az aj=E1nl=E1sba, hogy a hosszabb foly=F3sz=F6veg
>mindenk=E9ppen Timesszal legyen, mert mind a groteszk, mind
>az =EDr=F3g=E9pbet=FB cs=FAf, alkalmatlan.
Ez is benne van (annyi kulonbseggel, hogy ha csak egy
betutipus van, akkor azt nem kellene definialni egyaltalan,
meg kell hagyni a bongeszoben beallitott default font-ot):
- <font face=3D> c=EDmk=E9t lehet=F5leg ne haszn=E1ljunk, mert
nem lehet tudni, hogy az olvas=F3nak van-e megfelel=F5
fontk=E9szlete a g=E9p=E9n, =E9s ez kisz=E1m=EDthatatlan eredm=E9nyre
vezet. Ha m=E9gis k=FCl=F6nb=F6z=F5 bet=FBkre van sz=FCks=E9g=FCnk, a=
kkor
a "Times", "Arial" =E9s "Courier" fontokat alkalmazzuk
csak (az alap-bet=FBt=EDpus ilyenkor is a Times).
Lang Attila D. irta:
>> Az id=E9z=F5jeleket egyszer=FB " karakterrel kell =EDrni az id=E9zet
>> elej=E9n =E9s v=E9g=E9n egyar=E1nt, a bels=F5 id=E9z=F5jeleket >> illetv=
e <<
>> jelekkel, a gondolatjeleket egy egyszer=FB - jellel, a f=E9lbehagyott
>> mondatot jelz=F5 h=E1rom pontot pedig igy: ...
> Ez viszont megnehez=EDti az esetleges nyomdai =FAjrafeldolgoz=E1st,
> rontja a k=FClalakot, s=E9rti a helyes=EDr=E1si szab=E1lyokat. A teljessz=
=F6veg=FB
> keres=F5t meg lehetne r=E1juk tan=EDtani, az olvas=F3k g=E9pein pedig sze=
rintem
> ezek az alapszint=FB jelek ma m=E1r megtal=E1lhat=F3k.
Mint a hozzaszolasokbol kiderult, ezek a jelek nem talalhatok meg
mindig az olvasok gepein, pontosabban a Web-bongeszok nem biztos,
hogy rendesen megjelenitik oket. (Magam is sokszor tapasztaltam.)
Celszerubb talan megkerulni a problemat es az ajanlasban javasolt,
biztonsagos ASCII karakterekkel helyettesiteni oket. Szukseg
esete'n nem nagy munkaval visszacserelhetok (a Word-ben pl.
van "irogep-idezojelet nyomdai idezojelre" cserelo funkcio),
illetve a bongeszesre sza'nt HTML verzio mellett tobbnyire
ott lesz - ha van - az eredeti Word (pontosabban RTF vagy PDF)
valtozat is, amiben a helyes nyomdai jelek hasznalhatok.
Lang Attila D. irta:
>> - A bekezd=E9seket <p> c=EDmk=E9vel kell elv=E1lasztani egym=E1st=F3l. H=
osszabb,
>> folyamatos sz=F6vegekn=E9l (pl. reg=E9nyek) a <p align=3Djustify> opci=
=F3
>> aj=E1nlhat=F3, mert =EDgy szebb az =F6sszhat=E1s. A bekezd=E9sek elej=E9=
re nem
>> kell beh=FAz=E1st csin=E1lni (pl. egy kis k=E9ppel vagy k=F3dokka=
l),
>> a j=F3 olvashat=F3s=E1ghoz elegend=F5 a <p> =E1ltal l=E9trehozott t=E1v=
ols=E1g a
>> bekezd=E9sek k=F6z=F6tt.
>Viszont ellenkezik a tipogr=E1fiai szab=E1lyokkal. Nem hiszem, hogy a
>pap=EDr =E9s a k=E9perny=F5 k=F6z=F6tti k=FCl=F6nbs=E9g indokoln=E1 ezt, m=
=E9g kev=E9sb=E9
>hiszem, hogy ha egy sz=F6veg olvashat=F3 pap=EDron, de ugyanabban az
>=E1llapot=E1ban nem olvashat=F3 k=E9perny=F5n, akkor puszt=E1n a bekezd=E9=
sek
>k=F6z=F6tti t=E1vols=E1gt=F3l olvashat=F3 lesz. Ami a beh=FAz=E1st illeti,=
annak
>hi=E1nya szint=E9n ellenkezik a tipogr=E1fiai szab=E1lyokkal. =C9ppen most
>van a kezemben egy k=F6nyv, amit =EDgy adtak ki 1991-ben, s mondhatom,
>roppant cs=FAnya.
A papirrol es a kepernyorol valo olvasas kozott lenyeges kulonbsegek
vannak, es ami az egyiken jol mutat es kellemesen olvashato, az
a masikon nem szuksegszeruen van ugyanigy. A tipografiai szabalyokat
a nyomtatott szovegekhez talalta'k ki, az elektronikus konyvekre
nem vonatkoznak automatikusan. A Web-oldalak tulnyomo tobbsegene'l
nem hasznalnak behuzast es <p> cimkevel valasztjak el a bekezdeseket
egymastol. Ez az altalanosan elfogadott, megszokott kulalak a Weben,
nem hiszem, hogy el kellene tole te'rni. (A Word es PDF formatumu
konyvek eseteben - melyek ma'r nyomtatasra is alkalmasak - persze
lehet majd behuzast alkalmazni. Az egy masik vita temaja lesz.)
Lang Attila D. irta:
>> A l=E1bjegyzet hivatkoz=E1sokat sorsz=E1mozni kell (ha csak egy-k=E9t
>> darab van, akkor elegend=F5 csillagokkal jel=F6lni =F5ket) =E9s sz=F6gle=
tes
>> z=E1r=F3jelek k=F6z=E9 tenni.
> A sz=F6gletes z=E1r=F3jel is ellenkezik a tipogr=E1fiai =E9s helyes=EDr=
=E1si
> szab=E1lyokkal.
Itt megint nem erzem e'rvnek a szabalyokra valo hivatkozast.
Szerintem jo otlet szogletes zarojellel kiemelni a labjegyzetek
hivatkozasait a szovegben, jol is mutat es egyertelmu.
Valas Gyorgy irta:
> Most nem jelentkezik a MEK, nem tudom megnezni, fent van-e ez a
> szoveg a Ruhatarban. Szerintem oda valo ma'r veglegesites elott is.
A MEK Irattarban lesz, a tobbi ajanlassal egyutt, amint egy 1.0-as
verzio osszeall. (A hetvegen atvezetem rajta az addig erkezett,
hasznosnak bizonyult javaslatokat es kiteszem.)
Valas Gyorgy irta:
> Javaslom a szineket a http://www.lynda.com/hex.html
> weboldalon talalhato bongeszofuggetlen szinekre korlatozni.
Onnan vettem oket, de az a baj, hogy ezek kozott nincs
megfelelo vilagos hatterszin. Mindenkeppen vilagos hatteret
kellene hasznalni, viszont az FFFFFF tul kontrasztos es
vakit, az FFFFCC pedig ma'r tul sarga (gyomorsavat csinal ;-)).
Az ajanlasban javasolt FFFFEE kozel a'll ahhoz a tojashe'j
szinhez, amit eddig is gyakran hasznaltunk a MEK-ben.
Megneztem 16 szinu Windows-ban is mindenfele regi
bongeszovel, es nem torzul el zavaro mertekben, majdnem
feher lesz.
Valas Gyorgy irta:
>Javaslom, hogy a Courier betutipus legyen az elsodlegesen
>ajanlott minden olyan helyen, ahol egyenkozu tipusra van
>szukseg.
Ez benne van az ajanlasban (lasd a fenti idezetet), azzal
a kulonbseggel, hogy ha nem muszaj, akkor nem kell kulon
definialni ezt sem, ra kell bizni a bongeszore, hogy a
default font-ot hasznalja a <pre> formatumu reszeknel.
Zsadanyi Nagy Csaba irta:
>ebb=F5l a list=E1b=F3l a css-t szerintem ki kell h=FAzni, ugyanis a
>lehet=F5 legkev=E9sb=E9 b=F6ng=E9sz=F5f=FCgg=F5! sokkal ink=E1bb b=F6ng=E9=
sz=F5 =E9s
>oper=E1ci=F3srendszer-f=FCgg=F5 a <font xxx=3D""></font>, ezek
>haszn=E1lata helyett kellene a css-t min=E9l intenz=EDvebben
>haszn=E1lni.
A stiluslapokat a regebbi bongeszok nem ismerik, nagyon
csunya a vegeredmeny ilyen esetben. Az uj bongeszok
pedig nem mentik el, vagyis egy lementett Web-lap
visszatoltes utan ismet "csupasz", formazatlan lesz.
(Kivetel ez alol az 5-os Explorer, ami a .css file-t
is elmenti egy "xxx.elemei" nevu alkonyvtarba, amennyiben
"teljes Web-lap" formatumban ke'rjuk a mentest, de ezt
megint nehez megmagyarazni egy atlagfelhasznalonak.)
Tovabba a jo stiluslapok keszitese szakertelmet illetve
CSS-t tamogato HTML-szerkeszto szoftvert kiva'n, amit
nem lehet eloirni a MEK sza'ma'ra dolgozoknak.
Zsadanyi Nagy Csaba irta:
>a gif helyett is igenis =E9rdemes volna a png-re =E1tt=E9rni,
>l=E9v=E9n az el=F5z=F5vel 'kopir=E1lyt-vit=E1k' voltak/vannak, egy
>csom=F3 linuxos disztribbe helyb=F5l nem is t=E1mogatott
>=E9ppen ez=E9rt.
A GIF-fel kapcsolatos copyright-vita tudtommal arrol
szolt, hogy ha valaki olyan szoftvert ir, amiben a GIF
kodolo vagy dekodolo algoritmusat hasznalja, az fizessen
jogdijat. Maguk a GIF kepek nyugodtan es ingyenesen
hasznalhatok, terjeszthetok, es van is beloluk boven
az Interneten, sokkal tobb, mint a PNG-bol. A PNG-t
a regebbi bongeszok es egyeb szoftverek nem ismerik,
nem tartom indokoltnak a MEK-ben valo ajanlasat.
Zsadanyi Nagy Csaba irta:
>> A Windows Latin-2-es (8859-2) k=F3dk=E9szlet=E9vel kell =EDrni az =E9kez=
etes
>> bet=FBket, nem haszn=E1lunk "acute"-k=F3dol=E1st, mert megn=F6veli a m=
=E9retet
>> =E9s rosszul olvashat=F3v=E1 teszi a file-t.
>na ez =EDgy nagyon-nagyon ellentmond=E1sos! egyr=E9szt t=F6reksz=FCnk a
>szabv=E1nyoss=E1gra, m=E1sr=E9szt meg nem? egy baromi egyszer=FB kis szkri=
pttel
>b=E1rmikor lehet szabv=E1nyos szekvenci=E1kkal lek=F3dolt html sz=F6veget
>windowsos textt=E9 var=E1zsolni, de csak el=E9g megn=E9zni, hogy p=E9ld=E1=
ul az
>[alt]+0148 karakterkombin=E1ci=F3 milyen gy=F6ny=F6r=FB =FCres n=E9gyzetec=
skek=E9nt
>jelenik meg 4.0-s explorer f=F6l=F6tt iso-8859-2vel (win 1250-nel m=E1r
>t=E9nyl=E9eg z=E1r=F3 id=E9z=F5jel, de ez megint nem szabv=E1nyos). nem az=
t mondom,
>hogy legyen k=F6vetelm=E9ny az "acute"-k=F3dol=E1s, de ink=E1bb ez legyen =
a
>t=E1mogatott
A nyomdai idezojelek problemaja megkerulheto, ha helyettuk irogep
idezojelet hasznalunk (lasd fent). Az acute kodolas hasznalatanak
ajanlasa az osszes magyar ekezetes betuhoz megfontolando a HTML
szabvanyhoz valo ragaszkodas miatt, csak kerdes, hogy mege'ri-e?
Ha minden HTML file-t acute-ra kodolunk a szerveren valo
elhelyezes elott, akkor tobb mint 40%-kal megno a meretuk,
ami konyvnyi szovegeknel jelentos. Az ilyen file utana ma'r
nagyon nehezen javithato, ha csak nehany hibat kell kijavitani
benne, akkor is elobb vissza kell konvertalni vagy egy HTML-
szerkesztobe betolteni. A HTML, SGML, XML egyik elonyekent
szokas emlegetni, hogy a szoveg a benne levo tag-ektol eltekintve
olvashato marad (erre kulonbozo okok miatt barmikor szukseg
lehet), viszont egy acute-tal kodolt magyar szovegtol elborzad
az, aki nem tudja, hogy hogyan kell visszakonvertalni.
Zsadanyi Nagy Csaba irta:
>>(Az id=E9z=F5jeleket egyszer=FB " karakterrel kell =EDrni az id=E9zet
>>elej=E9n =E9s v=E9g=E9n egyar=E1nt,
>enn=E9l m=E9g a linuxos k=E9t vessz=F5 alulra, =EDr=F3g=E9p id=E9z=F5jel f=
=F6l=FClre is
>jobb, hihetetlen szenved=E9s kitakar=EDtani egy html file-b=F3l a kezd=F5,
>z=E1r=F3 id=E9z=F5jel helyettis haszn=E1lt "-jeleket, nem is besz=E9lve ar=
r=F3l,
>hogy magukban a html elemekben is =E9ppen eleget fordul el=F5.
Miert kellene kitakaritani az idezojeleket egy file-bol? (Ha
nyomdaira akarjuk lecserelni, akkor azt a Word ugyesen megcsinalja,
vagy irni kell egy kis scriptet/makrot, ami minden paratlan
sorszamu idezojelet also-ra, minden parosat felsore cserel.
A ketvesszos also idezojelet nem javaslom, mert nem szep.
Az irogep idezojel hasznalata megszokott a szamitogepes
kepernyokon, nem tartom feltetlenul szuksegesnek a nyomdai
irasjelek hasznalatat (ugyanez vonatkozik a gondolatjelre,
a harom pontra stb.) (A Word es PDF formatumok eseteben
termeszetesen lehet majd ezeket ajanlani, mert azoknal
biztosabb, hogy helyesen jelennek meg.)
Zsadanyi Nagy Csaba irta:
>igaz=E1b=F3l a szimpla magyar sz=F6vegek eset=E9ben is =E9rdemes
>volna el=F5bb-ut=F3bb =E1tt=E9rni az utf-8/16-ra, mert ez egy
>=E9letre v=E9get vet a kalapos u hull=E1mos o kever=E9s=E9nek azzal,
>hogy a 336-337 ill. a 368-369-re teszi az =D5-=F5 =DB-=FB-t.
Az UTF8/16-os kodolassal reszben ugyanaz a helyzet, mint
az acute-tal, tovabba egyelore nem varhatjuk el a MEK
olvasoitol, hogy kepesek legyenek ezt a kodolast olvasni
es szukseg eseten Latin-2-re konvertalni. Nem lehet tudni,
hogy vegul melyik kodolas fogja vegleg megoldani az
ekezetek es egyeb specialis karakterek problemajat
az Interneten, egyelore csak a "szabvanyok" szaporodnak.
Vizvari Tamas irta:
>> folyamatos sz=F6vegekn=E9l (pl. reg=E9nyek) a <p align=3Djustify> opci=
=F3
>> aj=E1nlhat=F3, mert =EDgy szebb az =F6sszhat=E1s. A bekezd=E9sek elej=E9=
re nem
>> kell beh=FAz=E1st csin=E1lni (pl. egy kis k=E9ppel vagy k=F3dokka=
l),
>> a j=F3 olvashat=F3s=E1ghoz elegend=F5 a <p> =E1ltal l=E9trehozott t=E1vo=
ls=E1g a
>> bekezd=E9sek k=F6z=F6tt.
Sajnos teljesen mindegy, hogy left vagy justify, ha ugyanis nincs
elvalasztas, a justify is iszonyuan ronda lehet... A bekezdesek
elejet illetoen viszont Lang Attilaval ertek egyet. Az
kodot kivetelesen mindegyik bongeszo ismeri. ;-))
Ha eleg sze'les az ablak, akkor nem ronda a justify elvalasztas
nelkul sem. Egy hosszu szoveg szerintem szebb kiegyenlitett
margokkal. Hogy ne csak a levegobe beszeljunk, csinaltam
nehany variaciot, kiegyenlitett es nem kiegyenlitett margokkal,
behuzott es nem behuzott bekezdesekkel: http://mek.oszk.hu/temp/
Erdemes tobbfele bongeszovel es ablakmeretben is megnezni,
es megfigyelni, hogy melyik adja a legesztetikusabb es szemmel
jol kovetheto szoveget. A szoveg kozepetol vannak hosszabb
parbeszedes reszek, erdemes azt kulon is megnezni.
Laci
További információk a(z) Mek-l levelezőlistáról