Betuadatbazis

Lang Attila D. lad at RENTAHOST.NET
2001. Okt. 29., H, 19:41:20 CET


  Juszt is megvédem az ötletemet! :)

CSABA

> ezzel nem értek egyet, az unicode.orgon igenis ott vannak kis
> gifecskék (vagy minima egy pdf, amibõl kinyerhetõk a képek),

  Kétségkívül ott vannak, Csaba. Van gif mondjuk az fb91-es kódú
karakterrõl, "Arabic letter keheh medial form", ahogy a szöveg mondja.
Szükséged van erre a karakterre egy mûben. Mit csinálsz? Beteszed a
gifet a szöveg kellõs közepébe, más betûk közé? Kicsit csúnyán fog
festeni.

> hogy melyik betû hogyan is néz ki, tehát ha adatbázist akar vki
> építeni, akkor szépen megnézheti és használhatja is.

  De az emberek nem adatbázist akarnak építeni, hanem _írásmûveket_
akarnak készíteni. Ezekben esetleg csak úgy mellesleg le kell írni egy
távoli ország elnökének vagy egy bájos tavacskának a nevét, amiben az
ottani nyelven egypár ékezetes betû található. Magában a mûben
semmilyen nyelvészeti vonatkozás nincs, arról szól, hogyan horgászott
az elnök a tavacska partján, de kellenének az ékezetek. A szerzõnek
két választása van: az elterjedt módszer szerint lenyesi az összes
ékezetet, avagy nem. Õ a másodikat szeretné választani -- talán
hagyjuk meg neki ezt a jogot --, és szüksége van egy fontra, amiben a
kérdéses betûk szerepelnek. Mit tegyen? Elzarándokol a unicode.orgra,
ahol megtudja a kérdéses betûk kódját, de mit kezdjen a kódokkal betûk
nélkül?

> ha másért nem is, pusztán a "hivatalos/szabványos" elnevezés és a
> mintakép miatt használható a unicode.org.

  Pontosan erre használható és erre kell is használni.

> de ahogy így elképzelem, akkor ez olyan adatbázis, amelyben minden
> fontkészletrõl föl kell sorolni, hogy mely tagjai vannak? arial
> unicode ms esetében akkor többtízezres lista? elég embertelen
> munkának tûnik...

  Ezt az embertelen munkát pontosan ennek az Arial Unicode MS-nek az
esetében én az elmúlt két napban elvégeztem. Közben még formába
öntöttem a betûadatbázis alapötletét adó szakdolgozatot, lefordítottam
egypár dokumentumot angolból, elolvastam pár fejezetet Harry
Potterbõl, lövöldöztem a jó öreg Wormsszal és legódoksikat töltögettem
pár órán keresztül. Ja, meg Veletek leveleztem. :) És elég sokat
aludtam. Az embertelen munka ennek ellenére készen van, eredménye egy
3116 byte-os file-ocska. (Bemásolom a levél végére, hátha nem esztek
meg érte.) Lehet, hogy nem hibátlan, de teljes, és segítségével a
Unicode-szabvány bármely karakterérõl (0000-tól FFFF-ig)
megállapítható, hogy szerepel-e az Arial Unicode MS-ben, anélkül, hogy
magát a fontot birtokolni kellene hozzá. Nem túl olvasmányos, az igaz,
de megfelelõ segédprogrammal azzá tehetõ.
  A dolog titka ugyanis az, hogy a karakterek neve és összes szükséges
tulajdonsága már le van írva a Unicode-szabványban. Innentõl nincs más
teendõ, mint felírni, hogy a definiált karakterek közül melyik
szerepel a fontban és melyik nem. Minden egyéb kiderül a szabványból.

>> a) Latin Small Letter R with Double Grave
> 0211
>> b) Latin Small Letter Y with Macron
> ezt nem találtam
>> c) Latin Capital Letter K with Line Below
> 1e34

  No, csak akadt egy helyes megfejtõ... :) A válasz helyes, a második
karakter hiányzik az Arial Unicode MS-bõl. Pedig megvan a kódja: 0233,
nagybetûs párja 0232.
  Teneked, Csaba, megvan a gépeden az Arial Unicode MS, így meg tudtad
keresni a toporzékolva követeltem betûket. Mit csináltál volna, ha
nincs meg a gépeden a font? Letöltöd a Microsoftról, hogy
utánanézhess? Aligha. Más módod pedig nincsen rá, ha nincs ez az
adatbázis.

LACI

> En sem hiszem, hogy jo otlet sok munkat fektetni az Interneten
> talalhato font-keszletek katalogizalasaba, mert a linkeknek
> atlagosan a fele 1 ev alatt elavul.

  A fontok attól még meglehetnek. Ha valaki ír valamit egy fontról, azt
úgyis csak úgy teheti, ha elõször is letölti, tehát ha máshol nem,
õnála meglesz és vissza tudja tenni a netre, ha kell. (Tudom, magamból
indulok ki, de én tényleg sose törlök le semmit...)

> Szerintem is gyujteni kellene inkabb oket (vagyis lemasolni es pl.
> CD-re irni), de erre a MEK nem tud vallalkozni,

  Persze, gyanítottam is. Semmi gond, nem Tõletek vártam, hogy még ezt
is a nyakatokba vegyétek.

> egy ilyen gyujtemeny elsosorban nyomdaszoknak hasznos, nem egy
> elektronikus konyvtarnak.

  Hát pedig itt mi, amint néha szajkózom, nyomdászok vagyunk. Néhányan
közülünk szakmájukat tekintve is azok, de mindenki valamilyen módon
szövegek rögzítésével és feldolgozásával foglalkozik. Létezhetnek
szövegek, amelyek igényelnek betûket. Most egy percre tekintsünk el a
"hogyan terjesszük a szövegeket a legkülönbözõbb platformokon"
szerteágazó kérdéskörétõl. Ha _egy_ platformon elkészítettünk egy
szöveget, azt könnyebben be lehet konvertálni a többire, mint... mint
hogyha azon az egy platformon se sikerül elkészíteni, mert hiányzik a
fõszereplõ nevének elengedhetetlen részét képezõ F betû két vesszõvel
és három ponttal. Ez a probléma tehát a MEK feladatkörén belül is
felmerül -- azzal együtt, hogy a MEK, bölcsen tudom, nem a szövegek
elkészítésére, hanem összegyûjtésére vállalkozott. De a legkülönbözõbb
kérdésekben adunk tanácsokat és nyújtunk segítséget. Most pár hete
fölhívott egy fiatal hölgy, akirõl sem azelõtt, sem azután nem
hallottam, és elmondta, hogy õneki betûk kellenének a
szakdolgozatához. Közölte, milyen betûk, én pedig nekiálltam és
megkerestem õket. Elég egyszerû és sokfelé elõforduló betûkre volt
szüksége, ezért nem volt nehéz begyûjteni a fontokat és postázni neki.
De ha hacsekes M-et keresett volna periszpomenivel és lila csillaggal,
már gondban lettem volna -- pedig lehet, hogy már tíz éve kint van a
neten gyönyörû szépen megrajzolva, MARSLAKO.TTF.
  Szóval segítséget nyújtunk idõnként, és saját magunk is segítségre
szorulunk, lásd a kazár font esetét. Az adatbázis azon segítene, hogy
az ilyen kérdéseket meg tudjuk oldani. Adott esetben ezen múlhat, hogy
egy kiadványt sikerül-e elkészíteni vagy sem, fõleg ha határidõ is van
rá.

> A TrueType fontok egy resze egyebkent copyright-os es draga penzert
> aruljak oket nagy gyujtemenyekben CD-n.

  Más részük ingyen van vagy shareware, azokkal kell foglalkozni. Bõven
sok munka az is.

> Persze ezek egy resze is "kiszivarog" a nyilvanos Internetre es
> utana nem konnyu eldonteni, hogy melyik is terjesztheto ezek kozul
> szabadon egy sajat szerverrol. Szoval nem egyszeru a dolog...

  Nem, de semmivel se nagyobb gond, mint a könyvek -- amelyek egy részét
hetvenhét pecsétes szerzõi jog védi és mégis itt figyelnek a CD-imen.

> Lehet, hogy konnyebb megrajzolni azt az eppen hianyzo specialis
> karatert egy font-tervezovel (vagyis pl. ratenni azt a ket pontot a
> cirill "i"-re),

  _Azt_ tényleg könnyû, mert i van, pont van, csak össze kell rakni. De
a kazár betûk megrajzolására nem vállalkoztam volna, pedig csak egypár
görbe vonal és ficak. Nem tudok rajzolni és rossz tapasztalataim
vannak a fontszerkesztõ programokkal. Ezenfelül ha valaki már
megrajzolta a nekem szükséges betût profi minõségben és ingyen
hozzáférhetõvé tette, akkor bolond leszek rajzolgatni -- ha tudok
róla, hogy a betû hol található.

> mint egy hatalmas adatbazist epitgetni es naprakeszen tartani.

  Nem kell azt naprakészen tartani. Ha egy föltérképezett font eltûnik a
webrõl, hát istenkém, pech. A leghíresebb keresõrendszerekben idõnként
úgy ráfutok a törött linkre, mint Titanic a jéghegyre (neki a jéghegy
lyukasztotta ki az oldalát, nekem a kíváncsiság, hogy mi lehetett a
link mögött) -- nem lesz tragédia, ha ilyen nálunk is elõfordul. Ha
pedig a fontokat magunk gyûjtjük össze -- nem a MEK site-ján, máshol
--, akkor nem lesznek törött linkek. Ha valamely font jogvédett, a
jogtulajdonos kérni fogja a levételét és le fogjuk venni, ezen ne
múljék.
  Ha pedig új font jelenik meg a weben, benne a legszebb umlautos
B-kkel, és mi nem szerzünk tudomást róla, hát istenkém, megint pech.
Egy híres lexikon készítõivel is elõfordult -- Ráth-Végh meséli --,
hogy már a Mi kezdetû címszavaknál tartottak, amikor riadtan vették
észre, hogy a Mediciek kimaradtak -- és folytatásokban jelent meg a
munka, már az olvasóknál volt. Hát segítettek magukon: "Midici,
helyesebben Medici." Ha õk hibázhattak, nekünk se kell kimerítõ
részletességgel mindent dokumentálni. Ha az adatbázis népszerû lesz és
használják, elõbb-utóbb úgyis lesz annyi segéderõ, hogy levadásszák az
érdekes fontokat. Ha meg nem lesz népszerû és nem használják, akkor
teljesen mindegy, hogy mi van benne, el lehet felejteni. De elõször ki
kellene próbálni.

> Persze emellett lehet/erdemes egy kis "hazi" gyujtemenyt is
> osszeszedni a fontosabb es kulonlegesebb font-okbol.

  Olyanja mindenkinek van, gondolom, kinek-kinek aszerint, hogy mire van
szüksége. De kevesen katalogizélik. Én is már mióta szeretnék legalább
egy olyat csinálni, hogy legalább a töméntelen tamil fontomat meg
tudjam különböztetni a töméntelen hindi fontomtól (valami szerveren
százával hemzsegtek), de lusta vagyok hozzá, mert annak úgyis csak én
venném hasznát, ha az itthoni fontjaim katalogizálva lennének.
_Ennek,_ amit most kitaláltam, nagyobb haszna lehetne.

  Azért kicsit szomorkás a hangulatom máma. Többen is jónak tartottátok
az ötletet, mégis egyedül érvelek itt szokott bõbeszédûségemmel. Aki
jónak tartja az ötletet, segíthetne valamit tevõlegesen is. Állítom,
hogy az egész munkát egyetlen ember is el tudja végezni, de akkor az
olyan is lesz. Ez többszemélyes buli lenne.

La'ng Attila D., iro <lad at rentahost.net> <http://lad.rentahost.net>
KOALA = Medvebol sajtolt udito ital.



További információk a(z) Mek-l levelezőlistáról