Betuadatbazis
Lang Attila D.
lad at RENTAHOST.NET
2001. Okt. 30., K, 15:43:46 CET
Vélhető, hogy ma vagy holnap kikapcsolják a telefonomat, úgyhogy ha
nem jelentkezem, ezért van. Ha ez történne, akkor házifeladatul Rátok
bízom, hogy elmélkedjetek a dolog fölött, amíg meg nem jövök, aztán
kikérdezem ám... :)
> sokat gondolkodtam az elmult par napban ezen a betuadatbazison.
> Tegnap estere ugyanarra a kovetkeztetesre jutottam, mint amit ma
> reggel Drotos Lacitol olvastam: szvsz egyszerubb es gyorsabb a
> hianyzo betut megrajzoltatni egy profival.
Tamás, drága vagy. De igazán. Nekem kisezer ötletem volt már eddig
életemben, amikhez semmi egyéb nem kellett volna, mint előrántani egy
profit, aki megcsinálja, és dőlt volna a profit. Időnként meg is
tettem, hogy előrántottam a profit, mert mondjuk programozóra volt
szükség és ott volt a HIX Coderen egy csomó, de akkor kicsi dologról
volt szó, amit hipp-hopp megír és kész. Amikor egy barátom
meglehetősen munkaigényes szoftverötletét tervezgettük, semeddig se
tartott elővarázsolni három programozót, akik aztán szépen
visszaszivárogtak a rendes munkájukhoz és a szoftverötlet azóta is
pihen. A barátom csinálgatja.
A profiknak csupán három apró hibájuk van. Nem eléggé elérhetőek; nem
eléggé érnek rá; és nem elég lapos a zsebük ahhoz, hogy kedvtelésből
megcsináljanak ezt-azt. A profik már keresnek valamicskét, és ezért
még többet akarnak keresni, azt meg miből fizetném?
> Ettol fuggetlenul nem akarom egybol elparentalni az otletedet.
Köszike... :)
> Azt megtehetjuk, hogy kezdetnek felvesszuk a kapcsolatot a magyar
> piacon talalhato szoftvercegekkel es eladokkal, es elkezdjuk
> kiepiteni a betuadatbazist. Szerintem a Corel, az Adobe vagy a
> ScanDer Kft. orulne, mert ez is egyfajta reklam lenne nekik.
Öööö... lassabban egy picit. Mit kellene tennünk nekünk a Corellel?
Lajstromba venni az _ő_ fontjaikat? Ki van csukva, hogy ebbe
belemennének. Persze meg sem tiltanák nekünk, hiszen ha a magát a
fontot nem terjesztjük, őket aztán igazán nem érdekli, mit irkálunk
össze azokról a fontokról, amiket tőlük _vásároltunk,_ ha kedvünk
tartja, írjunk. Reklám? Gondolod, hogy a Corelnek a mi reklámunkra van
szüksége?
> Alighanem elobb-utobb el is lopnak az otletedet...
No, bár már látnám. Akkor nem nekem kellene dolgozni vele, csak
beírnám, hogy www.betuadatbazis.hu és egyből köpné nekem, hogy hol
találok hacsekes ipszilont farokkal.
> Aztan utana johetnek a free fontokat tartalmazo site-ok, van tobb,
> amelyik direkt erre (vagy erre is) szakosodott.
Elsősorban ezekkel kellene foglalkozni, mert ezekről semmilyen
információ nincs. A Corelnek van ügyfélszolgálata, aminek lehet írni
levelet, "zicsóklom, van önöknek olyan fontjuk, amiben található alef
három csillaggal kétszer aláhúzva, és ha nincs, melyik az? el tudnák
küldeni? köszönöm, igen, bankátutalással megfelelő lesz", az
ingyenfontok készítőinek ilyenjük nincsen. Nekik is lehetne írni, de
több ezren vannak.
> Ami viszont a TrueType-ot illeti, hat tudod, a nyomdaszok
> tekintelyes resze meg mindig a Type1-re eskuszik, szerintem nem is
> erdemtelenul.
Én is hallottam valamit harangozni, de eddig még nem jártam utána, mi
kell a Type1 használatához Win9x környezetben. Egyszer azért mégiscsak
megnézném őket.
> Ugyhogy bizony en azokat is felvennem a listaba, sot csak azokat
> igazan!
Természetesen fel kell venni őket. Semmilyen formátumot nem szeretnék
kizárni. Szívem szerint akár még a 8*16 pontos VGA képernyőfontokat is
belevenném, vagy legalábbis nem tiltanám meg explicite, hogy
szerepeljenek. Olyan aranyosak és olyan szépeket lehet rajzolni velük.
S különben is, aki a DOS-t nem becsüli, az a Linuxt nem érdemli.
> Az pedig roppantul erdekelne, milyen modszerrel nyerted ki hipp-hopp
> az Arial Unicode MS betuinek nevet.
A _nevüket_ semmilyennel. Nincs rá szükség, ott van a Unicode kimerítő
részletességű dokumentációja, csak a pdf-ek kitesznek harminc megát.
Ha utánanézel, küldtem szombaton ide listácskánkra egy
formátumtervezetet, amely elmondta, miképp kellessék leírni egy
fontról a tudnivalókat. Ebben szerepel egy UNICODE mező, amelyben
ilyenek szerepelhetnek: 100-217 ON. Ez azt jelenti, hogy a
Unicode-szabvány hexa 100-tól 217-ig terjedő karakterei a fontban
megvannak. Hogy a karakterek micsodák, azt a Unicode Konzorcium
megmondja. Én tehát fogtam egy unicode-os fontnéző programot (az Arjan
Mels' Font Viewert, www.stack.nl/~arjanm), s végigpörgettem a fontot.
Ahol karakter volt, fölírtam, hogy on; ahol kocka volt, azt írtam,
hogy off. S például a CJK Unified Ideographs tartománynál csak azt
kellett ellenőriznem, hogy nem maradt-e benne definiálatlan karakter;
nem két perc persze végignézni az egészet, de utána nincs más teendőm,
mint felírni: 4e00-9fa5 on, s ezzel több mint húszezer karakter
gondját megoldottam. Van olyan font, például az MS Gothic, amiben ezt
a nagyocska tartományt csak úgy tessék-lássék definiálták, rengeteg
karaktert kihagyva; ott ilyeneket kell majd írni: 6973-6975,
6977-6979, 697c-697e stb. Kegyetlenül fárasztó lesz, de egyszer kell
megcsinálni és soha többet az életben. Egyébként az se lehetetlen,
hogy valaki tud olyan segédprogramot írni, amivel a feladat
elvégezhető.
Nevekre akkor lesz szükség, ha a font nem unicode-os, ennélfogva hiába
írnám, hogy 00a0-00ff, nem lehetne tudni, hogy ott milyen karakterek
vannak. Ezeknél egyenként meg kell nevezni a karaktereket --
kárpótlásul viszont a teljes kódtartomány 256 darabból áll, és ennek
egy részével nem is kell foglalkozni. Például az Adhawin-Tamil font,
készítette K. Srinivasan 1996-ban, a következőképpen kerülhet be
adatbázisunkba. Először is ki kell deríteni, hogy honnan az ördögből
töltöttem le, mert anélkül ugye nem lehet megadni a linkjét, aztán
ilyeneket kell irkálni:
f5 tamil letter i
f6 tamil letter ii
f7 tamil letter u
f8 tamil letter uu
vagy
f5 b87
f6 b88
f7 b89
f8 b8a
Utóbbi a Unicode-ra hivatkozik, de ez nehezebb, mert ki kell keresni a
kódokat a táblázatból, ráadásul a font egy csomó ligatúrát is
tartalmaz, amiknek nincs kódjuk a Unicode-ban.
Hogy miképpen határozzuk meg a cirkalmatos tamil betűk nevét? Úgy,
hogy tudunk tamilul. Másképp nem lehet, ehhez a fonthoz még az se
elég, ha az én Íráskalauzom tamil betűlistáját tartjuk az orrunk elé
növényhatározó gyanánt, mert az is a Unicode alapján készült és semmit
se tud a ligatúrákról és alakváltozatokról. Én se tudok.
Következéképpen az Adhawin-Tamil csak akkor kerülhet bele teljes
részletességgel az adatbázisba, ha találunk valakit, aki beazonosítja
nekünk a betűket. A technikai eszközünk megvan rá. Ha viszont nem
találunk senkit, akkor sincsen tragédia, mert egyfelől azt is lehet,
hogy az ismeretlen betűk "tamil izé két hogyhívjákkal" gyanánt
kerülnek bele adatbázisunkba. A keresésnél így is megtalálják arról a
szóról, hogy tamil, és a mellékelt képből kiderül, hogy mi van a
betűn. Az is előfordulhat, hogy valaki úgy szeretne tamil betűt
felhasználni munkájában, hogy ő maga nem tud tamilul, csak valahova le
van neki rajzolva egy betű és azt szeretné reprodukálni, tehát a
nevével semmit se tud kezdeni, látnia kell ahhoz, hogy tudja, ő-e az,
akire neki szüksége van. Ezért nem tragédia, ha nem tudjuk minden betű
nevét.
És az se tragédia, ha ilyen okok miatt egyes fontok nem kerülnek be az
adatbázisunkba. Sokkal több font fog kimaradni azért, mert véges az
időnk és a rászánt munkaerőnk.
La'ng Attila D., iro <lad at rentahost.net> <http://lad.rentahost.net>
EBURAFAKO = Lampatisztitok kozismert kifakadasa.
További információk a(z) Mek-l levelezőlistáról