Forma--1, Forma--2...
Gyulai Mihaly
gyulai at LINUXFAN.COM
1999. Sze. 30., Cs, 19:47:52 CEST
On Thu, Sep 30, 1999 at 12:42:32AM +0100, La'ng Attila D. wrote:
>> Valoszinuleg Word 6-ig bezarolag nezted... Mint kiderult szamomra,
>> az ujabb verziok tomoritve ta'roljak a szoveget, igy az
>> tobbnyire olvashatatlan.
> Hát ezt így hirtelenjében nem tudom megmondani, de valamennyire
> olvashatók voltak Word 7-8-cal készült dokumentumok is.
A fenti megjegyzést azért tettem, mert valaki azt írta, hogy
Word-ben kisebb a dokumentum, mint sima szövegként.
Ez csak úgy lehet, ha a szöveget tömörítve tárolja.
Akkor olvashatatlan (vagy nehezen olvasható...).
Ha nagyjából olvasható a szöveg (ahogy másvalaki írta),
akkor meg biztosan nagyobb, mint a sima ASCII.
Egy logikai ellentmondás volt, amire kénytelen voltam rámutatni...
Egyik esetben sem jobb Word-ben tárolni a szöveget, mint ASCII-ben.
>>> Egyébként a bináris tárolást is meg lehet fejteni,
>>> csak id? és fej kell hozzá.
>> Vallalod megirni az ilyen programot ? (a Word 6 utani verziokra)
> Nem azt mondtam, hogy meg _tudom_ fejteni, meg _lehet_ fejteni.
Ez is az a terület, amikor jobb, ha maradunk a konkrétumoknál...
Nagyon sok mindenről ki lehet jelenteni, hogy lehetséges,
de hasznosabb azt mondani, hogy 'lehetséges, mert meg tudom csinálni'...
Eddig 2, Linuxon működő Word-olvasó programmal találkoztam,
az egyik csak Word 6, a másik Word 8-at próbált olvasni, de
nekem egyik sem működött (talán azért, mert a programok szerzői
angol nyelvű szövegekkel dolgoztak...).
(nem StarOffice nagyságú programokról van szó !).
Az egyik nehézséget egyébként az jelenti, hogy a Microsoft
nem hozza nyilvánosságra a Word-ökben alkalmazott tárolási
módszereket, így valóban csak _megfejteni_ lehet a szöveget,
de a visszakódolás biztosan nem 100 %-os...
Szerintem ekkora munkabefektetést nem ér meg a megfejtés,
egyszerűbb vagy sima szövegként, vagy valami más, jól dokumentált
módszerrel tárolni a szöveget.
> Melyik a Wordnél jobb formátum? Mert eddig arról polemizáltunk, hogy
> minden formátumnak vannak el?nyei és hátrányai.
A Word-nél olvashatóság szempontjából jobb a sima ASCII,
ha pedig a szöveg grafikai megjelenése lényeges,
akkor jobb a PDF...
>> ... ha az a 30 mega sima ASCII szoveg, akkor eloszor
>> szet kellene darabolni regenyenkent es ugy dolgozni rajtuk.
> Pontosan ezen dolgozunk.
Szabad kérdezni, hogy milyen problémákat kell(ett) megoldani
a szöveg szétdarabolásához és milyen módszerrel sikerült ezeket
megoldani ?
(emlékszem rá, hogy korábban volt erről szó, de nem tudom,
most hol tart ez a folyamat...).
Most ez szakmai szempontból érdekel.
>> Nem hiszem, hogy eletszeru lenne az a szituacio, hogy
>> valaki betolt egy 10 kotetes lexikont, hogy elolvassa...
> Mintha a keresésr?l lett volna szó. Azért akartad egy darabba rakni a
> Bronstejn-könyvet, hogy lehessen benne keresni. Egy tízkötetes lexikonban
> nem akarsz keresni?
De _akarok_ lexikonban is kerestetni, csak a 2 szöveg
nem azonos kategória a terjedelmük miatt.
A Bronstejn könyv mondjuk 1 db lexikonkötetnek felel meg,
tehát ha ugyanazzal a módszerrel van tárolva mindkét szöveg,
akkor a Bronstejn-ben biztosan gyorsabb a keresés.
--
Gyulai Mihály http://www.freeyellow.com/members5/gyulai/
Ne hagyd, hogy egy bolond megcsókoljon, vagy egy csók elbolondítson.
További információk a(z) Mek-l levelezőlistáról