Forma--1, Forma--2...

Gyulai Mihaly gyulai at LINUXFAN.COM
1999. Sze. 30., Cs, 19:47:52 CEST


On Thu, Sep 30, 1999 at 12:42:32AM +0100, La'ng Attila D. wrote:

>> Valoszinuleg Word 6-ig bezarolag nezted... Mint kiderult szamomra,
>> az ujabb verziok tomoritve ta'roljak a szoveget, igy az
>> tobbnyire olvashatatlan.

> Hát ezt így hirtelenjében nem tudom megmondani, de valamennyire
> olvashatók voltak Word 7-8-cal készült dokumentumok is.

A fenti megjegyzést azért tettem, mert valaki azt írta, hogy
Word-ben kisebb a dokumentum, mint sima szövegként.

Ez csak úgy lehet, ha a szöveget tömörítve tárolja.
Akkor olvashatatlan (vagy nehezen olvasható...).
Ha nagyjából olvasható a szöveg (ahogy másvalaki írta),
akkor meg biztosan nagyobb, mint a sima ASCII.

Egy logikai ellentmondás volt, amire kénytelen voltam rámutatni...

Egyik esetben sem jobb Word-ben tárolni a szöveget, mint ASCII-ben.

>>> Egyébként a bináris tárolást is meg lehet fejteni,
>>> csak id? és fej kell hozzá.

>> Vallalod megirni az ilyen programot ? (a Word 6 utani verziokra)

> Nem azt mondtam, hogy meg _tudom_ fejteni, meg _lehet_ fejteni.

Ez is az a terület, amikor jobb, ha maradunk a konkrétumoknál...

Nagyon sok mindenről ki lehet jelenteni, hogy lehetséges,
de hasznosabb azt mondani, hogy 'lehetséges, mert meg tudom csinálni'...

Eddig 2, Linuxon működő Word-olvasó programmal találkoztam,
az egyik csak Word 6, a másik Word 8-at próbált olvasni, de
nekem egyik sem működött (talán azért, mert a programok szerzői
angol nyelvű szövegekkel dolgoztak...).
(nem StarOffice nagyságú programokról van szó !).

Az egyik nehézséget egyébként az jelenti, hogy a Microsoft
nem hozza nyilvánosságra a Word-ökben alkalmazott tárolási
módszereket, így valóban csak _megfejteni_ lehet a szöveget,
de a visszakódolás biztosan nem 100 %-os...

Szerintem ekkora munkabefektetést nem ér meg a megfejtés,
egyszerűbb vagy sima szövegként, vagy valami más, jól dokumentált
módszerrel tárolni a szöveget.

>   Melyik a Wordnél jobb formátum? Mert eddig arról polemizáltunk, hogy
> minden formátumnak vannak el?nyei és hátrányai.

A Word-nél olvashatóság szempontjából jobb a sima ASCII,
ha pedig a szöveg grafikai megjelenése lényeges,
akkor jobb a PDF...

>> ... ha az a 30 mega sima ASCII szoveg, akkor eloszor
>> szet kellene darabolni regenyenkent es ugy dolgozni rajtuk.

>   Pontosan ezen dolgozunk.

Szabad kérdezni, hogy milyen problémákat kell(ett) megoldani
a szöveg szétdarabolásához és milyen módszerrel sikerült ezeket
megoldani ?
(emlékszem rá, hogy korábban volt erről szó, de nem tudom,
most hol tart ez a folyamat...).
Most ez szakmai szempontból érdekel.

>> Nem hiszem, hogy eletszeru lenne az a szituacio, hogy
>> valaki betolt egy 10 kotetes lexikont, hogy elolvassa...

> Mintha a keresésr?l lett volna szó. Azért akartad egy darabba rakni a
> Bronstejn-könyvet, hogy lehessen benne keresni. Egy tízkötetes lexikonban
> nem akarsz keresni?

De _akarok_ lexikonban is kerestetni, csak a 2 szöveg
nem azonos kategória a terjedelmük miatt.

A Bronstejn könyv mondjuk 1 db lexikonkötetnek felel meg,
tehát ha ugyanazzal a módszerrel van tárolva mindkét szöveg,
akkor a Bronstejn-ben biztosan gyorsabb a keresés.

--
Gyulai Mihály   http://www.freeyellow.com/members5/gyulai/

Ne hagyd, hogy egy bolond megcsókoljon, vagy egy csók elbolondítson.



További információk a(z) Mek-l levelezőlistáról