Re: [Textlib] Tárgyszó rendszer helyrerakása

Nagy Imre emre at vkpaks.hu
2007. Ápr. 6., P, 12:08:13 CEST


>Gondoljuk vegig mit is szeretnenk :) Van egy rekordmezonk, ahol nem fixen 
>de vannak hibas targyszavak. Mi alapjan fogjuk eldontetni a scriptunkel, 
>hogy a rekordon belul csereljen fel szavakat? :)
>A kerdes csak koltoi reszemrol...

Kérdés teljesen jogos, én egyenlőre ami könyvtárunk adatbázisát ismerem, 
csak a miénkről tudok nyilatkozni.

Ime pár példa az adatbáziunkból:

1: könyv:
Mágia - Tibet
Tibet - Mágia

2: Könyv
Görögország - Ókor - Mitológia
Mitológia - Görögország - Ókor

3: Könyv
Divat - Elmélet
Divat - Szemiotika

Hibás tárgyszavak 95%nál a határolójel a "szókoz vonal szókoz"
Tudok pár feltételt felállitani hogy mikor nem kell szétbontani egytárgyszót 
annak ellenére hogy a határolójel szerepel benne.
Ebből nincs sok max 3-4 darab.

Nálunk az a szerencse hogy a hibás tárgyszavak is egy egységes rendszerrel 
lett felvive, szétbontása viszonylag egyszerü gépi módszerrel, de kézi 
módszerrel való javitgatást feladtam.

Baj az hogy ahány könyvtár annyi szokás, igy kicsi a valószinüsége hogy egy 
program (egy paraméterezés) elég lesz több könyvtárnak is.
És kitudja za esetlegessen előforuló adatbázis hibák milyen kihatással lenne 
egy ilyen bonyoult rekordmodosítással

Eredmény persze nem lesz tökéletes, de honapok munkáját lehet vele 
megsprolni.

kérdés első körben a következő:

Ez a program a paksi városi könyvtárnak fog egyedül elkészülni (márha 
elkészül, és nem csak egy álom marad) a mi igényeink alapján. Vagy 
belevonunk más könyvtárakat is

Nagy Imre
Rendszergazda
Pákolitz István Városi Könyvtár
Paks
http://www.vkpaks.hu
msn: emre34 at msn.com 




További információk a(z) Textlib levelezőlistáról