[Textlib] TIOP 1.2.3 közös kereső - hibatűrő megoldás
Szabó István
szistvan at mail.vcsk.hu
2009. Nov. 13., P, 16:48:07 CET
Hi!
A pályázat keretein belül egy közös keresőt fogunk üzemeltetni, aminek a
rendelkezésre állását szeretném megnövelni, hogy egy-egy könyvtári
adatbázis kiesésével tovább tudjam szolgáltatni a _digitalizált_ adatokat.
Tehát a feladat "szóló" könyvtár esetén nem igazán értelmezhető, ott nem
is igazán lenne értelme.
A probléma: 3 könyvtár (pl. Karcag, Szolnok, Budapest), közös keresővel
van felvértezve. Minden egyes könyvtár végzi a saját digitalizálását, a
végeredményt mondjuk egy .pdf fileban felteszi a weboldalra, a TextLib
Internet mezőjébe pedig beviszik az elérhetőséget. Ez eddig egy "normál"
ügymenet. Tehát (lényeges!!) a Karcagon feldolgozott adatok leírása a
karcagi TextLib adatbázisába kerülnek fel, míg a digitalizált .pdf file
Szolnokra és Budapestre is áttöltésre kerülne.
Nézzük testközelből a működést: az elérhetősége a közös katalógusnak a
példa kedvéért legyen tiop.vcsk.hu. Amennyiben ezt beírják a böngészőbe,
akkor a kérést egyszer Karcag, másodszor Szolnok, harmadszor Budapest
fogja kiszolgálni (a terhelés megoszlik a 3 könyvtár között). Eddig minden
szép és jó (a részleteket itt most nem ecsetelném: linux).
Viszont, ha Karcag leszakad az Internetről, akkor a TextLib katalógusa is
elérhetetlenné válik a közös kereső számára, így hiába van meg az adott
digitalizált dokumentum Szolnokon és Budapesten is, a közös kereső nem
fogja megmutatni, mert sem a szolnoki, sem a budapesti TextLib
adatbázisban nincs benne, ergó a .pdf dokumentumra nem mutat link, nem
elérhető.
Pár ötlet felmerült bennem a probléma orvoslására, de kíváncsi lennék,
hogy ez esetleg érdekel -e mást is, vagy "elszigetelve" csak minket?
Természetesen tisztában vagyok azzal, hogy vannak fontosabb, a TextLib
közösséget nagyobb számban lázbahozó témák, de kíváncsi vagyok, hogy
érdekelne -e mást is egy hasonló "hibatűrő" közös kereső?
Visszatérve a problémára egy megoldási javaslattal is előállnék,
továbbgondolásra bocsátanék: a napi digitalizálási mennyiséget viszonylag
kevésnek saccolom (munka tipusa miatt, emberi erőforrás hiánya miatt,
stb.), így első körben napi egyszeri szinkronizációra gondoltam, mondjuk
indexelés végén. Tehát indexelés végén - opcionálisan - lehetne kérni,
hogy a TextLib adatbázisból emelje ki azokat a rekordokat, amelyek
Internet mezeje ki van töltve. Hogy ez hunmark vagy egyéb formátumba
történne, azt a későbbikre hagynám. Az így kiemelt rekordokat a másik két
könyvtár adatbázisába tölteném be (természetesen a duplumokra figyelve,
ill. figyelmeztetve pl. e-mailben). A leválogatást akár lehetne limitálni
is, hogy max az 1 hétnél nem régebbi rekordokat szedje csak le, ezzel is
csökkentve az átmozgatandó adatok mennyiségét (az időintervallum
tetszőlegesen paraméterezhető lenne).
Így viszonylag kis mennyiségű adatot kellene mozgatni és a digitalizált
gokumentumokra mutató link mindhárom adatbázisnak része lenne, így egy
szerver kiesése esetén is szolgáltatható maradna a digitalizált anyag.
Mégegyszer mondom: tudom, hogy vannak fontosabb, prioritást élvező
feladat. Azt szeretném feltérképezni, hogy mást is érdekel ez a probléma,
mert, ha nem, akkor esetleg máshogy fogjuk megközelíteni a probléma
megoldását.
Aki eddig elolvasta, annak köszönöm a türelmét és várom a válaszokat,
véleményeket.
--
(O__ ------------------------------------------------------
//\ / Varosi Csokonai Konyvtar
// ) | Tel.: 59/503-152
V__/_ szistvan at tux.hu \ szistvan at mail.vcsk.hu
További információk a(z) Textlib levelezőlistáról