[Textlib] TIOP 1.2.3 közös kereső - hibatűrő megoldás

2009. Nov. 13., P, 16:48:07 CET

Hi!

A pályázat keretein belül egy közös keresőt fogunk üzemeltetni, aminek a 
rendelkezésre állását szeretném megnövelni, hogy egy-egy könyvtári 
adatbázis kiesésével tovább tudjam szolgáltatni a _digitalizált_ adatokat.

Tehát a feladat "szóló" könyvtár esetén nem igazán értelmezhető, ott nem 
is igazán lenne értelme.

A probléma: 3 könyvtár (pl. Karcag, Szolnok, Budapest), közös keresővel 
van felvértezve. Minden egyes könyvtár végzi a saját digitalizálását, a 
végeredményt mondjuk egy .pdf fileban felteszi a weboldalra, a TextLib 
Internet mezőjébe pedig beviszik az elérhetőséget. Ez eddig egy "normál" 
ügymenet. Tehát (lényeges!!) a Karcagon feldolgozott adatok leírása a 
karcagi TextLib adatbázisába kerülnek fel, míg a digitalizált .pdf file 
Szolnokra és Budapestre is áttöltésre kerülne.
Nézzük testközelből a működést: az elérhetősége a közös katalógusnak a 
példa kedvéért legyen tiop.vcsk.hu. Amennyiben ezt beírják a böngészőbe, 
akkor a kérést egyszer Karcag, másodszor Szolnok, harmadszor Budapest 
fogja kiszolgálni (a terhelés megoszlik a 3 könyvtár között). Eddig minden 
szép és jó (a részleteket itt most nem ecsetelném: linux).
Viszont, ha Karcag leszakad az Internetről, akkor a TextLib katalógusa is 
elérhetetlenné válik a közös kereső számára, így hiába van meg az adott 
digitalizált dokumentum Szolnokon és Budapesten is, a közös kereső nem 
fogja megmutatni, mert sem a szolnoki, sem a budapesti TextLib 
adatbázisban nincs benne, ergó a .pdf dokumentumra nem mutat link, nem 
elérhető.

Pár ötlet felmerült bennem a probléma orvoslására, de kíváncsi lennék, 
hogy ez esetleg érdekel -e mást is, vagy "elszigetelve" csak minket?

Természetesen tisztában vagyok azzal, hogy vannak fontosabb, a TextLib 
közösséget nagyobb számban lázbahozó témák, de kíváncsi vagyok, hogy 
érdekelne -e mást is egy hasonló "hibatűrő" közös kereső?

Visszatérve a problémára egy megoldási javaslattal is előállnék, 
továbbgondolásra bocsátanék: a napi digitalizálási mennyiséget viszonylag 
kevésnek saccolom (munka tipusa miatt, emberi erőforrás hiánya miatt, 
stb.), így első körben napi egyszeri szinkronizációra gondoltam, mondjuk 
indexelés végén. Tehát indexelés végén - opcionálisan - lehetne kérni, 
hogy a TextLib adatbázisból emelje ki azokat a rekordokat, amelyek 
Internet mezeje ki van töltve. Hogy ez hunmark vagy egyéb formátumba 
történne, azt a későbbikre hagynám. Az így kiemelt rekordokat a másik két 
könyvtár adatbázisába tölteném be (természetesen a duplumokra figyelve, 
ill. figyelmeztetve pl. e-mailben). A leválogatást akár lehetne limitálni 
is, hogy max az 1 hétnél nem régebbi rekordokat szedje csak le, ezzel is 
csökkentve az átmozgatandó adatok mennyiségét (az időintervallum 
tetszőlegesen paraméterezhető lenne).
Így viszonylag kis mennyiségű adatot kellene mozgatni és a digitalizált 
gokumentumokra mutató link mindhárom adatbázisnak része lenne, így egy 
szerver kiesése esetén is szolgáltatható maradna a digitalizált anyag.

Mégegyszer mondom: tudom, hogy vannak fontosabb, prioritást élvező 
feladat. Azt szeretném feltérképezni, hogy mást is érdekel ez a probléma, 
mert, ha nem, akkor esetleg máshogy fogjuk megközelíteni a probléma 
megoldását.

Aki eddig elolvasta, annak köszönöm a türelmét és várom a válaszokat, 
véleményeket.

-- 
   (O__	  ------------------------------------------------------
   //\                       /      Varosi Csokonai Konyvtar
  //  )                     |       Tel.: 59/503-152
  V__/_    szistvan at tux.hu   \      szistvan at mail.vcsk.hu