[KATALIST] Új ALA-kereső
Peter Kiraly
pkiraly at tesuji.eu
2008. Jún. 26., Cs, 19:22:09 CEST
Tisztelt lista,
holnap, június 27-én kezdődik az Amerikai Könyvtárosok Egyesülete
(ALA) hatalmas éves konferenciája a kaliforniai Annaheimben.
Hogy képet alkothassunk a méretekről a tavalyi konferencián 21 500
résztvevő és 7000 kiállító volt jelen. A hat nap alatt több száz
előadás, kerekasztalbeszélgetés és egyéb program várja a látogatókat.
A konferencia egyik kisérő eseménye a szervezet webszájtjai új
keresője illetve az új design elindítása. Az előbbiben volt
szerencsém a Tesuji Magyarország Kft. képviseletében személyesen
is részt venni.
Az ala.org struktúrája meglehetősen szövevényes. A honlap magját egy
tartalomkezelő rendszer alkotja, melyet azonban többször levéltottak
az idők során és némi élő információ-maradék a régi rendszerekben is
maradt. A mag mellett azonban számos egyéb tartalom is található
különféle al szájtokon. Ezek közül a legfontosabbak:
- 39 blog, melyet a b2evolution motorral üzemeltetnek
- 59 wiki, a standard MediaWiki szoftverrel
- külső fejlesztők által készített és üzemeltetett álláshírdetési oldal
- szintén hasonló módon üzemelő online áruház (az ALA jelentős
könyv- és oktatási anyag kiadó)
- levelezőlisták
A megvalósítás elsősorban Google technológiák segítségével történt.
Az ALA rendelkezik egy korlátozott Google Search Appliance (GSA) géppel.
A GSA - hátha valaki nem ismeri - egy olyan fekete doboz (ténylegesen az,
már a színe is olyan mint a fekete dobozoké: sárga), amit csak be kell
dugni egy rack szekrénybe, konfigurálni és máris indulhat a szolgáltatás.
A GSA lényegében a hagyományos webes Google technológiát használja,
de bizonyos mértékig testre szabható:
- a crawlernek meg lehet adni kiinduló URL-eket és szabályokat (pl.
tiltott URL-ek)
- meg lehet adni szinonímákat
- keresőkérdésenként kiemelt találatokat (ajánlatokat)
- az találati lista egy XML fájl, amit XSLT-vel testre lehet szabni
- integrálni lehet más Google találati forrásokat (pl. a hagyományos
webes keresőt, Custom Search Engine-t (CSE, mint amilyen a Kataker),
Google SiteSearch-öt stb.)
- integrálni lehet nem Google-ös találati forrásokat, pl. olyan
élő, akár percenként változó adatokat, melyek nincsenek leindexelve
(tőzsdeárfolyam, aktuális menetrend stb.)
A GSA-t sajátos licenszeléssel kínálják, melyben az árt befolyásoló
faktorok: a leindexelendő oldalak száma, a szájtok száma, a terhelés stb.
Az ALA-keresőben elsősorban a GSA-n belüli indexre építettünk, így a fő
feladat az volt, hogy kiépítsük a kapcsolatot a különféle belső
rendszerekkel, illetve kiszűrjük az említett adatmigrációk nyomán
keletkezett duplikátumokat. Ezen kívül létrehoztunk néhány CSE-t
olyan tartalmak számára, melyeket egyelőre nem tudtunk integrálni
a közös indexbe.
A kereső és az új ALA design elérhető a következő címen:
http://staging.ala.org/home.cfm
Illetve itt:
http://66.158.92.81/
Mivel a design alkalmazása az összes ALA szájtra meglehetősen
bonyolult ejrárás, ez a folyamat jelenleg még éppen hogy elkezdődött,
de a következő hónapokban feltehetőleg egyre több helyen fog
felbukkanni az új külső.
Jogosan vetődhet fel a kérdés, hogy hogyan került egy ilyen megbízás
egy magyar, könytári szoftverekkel foglalkozó céghez. Az ALA a
közelgő határidő miatt az utolsó pillanatban keresett
egy kis segítséget a Google szolgáltatások testreszabásával,
tuningolásával foglalkozó Adhere Solution-től, akik viszont más
közös munkáink és a keresés világában felmutatott referenciáink
miatt kerestek meg minket.
Ha bárkinek van megjegyzése, javaslata az új keresővel kapcsolatban,
kérem, hogy észrevételeit juttassa el hozzám.
A GSA-ról bővebben itt lehet olvasni:
http://code.google.com/apis/searchappliance/
Tisztelettel,
Király Péter
http://tesuji.eu
További információk a(z) Katalist levelezőlistáról