VMEK - Vilaghallo - sajtotajekoztato az OSZK-ban
Moldovan Istvan
moldovan at OSZK.HU
2004. Már. 4., Cs, 10:50:06 CET
Kedves Kollégák,
Tájékoztatásul küldöm az alábbi meghívót és ismertetőt
egy mai OSZK-s sajtótájékoztatóról. A rendezvény kimondottan
a sajó számára szól, igyekszünk a nagyvilág számára is bemutatni
a fejlesztéseinket.
Üdvözlettel
Moldován István
MEK könyvtáros
MEGHÍVÓ
Tisztelettel meghívjuk a Magyar Elektronikus Könyvtár
"Vakbarát" verziójának és online felolvasó rendszerének
bemutatójára.
A sajtótájékoztatón köszöntőt mond: Dr. Magyar Bálint, oktatási miniszter
Monok István, az OSZK főigazgatója
A fejlesztéseket bemutatja: Ádám Katalin, a program koordinátora
Moldován István, a MEK osztály vezetője
Időpont: 2004. március 4. 12 óra.
Helyszín: Országos Széchényi Könyvtár,
1827 Budapest, Budavári Palota F. ép. 516. szoba
"VilágHalló" rendszerünk segítségével az elektronikus könyveket és
egyéb szövegeket vizuális információ nélkül használhatják vak és
látáskorlátozott olvasóink. Nem pusztán szöveget hallhatnak, lapozgathatnak,
könyvjelzőt is elhelyezhetnek a "VilágHalló" segítségével. "Vakbarát"
rendszerünk a vakokat, a csökkentlátókat és az idősebb korosztály olvasni
vágyó tagjait szeretné a könyvélmények varázsához hozzásegíteni. Lesznek
talán olyanok is, akik csak kedvtelésből, a változatosság miatt választják
az olvasásnak ezt a formáját.
A rendszert az IHM-OM pályázati rendszerében 2003-ban dolgoztuk ki.
A fejlesztéseket "A magyarnyelvű beszédszintézis alkalmazásának szabványai,
onine szövegfelolvasás" IHM K+F ITEM 2002, valamint a "Vakok és csökkentlátók
számára kialakított navigációs felület és letöltési formátumok a Magyar
Elektronikus Könyvtárban" IHM-ITP-2/E 2002 című pályázatok keretében
valósítottuk meg.
Mindkét kutatásunk célja az, hogy az Interneten elérthető elektronikus
könyveket, szöveget a vak és csökkentlátó emberek, az idős, fáradó szeműek
a látókkal közel egyenértékűen használhassák. Erre a magyar kutatásfejlesztés
legújabb eredményei és az Interneten kialakuló esélyegyenlőséget támogató
szabványok megjelenése adott lehetőséget.
SAJTÓTÁJÉKOZTATÓ
A "Vakbarát" Magyar Elektronikus Könyvtár és a VilágHalló online
felolvasó rendszer.
1. A Vakbarát Magyar Elektronikus Könyvtár (MEK). (http://vmek.oszk.hu)
A MEK Egyesület, átgondolva látássérült olvasóinak helyzetét, az
elektronikus könyvtárhoz vakbarát belépési oldalt hozott létre. A
dokumentumok letöltéséhez egyszerű text formátumot, az erre alkalmas
dokumentumokhoz pedig online felolvasási lehetőséget biztosít. Mind az
online felolvasás mind a text formátum kiinduló pontja az XML, a mára
már nemzetközileg elfogadott szövegábrázolási szabvány. Tekintve, hogy
ezek előállítása nagy munka, igyekeztünk minél szabványosabb formában,
a Text Encoding Initiative (TEI) alapján elkészíteni, hogy később már
gépi konverzióval kinyerhető legyen az e-book vagy más, később
igényként felmerülő egyéb formátum.
Előzmények
A hálózati technológiák fejlődése a vak és csökkentlátó felhasználók
számára kedvezőtlen irányba fordult a grafikus felületek
térhódításával. Az eredetileg karakteres programokra kidolgozott
felolvasó (text to speech) programok segítségével a bonyolult képeket
tartalmazó oldalakon már nem lehet eligazodni. Az egér, mint fő
navigálási eszköz, a vakok számára alkalmatlan. A fejlődés irányát
követve a MEK is áttért összetettebb szolgáltatást nyújtó újabb
technológiákra, de a látássérült olvasók nagy számára való
tekintettel, egyidejűleg vakos használatra optimalizált belépési
pontot is kíván nyújtani. Ezt a célt szolgálja a http://vmek.oszk.hu
internet címen nyíló oldal, az online felolvasás lehetősége, valamint
a text formátumban is feltöltött szövegek. Az így kialakított oldal
egyben a gyengébb kapcsolattal rendelkező olvasók számára is előnyös a
grafikus elemek kis száma miatt.
A tervezés során derült ki, hogy a fejlesztésbe nem érdemes ma már
belefogni az XML technológia alkalmazása nélkül. A logikai jelölőkkel
ellátott szövegből ugyanis a letöltésre és felolvasásra szánt szövegek
éppúgy előállíthatók konverzióval, mint a látók számára is alkalmas
HTML oldalak, PDF fájlok, valamint a jövőben várható (esetleg
váratlan) igények, mint pl. az e-book. Továbbá felhasználható a szöveg
differenciált keresésre, újabb szöveggyűjtemény összeállítására, sőt,
ha szükségessé válik, akár braille-ben is kinyomtatható.
A sokoldalú későbbi felhasználás egységes, lehetőleg nemzetközi
szabványon alapuló szerkezeti meghatározottságot igényel. Erre a célra
a TEI (Text Encoding Initiative) ajánlásai alapján készíttetett a MEK
minden dokumentumtípusra kiterjedő DTD-t (documentum type definition),
amely a későbbiekben az OSZK egyéb digitalizálási projektjeiben is
felhasználható.
A DTD-t az Empolis Magyarország készítette, az IHM-ITEM pályázat
keretében.
2. A VilágHalló online felolvasó rendszer
A VILÁGHALLÓ egy nyílt forráskódú internetes online felolvasó
rendszer, mely az interneten lévő szövegeket mesterségesen generált
emberi beszéd formájában teszi hallgathatóvá. (Olvasásszakértők
szerint ez a fajta felolvasás – éppen mert személytelen, érzelemmentes
– jobban hasonlít az olvasásra, mintha színész tolmácsolná a szöveget,
mivel az olvasó saját maga értelmezheti a művet.)
Jelenleg még kissé mesterkélt a felolvasó hang, de fejlesztőinek
kitűzött célja, hogy a géphang minősége megközelítse, sőt elérje
a természetes emberi beszédet.
A VilágHalló mind filozófiájában, mind információtechnológiai
megoldásában alapvetően eltér a képernyő-felolvasó szoftverektől ,
melyek használata esetén a felhasználók külön-külön gondoskodnak a
szoftverkomponensek beszerzéséről és folyamatos frissítéséről, a
szövegek letöltéséről, a kapcsolódó szerzői jogi követelmények
betartásáról, a megfelelő tároló és processzor kapacitásról stb.
Ezekkel szemben a VILÁGHALLÓ egy központilag menedzselt integrált
online szolgáltatás, ami az elérhető szövegeket kombinált szöveg- és
hangfolyamként juttatja el a hallgatóhoz (mint egy „szövegrádió”) egy
speciális, erre a célra kifejlesztett hang-szöveg szinkronprotokoll
(wow) segítségével. Ez biztosítja, hogy a szövegben navigálni, lapozni
lehessen. Ez a megoldás szerzői jogi szempontból is előnyös, mert a
szöveg nem jelenik meg önállóan a felhasználónál, nem töltheti le, nem
mentheti el, és így mentesül sok szerzői jogi megkötéstől. Lehetőség
van a kivételszó (nem úgy kell ejteni, ahogyan írva van), idegenszó,
tulajdonnév kiejtésének központi kezelésére.
A szoftver-komponensek és az internetes szövegállomány változásainak
követését és a rendszerbe építését a szolgáltató végzi és teszi
elérhetővé a felhasználók számára. Hogy csak a fontosabbakat említsük:
a beszédgeneráló motor fejlettebb verzióra cserélése (pl. több
hangszín, állítható sebesség), az újabb motorok (pl. idegen nyelvű)
beépítése, az elektronikus formában elérhetővé vált szövegek,
szövegábrázolási standardok (pl. XML, TEI) használata, a számítógépes
nyelvi elemzés új eredményeinek felhasználása.
A VILÁGHALLÓ a tárolt szövegeket a felolvasásra legalkalmasabb
formátumra hozza függetlenül attól, hogy milyen formátumban érhetők el
(HTML, ZIPHTML, TXT, ZIPTXT, MSWORD, RTF, XML, SGML) és a felolvasás
szempontjából informatív, strukturális és nyelvi annotációkkal látja
el (ilyenek pl. a mondat, bekezdés, versszak, fejezet, stb. jelölések
vagy az – akár ragozott - idegenszó illetve név helyes kiejtése).
A szükséges szoftver és hardver komponensekről a felhasználónak még
csak tudomást sem kell szereznie, a megfelelő CPU igényt, tárolási
kapacitást és minden egyéb erőforrást a szolgáltatás biztosítja és így
ezek költségei nem a felhasználót terheli. Elegendő egy vékony kliens
programot letölteni és az internetre kapcsolódni, akár telefonvonalon
is.
Mindehhez a VILÁGHALLÓ egy egységes közeget és a vakok által is
könnyen, vizuális információk nélkül is kezelhető felhasználói
felületet biztosít. Ez a felület személyre szabható, beállítható
a legkedvezőbb megjelenés és a billentyűk, amikkel kezelni lehet.
A felhasználói beállítások megmaradnak, míg a folytonosan fejlődő
alkalmazás minden bejelentkezésnél frissül (Webstart). A felhasználói
beállítások közül az egyik legfontosabb a "KÖNYVJELZŐ" funkció, mely
lehetőséget biztosít arra, hogy ott folytassuk a könyvet ahol
abbahagytuk. (Egy átlagos méretű könyv felolvasása 12 órát venne
igénybe.)
Jelenleg a VILÁGHALLÓ a Magyar Elektronikus Könyvtár (MEK) vakbarát
oldalához kapcsolódik és az új MEK szövegeit olvassa. Ehhez a Profivox
beszédszintetizáló motort használja. A MEK oldaláról a Világhalló
szolgáltatást és a pályázat ismertetését a
http://mek.oszk.hu/egyesulet/palyazatok/vakbarat/ címen lehet elérni.
A ProfiVox magyar nyelvű beszédgeneráló szoftver (TTS, Text-to-
Speech). Az eszköz közel 10 év fejlesztő munkájának eredménye, a BME
Távközlési és Telematikai Tanszék kiemelkedő kutatói fejlesztették.
Ma is folyamatosan fejlesztik, pillanatnyilag ez a legszebben beszélő
magyar TTS motor. Nem ingyenes.
Minden nyelven vannak TTS (Text-to-Speech) motorok, némelyik hangját
szinte nehéz megkülönböztetni az emberi hangtól, a kevésbé jókat akár
ingyen is el lehet érni.
A VILÁGHALLÓ világviszonylatban is egyedülálló.
A Szabály Informatikai Bt. által elindított, és az IHM
kutatásfejlesztési pályázata által támogatott program keretében a
K-PRO Kft. fejlesztette.
A szolgáltatás végleges verziója a http://www.vilaghallo.hu oldalról
érhető el, innen tölthető le a használatához szükséges program a JAVA
szoftverkomponensekkel együtt.
További információk a(z) Mek-l levelezőlistáról