Linux E X P R E S

Facebook

České univerzity používají DSpace – systém pro digitální knihovny

dspace.png

DSpace je OSS pro digitální knihovny. Umožňuje ukládání, správu a vyhledávání obsahu různého druhu, zejména vědeckých článků, odborných zpráv a dalších podobných dokumentů, knih, fotografií, audiovizuálních dat, 3D modelů a mnohého dalšího. Využívají ho především vzdělávací a vědecké instituce po celém světě. Výjimkou není ani ČR, kde je systém DSpace v provozu kromě jiného na řadě univerzit.


DSpace se představuje

DSpace umožňuje efektivně spravovat databázi rozmanitých informací a snadno v ní podle potřeby vyhledávat. Mezi takové informace patří různé akademické a vědecké práce (výstupy z výzkumných projektů, diplomové, disertační, habilitační a jiné podobné práce, konferenční materiály, sborníky apod.), knihy, fotografie či jiné obrázky, zvukové záznamy, videozáznamy, trojrozměrné modely a různá další data.

Rozhraní je především webové (starší verze s Java Servlety a JSP, novější založená na XMLUI a technologii Apache Cocoon), systém ovšem navenek komunikuje také řadou otevřených protokolů a technologií, například OAI-PMH, SWORD, OpenSearch, METS nebo RSS. To umožňuje jak snadný přístup pro živé uživatele a správce (odkudkoli, stačí pouze webový prohlížeč), tak i bohaté možnosti interoperability s jinými systémy, datovými zdroji a příjemci dat. Data jsou uložena v relačních databázích, DSpace v současné době podporuje databáze PostgreSQL a Oracle.

Za vývojem systému DSpace stojí společné úsilí firmy Hewlett-Packard (HP) a univerzity MIT (Massachussetts Institute of Technology), které započalo již v roce 2002.

CC: Ann-Kathrin Rehse CC: Ann-Kathrin Rehse

V roce 2007 tyto dva subjekty založily organizaci DSpace Foundation, která celý projekt řídí a poskytuje podporu uživatelské a vývojářské komunitě.

DSpace v českém prostředí

Software DSpace se využívá i v řadě českých institucí, zejména z akademické oblasti. Magazín Open source & praxe proto požádal některé z nich o sdělení svých zkušeností s instalací, správou a používáním DSpace.

Tyto informace jsou zajímavé hned z několika důvodů. V první řadě tyto reálné zkušenosti výborně poslouží při rozhodování, zda při potřebě nasadit systém tohoto druhu zvolit právě DSpace, nebo něco jiného. Zkušenosti z praxe se hodí i při zprovozňování systému a v začátcích používání. Nelze opomenout ani záležitosti okolo interoperability a uživatelské znalosti.

Masarykova univerzita v Brně, DML-CZ

Brněnská Masarykova univerzita provozuje celkem tři instalace DSpace. Dvě slouží přímo účelům MU – jedna hlavně pro experimentální účely, zejména testování nových technologií, druhá přímo pro uložení dat (zatím jako „betaverze“ digitální knihovny filozofické fakulty MU). Třetí a současně nejdůležitější instalace je DML-CZ, celým názvem Czech Digital Mathematics Library, tedy Česká digitální matematická knihovna.

Tato knihovna je velkým národním projektem spravovaným Matematickým ústavem Akademie věd České republiky, na kterém se kromě Masarykovy univerzity (Fakulty informatiky a Ústavu výpočetní techniky) podílí také Knihovna Akademie věd České republiky a Matematicko-fyzikální fakulta Univerzity Karlovy. Instalace DSpace pro DML-CZ je zde v Česku určitě nejzajímavější, vzhledem k rozsáhlému přizpůsobení systému, které svědčí o jeho flexibilitě a o tom, co lze s jeho pomocí obsáhnout.

O zmíněných třech instalacích, především o té třetí z nich, pohovořil Mgr. Vlastimil Krejčíř z Ústavu výpočetní techniky MU, který se systému DSpace věnuje již od roku 2004: „V letech 2004 a 2005 jsem se podrobně věnoval testování tehdy dostupných systémů pro digitální knihovny. V dané době jsem vyhodnotil DSpace jako nejlepší řešení, resp. nejkompletnější hotové řešení (možnost systém okamžitě nasadit) – zejména se mi líbila vnitřní architektura, která nabízela možnost budoucí rozšiřitelnosti. Samozřejmě tam byla i řada jiných výhod. Nyní mohu říct, že tehdejší sázky na DSpace v žádném případě nelituji. Jak se ukázalo, DSpace se velice rychle rozvíjel (a stále rozvíjí) – zejména oceňuji širokou podporu standardů a především flexibilitu. V neposlední řadě je podpora široké mezinárodní komunity okolo DSpace (a i to, že za ním stojí tak silní hráči, jako jsou MIT a HP).“

Co se týká zprovoznění systému, přímo na univerzitě to šlo snadno: „Jde-li o nasazení univerzitního DSpace, pak zásadní komplikace nebyly – je to dané tím, že tato instalace nejvíce vychází z výchozího nastavení DSpace, zejména pokud jde o uživatelské rozhraní. Na tomto DSpace jsem si zároveň zkoušel některé úpravy.“

V rámci DML-CZ byla situace o něco složitější, vzhledem k větším nárokům na konkrétní podobu systému: „Mluvíme-li o nasazení DML-CZ, pak největší problémy nebyly technického rázu. Čistě programátorsky je možné v DSpace udělat ledacos. Osobně jsem dospěl k názoru, že největší překážku při budování digitální knihovny netvoří software a hardware, ale spíše věci kolem zpracování obsahu této knihovny. Navzdory tomu již bylo i z technického hlediska nasazení DML-CZ komplikovanější, protože jsme jako jedni z prvních začali využívat systém Manakin, který umožňuje kompletní tvorbu nových funkcí a rozhraní nad jádrem DSpace (to je ona flexibilita, o které jsem již hovořil). Svým způsobem jsme se tento systém učili za chodu, z čehož samozřejmě pramenila celá řada komplikací – jednak Manakin byl sám o sobě horkou novinkou s řadou chyb (to již dnes neplatí), jednak nebylo s kým konzultovat a vše jsme si museli řešit sami. Díky tomu jsme načerpali velké množství zkušeností, které právě uplatňujeme v nasazení DSpace pro naši filozofickou fakultu (což jde již mnohem snáze). V současnosti kdokoli další, kdo se pustí do DSpace, může využívat prostřednictvím diskusní skupiny znalosti ostatních (i připravené materiály v českém jazyce, jež byly prezentovány na workshopu, který jsme k tématu nasazování, přizpůsobování a programování DSpace/Manakin v rámci české komunity DSpace pořádali).“

DSpace DSpace

Instalační zkušenosti Mgr. Krejčíř shrnuje takto: „Obtížnost nasazení DSpace velmi závisí na tom, čeho chce uživatel dosáhnout. Základní instalace DSpace (připraven ihned k použití) zabere zkušenému administrátorovi cca půl dne. Samozřejmě výchozí nastavení nemusí vyhovovat každému, s mírou požadavků na systém roste časová náročnost na jejich implementaci. Nasazení systému Manakin a jeho úpravy (doplňování nových funkcí apod.) jsou již těžším a časově i programátorsky náročnějším úkolem. Velice záleží na tom, co a jak chcete do DSpace ukládat – jak moc se realita liší od vnitřního modelu DSpace a jak moc je uživatel ochoten ke kompromisu. Vzhledem k tomu, co vím o systémech DSpace u nás, si troufám tvrdit, že v DSpace lze udělat téměř cokoli (a i osobně před tím, co dokázali na jiných školách, smekám – know-how je v České republice silné).“

A jaký je systém DSpace z hlediska správy? „Běžná provozní správa DSpace je poměrně nenáročná (dá se plně automatizovat). Ve starších verzích se systémem Manakin bývaly problémy se stabilitou, ale poslední testy verzí nových již běží bez zásadních problémů. Samozřejmě drobnější problémy se čas od času vyskytují, vyskytovaly a vyskytovat budou, to je však obvyklé u jakéhokoli systému. Chyby komunita poměrně rychle odstraňuje a upgrade minor verzí DSpace (které právě chyby odstraňují) je relativně snadný. Přirozeně upgrade major verzí je (v závislosti na lokálně provedených úpravách DSpace) náročnější (u naší univerzitní instalace DSpace, která má málo úprav, je ovšem i přechod na novou major verzi snadný). Velkým pozitivem je to, že kód DSpace (API – rozhraní pro programátory) je udržován maximálně zpětně kompatibilní (bez problémů a úprav používáme věci z DML-CZ, což je DSpace 1.4.2, v systému vyvíjeném pro filozofickou fakultu, což je DSpace 1.6.2).“

Pochopitelně nelze opomenout ani pohled uživatelů, kteří se systémem pracují: „Ze strany uživatelů, kteří DSpace používají jako digitální knihovnu, jsme výrazné připomínky nezaznamenali. Jiné je to přirozeně u uživatelů, kteří používají DSpace aktivně v autentizovaném režimu (mohou vkládat obsah apod.), tak se nějaké připomínky čas od času vyskytnou. Bohužel se nelze zavděčit všem. Osobně jsem toho názoru, že když se nikdo neozývá, tak se to všem celkem líbí (a návštěvnost prokazatelně máme) – pozitivní reakce jako takové jsou obecně vzácností.“

Nezbývá než poděkovat Mgr. Krejčířovi a jeho týmu jak za zkušenosti, o které se s námi podělili, tak hlavně za obrovský kus práce, který na poli DSpace odvedli a z něhož mohou nyní těžit všichni, kdo se pro DSpace rozhodnou.

Vysoká škola báňská – Technická univerzita Ostrava

VŠB-TUO používá systém DSpace již pět let a byla mezi českými univerzitami průkopníkem v použití tohoto softwaru pro realizaci digitální knihovny. Okolnosti volby systému přibližuje Mgr. Pavla Rygelová z Ústřední knihovny VŠB-TUO: „Na VŠB-TUO jsme zprovoznili DSpace v roce 2006. Rozhodovali jsme se mezi DSpace a EPrints. Stručně by se dalo říci, že DSpace oproti EPrints nabízel přirozené strukturování obsahu podle organizační struktury instituce (členění na komunity a kolekce) a metadatový formát Dublin Core.“

S instalací i správou systému panuje všeobecná spokojenost: „Nasazení systému DSpace probíhalo bez velkých problémů, v zásadě všechny požadavky se podařilo vyřešit (přidání české diakritiky do řazení záznamů, autentizace pomocí LDAP hesla, úprava vkládacích formulářů, import metadat vysokoškolských kvalifikačních prací z předchozí databáze apod.). Systém DSpace je spolehlivý, údržba nenáročná, systém je otevřený pro nejrůznější vylepšení podle lokálních potřeb.“

Dá se říci, že spokojeni jsou i uživatelé: „S vyloženě negativními reakcemi při práci se systémem DSpace jsme se nesetkali. Systém zaručuje kvalitní vyhledávání, možnost rozšířeného vyhledávání podle různých hledisek, která dostatečně vyhovují uživatelům. Nevyužíváme funkce individuálního přispívání do repozitáře, takže nemůžeme zhodnotit, jestli je workflow přispívání vyhovující, ale DSpace je dostatečně otevřený pro specifické potřeby, takže i v tomto směru by případné požadavky bylo možné vyřešit.“

Ústřední knihovna VŠB-TUO každoročně pořádá (s podporou Asociace knihoven vysokých škol České republiky) setkání českých uživatelů systému DSpace, kde lze na přednáškách, workshopech i při neformální komunikaci načerpat nové informace a znalosti či se naopak podělit o ty své.

Univerzita Karlova v Praze

Na pražské Univerzitě Karlově systém DSpace využívá Matematicko-fyzikální fakulta, a to jak v rámci již zmíněného projektu DML-CZ, tak i pro vlastní potřeby. O zkušenosti s provozem DSpace na MFF UK se podělil Karel Vandas.

„Nasazení DSpace je vcelku přímočaré, ze začátku je nutné nainstalovat podpůrné programy pro jeho správu, ale později se jeho udržování provádí lehce. Z hlediska správy DSpace postrádám nějaké dávkové programy pro automatické provádění činností. Při nasazení v našem případě bylo nutné provést mnoho nastavení a elementárních operací, pro něž jsme museli vyvinout úsilí při tvorbě skriptů, které tyto činnosti provádějí. V nemalé míře také zasahujeme do zdrojového kódu, který považuji osobně za velmi dobře strukturovaný.“

Z připomínek uživatelů zmínil Karel Vandas pouze ty od správců: „Chybí nám předdefinované automatické zpracování některých činností (kompilace, instalace). Trochu nešikovná je nutnost DSpace při každé změně konfigurace restartovat.“

Univerzita Tomáše Bati ve Zlíně

UTB ve Zlíně provozuje jednu instalaci přibližně rok a nyní připravuje druhou: „DSpace na Univerzitě Tomáše Bati ve Zlíně provozujeme v ostrém režimu od září 2010. Slouží k dlouhodobé archivaci a zpřístupnění závěrečných prací. Rozhodovali jsme mezi komerčním programem DigiTool s placenou podporou a DSpace, o který bychom se starali vlastními silami. Pro DSpace jsme se rozhodli z následujících důvodů: 1. možnost přizpůsobení našim potřebám, 2. živá komunita v České republice i celosvětově, 3. finanční důvody. Na září 2011 připravujeme druhou instanci, kde budou bibliografické záznamy k veškeré publikační činnosti na UTB (články v recenzovaných časopisech a konferenčních sbornících), v případě dostupnosti i s plným textem.“

Při procesu zprovozňování DSpace si univerzita vypomohla specializovaným programem. „Pro archiv kvalifikačních prací jsme si nechali na zakázku udělat program, který tyto práce exportuje ze studijního systému STAG a importuje je do DSpace. Pro archiv publikační činnosti jsme už nabrali dostatek zkušeností a import ze systémů RIV a OBD si řešíme vlastním systémem. Při nasazení samotného DSpace žádné větší problémy nebyly hlavně díky dobře udržované dokumentaci. Je nutno říci, že se správou servletů v Tomcatu jsme předtím neměli žádné zkušenosti. Na problém jsme narazili při pokusu nasadit vyhledávací rozhraní SRU/SRW, které však není součástí DSpace, vyvíjí ho třetí strana. Od nasazení jsme nakonec upustili ve prospěch lepšího plánovaného řešení – exportu dat do centrálního indexu.“

UTB na rozdíl od jiných dotazovaných institucí provozuje systém DSpace bez větších úprav. „Úpravy systému se snažíme udržet na minimu, abychom si ulehčili správu. Kromě vzhledu jsme upravovali pouze překlad a propojení na linkovací server a obě změny jsou dnes už dostupné v upstreamu. Provoz po nasazení je prakticky bez nutnosti zásahů, jediná činnost, kterou vykonáváme, je spouštění importu a řešení problémů se samotným obsahem.“

Ale podobně jako jinde, ani tady se nesetkali s tím, že by si uživatelé stěžovali na nějaké potíže se systémem: „Od uživatelů nemáme na systém žádné ohlasy (vůbec žádné negativní), ale ze statistik vidíme, že začal být okamžitě široce využíván (i díky informační kampani při spuštění). Veškerá komunikace s uživateli se týká samotného obsahu.“

Závěr

Průzkum u institucí používajících DSpace ukázal, že s tímto systémem panuje vesměs spokojenost, ať již je používán bez zvláštních úprav, nebo naopak významně přizpůsobený specifickým potřebám. Pokud už by se nějaké problémy vyskytly, je na koho se obrátit, protože (nejen) česká uživatelská komunita je velmi silná a zkušená. Pro výměnu informací slouží i pravidelná setkání uživatelů DSpace.

Jako hlavní důvody upřednostnění DSpace před jinými systémy se objevovaly jak vlastnosti funkční (celková koncepce, rozšířitelnost atd.), tak i již zmíněná komunitní podpora a v neposlední řadě i otázka nákladů na systém.

Toto celé může posloužit jako dobré vodítko pro všechny, kdo stojí před rozhodnutím, zda nějaký takový systém nasadit a hlavně který zvolit. DSpace lze v tomto kontextu považovat za systém kvalitní, osvědčený, s řadou dobrých vlastností prokázaných v reálné praxi.

Tento článek vyšel ve třetím čísle magazínu Open source & praxe.

Diskuze (0) Nahoru