Jan A. Novák: Téma pro elektronickou archivaci: Internetové stránky

Na první pohled by se mohlo zdát, že vytvářet si v časech internetu nějaké archivy téměř nemá smysl: na webu je vše, na co si vzpomenete. Ale zdání klame - a to hned z několika důvodů: webové stránky například poměrně přesně mapují současnost, s minulostí je to ale mnohem horší. Smutnou skutečností je i to, že kvalitní informace nabízejí především anglické a do určité míry i německé servery, pokud ale chcete informace z české oblasti, je obsah - mírně řečeno - nevyrovnaný, nezřídka ovšem na požadované téma nenajdete vůbec nic. A tak často nezbyde než resignovat na vymoženosti informačního věku a začít se pídit po papírových dokumentech v knihovnách a archivech.

Třetí důvod ale je hlediska tohoto zamyšlení nejzávažnější: ne vše, co na webu objevíte, tam zůstane navždy. Podstatná část obsahu, která tam byla (dejme tomu) někdy okolo roku 2000 je dnes pryč. Zmizela, vypařila se, odešla do křemíkového nebe. Důvody jsou různé: zanikl server, bylo třeba uvolnit místo na disku, provozovatel stránek se začal zabývat něčím jiným, obsah se přesunul na jinou adresu... Přitom někdy to může jít velmi rychle; zejména z menších webů jejich redaktoři starší obsah vyřazují poměrně brzy. Uvádí se, že průměrná životnost webové stránky je asi 75 dní. Ve strovnání třeba se staroegyptskými nápisy je to tedy žalostně málo...

Winston Smith pracující na ministerstvu pravdy v Orwellově románu 1984 by z toho možná měl radost, protože internet vlastně plní tutéž funkci, jako jeho Jáma pamětnice - vytváří svět, jehož minulost se v každém okamžiku rodí znovu podle momentálních potřeb. Jenže, co vyhovovalo Orwellovu Velkému Bratrovi, to může v reálném životě vadit. Internet zkrátka nejen, že nenahrazuje archivy a knihovny, ale dokonce ani nevytváří nic na způsob kolektivní paměti lidstva, jak bývá často tvrzeno.
Rozhodně se tedy nedá spoléhat na to, že když narazíte na zajímavou stránku, můžete se k ní kdykoliv vrátit. Poslední dobou sice vznikají různé on-line webové archivy, paradoxně ale mají podobnou nevýhodu jako jednotlivé stránky: nikdo nezaručí, jak dlouho projekt poběží.

A tak nezbývá než archivovat osobně - ale jak? Zdánlivě nejjednodušší cestou je tisk: kliknete na příslušné tlačítko rolovací lišty, a je to. Jenže, kdo se v těch horách papíru má pak vyznat? Lepší už je stažení stránky na pevný disk; formát .mht navíc umožňuje stránku uložit jako jediný soubor, což značně ulehčuje další manipulaci s ní. I v tomto případě ale při větším množství souborů nemusí být lehké se v nich vyznat. O důvod víc, proč se zajímat o nástroje pro archivaci a vyhledávání dokumentů v elektronické podobě.