3.4.4. Formátové politiky
Důležitým předpokladem dobré správy uložených digitálních objektů je přehled o jejich technických vlastnostech. Archiv je dostupnými nástroji zjišťuje, ověřuje a ukládá jako součást metadat informačních balíčků. Tyto informace jsou jedním z východisek pro realizaci kroků směřujících k zachování informačního obsahu digitálních objektů.
Informace o technických vlastnostech digitálních objektů
Všechny digitální objekty prochází v digitálním archivu kompletní formátovou analýzou. Tato činnost je realizována bezprostředně po uložení archivovaných digitálních objektů. Archiv postupuje dle zásady prvotního uložení dat. Realizace kompletní formátové analýzy tedy nepodmiňuje samotné trvalé uložení. Formátovou analýzu je možné v odůvodněných případech zopakovat.
Formátová analýza zahrnuje identifikaci formátu digitálního objektu, v určených případech validaci určeného formátu, vytěžení technických metadat a uložení zjištěných informací do metadat informačního balíčku, v němž je digitální objekt uložen. Činnost je zajištěna postupným spouštěním určených specializovaných nástrojů a zpracováním výsledku jejich činnosti.
Okruh zapojených nástrojů a definice jednotlivých kroků základní komplexní formátové analýzy vychází z analýzy obsahu digitálního archivu, dostupných technických nástrojů a technických možností při jejich integraci. Tým digitálního archivu sleduje vývoj v této oblasti a v rámci pravidelných plánů na rozvoj digitálního archivu může navrhnout aktualizaci zapojených nástrojů a jednotlivých kroků analýzy.
Kompletní formátová analýza je spouštěna automaticky. Mimo to má uživatel možnost spustit konkrétní identifikační, validační či extrakční nástroje nad vybranými digitálními objekty pomocí specializovaných workflow.
Každá jednotlivá operace nad konkrétním digitálním objektem je logována a tento log je přístupný oprávněným uživatelům. V případě uživatelsky spouštěných operací může uživatel rozhodnout, zda výsledek operace zapíše do informačního balíčků nebo zda jej odmítne. Toto rozhodnutí je možné nad jednotlivou komponentou i nad celou dávkou.
Vytěžené informace jsou zapsány do metadat informačního balíčku archiválií a s určenými informacemi je možné pracovat v rámci správy archiválií. Těmi jsou:
identifikace formátu,
validita digitálního objektu v tomto formátu,
vytěžená technická metadata.
Systém v určených intervalech (zpravidla jednou týdně) zhotovuje statistiku výskytu všech formátů v archivu. Součástí této statistiky jsou vybrané vlastnosti formátů (např. jejich míra rizika) a digitálních objektů v těchto formátech (identifikace reprezentace, zda tato reprezentace již byla nahrazena). Tyto statistiky vychází z aktuální báze znalostí o obsahu digitálního archivu. Statistiky jsou v průběhu času aktualizovány o informace o nových digitálních objektech a o výsledky nových formátových analýz nad archivovanými digitálními objekty. Konkrétní statistika vždy obsahuje jen informace aktuální k datu vyhotovení statistiky, neobsahuje tedy např. výsledky již “nahrazených” formátových analýz. Tyto informace jsou trvale k dispozici v metadatech informačních balíčků archiválií. Statistiky je možné uživatelsky vytvořit i pro určenou část archivu.
Tyto statistiky jsou využívány zejména v plánování činností pro zajištění dlouhodobé čitelnosti spravovaného informačního obsahu, ovlivňují i budoucí rozvoj AIS UK a plánování integrace jednotlivých softwarových nástrojů pro práci s objekty v konkrétních formátech.
S částí vytěžených informací (vybrané vlastnosti formátu, vybranými technickými metadaty) je v digitálním archivu dále pracováno jako s významnými (signifikantními) vlastnostmi (viz Transformational Information Property dle OAIS, https://ccsds.org/wp-content/uploads/gravity_forms/5-448e85c647331d9cbaf66c096458bdd5/2025/01//650x0m3.pdf page 1-17), které jsou důležité pro ověření zachování informační hodnoty digitálního objektu v procesu ochrany ohroženého informačního obsahu.
Realizace ochrany ohroženého informačního obsahu
Činnosti zajišťující udržení srozumitelnosti informačního obsahu v ohrožených digitálních objektech jsou připravovány na základě plánování, které vychází z analýzy, formátových statistik a informačního významu ohrožených digitálních objektů s ohledem na zájem určené komunity a možnosti jejího přístupu k informačnímu obsahu v ohrožených digitálních objektech.
K tomuto plánování dochází zpravidla jednou ročně, jeho závěry jsou zahrnuty do plánovaných činností v záznamech jednotlivých formátů ve formátové knihovně. Návrh plánu činností k udržení srozumitelnosti informačního obsahu na konkrétní časové období zpracovávají správci informačního obsahu a schvalují vedoucí archivu a projektový manažer.
Základním nástrojem archivu v této oblasti je v současné době formátová migrace, která je realizována ve formátovém modulu. Jde o proces, při kterém je informační obsah uloženého digitálního objektu převeden do nového digitálního objektu (nové reprezentace) a tento nový objekt (včetně příslušných metadat) je uložen do informačního balíčku archiválie.
Uživatel v rámci konkrétního procesu volí vhodné softwarové nástroje pro digitální objekty v daném formátu, dokončení procesu předchází analýza výsledku vzorku migrace, při kterém je posuzována srozumitelnost a shoda informačního obsahu v novém digitálním objektu a zachování jeho dalších významných (signifikantních) vlastností. K tomu dochází jednak porovnáním vybraných technických vlastností (metadat) původního a nového digitálního objektu nástroji digitálního archivu, jednak individuálním posouzením obsaženého informačního obsahu uživatelem v původním a novém digitálním objektu.
Součástí procesu je vždy formátová analýza nového digitálního objektu, jejíž výsledky dávají mj. informaci o signifikantních vlastnostech nového objektu. Celý proces je na úrovni každého migrovaného objektu logován. Log s těmito záznamy je uživatelsky přístupný. K uložení výsledku migrace formou nové verze informačního balíčku dochází až po schválení dalším uživatelem. Samozřejmostí je zachování výchozí reprezentace (původního digitálního objektu a jeho metadat) v balíčku. Součástí dokumentace každé dávky realizace ochrany ohroženého informačního obsahu je zpráva o určení významných (signifikantních) vlastností původního digitálního objektu a ověření jejich zachování v novém digitálním objektu.
Způsob ověřování zachování významných (signifikantních) vlastností v průběhu procesu realizace ochrany ohroženého informačního obsahu byl navržen s ohledem na technické možnosti digitálního archivu a současný stav poznání. V důsledku očekováného prohlubování znalostí odborné komunity a rozvoje technických prostředků předpokládáme, že okruh sledovaných vlastností bude rozšiřován a že budou zapojovány nástroje pro hromadné ověřování jejich zachování.
Otevřená architektura formátového modulu umožňuje integraci dalších softwarových nástrojů pro migraci. Plánování těchto kroků je součástí přípravy pravidelných plánů na rozvoj systému. Obdobně otevřená architektura celého systému umožňuje integraci dalších metod pro zajištění dlouhodobé srozumitelnosti informačního obsahu uložených digitálních objektů, např. emulace historického software a jeho zpřístupnění určené komunitě.
Tým digitálního archivu sleduje vývoj v oblasti digitálního archivnictví s ohledem na nové metody pro zajištění dlouhodobé logické ochrany, potřeby určené komunity, vývoj nového software pro její zajištění, realizuje výzkum v této oblasti a výsledky této činnosti aplikuje v plánování rozvoje AIS.