.. _struktura_metadata: =================== Zápis metadat =================== .. role:: xpath(code) :language: xquery .. role:: xml(code) :language: xml .. _struktura_metadata_obecne: Obecné požadavky na metadata v informačním balíčku =================================================== Obecné požadavky na metadata vychází z :ref:`E-ARK:CSIP `:5.1. General requirements for metadata in a CSIP Information Package. Stejně jako u ostatních částí této specifikace je hlavním hlediskem u metadat interoperabilita. Konkrétně se jedná o technickou interoperabilitu na vysoké úrovni a požadavky, které umožňují přípravu, přenos a příjem informačního balíčku bez ohledu na zapojené archivy nebo nástroje. Tyto požadavky zahrnují: - jednoznačnou identifikaci informačního balíčku a jeho :term:`komponent ` - validace informačního balíčku a jeho obsahu - zajištění věrohodnosti původu archivního informačního balíčku (viz archivní zákon č. 499/2004 Sb. §3, odst. 5) - zpřístupnění informačního obsahu balíčku. Z technického hlediska se definuje specifikace pravidel pro metadata, a to tak, aby uživatelé pomocí nástrojů mohli: - procházet datové a metadatové komponenty v rámci balíčku; - ověřit, že při přenosu nebo dlouhodobém uchovávání nedošlo k poškození žádné komponenty (fixity information); - porozumět procesům při vytváření a dosavadním uchovávání balíčku (tj. metadata o původu a uchovávání); - porozumět, jakým způsobem je možné data v archivním balíčku zpřístupnit (tj. popisná metadata, případně jiné reprezentace). Na rozdíl od specifikace :ref:`E-ARK ` tato specifikace podrobněji určuje způsob uchovávání popisných i technických metadat, a to tak, aby je bylo možné přenášet mezi jednotlivými systémy a využívat je. Současně MUSÍ mezi předávajícím a přijímajícím systémem panovat na základě tohoto standardu důvěra ve správnost těchto předávaných metadat. Základní požadavky na metadata jsou popsány pomocí :ref:`METS `. Ve standardu je přesně popsán způsob a rozsah použití jednotlivých prvků. Pro účely této specifikace jsou rozlišovány následující typy metadat: *administrativní metadata* Zahrnují informace nezbytné pro zajištění :term:`dlouhodobého uchovávání ` v digitálním archivu, tj. jeho příslušnost k archivnímu souboru, způsob akvizice, informace o životním cyklu jeho částí, zajištění formátové ochrany a integrity dat. *popisná metadata* Poskytují podrobné informace o obsahu a kontextu digitálních objektů, což umožňuje uživatelům pochopit a efektivně využívat archivované materiály. *technická metadata* Metadata popisující technické vlastnosti a charakteristiky jednotlivých komponent tvořících datovou část archivního balíčku. *ostatní metadata* V závislosti na uchovávaném obsahu v rámci digitálního archivu, jeho vnitřní implementaci se mohou vyskytovat další typy metadat, například v souvislosti s právními otázkami, extrakcí obsahu jednotlivých datových komponent apod. Tato specifikace upravuje způsob reprezentace vybrané podmnožiny metadat a definuje jejich výměnný formát. .. _struktura_metadata_spol_pozadavky: Požadavky na používání metadat =================================================== Před podrobným popisem požadavků na používání METS a :ref:`PREMIS ` je třeba zdůraznit některé obecné otázky týkající se metadat, které by měly být důsledně řešeny. .. _struktura_metadata_spol_pozadavky_idents: Používání identifikátorů --------------------------- .. _czdax-pmd0101: **CZDAX-PMD0101**: Pro identifikátory v rámci výměnného balíčku MUSÍ být využíváno UUID v definovaném tvaru včetně prefixu :token:`uuid-`. UUID se skládá z hexadecimálních znaků a pomlček (např. hodnota :token:`906F4F12-BA52-4779-AE2C-178F9206111F`), má pevnou datovou délku. Jak :ref:`METS `, tak i další metadatové standardy hojně využívají datový typ XML ID (viz: https://www.w3.org/TR/xml-id/). Platné XML ID musí rovněž splňovat omezení NCName (viz: https://www.w3.org/TR/REC-xml-names/#NT-NCName), musí začínat písmenem nebo znakem podtržítka ("_") a nesmí obsahovat jiné znaky než písmena, číslice, pomlčky, podtržítka, tečky a některé rozšiřující a kombinované znaky. Hodnoty NCName a xml:id nemohou začínat číselnými znaky. Řešením je přidání předpony uuid- před hodnotu každého identifikátoru. Příklad: .. code-block:: xml Používání data a času ---------------------- .. _czdax-pmd0102: **CZDAX-PMD0102**: Schéma :ref:`METS ` vyžaduje několik atributů :token:`CREATEDATE` či :token:`LASTMODDATE`, které se používají k zaznamenání časových údajů o vytvoření a změně souborů balíčků. Ačkoli jsou tyto atributy jednoduše pojmenovány :token:`DATE`, ve skutečnosti se jedná o data ve schématu XML a musí obsahovat jak čas, tak datum. V mnoha případech nebudou mít implementátoři k dispozici přesný čas, pouze datum. V těchto případech se použije čas půlnoci a příslušné časové pásmo. Příklad: ``2021-10-12T00:00:00+01:00``. Kontrolní součty ---------------------- .. _czdax-pmd0103: **CZDAX-PMD0103**: Pro každý datový a metadatový soubor vyjma kořenového :file:`METS.xml` MUSÍ být uveden kontrolní součet. Kontrolní součet MUSÍ být vypočtený pomocí funkce SHA512. Ve specifikaci E-ARK se obvykle vyžaduje požadavek na SHA256, v rámci tohoto standardu je závazné užití SHA512. .. _struktura_metadata_rozsah: Rozsah metadat v informačním balíčku =================================================== V informačním balíčku jsou přenášena metadata vztahující se k celému balíčku, k jeho obsahu i ke konkrétní komponentě či její části. .. _czdax-pmd0201: **CZDAX-PMD0201**: Administrativní metadata MUSÍ být předávána ve formátu :ref:`PREMIS `, a to v souladu s technickými požadavky formulovanými v části :ref:`struktura_premis`. Typy předávaných administrativních metadat jsou: - :ref:`struktura_packageinfo`, tj. informace o celém balíčku, jeho zařazení do archivní evidence, informace o souvisejících vnějších či vnitřních změnách v evidenci - :ref:`struktura_uchovaní`, tj. informace o jednotlivých komponentách, jejich uchování, formátových migracích a dalších souvisejících událostech .. _czdax-pmd0202: **CZDAX-PMD0202**: Popisná metadata MUSÍ být předávána ve formátu :ref:`EAD `, dle :ref:`profilu pro ČR `. Rozeznáváme následující typy popisných metadat archiválií: :ref:`Popisná metadata od původce ` Popisná metadata předávaná původcem při přejímce do digitálního archivu, která jsou součástí prvotního SIP. Ukládají se společně s daty a nejsou uložena v samostatných metadatových strukturách balíčku. Jejich vymezení je provedeno v rámci jednotlivých formátů uchovávaných dat. :ref:`Inherentní archivní popis ` Popisná metadata vycházející primárně z dat v digitálním archivu, metadat od původce, doplňujícího archivního popisu v rámci přejímky nebo při následných změnách AIP. :ref:`Kontextuální archivní popis ` Archivní popis vzniklý při zpracování archiválií archiváři v software pro zpracování archiválií.