2.2. Struktura balíčku

Kapitola popisuje základní struktura balíčku, uložení a pojmenování jednotlivých souborů tvořících balíček. Základním východiskem je specifikace E-ARK CSIP, kapitola 4 CSIP structure.

2.2.1. Struktura složek

Převzatá pravidla z E-ARK:CSIP: 4.1. Folder structure of the CSIP

CZDAX-PSP0101 (E-ARK:CSIPSTR1, převzato beze změny): Každý balíček je uložen v samostatné (jediné) složce.

CZDAX-PSP0102 (E-ARK:CSIPSTR2, upraveno): Název kořenové složky balíčku MUSÍ odpovídat hodnotě atributu @OBJID z kořenového elementu v METS.xml.

CZDAX-PSP0103 (E-ARK:CSIPSTR3, upraveno): Pokud je jednotlivý balíček předáván v zabalené/komprimované podobě, MUSÍ v tomto kontejneru (TAR nebo ZIP) být jedna složka nejvyšší úrovně, v níž jsou umístěny všechny další podsložky a soubory vytvářející tento balíček. Název této kořenové složky MUSÍ odpovídat hodnotě atributu @OBJID z kořenového elementu v METS.xml.

CZDAX-PSP0104 (E-ARK:CSIPSTR4, převzato beze změny): Balíček MUSÍ obsahovat kořenový METS.xml.

CZDAX-PSP0105 (E-ARK:CSIPSTR5, upraveno): Kořenová složka informačního balíčku MUSÍ obsahovat složku s názvem metadata, která MUSÍ obsahovat metadata týkající se celého balíčku.

CZDAX-PSP0106 (E-ARK:CSIPSTR6, upraveno): Metadata popisující uchovávání (preservation) MUSÍ být uložena v podsložce preservation.

CZDAX-PSP0107 (E-ARK:CSIPSTR7, upraveno): Popisná metadata MUSÍ být uložena v podsložce descriptive.

CZDAX-PSP0108 (E-ARK:CSIPSTR8, převzato beze změny): Pokud jsou k dispozici další metadata, MOHOU být zařazena do samostatných podsložek, například do další složky s názvem other.

CZDAX-PSP0109 (E-ARK:CSIPSTR9, upraveno): Pokud informační balíček obsahuje data či metadata reprezentací, MUSÍ obsahovat k tomu určenou složku pojmenovanou representations.

CZDAX-PSP0110 (E-ARK:CSIPSTR10, upraveno): Složka reprezentací MUSÍ obsahovat podsložku pro každou jednotlivou reprezentaci. Každá složka reprezentace musí mít jedinečný název. Vhodnými kandidáty na název podsložky reprezentace může být například název reprezentace a/nebo datum jejího vytvoření.

Originální data reprezentace převzaté v rámci přejímky balíčku musí být povinně uložena ve složce submission.

CZDAX-PSP0111 (E-ARK:CSIPSTR11, upraveno): Pokud je reprezentace tvořena daty (nikoliv jen metadaty), MUSÍ být uložena v podsložce pojmenované data.

CZDAX-PSP0112 (E-ARK:CSIPSTR12, upraveno): Struktura celého balíčku MUSÍ být popsána v kořenovém METS.xml. Složky reprezentací obsahující komponenty NESMÍ obsahovat samostatný METS.xml. Samostatný soubor MEST.xml` MŮŽE být uveden jen v případě reprezentací obsahujících rozšiřující data či metadata. Požadavky na formát takovýchto složek MUSÍ strany individuálně dohodnout a odsouhlasit.

CZDAX-PSP0113 (E-ARK:CSIPSTR13, upraveno): Složka reprezentace bez METS.xml NESMÍ obsahovat složku metadata. Složka reprezentace s METS.xml by MĚLA obsahovat podsložku pojmenovanou metadata, která MŮŽE obsahovat metadata k dané reprezentaci.

CZDAX-PSP0114 (E-ARK:CSIPSTR14, upraveno): Informační balíček NESMÍ obsahovat žádné dodatečné složky, které nejsou popsány v rámci této či doplňující specifikace výměnného balíčku. Pravidlo CZDAX-PSP0108 <czdax-psp0108> definuje, jakým způsobem lze balíček rozšiřovat o doplňující metadata, avšak ta musí být před přidáním nejprve potvrzena doplňující specifikací schválenou předávajícím i přejímajícím archivem.

CZDAX-PSP0115 (E-ARK:CSIPSTR15, upraveno): Pokud daný typ předávaného obsahu vyžaduje doplňující schémata dat pro strukturovaná metadata, MUSÍ být umístěna ve složce schemas v kořenové složce.

CZDAX-PSP0116 (E-ARK:CSIPSTR16, upraveno): Pokud daný typ předávaného obsahu vyžaduje doplňující dokumentaci předávaných a uchovávaných dat, MUSÍ být umístěna ve složce documentation v kořenové složce.

2.2.2. Struktura XML souborů

CZDAX-PSP0201: XML soubory s metadaty MUSÍ odpovídat XML ve verzi 1.0. Jako kódování souborů musí být povinně nastaveno UTF-8.

CZDAX-PSP0202: V metadatových souborech MUSÍ být přímo užíván výchozí jmenný prostor.

Z důvodu snazší čitelnosti a neopakování informací je v jednotlivých metadatových XML využíván primárně výchozí jmenný prostor pro uvádění elementů. Explicitně pojmenované jmenné prostory jsou využívány až pro sekundární schémata použitá v rámci daného metadatového souboru. Konkrétní podmínky mohou být dále stanoveny pro jednotlivé typy souborů.

CZDAX-PSP0203: Předávané metadatové soubory NESMÍ obsahovat další atributy či elementy nad rámec tohoto standardu.

Cílem výměnného formátu balíčku je plnohodnotné přenesení úplné informace, a to takovým způsobem, aby byla shodně vnímána na straně tvůrce balíčku i jejího příjemce. V případě nutnosti doplňujících informací je nutná jejich samostatná explicitní definice, případně umístění v k tomu určených strukturách.

2.2.3. Předávání schémat

CZDAX-PSP0301: Schémata k definovaným oborovým standardům BY se NEMĚLA předávat.

Není důvod předávat schémata k uznávaným oborovým standardům, obzvlášť pokud se na nich dohodnou obě strany. Další schémata se mohou uvést v závislosti na předávaném typu dat a jejich specifikaci.

CZDAX-PSP0302: Schémata vybraných standardů se NESMÍ předávat.

NESMÍ se předávat schémata oborových standardů, zejména:

U uvedených standardů se nepředávají ani novější ani starší verze těchto standardů nežli ty, které jsou uvedené v tomto dokumentu.

2.2.4. Předávání dokumentace

Dokumentace se uvádí v závislosti na předávaném typu dat a jejich specifikaci. Předaná dokumentace by měla svou podstatou napomáhat ke zpracování daného informačního balíčku a schopnosti interpretovat jeho obsah. Není důvod předávat dokumentaci k uznávaným oborovým standardům, obzvlášť pokud se na nich dohodnou obě strany.

CZDAX-PSP0401: MĚLA by se předávat dokumentace k méně obvyklým způsobům uložení dat a jejich formátům. Dokumentace formátu souborů a jiných oborových standardů obecně známých BY se NEMĚLA předávat.

Pokud se obě strany dohodnou na předávání dat či metadat nad rámec tohoto standardu, je nutné takováto rozšíření náležitě zdokumentovat a vzniklou dokumentaci uchovat.

CZDAX-PSP0402: Formát dat a metadata předávané nad rámec tohoto standardu na základě vzájemné dohody obou stran MUSÍ být přesně popsány a zdokumentovány. Takováto dokumentace MŮŽE být součástí daného balíčku. Pokud se dokumentace týká shodným způsobem většího množství balíčků, NEMĚLA BY být uvedena u každého balíčku opakovaně, ale MĚLA BY být předána jiným způsobem. U daného balíčku MUSÍ být vhodným způsobem vyznačeno, že má vlastnosti nad rámec tohoto standardu.

CZDAX-PSP0403: Dokumentace k obvyklým souborovým formátům se NESMÍ předávat, zejména se jedná o formáty textových souborů, grafických souborů a jiných dobře popsaných standardů a specifikací.

Jedná se o nadbytečnou zátěž přijímajícího archivu, která navíc vyžaduje nutnost interpretace takové dokumentace. Za dobře zdokumentované soubory lze považovat ty, jejichž formát je popsán ve zveřejněné a dostupné technické specifikaci. Průvodními znaky dobře popsaných formátů je například uvedení formátu ve formátové databázi PRONOM, užití formátu napříč více organizacemi a obzvláště v mezinárodním prostředí. Zachování technického popisu takového formátu může patřit mezi samostatné role archivu nad rámec této specifikace.