2.2. Struktura balíčku
Kapitola popisuje základní struktura balíčku, uložení a pojmenování jednotlivých souborů tvořících balíček. Základním východiskem je specifikace E-ARK CSIP, kapitola 4 CSIP structure.
2.2.1. Struktura složek
Převzatá pravidla z E-ARK:CSIP: 4.1. Folder structure of the CSIP
CZDAX-PSP0101 (E-ARK:CSIPSTR1, převzato beze změny): Každý balíček je uložen v samostatné (jediné) složce.
CZDAX-PSP0102 (E-ARK:CSIPSTR2, upraveno): Název kořenové složky balíčku MUSÍ odpovídat hodnotě
atributu @OBJID
z kořenového elementu v METS.xml
.
CZDAX-PSP0103 (E-ARK:CSIPSTR3, upraveno): Pokud je jednotlivý balíček předáván v zabalené/komprimované podobě,
MUSÍ v tomto kontejneru (TAR nebo ZIP) být jedna složka nejvyšší úrovně, v níž jsou umístěny všechny další podsložky
a soubory vytvářející tento balíček. Název této kořenové složky MUSÍ odpovídat hodnotě
atributu @OBJID
z kořenového elementu v METS.xml
.
CZDAX-PSP0104 (E-ARK:CSIPSTR4, převzato beze změny): Balíček MUSÍ obsahovat kořenový METS.xml
.
CZDAX-PSP0105 (E-ARK:CSIPSTR5, upraveno): Kořenová složka informačního balíčku MUSÍ obsahovat složku
s názvem metadata
, která MUSÍ obsahovat metadata týkající se celého balíčku.
CZDAX-PSP0106 (E-ARK:CSIPSTR6, upraveno): Metadata popisující uchovávání (preservation) MUSÍ být uložena
v podsložce preservation
.
CZDAX-PSP0107 (E-ARK:CSIPSTR7, upraveno): Popisná metadata MUSÍ být uložena v podsložce descriptive
.
CZDAX-PSP0108 (E-ARK:CSIPSTR8, převzato beze změny): Pokud jsou k dispozici další metadata, MOHOU být zařazena
do samostatných podsložek, například do další složky s názvem other
.
CZDAX-PSP0109 (E-ARK:CSIPSTR9, upraveno): Pokud informační balíček obsahuje data či metadata reprezentací,
MUSÍ obsahovat k tomu určenou složku pojmenovanou representations
.
CZDAX-PSP0110 (E-ARK:CSIPSTR10, upraveno): Složka reprezentací MUSÍ obsahovat podsložku pro každou jednotlivou reprezentaci. Každá složka reprezentace musí mít jedinečný název. Vhodnými kandidáty na název podsložky reprezentace může být například název reprezentace a/nebo datum jejího vytvoření.
Originální data reprezentace převzaté v rámci přejímky balíčku musí být povinně uložena ve složce submission
.
CZDAX-PSP0111 (E-ARK:CSIPSTR11, upraveno): Pokud je reprezentace tvořena daty (nikoliv jen metadaty), MUSÍ být
uložena v podsložce pojmenované data
.
CZDAX-PSP0112 (E-ARK:CSIPSTR12, upraveno): Struktura celého balíčku MUSÍ být popsána v kořenovém METS.xml
.
Složky reprezentací obsahující komponenty NESMÍ obsahovat samostatný METS.xml
.
Samostatný soubor MEST.xml`
MŮŽE být uveden jen v případě reprezentací obsahujících
rozšiřující data či metadata. Požadavky na formát takovýchto složek MUSÍ strany individuálně dohodnout
a odsouhlasit.
CZDAX-PSP0113 (E-ARK:CSIPSTR13, upraveno): Složka reprezentace bez METS.xml
NESMÍ obsahovat složku metadata
.
Složka reprezentace s METS.xml
by MĚLA obsahovat podsložku pojmenovanou metadata
, která MŮŽE obsahovat metadata
k dané reprezentaci.
CZDAX-PSP0114 (E-ARK:CSIPSTR14, upraveno): Informační balíček NESMÍ obsahovat žádné dodatečné složky, které nejsou popsány v rámci této či doplňující specifikace výměnného balíčku. Pravidlo CZDAX-PSP0108 <czdax-psp0108> definuje, jakým způsobem lze balíček rozšiřovat o doplňující metadata, avšak ta musí být před přidáním nejprve potvrzena doplňující specifikací schválenou předávajícím i přejímajícím archivem.
CZDAX-PSP0115 (E-ARK:CSIPSTR15, upraveno): Pokud daný typ předávaného obsahu vyžaduje doplňující schémata dat pro strukturovaná
metadata, MUSÍ být umístěna ve složce schemas
v kořenové složce.
CZDAX-PSP0116 (E-ARK:CSIPSTR16, upraveno): Pokud daný typ předávaného obsahu vyžaduje doplňující dokumentaci předávaných
a uchovávaných dat, MUSÍ být umístěna ve složce documentation
v kořenové složce.
2.2.2. Struktura XML souborů
CZDAX-PSP0201: XML soubory s metadaty MUSÍ odpovídat XML ve verzi 1.0. Jako kódování souborů musí být povinně nastaveno UTF-8.
CZDAX-PSP0202: V metadatových souborech MUSÍ být přímo užíván výchozí jmenný prostor.
Z důvodu snazší čitelnosti a neopakování informací je v jednotlivých metadatových XML využíván primárně výchozí jmenný prostor pro uvádění elementů. Explicitně pojmenované jmenné prostory jsou využívány až pro sekundární schémata použitá v rámci daného metadatového souboru. Konkrétní podmínky mohou být dále stanoveny pro jednotlivé typy souborů.
CZDAX-PSP0203: Předávané metadatové soubory NESMÍ obsahovat další atributy či elementy nad rámec tohoto standardu.
Cílem výměnného formátu balíčku je plnohodnotné přenesení úplné informace, a to takovým způsobem, aby byla shodně vnímána na straně tvůrce balíčku i jejího příjemce. V případě nutnosti doplňujících informací je nutná jejich samostatná explicitní definice, případně umístění v k tomu určených strukturách.
2.2.3. Předávání schémat
CZDAX-PSP0301: Schémata k definovaným oborovým standardům BY se NEMĚLA předávat.
Není důvod předávat schémata k uznávaným oborovým standardům, obzvlášť pokud se na nich dohodnou obě strany. Další schémata se mohou uvést v závislosti na předávaném typu dat a jejich specifikaci.
CZDAX-PSP0302: Schémata vybraných standardů se NESMÍ předávat.
NESMÍ se předávat schémata oborových standardů, zejména:
U uvedených standardů se nepředávají ani novější ani starší verze těchto standardů nežli ty, které jsou uvedené v tomto dokumentu.
2.2.4. Předávání dokumentace
Dokumentace se uvádí v závislosti na předávaném typu dat a jejich specifikaci. Předaná dokumentace by měla svou podstatou napomáhat ke zpracování daného informačního balíčku a schopnosti interpretovat jeho obsah. Není důvod předávat dokumentaci k uznávaným oborovým standardům, obzvlášť pokud se na nich dohodnou obě strany.
CZDAX-PSP0401: MĚLA by se předávat dokumentace k méně obvyklým způsobům uložení dat a jejich formátům. Dokumentace formátu souborů a jiných oborových standardů obecně známých BY se NEMĚLA předávat.
Pokud se obě strany dohodnou na předávání dat či metadat nad rámec tohoto standardu, je nutné takováto rozšíření náležitě zdokumentovat a vzniklou dokumentaci uchovat.
CZDAX-PSP0402: Formát dat a metadata předávané nad rámec tohoto standardu na základě vzájemné dohody obou stran MUSÍ být přesně popsány a zdokumentovány. Takováto dokumentace MŮŽE být součástí daného balíčku. Pokud se dokumentace týká shodným způsobem většího množství balíčků, NEMĚLA BY být uvedena u každého balíčku opakovaně, ale MĚLA BY být předána jiným způsobem. U daného balíčku MUSÍ být vhodným způsobem vyznačeno, že má vlastnosti nad rámec tohoto standardu.
CZDAX-PSP0403: Dokumentace k obvyklým souborovým formátům se NESMÍ předávat, zejména se jedná o formáty textových souborů, grafických souborů a jiných dobře popsaných standardů a specifikací.
Jedná se o nadbytečnou zátěž přijímajícího archivu, která navíc vyžaduje nutnost interpretace takové dokumentace. Za dobře zdokumentované soubory lze považovat ty, jejichž formát je popsán ve zveřejněné a dostupné technické specifikaci. Průvodními znaky dobře popsaných formátů je například uvedení formátu ve formátové databázi PRONOM, užití formátu napříč více organizacemi a obzvláště v mezinárodním prostředí. Zachování technického popisu takového formátu může patřit mezi samostatné role archivu nad rámec této specifikace.