3.8. Formát SIPu pro ESM
Do ESM se formou SIPů vkládají a updatují archiválie. Jednotlivý SIP je vždy adresář, který obsahuje metadatové soubory a komponenty tvořící SIP.
Metadatová část je tvořena jedním nebo dvěma XML soubory obsahujícími metadata. Jednotlivé soubory jsou ve formátu METS dle specifikace: http://www.loc.gov/standards/mets/.
Vnitřní struktura SIPu:
sip.xml
Zdrojová (původcovská) metadata SIPu. Soubor je uložen jako součást archiválie.
Tento soubor není přítomen v SIPu reprezentující update existující archiválie.
- Formát souboru:
skartační řízení - NSESSS
diplomové práce - MARC XML
mimoskartační řízení - METS s EAD sekcí
aip-source.xml
Soubor ve formátu METS s EAD sekcí (EAD). Z EAD sekce jsou vytěžena vybraná metadata do ESM DB. Metadata z EAD sekce jsou ve všech typech balíku extrahovány do databáze stejným způsobem (není tedy možné mapovat obsah stejného EAD elementu na rozdílné databázové atributy v závislosti na typu balíku).
V souboru je skrze METS fileSec zachycena vazba mezi jednotlivými soubory dle specifikace: Formát filesec.
SIP reprezentující novou archiválii
Jedná se o případy MSK, ESS, Diplomové práce studentů UK.
Soubor je tvořen konverzí ze SIP XML.
EAD sekce souboru je vložena do AIP XML a indexována jako původcovská metadata.
V případě MSK není soubor aip-source.xml zaslán (je identický s SIP XML) identický s SIP XML.
SIP reprezentující update existující archiválie
Jedná se o případy nahrání digitalizátů, obsahových verzí a formátových reprezentací k existujícím archiváliím
EAD sekce souboru slouží pouze pro vytěžení dat do ESM DB, není považována za původcovská metadata a není indexována. Sekce musí obsahovat element s číslem verze archiválie - pokud toto není v ESM v době příjmu nejnovější, obohacení této archiválie selže. Soubor může dále obsahovat např. textový řetězec reprezentující odkaz z nestrukturované archivní pomůcky. Soubor neobsahuje technická metadata.
techmd.xml
Soubor s technickými metadaty produkovanými mimo AIS, které mají být vloženy do AIP XML. Níže jsou popsány obecné zásady užití. Jediným případem užití je v této chvíli SIP digitalizace: Techická metadata digitalizace.
Soubor obsahuje 0-n elementů premis:event.
pro každý event je v AIS generované nové ID, nelze tedy tímto způsobem vložit metadata k již existujícímu eventu
podporované elementy
premis:eventType (povinný, musí obsahovat hodnotu ze slovníku https://www.loc.gov/standards/premis/v3/preservation-events.pdf)
premis:eventDateTime (volitelný, pokud není obsažen AIS vloží časovou známka zápisu)
premis:eventDetailInformation (volitelný)
premis:eventOutcomeInformation (volitelný)
premis:linkingAgentIdentifierValue (povinný, viz poznámky)
premis:linkingObjectIdentifierValue (povinný, viz poznámky)
nepodporované elementy
premis:eventIdentifier
premis:linkingAgentIdentifierType
premis:linkingObjectIdentifierType
poznámky
Event může odkazovat i na objekty které nejsou popsány v techmd.xml, musí však být součástí fileSec v aip-source.xml. Odkazuje se hodnotou atributu ID elementu file v fileSec.
Event nemůže odkazovat na agenty kteří nejsou popsáni v techmd.xml.
AIS generuje vlastní event creation pouze pro takové nové soubory, které nebyly popsány v některém creation eventu v rámci techmd.xml.
Soubor obsahuje 0-n elementů premis:agent.
pro každého agenta je v AIS generované nové ID, nelze tedy tímto způsobem vložit metadata k již existujícímu agentovi, nebo přiřadit event k existujícímu agentovi
podporované elementy
premis:agentIdentifierValue (povinný, slouží pouze pro vazbu z eventu v techmd.xml, v AIS je následně přepsán generovanou hodnotou)
premis:agentName (povinný)
všechny další mimo výčet nepodporovaných, volitelně
nepodporované elementy
premis:agentIdentifierType
premis:linkingEventIdentifier
premis:linkingRightsStatementIdentifier
premis:linkingEnvironmentIdentifier
Soubor obsahuje 0-n elementů premis:object.
podporované elementy
premis:objectIdentifierValue (povinný, obsahuje hodnotu shodnou s ID použitém v elementu file sekce fileSec souboru aip-source.xml)
všechny další mimo výčet nepodporovaných, volitelně
nepodporované elementy
premis:objectIdentifierType
premis:objectCategory
premis:preservationLevel
premis:compositionLevel
premis:fixity
premis:size
premis:formatDesignation
premis:formatRegistry
premis:originalName
premis:relationship
premis:linkingEventIdentifier
premis:linkingRightsStatementIdentifier