3.8. Formát SIPu pro ESM

Do ESM se formou SIPů vkládají a updatují archiválie. Jednotlivý SIP je vždy adresář, který obsahuje metadatové soubory a komponenty tvořící SIP.

Metadatová část je tvořena jedním nebo dvěma XML soubory obsahujícími metadata. Jednotlivé soubory jsou ve formátu METS dle specifikace: http://www.loc.gov/standards/mets/.

Vnitřní struktura SIPu:

sip.xml

Zdrojová (původcovská) metadata SIPu. Soubor je uložen jako součást archiválie.

Tento soubor není přítomen v SIPu reprezentující update existující archiválie.

Formát souboru:
  • skartační řízení - NSESSS

  • diplomové práce - MARC XML

  • mimoskartační řízení - METS s EAD sekcí

aip-source.xml

Soubor ve formátu METS s EAD sekcí (EAD). Z EAD sekce jsou vytěžena vybraná metadata do ESM DB. Metadata z EAD sekce jsou ve všech typech balíku extrahovány do databáze stejným způsobem (není tedy možné mapovat obsah stejného EAD elementu na rozdílné databázové atributy v závislosti na typu balíku).

V souboru je skrze METS fileSec zachycena vazba mezi jednotlivými soubory dle specifikace: Formát filesec.

SIP reprezentující novou archiválii

  • Jedná se o případy MSK, ESS, Diplomové práce studentů UK.

  • Soubor je tvořen konverzí ze SIP XML.

  • EAD sekce souboru je vložena do AIP XML a indexována jako původcovská metadata.

  • V případě MSK není soubor aip-source.xml zaslán (je identický s SIP XML) identický s SIP XML.

SIP reprezentující update existující archiválie

  • Jedná se o případy nahrání digitalizátů, obsahových verzí a formátových reprezentací k existujícím archiváliím

  • EAD sekce souboru slouží pouze pro vytěžení dat do ESM DB, není považována za původcovská metadata a není indexována. Sekce musí obsahovat element s číslem verze archiválie - pokud toto není v ESM v době příjmu nejnovější, obohacení této archiválie selže. Soubor může dále obsahovat např. textový řetězec reprezentující odkaz z nestrukturované archivní pomůcky. Soubor neobsahuje technická metadata.

techmd.xml

Soubor s technickými metadaty produkovanými mimo AIS, které mají být vloženy do AIP XML. Níže jsou popsány obecné zásady užití. Jediným případem užití je v této chvíli SIP digitalizace: Techická metadata digitalizace.

Soubor obsahuje 0-n elementů premis:event.

  • pro každý event je v AIS generované nové ID, nelze tedy tímto způsobem vložit metadata k již existujícímu eventu

  • podporované elementy

  • premis:eventType (povinný, musí obsahovat hodnotu ze slovníku https://www.loc.gov/standards/premis/v3/preservation-events.pdf)

  • premis:eventDateTime (volitelný, pokud není obsažen AIS vloží časovou známka zápisu)

  • premis:eventDetailInformation (volitelný)

  • premis:eventOutcomeInformation (volitelný)

  • premis:linkingAgentIdentifierValue (povinný, viz poznámky)

  • premis:linkingObjectIdentifierValue (povinný, viz poznámky)

  • nepodporované elementy

  • premis:eventIdentifier

  • premis:linkingAgentIdentifierType

  • premis:linkingObjectIdentifierType

  • poznámky

  • Event může odkazovat i na objekty které nejsou popsány v techmd.xml, musí však být součástí fileSec v aip-source.xml. Odkazuje se hodnotou atributu ID elementu file v fileSec.

  • Event nemůže odkazovat na agenty kteří nejsou popsáni v techmd.xml.

  • AIS generuje vlastní event creation pouze pro takové nové soubory, které nebyly popsány v některém creation eventu v rámci techmd.xml.

Soubor obsahuje 0-n elementů premis:agent.

  • pro každého agenta je v AIS generované nové ID, nelze tedy tímto způsobem vložit metadata k již existujícímu agentovi, nebo přiřadit event k existujícímu agentovi

  • podporované elementy

  • premis:agentIdentifierValue (povinný, slouží pouze pro vazbu z eventu v techmd.xml, v AIS je následně přepsán generovanou hodnotou)

  • premis:agentName (povinný)

  • všechny další mimo výčet nepodporovaných, volitelně

  • nepodporované elementy

  • premis:agentIdentifierType

  • premis:linkingEventIdentifier

  • premis:linkingRightsStatementIdentifier

  • premis:linkingEnvironmentIdentifier

Soubor obsahuje 0-n elementů premis:object.

  • podporované elementy

  • premis:objectIdentifierValue (povinný, obsahuje hodnotu shodnou s ID použitém v elementu file sekce fileSec souboru aip-source.xml)

  • všechny další mimo výčet nepodporovaných, volitelně

  • nepodporované elementy

  • premis:objectIdentifierType

  • premis:objectCategory

  • premis:preservationLevel

  • premis:compositionLevel

  • premis:fixity

  • premis:size

  • premis:formatDesignation

  • premis:formatRegistry

  • premis:originalName

  • premis:relationship

  • premis:linkingEventIdentifier

  • premis:linkingRightsStatementIdentifier