PREMIS
V AIS UK jsou metadata dle standardu PREMIS 3.0 součástí metadatového souboru AIP (je jednou ze sekcí souboru aip.xml).
Hlavními případy užití formátu PREMIS jsou:
Zaznamenání vzniku AIP.
Zaznamenání původu a vývoje všech datových komponent, které vytvářejí balíček, a to včetně migrace formátů.
Zaznamenání informací o událostech a agentech souvisejících s dlouhodobým uchováváním (LTP) komponent jako jsou kontrolní součty, podrobné informace o jejich formátech včetně jejich validace.
Zaznamenání událostí vytěžení metadat z uložených digitálních objektů a uložení těchto metadat.
V AIS UK jsou využívány jen elementy Object
, Agent
a Event
.
Pro identifikaci popisovaných digitálních objektů jsou používány identifikátory sdílené s ostatními částmi metadatového souboru AIP.
Zápis událostí
Události se zapisují pomocí sémantické jednotky event
a odpovídajícího elementu <event>
.
Každá událost je identifikována svým lokálním identifikátorem. Povinně se uvádí typ události a
datace. Na základě typu události je určen její charakter. Možné typy událostí, způsob jejich
identifikace a hlavně význam každého typu jsou definovány v této specifikaci. Součástí definice
jednotlivého typu události je také význam rolí napojených objektů a agentů.
Každá událost, která znamená modifikaci informačního balíčku (AIP) je zapsána do metadatového souboru
balíčku jako EVENT
(https://www.loc.gov/standards/premis/v3/preservation-events.pdf).
V rámci AIS jsou využívány jen některé typy událostí, které standard PREMIS umožňuje.
Jde o tyto typy:
Creation
Creation – pro události vzniku AIP, které vznikají operací uvnitř archivu (tj. nevznikají zpracováním SIP).
Ukázka popisu události typu Creation:
<premis:event version="3.0">
<premis:eventIdentifier>
<premis:eventIdentifierType>EventId</premis:eventIdentifierType>
<premis:eventIdentifierValue>EVENT_1</premis:eventIdentifierValue>
</premis:eventIdentifier>
<premis:eventType>creation</premis:eventType>
<premis:eventDateTime>2023-11-22T12:43:24.198559Z</premis:eventDateTime>
<premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifierType>AIS_SoftwareID</premis:linkingAgentIdentifierType>
<premis:linkingAgentIdentifierValue>AIS</premis:linkingAgentIdentifierValue>
</premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifierType>AIS_UserID</premis:linkingAgentIdentifierType>
<premis:linkingAgentIdentifierValue>18468142</premis:linkingAgentIdentifierValue>
</premis:linkingAgentIdentifier>
</premis:event>
Accession
Accession – pro události vzniku AIP, který vzniká zpracováním SIP
Ukázka zápisu události typu Accession:
<premis:event version="3.0">
<premis:eventIdentifier>
<premis:eventIdentifierType>EventId</premis:eventIdentifierType>
<premis:eventIdentifierValue>EVENT_1</premis:eventIdentifierValue>
</premis:eventIdentifier>
<premis:eventType>accession</premis:eventType>
<premis:eventDateTime>2023-06-21T12:59:42.042074Z</premis:eventDateTime>
<premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifierType>AIS_SoftwareID</premis:linkingAgentIdentifierType>
<premis:linkingAgentIdentifierValue>AIS</premis:linkingAgentIdentifierValue>
</premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifierType>AIS_UserID</premis:linkingAgentIdentifierType>
<premis:linkingAgentIdentifierValue>36826263</premis:linkingAgentIdentifierValue>
</premis:linkingAgentIdentifier>
<premis:linkingObjectIdentifier>
<premis:linkingObjectIdentifierType>ObjectId</premis:linkingObjectIdentifierType>
<premis:linkingObjectIdentifierValue>a_00316426_dok00005_f001_v00001</premis:linkingObjectIdentifierValue>
</premis:linkingObjectIdentifier>
</premis:event>
Metadata modification
Metadata modification – pro události editace všech entit v ESM a pro takové vnitřní změny, které nepovedou k vzniku nových balíčků. Výsledkem je vznik nové metadatové verze existujícího balíčku např. v důsledku editace popisných metadat uživatelem.
Ukázka zápisu pro událost typu metadata modification:
<premis:event version="3.0">
<premis:eventIdentifier>
<premis:eventIdentifierType>EventId</premis:eventIdentifierType>
<premis:eventIdentifierValue>EVENT_6</premis:eventIdentifierValue>
</premis:eventIdentifier>
<premis:eventType>metadata modification</premis:eventType>
<premis:eventDateTime>2025-04-16T13:54:10.501471Z</premis:eventDateTime>
<premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifierType>AIS_SoftwareID</premis:linkingAgentIdentifierType>
<premis:linkingAgentIdentifierValue>AIS</premis:linkingAgentIdentifierValue>
</premis:linkingAgentIdentifier>
</premis:event>
Capture
Capture – událost přidání datového objektu k existujícímu AIP uvnitř AIS (např. dohrání digitalizátu)
<premis:event version="3.0">
<premis:eventIdentifier>
<premis:eventIdentifierType>EventId</premis:eventIdentifierType>
<premis:eventIdentifierValue>EVENT_3</premis:eventIdentifierValue>
</premis:eventIdentifier>
<premis:eventType>capture</premis:eventType>
<premis:eventDateTime>2025-04-17T10:08:40.393495Z</premis:eventDateTime>
<premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifierType>AIS_SoftwareID</premis:linkingAgentIdentifierType>
<premis:linkingAgentIdentifierValue>AIS</premis:linkingAgentIdentifierValue>
</premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifierType>AIS_UserID</premis:linkingAgentIdentifierType>
<premis:linkingAgentIdentifierValue>33278123</premis:linkingAgentIdentifierValue>
</premis:linkingAgentIdentifier>
<premis:linkingObjectIdentifier>
<premis:linkingObjectIdentifierType>local</premis:linkingObjectIdentifierType>
<premis:linkingObjectIdentifierValue>a_00294978_dok00001_f002_v00001</premis:linkingObjectIdentifierValue>
</premis:linkingObjectIdentifier>
</premis:event>
Deaccession
Deaccession – pro událost smazání (zneplatnění AIP)
Ukázka zápisu události Deaccession:
<premis:event version="3.0">
<premis:eventIdentifier>
<premis:eventIdentifierType>EventId</premis:eventIdentifierType>
<premis:eventIdentifierValue>EVENT_4</premis:eventIdentifierValue>
</premis:eventIdentifier>
<premis:eventType>deacession</premis:eventType>
<premis:eventDateTime>2025-04-03T13:54:30.346774Z</premis:eventDateTime>
<premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifierType>AIS_SoftwareID</premis:linkingAgentIdentifierType>
<premis:linkingAgentIdentifierValue>AIS</premis:linkingAgentIdentifierValue>
</premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifierType>AIS_UserID</premis:linkingAgentIdentifierType>
<premis:linkingAgentIdentifierValue>46936304</premis:linkingAgentIdentifierValue>
</premis:linkingAgentIdentifier>
</premis:event>
Unpackinng
Unpackinng – pro událost rozbalení datového souboru v kontejneru (vyjmutí datového souboru uloženého v kontejneru, vyjmuté datové soubory jsou uloženy jako nové dokumenty).
<premis:event version="3.0">
<premis:eventIdentifier>
<premis:eventIdentifierType>EventId</premis:eventIdentifierType>
<premis:eventIdentifierValue>EVENT_6</premis:eventIdentifierValue>
</premis:eventIdentifier>
<premis:eventType>unpacking</premis:eventType>
<premis:eventDateTime>2024-08-16T09:00:31.040Z</premis:eventDateTime>
<premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifierType>AIS_UserID</premis:linkingAgentIdentifierType>
<premis:linkingAgentIdentifierValue>52642206</premis:linkingAgentIdentifierValue>
</premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifierType>AIS_SoftwareID</premis:linkingAgentIdentifierType>
<premis:linkingAgentIdentifierValue>python_3.9.18</premis:linkingAgentIdentifierValue>
</premis:linkingAgentIdentifier>
<premis:linkingObjectIdentifier>
<premis:linkingObjectIdentifierType>local</premis:linkingObjectIdentifierType>
<premis:linkingObjectIdentifierValue>a_00404566_dok00001_f002_v00001</premis:linkingObjectIdentifierValue>
</premis:linkingObjectIdentifier>
<premis:linkingObjectIdentifier>
<premis:linkingObjectIdentifierType>local</premis:linkingObjectIdentifierType>
<premis:linkingObjectIdentifierValue>a_00404566_dok00003_f002_v00001</premis:linkingObjectIdentifierValue>
</premis:linkingObjectIdentifier>
<premis:linkingObjectIdentifier>
<premis:linkingObjectIdentifierType>local</premis:linkingObjectIdentifierType>
<premis:linkingObjectIdentifierValue>a_00404566_dok00002_f002_v00001</premis:linkingObjectIdentifierValue>
</premis:linkingObjectIdentifier>
</premis:event>
Format identification
Format identification – pro událost určení formátu datového souboru v AIP.
- Události formátového určení se odkazují na soubory, které byly formátovým určením zpracovány a
na nástroje, které byly při formátovém určení použity. Pokud byla stejná sada nástrojů použita na více souborů, zapisuje se pro ně jedna společná událost. Na závěr se do balíčku zapíše již používaná událost typu metadata modification. Tato událost se odkazuje na uživatele, který změnu metadat potvrdil a na software, který změnu provedl, tedy systém AIS.
Ukázka zápisu události Format identification:
<premis:event version="3.0">
<premis:eventIdentifier>
<premis:eventIdentifierType>EventId</premis:eventIdentifierType>
<premis:eventIdentifierValue>EVENT_3</premis:eventIdentifierValue>
</premis:eventIdentifier>
<premis:eventType>format identification</premis:eventType>
<premis:eventDateTime>2024-10-04T20:36:13.046Z</premis:eventDateTime>
<premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifierType>AIS_UserID</premis:linkingAgentIdentifierType>
<premis:linkingAgentIdentifierValue>33278123</premis:linkingAgentIdentifierValue>
</premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifierType>AIS_SoftwareID</premis:linkingAgentIdentifierType>
<premis:linkingAgentIdentifierValue>Siegfried_1.11.1</premis:linkingAgentIdentifierValue>
</premis:linkingAgentIdentifier>
<premis:linkingObjectIdentifier>
<premis:linkingObjectIdentifierType>local</premis:linkingObjectIdentifierType>
<premis:linkingObjectIdentifierValue>a_00316426_dok00005_f001_v00001</premis:linkingObjectIdentifierValue>
</premis:linkingObjectIdentifier>
</premis:event>
Metadata extraction
Metadata extraction – pro událost vytěžení metadat z datového souboru v AIP
Ukázka zápisu události Metadata extraction:
<premis:event version="3.0">
<premis:eventIdentifier>
<premis:eventIdentifierType>EventId</premis:eventIdentifierType>
<premis:eventIdentifierValue>EVENT_3</premis:eventIdentifierValue>
</premis:eventIdentifier>
<premis:eventType>metadata extraction</premis:eventType>
<premis:eventDateTime>2025-06-05T11:05:22.480Z</premis:eventDateTime>
<premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifierType>AIS_SoftwareID</premis:linkingAgentIdentifierType>
<premis:linkingAgentIdentifierValue>ExifTool_12.76</premis:linkingAgentIdentifierValue>
</premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifierType>AIS_UserID</premis:linkingAgentIdentifierType>
<premis:linkingAgentIdentifierValue>53557701</premis:linkingAgentIdentifierValue>
</premis:linkingAgentIdentifier>
<premis:linkingObjectIdentifier>
<premis:linkingObjectIdentifierType>local</premis:linkingObjectIdentifierType>
<premis:linkingObjectIdentifierValue>a_00367791_dok00001_f001_v00001</premis:linkingObjectIdentifierValue>
</premis:linkingObjectIdentifier>
<premis:linkingObjectIdentifier>
<premis:linkingObjectIdentifierType>local</premis:linkingObjectIdentifierType>
<premis:linkingObjectIdentifierValue>a_00367791_dok00002_f001_v00001</premis:linkingObjectIdentifierValue>
</premis:linkingObjectIdentifier>
</premis:event>
Validation
Validation – pro událost validace určeného datového formátu
Ukázka události typu Validation:
<premis:event version="3.0">
<premis:eventIdentifier>
<premis:eventIdentifierType>EventId</premis:eventIdentifierType>
<premis:eventIdentifierValue>EVENT_5</premis:eventIdentifierValue>
</premis:eventIdentifier>
<premis:eventType>validation</premis:eventType>
<premis:eventDateTime>2024-10-04T20:36:16.554Z</premis:eventDateTime>
<premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifierType>AIS_UserID</premis:linkingAgentIdentifierType>
<premis:linkingAgentIdentifierValue>33278123</premis:linkingAgentIdentifierValue>
</premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifierType>AIS_SoftwareID</premis:linkingAgentIdentifierType>
<premis:linkingAgentIdentifierValue>VeraPDF_1.24.1</premis:linkingAgentIdentifierValue>
</premis:linkingAgentIdentifier>
<premis:linkingObjectIdentifier>
<premis:linkingObjectIdentifierType>local</premis:linkingObjectIdentifierType>
<premis:linkingObjectIdentifierValue>a_00316426_dok00006_f001_v00001</premis:linkingObjectIdentifierValue>
</premis:linkingObjectIdentifier>
</premis:event>
Migration
Migration – pro událost formátové migrace (převodu datového souboru do nového formátu). Události formátové migrace se odkazují na soubory, které formátovou migrací vznikly a na nástroje, které byly při formátové migraci použity. Pokud stejnou sadou nástrojů vznikne více souborů, zapisuje se pro ně jedna společná událost. Nové soubory, vzniklé migrací, se zapisují standardním způsobem pomocí tagů premis:object a odkazy na ně jsou stejné jako u jiných událostí. Na závěr se do balíčku zapíše událost typu metadata modification. Tato událost se odkazuje na uživatele, který změnu metadat potvrdil a na software, který změnu provedl, tedy systém AIS.
Ukázka události typu Migration:
<premis:event version="3.0">
<premis:eventIdentifier>
<premis:eventIdentifierType>EventId</premis:eventIdentifierType>
<premis:eventIdentifierValue>EVENT_7</premis:eventIdentifierValue>
</premis:eventIdentifier>
<premis:eventType>migration</premis:eventType>
<premis:eventDateTime>2025-04-28T09:34:45.374Z</premis:eventDateTime>
<premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifierType>AIS_UserID</premis:linkingAgentIdentifierType>
<premis:linkingAgentIdentifierValue>69822850</premis:linkingAgentIdentifierValue>
</premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifierType>AIS_SoftwareID</premis:linkingAgentIdentifierType>
<premis:linkingAgentIdentifierValue>GraphicsMagick_1.3.38</premis:linkingAgentIdentifierValue>
</premis:linkingAgentIdentifier>
<premis:linkingObjectIdentifier>
<premis:linkingObjectIdentifierType>local</premis:linkingObjectIdentifierType>
<premis:linkingObjectIdentifierValue>a_00410267_dok00001_f002_v00001</premis:linkingObjectIdentifierValue>
</premis:linkingObjectIdentifier>
</premis:event>
Agent
Agenti se zapisují pomocí sémantické jednotky agent a odpovídajícího elementu <agent>
.
Každý agent je identifikován svým lokálním identifikátorem. Povinně se uvádí typ agenta
(osoba, software apod.), jeho název a případně další doplňující identifikátory.
Typy agentů:
Person
Person – zpravidla uživatel AIS, který je identifikován jménem a numerickým ID, které odpovídá jeho osobnímu číslu v rámci UK
Příklad zápisu agenta typu Person:
<premis:agent version="3.0">
<premis:agentIdentifier>
<premis:agentIdentifierType>AIS_UserID</premis:agentIdentifierType>
<premis:agentIdentifierValue>12345678</premis:agentIdentifierValue>
</premis:agentIdentifier>
<premis:agentName>Příjmení, Jméno</premis:agentName>
<premis:agentType>person</premis:agentType>
</premis:agent>
Software
Software - samotný AIS, který pracuje s AIP, případně konkrétní software, který realizuje operace s datovými objekty tvořícími AIP, software je zpravidla identifikován názvem a konkrétní použitou verzí.
Příklad zápisu agenta typu Software:
<premis:agent version="3.0">
<premis:agentIdentifier>
<premis:agentIdentifierType>AIS_SoftwareID</premis:agentIdentifierType>
<premis:agentIdentifierValue>VeraPDF_1.24.1</premis:agentIdentifierValue>
</premis:agentIdentifier>
<premis:agentName>VeraPDF</premis:agentName>
<premis:agentType>software</premis:agentType>
<premis:agentVersion>1.24.1</premis:agentVersion>
</premis:agent>
Objekt
V AIS je používána jen kategorie objektu soubor (premis:file
).
Pro popis reprezentací a intelektuálních entit je v AIP XML je použita sekce mets fileGrp
.
Objekt typu file v AIS UK:
Identifikace pomocí uuid a sémantických identifikátorů (hodnota z názvové konvence AIS UK)
Součástí popisu objektu je označení úrovně ochrany s možnými hodnotami:
ORIGINAL
,LTP_COPY
,HQ_COPY
aLQ_COPY
Kontrolní součet typu SHA-512 s uvedením hodnoty
Velikost v byte
Popis formátu ( <premis:format>
), pro určení formátu jsou používány identifikátory
z formátové knihovny AIS UK, PRONOM a FDD. Výčet používaných formátových knihoven může
být v budoucnu rozšířen. Pokud nástroj bude schopen určit i další identifikátory, zapíší
se opakujícím se tagem format. Součástí popisu formátu je informace o validaci určeného formátu
zapsaná v poli <premis:formatNote>
s hodnotami VALID
/NOT VALID
/NOTVALIDATED
.
Zápis vytěžených technických metadat (sekce <premis:objectCharacteristicsExtension>
) v níž jsou zanořeny
definované kontejnery se zápisem technických metadat pro určené skupiny formátů:
Pro obrazové soubory formát ExifTool (RDF obálka)
Pro PDF a textové soubory formát ExifTool (RDF obálka)
Pro audiovizuální dokumenty formát Media info.
Ukázka popisu objektu kategorie soubor (premis:file):
<premis:object version="3.0" xsi:type="premis:file">
<premis:objectIdentifier>
<premis:objectIdentifierType>hdl</premis:objectIdentifierType>
<premis:objectIdentifierValue>4af2de3e-49b1-4443-bb18-88786fc86636</premis:objectIdentifierValue>
</premis:objectIdentifier>
<premis:objectIdentifier>
<premis:objectIdentifierType>local</premis:objectIdentifierType>
<premis:objectIdentifierValue>a_00316426_dok00001_f001_v00001</premis:objectIdentifierValue>
</premis:objectIdentifier>
<premis:preservationLevel>
<premis:preservationLevelValue>ORIGINAL</premis:preservationLevelValue>
</premis:preservationLevel>
<premis:objectCharacteristics>
<premis:compositionLevel>1</premis:compositionLevel>
<premis:fixity>
<premis:messageDigestAlgorithm>SHA-512</premis:messageDigestAlgorithm> <premis:messageDigest>f08b7f0181b0ddb6a5388fd804663dd4dcf9eaac33b146d47a0b63c5e65d5e4b9c6b9318e6fd780a7e9ac8ed8dc7d36dce67ae73dac8d47f307e859626e9b6d5</premis:messageDigest>
</premis:fixity>
<premis:size>323345</premis:size>
<premis:format>
<premis:formatDesignation>
<premis:formatName>Acrobat PDF/A - Portable Document Format 3a</premis:formatName>
</premis:formatDesignation>
<premis:formatRegistry>
<premis:formatRegistryName>AIS_FORMAT_MODULE</premis:formatRegistryName>
<premis:formatRegistryKey>38596e68-1397-4a8f-bad4-a81ada639844</premis:formatRegistryKey>
</premis:formatRegistry>
<premis:formatNote>VALID</premis:formatNote>
</premis:format>
<premis:format>
<premis:formatRegistry>
<premis:formatRegistryName>MIME</premis:formatRegistryName>
<premis:formatRegistryKey>application/pdf</premis:formatRegistryKey>
</premis:formatRegistry>
</premis:format>
<premis:format>
<premis:formatRegistry>
<premis:formatRegistryName>PRONOM</premis:formatRegistryName>
<premis:formatRegistryKey>fmt/479</premis:formatRegistryKey>
</premis:formatRegistry>
</premis:format>
<premis:objectCharacteristicsExtension>
<RDF xmlns="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:exifTool="http://ns.exiftool.org/ExifTool/1.0/" xmlns:pdf="http://ns.exiftool.org/PDF/PDF/1.0/">
<Description about="/var/workspace/process/0c30a7ab-a1eb-4917-a458-58309d260b7a/5b8a48b8-39b3-41aa-9b5e-b7f7f7f18a48/input-files/a_00316426_dok00001_f001_v00001.pdf">
<exifTool:ExifToolVersion>12.76</exifTool:ExifToolVersion>
<pdf:CreateDate>2017:04:24 01:11:16+02:00</pdf:CreateDate>
<pdf:ModifyDate>2017:04:24 01:11:16+02:00</pdf:ModifyDate>
<pdf:Creator>Venca</pdf:Creator>
<pdf:Producer>Microsoft® Word 2016</pdf:Producer>
<pdf:PageCount>1</pdf:PageCount>
</Description>
</RDF>
</premis:objectCharacteristicsExtension>
</premis:objectCharacteristics>
<premis:originalName>komponenty/871/174251/DP_174251_BC.pdf</premis:originalName>
</premis:object>