.. _aip_premis: ========================= PREMIS ========================= V AIS UK jsou metadata dle standardu :ref:`PREMIS 3.0 ` součástí metadatového souboru AIP (je jednou ze sekcí souboru aip.xml). Hlavními případy užití formátu PREMIS jsou: - Zaznamenání vzniku AIP. - Zaznamenání původu a vývoje všech datových komponent, které vytvářejí balíček, a to včetně migrace formátů. - Zaznamenání informací o událostech a agentech souvisejících s dlouhodobým uchováváním (LTP) komponent jako jsou kontrolní součty, podrobné informace o jejich formátech včetně jejich validace. - Zaznamenání událostí vytěžení metadat z uložených digitálních objektů a uložení těchto metadat. V AIS UK jsou využívány jen elementy ``Object``, ``Agent`` a ``Event``. Pro identifikaci popisovaných digitálních objektů jsou používány identifikátory sdílené s ostatními částmi metadatového souboru AIP. Zápis událostí ================= Události se zapisují pomocí sémantické jednotky ``event`` a odpovídajícího elementu ````. Každá událost je identifikována svým lokálním identifikátorem. Povinně se uvádí typ události a datace. Na základě typu události je určen její charakter. Možné typy událostí, způsob jejich identifikace a hlavně význam každého typu jsou definovány v této specifikaci. Součástí definice jednotlivého typu události je také význam rolí napojených objektů a agentů. Každá událost, která znamená modifikaci informačního balíčku (AIP) je zapsána do metadatového souboru balíčku jako ``EVENT`` (https://www.loc.gov/standards/premis/v3/preservation-events.pdf). V rámci AIS jsou využívány jen některé typy událostí, které standard PREMIS umožňuje. Jde o tyto typy: Creation ----------- Creation – pro události vzniku AIP, které vznikají operací uvnitř archivu (tj. nevznikají zpracováním SIP). Ukázka popisu události typu Creation: .. code-block:: xml EventId EVENT_1 creation 2023-11-22T12:43:24.198559Z AIS_SoftwareID AIS AIS_UserID 18468142 Accession ----------- Accession – pro události vzniku AIP, který vzniká zpracováním SIP Ukázka zápisu události typu Accession: .. code-block:: xml EventId EVENT_1 accession 2023-06-21T12:59:42.042074Z AIS_SoftwareID AIS AIS_UserID 36826263 ObjectId a_00316426_dok00005_f001_v00001 Metadata modification ----------------------- Metadata modification – pro události editace všech entit v ESM a pro takové vnitřní změny, které nepovedou k vzniku nových balíčků. Výsledkem je vznik nové metadatové verze existujícího balíčku např. v důsledku editace popisných metadat uživatelem. Ukázka zápisu pro událost typu metadata modification: .. code-block:: xml EventId EVENT_6 metadata modification 2025-04-16T13:54:10.501471Z AIS_SoftwareID AIS Capture -------------- Capture – událost přidání datového objektu k existujícímu AIP uvnitř AIS (např. dohrání digitalizátu) .. code-block:: xml EventId EVENT_3 capture 2025-04-17T10:08:40.393495Z AIS_SoftwareID AIS AIS_UserID 33278123 local a_00294978_dok00001_f002_v00001 Deaccession ------------------ Deaccession – pro událost smazání (zneplatnění AIP) Ukázka zápisu události Deaccession: .. code-block:: xml EventId EVENT_4 deacession 2025-04-03T13:54:30.346774Z AIS_SoftwareID AIS AIS_UserID 46936304 Unpackinng --------------------- Unpackinng – pro událost rozbalení datového souboru v kontejneru (vyjmutí datového souboru uloženého v kontejneru, vyjmuté datové soubory jsou uloženy jako nové dokumenty). .. code-block:: xml EventId EVENT_6 unpacking 2024-08-16T09:00:31.040Z AIS_UserID 52642206 AIS_SoftwareID python_3.9.18 local a_00404566_dok00001_f002_v00001 local a_00404566_dok00003_f002_v00001 local a_00404566_dok00002_f002_v00001 Format identification ----------------------- Format identification – pro událost určení formátu datového souboru v AIP. Události formátového určení se odkazují na soubory, které byly formátovým určením zpracovány a na nástroje, které byly při formátovém určení použity. Pokud byla stejná sada nástrojů použita na více souborů, zapisuje se pro ně jedna společná událost. Na závěr se do balíčku zapíše již používaná událost typu metadata modification. Tato událost se odkazuje na uživatele, který změnu metadat potvrdil a na software, který změnu provedl, tedy systém AIS. Ukázka zápisu události Format identification: .. code-block:: xml EventId EVENT_3 format identification 2024-10-04T20:36:13.046Z AIS_UserID 33278123 AIS_SoftwareID Siegfried_1.11.1 local a_00316426_dok00005_f001_v00001 Metadata extraction ------------------------ Metadata extraction – pro událost vytěžení metadat z datového souboru v AIP Ukázka zápisu události Metadata extraction: .. code-block:: xml EventId EVENT_3 metadata extraction 2025-06-05T11:05:22.480Z AIS_SoftwareID ExifTool_12.76 AIS_UserID 53557701 local a_00367791_dok00001_f001_v00001 local a_00367791_dok00002_f001_v00001 Validation ----------------- Validation – pro událost validace určeného datového formátu Ukázka události typu Validation: .. code-block:: xml EventId EVENT_5 validation 2024-10-04T20:36:16.554Z AIS_UserID 33278123 AIS_SoftwareID VeraPDF_1.24.1 local a_00316426_dok00006_f001_v00001 Migration --------------- Migration – pro událost formátové migrace (převodu datového souboru do nového formátu). Události formátové migrace se odkazují na soubory, které formátovou migrací vznikly a na nástroje, které byly při formátové migraci použity. Pokud stejnou sadou nástrojů vznikne více souborů, zapisuje se pro ně jedna společná událost. Nové soubory, vzniklé migrací, se zapisují standardním způsobem pomocí tagů premis:object a odkazy na ně jsou stejné jako u jiných událostí. Na závěr se do balíčku zapíše událost typu metadata modification. Tato událost se odkazuje na uživatele, který změnu metadat potvrdil a na software, který změnu provedl, tedy systém AIS. Ukázka události typu Migration: .. code-block:: xml EventId EVENT_7 migration 2025-04-28T09:34:45.374Z AIS_UserID 69822850 AIS_SoftwareID GraphicsMagick_1.3.38 local a_00410267_dok00001_f002_v00001 Agent ================== Agenti se zapisují pomocí sémantické jednotky agent a odpovídajícího elementu ````. Každý agent je identifikován svým lokálním identifikátorem. Povinně se uvádí typ agenta (osoba, software apod.), jeho název a případně další doplňující identifikátory. Typy agentů: Person ----------------- Person – zpravidla uživatel AIS, který je identifikován jménem a numerickým ID, které odpovídá jeho osobnímu číslu v rámci UK Příklad zápisu agenta typu Person: .. code-block:: xml AIS_UserID 12345678 Příjmení, Jméno person Software ---------------- Software - samotný AIS, který pracuje s AIP, případně konkrétní software, který realizuje operace s datovými objekty tvořícími AIP, software je zpravidla identifikován názvem a konkrétní použitou verzí. Příklad zápisu agenta typu Software: .. code-block:: xml AIS_SoftwareID VeraPDF_1.24.1 VeraPDF software 1.24.1 Objekt ============== V AIS je používána jen kategorie objektu soubor (``premis:file``). Pro popis reprezentací a intelektuálních entit je v AIP XML je použita sekce mets ``fileGrp``. Objekt typu file v AIS UK: - Identifikace pomocí uuid a sémantických identifikátorů (hodnota z názvové konvence AIS UK) - Součástí popisu objektu je označení úrovně ochrany s možnými hodnotami: ``ORIGINAL``, ``LTP_COPY``, ``HQ_COPY`` a ``LQ_COPY`` - Kontrolní součet typu SHA-512 s uvedením hodnoty - Velikost v byte Popis formátu ( ```` ), pro určení formátu jsou používány identifikátory z formátové knihovny AIS UK, PRONOM a FDD. Výčet používaných formátových knihoven může být v budoucnu rozšířen. Pokud nástroj bude schopen určit i další identifikátory, zapíší se opakujícím se tagem format. Součástí popisu formátu je informace o validaci určeného formátu zapsaná v poli ```` s hodnotami ``VALID``/``NOT VALID``/``NOTVALIDATED``. Zápis vytěžených technických metadat (sekce ````) v níž jsou zanořeny definované kontejnery se zápisem technických metadat pro určené skupiny formátů: - Pro obrazové soubory formát ExifTool (RDF obálka) - Pro PDF a textové soubory formát ExifTool (RDF obálka) - Pro audiovizuální dokumenty formát Media info. Ukázka popisu objektu kategorie soubor (premis:file): .. code-block:: xml hdl 4af2de3e-49b1-4443-bb18-88786fc86636 local a_00316426_dok00001_f001_v00001 ORIGINAL 1 SHA-512 f08b7f0181b0ddb6a5388fd804663dd4dcf9eaac33b146d47a0b63c5e65d5e4b9c6b9318e6fd780a7e9ac8ed8dc7d36dce67ae73dac8d47f307e859626e9b6d5 323345 Acrobat PDF/A - Portable Document Format 3a AIS_FORMAT_MODULE 38596e68-1397-4a8f-bad4-a81ada639844 VALID MIME application/pdf PRONOM fmt/479 12.76 2017:04:24 01:11:16+02:00 2017:04:24 01:11:16+02:00 Venca Microsoft® Word 2016 1 komponenty/871/174251/DP_174251_BC.pdf