3.1. Formátové reprezentace v AIS

V AIS může být jeden logický soubor - např. naskenovaný dokument, uchováván ve více fyzických kopiích. Soubor může být uchováván více verzích, každá verze ve více formátových skupinách a v rámci některých formátových skupin může být více formátových reprezentací.

Verzí je myšlena obsahová verze, tedy např. pokud se dokument podepíše, znovu naskenuje a nahraje s vazbou na předešlý dokument, stává se jeho obsahovou verzí. AIS v drivé většině případů pracuje pouze s posledními obsahovými verzemi.

Formátová skupina je rozřazení/kategorizace souborů dle jejich použití. Rozlišujeme níže popsané NOT_ORIGINAL, ORIGINAL, LTP_COPY, HQ_COPY, LQ_COPY.

Soubor se jedné v formátové skupině LTP_COPY/HQ_COPY/LQ_COPY může vyskytovat ve více kopiích - ve více formátových reprezentacích. Jedná se především o podporu formátových migrací. Např. pokud souborový formát JPEG zastárne, mohou být všechny LQ kopie formátu JPG migrovány do formátu JPEG 2000 a tím pro každou vznikne nová formátová reprezentace.

Rozeznáváme tyto formátové skupiny:

f000 (NOT_ORIGINAL)
  • Soubory spisových služeb označeny jako koncept. Pokud se k logickému souboru pojí více konceptů, každý v řadě má nové číslo obsahové verze.

  • Všechny koncepty mají nižší číslo obsahové verze než kterýkoliv ORIGINAL - není možné zpětně dohrát novou verzi konceptu, pokud je již v systému originál.

f001 (ORIGINAL)
  • Soubory spisových služeb nebo diplomových prací.

  • V případě diplomých prací je vždy přítomen jeden soubor v obsahové verzi 1.

  • V případě spisových služeb jsou stejně jako konceptům inkrementovány čísla obsahových verzí, číslo obsahové verze prvního originálu je číslo verze posledního konceptu + 1.

f002 - f099 (LTP_COPY)
  • Jedná se buď o digitalizáty (soubory tvořeny v archivu UK skenováním) nebo o formátové migrace (migrace ze zastaralého souborového formátu).

  • V případě digitalizátů má první digitalizát číslo obsahové verze 1 (není možno dohrávat digitalizát k existujícímu ORIGINAL/NOT_ORIGINAL souboru) a označení reprezentace f002. K existujímu digitalizátu může být nahrána nová obsahová verze: taková má inkrementované číslo obsahové verze ale označení reprezentace je opět f002 (první LTP kopie této obsahové verze).

  • Formátové migrace mohou být nahrány vždy k souboru typu NOT_ORIGINAL/ORIGINAL/LTP_COPY v aktuálně poslední obsahové verzi. Každý soubor jenž je migrací má stejné číslo obsahové verze jako původní soubor a inkrementované označení f002-f099 (migrací může pro jednu obsahovou verzi proběhnout více). Příklad 1: ORIGINAL označen f001v2 má první migraci označenou f002v2 a druhou migraci označenou f003v2. Příklad 2: digitalizát označen f002v1 má první migaci označenou f003v1, druhou f004v1.

f100 - f199 (HQ_COPY)
  • Kopie ve vysoké kvalitě, mohou být nahrány vždy k souboru typu NOT_ORIGINAL/ORIGINAL/LTP_COPY v aktuálě poslední obsahové verzi.

f200 - f299 (LQ_COPY)
  • Kopie v nízké kvalitě, mohou být nahrány vždy k souboru typu NOT_ORIGINAL/ORIGINAL/LTP_COPY v aktuálě poslední obsahové verzi.

V obou případech je zde možnost nahrát v čase až 100 kopií, formátové migrace jsou tedy podporovány i na úrovni LQ/HQ kopií.

Názvové konvence souborů v AIPu

Formát filesec