Differences between revisions 14 and 16 (spanning 2 versions)

Popis formátu uložení naskenovaných dat

Dále je popsán návrh formátu uložení naskenovaných dat. Data jsou skenována vysokorychlostním skenerem a jsou k nim získány základní údaje - dokumentový typ a číslo jednací. Dále jsou uložena na disk do sdíleného adresáře.

Adresářová struktura

Základni rozděleni skenovaných souborů bude do adresařové struktury o dvou úrovních. V první úrovni budou ooděleny jednotlivé naskenované dávky. Ve druhé úrovni budou jednotlivé stránky logicky sdruženy podle cisel jednacich.

 DAVKA1 
  SADA_STRANEK1
  SADA_STRANEK2
  ...
 DAVKA2
  SADA_STRANEK1
  SADA_STRANEK2
  ...

DAVKA - jedna naskenovaná dávka

obsahuje soubor s informacemi o naskenované dávce ( např. vhodné pro spisovou službu ) formát souboru si určí POSAM název "description.xml" úplnost dávky je určena existencí souboru "complete" ( soubor zapíše POSAM po jejich zpracování) od tohoto okamžiku máme nad adresářem plnou kontrolu kontrolu a můžeme ho v libovolný okamžik smazat někdo bude muset řešit mrtvé adresáře ( starší adresář, který neobsahuje soubor complete )

SADA_STRANEK - sada stranek se stejným číslem jednacím

název adresáře se sadou dokumentů formát: 8 číslic (např. 00000001) adresář obsahuje:
- jednotlivé naskenované stránky a soubor docset.xml

Příklad adresářové struktury:

Následující příklad ukazuje strukturu jedné naskenované dávky. Dávka obsahuje dvě sady dokumentů ( 00000001 a 00000002 ). Dávka je již připravena ke zpracování, protože obsahuje soubor complete.

.../SkenovaciAdresar/davka00001/00000001/0000001.jpg
.../SkenovaciAdresar/davka00001/00000001/0000002.jpg
.../SkenovaciAdresar/davka00001/00000001/0000003.jpg
.../SkenovaciAdresar/davka00001/00000001/docset.xml
.../SkenovaciAdresar/davka00001/00000002/0000001.jpg
.../SkenovaciAdresar/davka00001/00000002/0000002.jpg
.../SkenovaciAdresar/davka00001/00000002/0000003.jpg
.../SkenovaciAdresar/davka00001/00000002/0000004.jpg
.../SkenovaciAdresar/davka00001/00000002/doxset.xml
.../SkenovaciAdresar/davka00001/complete
.../SkenovaciAdresar/davka00001/description.xml

V souboru docset.xml je popis přiřazení stránek jednotlivým dokumentům a atributy dokumentů docset.xml

<?xml version="1.0"?>
<DocumentSet>
 <Document>
  <Attributes>
   <Attribute name="Document.type" value="ZP006" /> 
  </Attributes>
  <Files>
   <File name="00000001.jpg" mimeType="IMAGE/JPEG"/>
  </Files>
 </Document>
</DocumentSet>

<DocumentSet> může obsahovat libovolné množství <Document>
<Document> popisuje jeden dokument, obsahuje <Attributes> a <Files>
<Attributes> popisuje atributy dokumentu, obsahuje libovolné množství <Attribute>
<Files> popisuje jednu stránku, obsahuje libovolné množství <File>
<Attribute> obsahuje popis jednoho atributu dokumentu

Atribut

Význam

name

název atributu

value

hodnota atributu
<File> obsahuje popis jedné stránky

Atribut

Význam

name

název souboru s příslušnou stránkou

mimeType

mime typ stránky ( MIME/JPEG, MIME/TIFF)

Předávané atributy

Pro následné zpracování je nutné správné pojmenování atributů. V následující tabulce jsou popsány některé názvy atributů a jejich význam.

Atribut	Význam
Document.type	dokumentový typ
Další atributy viz cmserver.xml

Poznámky

Všechny názvy souborů jsou case sensitive

Diskuze, dotazy atd.

Je dostačující dělení na dvě úrovně? Nemělo by se to dělit ještě na další např. podle datumu skenování?

-  ⇤ ← Revision 14 as of 2005-06-14 14:24:06 → 
  Size: 3680
  Editor: 10
  Comment:
+   ← Revision 16 as of 2005-06-14 14:28:28 → ⇥
  Size: 3839
  Editor: 10
  Comment:
-Deletions are marked like this.
+Additions are marked like this.
 Line 43:
- Dávka obsahuje dvě sady dokumentů ( 00000001 a 00000002 )
 Dávka je již připravena ke zpracování, protože obsahuje soubor complete
+ Dávka obsahuje dvě sady dokumentů ( 00000001 a 00000002 ).
 Dávka je již připravena ke zpracování, protože obsahuje soubor complete.
 Line 102:
+= Diskuze, dotazy atd. =
 Je dostačující dělení na dvě úrovně? Nemělo by se to dělit ještě na další např. podle datumu skenování?

Wiki

Page

User

Popis formátu uložení naskenovaných dat

Adresářová struktura

Předávané atributy

Poznámky

Diskuze, dotazy atd.

Atribut	Význam
name	název souboru s příslušnou stránkou
mimeType	mime typ stránky ( MIME/JPEG, MIME/TIFF)

Atribut	Význam
name	název atributu
value	hodnota atributu