Differences between revisions 18 and 50 (spanning 32 versions)
Revision 18 as of 2005-06-15 12:23:15
Size: 3866
Editor: 10
Comment:
Revision 50 as of 2013-10-11 14:05:29
Size: 6942
Editor: pyta
Comment:
Deletions are marked like this. Additions are marked like this.
Line 1: Line 1:
#acl TahitiAdminGroup:read,write All:read
#pragma title Serverové rozhraní Damis
Line 3: Line 6:
Data jsou skenována vysokorychlostním skenerem a jsou k nim získány základní údaje - dokumentový typ a číslo jednací. Dále jsou uložena na disk do sdíleného adresáře podle produktové oblasti. Data jsou skenována vysokorychlostním skenerem a jsou k nim získány základní údaje - dokumentový typ a číslo jednací. Dále jsou uložena na disk do sdíleného adresáře.

= Číslo jednací =
Jednoznačným identifikátorem entity ( sady stránek )
přes všechny zpracovávané dávky je číslo jednací. Číslo jednací je 14-ti místný čiselný identifikátor.
Line 7: Line 13:
Základni rozděleni skenovaných souborů bude do adresařové struktury o dvou úrovních.
V první úrovni budou ooděleny jednotlivé naskenované dávky.
Ve druhé úrovni budou jednotlivé stránky logicky sdruženy podle cisel jednacich.
Základni rozděleni skenovaných souborů bude do adresařové struktury o třech úrovních.
Line 23: Line 27:
PRODUKTOVA_RADA - logické rozdělení skenování podle produktových řad. PRODUKTOVA_RADA - adresář , reprezentující logické rozdělení skenování podle produktových řad ( smlouvy,škody určitého typu ).
Line 25: Line 29:
DAVKA - jedna naskenovaná dávka DAVKA - jedna naskenovaná dávka
 * adresář obsahuje soubor description.xml , jeho formát definuje POSAM. V tomto souboru jsou uloženy atributy vzniklé při skenování, popisující tento proces, vytěžené atributy apod.
 * úplnost dávky je určena existencí souboru "complete" ( soubor zapíše POSAM po jejich zpracování) od tohoto okamžiku máme nad adresářem plnou kontrolu kontrolu a můžeme ho v libovolný okamžik smazat
Line 27: Line 33:
 úplnost dávky je určena existencí souboru "complete" ( soubor zapíše POSAM po jejich zpracování)
 od tohoto okamžiku máme nad adresářem plnou kontrolu kontrolu a můžeme ho v libovolný okamžik smazat
SADA_STRANEK - sada stranek se stejným číslem jednacím
* název adresáře se sadou dokumentů formát: číslo jednací
* adresář obsahuje: jednotlivé naskenované stránky a soubor docset.xml
Line 30: Line 37:
SADA_STRANEK - sada stranek se stejným číslem jednacím
 název adresáře se sadou dokumentů
 formát: 8 číslic (např. 00000001)
 
 adresář obsahuje:
  jednotlivé naskenované stránky a soubor docset.xml


Příklad adresářové struktury:
 Následující příklad ukazuje strukturu jedné naskenované dávky.
Dávka obsahuje dvě sady dokumentů ( 00000001 a 00000002 ).
Dávka je již připravena ke zpracování, protože obsahuje soubor complete.
== Příklad adresářové struktury: ==
Následující příklad ukazuje strukturu jedné naskenované dávky. Dávka obsahuje dvě sady dokumentů ( 12345678901234 a 12345678901235 ). Dávka je již připravena ke zpracování, protože obsahuje soubor complete. 
Line 44: Line 41:
.../ProduktovaRadaX/davka00001/00000001/0000001.jpg
.../ProduktovaRadaX/davka00001/00000001/0000002.jpg
.../ProduktovaRadaX/davka00001/00000001/0000003.jpg
.../ProduktovaRadaX/davka00001/00000001/docset.xml
.../ProduktovaRadaX/davka00001/00000002/0000001.jpg
.../ProduktovaRadaX/davka00001/00000002/0000002.jpg
.../ProduktovaRadaX/davka00001/00000002/0000003.jpg
.../ProduktovaRadaX/davka00001/00000002/0000004.jpg
.../ProduktovaRadaX/davka00001/00000002/doxset.xml
.../ProduktovaRadaX/davka00001/12345678901234/0000001.jpg
.../ProduktovaRadaX/davka00001/12345678901234/0000002.jpg
.../ProduktovaRadaX/davka00001/12345678901234/0000003.jpg
.../ProduktovaRadaX/davka00001/12345678901234/docset.xml
.../ProduktovaRadaX/davka00001/12345678901235/0000001.jpg
.../ProduktovaRadaX/davka00001/12345678901235/0000002.jpg
.../ProduktovaRadaX/davka00001/12345678901235/0000003.jpg
.../ProduktovaRadaX/davka00001/12345678901235/0000004.jpg
.../ProduktovaRadaX/davka00001/12345678901235/docset.xml
.../ProduktovaRadaX/davka00001/description.xml
Line 56: Line 54:
= Formát souborů =
Line 57: Line 56:
V souboru docset.xml je popis přiřazení stránek jednotlivým dokumentům a atributy dokumentů
docset.xml
== docset.xml ==

V souboru docset.xml je popis přiřazení stránek jednotlivým dokumentům a atributy dokumentů docset.xml Pokud kódová stránka není uvedena, standardně se rozumí kódování utf-8.

Příklad:
Line 66: Line 68:
   <Attribute name="CJ" value="12345678901234" />
Line 78: Line 81:
Line 89: Line 91:
= Předávané atributy = Rozšířený formátu docset.xml je dostupný zde: [WWW] http://frnk.lightcomp.cz/lcdevel/SpecifikaceTahitiDamisUlozeniDat, část Popis spisu

=== Předávané atributy ===
Line 91: Line 95:
|| Atribut || Význam ||
|| Document.type || dokumentový typ ||
|| Posam...... || další atributy vzniklé při skenování ||
|||| Další atributy viz cmserver/2.xml||
 || Atribut || Význam ||
 || Document.type || dokumentový typ ||
 || Golem.Area || produktová oblast ||
 || Scan.Batch``Id || identifikátor dávky - jednoznačný ||
 || Scan.Prepare || přípravář spisu ||
 || Scan.Operate || uživatel provádějící skenování ||
 || Scan.Date || datum skenování - dd.mm.yyyy ||
 || Scan.Time || čas skenování(vytvoření dávky) - hh:mm ||
 || Damis.Priority || priorita zobrazeni ve stromu, číslo z intervalu 0..100, 100 je největší priorita, defaultní hodnota 0 (pokud atribut není použit) ||
 || Damis.Input``Filter || použití vstupních filtrů a filtrů při otevření souboru, hodnotou jsou flagy prevedene na decimální číslo. Flag na pozici nula určuje použití vstupního filtru 0-fitr se nepoužije, 1-filtr se použije, defaultní hodnota 0. Flag na pozici jedna určuje použití filtru při otevření souboru 0-fitr se nepoužije, 1-filtr se použije, defaultní hodnota 0. Př. 0 - nepoužije se ani vstupní filtr ani filtr při otevření souboru, 3 - použije se vstupní filtr i filtr při otevření souboru. ||
 || Damis.Check``Pages || 1 - nutí uživatele zobrazit všechny stránky v rámci dokumentu, 0 - uživatel nemusí zobrazit každou stránku (defaultní hodnota 0) ||
 || Damis.Allow``Export || umožnění exportu souborů (0 - zakázáno, 1 - povoleno) ||
 || Damis.Allow``Delete || umožnění mazání dokumentů z Damisu (1 - povoleno, jinak zakázáno) ||
 |||| Atributy dokumentu viz cmserver2.xml ||

Povinné atributy:
 * číslo jednací - název atributu je určen definicí v cmserver2.xml
 * atributy skenovací linky označené jako Scan.

== description.xml ==
Soubor obsahuje globální atributy popisující celou dávku, např. příslušnost dávky do krabice (údaj pro spisovou službu) a také obsah všech jednotlivých docset.xml uložených v dávce.

Příklad:
{{{
<?xml version="1.0"?>
<Batch>
 <Attributes>
  <Attribute name="BoxId" value="345-2"/>
  <Attribute name="Scan.person" value="Jan Wagner"/>
 </Attributes>
 <DocumentSets>
  <!-- jednotlivé dávky -->
  <DocumentSet>........</DocumentSet>
  ...
  ...
 </DocumentSets>
<Batch>
}}}

 * <Batch> naskenovaná dávka - obsahuje povinně tag <DocumentSets>
 * <Attributes> popisuje atributy dávky, obsahuje libovolné množství <Attribute> (atribut je volitelný)
 * <Attribute> obsahuje popis jednoho atributu dokumentu
 || Atribut || Význam ||
 || name || název atributu ||
 || value || hodnota atributu ||
 * <Document``Sets> může obsahovat libovolné množství <Document``Set>, popis sady dokumentů je shodný jako formát souboru docset.xml
Line 99: Line 145:


= Diskuze, dotazy atd. =
 * Je dostačující dělení na dvě úrovně? Nemělo by existovat ještě další dělení např. podle datumu skenování?
 * Jakým způsobem se budou řešit “mrtvé adresáře” ( starší adresář, který neobsahuje soubor complete ) ?
 * Soubor {{{description.xml}}} je volitelný

Abstrakt

Dokument je návrhem formátu předávání dat po jejich naskenování do identifikačního a archivačního procesu. Data jsou skenována vysokorychlostním skenerem a jsou k nim získány základní údaje - dokumentový typ a číslo jednací. Dále jsou uložena na disk do sdíleného adresáře.

Číslo jednací

Jednoznačným identifikátorem entity ( sady stránek ) přes všechny zpracovávané dávky je číslo jednací. Číslo jednací je 14-ti místný čiselný identifikátor.

Adresářová struktura

Základni rozděleni skenovaných souborů bude do adresařové struktury o třech úrovních.

 PRODUKTOVA_RADA
  DAVKA1 
    SADA_STRANEK1
    SADA_STRANEK2
    ...
  DAVKA2
    SADA_STRANEK1
    SADA_STRANEK2
    ...

PRODUKTOVA_RADA - adresář , reprezentující logické rozdělení skenování podle produktových řad ( smlouvy,škody určitého typu ).

DAVKA - jedna naskenovaná dávka

  • adresář obsahuje soubor description.xml , jeho formát definuje POSAM. V tomto souboru jsou uloženy atributy vzniklé při skenování, popisující tento proces, vytěžené atributy apod.
  • úplnost dávky je určena existencí souboru "complete" ( soubor zapíše POSAM po jejich zpracování) od tohoto okamžiku máme nad adresářem plnou kontrolu kontrolu a můžeme ho v libovolný okamžik smazat

SADA_STRANEK - sada stranek se stejným číslem jednacím * název adresáře se sadou dokumentů formát: číslo jednací * adresář obsahuje: jednotlivé naskenované stránky a soubor docset.xml

Příklad adresářové struktury:

Následující příklad ukazuje strukturu jedné naskenované dávky. Dávka obsahuje dvě sady dokumentů ( 12345678901234 a 12345678901235 ). Dávka je již připravena ke zpracování, protože obsahuje soubor complete.

.../ProduktovaRadaX/davka00001/12345678901234/0000001.jpg
.../ProduktovaRadaX/davka00001/12345678901234/0000002.jpg
.../ProduktovaRadaX/davka00001/12345678901234/0000003.jpg
.../ProduktovaRadaX/davka00001/12345678901234/docset.xml
.../ProduktovaRadaX/davka00001/12345678901235/0000001.jpg
.../ProduktovaRadaX/davka00001/12345678901235/0000002.jpg
.../ProduktovaRadaX/davka00001/12345678901235/0000003.jpg
.../ProduktovaRadaX/davka00001/12345678901235/0000004.jpg
.../ProduktovaRadaX/davka00001/12345678901235/docset.xml
.../ProduktovaRadaX/davka00001/description.xml
.../ProduktovaRadaX/davka00001/complete

Formát souborů

docset.xml

V souboru docset.xml je popis přiřazení stránek jednotlivým dokumentům a atributy dokumentů docset.xml Pokud kódová stránka není uvedena, standardně se rozumí kódování utf-8.

Příklad:

<?xml version="1.0"?>
<DocumentSet>
 <Document>
  <Attributes>
   <Attribute name="Document.type" value="ZP006" /> 
   <Attribute name="CJ" value="12345678901234" /> 
  </Attributes>
  <Files>
   <File name="00000001.jpg" mimeType="IMAGE/JPEG"/>
  </Files>
 </Document>
</DocumentSet>
  • <DocumentSet> může obsahovat libovolné množství <Document>

  • <Document> popisuje jeden dokument, obsahuje <Attributes> a <Files>

  • <Attributes> popisuje atributy dokumentu, obsahuje libovolné množství <Attribute>

  • <Files> popisuje jednu stránku, obsahuje libovolné množství <File>

  • <Attribute> obsahuje popis jednoho atributu dokumentu

    Atribut

    Význam

    name

    název atributu

    value

    hodnota atributu

  • <File> obsahuje popis jedné stránky

    Atribut

    Význam

    name

    název souboru s příslušnou stránkou

    mimeType

    mime typ stránky ( MIME/JPEG, MIME/TIFF)

Rozšířený formátu docset.xml je dostupný zde: [WWW] http://frnk.lightcomp.cz/lcdevel/SpecifikaceTahitiDamisUlozeniDat, část Popis spisu

Předávané atributy

Pro následné zpracování je nutné správné pojmenování atributů. V následující tabulce jsou popsány některé názvy atributů a jejich význam.

  • Atribut

    Význam

    Document.type

    dokumentový typ

    Golem.Area

    produktová oblast

    Scan.BatchId

    identifikátor dávky - jednoznačný

    Scan.Prepare

    přípravář spisu

    Scan.Operate

    uživatel provádějící skenování

    Scan.Date

    datum skenování - dd.mm.yyyy

    Scan.Time

    čas skenování(vytvoření dávky) - hh:mm

    Damis.Priority

    priorita zobrazeni ve stromu, číslo z intervalu 0..100, 100 je největší priorita, defaultní hodnota 0 (pokud atribut není použit)

    Damis.InputFilter

    použití vstupních filtrů a filtrů při otevření souboru, hodnotou jsou flagy prevedene na decimální číslo. Flag na pozici nula určuje použití vstupního filtru 0-fitr se nepoužije, 1-filtr se použije, defaultní hodnota 0. Flag na pozici jedna určuje použití filtru při otevření souboru 0-fitr se nepoužije, 1-filtr se použije, defaultní hodnota 0. Př. 0 - nepoužije se ani vstupní filtr ani filtr při otevření souboru, 3 - použije se vstupní filtr i filtr při otevření souboru.

    Damis.CheckPages

    1 - nutí uživatele zobrazit všechny stránky v rámci dokumentu, 0 - uživatel nemusí zobrazit každou stránku (defaultní hodnota 0)

    Damis.AllowExport

    umožnění exportu souborů (0 - zakázáno, 1 - povoleno)

    Damis.AllowDelete

    umožnění mazání dokumentů z Damisu (1 - povoleno, jinak zakázáno)

    Atributy dokumentu viz cmserver2.xml

Povinné atributy:

  • číslo jednací - název atributu je určen definicí v cmserver2.xml
  • atributy skenovací linky označené jako Scan.

description.xml

Soubor obsahuje globální atributy popisující celou dávku, např. příslušnost dávky do krabice (údaj pro spisovou službu) a také obsah všech jednotlivých docset.xml uložených v dávce.

Příklad:

<?xml version="1.0"?>
<Batch>
 <Attributes>
  <Attribute name="BoxId" value="345-2"/>
  <Attribute name="Scan.person" value="Jan Wagner"/>
 </Attributes>
 <DocumentSets>
  <!-- jednotlivé dávky -->
  <DocumentSet>........</DocumentSet>
  ...
  ...
 </DocumentSets>
<Batch>
  • <Batch> naskenovaná dávka - obsahuje povinně tag <DocumentSets>

  • <Attributes> popisuje atributy dávky, obsahuje libovolné množství <Attribute> (atribut je volitelný)

  • <Attribute> obsahuje popis jednoho atributu dokumentu

    Atribut

    Význam

    name

    název atributu

    value

    hodnota atributu

  • <DocumentSets> může obsahovat libovolné množství <DocumentSet>, popis sady dokumentů je shodný jako formát souboru docset.xml

Poznámky

  • Všechny názvy souborů jsou case sensitive
  • Soubor description.xml je volitelný

SpecifikaceRozhraniDistrSken (last edited 2013-10-11 14:05:29 by pyta)