Indexace digitalizované dokumentace

Díky indexaci naleznete potřebný dokument rychle a jednoduše!

Co je indexace?

  • pojmenovávání naskenovaných dokumentů
  • přiřazení popisných informací k naskenovaným dokumentům
  • tvorba výstupní adresářové struktury

Samotné vytvoření digitálního obrazu je pouze prvním krokem k efektivnímu používání digitálního archivu. Bez přiřazení popisných informací dokumentu (někdy nazývaných indexy, klíčová slova, metadata,…) by nebylo možné žádné vyhledávání v digitalizovaných dokumentech. Proto je neoddělitelnou součástí digitalizace papírového dokumentu po vytvoření elektronického obrazu také jeho oindexování.

Příklad:

Po naskenování šanonu s archivovanými cestovními příkazy ze zahraničních služebních cest je vytvořených např. 100 souborů ve formátu TIFF s pojmenováním pomocí jedinečného identifikátoru DMS systému ve formě 9místného čísla – tj. 214002001.tif až 214002100.tif. Pokud by do DMS systému nebyla zavedena spolu se souborem 214002099.tif také informace, že je to „Cestovní příkaz“ ze „Zahraniční pracovní cesta“ z roku „2011“ (v tomto příkladě 3 nejjednodušší indexy), byl by tento naskenovaný obraz daného cestovního příkazu těžko vyhledatelný.

Proto indexaci věnujeme velkou pozornost a vytváříme ji podle konkrétních požadavků zákazníka. Tvorba indexů může být napojená a kontrolovaná přímo proti databázím zákazníka (např. zákaznické číslo, číslo diagnózy, kódy operací,…). V nejjednodušším případě jsou indexy použité například pro tvorbu výstupní adresářové struktury (podle uvedeného příkladu by byl vytvořen podle indexu „rok“ adresář s názvem „2011“, v něm vnořeny podadresáře „Cestovní příkaz“ a „Zahraniční pracovní cesta“, v nichž by byly podle pořadových čísel uloženy samotné digitální obrazy jednotlivých cestovních příkazů).

Možnosti tvorby indexů

  • Automaticky – je možné indexovat systémové údaje (např. datum, rozměr, rozlišení, velikost,…) anebo údaje snímané pomocí čárových kódů anebo zónového OCR - optického rozpoznání znaků v předem definované oblasti (např. vytištěná čísla smlouvy, formuláře identifikované čárovým kódem, ISBN kódy publikací,…)
  • Poloautomaticky – indexování je prováděno operátorem na základě výběru hodnot z listingu případně flexibilním hledáním informací na dokumentu pomocí technologie FlexiCapture s následným ověřováním operátorem (např. číslo dodacího listu, datum vytvoření dokumentu, DIČ na pokladním bloku,…)
  • Manuálně – jedná se o nalezení a identifikaci informace na dokumentu vizuálně operátorem a její manuální zapsání do systému (např. autor dokumentu, stručný popis, zhodnocení fyzického poškození,…)

Příklady možností tvorby indexů

Příklady indexů pro šanon:
  • Název – kód šanonu
  • Firma, provozovna, oddělení…
  • Rok
  • Typ šanonu (např. výběr z listingu)
    • 1 – Dodavatelské_faktury
    • 2 – Odběratelské_faktury
    • 3 – Pokladniční_doklady
    • 4 – Bankovní_doklady
    • ...
Příklad indexů pro složku:
  • Typ_složky (výběr z listingu)
    • 1.1 – Domácí_faktury
    • 1.2 – Zahraniční_faktury
    • 2.1 – Řádné_faktury
    • 2.2 – Zálohové_faktury
    • ...
Příklad indexů pro dokument:
  • Název_dokumentu
    • Číslo faktury
    • Číslo objednávky
    • Číslo dodacího listu
    • ...
Příklad indexů pro knihu:
  • Název knihy/publikace
    • Název 1. kapitoly
    • Název 2. kapitoly
    • ...
  • Jméno autora
  • Rok vydání
  • Žánr
  • ...