Indexace digitalizované dokumentace
Díky indexaci naleznete potřebný dokument rychle a jednoduše!
Co je indexace?
- pojmenovávání naskenovaných dokumentů
- přiřazení popisných informací k naskenovaným dokumentům
- tvorba výstupní adresářové struktury
Samotné vytvoření digitálního obrazu je pouze prvním krokem k efektivnímu používání digitálního archivu. Bez přiřazení popisných informací dokumentu (někdy nazývaných indexy, klíčová slova, metadata,…) by nebylo možné žádné vyhledávání v digitalizovaných dokumentech. Proto je neoddělitelnou součástí digitalizace papírového dokumentu po vytvoření elektronického obrazu také jeho oindexování.
Příklad:
Po naskenování šanonu s archivovanými cestovními příkazy ze zahraničních služebních cest je vytvořených např. 100 souborů ve formátu TIFF s pojmenováním pomocí jedinečného identifikátoru DMS systému ve formě 9místného čísla – tj. 214002001.tif až 214002100.tif. Pokud by do DMS systému nebyla zavedena spolu se souborem 214002099.tif také informace, že je to „Cestovní příkaz“ ze „Zahraniční pracovní cesta“ z roku „2011“ (v tomto příkladě 3 nejjednodušší indexy), byl by tento naskenovaný obraz daného cestovního příkazu těžko vyhledatelný.
Proto indexaci věnujeme velkou pozornost a vytváříme ji podle konkrétních požadavků zákazníka. Tvorba indexů může být napojená a kontrolovaná přímo proti databázím zákazníka (např. zákaznické číslo, číslo diagnózy, kódy operací,…). V nejjednodušším případě jsou indexy použité například pro tvorbu výstupní adresářové struktury (podle uvedeného příkladu by byl vytvořen podle indexu „rok“ adresář s názvem „2011“, v něm vnořeny podadresáře „Cestovní příkaz“ a „Zahraniční pracovní cesta“, v nichž by byly podle pořadových čísel uloženy samotné digitální obrazy jednotlivých cestovních příkazů).
Možnosti tvorby indexů
- Automaticky – je možné indexovat systémové údaje (např. datum, rozměr, rozlišení, velikost,…) anebo údaje snímané pomocí čárových kódů anebo zónového OCR - optického rozpoznání znaků v předem definované oblasti (např. vytištěná čísla smlouvy, formuláře identifikované čárovým kódem, ISBN kódy publikací,…)
- Poloautomaticky – indexování je prováděno operátorem na základě výběru hodnot z listingu případně flexibilním hledáním informací na dokumentu pomocí technologie FlexiCapture s následným ověřováním operátorem (např. číslo dodacího listu, datum vytvoření dokumentu, DIČ na pokladním bloku,…)
- Manuálně – jedná se o nalezení a identifikaci informace na dokumentu vizuálně operátorem a její manuální zapsání do systému (např. autor dokumentu, stručný popis, zhodnocení fyzického poškození,…)
Příklady možností tvorby indexů
|
Příklady indexů pro šanon:
|
Příklad indexů pro složku:
|
Příklad indexů pro dokument:
|
|
Příklad indexů pro knihu:
|
