Tovek Indexace

Zajišťuje dostupnost dat v našich řešeních. Sjednocuje data z různých zdrojů, formátů a jazyků. Automaticky identifikuje ve zpracovávaných datech další informace.

Zprovoznění indexace společně s návrhem struktury jednotlivých indexů tvoří obvykle nejnáročnější část implementace platformy Tovek.

Jednotlivé úlohy zajišťují tyto komponenty

Gateway

Zajišťuje přístup k datovému úložišti (souborový systém, databáze, e-mail, DMS apod.). Automaticky hledá v úložišti nová a změněná data a promítá je do systému Tovek. Zabezpečuje rovněž převzetí přístupových práv. U strukturovaných úložišť předává do systému Tovek také informace o struktuře dat. Může též poskytovat další metadata (např. datum poslední úpravy).

Filtr

Z různých datových formátů (PDF, HTML, Word, Excel...) získává textové informace a dostupná metadata.

Locale

Soubor akcí specifických pro daný jazyk. Zahrnuje celou řadu kroků, od rozdělení textu na slova přes normalizaci a lematizaci až k extrakci jmenných entit.

Extrakce metadat

Vyhledává podle zadaných pravidel další struktrované informace.

Tvorba indexu

Vlastní proces tvorby inverzního indexu a jeho zápis na disk. V této fázi se data stávají dostupnými pro ostatní moduly platformy Tovek.

Log

Informace o zpracování se zapisují do protokolů. Ty slouží především k detekci případných problémů během zpracování dat.

Shrnutí

Nepotřebujeme aktivně zasahovat do stávajících informačních systémů. Originální data zůstavají nezměněná na původním místě. Z dat si vytváříme interní rejstříky, které následně využíváme. Přístupová práva jsou zachována. Uživatelé mohou také vytvářet a ukládat další informace přímo v našem systému pomocí vzdálené indexace dostupné přes Tovek Server.

Sjednejte si schůzku, rádi vám Tovek Indexaci podrobněji vysvětlíme.

E-mail obchod@tovek.cz

Telefon +420 222 728 129

Kontakt