Vyvinul | OutWit Technologies |
---|---|
Poslední verze | 9.0 |
Operační systém | Microsoft Windows , macOS a Linux |
Typ | software pro škrábání webu , správce stahování |
Licence | vlastnická licence |
webová stránka | www.outwit.com |
OutWit Hub je software pro škrábání webů , navržený k automatickému získávání a shromažďování informací z online nebo místních zdrojů.
Program rozpoznává a shromažďuje odkazy, obrázky, dokumenty, kontakty, opakující se slova a skupiny slov, kanály RSS a převádí strukturovaná nebo nestrukturovaná data do formátovaných tabulek, které lze exportovat do tabulek nebo databází . První verze softwaru byla vydána na konci roku 2010. Od té doby byla vydána verze 9.0ledna 2020.
Program obsahuje webový prohlížeč a boční panel, který poskytuje přístup k řadě pohledů obsahujících data z předdefinovaných extraktorů. Webové stránky a textové dokumenty jsou rozděleny do různých složek a v těchto pohledech jsou prezentovány jako tabulky. Aplikace může automaticky procházet řadou odkazů nebo sekvencí stránek s výsledky vyhledávače, aby extrahovala požadované informace, uspořádala je do tabulek a exportovala v různých formátech. Předem definované extraktory umožňují shromažďovat strukturované tabulky, seznamy a toky. Pokud tyto automatické extrakce nestačí, může uživatel také vytvořit konkrétní škrabky pro extrahování prvků z méně strukturovaných stránek. Regulární výrazy lze použít ve škrabkách i v jiných částech aplikace k definování proměnných značek pro rozpoznávání a extrakci dat.
Program existuje ve dvou verzích: spustitelná aplikace a doplněk Mozilla Firefox se stejnou funkčností. Bezplatnou a omezenou verzi lze stáhnout ze stránek vydavatele a ze stránek ke stažení.