BI (anglicky business intelligence ( BI ) a pomocný systém rozhodování ( DSS )) je počítač pro použití ze strany tvůrců politiky a podnikatelské sféry. Určuje prostředky, nástroje a metody, které umožňují shromažďovat, konsolidovat, modelovat a obnovovat údaje , materiální nebo nehmotné , o společnosti s cílem poskytnout podporu při rozhodování a umožnit rozhodovacímu orgánu mít přehled o činnosti, která je zpracováno.
Tento typ aplikace je založen na běžné architektuře, jejíž teoretické základy pocházejí hlavně od Ralpha Kimballa , Billa Inmona a DanLinstedta.
Business inteligence je součástí širší architektury informačního systému , ale není konkurenčním konceptem se správou informačního systému . Stejně jako management spadá pod sociologii a ekonomii , management prostřednictvím zpracování dat tvoří dvě radikálně odlišné oblasti, kterými jsou management a zpracování dat . Abychom tento koncept obohatili o tyto dva způsoby myšlení, je možné uvažovat o straně IT zaměřené na inženýrství nazývané business intelligence a další straně, která slouží konkrétněji přístupům k řízení, které se nazývají informace o správě systému .
Anglický termín business intelligence (BI) může vést k záměně s konceptem ekonomické inteligence (IE). Business inteligence neznamená „ ekonomickou inteligenci “, na rozdíl od toho, co by naznačoval doslovný překlad (srovnej tuto diskusi) .
BI se liší od EI třemi způsoby:
V současné době jsou data obchodních aplikací uložena v jedné (nebo více) relačních nebo nerelačních databázích .
Tato data jsou extrahována, transformována a načtena do datového skladu obecně nástrojem typu ETL ( Extract-Transform-Load ).
Datový sklad může mít podobu datového skladu nebo v datovém mart . Obecným pravidlem je, že datový sklad agreguje všechna aplikační data společnosti, zatímco datové tržby (obvykle napájené z dat z datového skladu ) jsou podmnožinami informací týkajících se konkrétního podnikání společnosti (marketing, riziko, řízení, atd.), konkrétní použití (analýza, podávání zpráv atd.), nebo dokonce splnění konkrétních požadavků nebo omezení (rozdělení dat, objemu atd.). Termín počitadlo dat nebo úložiště dat se také používá k označení datového grafu.
Datové sklady vám umožňují vytvářet zprávy, které odpovídají na otázku „Co se stalo?“ Lze je však také navrhnout tak, aby odpovídaly na analytickou otázku „Proč se to stalo?“ „A k prognostické otázce:„ Co se stane? ". V provozním kontextu také odpovídají na otázku „Co se právě děje?“ ", Nebo dokonce v případě aktivního řešení datového skladu" Co by se mělo stát? ".
Reporting je pravděpodobně dnes nejpoužívanější a aplikací BI, umožňuje manažerům:
Programy používané k podávání zpráv přirozeně umožňují reprodukovat stejné výběry a stejné léčby z období na období a měnit určitá kritéria pro zpřesnění analýzy. Reportování však není striktně řečeno aplikací na podporu rozhodování. Budoucnost patří spíše přístrojům typu palubní desky vybaveným funkcemi vícerozměrné analýzy typu Olap. Funkce OLAP, kterou lze získat různými způsoby, například prostřednictvím relační databáze R-OLAP nebo vícerozměrné databáze M-OLAP, nebo dokonce v H-OLAP.
Datové grafy a / nebo datové sklady tak mohou prostřednictvím OLAP umožnit velmi hloubkovou analýzu činnosti společnosti, a to díky statistikám kombinujícím informace týkající se činností zjevně velmi odlišných nebo velmi vzdálených od sebe, ale jejich studie často odhalí dysfunkce , korelace nebo možnosti velmi významných vylepšení.
Interoperability mezi systémy datového skladu , počítačových aplikací nebo pro správu obsahu a systémů podávání zpráv je dosaženo prostřednictvím řízení metadat .
Business inteligence se zaměřuje na měření:
Například můžeme chtít měřit:
Získáme tak tabulku se dvěma položkami:
Pro ilustraci křížové tabulky hlavních tabulek umožňují sestavit tento typ řídicího panelu z databáze .
Pokud nás zajímá třetí dimenze analýzy, například geografická hierarchie prodejních míst (podle země, regionu, obchodu), přesuneme se tak na krychli . Na kontingenční tabulky z Excelu mohou představovat tento typ krychle s „strana“, která představuje souhrnné údaje pro jednotlivé hierarchické úrovně a pro každou dimenzi.
Pokud nás zajímá další osa analýzy, například segmentace zákazníků (podle kategorie, profese, zákazníka), získáme kostku s více než 3 rozměry, která se nazývá hyperkrychle . Termín krychle se často používá místo hyperkrychle .
Nástroje rozhodovacího světa nabízejí možnosti „navigace“ v různých dimenzích krychle nebo hyperkrychle:
Každý z těchto částečných pohledů na krychli nakonec vyústí v buď tabulku podvojného záznamu (křížové třídění), nebo obecně dvourozměrný graf .
Ačkoli je tedy navigace v krychli vícerozměrná, rozhodující osoba ve skutečnosti nemá přístup k syntéze, ale k množství křížových nebo dvourozměrných pohledů, jejichž průzkum, dlouhý a zdlouhavý, je někdy krátký. - obvod pro nedostatek času. To může vést k nákladným chybám při rozhodování.
Může být proto užitečné kombinovat tento přístup s ikonografií korelací , která umožňuje skutečně multidimenzionální přehled bez nadbytečnosti.
Rozhodovací informační systém (CIS) musí být schopen poskytovat čtyři základní funkce: sběr, integraci, distribuci a prezentaci dat . K těmto čtyřem funkcím je přidána administrační funkce , to znamená ovládání samotného SID.
Funkce kolekce (někdy nazývaná datapumping ) pokrývá všechny úkoly spočívající v detekci, výběru, extrakci a filtrování nezpracovaných dat z příslušných prostředí vzhledem k rozsahu pokrytému SID. Protože je běžné, že interní a / nebo externí zdroje dat jsou heterogenní - technicky i sémanticky - je obtížné nastavit tuto funkci v komplexním rozhodovacím systému. Spoléhá se zejména na nástroje ETL ( extrakt-transformace-zatížení pro extrakci-transformaci-načítání).
Zdroj dat , který napájí SID pochází z transakčních systémů produkce, nejčastěji ve formě:
Funkce shromažďování také v případě potřeby hraje roli překódování. Dat reprezentována odlišně od jednoho zdroje na druhý vyžaduje výběr jediné ztvárnění, a tedy užitečný kapitál pro budoucí analýzu.
Funkce integrace spočívá v koncentraci shromážděných dat do jednotného prostoru, jehož základním IT základem je datový sklad . Centrální prvek systému umožňuje aplikacím business intelligence skrývat rozmanitost původu dat a těžit z běžného, homogenního, standardizovaného a spolehlivého zdroje informací v rámci jediného a pokud možno standardizovaného systému.
Mimochodem, data jsou čištěna nebo transformována:
Také v této funkci se provádějí výpočty a agregace (akumulace) společné pro celý projekt.
Funkce integrace je obecně zajištěna správou metadat , která zajišťuje interoperabilitu mezi všemi počítačovými prostředky , ať už jde o strukturovaná data ( databáze přístupné prostřednictvím softwarových balíčků nebo aplikací), nebo data ne. Strukturovaná (dokumenty a jiné nestrukturované zdroje, manipulované obsahem) systémy řízení ).
Funkce šíření činí údaje k dispozici uživatelům , podle vzorů, které odpovídají profilům nebo povolání každého, s vědomím, že přímý přístup do datového skladu není obecně odpovídají specifickým potřebám s rozhodovací pravomocí nebo správce. ‚Analytik. Prioritním cílem je proto segmentovat data do vysoce koherentních informačních kontextů, snadno použitelných a odpovídajících konkrétní rozhodovací činnosti. Zatímco datový sklad může hostit stovky nebo tisíce proměnných nebo indikátorů, rozumný kontext vydání má maximálně jen několik desítek. Každý kontext může odpovídat datamartu , ačkoli neexistují žádná obecná pravidla týkající se fyzického úložiště. Difúzní kontext je velmi často vícerozměrný , to znamená, že jej lze modelovat ve formě hyperkrychle ; poté jej lze zpřístupnit pomocí nástroje OLAP .
Různé kontexty stejného rozhodovacího systému nevyžadují všechny stejnou úroveň podrobností. Mnoho agregací nebo akumulací je zajímavých pouze pro určité aplikace, a proto je není nutné spravovat jako běžné agregáty integrační funkcí: Správa tohoto typu specificity může být zpracována funkcí broadcast. Tyto agregáty lze volitelně trvale ukládat nebo dynamicky počítat na vyžádání.
V této fázi a při navrhování systému podávání zpráv je třeba zvýšit tři úrovně dotazování:
Tato čtvrtá funkce, která je pro uživatele nejviditelnější, určuje podmínky přístupu uživatele k informacím v rámci stanoveného rozhraní člověk-stroj ( HMI ). Zajišťuje řízení přístupu a fungování pracovní stanice , vyřizování požadavků, vizualizaci výsledků v té či oné podobě. Využívá všechny možné komunikační techniky: kancelářské nástroje , žadatele a specializované generátory zpráv, webovou infrastrukturu , mobilní telekomunikace atd.
Je to příčná funkce, která dohlíží na správné provedení všech ostatních. Řídí data procesu aktualizace , dokumentaci dat ( metadata ), zabezpečení , zálohování a správu incidentů.
V podnikání objem zpracovávaných dat v průběhu času rychle roste. Tato data mohou pocházet od dodavatelů, zákazníků, prostředí atd. Toto množství dat se zvyšuje v závislosti na sektoru a aktivitě společnosti. Například v supermarketech je množství dat shromážděných každý den obrovské (zejména v obchodech, kde se shromažďují pokladní doklady).
Společnost má několik možností, jak tento datový tok zpracovat:
Této poslední možnosti odpovídá projekt rozhodování. Jde o zpracování dat a jejich důsledné ukládání, jak přicházejí. Proto je rozhodovací projekt projektem bez časového omezení. To znamená, že jakmile společnost zahájí tento projekt, nezastaví se (s výjimkou výjimečných případů). Wal-Mart (a supermarket řetězce ) je jednou ze společností, která ukládá většina dat (to násobené svá data od 100 do několika let) a dosáhne v příštích letech přijít Petabyte (1000 TB ).
K provádění těchto rozhodovacích projektů existuje řada nástrojů, z nichž každý je víceméně přizpůsoben velikosti společnosti, struktuře stávajících údajů a požadovanému typu analýzy.
Měly by být zvláště zdokumentovány tři oblasti:
To vede k volbě přesných technologií a konkrétního modelu.