Ontologie (informatika)

V počítačové a informační vědy , An ontologie je strukturovaná sada termínů a pojmů, reprezentujících znamenat informačního pole, ať už prostřednictvím metadat jednoho jmenného prostoru , nebo prvky prostoru znalostí. Samotná ontologie představuje datový model představující soubor pojmů v doméně i vztahy mezi těmito pojmy. Používá se k uvažování o objektech dané domény. Jednodušeji můžeme také říci, že „ontologie je datová gramatika jazyková“.

Termín je používán analogicky s filozofickým konceptem , ontologie (z onto- , převzato z řeckého ὤν , ὄντος „bytí“, přítomné příčastí slovesa εἰμί „být“), což je studie bytí jako „ být“ , to znamená studium obecných vlastností toho, co existuje.

Koncepty jsou uspořádány do grafu, jehož vztahy mohou být:

Primárním cílem ontologie je modelování souboru znalostí v dané oblasti, které mohou být skutečné nebo imaginární.

Ontologie se používají v umělé inteligenci , sémantickém webu , softwarovém inženýrství , biomedicínské informatice nebo dokonce v informační architektuře jako forma reprezentace znalostí o světě nebo určitém světě. Ontologie obecně popisují:

Zásada

Podle Grubera je „ontologie výslovnou specifikací konceptualizace“, to znamená, že umožňuje specifikovat ve formálním jazyce pojmy domény a jejich vztahy.

Abstraktní přístup

Etymologie odkazuje na „teorii existence“, to znamená teorii, která se snaží vysvětlit pojmy, které ve světě existují, a jak tyto pojmy do sebe zapadají a jsou organizovány tak, aby dávaly smysl. Na rozdíl od člověka , znalosti pro počítačový systém je omezen na poznání, že může představovat.

U lidí jsou reprezentativní znalosti (tj. Vesmír diskurzu ) doplněny o nevyjádřitelné znalosti ( vjemy , vjemy , neverbalizovatelné pocity, nevědomé znalosti, tiché znalosti atd.). Tyto nereprezentovatelné prvky se nicméně podílejí na procesech uvažování a rozhodování , které jsou kognitivními procesy ve znalostním managementu . Kognitivní výkony IT agenta proto budou částečně založeny na poli zastoupení, ke kterému bude mít přístup, tj. Konkrétně na poli zastoupení, které budou formalizovány.

Počítačové ontologie jsou nástroje, které přesně umožňují reprezentaci souboru znalostí ve formě, kterou může počítač použít .

Jednou z autoritativních definic ontologie je definice Grubera:

"Ontologie je specifikace konceptualizace." […] Konceptualizace je abstraktní a zjednodušený pohled na svět, který chceme reprezentovat. "

Tato definice je založena na dvou dimenzích:

Je základem pro formování znalostí. Nachází se na určité úrovni abstrakce a v konkrétním kontextu. Je to také reprezentace sdílené a konsensuální konceptualizace v konkrétní oblasti a směřující ke společnému cíli. Klasifikuje vztahy mezi koncepty do kategorií.

Hodnocení

Podle Grubera pět kritérií umožňuje zdůraznit důležité aspekty ontologie:

Operativní přístup

Spolu s touto poněkud teoretickou definicí toho, co ontologie představuje, lze formulovat další, operativnější definici takto:

"Ontologie je sémantická síť, která seskupuje sadu konceptů, které zcela popisují doménu." Tyto koncepty jsou navzájem propojeny taxonomickými vztahy (hierarchizace konceptů) na jedné straně a sémantickými na straně druhé. "

Tato definice umožňuje psát jazyky určené k implementaci ontologií. K vybudování ontologie máme alespoň tři z těchto pojmů:

  1. stanovení pasivních nebo aktivních látek;
  2. jejich funkční a kontextové podmínky;
  3. jejich možné transformace směrem k omezeným cílům.

K modelování ontologie použijeme tyto nástroje:

  1. upřesnit slovníky a sousední koncepty;
  2. rozdělit do kategorií a dalších témat;
  3. kázat, aby poznal sousední transformace a orientoval se na vnitřní cíle;
  4. relativizovat, aby zahrnoval koncepty;
  5. obdobně za účelem redukce na zcela odlišné báze;
  6. vytvořit instanci za účelem reprodukce celé „větve“ na jinou ontologii.

Typy

Identifikujeme tři typy ontologií podle klesající úrovně abstrakce.

Pohodlné

Příklady

Například k popisu konceptů zapojených do návrhu elektronických karet bychom mohli definovat následující ontologii (zde zjednodušenou):

Jazyky

Specifikační jazyk je ústředním prvkem, na kterém je ontologie založena.

Většina z těchto jazyků je založena na logice prvního řádu nebo se jí blíží , a proto představují znalosti ve formě tvrzení (předmět, predikát, objekt). Tyto jazyky jsou obvykle navrženy tak, aby abstrahovaly od datových struktur a zaměřovaly se na sémantiku. Mezi nejpoužívanějšími formalizmy založenými na logice predikátů najdeme jazyky jako N3 nebo N-Triple . Můžeme také vyvolat jazyk DEF- * .

Kromě toho, jako součást své práce na sémantického webu , v roce 2002 W3C ustavil pracovní skupinu věnovanou rozvoji standardních jazyků pro modelování ontologií, které mohou být použity i vyměněné na webu . Tato skupina, inspirovaná předchozími jazyky jako DAML + OIL a teoretickými základy logiky popisu , vydala v roce 2004 doporučení definující jazyk OWL ( Web Ontology Language ), založený na standardu RDF a specifikující syntaxi XML. OWL, expresivnější než jeho předchůdce RDFS , rychle zaujal významné místo v ontologické krajině a nyní je de facto nejpoužívanějším standardem.

Ačkoli byl vyvinut pro reprezentaci řízených a strukturovaných slovníků (tezauri), lze SKOS použít k vytváření a správě lehkých vícejazyčných ontologií.

Nástroje

Následující redaktoři ontologie jsou zdarma a lze je stáhnout:

Se vznikem trhu technologií sémantického webu si můžeme všimnout vzhledu softwarových nástrojů nabízených komerčními vydavateli od roku 2005. Můžeme citovat:

Na druhou stranu existují počítačové nástroje, které umožňují vybudovat ontologii z textového souboru. Tyto nástroje skenují text při hledání opakujících se nebo uživatelem definovaných výrazů, poté analyzují způsob, jakým tyto výrazy souvisejí v textu (podle gramatiky a podle pojmů, které pokrývají a které lze definovat definicí. uživatelský slovník). Výsledkem je ontologie, která představuje globální znalosti, které textový korpus obsahuje v doméně aplikace, kterou pokrývá. Nejdůležitějším příkladem je projekt WordNet (viz odkazy).

Normativní přístup

V Evropě je standardem, který je v současnosti předmětem zvláštní pozornosti, standard umožňující zejména popsat ontologie o nehmotném kulturním dědictví ( knihovny , muzea a archivy atd.).

Její přesné odkazy jsou ISO 21127  : „Ontologie nutné pro popis údajů týkajících se kulturního dědictví“.

Publikované příklady

Poznámky a odkazy

Poznámky
  1. (in) „  Ontologie je výslovná specifikace konceptualizace. […] Konceptualizace je abstraktní zjednodušený pohled na svět, který chceme z nějakého důvodu představovat.  "
  2. V angličtině: „  Ontologický závazek lze minimalizovat specifikováním nejslabší teorie (umožňující většinu modelů) a definováním pouze těch termínů, které jsou nezbytné pro komunikaci znalostí v souladu s touto teorií  “ .
Reference
  1. Viz Třída (matematika) , Třída (informatika) a Třída (filozofická)  (en) , každá relevantní, ale ne totožná s pojmem „třída“ zde.
  2. (en) Thomas R. Gruber, Směrem k zásadám pro design ontologií používaných pro sdílení znalostí ve formální ontologii v koncepční analýze a reprezentaci znalostí, Kluwer Academic Publishers, 1993, [ číst online ] [PDF] .
  3. Tom Gruber, článek "Ontologie" v Encyklopedii databázových systémů , Springer-Verlag, 2009, [ číst online ]
  4. Henri Briand, Fabien Gandon a Fabien Picarougne, Workshop „Znalost modelování“ Znalost Těžba a konferenční management, 8 th frankofonní dny, Sophia Antipolis, 29 leden 2008.
  5. (in) „  IDEAS Group  “ , oficiální stránky (přístup 6. října 2018 )

Podívejte se také

Související články

Bibliografie

externí odkazy