Poslední verze | 3.31.0 (13. května 2020) |
---|---|
Vklad | github.com/h2oai/h2o-3 |
Zajištění kvality | Test jednotky |
Napsáno | Jáva |
Operační systém | Linux |
životní prostředí | Virtuální stroj Java |
Typ | Softwarová knihovna |
Licence | Licence Apache |
webová stránka | www.h2o.ai a h2o.ai |
H2O je open source software pro analýzu dat Big Data . Vyrábí ji společnost H2O.ai. H2O umožňuje uživatelům testovat tisíce modelů jako součást objevování vzorců v datech.
H2O lze volat z R , z programu Python nebo z jiných prostředí. Používá se pro průzkum a analýzu dat uložených v cloudu nebo v systémech, jako je HDFS, nebo na konvenčnějších systémech Linux , Mac , Microsoft Windows . H2O Tento software je napsán v jazyce Java , Python , a R . Jeho grafické rozhraní je kompatibilní se čtyřmi prohlížeči: Google Chrome , Safari , Firefox a Internet Explorer .
Cílem projektu H2O je vyvinout analýzu rozhraní cloud computingu a poskytnout uživatelům nástroje pro analýzu dat. Tento software je otevřený a volně distribuovaný. Společnost je za poskytování služby odměňována.
Některé datové soubory jsou příliš velké, které mají být analyzovány pomocí tradičního softwaru, jako je R . H2O poskytuje datové struktury a metody vhodné pro velká data. H2O umožňuje uživatelům analyzovat a vizualizovat celou datovou sadu (bez nutnosti vzorkování). H2O zahrnuje statistické algoritmy: K-prostředky , generalizované lineární modely , distribuované náhodné lesy , stroje stimulující gradient, naivní bayes , analýza hlavních komponent a generalizované modely nízké úrovně.
H2O je také schopné běhu na Sparku.
Iterační metody pro problémy v reálném časeH2O používá iterační metody, které poskytují rychlé odpovědi s využitím všech dat zákazníka. Pokud se zákazník nemůže dočkat optimálního řešení, může přerušit výpočty a použít přibližné řešení. Ve svém přístupu k hlubokému učení H2O rozděluje data do podmnožin a poté analyzuje každou podmnožinu současně pomocí stejné metody. Tyto procesy jsou kombinovány pro odhad parametrů pomocí Hogwildova schématu, stochastické metody paralelního gradientu . Tyto metody umožňují H2O poskytovat odpovědi, které využívají všechna data zákazníka, místo aby většinu z nich zahodily a analyzovaly podmnožinu pomocí tradičního softwaru.
Software H2O má rozhraní pro programovací jazyky: Java (6 nebo vyšší), Python (2.7.x, 3.5.x), R (3.0.0 nebo vyšší) a Scala (1.4-1.6).
Operační systémySoftware H2O lze spustit na klasických operačních systémech: Microsoft Windows ( 7 nebo novější), Mac OS X ( 10.9 nebo novější) a Linux ( Ubuntu 12.04 ; RHEL / CentOS 6 nebo novější). Funguje také na velkých datových systémech, zejména Apache Hadoop Distributed File System (HDFS), několik populárních verzí: Cloudera (5.1 nebo novější), MapR (3.0 nebo novější) a hortonworks a (HDP 2.1 nebo novější). Funguje také na cloudových výpočetních prostředích, například pomocí Amazon EC2 , Google Compute Engine a Microsoft Azure . Software H2O Sparkling Water má certifikaci Databricks na Apache Spark .
Jeho grafické uživatelské rozhraní je kompatibilní se čtyřmi prohlížeči: Google Chrome , Safari , Firefox , Internet Explorer ( IE10 ).