Značkovací jazyk HTML
Rozšíření | .html, .htm |
---|---|
Typ MIME | text/html |
Vyvinul | World Wide Web Consortium & WHATWG |
Počáteční verze | 1993 |
Typ formátu | Značkovací jazyk |
Na základě | Standardní zobecněný značkovací jazyk |
Původ | XHTML |
Standard |
ISO / IEC 15445 W3C HTML 4.01 W3C HTML5 |
ISO | 15445 |
Specifikace | Otevřený formát |
Webové stránky |
www.w3.org/html html.spec.whatwg.org/multipage w3c.github.io/html |
HyperText Markup Language , obyčejně zkrátil HTML nebo ve svém posledním HTML5 je značkovací jazyk určen k reprezentaci webových stránek .
Tento jazyk umožňuje:
Často se používá ve spojení s programovacím jazykem JavaScript a kaskádovými styly (CSS). HTML je inspirováno Standard Generalized Markup Language (SGML). Toto je otevřený formát .
English Hypertext Markup Language doslovně překládá do hypertext značkovacího jazyka . Obvykle se používá zkratka HTML, někdy se dokonce opakuje slovo „jazyk“ jako v „jazyce HTML“. Hypertext je někdy psán HyperText označit T v zkratce HTML.
Někdy neinformovaná veřejně mluvící HTM namísto HTML, přičemž HTM je název souboru s příponou, zkrácen na tři písmena, což je omezení, které se nachází ve starších operačních systémech od společnosti Microsoft .
V první polovině 90. let , před vznikem webových technologií, jako je JavaScript (js), kaskádové styly (CSS) a Document Object Model (Dom), diktoval vývoj HTML vývoj World Wide Web . Od roku 1997 a HTML 4 se vývoj HTML značně zpomalil; O 10 let později se HTML 4 stále používá na webových stránkách . V roce 2008 je specifikace HTML5 ve fázi studia a běžně se používá ve druhé polovině roku 2010 .
HTML je jedním ze tří vynálezů, které tvořily základ World Wide Web , spolu s protokolem Hypertext Transfer Protocol (HTTP) a webovými adresami ( URL ). HTML bylo vynalezeno, aby umožnilo psát hypertextové dokumenty spojující různé internetové zdroje s hypertextovými odkazy . Dnes se těmto dokumentům říká „ webová stránka “. vSrpna 1991, když Tim Berners-Lee veřejně inzeruje web na Usenetu , cituje pouze SGML , ale uvádí URL dokumentu s příponou.html.
Ve své knize Tkaní webu , Tim Berners-Lee popisuje rozhodnutí základního HTML na SGML jako bytí jako „diplomatické“, jak je technická: technicky, našel SGML příliš složité, ale chtěl přilákat hypertextový komunitu , který viděl SGML as jazyk. nejslibnější pro standardizaci formátu hypertextových dokumentů. Kromě toho společnost SGML již používala její zaměstnavatel, Evropská organizace pro jaderný výzkum (CERN). ;
První prvky HTML zahrnují:
Popis HTML je pak docela neformální a hlavně definovaný podporou různých současných webových prohlížečů . Dan Connolly pomohl vytvořit z HTML opravdovou aplikaci SGML .
Stav HTML pak odpovídá tomu, co bychom mohli nazvat HTML 1.0 . S tímto názvem však není žádná specifikace, zejména proto, že jazyk byl tehdy v plném vývoji. Proběhlo však standardizační úsilí . Od konce roku 1993 byl termín HTML + používán k označení budoucí verze HTML. Přes takto zahájené standardizační úsilí a do konce 90. let bylo HTML definováno hlavně implementacemi prohlížeče.
Díky prohlížeči NCSA Mosaic zná HTML dva hlavní vynálezy:
S příchodem Netscape Navigator 0.913. října 1994, přidána podpora mnoha prezentačních prvků: textové atributy, blikání, centrování atd.
Vývoj HTML poté trvá dvěma odlišnými cestami:
Návrháři se řídí zásadami SGML, které ponechávají prezentaci ve stylovém jazyce. V tomto případě jsou kaskádové styly (CSS) určeny pro HTML. Pouze podpora tabulek je rychle integrována do prohlížečů, zejména proto, že umožňuje velmi jasné vylepšení prezentace. Kromě znásobení prezentačních prvků pak software vytvářející a konzumující HTML často pojímal dokumenty spíše jako řadu formátovacích příkazů než jako označení představující stromovou strukturu dnes známou jako Document Object Model (DOM). Nedostatek struktury implementovaného HTML je někdy odsouzen jako „ tag soup “, anglicky : tag soup .
v Březen 1995, nově založené konsorcium World Wide Web Consortium (W3C) nabízí výsledek svého výzkumu HTML +: koncept HTML 3.0 . Zahrnuje podporu pro tabulky, obrázky a matematické výrazy. Platnost tohoto konceptu vyprší28. září 1995bez přímého sledování. Na konci roku 1995 , RFC 1866 popisující HTML 2.0 byl dokončen. Hlavním editorem je Dan Connolly . Tento dokument popisuje HTML tak, jak existovalo dříveČerven 1994, takže bez mnoha doplňků Netscape Navigator .
The 14. ledna 1997, W3C publikuje specifikaci HTML 3.2 . Popisuje současnou praxi pozorovanou na začátku roku 1996 , tedy s částmi dodatků Netscape Navigator a Internet Explorer . Mezi jeho nejdůležitější novinky patří standardizace tabulek a mnoho prezentačních prvků. HTML 3.2 těsně předchází HTML 4.0 a obsahuje prvky pro podporu stylů a skriptů.
The 18. prosince 1997W3C publikuje specifikaci HTML 4.0, která standardizuje mnoho rozšíření podporujících styly a skripty, rámce a objekty (všeobecné zahrnutí obsahu). HTML 4.0 také přináší různá vylepšení přístupnosti obsahu, zejména možnost explicitnějšího oddělení mezi strukturou a prezentací dokumentu nebo podporu dalších informací o určitém komplexním obsahu, jako jsou formuláře, tabulky nebo akronymy. HTML 4.0 zavádí tři varianty formátu, které mají podpořit vývoj směrem ke smysluplnějším značkám, přičemž zohledňují dočasná omezení produkčních nástrojů:
Tyto varianty pokračovaly poté bez výrazných úprav v HTML 4.01 a v přechodovém formátu XHTML 1.0 z HTML. Nejnovější specifikací HTML je verze 4.01 ze dne24. prosince 1999. Provádí pouze drobné opravy verze 4.0 .
Od vývoje HTML jako aplikace Standard Generalized Markup Language (SGML) se oficiálně upouští ve prospěch XHTML , aplikace Extensible Markup Language (XML). V roce 2004 však vydavatelé webových prohlížečů vytvořili pracovní skupinu pro webovou hypertextovou aplikační technologii (WHATWG), jejímž cílem bylo zejména znovu zahájit vývoj formátu HTML a vyhovět novým potřebám na technologickém základě, který byl považován za snáze implementovatelný. XHTML 2.0 je určen. To je součástí kontextu obecnější výzvy k režimu provozu W3C, kterou někteří vývojáři a weboví designéři považují za příliš uzavřenou.
v Březen 2007W3C , což je důsledkem neochoty části průmyslového odvětví a návrhářů webového obsahu čelit XHTML 2.0 , obnovuje vývoj HTML a vytváří novou pracovní skupinu pod dohledem Chrisa Wilsona ( Microsoft ) a původně Dana Connollyho ( W3C ), nyní Michael Smith ( W3C ). Tyto zahrnují:
Práce WHATWG byla formálně přijata v roce Květen 2007jako výchozí bod pro novou specifikaci HTML5 . Tento dokument byl vydán jako pracovní návrh dne22. ledna 2008. Mezi konstrukční principy uvedené pracovní skupinou patří zejména:
Přístupnost Task Force je vytvořen W3C vlistopadu 2009- aby se vyřešily problémy s kompatibilitou nového formátu se standardy přístupnosti souvisejícími zejména s implementací ARIA , textovými alternativami a novými prvky canvasa video.
Vývoj XHTML 2.0 zpočátku pokračuje paralelně, v reakci na potřeby dalších oblastí webu, jako jsou mobilní zařízení, podnikové aplikace a serverové aplikace. Pak dovnitřčervence 2009se W3C rozhodl neobnovit pracovní skupinu XHTML 2 na konci roku 2009.
S upuštěním od XHTML 2 proto zůstává verze XHTML 1.1 standardizovanou verzí. HTML5 bude kompatibilní s XHTML a XML, a proto bude umožňovat dokumenty XHTML5 . Je však pravděpodobné, že W3C směřuje k úplnému upuštění od XHTML 1.1 , protože implementace XML v HTML5 činí definici dokumentu typu XHTML y zbytečnou . y (kde yy jsou čísla verzí).
v ledna 2011, rozdíly v názorech mezi Ianem Hicksonem (technikem společnosti Google), který píše specifikaci HTML5, a členy pracovní skupiny W3C vedou WHATWG k vytvoření HTML Living Standard (doslovně: životní úroveň HTML), specifikace HTML určená k se neustále vyvíjí, aby se držel rychlého vývoje nových funkcí vývojáři prohlížečů (na rozdíl od očíslovaných verzí, tedy „opravených“).
Cílem HTML Living Standard je zahrnout HTML5 a neustále jej rozvíjet. Zejména ve verzi22. srpna 2012, referenční dokument vysvětluje, že W3C HTML5, publikováno dne 22. června 2012, je založen na verzi HTML Living Standard , ale HTML Living Standard se v této verzi nezastaví a nadále se vyvíjí. Vyvíjí zejména rozdíly mezi verzí W3C (HTML5) a verzí HTML Living Standard (například nové chyby nejsou v HTML5 brány v úvahu, jsou uvedeny syntaktické rozdíly a nové značky vytvořené HTML Living Standard nejsou součástí HTML5).
HTML je jazyk pro popis formátu dokumentu, který má podobu značkovacího jazyka, jehož syntaxe pochází z jazyka SGML ( Standard Generalized Markup Language ).
Až do verze 4.01 včetně je HTML formálně popsáno jako aplikace Standard Generalized Markup Language (SGML). Postupné specifikace však různými způsoby připouštějí, že agenti uživatelů nejsou v praxi vyhovující analyzátory SGML . Na webových prohlížečů nebyli schopni rozluštit všechny varianty povoleny syntaxe SGML ; na druhou stranu jsou obecně schopni automaticky zachytit mnoho syntaktických chyb, podle první části „ Postelova zákona “: „Buďte liberální v tom, co přijímáte, a konzervativní v tom, co odesíláte“ ( RFC 791). Ve skutečnosti si vývojáři webových stránek a webových prohlížečů vždy užívali velkou volnost se syntaktickými pravidly SGML . A konečně, definice dokumentu typu HTML (DTD), formální technický popis HTML, napsal Dan Connolly až několik let po zavedení HTML.
Navzdory svobodám užívaným standardem se používá terminologie specifická pro SGML : dokument, prvek, atribut, hodnota, značka, entita, platnost, aplikace atd. Díky DTD je možné automaticky zkontrolovat platnost dokumentu HTML pomocí analyzátoru SGML .
Původně byl HTML navržen tak, aby jednoduše označil (nebo označil) text, včetně přidání hypertextových odkazů na něj. Použili jsme minimum značek, jako v následujícím dokumentu HTML:
<TITLE>Exemple de HTML</TITLE> Ceci est une phrase avec un <A HREF=cible.html>hyperlien</A>. <P> Ceci est un paragraphe où il n'y a pas d'hyperlien.Tento příklad obsahuje text, pět značek a odkaz na entitu:
Platný dokument HTML je dokument, který respektuje syntaxi SGML , používá pouze standardizované prvky a atributy a respektuje vnoření prvků popsaných normou. V předchozím příkladu chybí pouze jedna deklarace typu dokumentu, aby se jednalo o platný dokument HTML 2.0.
Platný dokument však není dostatečný, aby vyhovoval specifikované cílové specifikaci HTML. Ve skutečnosti kromě požadavku na platnost podléhá vyhovující dokument dalším omezením, která nejsou vyjádřena definicí typu dokumentu (DTD), ale která jsou vyjádřena samotnou specifikací. To platí zejména pro typ obsahu určitých atributů, jako je například atribut datetime : aby byl kompatibilní s HTML 4.01 , musí sám vyhovovat podmnožině normy ISO 8601 . Přísně analyzátor SGML , jako je validátor HTML W3C, proto nemůže zaručit shodu dokumentu HTML.
V prvních letech byly dokumenty HTML často považovány za ploché struktury a značky za příkazy stylu. Značka <p>byla tedy považována za konec řádku a značka </p>byla ignorována. Nebo když se objevil JavaScript 1.0 , poskytoval přístup k odkazům na dokumenty a formulářům pouze prostřednictvím tabulek document.formsa document.links.
Se zavedením kaskádových stylů a modelu objektu dokumentu bylo nutné vzít v úvahu, že dokumenty HTML mají skutečnou stromovou strukturu , přičemž kořenový prvek obsahuje všechny ostatní prvky. Otevírací a zavírací značky těchto prvků zůstávají volitelné. Dnes však existuje tendence označovat každý prvek a označovat DTD. S výjimkou kořenového prvku má každý prvek přesně jeden přímý nadřazený prvek; tento „strom dokumentů“ se používá zejména ve struktuře formátování, která je z něj odvozena pro aplikaci kaskádových stylů, kde každý prvek může mít své vlastní pozadí, ohraničení a okraj.
Strukturu a kód webových stránek lze zobrazit také přidáním view-source:před adresu URL stránky. Pro aktuální stránku, která by dala . view-source:https://fr.m.wikipedia.org/wiki/Hypertext_Markup_Language
Zdroj HTML | Vzor dokumentu |
---|---|
<!DOCTYPE html PUBLIC "-//IETF//DTD HTML 2.0//EN"> <html> <head> <title> Exemple de HTML </title> </head> <body> Ceci est une phrase avec un <a href="cible.html">hyperlien</a>. <p> Ceci est un paragraphe où il n’y a pas d’hyperlien. </p> </body> </html> |
html hlava titul text tělo text na text text p text |
Verze 4 HTML popisuje 91 prvků . V návaznosti na specifikaci HTML 4 lze funkce implementované HTML rozdělit následovně:
Obecná struktura dokumentu HTML Na nejvyšší úrovni je dokument HTML rozdělen mezi záhlaví a tělo. Záhlaví obsahuje informace o dokumentu, včetně jeho názvu a případně metadat . Tělo obsahuje to, co je zobrazeno. Informace o jazyku Je možné označit jazyk jakékoli části dokumentu a spravovat směs textu psaného zleva doprava s textem zprava doleva . Sémantické značení HTML pomáhá odlišit konkrétní obsah, jako jsou citace z externích děl, úryvky počítačového kódu, zdůrazněné pasáže a zkratky. Některé z těchto prvků, původně navržených k podpoře technické dokumentace, se používají velmi zřídka (například rozlišení mezi proměnnými a ukázkovými hodnotovými prvky v počítačovém kódu, nebo dokonce instance výrazu definovaného v kontextu). Seznamy HTML rozlišuje mezi neuspořádanými a seřazenými seznamy podle toho, zda formální pořadí obsahu v kódu je informací samo o sobě. Tyto seznamy definice také existují, ale jejich rozsah je přesně stanovena. Tabulky Tato funkcionalita se formálně používá pro prezentaci tabulkových dat, ale byla využívána hlavně pro její možnosti rozvržení, než kaskádové styly (CSS) dosáhly dostatečného stupně zralosti. Hypertextové odkazy Primární funkčnost HTML. Zahrnutí obrázků, appletů a různých předmětů Původně HTML umožňovalo pouze hypertextové odkazy na externí média. Vynález specializovaných prvků pro multimédia umožnil automatické zahrnutí obrazu, hudby, videa atd. na webových stránkách. Seskupování prvků Tyto obecné prvky, které obsahu, který označují, nepřiznávají žádný význam, umožňují použít prezentační styly, provádět zpracování pomocí skriptů nebo jakoukoli jinou operaci vyžadující izolaci části obsahu. Styl prezentace Každý prvek nebo dokonce celý dokument může mít aplikované styly. Styly jsou definovány v dokumentu nebo pocházejí z externích kaskádových stylů (CSS). Značení textové prezentace Byl vyvinut před zobecněním CSS, aby rychle poskytl funkčnost grafickým návrhářům. Většina použití se nyní oficiálně nedoporučuje. Rámečky Také známý jako rámečky , často kritizovaná funkce, která vám umožňuje zobrazit více dokumentů HTML v jednom okně. Formulář pro interaktivní vkládání dat Prvky formuláře umožňují návštěvníkům zadávat text a soubory na webové stránky. Skripty Slouží k přidružení částí programu k akci uživatele v dokumentu. Používanými jazyky jsou obvykle JavaScript a VBScript .Atributy se používají k určení vlastností prvků HTML. Ve verzi HTML 4 je 188 atributů .
Některé atributy platí pro téměř všechny prvky:
Ostatní atributy jsou jedinečné pro jeden prvek nebo podobné prvky. Například :
Většina atributů je volitelná. Některé prvky však mají povinné atributy:
Typ obsahu atributů HTML je částečně mimo rozsah tohoto standardu a jeho ověření spadá pod standardy třetích stran, jako jsou URI , typy obsahu nebo jazykové kódy .
Nakonec jsou některé atributy booleovského typu. Jedná se o jediné atributy, jejichž syntaxe může být platně implicitní v HTML: atribut selectedovládacího prvku formuláře lze tedy zkrátit na formulář selectednahrazující celý formulář selected="selected". Tato konkrétní forma je jedním z bodů odlišujících HTML od syntaxe „dobře vytvořených“ dokumentů ve smyslu XML.
Webové stránky lze psát ve všech druzích jazyků a lze použít velmi mnoho znaků , které vyžadují buď jednu znakovou sadu pro každý typ psaní, nebo jednu univerzální znakovou sadu. Když se objevil HTML, univerzální znaková sada Unicode ještě nebyla vynalezena a mnoho znakových sad bylo použito vedle sebe, včetně ISO-8859-1 pro latinskou a západoevropskou abecedu , Shift-JIS pro japonštinu , KOI8-R pro Cyrilice . Dnes je nejvíce převládající kódování UTF-8 do Unicode .
HTTP Komunikační protokol přenáší název znakové sady. Záhlaví HTML může obsahovat připomenutí této znakové sady, které by mělo být stejné, pokud nedojde k chybě nastavení. Nakonec po nesprávném nastavení se skutečně použitá znaková sada může stále lišit od oznámené sady. Tato nesprávná nastavení obecně způsobují chyby zobrazení textu, zejména u znaků, na které se nevztahuje standard ASCII .
Technologie výfukuPřed zobecněním Unicode byly entity definovány tak, aby představovaly určité znaky jiné než ASCII . Začalo to znaky ISO 8859-1 ve standardu HTML 2.0 . Pro diakritiku se tyto entity řídí jednoduchým principem: písmeno, za nímž následuje zkratka přidružené diakritiky.
charakter | odkaz na entitu | Poznámka |
---|---|---|
NA | Á | acutepro akutní přízvuk |
NA | Â | circpro přízvuk háčkem |
NA | À | graveza hrobový přízvuk |
NA | Å | ringpro hlavní kolo |
NA | Ã | tildepro vlkodlak |
NA | Ä | umlna přehlásku |
VS | Ç | cedilpro cedilu |
Ó | Ø | slashpro lomítko |
Formálně formulované W3C je HTML navrženo tak, aby optimalizovalo interoperabilitu dokumentů. HTML se nepoužívá k popisu konečného vykreslení webových stránek . Zejména na rozdíl od desktopového publikování není HTML navrženo tak, aby určovalo vizuální vzhled dokumentů. Místo toho je HTML navrženo tak, aby dávalo smysl různým částem textu: název, seznam, důležitá pasáž, citát atd. HTML bylo vyvinuto s intuicí, že k procházení webu budou používána zařízení všeho druhu: osobní počítače s obrazovkami s různým rozlišením a barevnou hloubkou, mobilní telefony, zařízení pro syntézu a rozpoznávání počítačů. Řeč, počítače s nízkou a vysokou šířkou pásma atd. na.
Protože se HTML nezaměřuje na konečné vykreslení dokumentu, lze stejný dokument HTML zobrazit pomocí široké škály hardwaru a softwaru. Na úrovni hardwaru může být dokument zobrazen zejména na obrazovce počítače v grafickém režimu nebo na terminálu počítače v textovém režimu , může být vytištěn nebo může být vysloven hlasovou syntézou . Na softwarové úrovni ani HTML nedává předpoklady a několik typů softwaru čte HTML: webový prohlížeč , prohledávač , různé skripty (v Perlu , PHP ) pro automatické zpracování.
Vysoký stupeň interoperability pomáhá snížit náklady poskytovatelů obsahu, protože jedna verze každého dokumentu slouží široké škále potřeb. Pro uživatele webu interoperabilita umožňuje existenci mnoha konkurenčních prohlížečů, které jsou všechny schopné zobrazit celý web.
Každá verze HTML se snažila odrážet největší konsenzus mezi průmyslovými hráči, takže investice poskytovatelů obsahu nejsou zbytečné a jejich dokumenty se rychle stávají nečitelnými. Při vývoji jazyka nebylo vždy dodržováno oddělení obsahu a formy, o čemž svědčí například označení stylu textu, které umožňuje určit zejména požadované písmo pro zobrazení, jeho velikost nebo barvu.