Kurz informačních technologií

Elektronický text

Cílem tohoto textu není úvod do webdesignu, ale hlubší pochopení myšlenky o složkách elektronického textu z výukových posterů. Základním východiskem je pohled na dvojí druh obsahu v souboru s elektronickým textem:

  1. samotný text (obsah)
  2. informace o textu (meta-obsah).

Soubor samozřejmě musí obsahovat obojí najednou a do obsahové složky jsou vpleteny informace typu: tohle je nadpis, ten má velikost 20 bodů a modrou barvu, tohle je jen obyčejný odstavec, ten je odsazen zleva o 25 bodů a barvu má černou. Na první pohled vidíte, že tyto meta-informace o struktuře textu a jeho formátování mohou snadno být delší, než samotný úsek textu k němuž se váží, protože, ač to může znít překvapivě, tyto informace jsou v souboru zapsány právě takovouto textovou formou a následně jsou prohlížečem, nebo editorem interpretovány a zobrazeny na monitoru.

Někdo by mohl namítat, že informace o formátování by mohla být uchována prostě jako obrázek: jestliže to má černou barvu a je to odsazené, tak je to prostě obrázek odsazeného černého textu. Obrázky na počítači jsou ovšem uloženy naprosto jiným způsobem než text (viz studijní text o grafice). U textu má každé písmeno vlastní číslo a zabírá jeden až více bytů podle zvoléného kódování zpřístupňujícího i speciální národní znaky. To znamená že počítač „ví“, že tenhle kus informace znamená to a to písmeno.

S obrázky to je ale jinak. V počítači maximálně uložíte informaci o počtu pixelů (obrazových bodů) a jejich barvě a už na jeden jediný pixel v nějakém jemném odstínu potřebujete alespoň tři byty. Kolik by jich pak bylo potřeba na nadpis přes půl obrazovky? Podstata problému, ale netkví v nehospodárnosti ukládání informace. To je pouze vyvětlení proč i malá fotka zabere stejně místa jako několik desítek stran textu. Problém je v tom, že počítač ve sledu pixelů „nevidí“ žádnou informaci. Počítače „neví“ co je na obrázcích a proto text uložený jako obrázek není možné editovat, na což určitě už přišel každý, kdo si oskenoval dokument např. do PDF a pak jej chtěl měnit, nebo z něj kopírovat přes schránku.

Závěrem této úvahy ještě drobná poznámka, o programech, které umí převést text na obrázku na skutečný editovatelný text. Tyto, tzv. OCR (Optical Character Recognition), jsou založeny na tom, že na jednotlivé tmavé skvrnky na obrázku přikládají šablony jednotlivých písmen tam, kde je překryv šablony a černého tvaru na obrázku největší prohlásí, že to je to a to písmeno. U tištěných předloh to funguje velice spolehlivě, ale stále jde o vytažení informace z obrázku a její uložení do naprosto jiného formátu: totiž textového. S textem v samotném obrázku nic dělat nelze.

HTML

Jazyk pro značkování hypertextu (HyperText Markup Language) vznikl původně skutečně především pro text. Při pohledu na dnešní web to již není téměř znát, protože co do objemu po internetu přenášených dat představuje text jen pouhý zlomeček ve srovnání s videem, zvukem a obrázky. Celá myšlenka značkovacích jazyků je v principu jednoduchá: každý kus samotného textu (obsahu) dokumentu je obalen do párové značky, která určuje jeho význam. Tyto značky jsou v HTML standardizovány a browser musí být postaven tak, aby je dokázal správně přečíst a zobrazit. Mluvíme-li o párovém obalení značkou máme na mysli toto:


<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
  <head>
    <title>Extrémní sporty</title>
    <meta http-equiv="content-type" content="text/html; 
	charset=utf-8" />
  </head>

  <body>
  <h1>Extrémní sporty a marketing</h1>
  <p>Reklamní společnosti brzy pochopily, že určité publikum tento 
  druh zábavy miluje, že se s ní především mladí lidé identifikují 
  a že se tento druh zábavy, životní styl a vše kolem něj dobře 
  prodává. (Rozvoj šel tak rychle, že vysoká popularita extrémních 
  sportů a kultury kolem nich vedla dokonce i k vytvoření parodií, 
  jako extrémního žehlení či extrémního kroketu.)</p>

  <h2>Proč účastníci milují extrémní sporty?</h2>
  <ul>
    <li>tvrdí, že si absolutně užívají zlepšování svých psychických 
	i fyzických možností</li>
    <li>snaží se stát mistry v přežití v nehostinných 
	podmínkách</li>
    <li>často uváděným důvodem bývá také únik z denodenního 
	stereotypu nebo prostě láska k divokému prostředí, 
	kde se extrémní sporty většinou odehrávají</li>
    <li>mnoho účastníků také tvrdí, že se necítí být tradičními 
	sportovci</li>
  </ul>

  </body>
</html>

Jak vidíte, význam každého kousku textu je zanesen pomocí syntaxe

 <značka> text </značka>

Těmto značkám je třeba samozřejmě rozumět a většinu lze intuitivně odvodit ze srovnání s výstupem na obrazovku, který vidíte níže. Pro úplný popis se podívejte na tuto stránku. Zkuste nyní kousek textu výše se značkami vykopírovat přes schránku do obyčejného textového souboru (jak, to se dozvíte v jednom z video tutoriálů), dát mu jméno „pokus.html“ a následně jej otevřít v prohlížeči. Gratulujeme, právě jste stvořili svou první webovou stránku. Aby byla přístupná i na internetu, museli byste ji přes FTP službu nahrát na některý server.


Extrémní sporty a marketing

Reklamní společnosti brzy pochopily, že určité publikum tento druh zábavy miluje, že se s ní především mladí lidé identifikují a že se tento druh zábavy, životní styl a vše kolem něj dobře prodává. (Rozvoj šel tak rychle, že vysoká popularita extrémních sportů a kultury kolem nich vedla dokonce i k vytvoření parodií, jako extrémního žehlení či extrémního kroketu.)

Proč účastníci milují extrémní sporty?

  • tvrdí, že si absolutně užívají zlepšování svých psychických i fyzických možností
  • snaží se stát mistry v přežití v nehostinných podmínkách
  • často uváděným důvodem bývá také únik z denodenního stereotypu nebo prostě láska k divokému prostředí, kde se extrémní sporty většinou odehrávají
  • mnoho účastníků také tvrdí, že se necítí být tradičními sportovci

Někoho možná zarazí, že ve zdrojovém kódu se značkami neviděl nic o formátování textu a přesto výstup obsahuje tučný velký nadpis první úrovně a menší nadpis úrovně druhé. Je to proto, že základní značky HTML mají implicitní formátování vestavěné přímo do prohlížeče. Jinak je ale třeba ke každé značce zapsat, jak má vypadat a to jazykem který se jmenuje CSS (Cascading Style Sheets). Pro ilustraci si uveďme příklad. Informace o tom, nadpis první úrovně má být červený a má mít nahoře a dole 30 pixelů odsazení by se zapsala tímto způsobem:

h1 {color: #FF0000; margin: 30px 0 30px 0;}

Na první pohled to vypadá těžkopádně. Vždyť v editoru stačí jen nastavit barvu z paletky a v panelu odstavec zvolit odsazení před a za. Musíme si ale uvědomit, že i webové stránky lze vyrábět ve vizuálních editorech (tzv. WYSISYG), ale stejně jako jejich výstupem je HTML a CSS kód, tak výstupem běžných textových editorů jako je MS Word či OpenOffice Writer je zase zdojový kód elektronického textu, který obsahuje jednotlivé složky sice v odlišném formátu než je webové HTML, ale tento formát je založen na naprosto stejných principech: vepsaných speciální značkách a k nim přiřazeném formátování pomocí speciálního formátovacího jazyka.


<< zpět na úvodní stranu kurzu informačních technologií