Kurz informačních technologií

Web a co s ním souvisí

V tomto textu naleznete bližší vysvětlení k fungování Vašeho pohybu a vyhledávání na webu.

Pohyb po webu

Webové stránky mají svou adresu, které se také říká URL (Uniform Resource Locator), např. http://www.urazydeti.cz. Tato adresa se píše do adresního řádku prohlížeče. Odesláním této adresy vznášíte požadavek na vzdálený počítač (server) aby Vám poslal svou výchozí stránku.

adresní řádek

TIP: Adresu můžeme psát bez prefixu http://, ten si prohlížeč doplní sám. HTTP (HyperText Transfer Protocol) je takzvaný protokol, který určuje, jakým způsobem spolu budou počítače (server a klient) komunikovat, asi stejně jako diplomatický protokol určuje, jak přesně spolu budou dva státy jednat.

Po zmáčknutí klávesy ENTER nebo po kliknutí na ikonu „Přejít na www“ (podle prohlížeče) se načte příslušná webová stránka. Pokud se stránka nezobrazí a objeví se hlášení „Server not found“ nebo „Aplikace Internet Explorer nemůže zobrazit tuto webovou stránku“, znamená to, že jsme buď napsali špatně adresu nebo je stránka mimo provoz.

Prohlížeč si pamatuje seznam navštívených stránek, takže kliknutím na tlačítko zpět (šipka vlevo) se vrátíme na předchozí stránku. Problém může nastat, pokud jsme na webu zadávali nějaké údaje. Pak se může stát, že pro cestu zpět už nejsou k dispozici a předchozí stránka se nezobrazí nebo se zobrazí jinak než dříve. Pokud se nacházíte v nějaké zabezpečené oblasti webu jako například při nakupování, nebo třeba právě při studiu e-learningu, snažte se šipku zpět nepoužívat vůbec a k veškeré navigaci používejte menu dané webové aplikace.

Důvod vyžaduje krátké vysvětlení. Jak víte z výukového posteru, webová stránka je balíkem souborů, které Vám příslušný server poslal, poté, co jste ho o to napsáním adresy, nebo kliknutím na odkaz požádali. Spojení přes protokol HTTP tedy vypadá tak, že se spojení otevře, příjde požadavek, nazpět jsou poslány soubory (webová stránka) a spojení se uzavře. Tím to ovšem pro server končí. Pokud si uživatel vklidu přečte stránku a klikne na další odkaz, který je na tom samém webovém sídle, tak proběhne opět to samé spojení, ale server “nemá potuchy”, že zasílá stránku tomu samému uživateli – pro něj to je zcela nezávislá operace. Tato vlastnost HTTP se stala problémem v momentu, kdy bylo potřeba zaznamenávat činnost uživatelů. Například, že objednávka knihy na jedné stránce internetového obchodu a objednávka CD na stránce jiné je od toho samého člověka, a měla by být zaslána společně a fakturována jediným dokumentem. Za tímto účelem vnikly malé kousky informace, které si webové stránky ukládají u Vás na počítači (říká se jim cookies, tedy koláčky) a díky nalezené cookie další stránka “ví” že jste se na daném webu již dříve pohybovali. Pokud ovšem mezi stránkami nepřecházíte prostřednictvím k tomu určené navigace, ale “zvnějšku” pomocí ovládacích šipek Vašeho prohlížeče, tak se může snadno stát, že něco objednáte dvakrát, aniž byste o tom věděli, a nebo aplikace přestane pracovat správně a vy musíte prohlížeč zavřít a přihlašovat se znovu. Z každé takové aplikace se odhlašujte k tomu určeným tlačítkem a v případě, že jste přes internet spravovali nějaká důverná data, tak na závěr zavřete onko prohlížeče.

Internetová adresa

Na začátku URL, v našem případě například http://www.urazydeti.cz/aktuality.php, je určení typu zdroje. Nejčastěji se setkáme s HTTP pro přenos hypertextových dokumentů, HTTPS pro zabezpečené připojení (např. v internetovém bankovnictví) a FTP pro přenos souborů.

Dále je v URL oddělovač ://, celé doménové jméno hostitelského počítače www.urazydeti.cz a cesta ke stránce nebo souboru obsahujícímu informaci /aktuality.php.

Doménové jméno, např. www.urazydeti.cz, je tvořeno několika částmi, které jsou odděleny tečkami. Nejobecnější je poslední část, tzv. doména nejvyššího řádu (anglicky top-level domain, TLD). Tyto domény vyjadřují obecný typ stránky a jsou dvou druhů: dvoupísmenné národní (např. .cz pro Českou republiku, .sk pro Slovensko nebo .uk pro Velkou Británii) nebo tzv. generické jako .org pro neziskové organizace, nebo .com pro firmy, která je ovšem volně dostupná komukoli.

V našem případě je urazydeti tzv. doména druhého řádu, tedy adresa webu v rámci domény nejvyššího řádu cz.

Vyhledávání na webu

Internet nemá žádnou centrální správu, která by vedla seznam všech webových stránek. Existují vyhledávače (search engines, vyhledávací roboti), které se snaží zmapovat co největší množství stránek tak, aby se v jejich obsahu dalo vyhledávat. Nejznámějším světovým vyhledávačem je Google (google.com), který nabízí rozhraní i v češtině. Mezi českými vyhledávači vládne Seznam (seznam.cz). Mají společné to, že se rozšířily tzv. portály: mimo vyhledávání webových stránek poskytují řadu dalších služeb jako email, mapy atd.

Pokud pomocí vyhledávače nenajdete informaci, kterou hledáte, neznamená to, že neexistuje. Vyhledávače fungují tak, že pravidelně procházejí webové stránky a zaznamenávají jejich obsah. Některé stránky však uniknou jejich pozornosti - mohou to být nové stránky nebo stránky, jejichž obsah vyhledávač nedokáže „přečíst“. Na webu je velké množství obsahu dostupné jen pro přihlášené uživatele - jedná se například o obsah placených elektronických databází.

TIP: Při vyhledávání se většinou vyplatí vyzkoušet více vyhledávačů a různé varianty dotazu (upřesnit dotaz, použít synonyma apod.).

Přesto vyhledávače umějí najít nejrůznější typy informací - obrázky, dokumenty v pdf nebo doc. Například pro obrázky má většina vyhledávačů speciální hledání:

Pro logiku vyhledávání obrázků je třeba vzpomenout na to, jak vypadá vyhledatelná informace. Při indexaci k sobě vyhledávače stahují především textovou složku elektronického textu a v ní se pak hledá pomocí klíčových slov. Jak je vysvětleno ve studijním textu o obrázcích na počítači, v obrázku samotném nepozná počítač v principu nic, je to pro něj jen sled bytů s informací o barevnosti jednotlivých obrazových bodů. Vyhledávání obrázků je tedy založeno na prohledávání jejich názvů, které zvolil webdesigner při tvorbě stránky, nebo v textu, který obrázek doprovází a je vidět při přejezdu myší. Není to tedy samotný obrázek ve kterém je uložena informace o jeho obsahu, ale jsou to k němu připojené meta-informace. To je také odpověď na to, proč leckdy vidíte jako odpověď na svůj vyhledávací dotaz obrázky, které se vůbec netýkají předmětu Vašeho zájmu.


<< zpět na úvodní stranu kurzu informačních technologií