Vyšlo v týdeníku CHIPweek č. 4/95, 3. května 1995
Vytištěno z adresy: http://www.earchiv.cz/a95/a504k130.php3

URL

Jedním z charakteristických důsledků současného rozmachu informačních technologií je skutečnost, že nejrůznější informace se na nás doslova jen valí. Nejde přitom zdaleka jen o informace reklamního charakteru, které jsou nám všem podstrkovány a mnohdy doslova vnucovány při nejrůznějších příležitostech. Účinně se bránit reklamním informacím naštěstí není zase až tak těžké. Větší problém je s takovými informacemi, které jsou pro nás užitečné, které nám něco říkají, a které skutečně můžeme využít - ať již mají povahu knih, časopisů či jiných tiskovin, nebo jsou přístupné v elektronické formě prostřednictvím počítačových sítí apod. Potíž je v tom, že i těchto informací je příliš mnoho.

Je jich příliš mnoho na to, abychom je mohli zužitkovat všechny - tedy všechny je přečíst, prostudovat, promyslet apod. Stejně tak je jich ale příliš mnoho na to, abychom je vůbec mohli mít všechny u sebe, resp. aby je jejich autoři mohli direktivně rozesílat všem potenciálním zájemcům. Již kvůli pouhému objemu a kvantitě dostupných informací není dost dobře možné řešit jejich zpřístupnění formou jejich distribuce. Místo toho je nutné soustředit tyto informace na jednom či několika málo vhodných místech (například přímo tam, kde vznikají), a distribuovat pouze malý objem informací o tom, kde jsou tyto „plné" informace k dispozici. Neboli kam a jakým způsobem si pro ně mají „sáhnout" ti, kteří je skutečně potřebují.

Přesně v tomto duchu se vyvinul charakter soudobých informačních služeb v nejrozsáhlejší počítačové síti světa, v Internetu - ať již jde o služby typu anonymních FTP archivů, službu Gopher, WWW atd. Všechny tyto služby počítají s tím, že informace čekají na své odběratele, a tito jsou povinni si „pro ně sami dojít". V praxi to pak znamená, že uživatelé (odběratelé informací) jsou povinni znát, kde se jimi požadované informace nachází. Aby to ale neměli uživatelé zase až tak těžké, přichází jim na pomoc různé vyhledávací služby, schopné lokalizovat požadovaný „kus" informace - například služby Archie či Parker, Veronica, World Wide Web Worm, či nejnovější služba s příznačným názvem Harvest (doslova: sklízet, sklizeň).

Drobný technický problém ovšem vzniká v souvislosti s tím, jak jednoznačně identifikovat ono „místo, kde se požadovaná informace nachází". Když nám zmíněná vyhledávací služba něco najde, jakým způsobem nám má předat přesný a jednoznačný odkaz na zmíněné místo a to, co na něm našla? Netýká se to ovšem zdaleka jen vyhledávacích služeb, stejný problém nastává i v jiných situacích. Například i tehdy, když někdo v rámci Internetu zpřístupní nějakou informaci, a třeba formou inzerátu v počítačovém časopise chce oznámit, kde se nachází a jak se k ní dostat. To, co by se k takovému účelu hodilo nejlépe, je vhodný druh ukazatele. Takového ukazatele, kterým by bylo možné „ukázat" na libovolné místo v Internetu a jednoznačně identifikovat objekt, který se zde nachází a který máme na mysli. Navíc takový ukazatel, jehož formát i význam by mohl být nezávislý na konkrétním objektu na který ukazuje, a tudíž i nezávislý na konkrétní vyhledávací službě, která jej poskytne jako svůj výstup, resp. na službě, která jej přijme jako svůj vstup a podle něj na příslušné místo skutečně „sáhne".

Zkusme se nyní zamyslet nad tím, jaké údaje by takovýto ukazatel měl obsahovat. Zcela určitě by v něm měla být obsažena jednoznačná identifikace konkrétního uzlu (uzlového počítače), na kterém se příslušný objekt nachází. K tomuto účelu lze snadno využít tzv. doménové jméno uzlu (domain name), které má vhodný symbolický charakter: např. www.dcit.cz, gopher.cesnet.cz, kki.ms.mff.cuni.cz apod. Dalším údajem pak musí být identifikace objektu, který se v rámci daného uzlu nachází. Tato identifikace, na rozdíl od předchozí, již může mít relativní charakter - může představovat „relativní adresu" příslušného objektu v rámci daného uzlu. Jelikož nejčastěji jde o objekty, které mají povahu souborů, lze jako jejich „relativní adresu" použít jméno a příponu příslušného souboru, a dále přístupovou cestu k tomuto souboru (neboli popis hierarchicky uspořádaných adresářů, kterými je třeba nejprve projít). Příkladem mohou být zápisy typu /pub/predn/tcpip/tcpip01.zip či /articles/chipweek/slovnik/url_cz.html apod. Potřebný smysl ovšem mají až ve spojitosti s adresou uzlu, na kterém se objekt nachází. Naštěstí není nic jednoduššího, než oba druhy údajů vhodně zkombinovat, do zápisu typu:

kki.ms.mff.cuni.cz/pub/predn/tcpip/tcpip01.zip

ksi.ms.mff.cuni.cz/~peterka/archiv/a504k130.html
apod.

Stačí ale tyto dva druhy údajů, spojené do jediného zápisu, na jednoznačnou identifikaci všech možných objektů, které chceme jejich prostřednictvím identifikovat? V zásadě asi ano, ale z ryze praktických důvodů potřebujeme o každém takovém objektu vědět ještě něco navíc - co je zač, a hlavně jakým způsobem máme k němu přistupovat.

Je-li příslušným objektem soubor, z jeho přípony lze často poznat, o jaký druh souboru se jedná, a z toho si pak následně odvodit, jakým způsobem s ním pracovat (např. jakým způsobem jej „stáhnout" k sobě, jak jej zobrazit atd.). Používání přípon ovšem není povinné, stejně tak jako dodržování konvencí, které konkrétní přípony specifikují. Navíc se tyto konvence mohou na různých výpočetních platformách lišit, stejně tak jako pravidla pro pojmenovávání jednotlivých souborů.

Takže ne vždy je možné ze jména a případné přípony souboru poznat, o jaký druh objektu vlastně jde, a jak k němu přistupovat. Proto musí být tato informace poskytnuta explicitně, jako další složka námi postupně budovaného ukazatele. Například jde-li o soubor, který se nachází na tzv. FTP serveru a má být „stažen" protokolem FTP (File Transfer Protocol), lze tuto skutečnost vyjádřit např. zápisem:

ftp://kki.ms.mff.cuni.cz/pub/predn/tctpip/tcpip01.zip

Jde-li naopak o WWW stránku, tj. o hypertextový dokument v jazyku HTML, který by měl být použit v rámci služby WWW, pak příslušný ukazatel bude mít následující podobu:

http://archiv.czech.net/a504k130.php3

Zde je asi vhodné podotknout, že protokol, který se v rámci služby WWW používá pro vlastní přenos jednotlivých stránek (HTML dokumentů), se jmenuje HTTP (HyperText Transfer Protocol).

No a tím jsme vlastně již dospěli ke konvenci, která se dnes v rámci Internetu skutečně používá, a která definuje přesný formát a význam „univerzálního ukazatele" na nejrůznější objekty a zdroje informací. Však se také tomuto ukazateli říká Uniform Resource Indicator (zkratkou URI), častěji ale Uniform Resource Locator (zkratkou URL). Ve skutečnosti tento druh ukazatele pamatuje i na jiné druhy objektů, než jen na soubory, a má ještě některé další zajímavé vlastnosti. Ty ale již značně přesahují rámec této spíše populární rubriky.