Vyšlo v týdeníku CHIPweek číslo 04/98, 20. ledna 1998
Vytištěno z adresy: http://www.earchiv.cz/a98/a804k180.php3

On-line brouzdání

On-line browsing
browsing, alias "brouzdání", označuje postupné procházení uživatele jednotlivými WWW stránkami, prostřednictvím předem připravených odkazů, kterými jsou jednotlivé stránky vzájemně provázány. Důležitým předpokladem je zde existence WWW serveru, který požadované stránky poskytuje, resp. serverů (v množném čísle), protože uživatel při svém brouzdání může požadovat WWW stránky umístěné na různých WWW serverech. Přívlastek "on-line" se používá (v souvislosti se samotným brouzdáním) v případě, že uživatel má během svého brouzdání možnost přístupu k celému Internetu, a může tedy požadovat WWW stránky na kterémkoli WWW serveru, který je v Internetu dostupný. V případě uživatelů, kteří se připojují k Internetu komutovaně, tj. prostřednictvím modemu a veřejné telefonní sítě, je takovéto "on-line brouzdání" možné pouze v době, kdy jsou skutečně připojeni (a kdy tudíž platí Telecomu za telefonní hovor, a současně i svému poskytovateli připojení za poskytnutý přístup, není-li tento hrazen paušálním způsobem).
 
Cache (vyrovnávací paměť)
při brouzdání WWW stránkami je poměrně časté, že se uživatelé znovu vrací k již jednou navštíveným stránkám. Stejně tak je častá i situace, kdy se některé prvky stránek (například obrázky, loga, ikony apod.) opakují na více stránkách, a bylo by neefektivní načítat je pokaždé znovu. Pro zamezení opakovaného načítání, i pro celkové zefektivnění práce uživatele v rámci služby WWW, se proto zavádí celý systém vyrovnávacích pamětí (cache pamětí, zkráceně jen cache), ve kterých jsou dočasně uchovávány jak celé stránky, tak i jejich jednotlivé součásti typu obrázků, ikon, appletů apod. Když pak klientský program (browser) na popud svého uživatele vznese nějaký konkrétní požadavek, je příslušný objekt hledán nejprve v dostupné paměti cache, a teprve když se zde nenachází, je požadován od příslušného WWW serveru. Vyrovnávací paměti (cache paměti) mohou tvořit složitou soustavu s hierarchickým uspořádáním a hierarchickým způsobem fungování - nenajde-li se požadovaný objekt (stránka, obrázek atd.) v cache paměti na nižší úrovni, resp. blíže k uživatelskému browseru, je postupně hledán v cache pamětech vyšší úrovně.
 
Browser Cache (vyrovnávací paměť udržovaná browserem)
na nejnižší úrovni hierarchického systému cache pamětí bývá taková vyrovnávací (cache) paměť, kterou si udržuje sám WWW browser, přímo na uživatelově počítači. Je obvykle rozdělena na dvě části, resp. dva stupně: na cache udržovanou v operační paměti, a na cache paměť udržovanou na místním pevném disku. Obsah první cache paměti se při vypnutí počítače či ukončení práce s browserem ztrácí, obsah druhé naopak přetrvává. Uživatel většinou má možnost nastavit, kolik místa se má pro oba druhy cache paměti použít (vyhradit).
 
Reload, Refresh
Na vyrovnávacích (cache) pamětech je velmi podstatný i konkrétní režim jejich fungování, zejména pak způsob jakým kontrolují zda od nějaké konkrétní stránky (obrázku apod.) neexistuje na příslušném WWW serveru novější (aktuálnější) verze. Pokud by totiž existovala, ale uživatelův browser by získal ještě starší verzi z cache paměti, uživateli by se zobrazovalo něco, co již není platné a aktuální. V případě cache pamětí udržovaných přímo browserem si uživatel většinou může sám nastavit příslušný režim: zda se má existence novější verze testovat při každém požadavku na příslušnou stránku, nebo jen při prvním požadavku v rámci jedné relace (jednoho "běhu" browseru), nebo nikdy. Kromě toho má uživatel vždy možnost potlačit celý systém cache pamětí a vyvolat nucené načtení přímo z příslušného zdrojového WWW serveru - prostřednictvím příkazu Reload (někdy: Refresh, u lokalizovaných browserů: Obnovit).
 
Dynamic WWW pages (dynamické WWW stránky)
nepříjemným problémem pro celý mechanismus cache pamětí a samotnou myšlenku zefektivnit fungování služby WWW udržováním dočasných kopií v cache pamětech je existence dynamicky generovaných WWW stránek - tedy takových stránek, které neexistují "dopředu" (staticky), ale jsou generovány dynamicky až na základě momentální potřeby, resp. okamžitého požadavku. Jsou to například odpovědi na nejrůznější dotazy, které skutečně nemá smysl používat opakovaně, resp. zachovávat pro nové použití (a tudíž ani uchovávat kdekoli, včetně cache pamětí). V současné době, vzhledem ke snahám činit WWW stránky uživatelsky co nejatraktivnější, četnost takovýchto dynamicky generovaných stránek výrazně roste. Problémem bývá i samotné rozpoznání dynamicky generované stránky, tak aby si jí celý systém cache pamětí "nevšímal" a nesnažil se ji uchovávat - možnosti samozřejmě existují, ale nejsou vždy dostatečně přesné, takže se v praxi stává, že se v cache paměti neudrží ani takové stránky, které by mělo logický smysl uchovávat. Příkladem mohou být i mechanismy zajišťují správnou českou diakritiku na českých WWW stránkách, jimi generované stránky (které by jinak mohly být statické a mělo by smysl je uchovávat v cache pamětech) mohou být považovány za dynamické a vyloučeny z mechanismu cache pamětí.
 
Caching WWW server
dalším stupněm v hierarchické soustavě cache pamětí může být speciální WWW server, který sám nenabízí žádné "vlastní" WWW stránky, ale funguje pouze jako cache paměť společná pro více uživatelů resp. uzlů (tedy jako tzv. cache, resp. "cachující" WWW server). Smyslem jeho existence je předpoklad, že jedny a tytéž WWW stránky může požadovat více uživatelů v určité lokalitě (např. v rámci téže firmy či jiné instituce). Proto se browsery příslušných uživatelů nastaví tak, aby při nenalezení požadované stránky ve své lokální cache paměti nejprve kontaktovaly takovýto cache server, a stránku požadovaly na něm. Také samotné cache servery mohou tvořit hierarchický systém, tj. mohou být uspořádány do vrstev a vzájemně zřetězeny, ve snaze minimalizovat zátěž a potřebné přenosy dat, a tím celkově zefektivnit používání služby World Wide Web. Zřídit si vlastní cache server může kdokoli (například provozovatel podnikové sítě), a může je provázat s hierarchicky nadřazenými cache servery. Vlastní cache servery obvykle zřizují i jednotliví poskytovatelé připojení k Internetu (provideři), pro potřeby svých zákazníků a zefektivnění jejich práce, i pro snížení zátěže jejich páteřních systémů (přípojek do zahraničí).
 
WWW proxy
funkce "cachujícího" WWW serveru je téměř vždy kombinována s další funkcí, kterou je role tzv. proxy brány pro službu World Wide Web. Proxy brány obecně fungují jako zprostředkovatelé, či "přestupní stanice" pro požadavky klientů, adresované konkrétním serverům: proxy brána z jedné strany přijme požadavek od klienta, a z "druhé strany" jej položí (nyní již jako svůj vlastní požadavek, resp. "svým jménem") cílovému serveru. Ten zašle svou odpověď proxy bráně, a ta jej zase předá dál původnímu tazateli. V případě WWW proxy brány jde o požadavky na jednotlivé WWW stránky, a smyslem zřizování takovýchto WWW proxy bran je nejčastěji potřeba "bezpečnostního" oddělení jedné části sítě (typicky: interní sítě) od zbytku světa - potřebný oddělující efekt je zde dosažen tím, že skrz WWW proxy bránu neprojde nic jiného než WWW stránky. Dokonce je zde dosaženo i zajímavého "maskovacího" efektu: jelikož požadavek směřující do vnějšího prostředí (k cílovému WWW serveru) vždy zasílá svým jménem WWW proxy brána, vnější svět se vůbec nedozví, který konkrétní uzel "za" proxy bránou je skutečným iniciátorem požadavku. Funkce WWW proxy brány lze velmi jednoduše a přirozeně zkombinovat s funkcí "cachujícího WWW serveru" - proxy brána si po určitou dobu pamatuje obsah stránek, které skrz ni prochází, a při dalších požadavcích na tutéž stránku (či obrázek apod.) dokáže poskytnout požadovaný objekt sama, aniž by jej sama musela získávat znovu z vnějšího zdroje. Klientské programy služby WWW (uživatelské browsery) však musí být explicitně nastaveny na použití takovýchto WWW proxy bran.
 
History (historie)
WWW browsery si obvykle pamatují také posloupnost WWW stránek, kterou jejich uživatel navštívil (v rámci dané relace, resp. běhu browseru, nebo i dříve), s cílem poskytnout na vyžádání výpis této posloupnosti a umožnit případný návrat ke kterékoli z těchto stránek. Nejedná se ale o uchovávání obsahu těchto stránek (jako je tomu v případě cache pamětí), nýbrž pouze o uchovávání odkazů na tyto stránky jako takové - obsah některých stránek z "historie" může být ještě uložen v cache paměti, ale také nemusí (a v takovém případě se znovu načítá ze svého původního zdroje).