Vyšlo v týdeníku CHIPweek č. 36/97, 2. září 1997
Vytištěno z adresy: http://www.earchiv.cz/a97/a736k140.php3

AltaVista česky - podruhé

V minulém dílu našich toulek jsme si všímali způsobu, jakým známá AltaVista podporuje naší mateřštinu při vlastním vyhledávání. Dnes se podíváme na to, jak dále vychází vstříc česky mluvícím uživatelům.
Warning: include(../includes/potenza/stridavytext_inner.php3): failed to open stream: No such file or directory in /www/doc/www.earchiv.cz/www/a97/a736k140.php3 on line 20

Warning: include(../includes/potenza/stridavytext_inner.php3): failed to open stream: No such file or directory in /www/doc/www.earchiv.cz/www/a97/a736k140.php3 on line 20

Warning: include(): Failed opening '../includes/potenza/stridavytext_inner.php3' for inclusion (include_path='.:/usr/share/php') in /www/doc/www.earchiv.cz/www/a97/a736k140.php3 on line 20

Vyhledávací služba AltaVista byla uvedena do provozu v prosinci roku 1995, v jistém smyslu jako výkladní skříň firmy Digital, s úkolem názorně demonstrovat možnosti jejích technologií. Časem se "divize AltaVista" osamostatnila od mateřské firmy, začala žít svým vlastním (hlavně ekonomickým) životem, a živí se mj. i prodejem vyhledávacích technologiích, které byly pro její potřeby vyvinuty. O tom, že vyhledávací technologie AltaVisty je velmi úspěšná, svědčí fakt že dnes tuto technologii používá celá řada dalších vyhledávacích služeb, mnohdy i v konkurenčním vztahu k samotné AltaVistě. Pro náš dnešní díl je ale zajímavá jiná skutečnost - původně jediná, úzce lokalizovaná AltaVista, na kterou určitě směřovalo každou sekundu a minutu enormní množství dotazů, si časem vytvořila i své repliky, resp. dceřinné vyhledávací služby, v různých částech světa. Motivací zde zřejmě byla snaha rozložit velké množství dotazů, které k AltaVistě směřuje, a v neposlední řadě pak i snaha vyjít více vstříc uživatelům v různých částech světa a jejich specifickým potřebám. Kromě vyhledávání stránek psaných v konkrétním jazyku, které nabízí i centrální AltaVista, jde zejména o celkovou komunikaci v jednotlivých národních jazycích. Tedy například o používání vyhledávacích formulářů psaných v národním jazyku, o nápovědu psanou v národním jazyku atd.

V našich zeměpisných šířkách je jistě nejzajímavější švédská replika AltaVisty, provozovaná společností Telia, protože právě ona "umí česky". Najdete ji na adrese http://www.altavista.telia.com, ze které se vám nejprve ozve takový formulář, jaký vidíte na dnešním prvním obrázku [GIF1,URL1]. Zde si musíte nejprve navolit zemi ze které se služeb AltaVisty dovoláváte, a pak jazyk, ve kterém chcete aby se s Vámi AltaVista bavila. Kromě jednoznačné volby České republiky pro druhou volbu připadají v úvahu dvě možnosti: čeština pro Windows (alias čeština s kódováním dle kódové stránky 1250), nebo čeština pro Unix (alias čeština s kódováním ISO-8859-2, neboli s kódováním ISO Latin 2, které je používáno zejména na Unixových počítačích). Pak už vám stačí jen zmáčknout příslušné tlačítko (uváděné jako třetí bod v pořadí), a již se dostanete k vyhledávacímu formuláři pro jednoduchý režim dotazování, v řádné a spisovné češtině, se všemi háčky a čárkami. Tedy skoro, protože právě sem se vloudila příslovečná chybička - konkrétně do té části formuláře, která slouží k výběru jazyka pro potřeby vyhledávání. Jak si můžete sami povšimnout, zde ještě háčky a čárky nejsou zcela v pořádku, a správná identifikace češtiny (viz třetí obrázek [GIF3]) není zcela triviální záležitostí. Jinak je ale správně počeštěno snad úplně všechno - nejen vyhledávací formulář pro složitější dotazy, ale také veškerá nápověda (což mnoha našim uživatelům jistě přijde vhod), a počeštěny (či spíše "pomoravštěny") jsou dokonce i reálie na uváděných příkladech, viz pátý obrázek [GIF5]. Samotný způsob fungování počeštěné AltaVisty však jinak zůstal beze změny.

Rád bych se v závěru tohoto dílu zastavil ještě u jedné zajímavé skutečnosti. AltaVista, podobně jako další vyhledávací služby, vychází aktivně vstříc tomu, aby jí uživatelé mohli klást své dotazy i odjinud, z jiných stránek resp. dotazovacích formulářů, a ne pouze z jejích domovských stránek. Po technické stránce je to velmi jednoduché, a samotná AltaVista dokonce dává podrobný návod, jak něco takového udělat (viz šestý obrázek [GIF6], stačí vložit do vaší stránky uvedenou část HTML kódu). Díky tomu se pak na mnoha místech mohou vyskytovat jednoduché formuláře pro dotazování AltaVisty, příklad z oblíbeného Seznamu vidíte na sedmém obrázku [GIF7]. Zajímavý je i autorskoprávní aspekt takovéhoto postupu: AltaVista říká, že dotazování odjinud je plně v pořádku, pokud výsledky dotazu nejsou nijak měněny (viz nejspodnější část šestého obrázku [GIF6]). V praxi to většinou znamená, že uživatel se sice dotáže AltaVisty odjinud, ale odpověď mu přijde přímo od samotné AltaVisty, tedy stejně jako kdyby se ptal přímo jí. V našem domácím Internetu jsem ale našel i jeden odlišný případ: službu U zdroje. Z její domovské stránky se také můžete ptát AltaVisty (viz osmý obrázek [GIF8]), ale výsledky od AltaVisty nedostanete přímo - nejprve si je převezme služba U zdroje (resp. její fulltextový vyhledávací stroj jménem Pavouk), a pak vám je předá jako své vlastní stránky, se svým logem a bez původních reklam AltaVisty (s přípodotkem "Pavouk hlásí" v titulku stránky). Nejsem právník, ale myslím si že to není zcela v souladu s požadavky na šestém obrázku [GIF6]. Přesně stejná situace však nastává obecně u všech vyhledávacích meta-služeb (či meta-vyhledávacích služeb), neboli takových služeb, které fungují jako prostředníci: samy přijmou dotaz, "rozhodí jej" mezi několik (faktických) vyhledávacích služeb, převezmou si od nich výsledky a sloučí je do jednoho výsledného celku (a přitom také odstraňují původní vzhled i reklamy). Příkladem takovéto meta-služby může být služba SavvySearch, kterou jsme navštívili ve 12. dílu minulého ročníku Toulek, či novější služby Dogpile (http://www.dogpile.com) a MetaSearch (http://www.metasearch.com), ke kterým se teprve dostaneme.


P.S. Ke zmíněným meta-službám se seriál Toulky Internetem již nedostal. Všechno krásné jednou končí, a stejný osud potkal i tento seriál - myšlenka ukazovat zajímavé a užitečné věci z Internetu však naštěstí nezahynula. Seriál Toulky Internetem, vycházející v rozsahu dvou tiskových stránek, byl nahrazen jednostránkovým seriálem s novým názvem (Zajímavosti z Internetu), a také s poněkud volnějším zaměřením, jeho jednotlivé díly už na sebe prakticky nijak logicky nenavazují.

Jiří Peterka


Seznam obrázků:

  1. Úvodní stránka švédské AltaVisty, s možností výběru jazyka
  2. Český dotazovací formulář pro jednoduchý režim dotazování
  3. Český formulář pro složitější dotaz, a příklad výsledku vyhledání
  4. Také nápověda je česky
  5. Lokalizovány jsou i reálie v příkladech
  6. Jak si pořídit vlastní vyhledávací formulář
  7. AltaVisty se lze ptát i ze Seznamu
  8. Možnost dotazu AltaVistě ze služby U zdroje
  9. Příklad zprostředkovaného výsledku