Objevuji Ameriku: Google ohýbá česká slova

8. 5. 2007 20:43 (aktualizováno) koppel

Vyhledávače

Asi se dočkám smrště sarkastických komentářů ve stylu: „Ty máš teda postřeh!“, ale pro mne je to rána z čistého nebe: Všiml jsem si, že Google je schopný hledat i ve tvarech českých slov. Není úplně jednoduché ho k tomu donutit, protože obecně zřejmě stále preferuje čistou shodu, ale třeba na tomto dotazu je to vidět docela dobře. Sloveso „získat“ je ve výsledcích v několika různých tvarech. Kromě ohýbání slov je dobře vidět, že Googlu nedělá problémy správně propojovat varianty s a bez diakritiky. Takže morfologický modul je dost kvalitní.

Jak říkám, jsem trochu na rozpacích z toho s jak moc velkou nenovinkou přicházím. Je to spojené s tím, že jsem zatím zarputile pro hledání po Čechách používal Jyxo, které považuji za krále v práci s češtinou. Zjištění, že Google v tomto ohledu začína tvrdě dotahovat bude zřejmě zajímavé spíše pro ty co se jmenují Ivo.

Fakt je, že je stále prostor pro růst. Způsob určování relevance stránek tvoří velkou část z hodnoty Google. A ten je zřejmě z velké části společný napříč jazyky. Teď je otázka nakolik do toho mají kecat morfologické aspekty pro každý jazyk. Zatím to vidím tak, že minimálně preference čisté shody je příliš tvrdá. Přece jen je čeština jazyk tak květnatý, že se dá jen těžko odhadnout, zda hledaný text bude na zajímavé stránce přesně v tom tvaru, který jsme zadali. A žádnou optimalizací dotazu to moc neovlivníte.

Budu rád, když mě v komentářích seznámíte nejen s tím, jak moc jsem za dobu, ale také s tím co všechno dalšího Google s naší mateřštinou dokáže. Přece jen mi přijde, že je to od americké společnosti v oblasti IT zatím největší krok ve směru k respektu k našemu jazyku. Nějaké zde nakoupené tezaury v MS produktech s tím v mých očích nemohou soupeřit. Think globally, act locally v praxi.

Související články na blogu koppel
- Jaká je IP kamera Axis Q1755? 4. 5. 2009 19:22
- Centrum + Atlas > moje rozlišovací míra ? 27. 2. 2008 21:29
- Co všechno na vás Google ví? 26. 10. 2007 15:59
- Lukačovičův omyl 31. 8. 2007 13:27
Související články na ostatních blozích
- Nezbytné nástroje pro online marketing 16. 3. 2015 11:55
- Návrh na lepší české IDN? 23. 11. 2010 0:04
- Sreality - bordel jako vždycky 19. 10. 2010 17:55
- Reseni chaosu s nekolika Google ucty 28. 9. 2010 22:10
- katalog-cz-firem.cz (podvodník) 22. 9. 2010 10:47
- Katalogy aneb proklik za 100 Kč 20. 9. 2010 11:52
Související články na serveru Lupa.cz
- Robert Čásenský (Seznam Zprávy): Média jsou v krizi permanentně. První placený obsah plánujeme spustit během jara 20. 12. 2025 15:12
- Smrt webu má podobu krokodýla. Pusťte si přednášku analytika Josefa Šlerky 25. 11. 2025 6:30
- Google spouští v Česku AI Mode. Vyhledávání už nikdy nebude stejné 8. 10. 2025 0:13
- Konec symbiózy webů s Googlem. Jak funguje AI Mode a jak přežít v éře AI vyhledávání 7. 10. 2025 6:30
- Martin Kopta: Web úplně nezmizí, bude ale pro lidi něčím, co se používalo v minulosti 26. 8. 2025 6:30
- Stárnu a křičím na mraky, že web je rozbitý. Spasí tu bídu chatboti, umělá inteligence a svět bez klikání? 23. 6. 2025 6:30

Přidat názor

Podle hodnocení
Podle vláken
Nejnovější

8. 5. 2007 21:38

rewerend (neregistrovaný)

Ty máš teda postřeh!;)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
9. 5. 2007 19:45

Janek (neregistrovaný)

Já to zaregistroval tak před týdnem, možná ani to ne... Neví někdo, kdy to fakt spustili?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
10. 5. 2007 12:58

William Walker (neregistrovaný)

Jsou to tichoslapci...
Dokonce funguje vyhledavani ulic/tras v mestech v CR na maps.google.com

taky bez nejakeho oficialniho spusteni...asi porad beta :)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
13. 5. 2007 20:39

halogan (neregistrovaný)

Já o tom raději neinformoval, protože bych byl také považován za "bleska". Nicméně jsem velice rád, pamatuji (stejně asi jako většina zde) na doby, kdy Google nedoplňoval diakritiku. To byly krušné doby. Teď je to stále lepší a lepší.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
12. 6. 2007 23:53

Lukáš (neregistrovaný)

já o tom slyšel už dřív a musím říct že je to super....dá goooglit čím dál líp :)
kdx přesně to bylo ale netuším....
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
25. 3. 2008 17:33

thřžuřžrsf (neregistrovaný)

ezčžuedhcjt
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
25. 3. 2008 17:33

thřžuřžrsf (neregistrovaný)

nogo gogo kunukunu

Přidat názor

Sdílet

Související články na blogu koppel

Jaká je IP kamera Axis Q1755? 4. 5. 2009 19:22

Centrum + Atlas > moje rozlišovací míra ? 27. 2. 2008 21:29

Co všechno na vás Google ví? 26. 10. 2007 15:59

Lukačovičův omyl 31. 8. 2007 13:27

Související články na ostatních blozích

Nezbytné nástroje pro online marketing 16. 3. 2015 11:55

Návrh na lepší české IDN? 23. 11. 2010 0:04

Sreality - bordel jako vždycky 19. 10. 2010 17:55

Reseni chaosu s nekolika Google ucty 28. 9. 2010 22:10

katalog-cz-firem.cz (podvodník) 22. 9. 2010 10:47

Katalogy aneb proklik za 100 Kč 20. 9. 2010 11:52

Související články na serveru Lupa.cz

Robert Čásenský (Seznam Zprávy): Média jsou v krizi permanentně. První placený obsah plánujeme spustit během jara 20. 12. 2025 15:12

Smrt webu má podobu krokodýla. Pusťte si přednášku analytika Josefa Šlerky 25. 11. 2025 6:30

Google spouští v Česku AI Mode. Vyhledávání už nikdy nebude stejné 8. 10. 2025 0:13

Konec symbiózy webů s Googlem. Jak funguje AI Mode a jak přežít v éře AI vyhledávání 7. 10. 2025 6:30

Martin Kopta: Web úplně nezmizí, bude ale pro lidi něčím, co se používalo v minulosti 26. 8. 2025 6:30

Stárnu a křičím na mraky, že web je rozbitý. Spasí tu bídu chatboti, umělá inteligence a svět bez klikání? 23. 6. 2025 6:30

koppel

Nejčtenější články autora

Poslední názory

Témata

Objevuji Ameriku: Google ohýbá česká slova

Sdílet

Související články na blogu koppel

Jaká je IP kamera Axis Q1755? 4. 5. 2009 19:22

Centrum + Atlas > moje rozlišovací míra ? 27. 2. 2008 21:29

Co všechno na vás Google ví? 26. 10. 2007 15:59

Lukačovičův omyl 31. 8. 2007 13:27

Související články na ostatních blozích

Nezbytné nástroje pro online marketing 16. 3. 2015 11:55

Návrh na lepší české IDN? 23. 11. 2010 0:04

Sreality - bordel jako vždycky 19. 10. 2010 17:55

Reseni chaosu s nekolika Google ucty 28. 9. 2010 22:10

katalog-cz-firem.cz (podvodník) 22. 9. 2010 10:47

Katalogy aneb proklik za 100 Kč 20. 9. 2010 11:52

Související články na serveru Lupa.cz

Robert Čásenský (Seznam Zprávy): Média jsou v krizi permanentně. První placený obsah plánujeme spustit během jara 20. 12. 2025 15:12

Smrt webu má podobu krokodýla. Pusťte si přednášku analytika Josefa Šlerky 25. 11. 2025 6:30

Google spouští v Česku AI Mode. Vyhledávání už nikdy nebude stejné 8. 10. 2025 0:13

Konec symbiózy webů s Googlem. Jak funguje AI Mode a jak přežít v éře AI vyhledávání 7. 10. 2025 6:30

Martin Kopta: Web úplně nezmizí, bude ale pro lidi něčím, co se používalo v minulosti 26. 8. 2025 6:30

Stárnu a křičím na mraky, že web je rozbitý. Spasí tu bídu chatboti, umělá inteligence a svět bez klikání? 23. 6. 2025 6:30

koppel

Nejčtenější články autora

Poslední názory

Témata

Dále u nás najdete

Anthropic vyvinul model schopný odhalovat tisíce zranitelností

CreditShare míří na drobné investory, úvěry vybírá přísně

Provoz EET 2.0 má stát až 600 milionů korun ročně

Při screeningu rakoviny plic lékaři zachytí i jiné nemoci. Jaké?

Google Chrome přináší vertikální karty a imerzivní režim čtení

Start JMHZ: ztracená data, chyby a infolinky na zhroucení

Při přípravě newsletteru můžete nativně konzultovat s AI

V Brně lékaři přišili zcela amputovanou ruku

JMHZ v praxi: Jak správně využít služby a vyhnout se chybám

Zvláštní zkrat ministerstva, postavit si hlavu u zdravotních benefitů

IKEA nabídne lízátka s příchutí masových kuliček

Cukrovka není jen o cukru. Když život strávíte v masně, hrozí taky

Unikla data z Lacoste, Ralph Lauren a Canada Goose

Přehledy OSVČ. Do kdy je podat a na co nezapomenout?

Vibe coding: Proč vám tahle dovednost zachrání místo u stolu

Agentní nákupy startují, nakupovat budou za biliony

Generace Z se brání umělé inteligenci v práci

Nepodceňte návodné dokumenty a pomůcky k JMHZ

Prodal byt, aby mohl pražit. Dnes má Michal jednu z nejlepších káv v Evropě

Ministerstvo zvýší penze. Ale později, než se čekalo