Hlavní navigace

Omluva úvodem, jak mě zklamal jilm a jak se čistí wiki

1. 6. 2008 10:17 (aktualizováno) wiki

Jak mechanismy hlídání chyb ve Wikipedii fungují ve skutečnosti. Že chyby opravuje téměř mýtická „komunita“ je známé, ale jak to ta „komunita“ doopravdy dělá? A kdy to selže? A proč poškození článku Patrick Zandl nic moc zajímavého nedokazuje.

Omluva úvodem

Tak, bohužel, už to i na mě přišlo… Začínám blogovat. Čtenáři, který si chce přečíst fundovaný rozbor opravných mechanismů Wikipedie , teď doporučuji přeskočit o nadpis níže.

Už jste přeskočili? Ne?

Pořád ne?

Fajn – v tom případě asi patříte mezi zatvrzelé čtenáře blogů, nebo přímo bloggery, a číst dál si zasloužíte. Nemám zvlášť rád blogy a blogování. A to i pominu-li blogísky které písují(?) lidičkové na lidé/bloguje/… Místo informací se snahou o objektivitu, názory se snahou zaujmout, místo snahy o výtvory s delší trvanlivostí, přežvýkané pseudoinformace zajímavé několik dní. Bohužel, blogy zbožňují média a hlavně vyhledávače – například Googlu připadá přibližně stejně důležitý Jilmův blog a stránka Lezec.cz. Jilmův blog je zdrojem občasných postřehů pro pár set lidí. Lezec.cz je jednou z nejdůležitějších stránek na webu pro tisíce lidí, kteří u nás lezou po horách, skalách a umělých stěnách, a na lezci se dělí o zážitky, informace, gratulují k úspechům a vyjadřují soustrast když někdo umře.

Lezec je od svého vzniku 2.0 web, kde skoro veškerý obsah tvoří čtenáři.

Předpokládám, že kdyby jilm napsal nějaký vhodně SEO-článek třeba o slaňování, ocitne se záhy před jakoukoli horolezckou stránkou.

Část bloggerů tak získává nepřiměřený vliv na pozornost publika. Google naneštěsí asi dneska nezměním, tak nezbývá, než přijmout pravidla hry a pustit se do boje o pozornost

(dodatečně doplněná poznámka – takto to může znít, že napadám Jilma, nebo jeho blog – to nebylo záměrem, zde slouží jako generický příklad relativně kvalitního blogu s GTPR 5)

Tématem tohoto blogu budou především wiki, Wikipedie, a otázky související. Osobní kecy tohoto typu se budu snažit udržet na nejnižší možné míře. Nuž, do boje :-)

Jak mě zklamal jilm

Jak jste si pravděpodobně přečetli, pro jilma je zarážející, že však nikdo za více než týden neodhalil tak zjevnou blbost v článku o Patricku Zandlovi.

Ne, nezklamalo mě, že Jilm poškodil Wikipedii vložením blbosti. Zklamalo mě, že se projevil jako typický blogger-novinář. Zklamalo mě, že předvedl, že ani po letech kdy má možnost Wikipedii sledovat a napsal o ní řadu textů, o čisticích filtrech Wikipedie téměř nic neví. (Jinak by takové blbosti nenapsal. Nic ve zlém.)

Tedy…

Jak čištění wiki skutečně funguje?

Pro představu čištění wiki bude užitečné si mechanismy wiki představit jako soustavu filtrů, kterými každá atomická změna – „editace“ – proteče, a cílem těchto filtrů je buď ji propustit, pokud kvalitu Wikipedie zvyšuje, nebo vrátit do původního stavu – „revertovat“.

Poslední změny

Prvním a hlavním filtrem úprav, které škodí, je u většiny wiki stránka známá jako RecentChanges, neboli Poslední změny. RecentChanges je pro aktivnější uživatele wiki lidské velikosti takové náměstí, kde se potkávají, vidí, co se na wiki děje, a kde se vytváří sdílená pozornost.

Poslední změny proto obvykle sleduje podstatná část uživatelů, kteří jsou zrovna na wiki online. Upoutá záškodník jejich pozornost? Ti, kteří sledují RC spíše mimoděk, si nejspíš všimnou jen hlasitého vandalismu – například vymazání stránky, nebo hlasitých projevů přátel homosexuálů. Na Wikipedii je obvyklé, že část přispěvatelů, kteří její kvalitu berou za svou, přímo aktivně vyhledává různé změny obsah poškozující. Wikipedisté pro tuto činnost používají termín „patrola“ – teoretikům Webu X.Y.Z bych doporučoval si patrolování na několik hodin zkusit třeba na anglické Wikipedii, ledacos se jim ujasní.

Například, je jasné, že lidé, kteří si změny všimnou v RC, obvykle vůbec nejsou odborníky na dané téma. K tomu, aby si úpravy všimli, a identifikovali ji jako „záškodnickou“, mají několik vodítek

  • Reputace autora – s největší obezřetností se pochopitelně setkávají anonymní přispěvatelé identifikovaní ip adresou. Dále pak nový uživatelé, a občas nějaký „nechvalně proslulý“ přispěvatel, známý třeba fanatickým prosazováním nějakého názoru.
  • Reputace článku – je jasné, že nevítané změny některé články přitahují spíš
  • Uváděné zdroje – pokud jsou
  • Hrubý objem ubrání nebo přidání textu, jazyková úroveň

Pokud odbočím ke konkrétnímu příkladu, je jasné, že jilmův vandalismus se filtruje velmi špatně – jilm má na Wikipedii asi sto kvalitních příspěvků rozprostřených v průběhu několika let, což znamená dosti silnou reputaci, ještě podpořenou spojením s real-life identitiou. Navíc ve vztahu k poměrně drobnému tématu, kterým je český internetový rybník, je expert. Celkově tato silná reputace znamená, že jilmovi by pravděpodobně prošla dost velká blbost dokonce i pokud by úpravu někdo přímo četl.

Proč by měl Patrick Zandl přitahovat vandalismus také není na první pohled patrné, a uvádění zdrojů dosud není v české Wikipedii striktně vyžadováno.

Watchlisty

Na stránce posledních změn se úprava ohřeje, podle velikosti wiki, několik minut, hodin nebo i dní. Pak mizí z dohledu této „ultrakrátkodobé pozornosti“. Nastupuje druhá šance odhalení chyby – watchlisty, v češtině známé jako „sledované stránky“. Tato funkce, přítomná v některých wikienginech, umožňuje uživatelům sledovat poslední změny na vybrané množině stránek. Obvykle je tento výběr daný vlastními příspěvky uživatele – sleduje stránky, které sám založil, nebo výrazně upravil. Co čekat od této kontroly? U nejaktivněších uživatelů, kteří mají na wiki tisíce příspěvků a „sledují“ tisíce stránek, je situace podobná jako u RC – jen střední doba, za kterou změna sejde z očí, a tedy i mysli, je delší, a odbornost k tématu trochu větší.

Rozdíl nastává u středně aktiviních uživatelů, kteří většinu života tráví jinde než na RC nebo IRC Wikipedie, ale nějakou desítku až stovku článků, ke kterým mají bližší vztah, na watchlistu mají, a občas se na změny v oblíbených článcích podívají. Od tohoto „filtru“ lze čekat odhalení i poměrně odborných chyb. Slabé místo je ovšem zjevné

  • Okrajová témata – která nikoho nezajímají natolik, aby je sledoval

Seznam dřímajích problémů Wikipedie by proto šlo s několika databázovými dotazy zjistit celkem snadno – stačilo by zjistit, které články nemá na watchlistu nikdo. Nebo alespoň nikdo, kdo by watchlist podrobně sledoval.

Jak je na tom Patrick Zandl zjistit nemohu , ale z historie úprav hesla lze vyčíst, že jeho původní zakladtel naposledy editoval Wikipedii někdy loni v srpnu, a další výrazné úpravy jsou na vrub ostřílených editorů jako Adam Hauner, Mormegil nebo Che, pro které je Zandlův článek pravděpodobně jen jedním z tisíců, které vylepšili, a nemají k němu nějaký důvěrnější vztah.

Pokud škodlivá úprava propadne sítem sledovaných, má už prakticky vyhráno a může jít mást běžné čtenáře. Případně vyvolat erupce a protuberance v blogosféře a zprávičkosféře – ovšem vyvržená sto..plasma je obvykle řídká.

Tlačítko editovat

Poslední záchranou a poslední instancí opravy chyb je sám základ wiki – odkaz editovat. Nepovšimnutá chyba tak čeká na chvíli, kdy náhodný čtenář, který o tématu přece jen něco ví, řekne si „to je ale blbost“, klikne, a chybu odstraní.
Základní parametry tohot filtru jsou také jasné:

Články, které nikdo nečte – nikdo ani neopravuje. Tato přirozená korelace naštěstí funguje obousměrně a značně zvyšuje praktickou použitelnost Wikipedie. Chyby v článcích, které relativně nikdo nečte, sice Wikipedii uberou body v naivních výzkumech na vzorku zcela náhodných článků, ale jinak moc nevadí.

Protože skupina členářů je daleko širší než u pravidelných editorů, je zde šance na opravu i velmi odborných a komplikovaných chyb, případně i obecně rozšířených bludů.

Předpokladem je, že lidé jsou staticky hodní, spolupracují a tlačítko pochopí a kliknou na něj. A tedy při objevení chyby jich část chybu opraví. I s rizikem, že vytvářím tautologii, bych si dovolil říci, že existence Wikipedie ukazuje, že to zatím platí.

Jak je na tom Patrik Zandl? statistika Seznamu ukazuje, že Patrika Zandla téměř nikdo nevyhledává, alespoň na Seznamu. Vyhledávanost je velmi dobrý indikátor čtenosti – a tak lze odhadovat, že i přirozená čtenost článku na Wikipedii je minimální. Relativní nevýznamnost tématu je bohužel doprovázená relativně vysokou pozicí článku ve Wikipedii ve vyhledávačích a nedostatkem dalších seriózních zdrojů, takže naneštěstí chyba v takovém článku může toho občasného čtenáře poškodit, případně když jde o osobu, poškodit i to „téma“.

V případě tohoto tématu je navíc problematický i „průměrný čtenář“ – s trochou nadsázky by šlo odhadnout, že než by chybu opravil, dříve o ní blogne, nebo zmíní za týden v komentářích jako příklad, jak je ta Wikipedie na nic.

Podle ovoce poznáš…

Podle mě kvalitu „filtrace“ má v tomto případě smysl měřit podle výsledků. Vybrat náhodné články Wikipedie – ale s pravděpodobností zařazení do výběru danou nějakou mírou důležitosti (např. čteností, přítomností stejného tématu v jiné encyklopedii a pod.). Články důkladně prozkoumat a spočítat chyby. Porovnat s obdobným výběrem např. na Lupě či v jiné encyklopedii. Jsem přesvědčený, že i česká Wikipedie by dopadla dobře – (i třeba ve srovnání s filtrem,kterým prošlo kupříkladu toto pojednání o kvantové kryptografii).

Pokusy s „vložením jednotlivé náhodné blbosti“ jsou podobně zbytečné a řekl bych přímo blbé, jako by byl pokus testovat antispamový filtr na jednom exempláři unikátního spamu, který odešlu z vlastního mailserveru s dobrou reputací, a obsahem bude nevyžádaná reklama, ale ne na obvyklá témata, ale třeba na astronomickou konferenci. Jistěže takový mail filtrem zpravidla projde – zjištěná informace je ale bezcenná.

Naopak doufám, že z předestřených úvah o fungování „filtrů“ a pochopení fungování čistících mechanismů wiki už je čtenáři plyne, kde jsou slabá místa Wikipedie, a proč to většinou nevadí. Riziková je nepřítomnost na watchlistech a malá čtenost článku, a případně hraje roli i to, zda jejichž čtenáři nějakého článku nejsou relativně zlí, blbí nebo obojí. (Proto nečekaně dobrou kvalitu mají i některé velmi odborné články, jejichž tématu rozumí třeba jen několik tisíc lidí na světě, ale z nich naopak velký podíl chybu opraví.)

Nepřítomnost na watchlistech a malá čtenost je naštěstí úzce korelovaná se skoro jakkoli určenou významností tématu, takže statisticky je pro uživatele Wikipedie překvapivě dobrá. Obranou Wikipedie by mohlo být nedostatečně významná témata nemít a takové články mazat. Ovšem už jen to, že se o smazání článku Patrick Zandl na Wikipedii hlasovalo, by pro prostejné kritiky, kteří se diví, že v tomto článku blbost vydržela celý týden, jistě bylo zdrojem stejného pobouření. Ale to už je jiné téma, o významnosti třeba někdy příště.

Na druhou stranu se k problematickým článkům dá říci …i přes pochybnou kvalitu této temné hmoty Wikipedie ja často článek ve Wikipedii tím nejlepším nezaujatým shrnutím, které se dá na webu v záplavě šumu najít. Dokud je průměrná kvalita této hmoty lepší, než průměrná kvalita zbytku webu, viděného prizmatem SEO-blogo-zmagořených vyhledávačů, tak je pořád lepší Wikipedie, i když nedosahuje kvalit encyklopedie

AddThis Social Bookmark Buttonpošli na vybrali.sme.sk web metrics