Jak mechanismy hlídání chyb ve Wikipedii fungují ve skutečnosti. Že chyby opravuje téměř mýtická „komunita“ je známé, ale jak to ta „komunita“ doopravdy dělá? A kdy to selže? A proč poškození článku Patrick Zandl nic moc zajímavého nedokazuje.
Tak, bohužel, už to i na mě přišlo… Začínám blogovat. Čtenáři, který si chce přečíst fundovaný rozbor opravných mechanismů Wikipedie , teď doporučuji přeskočit o nadpis níže.
Už jste přeskočili? Ne?
Pořád ne?
Fajn – v tom případě asi patříte mezi zatvrzelé čtenáře blogů, nebo přímo bloggery, a číst dál si zasloužíte. Nemám zvlášť rád blogy a blogování. A to i pominu-li blogísky které písují(?) lidičkové na lidé/bloguje/… Místo informací se snahou o objektivitu, názory se snahou zaujmout, místo snahy o výtvory s delší trvanlivostí, přežvýkané pseudoinformace zajímavé několik dní. Bohužel, blogy zbožňují média a hlavně vyhledávače – například Googlu připadá přibližně stejně důležitý Jilmův blog a stránka Lezec.cz. Jilmův blog je zdrojem občasných postřehů pro pár set lidí. Lezec.cz je jednou z nejdůležitějších stránek na webu pro tisíce lidí, kteří u nás lezou po horách, skalách a umělých stěnách, a na lezci se dělí o zážitky, informace, gratulují k úspechům a vyjadřují soustrast když někdo umře.
Lezec je od svého vzniku 2.0 web, kde skoro veškerý obsah tvoří čtenáři.
Předpokládám, že kdyby jilm napsal nějaký vhodně SEO-článek třeba o slaňování, ocitne se záhy před jakoukoli horolezckou stránkou.
Část bloggerů tak získává nepřiměřený vliv na pozornost publika. Google naneštěsí asi dneska nezměním, tak nezbývá, než přijmout pravidla hry a pustit se do boje o pozornost
(dodatečně doplněná poznámka – takto to může znít, že napadám Jilma, nebo jeho blog – to nebylo záměrem, zde slouží jako generický příklad relativně kvalitního blogu s GTPR 5)
Tématem tohoto blogu budou především wiki, Wikipedie, a otázky související. Osobní kecy tohoto typu se budu snažit udržet na nejnižší možné míře. Nuž, do boje :-)
Jak jste si pravděpodobně přečetli, pro jilma je zarážející, že však nikdo za více než týden neodhalil tak zjevnou blbost v článku o Patricku Zandlovi.
Ne, nezklamalo mě, že Jilm poškodil Wikipedii vložením blbosti. Zklamalo mě, že se projevil jako typický blogger-novinář. Zklamalo mě, že předvedl, že ani po letech kdy má možnost Wikipedii sledovat a napsal o ní řadu textů, o čisticích filtrech Wikipedie téměř nic neví. (Jinak by takové blbosti nenapsal. Nic ve zlém.)
Tedy…
Pro představu čištění wiki bude užitečné si mechanismy wiki představit jako soustavu filtrů, kterými každá atomická změna – „editace“ – proteče, a cílem těchto filtrů je buď ji propustit, pokud kvalitu Wikipedie zvyšuje, nebo vrátit do původního stavu – „revertovat“.
Prvním a hlavním filtrem úprav, které škodí, je u většiny wiki stránka známá jako RecentChanges, neboli Poslední změny. RecentChanges je pro aktivnější uživatele wiki lidské velikosti takové náměstí, kde se potkávají, vidí, co se na wiki děje, a kde se vytváří sdílená pozornost.
Poslední změny proto obvykle sleduje podstatná část uživatelů, kteří jsou zrovna na wiki online. Upoutá záškodník jejich pozornost? Ti, kteří sledují RC spíše mimoděk, si nejspíš všimnou jen hlasitého vandalismu – například vymazání stránky, nebo hlasitých projevů přátel homosexuálů. Na Wikipedii je obvyklé, že část přispěvatelů, kteří její kvalitu berou za svou, přímo aktivně vyhledává různé změny obsah poškozující. Wikipedisté pro tuto činnost používají termín „patrola“ – teoretikům Webu X.Y.Z bych doporučoval si patrolování na několik hodin zkusit třeba na anglické Wikipedii, ledacos se jim ujasní.
Například, je jasné, že lidé, kteří si změny všimnou v RC, obvykle vůbec nejsou odborníky na dané téma. K tomu, aby si úpravy všimli, a identifikovali ji jako „záškodnickou“, mají několik vodítek
Pokud odbočím ke konkrétnímu příkladu, je jasné, že jilmův vandalismus se filtruje velmi špatně – jilm má na Wikipedii asi sto kvalitních příspěvků rozprostřených v průběhu několika let, což znamená dosti silnou reputaci, ještě podpořenou spojením s real-life identitiou. Navíc ve vztahu k poměrně drobnému tématu, kterým je český internetový rybník, je expert. Celkově tato silná reputace znamená, že jilmovi by pravděpodobně prošla dost velká blbost dokonce i pokud by úpravu někdo přímo četl.
Proč by měl Patrick Zandl přitahovat vandalismus také není na první pohled patrné, a uvádění zdrojů dosud není v české Wikipedii striktně vyžadováno.
Na stránce posledních změn se úprava ohřeje, podle velikosti wiki, několik minut, hodin nebo i dní. Pak mizí z dohledu této „ultrakrátkodobé pozornosti“. Nastupuje druhá šance odhalení chyby – watchlisty, v češtině známé jako „sledované stránky“. Tato funkce, přítomná v některých wikienginech, umožňuje uživatelům sledovat poslední změny na vybrané množině stránek. Obvykle je tento výběr daný vlastními příspěvky uživatele – sleduje stránky, které sám založil, nebo výrazně upravil. Co čekat od této kontroly? U nejaktivněších uživatelů, kteří mají na wiki tisíce příspěvků a „sledují“ tisíce stránek, je situace podobná jako u RC – jen střední doba, za kterou změna sejde z očí, a tedy i mysli, je delší, a odbornost k tématu trochu větší.
Rozdíl nastává u středně aktiviních uživatelů, kteří většinu života tráví jinde než na RC nebo IRC Wikipedie, ale nějakou desítku až stovku článků, ke kterým mají bližší vztah, na watchlistu mají, a občas se na změny v oblíbených článcích podívají. Od tohoto „filtru“ lze čekat odhalení i poměrně odborných chyb. Slabé místo je ovšem zjevné
Seznam dřímajích problémů Wikipedie by proto šlo s několika databázovými dotazy zjistit celkem snadno – stačilo by zjistit, které články nemá na watchlistu nikdo. Nebo alespoň nikdo, kdo by watchlist podrobně sledoval.
Jak je na tom Patrick Zandl zjistit nemohu , ale z historie úprav hesla lze vyčíst, že jeho původní zakladtel naposledy editoval Wikipedii někdy loni v srpnu, a další výrazné úpravy jsou na vrub ostřílených editorů jako Adam Hauner, Mormegil nebo Che, pro které je Zandlův článek pravděpodobně jen jedním z tisíců, které vylepšili, a nemají k němu nějaký důvěrnější vztah.
Pokud škodlivá úprava propadne sítem sledovaných, má už prakticky vyhráno a může jít mást běžné čtenáře. Případně vyvolat erupce a protuberance v blogosféře a zprávičkosféře – ovšem vyvržená sto..plasma je obvykle řídká.
Poslední záchranou a poslední instancí opravy chyb je sám základ wiki – odkaz editovat. Nepovšimnutá chyba tak čeká na chvíli, kdy náhodný čtenář, který o tématu přece jen něco ví, řekne si „to je ale blbost“, klikne, a chybu odstraní.
Základní parametry tohot filtru jsou také jasné:
Články, které nikdo nečte – nikdo ani neopravuje. Tato přirozená korelace naštěstí funguje obousměrně a značně zvyšuje praktickou použitelnost Wikipedie. Chyby v článcích, které relativně nikdo nečte, sice Wikipedii uberou body v naivních výzkumech na vzorku zcela náhodných článků, ale jinak moc nevadí.
Protože skupina členářů je daleko širší než u pravidelných editorů, je zde šance na opravu i velmi odborných a komplikovaných chyb, případně i obecně rozšířených bludů.
Předpokladem je, že lidé jsou staticky hodní, spolupracují a tlačítko pochopí a kliknou na něj. A tedy při objevení chyby jich část chybu opraví. I s rizikem, že vytvářím tautologii, bych si dovolil říci, že existence Wikipedie ukazuje, že to zatím platí.
Jak je na tom Patrik Zandl? statistika Seznamu ukazuje, že Patrika Zandla téměř nikdo nevyhledává, alespoň na Seznamu. Vyhledávanost je velmi dobrý indikátor čtenosti – a tak lze odhadovat, že i přirozená čtenost článku na Wikipedii je minimální. Relativní nevýznamnost tématu je bohužel doprovázená relativně vysokou pozicí článku ve Wikipedii ve vyhledávačích a nedostatkem dalších seriózních zdrojů, takže naneštěstí chyba v takovém článku může toho občasného čtenáře poškodit, případně když jde o osobu, poškodit i to „téma“.
V případě tohoto tématu je navíc problematický i „průměrný čtenář“ – s trochou nadsázky by šlo odhadnout, že než by chybu opravil, dříve o ní blogne, nebo zmíní za týden v komentářích jako příklad, jak je ta Wikipedie na nic.
Podle mě kvalitu „filtrace“ má v tomto případě smysl měřit podle výsledků. Vybrat náhodné články Wikipedie – ale s pravděpodobností zařazení do výběru danou nějakou mírou důležitosti (např. čteností, přítomností stejného tématu v jiné encyklopedii a pod.). Články důkladně prozkoumat a spočítat chyby. Porovnat s obdobným výběrem např. na Lupě či v jiné encyklopedii. Jsem přesvědčený, že i česká Wikipedie by dopadla dobře – (i třeba ve srovnání s filtrem,kterým prošlo kupříkladu toto pojednání o kvantové kryptografii).
Pokusy s „vložením jednotlivé náhodné blbosti“ jsou podobně zbytečné a řekl bych přímo blbé, jako by byl pokus testovat antispamový filtr na jednom exempláři unikátního spamu, který odešlu z vlastního mailserveru s dobrou reputací, a obsahem bude nevyžádaná reklama, ale ne na obvyklá témata, ale třeba na astronomickou konferenci. Jistěže takový mail filtrem zpravidla projde – zjištěná informace je ale bezcenná.
Naopak doufám, že z předestřených úvah o fungování „filtrů“ a pochopení fungování čistících mechanismů wiki už je čtenáři plyne, kde jsou slabá místa Wikipedie, a proč to většinou nevadí. Riziková je nepřítomnost na watchlistech a malá čtenost článku, a případně hraje roli i to, zda jejichž čtenáři nějakého článku nejsou relativně zlí, blbí nebo obojí. (Proto nečekaně dobrou kvalitu mají i některé velmi odborné články, jejichž tématu rozumí třeba jen několik tisíc lidí na světě, ale z nich naopak velký podíl chybu opraví.)
Nepřítomnost na watchlistech a malá čtenost je naštěstí úzce korelovaná se skoro jakkoli určenou významností tématu, takže statisticky je pro uživatele Wikipedie překvapivě dobrá. Obranou Wikipedie by mohlo být nedostatečně významná témata nemít a takové články mazat. Ovšem už jen to, že se o smazání článku Patrick Zandl na Wikipedii hlasovalo, by pro prostejné kritiky, kteří se diví, že v tomto článku blbost vydržela celý týden, jistě bylo zdrojem stejného pobouření. Ale to už je jiné téma, o významnosti třeba někdy příště.
Na druhou stranu se k problematickým článkům dá říci …i přes pochybnou kvalitu této temné hmoty Wikipedie ja často článek ve Wikipedii tím nejlepším nezaujatým shrnutím, které se dá na webu v záplavě šumu najít. Dokud je průměrná kvalita této hmoty lepší, než průměrná kvalita zbytku webu, viděného prizmatem SEO-blogo-zmagořených vyhledávačů, tak je pořád lepší Wikipedie, i když nedosahuje kvalit encyklopedie
"...Wikipedie, i když nedosahuje kvalit encyklopedie"
To je vše, co jsem se pokusil zjistit, je-li českou wiki možno použít jako skutečně věrohodný zdroj informací na které se dá spolehnout - to je způsob, jak je Wikipedie stále častěji vnímána. A na to zatím opravdu nemá a ještě dlouho mít nebude.
Je email skutečně věrohodný způsob komunikace, na který se dá spolehnout? Obdobným pokusem snadno demonstrujete, že není. Používate email jako věrohodný způsob komunikace?
Pro její používanost a vnímání je podstatné, zda je Wikipedie _dostatečně_ věrohodná, ne skutečně věrohodná. Světem nehýbou "dokonalá řešení", ale "dostatečně dobrá řešení".
Btw s tím, zda je Wikipedie česká, nebo anglická, to nemá nic společného - na anglické Wikipedii byste se stejně zkonstruovaným pokusem v průměru dopadl stejně jako na cs:, těchto "temných článků" je na en.wikipedia.org spíš větší podíl - a při současném modelu fungování Wikipedie nebude klesat.
Tím, že "...Wikipedie, i když nedosahuje kvalit encyklopedie...", jsem chtěl říct, že pro čtenáře je nejspíše lepší najít článek Wikipedie, i když nesplňuje vlastní měřítka Wikipedie.
Wikipedie sama sebe neprezentuje a není vnímána jako "dostatečně dobrá". Pokud mohu říct, jak ji vnímají lidé z mého okolí, berou ji jako věrohodné místo, jako encyklopedii, která má váhu. Údaj z Wikipedie je brán jako fakt. Když na blog napíšu, že Patrick Zandl koupil Chemopetrol, nikdo to jako fakt brát nebude, když to člověk najde ve Wikipedii, bude to brát vážně. Pokid Wikipedie neaspiruje na takovouto roli, měla by informaci o "relativní věrohodnosti" aktivně šířit do okolního světa.
Jilme, Wikipedie ma na kazde sve strance odkaz na upozorneni, ze muze obsahovat spatna data, viz http://cs.wikipedia.org/wiki/Wikipedie:Vylou%C4%8Den%C3%AD_odpov%C4%9Bdnosti. Jak to ma propagovat vice?
Google taky vetsina lidi povazuje za skvely vyhledavac. A on ma radu much.
[3] A vnímají jako důvěryhodné i nějaké jiné zdroje? Noviny, televize, servery...?
Pokud by se ukázalo, že nějaké další zdroje taky jsou jen "dostatečně věrohodné" a né "docela věrohodné", měly by informaci o tom též nějak aktivně šířit?
Wikipedie obsahuje to Jiřím zmíněné varovaní, odkazované z každé stránky. Co by měla dělat víc? Umístit varování 30px fontem na začátek každé stránky?
IMO by prospělo ne varování, ale to, aby se její čtenáři naučili fungování Wikipedie rozumět. A rozlišovat, že důvěryhodnost Wikipedie není konstantní, že článek Praha má jinou věrohodnost, než článek Patrick Zandl.
"Super" by ovšem bylo, kdyby Wikipedie dokázala tu věrohodnost nějak automatizovaně počítat a zobrazovat.
Vazeny jk,
dovolte, abych Vam pripomel jednu ze zakladnich pravd sveta (i kdyz mozna ne dobre parafrazovanou); "hadat se s hlupakem je jako prat se s veprem. I kdyz vyhrajete, budete od blata od hlavy k pate, a na rozdil od Vas ten vepr se u toho bude bavit" Dekuji za priblizeni prace wikipedie, sam ji obcas vyuzivam i pri psanich odbornych textu jako prehledovy vzor, ovsem podporeny odbornou literaturou.
Doufam, ze jilm zanecha svych pokusu posledniho chytreho a spravedliveho, nerad bych si na Lupe cetl o tom, jak posunul nekde v nejake vesnici hranicni kamen o pul metru doleva a ani po tydnu na to neprisel ani katastralni urad, ani ustav uzemniho rozvoje, a, povazte, dokonce ani sami vesnicane.
Diky za pekny popis procesu cisteni wikipedie. Velmi duveruji te korelaci hodne ctena stranka - hodne proverena stranka. Dokazete v (zejm. ceske) wikipedii pridat na kazdou stranku pocitadlo, vlastne vic pocitadel?
- tato stranka byla od sveho vzniku zobrazena 30krat
- minuly mesic byla tato stranka zobrazena 10x, coz predstavuje 33% navstevnosti stranky za celou dobu a 2% celkove navstevnosti ceske wikipedie v minulem mesici
- z celkoveho poctu 20 navstev (neodpovida nutne poctu zobrazeni!) byla v 50% v ramci navstevy ucinena tez uprava stranky
Zamerne jsem moznosti mereni prestrelil, protoze teprve zkusenost by ukazala, ktery ukazatel je nejlepsim voditkem pro odhad 'testovanosti' (a ta je zase voditkem pro odhad 'spolehlivosti')
Jilm především prokázal, že poznání je v jeho mysli spojeno s destruktivními experimenty, ačkoliv v tomto případě by k mnohem lepším a hodnotnějším výsledkům došel pouhým pozorováním a interpretací. Například kdyby vybral sto náhodných editací, odborně posoudil jejich věcnou správnost a zároveň sledoval jejich další osud. V tom je zásadní rozdíl mezi pozitivistickým a fenomenologickým přístupem. Pokud by si k vyhodnocení vybral nějaké starší editace, nemusel by se zatížit ani etickým prohřeškem, že poznané chyby ihned neopravil.
Přečteno 10 291×
Přečteno 9 073×
Přečteno 6 795×
Přečteno 6 534×
Přečteno 6 317×