Po přibližně dvanácti letech budování zpravodajského agregátoru jsem dospěl k závěru, že udělat dobrý agregátor není snadné. V mém přesvědčení mě utvrzuje to, že i ty nejpoužívanější agregátory nedosahují dokonalosti, včetně Google News nebo Flipboardu.
Disclaimer: Tento článek (včetně pokračování) se budu snažit psát maximálně nezaujatě, ale musíte vědět hned na začátku, že zaujatý jsem. Několik let tvořím a provozuji český zpravodajský agregátor Právě dnes. Některé zkušenosti z jeho provozování a výroby bych vám rád předložil.
Agregátory jsou strašně zajímavé. Pokud byste chtěli nějaký naprogramovat, umožní vám krásně se programátorsky vyřádit. Začnete si pohrávat s databází, pak s fultextových vyhledáváním, s dolováním dat z HTML, zpracováním přirozeného jazyka, Bayesovskou statistikou, klasifikací, clusterováním, atd. Při tom všem řešíte, jak efektivně uložit gigabajty dat, které taháte z internetu a jak je poutavě prezentovat na webu. Prostě nádhera.
Docela hezky se o agregátorech na podzim rozepsal Petr Koubský v svém článku Dobré elektronické zpravodajství robot nevyrobí. V tomtéž článku je psáno, že jsme (na Právě dnes) myšlenku agregátoru nikterak nerozvinuli, což má asi pravdu. K nějakému rozvoji v průběhu roku 2013 zcela jistě dojde, ale teď bych se chtěl tak trochu věnovat první příčitě toho, proč není tvorba dobrého agregátoru úplně jednoduchá záležitost.
Problém #1 – Politika a peníze aneb agregátor je zloděj
Velké vydavatelské domy si stále nezvykly na koncept hyperlinku. Mediální matadoři, kteří začínali svoji kariéru na papíře se cítí ukřivděni, když někdo jiný použije titulek jejich článku v hyperlinku. Jsou tací (a osobně jsem jednoho slyšel mluvit), kteří by zakázali i jedno osamocené použití bez předchozího souhlasu autora. Vidíte ten link o dva odstavce výš? Podle některých bych měl nejprve požádat Petra Koubského o svolení, abych mohl použít jeho titulek.
Mírnějšímu křídlu odpůrců linkování vadí hyperlink jen tehdy, když je nadužíván. Nejraději by zavedli jakýsi koncept většího než malého množství linků. Pro takové by byl link v článku v pohodě, ale systematické linkování agregátorem je už za hranicí slušnosti.
Zbytek mediální populace jsou příznivci linkování a pravděpodobně jim nevadí nebo je minimálně tolerují. Berou link jako součást internetu, možná i jeho hlavní atribut.
Zatímco první skupinu lze ignorovat jako extrémisty nebo dinosaury, druhá představuje pro jakýkoliv agregátor problém, a proto se jí budu víc zabývat.
Mírnější křídlo odpůrců hlasitě prezentuje, že nechce linkování a označuje agregátory za parazity. Současně ale investuje do SEO, kvůli nejlepší pozici na Googlu. Členové křídla vytvářejí dojem, že je rozdíl mezi linky v Google Search a linky v Google News. V jedné službě by linky na svoje články viděli rádi a v druhé službě (víc specializované) je jim to trnem v oku (nebo to jen předstírají).
Linky nechtějí, ale nepodniknou žádné kroky k blokaci stahovacích robotů (což je technicky poměrně snadné). Pravdou je, že i tato skupina má linky ráda. Akorát to nesmí říct nahlas, protože pak by nemohla požadovat výpalné od agregátorů. Jejich hlavní mantra vypadá asi takto:
Vydavatelé: My děláme obsah. Vy na něm profitujete bez finanční kompenzace pro nás.
Zapomínají však na to, že každá rovnice má dvě strany. V tomto případě ta druhá strana vypadá následovně:
Agregátor/vyhledávač: My děláme vyhledávací (agregující) technologii, která Vám přináší návštěvníky. Vy z toho profitujete bez finanční kompenzace pro nás.
Abych byl přesný, vydavatelé na to nezapomínají, protože kdykoliv jsem se snažil použít tento argument, dostal jsem odpověď přibližně v tomto tvaru:
Vydavatelé: Uživatelům stačí přečíst titulek a perex článku a vůbec nekliknou, aby přišli k nám. Tím naopak přicházíme o čtenáře.
Než tuto kapitolku problematiky agregátorů uzavřu, tak se pokusím ještě poprat s tímto běžným argumentem.
Ano určitě je nějaké procento uživatelů agregátoru, kteří na titulek nekliknou, ale troufnu si tvrdit, že to je hlavně u zpráv, které je až tak moc nezajímají. Pokud uživatel narazí na článek, který má poutavý titulek, zcela jistě bude chtít kompletní text. Když se vrátím k odkazu na článek P. Koubského, pochybuji, že byste se spokojili s titulkem a prvním odstavcem. Prostě Koubský tvrdí, že zpravodajství robot nevyrobí a hotovo – nikam se klikat nemusí.
Myslet si, že agregátor nechce, aby lidi klikali na články a tak chodili ke zdroji je možné jen tehdy, pokud žádný agregátor neděláte. Realitou je, že slušný agregátor se bez kliků uživatelů neobejde. Databáze prokliků je totiž cenným zdrojem informací a může posloužit k přizpůsobení agregátoru konkrétnímu uživateli.
Představte si, že má o vás agregátor v databázi, že jste 65× klikli na článek z Lupy, 22× článek z Živě, a 5× z TechCrunch. Je to cenná informace a kdyby ji agregátor neměl, tak by vám možná při příští návštěvě nabídnul článek o hubnutí z nějakého ženského magazínu.
Kliky jsou pro každý agregátor důležité a pokud by jim bránil svou koncepcí nebo designem, tak si pod sebou řeže větev.
Ve sporu mezi vyhledávači/agregátory a vydavateli je možné občas narazit na opravdu veselé (pokrytecké) případy. Vemte si např. Aktuálně.cz, které produkuje hodně internetového zpravodajství a patří mezi zastánce toho, že by agregátory měly vydavatelům platit. Na druhé straně Aktuálně.cz patří pod Centrum holdings, což je firma provozující vyhledávač (postavený na technologii Googlu). Vyhledávač Centrum.cz nejenom, že zobrazuje linky na cizí obsah, ale nabízí u nich i volbu „Náhled“, která uvnitř stránky Centra zobrazí ve vnořeném rámci cizí web. Kdyby si tohle dovolil Google News, tak by na něj „naběhly“ další státy (nejen Brazílie a Německo).
V prvním díle článku jsem se nemohl vyhnout “politice”, ale v pokračování bych rád byl víc techničtější a věnoval se problematice zobrazování zpráv, tj. design, UX, GUI, apod.
Pro doplnění bych ještě uvedl svůj dřívější článek k tématu:
Využívání obsahu na internetu – mýty a přání vydavatelů
… a ještě zajímavý článek, který vyšel tady na Lupě:
Google zaplatí médiím ve Francii 60 milionů eur, zřejmě na tom ale vydělá
Di tunggu informasi bagus lainny ya gan Green Pramuka City Hunian Strategis dan Nyaman di Pusat Kota
thank you for this beautiful site
get cash for surveys
how to stop ringing in ears
how to get rid of heartburn
I visited your site & after visiting I found it very informative for everyone. You’ve really done a great job. Thank you. how to get rid of gray hair fast and how to get rid of asthma fast
I strongly agree with your opinion that for the latter especially delivered , really can make me amazed . but did you know that too often in front of the computer can cause illness Obat Nyeri Sendi Lutut, Obat Nyeri Sendi And Obat Radang Sendi . Diseases Obat Sakit Sendi is also very disturbing especially when someone is doing activities that impose on the region obat nyeri sendi lutut dan jari tangan . Therefore we provide solutions to treat disease areas obat nyeri sendi jari tangan . More we review the following article :
Thank you so much for the information has been given clearly . we strongly agreed with your opinion about it . In addition we are distributors in the field of herbal medicines that treat diseases obatspermakosong.com
we also provide solutions for patients with obat penyakit sperma to overcome the disease obat sperma kental . There was also the way obat sperma encer and to obat sperma kosong . so the things we say and for more details please visit our article below :
obat sperma cair|
obat sperma encer|
obat sperma kosong alami|
obat sperma azoospermia|
obat sperma oligozoospermia|
This can be nice post we ended up being anticipating intended for this type of write-up so i get accumulated quite a few helpful information and facts using this website. Appreciate your revealing this review.I simply desired to get away from a remark as a symbol with love. I've got to get this chance to write to you from the cardiovascular.I truly appreciated your blog post.Irrrve never go through this kind of wonderful post.
I liked your post. Thanks for share it.
Martabak Paling Enak di Jakarta
Thanks a lot, it really helped me. Check out this url if you like to find out more about hair extensions.
obat herbal maag kronis
obat batuk berdahak kronisobat sakit maag kronis
cara mengobati biduran pada anak
cara mengobati telinga berdengung secara alami
obat tradisional anyang anyangan
khasiat daun cabai sebagai obat demam alami
buah dan sayur untuk mengobati penyakit maag kronis
obat kulit melepuh paling mujarab
cara mengatasi sesak nafas secara alami
cara mengobati batu ginjal secara alami
cara mengobati penyakit jantung secara alami
cara mengobati kram usus secara alami
manfaat sea cucumber jelly gamat gold g
khasiat kunyit untuk mengobati penyakit maag kronis
obat gagal ginjal tanpa cuci darah
buah buahan yang aman bagi penderita maag
makanan tidak baik dan makanan baik untuk penderita maag
cara mengobati penyakit jantung
cara mengobati radang tenggorokan secara alami
cara mengobati anyang anyangan
cara mengobati varises secara alami
cara mengobati penyakit tipes secara alami
cara mengobati penyakit jantung secara alami
cara mengobati cacar air pada anak secara alami
obat tradisional kaligata atau biduran
obat alami infeksi kandung kemih
ramuan alami untuk mengobati penyakit jantung
tips makanan untuk penyakit jantung
manfaat sea cucumber jelly gamat gold g
sayuran yang baik untuk pencegahan penyakit jantung
obat pengapuran tulang belakang
obat herbal untuk penyakit miom
tips pencegah penyakit jantung
tips tips untuk menghancurkan batu ginjal
cara alami menghancurkan batu ginjal
tumbuhan untuk penghancur batu ginjal
nama nama tanaman penghancur batu ginjal
tanda tanda orang terkena batu ginjal
ramuan herbal penghancur batu ginjal
fungsi jelly gamat sebagai penghancur batu ginjal
tanaman obat batu ginjal terampuh
pantangan makan untuk penderita batu ginjal
cara mengobati penyakit ginjal secara alami
resep obat herbal penghancur batu ginjal
3 tanaman obat penghancur batu ginjal
khasiat buah apel untuk kesehatan
khasiat lobak putih untuk penyakit batu ginjal
manfaat terong untuk kesehatan tubuh
cara mengobati limpa bengkak secara alami
pantangan bagi penderita batu ginjal
khasiat daun kumis kucing untuk mengobati batu ginjal
cara mengobati asam lambung secara alami
manfaat daun alpukat untuk hancur batu ginjal
khasiat teripang emas untuk kesehatan
khasiat daun cincau untuk kesehatan
tips menghilangkan jerawat secara alami
alasan daun pepaya sebagai obat tradisional
obat gagal ginjal tanpa cuci darah
beberapa tips cara menghancurkan batu ginjal
khasiat daun tempuyung untuk batu ginjal
paprika merah untuk pencegahan batu ginjal
thank you of some of the articles I find this is one of the very interesting article to read, I like this alat onani pria vagina ngangkang possible for people not important but very useful for us to read tattonox
Alfamart Official Partner Merchandise Fifa Piala Dunia Brazil 2014 Alfamart Official Partner Merchandise Fifa Piala Dunia Brazil 2014
Hotel Murah Di Jakarta
Unit Link Terbaik di Indonesia Commonwealth Life Investra Link
http://gupfransyah.blogspot.com/2014/02/alfamart-merchandise-fifa-piala-dunia.html
částečně jsem spolupracoval na službě NextStories. Je to něco jiného než "jen" agregátor. Pomocí bookmarkletu v liště umí nabídnout články z webů, které jsou kontextově blízké tomu, který právě čtete. V tom je to nové. Zkuste ... na http://nextstories.cz
Dobrý den,
chtěl jsem se vás zeptat proč nelinkujete zpravodajské servery na přímo a místo toho používáte přesměrování, které nepředává page rank? Je to úmysl a nebo nedopatření? Statistiku prokliků byste mohl získat pomocí javascritptu a když už přesměrováváte, tak byste mohl použít status 301. Takhle to může vypadat, že nechcete hrát úplně fér.
Dále už bych polemizoval s názorevm v článku. Dělal bych rozdíl mezi vyhledáváním a agregátorem zpráv. Vyhledávání je aktivní činnost, kdy si člověk jde pro určitou specifickou informaci. Agregátor zpráv je naopak více podobný zpravodajským médiím(=pasivní konzumace toho co se děje), protože tam člověku nabízí témata a ten si z nich vybírá. Tedy mohu si přečíst (získat informaci) třeba i z deseti titulků daného média aniž bych ho návštívil - prostě mi konzumace titulku stačí. Na zpravodajských serverech si lidé prokliknou jen každý Xtý titulek, ale přečtou z nich mnohem více. To že se neproklinou neznamená, že je daná věc nezajímá, ale může to znamenat jen tolik že jim stačila informace z titulku. V agregátoru tedy fakticky vytváříte médium nad médii. Debata o tom co je v rámci tohoto přístupu korektní spravedlivé/zákonné a co už není je zcela na místě. Spíše se tedy ty hranice hůře hledají a není to tak zažitá věc jako tradičnější stránky života, na které už existují etická/právní pravidla. Někdy se snadno dělá rovnítko mezi tím co lze strojově vytěžit a agregovat a tím co je legální, etické, férové.
Agregátory samozřejmě nabízejí přidanou hodnotu uživatelům, protože jinak by je nikdo nepoužíval. Na druhou stranu by bylo užitečné nastavit pravidla hry, tak aby napříkad médium mohlo rozhodovat zda si přeje, aby se jeho titulky objevily v agregátoru či nikoliv.
Musím se ozvat: hned, jak jsem si přečetl titulek, jsem si řekl: "Nač psát agregátor, když máme pravednes.cz?" No a když jsem zjistil, že ho píšete zrovna Vy, měl jsem opravdu radost :-)
Ohledně linků: od té doby, co používám pravednes.cz nechodím skoro na weby, které tam nejsou nebo jsou méně dobře propojené. Takže spíš bych se bál, abyste nedopadli tak, že vás bude někdo žalovat, že ho nelinkujete a on tím přichází o návštěvníky :-)
P.S. Zrovna u vás je úžasná ještě jedna věc, a to možnost porovnání, ja které médium informuje. Stane se nějaká věc a já hned na jedné stránce krásně vidím, jak rozdílně lze informovat o tom samém :-)
P.P.S. Děkuji za Vaši práci a držím Vám palce do budoucna!
Lze souhlasit s tím, že na nezajímavý perex na agregátoru nikdo neklikne. Právě proto ale zdrojový portál, aby návštěvník klikl i na méně atraktvní nadpisy, dává v hojné míře ilustrační obrázky (více či méně související, zato atraktivní). Druhý argument, pro který chápu vydavatele, je, že některé agregátory používají nofollow nebo podobné techniky bez SEO přínosu pro vydavatele článku. Ve výsledku se může stát, že google indexuje nadpis agregátoru, zatímco originální článek je někde na konci seznamu.
jen se modlím, aby se zpátky na prvních místa nevrátily parlamentní listy a eurozprávy. ta dvojnásobná porce odpadu se nedala vydržet.
Můj agregátor naštěstí není pod drobnohledem vydavatelů. Přesto mohu potvrdit názor aktuálně.cz které jsem si cvičně kontaktoval sám. Všechno je to o lidech... ta paní (nějaká velká šefka) které jsem se tenkrát dovolal vůbec nechápala co je agregátor a při představě, že bych někde na webu měl odkazy na jejich články mlela jen to že to nejde. Argument s vyhledávačem jí nechával chladnou. V každém případě problém agregátory vs. vyhledávače se dá výdy vyřešit snadno. Dotyčný web stáhnout z indexu. Vždy je dost webů které o to stojí a t ty návštěvníky dostanou.
Témata, do kterých si troufám kecat, jsou CRM (protože jedno dělám), zpravodajské agregátory (protože to dělám taky), řízení firmy (protože mám strach to nedělat – musím), jídlo (protože jej mám rád a občas o něm píšu), Apple (protože jsem programoval Mac ještě v době, kdy jste tahali kačera), Java (protože to je můj šálek kávy), webové technologie (protože bez nich by to teda nešlo), grafika a kreslení (protože bych na to chtěl mít víc času).