02 juni 2006

 

De volgende slag om de rangorde

Vandaag kwam mijn artikel uit in de IP met en prachtige illustratie van Henk Ruitenbeek. De aanleiding om dit artikel te gaan schrijven was een post van Jim Hedger op Search Engine Guide over nieuwe patenten van Google die Eric Sieverts aan mij doorspeelde.
In mijn bedankje voor de nuttige link liet ik aan Eric zo mijn gedachten gaan over hoe dit past in het perspectief van de ontwikkelingen van zoekmachines om spammers voor te blijven. Waarop Eric vroeg daar eens wat uitgebreider over te schrijven in de IP.
Wanneer je daar dan ja op zegt, moet je vervolgens wel wat meer studie verrichten om het allemaal onderbouwd op een rijtje te krijgen. Het artikel van Gyöngyi en Garcia-Molina (2005) helpt goed om de spam typeringen op orde te krijgen. Metaxas en DeStefano (2005) beschrijven hoe de zoekmachines op spam gereageerd hebben. Zij schetsen nog een ontwikkelingen extra rond het link spammen, maar dat vond ik te ver voeren voor mijn artikel. De oplossing tegen linkspammers die zij aandragen vind ik wat minder, en het is voor mij allang duidelijk dat Google met Google Personal ook een andere kant op beweegt.
Een discussie op het forum van webmasterworld die genoemd wordt in de post van Jim Hedger, kon ik rond die periode ook zomaar bij, terwijl dat normaal achter een wachtwoord zit. Ik denk dat de essentie van deze discussie zit in het feit dat de meeste mensen denken dat Google (of Yahoo!, MSN, Ask etc.) pas wat van je gedrag te weten komt wanneer je iets intikt, of op een advertentie klikt. Het vilein zit echter in het feit dat je surfgedrag al wordt geregistreerd wanneer je een pagina opvraagt waarop advertenties staan of wanneer er een (onzichtbaar) tellertje opzit zoals voor Google Analytics. De meeste mensen realiseren zich dat niet.
Wakker worden! Zouden Theo Huibers en Nart Wiellaard zeggen.

Referenties
Gerritsma, W. (2006). Zoekmachines de volgende slag om de rangorde. Informatie Professional 10(6): 26-28. http://www.wowter.nl/articles/zoekmachines%20de%20volgende%20slag%20om%20de%20rangorde.pdf.
Gyöngyi, Z. & H. Garcia-Molina (2005). Web Spam Taxonomy. First International Workshop on Adversarial Information Retrieval on the Web (at the 14th International World Wide Web Conference), Chiba, Japan. http://www-db.stanford.edu/~zoltan/publications/gyongyi2005web.pdf.
Metaxas, P.T. & J. DeStefano (2005). Web spam, propaganda and trust. AIRWeb05, Chiba, Japan. http://cs.wellesley.edu/~pmetaxas/TR28-2004/spamPropTrust.pdf.

technorati tags: ; ; ;

Labels: , ,


Comments:
Goed verhaal in deze post Wouter! Ik ben benieuwd naar het complete artkel: blijkbaar loopt TPG-post in Delft en Den Haag dit weekend wat minder hard dan in Wageningen. Wat ik wel hoop: je blijft toch óók wel de luis in de pels, toch?
 
De bezorging van de IP loopt prive ook altijd achter bij de Bib (afstand ongveer 500 m.), maar in de kop is de preprint gelinkt. Dus....
 
Dit is écht heel informatief en toch goed leesbaar geschreven.
Het wordt wel lastig om research te doen naar de werking van zoekmachines, als de resultaten per pc of inlogcode verschillen. Het verschil in zoekresultaten tussen Classic Home en Personalized Home bij Google is trouwens inderdaad opvallend!
 
Een reactie plaatsen

Links to this post:

Een koppeling maken



<< Home

This page is powered by Blogger. Isn't yours?