10 oktober 2008
De doornen van Web 2.0 toepassingen in de bibliotheek

Op dit blog schreef ik al eens eerder over de in mijn ogen prachtige potentie van de rubriek "wat lever je weer in?" van de Bibliotheek 's Hertogenbosch. Op sommige van deze stukje worden ook commentaren geschreven door andere gebruikers. Er ontstaat zomaar communicatie op die Website. Zo mooi. Zo 2.0
Alleen aan het openstellen van je site voor dit soort dingen kleven wel nadelen. Misbruik is er een van. Een oogje in het zeil houden is daarom wel verstandig en ingrijpen wanneer het nodig. Is dat echt nodig dan? In 's Hertogenbosch wel. Daar hebben ze al een hele poos een enorm spam probleem en het lijkt maar niet op te houden. Ik heb ze een hele tijd terug er al eens op gewezen. Maar tot op heden lijkt er niets te gebeuren. Althans, niet afdoende. Ik vind het zeer storend, zeker omdat je deze praktijken dus ook bij leestips voor de jeugd tegenkomt.
Kom 's Hertogenbosch, gooi dicht die commentaarmogelijkheden. Poets de spam weg en kies voor een betere spamfighter strategiën. Hier moet echt betere beveiliging op, al was het maar tijdelijk. Overweeg eens het gebruik van recaptcha in plaats van de huidige captcha, dan help je ook nog eens mee aan het tekst-herkennen van digitale teksten. Maar vooraleerst, werk die spam weg.
Ik weet het uit eigen ervaring. Er zijn nu eenmaal de donkere kanten van het Web die af en toe de kop opsteken. Maar laat je hierdoor niet uit het veld slaan. Ga na deze episode door op de ingeslagen weg, de voordelen zijn groter dan de nadelen.
21 juni 2008
Spam sites voor de TU Delft
Schreef ik laatst nog over de het slim gekozen url van leiden.edu, schoot me ineens een tegenovergesteld voorbeeld voor de TU Delft te binnen. In mijn cursussen over zoeken op het Web laat ik de cursisten meestal URL's raden van bekende instellingen.
Toen ik onlangs wat cursisten (zonder universitaire achtergrond) vroeg het URL te raden van de universiteit in Delft typten de meesten blindelings http://www.universiteitdelft.nl/ in (4 van de zes cursisten). De meesten dachten dat ze daadwerkelijk de site van de TU Delft voor ogen hadden. Het werd dus meteen een lesje kritisch je resultaat beoordelen geworden. Er staat wat informatie over studeren op de eerste pagina, maar dat is complete onzin. Wanneer je door wilt klikken zit je altijd in een reclameblokje van Google (de kassa van mijnheer Koole vaart er wel bij). Ook op de pagina's achter de tabbladen vertoonden precies dezelfde structuur. Je kon nergens heen navigeren zonder op een van de drie reclame blokjes van Google te klikken.
Overigens nog een ander domein dat een oplossing bleek voor Delft, www.tud.nl Blijkt niet het goede domein te zijn.
Als universiteit zou ik toch proberen daar wat aan te doen.
Toen ik onlangs wat cursisten (zonder universitaire achtergrond) vroeg het URL te raden van de universiteit in Delft typten de meesten blindelings http://www.universiteitdelft.nl/ in (4 van de zes cursisten). De meesten dachten dat ze daadwerkelijk de site van de TU Delft voor ogen hadden. Het werd dus meteen een lesje kritisch je resultaat beoordelen geworden. Er staat wat informatie over studeren op de eerste pagina, maar dat is complete onzin. Wanneer je door wilt klikken zit je altijd in een reclameblokje van Google (de kassa van mijnheer Koole vaart er wel bij). Ook op de pagina's achter de tabbladen vertoonden precies dezelfde structuur. Je kon nergens heen navigeren zonder op een van de drie reclame blokjes van Google te klikken.
Overigens nog een ander domein dat een oplossing bleek voor Delft, www.tud.nl Blijkt niet het goede domein te zijn.
Als universiteit zou ik toch proberen daar wat aan te doen.
Labels: domein kapen, resultaat evaluatie, SEO, spam
02 april 2008
De invloed van spam op Google Adsense
Tijdens pasen had dit weblog je te maken met een spam aanval en ik ben nog steeds de resten aan het wegwerken. Toch heb ik weer een hoop geleerd.
De teksten en de links kwamen mij nogal zot voor. WoW snapte ik nog wel, heeft iets met de titel en domeinnaam van mijn blog te maken. Maar al dat cheap gold en de chinese teksten, dat was toch veel te opvallend om mensen in te laten tuinen? Bovendien zaten die comments helemaal onderaan de blogposts. Je moet wel heel geduldig zijn wil je die in een oogopslag zien.
Ik ben er ondertussen achter dat deze vorm van spammen ook een veel subtieler effect heeft dan alleen het verhogen van het aantal links naar de spammende sites; Namelijk het beïnvloeden van de Adsense advertenties bovenaan de pagina. Doordat er zoveel gelijkende termen op die webpagina staan en links naar soortgelijke sites plaatst Google Adsense ook opeens advertenties op die pagina die normaal niet op dit blog zouden voorkomen maar nu ineens wel een relatie heeft met de uitgaande links in het gespammde commentaar zoals in onderstaande plaatje te zien is.
Normaal scoor ik alleen op bibliotheeksoftware maar dat levert normaal nooit zoveel op en met de huidige dollarkoers helemaal bitter weinig. Ik ben echter wel blij met die Adsense advertenties, anders had ik dit stukje black hat SEO nooit geleerd.
O ja, commentaar moderatie blijft hier voorlopig wel aan staan.
De teksten en de links kwamen mij nogal zot voor. WoW snapte ik nog wel, heeft iets met de titel en domeinnaam van mijn blog te maken. Maar al dat cheap gold en de chinese teksten, dat was toch veel te opvallend om mensen in te laten tuinen? Bovendien zaten die comments helemaal onderaan de blogposts. Je moet wel heel geduldig zijn wil je die in een oogopslag zien.Ik ben er ondertussen achter dat deze vorm van spammen ook een veel subtieler effect heeft dan alleen het verhogen van het aantal links naar de spammende sites; Namelijk het beïnvloeden van de Adsense advertenties bovenaan de pagina. Doordat er zoveel gelijkende termen op die webpagina staan en links naar soortgelijke sites plaatst Google Adsense ook opeens advertenties op die pagina die normaal niet op dit blog zouden voorkomen maar nu ineens wel een relatie heeft met de uitgaande links in het gespammde commentaar zoals in onderstaande plaatje te zien is.
Normaal scoor ik alleen op bibliotheeksoftware maar dat levert normaal nooit zoveel op en met de huidige dollarkoers helemaal bitter weinig. Ik ben echter wel blij met die Adsense advertenties, anders had ik dit stukje black hat SEO nooit geleerd.O ja, commentaar moderatie blijft hier voorlopig wel aan staan.
Labels: Google adsense, SEO, spam
22 maart 2008
Comments tijdelijk afgesloten
Wegens een serieuze spam attack zijn de reacties tijdelijk afgesloten. Leuke paasdagen, 300 spam comments in mijn mailbox. Ze blijken trouwens niet op mijn blog gepubliceerd. Wel is mijn mailbox enorm vervuild.
Het houdt je van de straat en de meubelboulevard...
Het houdt je van de straat en de meubelboulevard...
Labels: spam
02 november 2007
Google spam (2)

In mei berichtte ik al eens eerder over de spam van Google, volgens Google. Vandaag zijn de problemen nog niet opgelost. De Google Earth newsletter werd weer als spam herkend in Gmail. Toen ik de mail op de juiste plek gezet had en opende werd ik alsnog uitdrukkelijk gewaarschuwd over het feit dat de inhoud toch niet te vertrouwen is en dat ik vooral moet oppassen met het volgen van de links.
Ach ja, het is vrijdag denk ik dan....
01 mei 2007
Google spam

Most of the time Gmail does a fair job on recognizing what's spam and what's not. However, today it seems a bit harsh on its own brethren.
LOL
02 juni 2006
De volgende slag om de rangorde
Vandaag kwam mijn artikel uit in de IP met en prachtige illustratie van Henk Ruitenbeek. De aanleiding om dit artikel te gaan schrijven was een post van Jim Hedger op Search Engine Guide over nieuwe patenten van Google die Eric Sieverts aan mij doorspeelde.
In mijn bedankje voor de nuttige link liet ik aan Eric zo mijn gedachten gaan over hoe dit past in het perspectief van de ontwikkelingen van zoekmachines om spammers voor te blijven. Waarop Eric vroeg daar eens wat uitgebreider over te schrijven in de IP.
Wanneer je daar dan ja op zegt, moet je vervolgens wel wat meer studie verrichten om het allemaal onderbouwd op een rijtje te krijgen. Het artikel van Gyöngyi en Garcia-Molina (2005) helpt goed om de spam typeringen op orde te krijgen. Metaxas en DeStefano (2005) beschrijven hoe de zoekmachines op spam gereageerd hebben. Zij schetsen nog een ontwikkelingen extra rond het link spammen, maar dat vond ik te ver voeren voor mijn artikel. De oplossing tegen linkspammers die zij aandragen vind ik wat minder, en het is voor mij allang duidelijk dat Google met Google Personal ook een andere kant op beweegt.
Een discussie op het forum van webmasterworld die genoemd wordt in de post van Jim Hedger, kon ik rond die periode ook zomaar bij, terwijl dat normaal achter een wachtwoord zit. Ik denk dat de essentie van deze discussie zit in het feit dat de meeste mensen denken dat Google (of Yahoo!, MSN, Ask etc.) pas wat van je gedrag te weten komt wanneer je iets intikt, of op een advertentie klikt. Het vilein zit echter in het feit dat je surfgedrag al wordt geregistreerd wanneer je een pagina opvraagt waarop advertenties staan of wanneer er een (onzichtbaar) tellertje opzit zoals voor Google Analytics. De meeste mensen realiseren zich dat niet.
Wakker worden! Zouden Theo Huibers en Nart Wiellaard zeggen.
Referenties
Gerritsma, W. (2006). Zoekmachines de volgende slag om de rangorde. Informatie Professional 10(6): 26-28. http://www.wowter.nl/articles/zoekmachines%20de%20volgende%20slag%20om%20de%20rangorde.pdf.
Gyöngyi, Z. & H. Garcia-Molina (2005). Web Spam Taxonomy. First International Workshop on Adversarial Information Retrieval on the Web (at the 14th International World Wide Web Conference), Chiba, Japan. http://www-db.stanford.edu/~zoltan/publications/gyongyi2005web.pdf.
Metaxas, P.T. & J. DeStefano (2005). Web spam, propaganda and trust. AIRWeb05, Chiba, Japan. http://cs.wellesley.edu/~pmetaxas/TR28-2004/spamPropTrust.pdf.
technorati tags: Privacy; Search Engines; spam; spamming
In mijn bedankje voor de nuttige link liet ik aan Eric zo mijn gedachten gaan over hoe dit past in het perspectief van de ontwikkelingen van zoekmachines om spammers voor te blijven. Waarop Eric vroeg daar eens wat uitgebreider over te schrijven in de IP.
Wanneer je daar dan ja op zegt, moet je vervolgens wel wat meer studie verrichten om het allemaal onderbouwd op een rijtje te krijgen. Het artikel van Gyöngyi en Garcia-Molina (2005) helpt goed om de spam typeringen op orde te krijgen. Metaxas en DeStefano (2005) beschrijven hoe de zoekmachines op spam gereageerd hebben. Zij schetsen nog een ontwikkelingen extra rond het link spammen, maar dat vond ik te ver voeren voor mijn artikel. De oplossing tegen linkspammers die zij aandragen vind ik wat minder, en het is voor mij allang duidelijk dat Google met Google Personal ook een andere kant op beweegt.
Een discussie op het forum van webmasterworld die genoemd wordt in de post van Jim Hedger, kon ik rond die periode ook zomaar bij, terwijl dat normaal achter een wachtwoord zit. Ik denk dat de essentie van deze discussie zit in het feit dat de meeste mensen denken dat Google (of Yahoo!, MSN, Ask etc.) pas wat van je gedrag te weten komt wanneer je iets intikt, of op een advertentie klikt. Het vilein zit echter in het feit dat je surfgedrag al wordt geregistreerd wanneer je een pagina opvraagt waarop advertenties staan of wanneer er een (onzichtbaar) tellertje opzit zoals voor Google Analytics. De meeste mensen realiseren zich dat niet.
Wakker worden! Zouden Theo Huibers en Nart Wiellaard zeggen.
Referenties
Gerritsma, W. (2006). Zoekmachines de volgende slag om de rangorde. Informatie Professional 10(6): 26-28. http://www.wowter.nl/articles/zoekmachines%20de%20volgende%20slag%20om%20de%20rangorde.pdf.
Gyöngyi, Z. & H. Garcia-Molina (2005). Web Spam Taxonomy. First International Workshop on Adversarial Information Retrieval on the Web (at the 14th International World Wide Web Conference), Chiba, Japan. http://www-db.stanford.edu/~zoltan/publications/gyongyi2005web.pdf.
Metaxas, P.T. & J. DeStefano (2005). Web spam, propaganda and trust. AIRWeb05, Chiba, Japan. http://cs.wellesley.edu/~pmetaxas/TR28-2004/spamPropTrust.pdf.
technorati tags: Privacy; Search Engines; spam; spamming
Labels: Privacy, spam, zoekmachines
