10 augustus 2009
Waarom bibliotheken met hun informatie op Google cs moeten inzetten
Collega Sieverts wil het maar niet met mijn pleidooi eens zijn dat het verstandig is voor bibliotheken om hun waren met Google en soortgelijke zoekmachines doorzoekbaar te maken. Hoewel hij lijkt voor een type zoekactie een uitzondering te willen maken. Zijn pleidooi ligt misschien iets anders voor de zogenaamde "known item" zoekacties, zoals hijzelf aangeeft. Wanneer ik naar de log files van onze catalogus kijk valt het juist op hoeveel van dit soort zoeken naar de bekende weg plaats vindt. Zo gauw iemand een regeltje met 6 titelwoorden in een zoekmachine klopt, wordt de zin al zo specifiek dat de kansen van catalogusrecords om boven komen te drijven alweer behoorlijk toenemen. Als het dan ook nog eens om rapportliteratuur gaat dat niet in de reguliere boekhandel te krijgen is, dan nemen de kansen nog meer toe. Afijn, zo kan je dit naar hele specifieke gevallen toe redeneren, maar dat wil ik hier niet doen. Mij gaat het om het principe dat Google de favoriete zoekingang is van veruit de meeste mensen en onze studenten en onderzoekers zijn in wezen ook mensen. Dus wil je gevonden worden dan moet je in Google zitten.
Mijn redenering werd van de week weer kracht bijgezet door een grote wetenschappelijke uitgever. Wij werden door Wiley geattendeerd op het feit dat tot hun schande de gebruiksstatistieken van de elektronisch tijdschriften en boeken over mei en juni zwaar zouden tegenvallen omdat de indexeerregels van Google waren veranderd.
Het is een geluid dat mij niet onbekend voorkomt. Op het oude platform van BioOne werden er nog statistieken verstrekt over de herkomst van bezoekers die artikelen downloaden. Daar bleek dat van onze gebruikers 76% gebruik maakte van Google om tot die tijdschriften te komen. Met de nieuwe opzet van het BioOne platform kan ik deze getallen helaas niet meer actualiseren. Wel is het zo dat ik soortgelijke geluiden ook al eens bij Elsevier te horen heb gekregen, hoewel je het daar ook niet via de gebruikersstatistieken zelf kunt bekijken.
Ik denk dat het belangrijk is om te leren dat uitgevers er duidelijk baat bij hebben dat hun inhoud terug te vinden is in Google. Wat voor uitgevers geldt, geldt mijns inziens ook voor bibliotheken. Vervolgens kunnen we natuurlijk bakkeleien over de vraag of dat dan in de gewone Google moet zijn, Google Scholar of Google Books. Moeten bibliotheken het eigen kracht doen of via een koepel organisaties zoals OCLC met zijn vlaggenschip Worldcat? Het zijn allemaal keuzes en opties waar wel over nagedacht dient te worden. En een passende strategie voor ontwikkeld dient te worden. Niets doen op dit vlak is geen optie.
Overigens de veranderde indexeerregels van Google hebben ook ons ernstig parten gespeeld. We zijn teruggezet van zo'n 700,000 items een paar maanden terug naar ruim 400,000 op dit moment. Even ter geruststelling van Eric, het zijn juist de kale catalogusrecords die gewipt zijn. Onze documentatierecords, dissertaties en WUR publicaties zitten er nog netjes in. Toch eens zien of we in de toekomst dingen kunnen verbeteren zodat we wel weer naar de 800,000 items in Google door kunnen groeien.
Mijn redenering werd van de week weer kracht bijgezet door een grote wetenschappelijke uitgever. Wij werden door Wiley geattendeerd op het feit dat tot hun schande de gebruiksstatistieken van de elektronisch tijdschriften en boeken over mei en juni zwaar zouden tegenvallen omdat de indexeerregels van Google waren veranderd.
"Google excluded all Wiley InterScience content from its search results. As Google is a key driver of users to content this had a significant impact on usage of our journals in May and June 2009".
Het is een geluid dat mij niet onbekend voorkomt. Op het oude platform van BioOne werden er nog statistieken verstrekt over de herkomst van bezoekers die artikelen downloaden. Daar bleek dat van onze gebruikers 76% gebruik maakte van Google om tot die tijdschriften te komen. Met de nieuwe opzet van het BioOne platform kan ik deze getallen helaas niet meer actualiseren. Wel is het zo dat ik soortgelijke geluiden ook al eens bij Elsevier te horen heb gekregen, hoewel je het daar ook niet via de gebruikersstatistieken zelf kunt bekijken.
Ik denk dat het belangrijk is om te leren dat uitgevers er duidelijk baat bij hebben dat hun inhoud terug te vinden is in Google. Wat voor uitgevers geldt, geldt mijns inziens ook voor bibliotheken. Vervolgens kunnen we natuurlijk bakkeleien over de vraag of dat dan in de gewone Google moet zijn, Google Scholar of Google Books. Moeten bibliotheken het eigen kracht doen of via een koepel organisaties zoals OCLC met zijn vlaggenschip Worldcat? Het zijn allemaal keuzes en opties waar wel over nagedacht dient te worden. En een passende strategie voor ontwikkeld dient te worden. Niets doen op dit vlak is geen optie.
Overigens de veranderde indexeerregels van Google hebben ook ons ernstig parten gespeeld. We zijn teruggezet van zo'n 700,000 items een paar maanden terug naar ruim 400,000 op dit moment. Even ter geruststelling van Eric, het zijn juist de kale catalogusrecords die gewipt zijn. Onze documentatierecords, dissertaties en WUR publicaties zitten er nog netjes in. Toch eens zien of we in de toekomst dingen kunnen verbeteren zodat we wel weer naar de 800,000 items in Google door kunnen groeien.
Labels: bibliotheken, Google, Indexeren, SEO
13 juli 2008
Lenovo blogging programma voor de Olympische Spelen gelanceerd
Lenovo heeft de afgelopen week hun eerder aangekondigde Olympische blogging programma voor atleten die deelnemen aan Beijing 2008 gelanceerd: Voices of the Olympic Games. Honderd atleten uit 19 landen die deelnemen aan 27 verschillende sporten zijn geselecteerd om bijdragen te leveren aan de lenovo Website. Deze olympisch bloggers krijgen van Lenovo een Laptop en een cursus bloggen van Ogilvy's Rohit Bhargava.
Als Nederlandse deelnemer aan dit programma is hockeyer Floris Evers hier door Lenovo voor geselecteerd. Gelukkig was deze keuze niet helemaal, want op 1 juli kreeg Floris Evers van Roelant Oltmans te horen dat hij niet voor de Olympische hockeyploeg voor Beijing 2008 geselecteerd is. Dat verklaart waarschijnlijk ook meteen dat zijn laatste bijdrage aan het Voices nog leeg is.
Onderwijl is de hele Lenovo site door Jennifer Laycock van de Searchengine Guide vakkundig afgekraakt vanuit een SEO standpunt. De site is niet zoekmachine vriendelijk, slecht te linken, beschikt niet ove de content, is niet interactief. Kortom een nachtmerrie vanuit het ooogpunt van zoekmachine optimalisatie. Ondertussen trekt Lenovo zich de kritiek aan, en komt met enkele aanpassingen, maar feit blijft dat ze niet over de content beschikken.
Kortom het Olympische blogging programma voor Beijing 2008 van Lenovo lijkt niet helemaal onder een gelukkig gesternte geboren te zijn.
Als Nederlandse deelnemer aan dit programma is hockeyer Floris Evers hier door Lenovo voor geselecteerd. Gelukkig was deze keuze niet helemaal, want op 1 juli kreeg Floris Evers van Roelant Oltmans te horen dat hij niet voor de Olympische hockeyploeg voor Beijing 2008 geselecteerd is. Dat verklaart waarschijnlijk ook meteen dat zijn laatste bijdrage aan het Voices nog leeg is.
Onderwijl is de hele Lenovo site door Jennifer Laycock van de Searchengine Guide vakkundig afgekraakt vanuit een SEO standpunt. De site is niet zoekmachine vriendelijk, slecht te linken, beschikt niet ove de content, is niet interactief. Kortom een nachtmerrie vanuit het ooogpunt van zoekmachine optimalisatie. Ondertussen trekt Lenovo zich de kritiek aan, en komt met enkele aanpassingen, maar feit blijft dat ze niet over de content beschikken.
Kortom het Olympische blogging programma voor Beijing 2008 van Lenovo lijkt niet helemaal onder een gelukkig gesternte geboren te zijn.
Labels: Beijing 2008, Bloggen, Lenovo, Marketing, Ogilvy, Olympische Spelen, SEO
01 juli 2008
Seminar website optimalisatie voor de bibliotheek
Vanmiddag hadden we twee heren van Checkit op bezoek die een ons wijzer kwamen maken over website optimalisatie. Na een algemene inleiding viel de lezing viel uiteen in drie delen: Search Engine Ranking (1) architectuur en techniek, (2) copywriting en (3) link strategie.
In de zaal zat eigenlijk heel wat eigen website en zoekmachinekennis verenigd, maar toch heb je af en toe buitenstaanders nodig om je de ogen te openen. Het gebruik van framepagina's werd natuurlijk zwaar ter discussie gesteld, onder het mom van dat zoekmachines daar niet goed mee om kunnen gaan. Nu is dat natuurlijk een beetje een achterhaald standpunt (daarbij ziet Google ook maar liefst ruim 650.000 pagina's van onze website ondanks de frames, dus helemaal nodig is het niet) Maar het argument van de heren van Checkit dat het voor een gebruiker vervelend is om vanuit een zoekresultaat op een los frame terecht te komen snijdt natuurlijk wel hout. Ook is het linken naar losse framepagina's erg vervelend en dat staat op gespannen voet met de wens dat je uiteindelijk wil je dat veel van je materiaal gelinkt wordt.
Andere technische en architectuur zaken die de revue passeerden waren gebruiken van titles, header tags, en de index en follow tags van links. Maar echt goede richtlijnen voor het probleem des bibliotheek met veel 'dunne' metadata records, waar we al een boektitel vermelden in de title tag, de description en ook nog eens in de text van en record en hoe dat dan verder te optimaliseren daar werd geen duidelijk advies over gegeven.
Het deel over copywriting ging mijns inziens een beetje de mist omdat we met enorm veel kleine records zitten die volgens geldende standaards in opgesteld worden. Wel is het zo dat we die records moeten verrijken daar waar mogelijk is. Trefwoorden uit de thesaurus, maar het is vooral belangrijk om inhoudsopgaven en samenvattingen ook in het catalogusrecord te stoppen. Dat is niet zo zeer copy writing, maar ouderwtse verrijking. Iets waar we al jaren over praten, maar we zijn nog steeds niet in staat gebleken om zoiets in productie te brengen.
Link building was het laatste onderdeel het seminar. Volgens de heren van Checkit hadden we een Google Pagerank van 5, en dat vonden zij voldoende. Daar kon ik het niet mee eens zijn. Op dit moment is de PR van onze website zelfs 6, maar de bibliotheken van Utrecht, Twente, UBA en Maastricht scoren een volle punt meer. Dus daar lijkt nog ruimte te liggen. Trouwens wanneer je snel de inlinks met Yahoo telt zie je dat alleen Utrecht meer inlinks heeft dan wij. Van alle universitaire bibliotheken hebben we wel veruit de grootste site met ruim 650,000 geindexeerde pagina's. Ik denk dat aan het aantrekken van links nog veel kan gebeuren en dat sluit weer aan op de vervelende frame-pagina's die in mijn ogen vervelend linken.
Waarom een middag als dit georganiseerd werd? Wij hebben al een tijdje terug ingezien dat het belangrijk is om je informatie in de grote zoekmachines te stoppen. Dat lijkt nu wel redelijk gelukt. Nu is het de wens om vooral hoger in de rankings te klimmen met inhoud van je bibliotheek, waar dat mogelijk is. Maar ranken deden we al niet zelf in onze eigen catalogus, laat staan dat we ons er druk over maakten in Google. Toch lijkt het tij te keren. We gaan er oog voor krijgen.
Nu eerst maar eens goede gebruiksstatistieken van de website verzamelen, dan kunnen we straks eens vertellen wat werkte.
In de zaal zat eigenlijk heel wat eigen website en zoekmachinekennis verenigd, maar toch heb je af en toe buitenstaanders nodig om je de ogen te openen. Het gebruik van framepagina's werd natuurlijk zwaar ter discussie gesteld, onder het mom van dat zoekmachines daar niet goed mee om kunnen gaan. Nu is dat natuurlijk een beetje een achterhaald standpunt (daarbij ziet Google ook maar liefst ruim 650.000 pagina's van onze website ondanks de frames, dus helemaal nodig is het niet) Maar het argument van de heren van Checkit dat het voor een gebruiker vervelend is om vanuit een zoekresultaat op een los frame terecht te komen snijdt natuurlijk wel hout. Ook is het linken naar losse framepagina's erg vervelend en dat staat op gespannen voet met de wens dat je uiteindelijk wil je dat veel van je materiaal gelinkt wordt.
Andere technische en architectuur zaken die de revue passeerden waren gebruiken van titles, header tags, en de index en follow tags van links. Maar echt goede richtlijnen voor het probleem des bibliotheek met veel 'dunne' metadata records, waar we al een boektitel vermelden in de title tag, de description en ook nog eens in de text van en record en hoe dat dan verder te optimaliseren daar werd geen duidelijk advies over gegeven.
Het deel over copywriting ging mijns inziens een beetje de mist omdat we met enorm veel kleine records zitten die volgens geldende standaards in opgesteld worden. Wel is het zo dat we die records moeten verrijken daar waar mogelijk is. Trefwoorden uit de thesaurus, maar het is vooral belangrijk om inhoudsopgaven en samenvattingen ook in het catalogusrecord te stoppen. Dat is niet zo zeer copy writing, maar ouderwtse verrijking. Iets waar we al jaren over praten, maar we zijn nog steeds niet in staat gebleken om zoiets in productie te brengen.
Link building was het laatste onderdeel het seminar. Volgens de heren van Checkit hadden we een Google Pagerank van 5, en dat vonden zij voldoende. Daar kon ik het niet mee eens zijn. Op dit moment is de PR van onze website zelfs 6, maar de bibliotheken van Utrecht, Twente, UBA en Maastricht scoren een volle punt meer. Dus daar lijkt nog ruimte te liggen. Trouwens wanneer je snel de inlinks met Yahoo telt zie je dat alleen Utrecht meer inlinks heeft dan wij. Van alle universitaire bibliotheken hebben we wel veruit de grootste site met ruim 650,000 geindexeerde pagina's. Ik denk dat aan het aantrekken van links nog veel kan gebeuren en dat sluit weer aan op de vervelende frame-pagina's die in mijn ogen vervelend linken.
Waarom een middag als dit georganiseerd werd? Wij hebben al een tijdje terug ingezien dat het belangrijk is om je informatie in de grote zoekmachines te stoppen. Dat lijkt nu wel redelijk gelukt. Nu is het de wens om vooral hoger in de rankings te klimmen met inhoud van je bibliotheek, waar dat mogelijk is. Maar ranken deden we al niet zelf in onze eigen catalogus, laat staan dat we ons er druk over maakten in Google. Toch lijkt het tij te keren. We gaan er oog voor krijgen.
Nu eerst maar eens goede gebruiksstatistieken van de website verzamelen, dan kunnen we straks eens vertellen wat werkte.
Labels: bibliotheek websites, bibliotheken, SEO, zoekmachine optimalisatie
21 juni 2008
Spam sites voor de TU Delft
Schreef ik laatst nog over de het slim gekozen url van leiden.edu, schoot me ineens een tegenovergesteld voorbeeld voor de TU Delft te binnen. In mijn cursussen over zoeken op het Web laat ik de cursisten meestal URL's raden van bekende instellingen.
Toen ik onlangs wat cursisten (zonder universitaire achtergrond) vroeg het URL te raden van de universiteit in Delft typten de meesten blindelings http://www.universiteitdelft.nl/ in (4 van de zes cursisten). De meesten dachten dat ze daadwerkelijk de site van de TU Delft voor ogen hadden. Het werd dus meteen een lesje kritisch je resultaat beoordelen geworden. Er staat wat informatie over studeren op de eerste pagina, maar dat is complete onzin. Wanneer je door wilt klikken zit je altijd in een reclameblokje van Google (de kassa van mijnheer Koole vaart er wel bij). Ook op de pagina's achter de tabbladen vertoonden precies dezelfde structuur. Je kon nergens heen navigeren zonder op een van de drie reclame blokjes van Google te klikken.
Overigens nog een ander domein dat een oplossing bleek voor Delft, www.tud.nl Blijkt niet het goede domein te zijn.
Als universiteit zou ik toch proberen daar wat aan te doen.
Toen ik onlangs wat cursisten (zonder universitaire achtergrond) vroeg het URL te raden van de universiteit in Delft typten de meesten blindelings http://www.universiteitdelft.nl/ in (4 van de zes cursisten). De meesten dachten dat ze daadwerkelijk de site van de TU Delft voor ogen hadden. Het werd dus meteen een lesje kritisch je resultaat beoordelen geworden. Er staat wat informatie over studeren op de eerste pagina, maar dat is complete onzin. Wanneer je door wilt klikken zit je altijd in een reclameblokje van Google (de kassa van mijnheer Koole vaart er wel bij). Ook op de pagina's achter de tabbladen vertoonden precies dezelfde structuur. Je kon nergens heen navigeren zonder op een van de drie reclame blokjes van Google te klikken.
Overigens nog een ander domein dat een oplossing bleek voor Delft, www.tud.nl Blijkt niet het goede domein te zijn.
Als universiteit zou ik toch proberen daar wat aan te doen.
Labels: domein kapen, resultaat evaluatie, SEO, spam
02 april 2008
De invloed van spam op Google Adsense
Tijdens pasen had dit weblog je te maken met een spam aanval en ik ben nog steeds de resten aan het wegwerken. Toch heb ik weer een hoop geleerd.
De teksten en de links kwamen mij nogal zot voor. WoW snapte ik nog wel, heeft iets met de titel en domeinnaam van mijn blog te maken. Maar al dat cheap gold en de chinese teksten, dat was toch veel te opvallend om mensen in te laten tuinen? Bovendien zaten die comments helemaal onderaan de blogposts. Je moet wel heel geduldig zijn wil je die in een oogopslag zien.
Ik ben er ondertussen achter dat deze vorm van spammen ook een veel subtieler effect heeft dan alleen het verhogen van het aantal links naar de spammende sites; Namelijk het beïnvloeden van de Adsense advertenties bovenaan de pagina. Doordat er zoveel gelijkende termen op die webpagina staan en links naar soortgelijke sites plaatst Google Adsense ook opeens advertenties op die pagina die normaal niet op dit blog zouden voorkomen maar nu ineens wel een relatie heeft met de uitgaande links in het gespammde commentaar zoals in onderstaande plaatje te zien is.
Normaal scoor ik alleen op bibliotheeksoftware maar dat levert normaal nooit zoveel op en met de huidige dollarkoers helemaal bitter weinig. Ik ben echter wel blij met die Adsense advertenties, anders had ik dit stukje black hat SEO nooit geleerd.
O ja, commentaar moderatie blijft hier voorlopig wel aan staan.
De teksten en de links kwamen mij nogal zot voor. WoW snapte ik nog wel, heeft iets met de titel en domeinnaam van mijn blog te maken. Maar al dat cheap gold en de chinese teksten, dat was toch veel te opvallend om mensen in te laten tuinen? Bovendien zaten die comments helemaal onderaan de blogposts. Je moet wel heel geduldig zijn wil je die in een oogopslag zien.Ik ben er ondertussen achter dat deze vorm van spammen ook een veel subtieler effect heeft dan alleen het verhogen van het aantal links naar de spammende sites; Namelijk het beïnvloeden van de Adsense advertenties bovenaan de pagina. Doordat er zoveel gelijkende termen op die webpagina staan en links naar soortgelijke sites plaatst Google Adsense ook opeens advertenties op die pagina die normaal niet op dit blog zouden voorkomen maar nu ineens wel een relatie heeft met de uitgaande links in het gespammde commentaar zoals in onderstaande plaatje te zien is.
Normaal scoor ik alleen op bibliotheeksoftware maar dat levert normaal nooit zoveel op en met de huidige dollarkoers helemaal bitter weinig. Ik ben echter wel blij met die Adsense advertenties, anders had ik dit stukje black hat SEO nooit geleerd.O ja, commentaar moderatie blijft hier voorlopig wel aan staan.
Labels: Google adsense, SEO, spam
24 maart 2008
Digitale bibliotheken en Google
Over het algemeen hebben bibliotheken een haat liefde verhouding met zoekmachines en zeker de crawlers van zoekmachines. Nadat wij de databases net een beetje meer hadden opengesteld voor de crawlers was het systeem zo traag geworden omdat een bot door de databases dol aan het draaien was, dat die optie weer uitgezet werd. Maar toch zouden we graag in de zoekmachineindexen voorkomen, en het liefst hoog ranken.
Goede sitemaps, statische browse pagina's, allemaal mogelijk. Maar wat is nu het beste?
In het laatste issue van het Code4Lib journal zit een leuk artikel dat hierover gaat. Jody L. DeRidder (2008) Googlizing a Digital Library geeft hierover wat meer inzicht. Uit haar conclusie:
Goede sitemaps, statische browse pagina's, allemaal mogelijk. Maar wat is nu het beste?
In het laatste issue van het Code4Lib journal zit een leuk artikel dat hierover gaat. Jody L. DeRidder (2008) Googlizing a Digital Library geeft hierover wat meer inzicht. Uit haar conclusie:
Although the full-text version of the static files is less user-friendlyEen browse ingang op de catalogus. Ik pleit er al jaren voor. Misschien dat dit helpt wanneer we ook een uitgebreide sitemap implementeren. Er zit trouwens veel meer leuke artikelen in dit relatief jonge Code4Lib Journal.
than the dynamically-delivered versions, an added link to the latter can help to
ameliorate the pain of this trade-off. In addition, browse indexes which serve
to increase page ranking in search engine results, also increase usability to
consumers. A surprise benefit of the static browse pages has been their success
in channeling other crawlers to the static finding aids, which serves to further
advertise their existence via various search engines. Thus, the static browse
system enables crawling and indexing even by search engines which do not support
sitemaps, and hence complements the sitemap method.
Labels: catalogus, SEO, zoekmachines
08 oktober 2007
De pagerank van Nederlandse universiteiten
Schreef ik vrijdag nog over lijstjes. Vandaag wil ik zelf met een lijstje komen.
De aanleiding is dat ik uit de wandelgangen vernam dat er aan website optimalisatie gedacht wordt in Wageningen. SEO in concrete taal. In Februari gaf ik al eens een gratis advies voor wat harde maar conrete maatregelen voor de WUR-website. Maar ach ja, een goed bedoeld adviesje van de eerste beste blogger, dat kan niets voorstellen natuurlijk. Ze zullen we een prijzig bureau inhuren dat de website op 325 punten gaat doorlichten en dan met een goed onderbouwd advies komt.
Is het nodig?
De website verbeteren? Volmondig ja. Neem bijvoorbeeld eens de pagerank (voor het gemak even bepaald met de Google toolbar, dat is dus niet de echte Pagerank) Wageningen UR, die scoort slechts 6. Tilburg, Rotterdam, Maastricht, Nijmegen en Groningen scoren een 7. Leiden, Delft, Eindhoven, VU, Utrecht en Twente doen het goed en hebben een PR van 8. Alleen de UvA geeft geen GTPR, maar volgens rankalert is de PR ook 8.
Voor Wageningen als hekkesluiter is er dus werk aan de winkel. Kijk maar eens waar de WUR staat in de grote zoekmachines wanneer je op Wageningen zoekt en welk domein dan boven komt. Neem bijvoorbeeld Google Wageningen UR op één, met het domein wau.nl. Bij Yahoo! komt Wageningen UR op twee met het domein wau.nl, bij Live op twee maar hier wel met het domein wur.nl. Twee keer dus nog het wau.nl domein dat als eerste op de proppen komt. Welliswaar zijn de pagina's keurig ge-redirect, maar het staat verre van chique dat in Google als eerste nog steeds het wau.nl domein gepresenteerd wordt.
Wanneer je PR niet goed is hoef je net zo goed niet te beginnen over de traffic naar je site en je webometrics ranking of G-factor ranking die ook steeds belangrijker worden.
Ach laten we maar nog eens een duur bureau inhuren om dit in een lijvig rapport op te schrijven.
Als de PR maar eens omhoog gaat!
De aanleiding is dat ik uit de wandelgangen vernam dat er aan website optimalisatie gedacht wordt in Wageningen. SEO in concrete taal. In Februari gaf ik al eens een gratis advies voor wat harde maar conrete maatregelen voor de WUR-website. Maar ach ja, een goed bedoeld adviesje van de eerste beste blogger, dat kan niets voorstellen natuurlijk. Ze zullen we een prijzig bureau inhuren dat de website op 325 punten gaat doorlichten en dan met een goed onderbouwd advies komt.
Is het nodig?
De website verbeteren? Volmondig ja. Neem bijvoorbeeld eens de pagerank (voor het gemak even bepaald met de Google toolbar, dat is dus niet de echte Pagerank) Wageningen UR, die scoort slechts 6. Tilburg, Rotterdam, Maastricht, Nijmegen en Groningen scoren een 7. Leiden, Delft, Eindhoven, VU, Utrecht en Twente doen het goed en hebben een PR van 8. Alleen de UvA geeft geen GTPR, maar volgens rankalert is de PR ook 8.
Voor Wageningen als hekkesluiter is er dus werk aan de winkel. Kijk maar eens waar de WUR staat in de grote zoekmachines wanneer je op Wageningen zoekt en welk domein dan boven komt. Neem bijvoorbeeld Google Wageningen UR op één, met het domein wau.nl. Bij Yahoo! komt Wageningen UR op twee met het domein wau.nl, bij Live op twee maar hier wel met het domein wur.nl. Twee keer dus nog het wau.nl domein dat als eerste op de proppen komt. Welliswaar zijn de pagina's keurig ge-redirect, maar het staat verre van chique dat in Google als eerste nog steeds het wau.nl domein gepresenteerd wordt.
Wanneer je PR niet goed is hoef je net zo goed niet te beginnen over de traffic naar je site en je webometrics ranking of G-factor ranking die ook steeds belangrijker worden.
Ach laten we maar nog eens een duur bureau inhuren om dit in een lijvig rapport op te schrijven.
Als de PR maar eens omhoog gaat!
Labels: Pagerank, SEO, Wageningen UR
01 februari 2007
The position of Wageningen UR in the European academic Web
Lists, rankings and top 10's.
Managers love these. That applies to the managers of our university as well. They really like the ESI rankings (albeit we're loosing some prestige) or those from Newsweek and THES. A new type of ranking is based on webometrics. Link analysis of websites that is. A group of researchers from Spain has been quite active in this field. They posted a preprint of their analysis from the European academic Web on E-Lis. Interesting reading.
In Europe, the UK and Germany are the two most inter-linked academic Web communities. The Netherlands sits somewhat closer to the UK. The UvA and VU are two of the better linked universities in the Netherlands. Wageningen UR is a midget somewhat distant from the center where the real action takes place. This is perhaps partly due to the older web address the researchers have used in their investigation. But looking closer at their Website Webometrics which is part of their ongoing research, reveals some real problems for the Web-identity of our university.
As main university website they have still listed our old domain, but next to that there is Larenstein (perhaps rightfully so). And they have listed a portal Bioinformatics at Wageningen University and the Graduate School Experimental Plant Sciences as separate identities as well. Our position as a combined university and research institute is even more diluted by the fact that some of the research institutes are treated as separate distinct identities as well. To mention a few: Alterra-ILRI, CIDC (listed at two Web adresses) CRC, RIKILT also listed under two addresses, Wageningen Feed Processing Centre, Wageningen Institute of Animal Sciences (should actually be listed as a school). Wageningen NMR center, Wageningen UR and ISRIC also with two addresses.
There is plenty of room for criticism on the Spanish website and their selection of websites of Institutes. They also list redirected pages. Our university website(s) don't make matters any easier for these foreign investigators. There is for instance no sitemap available (would improve spidering of the website by search engines as well). Furthermore there are still too many seemingly independent websites that bear hardly any relation (in their domain) with Wageningen UR. Take for instance WIAS, VLAG or Plantenwetenschappen. They are one hunderd percent related to the University, but nothing in the web address (or layout) that shows for this relationship. There are whole legions of exotic websites such as Syscope, de Natuurkalender or IBL etc.…These websites should be used to improve the web presence of our University by making them integral part of the WUR domain.
What does it matter?
Well those Webometricians do their research. Fair enough, but that is not only academic inquisitiveness. Those are not mere theoretical exercises. Popular search engines work on exactly the same principles. Our web presence is in dire need for improvement. Look for instance at the traffic of three of our major domains. Wau.nl generates more traffic than Wageningenuniversiteit.nl. And we had a very expensive operation to move everything to a single web domain, with a brand new layout, and it was declared a success. Only when you look at the traffic at the previous link over a somewhat longer period you get some interesting graphs. Since the change in December 2005, total traffic plummeted, and the Wageningenuniversiteit.nl site never attracted really more traffic than the old wau.nl site. It is now more than a year after the whole operation and all kind of redirect pages are still afloat and attract a lot of traffic. Improving visibility and performance of a single wur domain seems badly needed.
But what really pleases me though, our library website generates 39% of the all WUR traffic. The library in the heart of the organization that is. WoW!
This is of course a laughing farmer with a very serious toothache.
Literature
Ortega, J. L., I. Aguillo, et al. (2007) Maps of the academic web in the European Higher Education Area - an exploration of visual web indicators. E-LIS http://eprints.rclis.org/archive/00005038/
Managers love these. That applies to the managers of our university as well. They really like the ESI rankings (albeit we're loosing some prestige) or those from Newsweek and THES. A new type of ranking is based on webometrics. Link analysis of websites that is. A group of researchers from Spain has been quite active in this field. They posted a preprint of their analysis from the European academic Web on E-Lis. Interesting reading.
In Europe, the UK and Germany are the two most inter-linked academic Web communities. The Netherlands sits somewhat closer to the UK. The UvA and VU are two of the better linked universities in the Netherlands. Wageningen UR is a midget somewhat distant from the center where the real action takes place. This is perhaps partly due to the older web address the researchers have used in their investigation. But looking closer at their Website Webometrics which is part of their ongoing research, reveals some real problems for the Web-identity of our university.
As main university website they have still listed our old domain, but next to that there is Larenstein (perhaps rightfully so). And they have listed a portal Bioinformatics at Wageningen University and the Graduate School Experimental Plant Sciences as separate identities as well. Our position as a combined university and research institute is even more diluted by the fact that some of the research institutes are treated as separate distinct identities as well. To mention a few: Alterra-ILRI, CIDC (listed at two Web adresses) CRC, RIKILT also listed under two addresses, Wageningen Feed Processing Centre, Wageningen Institute of Animal Sciences (should actually be listed as a school). Wageningen NMR center, Wageningen UR and ISRIC also with two addresses.
There is plenty of room for criticism on the Spanish website and their selection of websites of Institutes. They also list redirected pages. Our university website(s) don't make matters any easier for these foreign investigators. There is for instance no sitemap available (would improve spidering of the website by search engines as well). Furthermore there are still too many seemingly independent websites that bear hardly any relation (in their domain) with Wageningen UR. Take for instance WIAS, VLAG or Plantenwetenschappen. They are one hunderd percent related to the University, but nothing in the web address (or layout) that shows for this relationship. There are whole legions of exotic websites such as Syscope, de Natuurkalender or IBL etc.…These websites should be used to improve the web presence of our University by making them integral part of the WUR domain.
What does it matter?
Well those Webometricians do their research. Fair enough, but that is not only academic inquisitiveness. Those are not mere theoretical exercises. Popular search engines work on exactly the same principles. Our web presence is in dire need for improvement. Look for instance at the traffic of three of our major domains. Wau.nl generates more traffic than Wageningenuniversiteit.nl. And we had a very expensive operation to move everything to a single web domain, with a brand new layout, and it was declared a success. Only when you look at the traffic at the previous link over a somewhat longer period you get some interesting graphs. Since the change in December 2005, total traffic plummeted, and the Wageningenuniversiteit.nl site never attracted really more traffic than the old wau.nl site. It is now more than a year after the whole operation and all kind of redirect pages are still afloat and attract a lot of traffic. Improving visibility and performance of a single wur domain seems badly needed.
But what really pleases me though, our library website generates 39% of the all WUR traffic. The library in the heart of the organization that is. WoW!
This is of course a laughing farmer with a very serious toothache.
Literature
Ortega, J. L., I. Aguillo, et al. (2007) Maps of the academic web in the European Higher Education Area - an exploration of visual web indicators. E-LIS http://eprints.rclis.org/archive/00005038/
Labels: English, SEO, Universities, University rankings, Wageningen UR
21 november 2005
Teoma als David?
Net een leuk artikel over Teoma gelezen. Ik wist wel het een en ander over Teoma, zo prijs ik het altijd in de cursussen aan vanwege de verfijnopties die worden geboden en de link verzamelingen die onder her kopje ‘resources’ worden gepresenteerd. Verder realiseer ik me dat de index van Teoma kleiner is dan die van Google of Yahoo!, maar dat hoeft eigenlijk geen bezwaar te zijn. Door het artikel in “die Zeit” ben ik me pas gaan realiseren dat de relevance ranking van Teoma echt een stap verder gaat dan die van Google, en zoals ik het begrijp, in theorie beter zou moeten functioneren. Wat is het verschil?
Google heeft zijn PageRank, daar is ondertussen heel wat aan versleuteld, maar het idee was dat wanneer je iets zoekt, de populariteit van de webpagina (gemeten door het aantal links naar die pagina) een grote rol speelt in de relevance ranking van de zoekresultaten. Stel je zoekt naar [“elaeis guineensis”] dan zullen bij Google alle pagina’s boven komen drijven die deze zoektermen naast elkaar bevatten, maar vooral die pagina’s die veel gelinkt zijn. De laatste komen helemaal hoog. Van dit gegeven wordt dus volop gebruik gemaakt van de zoekmachine optimaliseerders. Die probeer o.a. door kunstmatige website structuren in het leven te roepen veel links te creëren naar pagina’s die ze optimaliseren, om de te optimaliseren pagina's op die manier hoog in de rankings te laten eindigen. Zoek maar eens op [“rode rozen”]
Bij Teoma gaan ze een stap verder dan bij Google. Daar wordt niet gekeken naar pagina’s met veel links. Daar wordt gekeken hoe de link structuur is van de pagina’s met de gevraagde zoektermen en halen daarvan de meest gelinkt pagina naar boven in de zoekresultaten. Op deze manier gaat het dus om link populariteit van alleen maar gelijkgestemden. De oplossing om dit te wiskundig ingewikkelde probleem op te lossen werd gevonden door Apostolos Gerasoulis een wiskunde professor van Rutgers University.
Nu begint Google steeds meer last te krijgen van zoekmachine optimaliseerders, net zoals Alta Vista dat eind jaren negentig had, en waardoor Google groot kon worden. Teoma lijkt een goed antwoord op de huidige zoekmachine spam te hebben gevonden met het algoritme voor de volgende generatie zoekmachines. Of ze inderdaad de droom van Gerasoulis gaan waar maken, zal alleen de toekomst uitwijzen.
Literatuur
Faller, H. (2005). Search engines : David vs. Goliath. Die Zeit Computer. http://www.zeit.de/online/2005/41/suchmaschinen_en?page=all.
Technorati tags: Teoma; Zoekmachine technology; Ranking
Literatuur
Faller, H. (2005). Search engines : David vs. Goliath. Die Zeit Computer. http://www.zeit.de/online/2005/41/suchmaschinen_en?page=all.
Technorati tags: Teoma; Zoekmachine technology; Ranking
