25 januari 2009

 

Een voordeel van je catalogus in Google

De afgelopen tijd hebben we behoorlijk ons best gedaan onze catalogus en documentatiebestanden zo goed mogelijk door Google geïndexeerd te krijgen. Nog lang niet alles zit er in –daar kwam ik achter voordat ik deze post ging schrijven- maar wel behoorlijk wat. Ruim 781.000 items. Voorzover dit soort cijfers wat zeggen, maar voorwaar een hele hoop. Het is in elk geval heel veel meer dan ik voor andere Nederlandse bibliotheekwebsites vind.

Onze rationale hierachter is dat onze gebruikers de grote G nu eenmaal graag gebruiken. En omdat wij moeten gaan waar onze gebruikers gaan, is het daarom logisch om zoveel mogelijk van onze catalogus en documentatiebestanden in de Google index te krijgen. Een voorbeeld van dat belang wordt onderstreept door de gebruiksstatistieken van een –prijzig– tijdschriftenpakket waarin keurig vermeld waar de gebruikers vandaan komen. Voor dat bewuste pakket staat al jarenlang steevast bekend bij ons dat tussen de 75-80% van de bezoekers via Google binnenkomen, en slechts voor de overige 20-25% via onze eigen digitale bibliotheek bronnen. De desbetreffende tijdschriften zitten op titel en abstract niveau al jaar en dag in Google –maar de volledigheid heb ik nog nooit gecheckt– en het gebruik van de artikelen is prima. Althans, wanneer we kijken naar de kosten per download gerekend over het totale pakket. Dus wie zou er mopperen?

Een klein stemmetje zegt me, dat wanneer alle uitgevers zouden besluiten dat ze hun artikelen op titel en abstract niveau door de gewone Google laten indexeren, dat we dan wel kunnen ophouden met secundaire bronnen aan te bieden in de digitale bibliotheek voor resource discovery. Oftewel, we een begin kunnen maken met het afbreken van die zorgvuldig gebouwde digitale bibliotheek.

Maar afgezien van dit relevante bezwaar en gevaar, bieden wij dus zoveel mogelijk van onze eigen bronnen aan in Google. En deze week hadden we er een groot voordeel mee. Onze eigen systeem had afgelopen week veel last van storingen. Website, catalogus, uitleningen van alles dat er niet werkte. Maar gelukkig beschikten we wel over de Google cache.

Een boektitel opzoeken in Google, met site:library.wur.nl. In de Google cache kijken. Magazijnnummer op een briefje schrijven. Briefje in de boekenlift, en het boek kon opgehaald worden. Uitlening op papier noteren, en zo kon ook de fysieke bibliotheek tijdens de storingen toch nog een beetje doorwerken. Een jaar geleden had digicmb al eens op de toolbars en netvibes gewezen als bakcup voor de bibliotheeksystemen, de Google cache hoort daar in ons geval dus ook bij.

Nu maar hopen dat komende week de storingen van de lucht zijn. Dan kunnen wij eens nadenken over mogelijke backupsystemen, voor het geval ons systeem weer eens kuren vertoont.

Trouwens, nu wel zoveel in de Google index hebben zitten, begint de echte uitdaging pas. Hoe zorg je ervoor dat die 781.000 biblioteek records ook in Google bij de juiste zoekvragen naar boven komen? Hoe optimaliseer je 781.000 "dunne" metadata items voor zoekmachines. Daar hebben we nog een hele hoop te leren. SEO bedrijven trouwens ook.

Labels: , , , ,


This page is powered by Blogger. Isn't yours?