16 november 2009

 

Instant satisfaction deel II


Een week geleden blogde ik al eens over instant satisfaction voor gebruikers van de catalogus. Volgens EricSieverts was dat nog ver weg, maar volgens mij kwam het wel steeds dichter bij. Alleen vertrouwde ik toen de cijfers van ons catalogus systeem niet zo -dat blijkt inderdaad wat technische oorzaken te hebben. Daarom heb ik het eens overgedaan, niet via het formulier, maar met wat URL manipulatie. Slechts op die manier kun je het juiste resultaat krijgen.

Wat blijkt we zitten al op een 70% elektronisch items in de catalogus. Je zit nog meer in de grafiek natuurlijk. Het aantal items dat we per publicatie jaar collectioneren nam in de periode 1995-2004 drastisch af. Komt ondermeer omdat we in de loop der tijd gestopt zijn met allerhande ruilabonnementen. Daarnaast zijn we ook minder geneigd om dingen die vroeger op papier binnenkwamen nu elektronisch te collectioneren.

De invloed van de Springer deal, waarbij we alle Springer boeken die uitkomen sinds 2005 per jaar kopen. Het vakgebied doet daar niets aan af, is het aantal titels weer behoorlijk gestegen, evenals het aantal elektronische items. Toch zet de groei in het aantal elektronische items ondanks de Springer deal onverdroten door.

Instant satisfaction? We zijn er bijna voor de jongste jaren. Nu rest ons alleen dat enorme magazijn te digitaliseren.

Labels: , , ,


09 november 2009

 

Instant satisfaction is ook in de catalogus om de hoek



Instant satisfaction in de catalogus, het geluk van ontdekken en vrijwel gelijk in handen hebben van dat wat je net ontdekte, is volgens Eric Sieverts zijn laatste column in de IP nog ver weg. Volgens Sieverts kunnen catalogi nooit tegen de zoekmachines -lees Google- op. Hij schrijft "Daar kunnen onze klassieke catalogi nooit tegenop, wat voor mooie trucjes men ook bedenkt om mensen ietsje sneller aan boeken of papieren copietjes te helpen."

Toch ben ik minder pessimistisch dan Eric. Ik heb eens in onze catalogus gekeken en zag we we over de laatste iets in de orde van 60,000 items per jaar aan de catalogus toevoegen. Ik was een beetje verbaasd over dit hoge aantal. Het neemt duidelijk af over de laatste jaren.

Daarnaast heb ik gekeken naar het aantal elektronische items dat we per publicatiejaar toegevoegd hebben. Dat stijgt gestaag. Van een kleine duizend items in 1995 tot ruim 7,500 voor 2008. Het sprongetje vanaf 2005 is zeer waarschijnlijk volledig op het conto van de Springer boeken die we elektronisch collectioneren toe te schrijven. Dat soort modellen gaan natuurlijk steeds meer komen.

Het percentage elektronisch fulltext items in de catalogus stijgt dus van minder dan een procent in 1995 naar 15% in 2008. We zijn er nog lang niet, maar ik denk dat we er wel degelijk naar toe groeien.

Waarschijnlijk helpt het wanneer we de scheiding van elektronische en papieren zoekhulpmiddelen eens overboord zetten, en we creatiever omgaan met het harvesten van elektronische bestanden zoals Internet Archive digitale teksten en Google Books en dat matchen met ons papieren bezit.

Ben trouwens wel heel benieuwd of die 60,000 wel correct is. Misschien wordt dit wel vervolgd.

Labels: , , ,


25 januari 2009

 

Een voordeel van je catalogus in Google

De afgelopen tijd hebben we behoorlijk ons best gedaan onze catalogus en documentatiebestanden zo goed mogelijk door Google geïndexeerd te krijgen. Nog lang niet alles zit er in –daar kwam ik achter voordat ik deze post ging schrijven- maar wel behoorlijk wat. Ruim 781.000 items. Voorzover dit soort cijfers wat zeggen, maar voorwaar een hele hoop. Het is in elk geval heel veel meer dan ik voor andere Nederlandse bibliotheekwebsites vind.

Onze rationale hierachter is dat onze gebruikers de grote G nu eenmaal graag gebruiken. En omdat wij moeten gaan waar onze gebruikers gaan, is het daarom logisch om zoveel mogelijk van onze catalogus en documentatiebestanden in de Google index te krijgen. Een voorbeeld van dat belang wordt onderstreept door de gebruiksstatistieken van een –prijzig– tijdschriftenpakket waarin keurig vermeld waar de gebruikers vandaan komen. Voor dat bewuste pakket staat al jarenlang steevast bekend bij ons dat tussen de 75-80% van de bezoekers via Google binnenkomen, en slechts voor de overige 20-25% via onze eigen digitale bibliotheek bronnen. De desbetreffende tijdschriften zitten op titel en abstract niveau al jaar en dag in Google –maar de volledigheid heb ik nog nooit gecheckt– en het gebruik van de artikelen is prima. Althans, wanneer we kijken naar de kosten per download gerekend over het totale pakket. Dus wie zou er mopperen?

Een klein stemmetje zegt me, dat wanneer alle uitgevers zouden besluiten dat ze hun artikelen op titel en abstract niveau door de gewone Google laten indexeren, dat we dan wel kunnen ophouden met secundaire bronnen aan te bieden in de digitale bibliotheek voor resource discovery. Oftewel, we een begin kunnen maken met het afbreken van die zorgvuldig gebouwde digitale bibliotheek.

Maar afgezien van dit relevante bezwaar en gevaar, bieden wij dus zoveel mogelijk van onze eigen bronnen aan in Google. En deze week hadden we er een groot voordeel mee. Onze eigen systeem had afgelopen week veel last van storingen. Website, catalogus, uitleningen van alles dat er niet werkte. Maar gelukkig beschikten we wel over de Google cache.

Een boektitel opzoeken in Google, met site:library.wur.nl. In de Google cache kijken. Magazijnnummer op een briefje schrijven. Briefje in de boekenlift, en het boek kon opgehaald worden. Uitlening op papier noteren, en zo kon ook de fysieke bibliotheek tijdens de storingen toch nog een beetje doorwerken. Een jaar geleden had digicmb al eens op de toolbars en netvibes gewezen als bakcup voor de bibliotheeksystemen, de Google cache hoort daar in ons geval dus ook bij.

Nu maar hopen dat komende week de storingen van de lucht zijn. Dan kunnen wij eens nadenken over mogelijke backupsystemen, voor het geval ons systeem weer eens kuren vertoont.

Trouwens, nu wel zoveel in de Google index hebben zitten, begint de echte uitdaging pas. Hoe zorg je ervoor dat die 781.000 biblioteek records ook in Google bij de juiste zoekvragen naar boven komen? Hoe optimaliseer je 781.000 "dunne" metadata items voor zoekmachines. Daar hebben we nog een hele hoop te leren. SEO bedrijven trouwens ook.

Labels: , , , ,


01 juni 2008

 

Over het digitaliseren van de papieren bibliotheek

Vorige week gaf Josje Calff een goede lezing over het digitaliseren de papieren bibliotheek. Ze stelde daarbij twee vragen die ze deels beantwoorde.
  1. Is elektronische opslag goedkoper van papieren opslag -even afgezien van de duurzaamheid die bij digitale opslag nog niet bewezen is.
  2. Moeten we selecteren bij het digitaliseren of moeten we gewoon van linksboven in de kast naar rechtsonder werken.
Direct na afloop van de lezing wees Marc van de Berg al op het Life project van de British Library dat antwoord poogt te geven op de eerste vraag.

Een dag daarvoor had een beetje adjunct wat cijfers opgerakeld en opgepoetst over aantallen boeken die momenteel al gedigitaliseerd zijn. Zijn conclusie was dat ongeveer 2% van de titels in Worldcat digitaal beschikbaar is er dat er daarom "Er is en blijft vooralsnog een ‘tremendous scope’ voor digitaliseringsprojecten. En voordat “the world’s information” volledig digitaal beschikbaar is zijn we dus ook nog wel een flink aantal jaren verder."

Labels: ,


27 mei 2008

 

Josje Calff: De papierloze bibliotheek?

Josje Calff, gaat in op het proces van digitaliseren van bibliotheken.

Naast de fysieke plaatselijke bibliotheek pleit Josje voor een Nederlandse digitale bibliotheek. Ze illustreert dit aan de hand van de site van bibliotheek.nl, waar je wel naar bibliotheken kunt zoeken, maar niet naar digitale content. Eigenlijk van de gekke dat die nationale digitale bibliotheek niet van de grond komt. En waarom niet ook een nationale wetenschappelijk digitale bibliotheek daar bij.

Een prangende vraag van Josje is wie er wat digitaliseert. Josje lijkt het standpunt in te nemen dat je dubbel digitaliseren moet voorkomen. Iets waar Google zich in de praktijk niets van lijkt aan te trekken. Zie pleit vooral voor een goede coördinatie om dubbel werk te voorkomen. Regie, controle en coördinatie. Heerlijke beleidsonderwerpen. Niet helemaal mijn straatje als het maar gaat gebeuren.

Vervangt het digitaal het papier? Er wordt vooral gewezen op de mogelijke doorbraak van de e-boek reader. Vervolgens gaat ze in op de kosten aspecten van papier versus digitale opslag. Helaas lijkt het haar onmogelijk omdat op dit moment met goede cijfers te ondersteunen.

Labels: , ,


27 januari 2008

 

Een digitale bibliotheek inrichten met weinig middelen

Een tijdje terug had ik een gesprek met iemand die in zijn eentje de informatiedienstverlening voor zijn organistie moest verzorgen. Vanuit een klassieke bedrijfsbibliotheek voorziening gegroeid naar een mediatheek en nu de sprong willen maken naar een digitale bibliotheek. Een lovenswaardig streven, maar het prijskaartje dat er aan mocht hangen was eigenlijk alleen zijn tijd. Geen andere kosten. Wanneer wordt de informatievoorziening nu eens serieus genomen vroeg ik me onderwijl af.

Waar te beginnen?

Tot nu toe nooit een catalogus gebruikt om boeken in te registreren, laat staan uitleningen bij te houden? LibraryThing lijkt dan een goede oplossing. Door je boeken te registreren kan je in elk geval al je gebruikers laten weten welke boeken er binnen de organisatie aanwezig zijn. Kost welliswaar een beetje. Maar US$ 10,- is natuurlijk een koopje voor een catalogussysteem. Lijkt me dat je door middel van tags ook wat kunt afspreken over locatie van de boeken binnen je organisatie. Open source oplossingen als Koha of Scriblio zijn natuurlijk ook voorhanden, maar dat vergt behoorlijk wat meer technische ondersteuning.

Een nuttige verzameling internetbronnen vastleggen voor je gebruikers is natuurlijk ontzettend waardevol. Dat doe je natuurlijk met een social bookmarking site. Del.icio.us is natuurlijk de eerste die op komt in de gedachte maar misschien is een meer wetenschapplijk georienteerde social bookmarking site in het gegeven geval meer toepasselijk.

Vervolgens zou ik een groot aantal relevante websites en databases op het vakgebied opnemen in een Google Custom Search Engine zodat ik voor mijn gebruikers een bovengemiddelde zoekmachine ter beschikking heb.
Daarnaast zou ik op zoek gaan naar zeer relevante RSS feeds op het vagebied van de organisatie. Dit zou ik aanvullen met RSS feeds van Google news zoekacties en Google Blog zoekacties. Die zoekacties moeten natuurlijk wel redelijk specifiek zijn zodat de meeste ruis er uit blijft. Concentreren op precisie en wat minder op recall. Om dat ook een paar heel algemenen bronnen te ontsluiten zou ik ook gaan spelen met Yahoo pipes, om een paar goede filters voor de organisatie te maken (Hier nog een goede inleiding).

Ik zou een en ander vervolgens bij elkaar brengen in een Netvibes Universe. Liefst natuurlijk meteen lekker pittig. Gember dus.

Nu nog voor je eigen eenpitter status een oplossing zoeken. Meteen aansluiten bij de Bibliotheek2.0 Ning en de nog niet bestaande groep voor eenpitters oprichten.

Er zijn vast meer suggesties (laat het weten, post een comment). Maar hiermee zou ik starten. Voorlopig genoeg te doen.

Labels: , ,


This page is powered by Blogger. Isn't yours?