20 augustus 2009

 

Willen de echte partners van Google Books op staan?

Gisteren verbaasde ik me over de wat eenzijdige berichtgeving van zowel ZBdigitaal en de Informatie Professional over de aangekondigde mogelijke samenwerking van de beroemde Bibliothèque nationale de France en het bibliotheekprogramma van Google Books. En vanochtend repte de Volkskrant er ook al over.

Het is natuurlijk een hele stap dat de grootste (?) Franse bibliotheek misschien gaat samenwerken met het Google Books programma om de auteursrechtenvrije werken te gaan digitaliseren. Maar het is zeker geen unicum voor een Franse bibliotheek, laat staan een voornamelijk Franstalige bibliotheek. Iets meer dan een jaar geleden kondigde de gemeentebibliotheek van Lyon al aan dat die ging samenwerken met het Google Books programma. Het ging daarbij om zo'n half miljoen boeken. Daarnaast vermoed ik dat de universiteitsbibliotheek van Lausanne -ook een Google Books partner- een aanzienlijke collectie auteursrechtenvrije Franse werken in haar bezit heeft.

Toch werden deze eerdere Franse geörienteerde inbrengen in het Google Books programma niet opgemerkt door normaal toch scherpe bibliotheeknieuws volgers en brengers. Vanochtend kreeg ik pas door hoe dat kan gebeuren. Wanneer je in Nederland op zoek gaat naar de lijst van bibliotheken die deelnemmen in het Google Books programma kom je op een Nederlandstalige pagina uit: http://www.google.com/googlebooks/partners.html. In eerste instantie lastig om daar vanaf te komen en in Engelstalige equivalent te vinden. Even zoeken in Google en naar de cache pagina kijken bevestigde mij dat de Nederlandstalige lijst afweek van de Engelstalige lijst. Dit soort eigenwijs gedrag van Google leidt bij mijn tot flink wat irritatie. Waarom krijg ik met de .com url een Nederlandse pagina en niet de Engelse? Waarom beslist Google voor mij dat het beter is om de Nederlandse lijst voor de neus te houden en niet de Engelse? Ergernis alom dus. Google is best leuk, maar op zijn tijd bijzonder irritant.

Ik moet het anders aanpakken. Hoe moest ik Google ook alweer om de tuin leiden zodat ik op de echte Engelse lijst kon komen. Wat spelen met de URL levert uiteindelijk de volledige (?) lijst: http://www.google.com/intl/en/googlebooks/partners.html. Je vraagt je nu natuurlijk af welke taalversie misschien wel een nog langere lijst heeft. De Spaanse versie misschien, of toch de Franse?

Ach de lijstjes schelen slechts één bibliotheek. Maar het was nu juist die éne waar het om ging in dit geval. Nu is het alleen nog even afwachten of de uitgelekte deal inderdaad door gaat. C'est une affaire très delicate.

Labels: , , , , ,


11 december 2008

 

Kleurenplaten in Google Book Search

Flore médicale Door François Pierre Chaumeton, Ernestine Panckoucke, Jean Luois Marie Poiret, Pierre Jean François Turpin: "Geen tekst"
Vanmiddag verbaasde ik mijn over deze prachtige plaat in kleur uit de Google Book Search van Universidad Complutense de Madrid. Cacao is een oude liefde van me, vandaar.

Net ervoor las ik echter minder mooie berichten over GBS.

hattip: OA News, BusalBlog

Labels: ,


14 juli 2008

 

Google gaat boeken van de stadsbibliotheek Lyon digitaliseren

Volgens Netties wordt de stadsbibliotheek van Lyon de volgende Europeese partner in het Google Books programma. Hiermee komt het aantal deelnemede bibliotheken uit Europa op zeven. Het betreft volgens Netties alleen boeken die rechtenvrij zijn, maar dat is het geval met de meeste Europeese bibliotheek partners. Er worden ongeveer een half miljoen werken gedigitaliseerd.

Wanneer je naar de Europeese inbreng in het Google Books programma kijkt dan is de inbreng uit Spanje het grootst, met 2 bibliotheken (Madrid en Barcelona). Daarnaast zien we bibliotheken uit België (Gent), Duitsland (München), Engeland (Oxford) en Zwitserland (Lausanne)

Toen Google aankondigde de collectie uit de boekentoren te gaan digitaliseren vroeg ik me al af welke de eerste Nederlandse bibliotheek zou zijn die zich aan gaat sluiten bij het Google Books programma. Die vraag is tot op heden nog onbeantwoord gebleven.

Labels: , ,


21 maart 2008

 

Van de GGC naar WorldCat

Sinds de aankondiging van de Google Books API zijn wij in Wageningen (en Leiden) heel wat wijzer geworden over de relatie tussen de GGC en WorldCat. Peter had het voortouw genomen om met OCLC verder te onderzoeken hoe we onze pre-ISBN boeken naar de Google Books API konden linken. Hij heeft over het uiteindelijke resultaat op zijn blog verslag gedaan.

Toch is er nog een detail in de uitwisseling met OCLC dat niet onvermeld mag blijven. Iedereen kan in feite zoeken met een PICA productie nummer (PPN) in Worldcat. De syntax is supereenvoudig.

http://worldcat.org/search?q=NLGGC+ppn

Bijvoorbeeld:

http://worldcat.org/search?q=NLGGC+29353490X

Is dit nuttig zullen sommigen zich afvragen?
Stel je nu eens voor dat je als bibliotheek wel een boek in bezit hebt, maar alle exemplaren zijn uitgeleend. Zou het dan niet handig zijn dat je op basis van worldcat toont in welke dichtsbijzijnde bibliotheek er ook een exemplaar aanwezig is. Ik ben altijd onder de indruk van die sortering op afstand in WorldCat. Ik klik altijd met plezier naar de verste bibliotheek. Gewoon omdat het zo'n mooie sortering is.

Ondertussen bouwen ze in Leiden voor ons een tooltje waar wij een PPN tegenaan kunnen gooien dat een OCLC nummer teruggeeft. Dat OCLC nummer stoppen wij vervolgens weer in de Google Books API, die dan op zijn beurt weer een plaatje, fulltext of partial fulltext teruggeeft. Vooral met de oudere boeken uit onze collectie hopen we natuurlijk op een aanzienlijke toename van succesvolle fulltext links.

Dit zijn nu eens kanten van Web 2.0 voor bibliotheken die naar mijn smaak te vaak onderbelicht blijven. Je haalt iets uit het een, stop het in het ander en krijgt er weer wat voor terug, allemaal om de gebruiker ten dienste te zijn. Allemaal mogelijk omdat we op grote hopen gestructureerde metadat zitten te zitten. Nu is de kans aangebroken om daar gebruik van te maken.

Maar wanneer we een boek in onze catalogus hebben dan hebben we toch het papieren exemplaar riep iemand nog, onze opwinding niet begrijpend. Helaas staat ons papieren exemplaar veilig in het magazijn, en kost een kwartier om op te duikelen. Onze gebruikers zitten elders op de campus, en willen snel even wat checken. Voor dat soort gebruik en gebruikers bouw je dit soort diensten.

Het verhaal gaat door
Worldcat is een dienst die zich steeds verder ontwikkeld. Het mooie van die ontwikkeling is dat bibliotheken overal ter wereld daar aan meewerken en OCLC faciliteert dat proces. Ik zie WorldCat zich verder ontwikkelen tot een resource waar we straks meer metadata van gaan harvesten. In het hierboeven omschreven geval gaat het nog om een nummer uit WorldCat om de FTXT bij Google Books op te kunnen halen. Straks gaan we de samenvattingen en inhoudsopgave vanuit WorldCat ophalen. Dat zijn niet de standaard metadata waar we ons in de bibliografische controle mee bezig houden, maar in de praktijk wel uiterst nuttig blijken. Een stap verder zijn natuurlijk de recensies en trefwoorden (tags) die toegekend worden door allerlei gebruikers. Waar ook ter wereld! Nu kan dat al bij LibraryThing, maar voor een toegepaste wetenschappelijke bibliotheek zie ik meer heil in WorldCat voor dit soort dingen. Dit is eigenlijk wat Robin Murray van OCLC al een tijdje loopt te verkondigen. We moeten dan alleen verder gaan kijken hoe we onze additionele gegevens -afgezien van de exemplaar gegevens- weer kunnen terugploegen in WorldCat. De GGC is daar op dit moment nog niet op berekend maar moet volgens mij evolueren tot een soort tool om die lokale data te globaliseren.

We gaan vooruit met dit soort ontwikkelingen. Het is slechts stapje voor stapje, maar de neuzen lijken de goede kant op te staan. Mogen we het bibliotheek 2.0 noemen?

Labels: , , , ,


17 maart 2008

 

Google Books in WUR catalogus

De toepassingen van de Google Books API schieten links en rechts uit de grond. Via het commentaar liet Jaap van de Geer mij weten dat ze bij DOK ook al bezig zijn. Onze applicatieontwikkelaars konden het ook niet nalaten om er over het weekend mee aan de slag te gaan.

Vanochtend kreeg ik al een mailtje van Peter waarin hij schreef:

"Wanneer er van een monografie een beschrijving is dan komt er een link met de tekst: google book info, google partial view of google full view, afhankelijk van de service die Google biedt. Indien er bij amazon geen cover is te vinden en bij Google wel, dan wordt die getoond (Amazon heeft mooiere covers) Ik heb het quick en dirty in de productieomgeving gedaan :o) Is er in twee tellen ook weer uit."



Hierbij een voorbeeld. Nu we de ISBN's links snel geimplementeerd hebben, nu op naar de boeken zonder ISBN.

Dus ook hier Google books rocks!

Labels:


13 maart 2008

 

Google laat een droom in vervulling gaan, nu Pica nog

Tijdens een presentatie voor de UB Utrecht, daagde ik de Utrechters eens uit om vanuit de catalogus naar Google Books te linken voor materiaal dat ze allang in hun catalogus hebben. Met een beetje Google hacking was dat wel mogelijk. Vandaag lanceerde Google Books een heuse API om een en ander te vergemakkelijken.

Voor onze catalogus in Wageningen had ik er ook al eens over nagedacht. Het kan voor de boeken gepubliceerd sinds 1965 (?) of daaromtrent prima. Daarvoor hebbben we ISBN's om dat mogelijk te maken. Maar het meeste van dat recente materiaal is slechts als limited preview beschikbaar. Voor mij geen reden om die droom na te gaan jagen. Het interessante materiaal voor zo'n exercitie zijn onze oudere boeken dat we op deze manier full text zouden kunnen linken. Nu doen we dat vaak handmatig. Op basis van onze rijke metadata zou dat toch beter moeten kunnen?

Wel? Niet helemaal. Je kunt volgens de Google books API het makkelijkst linken via het ISBN, het OCLC nummer (via dat nummer linkt Google weer naar worldcat, had ik al eens uitgevogeld) of LCCN. Voor het oudere materiaal in onze collectie is het OCLC nummer natuurlijk veruit het interessants. Al ons materiaal is immers on the fly beschikbaar in OCLC's Worldcat. Geen probleem dus?

We hebben echter wel een klein probleempje. En Pica kan ons helpen om dat op te lossen. Wij hebben natuurlijk keurig onze eigen unieke catalogusnummers voor alle records. We registreren de PPN (Pica Productie Nummer) maar missen de OCLC nummers. Ik neem aan dat er in Leiden ergens wel een sleuteltabel ligt die dit bruggetje voor ons mogelijk maakt. Maar het illustreert wel, dat we allerlhande metadata registreren. Aantal bladzijden, hoogte van het boek, alleen dat OCLC nummer dat we nu echt nodig hebben, net niet.

Pica ik neem aan dat jullie binnenkort een telefoontje uit Wageningen kunnnen verwachten. Met het verzoek om een complete OCLC-PPN tabel. Dit nieuwe speeltje is te mooi om te laten lopen. In een klap duizenden relevante fulltext links erbij! Geweldig! Dat is bibliotheek 2.0 op volle kracht. Slim gebruik van metadata en weg van die statische catalogus.

Labels: , ,


06 januari 2008

 

Retrospectief over Google books en Open Content Alliance

Op zich was het afgelopen jaar redelijk rustig op het gebied van Google's zoeken naar boeken en Google's bibliotheek programma. Zo ook bij de andere partij, OCA. Natuurlijk het aantal bibliotheken dat bronnen voor digitalisering ter beschikking stelt zowel bij Google als bij OCA toegenomen. Afgelopen jaar is de eerste bibliotheek met een substantiële Nederlandstalige collectie –Gent– toegetreden tot het bibliothekenprogramma van Google. De groei van het aantal OCA partners lijkt minder onstuimig. Althans het trekt in elk geval minder de aandacht zo lijkt het.

Helemaal stil was het dus niet op het gebied van de inhoudelijke ontwikkeling.
Afgelopen jaar kreeg het Google bibliotheek programma soms wel zware kritiek te verduren. Walt Crawford geeft in het laatste issue van Cites & Insights een mooi retrospectief over alle ontwikkelingen rond deze digitaliseringsprogramma's, ook de oorverdovende stilte in de rechtszalen passeren de revue. Zijn stelling wat betreft de inhoud is dat zowel GBS en OCA gezien moeten worden als 'discovery' tool. Het gaat er volgens hem vooral om, om relevante boeken te vinden. Bibliotheken zouden daarom hartstikke blij moeten zijn met GBS en OCA. Met de 'find in a library' knop kom je via worldcat vervolgens bij de bibliotheek om de hoe terecht voor een fysiek exemplaar. Mooi toch?

Kritiek over de kwaliteit van de scans en de herkende teksten vind hij minder relevant. Toch kan ik hem daar niet helemaal gelijk in geven. Natuurlijk zijn GBS en OCA in de eerste plaats hele bijzondere bronnen om relevante boeken te vinden, maar ik mag toch wel verwachten dat je auteursrechten vrije boeken redelijkerwijs zou moeten kunnen downloaden en fatsoenlijk op een e-book reader kunnen lezen. Zeker nu er zo actief met e-book readers geëxperimenteerd wordt zoals bij ecobibl en vakblog zijn dit bronnen die niet over moeten worden geslagen in de testfase.
Het retrospectief raad ik iedereen aan die geïnteresseerd in deze grote digitaliseringsprojecten. Ben benieuwd of er dit jaar een Nederlandse universiteitsbibliotheek zich aansluit bij een van de consortia. Utrecht? Leiden? Of wordt het Amsterdam? We zullen zien.

Literatuur
Crawford, W. (2008). Perspective: Discovering books, an OCA and GBS retrospective. Cites & Insights: Crawford at Large 8(1): 6-24. http://citesandinsights.info/civ8i1.pdf.

Labels: , ,


24 oktober 2007

 

Commerciële diensten en ideële instellingen

Toen Google books –in december 2004 nog Google Print geheten- zijn programma voor bibliotheken lanceerde viel de bibliotheekwereld van zijn stoel van verbazing. Tumult alom. Uitgevers en schrijvers liepen te hoop, maar ik denk dat heel veel bibliotheken wel een beetje jaloers waren op dit project. Stel je voor, je hele magazijn digitaal beschikbaar voor weinig of geen geld. Sommige directeuren zagen de bezuinigingen op het magazijn of personeel al voor zich.
De Google Books olievlek breidde zich verder uit. Ondertussen zijn er ongeveer 25 bibliotheken die meedoen. Daarnaast kwam de oppositie. Microsoft, ook met diepe zakken, kwam en de Open Content Alliance kwam als belangrijk alternatief, maar zij hebben niet zoveel geld.
In het imperium van de Google Books libraries kwamen in maart de eerste barstjes toen Peter Brantley, de toenmalige directeur van de California Digital Library, zijn eerste twijfels uitte over de voorwaarden waaronder Google de collecties mocht scannen. In de New York Times van twee dagen terug, staat een lang verhaal over nog meer bibliotheken die niet konden leven met de voorwaarden van Google of Microsoft. Het grootste probleem is dat van het monopoly op het beschikbaar maken van de digitale versie. Het OCA project van Brewster Kahle kent dit soort restrictieve voorwaarden trouwens niet, maar daar kost het scannen van een boek ongeveer 10 US$ cent per pagina, of ongeveer 30 US$ per boek. Een magazijn met een slordige miljoen boeken kost zo een aardig vermogen om te digitaliseren.
Projecten als de Worlddigitallibrary, dat vorige week woensdag een eerste prototype afleverde, zijn vanwege de restricties zoals bovengenoemd dan ook helemaal niet gebaat bij grote commerciële boekscanprojecten. Het is in dat licht dan ook verbazingwekkend dat de British Library zo’n grote collectie door Microsoft laat scannen. Het zijn toch vooral de grote nationale bibliotheken die in projecten als the european library project of worlddigitallibrary de digitale content moeten leveren.
Wanneer Google aanbiedt ons hele bezit te gaan scannen? Dan zou ik daar nog eens een goede nacht over moeten slapen.

Labels: , , ,


24 mei 2007

 

Google books gaat naar Gent

Laurent Meese schreef net dat Google Books de bibliotheek van Gent gaat digitaliseren. Dat wordt dan de eerste substantieele Nederlandstalige collectie in Google Books. Eric Sieverts opperde het idee onlangs voor de UBU. Gent is ze voor.
Welke (echte) Nederlandse bibliotheek zal volgen?

Labels: ,


07 maart 2007

 

Google books, some regrets

Peter Brantley has a very interesting post sharing some reflections on the Google book scanning deals that have been made with the participating libraries. From what I learned so far is that Google dealt with the libraries on a one to one basis, and they were sworn to secrecy. They all got their individual deals, not knowing each other terms.
Peter, the previous Director of Digital Library Technologies of CDL and current Director of the Digital Library Federation, shares some of his doubts about the deals that have been struck so far. And the way it has all been established.
Interesting reading.

Hattip: Lorcan Dempsey

Labels: , , , ,


This page is powered by Blogger. Isn't yours?