20 augustus 2009
Willen de echte partners van Google Books op staan?
Het is natuurlijk een hele stap dat de grootste (?) Franse bibliotheek misschien gaat samenwerken met het Google Books programma om de auteursrechtenvrije werken te gaan digitaliseren. Maar het is zeker geen unicum voor een Franse bibliotheek, laat staan een voornamelijk Franstalige bibliotheek. Iets meer dan een jaar geleden kondigde de gemeentebibliotheek van Lyon al aan dat die ging samenwerken met het Google Books programma. Het ging daarbij om zo'n half miljoen boeken. Daarnaast vermoed ik dat de universiteitsbibliotheek van Lausanne -ook een Google Books partner- een aanzienlijke collectie auteursrechtenvrije Franse werken in haar bezit heeft.
Toch werden deze eerdere Franse geörienteerde inbrengen in het Google Books programma niet opgemerkt door normaal toch scherpe bibliotheeknieuws volgers en brengers. Vanochtend kreeg ik pas door hoe dat kan gebeuren. Wanneer je in Nederland op zoek gaat naar de lijst van bibliotheken die deelnemmen in het Google Books programma kom je op een Nederlandstalige pagina uit: http://www.google.com/googlebooks/partners.html. In eerste instantie lastig om daar vanaf te komen en in Engelstalige equivalent te vinden. Even zoeken in Google en naar de cache pagina kijken bevestigde mij dat de Nederlandstalige lijst afweek van de Engelstalige lijst. Dit soort eigenwijs gedrag van Google leidt bij mijn tot flink wat irritatie. Waarom krijg ik met de .com url een Nederlandse pagina en niet de Engelse? Waarom beslist Google voor mij dat het beter is om de Nederlandse lijst voor de neus te houden en niet de Engelse? Ergernis alom dus. Google is best leuk, maar op zijn tijd bijzonder irritant.
Ach de lijstjes schelen slechts één bibliotheek. Maar het was nu juist die éne waar het om ging in dit geval. Nu is het alleen nog even afwachten of de uitgelekte deal inderdaad door gaat. C'est une affaire très delicate.
Labels: BNF, Digitaliseren, GBS, Google books, Laussanne, Lyon
11 december 2008
Kleurenplaten in Google Book Search
Vanmiddag verbaasde ik mijn over deze prachtige plaat in kleur uit de Google Book Search van Universidad Complutense de Madrid. Cacao is een oude liefde van me, vandaar.
Net ervoor las ik echter minder mooie berichten over GBS.
hattip: OA News, BusalBlog
Labels: Google books, Illustraties
14 juli 2008
Google gaat boeken van de stadsbibliotheek Lyon digitaliseren
Wanneer je naar de Europeese inbreng in het Google Books programma kijkt dan is de inbreng uit Spanje het grootst, met 2 bibliotheken (Madrid en Barcelona). Daarnaast zien we bibliotheken uit België (Gent), Duitsland (München), Engeland (Oxford) en Zwitserland (Lausanne)
Toen Google aankondigde de collectie uit de boekentoren te gaan digitaliseren vroeg ik me al af welke de eerste Nederlandse bibliotheek zou zijn die zich aan gaat sluiten bij het Google Books programma. Die vraag is tot op heden nog onbeantwoord gebleven.
Labels: Europa, Google books, Lyon
21 maart 2008
Van de GGC naar WorldCat
Toch is er nog een detail in de uitwisseling met OCLC dat niet onvermeld mag blijven. Iedereen kan in feite zoeken met een PICA productie nummer (PPN) in Worldcat. De syntax is supereenvoudig.
http://worldcat.org/search?q=NLGGC+ppn
Bijvoorbeeld:
http://worldcat.org/search?q=NLGGC+29353490X
Is dit nuttig zullen sommigen zich afvragen?
Stel je nu eens voor dat je als bibliotheek wel een boek in bezit hebt, maar alle exemplaren zijn uitgeleend. Zou het dan niet handig zijn dat je op basis van worldcat toont in welke dichtsbijzijnde bibliotheek er ook een exemplaar aanwezig is. Ik ben altijd onder de indruk van die sortering op afstand in WorldCat. Ik klik altijd met plezier naar de verste bibliotheek. Gewoon omdat het zo'n mooie sortering is.
Ondertussen bouwen ze in Leiden voor ons een tooltje waar wij een PPN tegenaan kunnen gooien dat een OCLC nummer teruggeeft. Dat OCLC nummer stoppen wij vervolgens weer in de Google Books API, die dan op zijn beurt weer een plaatje, fulltext of partial fulltext teruggeeft. Vooral met de oudere boeken uit onze collectie hopen we natuurlijk op een aanzienlijke toename van succesvolle fulltext links.
Dit zijn nu eens kanten van Web 2.0 voor bibliotheken die naar mijn smaak te vaak onderbelicht blijven. Je haalt iets uit het een, stop het in het ander en krijgt er weer wat voor terug, allemaal om de gebruiker ten dienste te zijn. Allemaal mogelijk omdat we op grote hopen gestructureerde metadat zitten te zitten. Nu is de kans aangebroken om daar gebruik van te maken.
Maar wanneer we een boek in onze catalogus hebben dan hebben we toch het papieren exemplaar riep iemand nog, onze opwinding niet begrijpend. Helaas staat ons papieren exemplaar veilig in het magazijn, en kost een kwartier om op te duikelen. Onze gebruikers zitten elders op de campus, en willen snel even wat checken. Voor dat soort gebruik en gebruikers bouw je dit soort diensten.
Het verhaal gaat door
Worldcat is een dienst die zich steeds verder ontwikkeld. Het mooie van die ontwikkeling is dat bibliotheken overal ter wereld daar aan meewerken en OCLC faciliteert dat proces. Ik zie WorldCat zich verder ontwikkelen tot een resource waar we straks meer metadata van gaan harvesten. In het hierboeven omschreven geval gaat het nog om een nummer uit WorldCat om de FTXT bij Google Books op te kunnen halen. Straks gaan we de samenvattingen en inhoudsopgave vanuit WorldCat ophalen. Dat zijn niet de standaard metadata waar we ons in de bibliografische controle mee bezig houden, maar in de praktijk wel uiterst nuttig blijken. Een stap verder zijn natuurlijk de recensies en trefwoorden (tags) die toegekend worden door allerlei gebruikers. Waar ook ter wereld! Nu kan dat al bij LibraryThing, maar voor een toegepaste wetenschappelijke bibliotheek zie ik meer heil in WorldCat voor dit soort dingen. Dit is eigenlijk wat Robin Murray van OCLC al een tijdje loopt te verkondigen. We moeten dan alleen verder gaan kijken hoe we onze additionele gegevens -afgezien van de exemplaar gegevens- weer kunnen terugploegen in WorldCat. De GGC is daar op dit moment nog niet op berekend maar moet volgens mij evolueren tot een soort tool om die lokale data te globaliseren.
We gaan vooruit met dit soort ontwikkelingen. Het is slechts stapje voor stapje, maar de neuzen lijken de goede kant op te staan. Mogen we het bibliotheek 2.0 noemen?
Labels: Bibliotheek 2.0, GGC, Google books, OCLC, Web 2.0
17 maart 2008
Google Books in WUR catalogus
Vanochtend kreeg ik al een mailtje van Peter waarin hij schreef:
"Wanneer er van een monografie een beschrijving is dan komt er een link met de tekst: google book info, google partial view of google full view, afhankelijk van de service die Google biedt. Indien er bij amazon geen cover is te vinden en bij Google wel, dan wordt die getoond (Amazon heeft mooiere covers) Ik heb het quick en dirty in de productieomgeving gedaan :o) Is er in twee tellen ook weer uit."
Hierbij een voorbeeld. Nu we de ISBN's links snel geimplementeerd hebben, nu op naar de boeken zonder ISBN.
Dus ook hier Google books rocks!
Labels: Google books
13 maart 2008
Google laat een droom in vervulling gaan, nu Pica nog
Voor onze catalogus in Wageningen had ik er ook al eens over nagedacht. Het kan voor de boeken gepubliceerd sinds 1965 (?) of daaromtrent prima. Daarvoor hebbben we ISBN's om dat mogelijk te maken. Maar het meeste van dat recente materiaal is slechts als limited preview beschikbaar. Voor mij geen reden om die droom na te gaan jagen. Het interessante materiaal voor zo'n exercitie zijn onze oudere boeken dat we op deze manier full text zouden kunnen linken. Nu doen we dat vaak handmatig. Op basis van onze rijke metadata zou dat toch beter moeten kunnen?
Wel? Niet helemaal. Je kunt volgens de Google books API het makkelijkst linken via het ISBN, het OCLC nummer (via dat nummer linkt Google weer naar worldcat, had ik al eens uitgevogeld) of LCCN. Voor het oudere materiaal in onze collectie is het OCLC nummer natuurlijk veruit het interessants. Al ons materiaal is immers on the fly beschikbaar in OCLC's Worldcat. Geen probleem dus?
We hebben echter wel een klein probleempje. En Pica kan ons helpen om dat op te lossen. Wij hebben natuurlijk keurig onze eigen unieke catalogusnummers voor alle records. We registreren de PPN (Pica Productie Nummer) maar missen de OCLC nummers. Ik neem aan dat er in Leiden ergens wel een sleuteltabel ligt die dit bruggetje voor ons mogelijk maakt. Maar het illustreert wel, dat we allerlhande metadata registreren. Aantal bladzijden, hoogte van het boek, alleen dat OCLC nummer dat we nu echt nodig hebben, net niet.
Pica ik neem aan dat jullie binnenkort een telefoontje uit Wageningen kunnnen verwachten. Met het verzoek om een complete OCLC-PPN tabel. Dit nieuwe speeltje is te mooi om te laten lopen. In een klap duizenden relevante fulltext links erbij! Geweldig! Dat is bibliotheek 2.0 op volle kracht. Slim gebruik van metadata en weg van die statische catalogus.
Labels: Google books, OCLC, PICA
06 januari 2008
Retrospectief over Google books en Open Content Alliance
Helemaal stil was het dus niet op het gebied van de inhoudelijke ontwikkeling.
Afgelopen jaar kreeg het Google bibliotheek programma soms wel zware kritiek te verduren. Walt Crawford geeft in het laatste issue van Cites & Insights een mooi retrospectief over alle ontwikkelingen rond deze digitaliseringsprogramma's, ook de oorverdovende stilte in de rechtszalen passeren de revue. Zijn stelling wat betreft de inhoud is dat zowel GBS en OCA gezien moeten worden als 'discovery' tool. Het gaat er volgens hem vooral om, om relevante boeken te vinden. Bibliotheken zouden daarom hartstikke blij moeten zijn met GBS en OCA. Met de 'find in a library' knop kom je via worldcat vervolgens bij de bibliotheek om de hoe terecht voor een fysiek exemplaar. Mooi toch?
Kritiek over de kwaliteit van de scans en de herkende teksten vind hij minder relevant. Toch kan ik hem daar niet helemaal gelijk in geven. Natuurlijk zijn GBS en OCA in de eerste plaats hele bijzondere bronnen om relevante boeken te vinden, maar ik mag toch wel verwachten dat je auteursrechten vrije boeken redelijkerwijs zou moeten kunnen downloaden en fatsoenlijk op een e-book reader kunnen lezen. Zeker nu er zo actief met e-book readers geëxperimenteerd wordt zoals bij ecobibl en vakblog zijn dit bronnen die niet over moeten worden geslagen in de testfase.
Het retrospectief raad ik iedereen aan die geïnteresseerd in deze grote digitaliseringsprojecten. Ben benieuwd of er dit jaar een Nederlandse universiteitsbibliotheek zich aansluit bij een van de consortia. Utrecht? Leiden? Of wordt het Amsterdam? We zullen zien.
Literatuur
Crawford, W. (2008). Perspective: Discovering books, an OCA and GBS retrospective. Cites & Insights: Crawford at Large 8(1): 6-24. http://citesandinsights.info/civ8i1.pdf.
Labels: Google books, OCA, Open Access
24 oktober 2007
Commerciële diensten en ideële instellingen
De Google Books olievlek breidde zich verder uit. Ondertussen zijn er ongeveer 25 bibliotheken die meedoen. Daarnaast kwam de oppositie. Microsoft, ook met diepe zakken, kwam en de Open Content Alliance kwam als belangrijk alternatief, maar zij hebben niet zoveel geld.
In het imperium van de Google Books libraries kwamen in maart de eerste barstjes toen Peter Brantley, de toenmalige directeur van de California Digital Library, zijn eerste twijfels uitte over de voorwaarden waaronder Google de collecties mocht scannen. In de New York Times van twee dagen terug, staat een lang verhaal over nog meer bibliotheken die niet konden leven met de voorwaarden van Google of Microsoft. Het grootste probleem is dat van het monopoly op het beschikbaar maken van de digitale versie. Het OCA project van Brewster Kahle kent dit soort restrictieve voorwaarden trouwens niet, maar daar kost het scannen van een boek ongeveer 10 US$ cent per pagina, of ongeveer 30 US$ per boek. Een magazijn met een slordige miljoen boeken kost zo een aardig vermogen om te digitaliseren.
Projecten als de Worlddigitallibrary, dat vorige week woensdag een eerste prototype afleverde, zijn vanwege de restricties zoals bovengenoemd dan ook helemaal niet gebaat bij grote commerciële boekscanprojecten. Het is in dat licht dan ook verbazingwekkend dat de British Library zo’n grote collectie door Microsoft laat scannen. Het zijn toch vooral de grote nationale bibliotheken die in projecten als the european library project of worlddigitallibrary de digitale content moeten leveren.
Wanneer Google aanbiedt ons hele bezit te gaan scannen? Dan zou ik daar nog eens een goede nacht over moeten slapen.
Labels: Digitaliseren, Google books, Microsoft Books, OCA
24 mei 2007
Google books gaat naar Gent
Welke (echte) Nederlandse bibliotheek zal volgen?
Labels: Gent, Google books
07 maart 2007
Google books, some regrets
Peter, the previous Director of Digital Library Technologies of CDL and current Director of the Digital Library Federation, shares some of his doubts about the deals that have been struck so far. And the way it has all been established.
Interesting reading.
Hattip: Lorcan Dempsey
Labels: English, Google books, Libraries, Regrets, Scanning
