31 maart 2006

 

Leuk doorkijkje naar de methoden van het Zembla team

Jos, gaf net een heel aardig doorkijkje in de methode van het Zembla team dat de inmiddels roemruchte documentaire over Google maakte. De heren zijn ook opnamen komen maken bij de Haagse Hogeschool. Lees maar verder hoe dat in zijn werk ging.

Technorati tags: ;

Labels:


30 maart 2006

 

Ontgoogelen met Zembla

Wat werd Google vanavond zwart gemaakt door Zembla. Ik denk niet dat een willekeurig andere zoekmachine anders omgaat met de informatie die ze vergaren. Of die data nu wordt verkregen door spiders, of door het klikgedrag van zoekers. De meeste zoekmachines leggen het vast, analyseren het en proberen vervolgens nog beter antwoorden te geven op de vragen die gesteld worden. Het is wel erg makkelijk om dan steeds een naam te pikken en die verder zwart te maken.
Voor mij begon het probleem eigenlijk bij de eerste scène van een schoolklas die informatie over de landen van Noord Amerika moesten zoeken. Waarom zouden we de leerlingen wat verwijten waneer de juffrouw werkelijk niet weet hoe een zoekmachine werkt, hoe je er meer uit kunt halen, en wat voor andere kwaliteitsbronnen er meer beschikbaar zijn op het Web.
Wat mij het meest verbaasde over deze documentaire is dat er niet wat beter werd ingegaan om de advertentierol van Google. Google is het grootste mediabedrijf ter wereld, en daarbij toevallig ook nog een zoekmachine. Althans zo lijkt dat tegenwoordig. Het gaat uiteindelijk om het verkopen van advertentieruimte. Daarnaast zijn er legertjes zoekmachine optimaliseerders aan de slag om voor commercieel bedrijven ook in de intrinsieke resultaten hoog te eindigen. Maar je hebt ‘white hat’ en ‘black hat’ optimaliseerders, slechts de laatste categorie zijn manipuleerders. De hetse over het manipuleren van de resultaten ging mij wat ver. Door de enorme veelzijdigheid aan zoekonderwerpen, zal bij heel veel zoekvragen bijna geen geoptimaliseerd resultaat te voorschijn komen. Dat is slechts voorbehouden aan een bepaalde soorten van informatie.
Dat de overheid optimaliseerders in dienst heeft genomen juich ik alleen maar toe, er zouden er meer moeten komen. Wanneer ik op Google moet vertrouwen om een beetje redelijkerwijs informatie bij overheid.nl te vinden is het toch wel droef gesteld met de websites van diezelfde overheid. Ik realiseer me dan ook als geen ander dat de organisatie van de informatie op de websites van de overheid, ministeries, provincies en gemeenten soms een behoorlijk complexe zaak is. Goede websites bouwen is een hele kunst, waar best wat experts bijgehaald mogen worden.
Natuurlijk moet een instelling als het CBP toezien op de bescherming van privacy gegevens, maar mensen laten ook wel heel gemakkelijk sporen op het web na. Ik heb trouwens ooit op een overeenkomst met Google geklikt toen ik de toolbar installeerde, dat ze wat van mijn zoekgedrag konden opslaan. Daar was ik zelf bij, daar hoeft geen CBP aan te pas te komen.

Ach, en heb je het nog niet gezien surf dan eens naar uitzendinggemist, die is nog niet in Google opgenomen, maar daar kan je het wel terugzien. Dat is nog een stukje van het diepe web, nog niet in Google. Maar dat komt nog wel. Eens.

Henk heeft op Voelspriet natuurlijk zijn Forum open staan voor meer discussie. Loopt nog niet echt, maar Ulco komt wel op voor zijn zaakjes. Trouwens bij Zembla loopt de discussie wat beter.

Technorati tags: ;

Labels:


26 maart 2006

 

Zoeken in tags

Bestaat er nu wel of geen tag: commando in Google Blogsearch? Dat is een vraag waar Jos en ik ons druk over kunnen maken. De standpunten mogen duidelijk zijn, volgens mij is het wel mogelijk, volgens Jos echter niet, maar later kwam hij daar op terug. Hmmm wat ik je brom. Duidelijke standpunten....
Ik heb er wel een tijdje over na moeten denken, want verwonderlijk steekt een en ander wel in elkaar. Mijn eerste insteek is eenvoudig.
Wanneer je in Google zoekt naar [tag:kpi site:wowter.nl] dan vind je helemaal niets. Mijn post van een paar dagen terug is echter wel in de standaard Google opgenomen, dat zie je met deze zoekactie [kpi site:wowter.nl]. Wanneer we nu echt gebruik willen maken van mijn tags, gebruik dan Google Blogsearch. Zoek daar eens op [tag:kpi] dan krijg je drie resultaten waaronder mijn post. Kijk eens naar de tweede resultaat, daar is inderdaad een KPI tag het is pas de vijfde tag. In het derde resultaat is het zelfs de zesde tag die werd gegeven. Je zou bijna gaan denken dat Google Blogsearch zoeken met tags ondersteunt. Dat deed ik dan ook en blogde er over.
Maar neem je de proef op de som en je probeert ["tag kpi"] in Blogsearch, dan krijg je dezeldefde resultaten als met het tag: commando of prefix. Er is hier dus meer aan de hand!
Bij mij viel het muntje toen ik gisterenavond onder de douche stond. Ben niet naakt naar beneden gerend onder het uitschreeuwen van Eureka, maar ik was wel happy dat ik wist waar ik het moest zoeken.
In mijn post lijkt de string "tag kpi" niet voor te komen. Wel "tags kpi". Maar dat is wat wij zien. Google Blogsearch indexeert deze pagina helemaal niet, wel de feed! En die feed is in XML, en daar komt de string "http://technorati.com/tag/kpi" wel in voor als onderdeel van de html string rond het woord KPI in de tag. Google heeft moeite met leestekens, dus alle :/ en ' worden niet meegenomen of als spatie gezien. In de index van de feed voor Blogsearch komen daadoor de termen tag en kpi wel naast elkaarvoor. Wanneer je zoekt met Blogsearch blijkt die ook niet goed om te kunenn bgaan met leestekens. Blogsearch blijkt [tag:kpi] omte zetten naar een phrase search ["tag:kpi"], en daarom komen beide zoekacties neer op precies hetzelfde.
Een aardige ondersteuning is de volgende vondst. Bij Frankly (van Rhinofly) doen ze hun best om af en toe posts te taggen. We zien in deze post over de Dutch Bloggies keurig onderaan Technorati tags voorkomen. Echter wanneer je in Blogsearch nu naar ["tag dutchbloggies"] zoekt vind je deze post niet, wel wat concurrende post van andere marketeers ;) Inspectie van de volledige feed leert mij dat ze hun tags niet meegeven aan hun XML feed (die in Feedburner trouwens netjes leesbaar wordt weergegeven) en het wordt daarom niet met Blogsearch gevonden. De grote grap is, wanneer je naar de tags van die post in plain vanilla Google gaat zoeken [dutchbloggies veiling award site:rhinofly.nl] dan zie je dat diezelfde post wel in de grote Google index zit. Hier kunnen ze bij Rhinofly nog eens over nadenken ;)

En Jos, wat is hierop jouw antwoord?

Technorati tags: ; ; ;

Labels:


25 maart 2006

 

Welkom terug -=(in between)=-

Een typisch geval van het bloed dat kruipt waar het niet gaan kan. Toen Henk Ellerman nog in het Rotterdamse vertoefde had hij ooit een blog over open access publishing. Volgens mij was het ook nog een redelijk gelezen blog. Er zijn zelfs nog wel sporen van te vinden in andere blogs. Onder meer in de Blog van Peter Suber.
In Groningen was hij vervolgens met een hele groep gestart aan de blog Digilib. Deze blog staat nog op mijn NL biblioblogs overzicht, in de hoop dat ze het toetsenbord ooit weer gaan beroeren. Maar sinds 24 juni 2005 zit er geen leven meer in. Terwijl er nog 19 lezers via Bloglines geabonneerd zijn. Zij wachten al sinds afgelopen zomer met geduld op het volgende bericht.
Er is nu witte rook uit Groningen. Guus van den Brekel attendeerde mij erop via het commentaar op het NL-Biblioblog overzicht. Henk Ellerman is zelf weer begonnen met -=(in between)=-- A weblog on scholarly online publishing, open access, and library related technology. Niet helemaal alleen, hij heeft Hanne Allespach meegenomen van Digilib als editor (zou ik ook kunnen gebruiken, zo iemand). De overige teamleden van Digilib zie ik niet meer terug bij Henk zijn Blog. Wanneer mijn indrukken juist waren schreef Henk ook veruit de meeste posts. Het geheel wordt duidelijk van de eerste post. Amusant detail vind ik wel het digilib element in de URL. Een soort knipoog.
Well Henk. Keep it up this time. We know you can do it!

In zijn post over wikis en weblogs wijst Henk op een gevulde juridische wiki en een SFX/Metalib blog die nog niet lijkt te functioneren.

En o, ja... Henk, een laatste Digilib post om die 19 blogline lezers te bedanken voor hun geduld is slechts een geste van mijn kant.

Technorati tags:

Labels:


 

Voor technofiele jogging librarians

Het voorjaar is echt begonnen, gezien de paddentrek in de straat. Daarom tijd om de loopschoenen uit het vet te halen ;)
Een GPS horloge heb ik niet. Een doel ook niet. Maar dit tooltje vind ik om te watertanden.

Bron: Another Blog by Dave

Technorati tags: ;Google Maps

Labels:


22 maart 2006

 

Zoeken naar tags

Dat ik in de kracht geloof van tagging heb ik al eens laten weten om mijn blog. Met een bibliotheekachtergrond moet je eigenlijk ook wel. Zeker als een deeltje van mijn werk uit het toekennen van trefwoorden bestaat. Afgezien daarvan, we leren onze studenten altijd dat wanneer je met een zoekactie teveel vindt, dat je de resultaten in kan perken door te zoeken op trefwoorden of titelwoorden in plaats van woorden overal in het record.
Voor de webomgeving is er nu een metazoekmachine die dat specifiek mogelijk maakt. Keotag. Een nieuwe smaak aan het firmament.
Keotag is een simpele metazoekmachine die jouw gewenste tag op de volgende zoekmachines loslaat: Technorati, Del.icio.us, Blinklist, Furl, Google Blog Search, Yahoo!, Blogpulse, Feedster, Icerocket, Rawsugar, Tagzania, Shadows, Feedmarker, 43things (Geen Flickr of Del.icio.us). Een vreemd lijstje. Wat ik er vooral verheugend eraan vind is dat al deze machines het tag: commando op een of andere wijze ondersteunen. Ik heb het al eens eerder laten weten dat het een ongedocumenteerde optie in Google Blogsearch is. Het is tot op vandaag nog steeds niet gedocumenteerd. Dus alleen al om het feit dat je in meerdere zoekmachines op tags kunt zoeken, schrijf ik deze post.

Bron: ResearchBuzz


Technorati tags: ;

Labels: ,


 

Wat is je invloed in de blogosphere

Bij Blog!Influence worden een aantal indicatoren voor de populariteit van een blog op een rijtje gezet, vermenigvuldigt en dan rolt er een getal uit. Zou dat dan een Key Performance Indicator zijn oftewel de KPI?
Laten we even kijken wat er gemeten wordt: Het aantal blogs linking en het aantal posts linking wordt bij Technorati opgehaald. Het aantal websites linking wordt gemeten bij Yahoo! Op zich een goed keuze, maar tijdens mijn onderzoekje naar de Nederlandse Biblioblogosphere, heb ik gezien dat daar gekke dingen mee kunnen gebeuren. Aantal bloglines abonnees. Prima keuze. Als laatste de Google Pagerank.
Leuk hè, allemaal indicatoren die ik ook aan het begin van dit jaar meegenomen heb voor mijn overzicht van de Nederlandse biblioblogosphere. De grap die Blog!Influence verder uitvoert is dat zij de volgende formule bedacht hebben: [(Technorati blog+ Technorati posts+ Yahoo! web links) + (bloglines Abo’s * 2)] * 1+(Pagerank/10) om alles in een getal te vatten. Hun Key Performance Indicator.
Voor dat laatste kan je in feite ook kijken naar de Technorati, Blopulse of PubSub rank.
Wat ze niet meegenomen hebben is een maat voor de kwaliteit zoals Sitescore (voor wat het waard is). Ze hebben ook geen antwoord op de vraag hoe je de commentaren moet wegen of de trackbacks (voorzover die niet in Technorati zitten).
Kortom dit programma maakt de voorbereiding van een post over de biblioblogosphere makkelijker, maar met die ene KPI, de Key performance Indicator, ben je er nog lang niet. Het werk begint daarna.

Bron: Phill Bradley

Tecnhorati tags: ; ;

Labels:


21 maart 2006

 

Luchtfoto’s van Nederland? Just Ask



Had ik nog mijn moppers over het Google Maps programma, dat het niet verder ontwikkeld lijkt te worden voor Nederland. Bleek dat ik nog niet ver genoeg gekomen was met het verkennen van de mogelijkheden van Ask. Ask heeft werkelijk geweldige set aan satelliet- en luchtfoto’s achter hun maps programma zitten. Het voordeel van luchtfoto’s over satellietfoto’s laat zich duidelijk zien wanneer ik Google en Ask voor onze eigen straat vergelijk, we hebben het zonnescherm uitstaan, en de auto staat niet voor de deur geparkeerd. Trouwens de parkeerplaats van het Jan Kops Huis is opmerkelijk leeg.
Het zoeken naar Nederlandse locaties gaat nog niet zo goed (misschien een reden dat het bij Ask Nederland nog niet aangeboden wordt) en de integratie van getekende plattegronden en luchtfoto’s werkt nog niet perfect. Maar begin even in de VS (ook de VS versie van Ask kiezen), zoom uit scroll naar Nederland, en zoom weer in op de locatie die je wilt zien.
Wat verwonderlijk is, is dat er voor de zomer nog zorgen waren bij kamerleden over de blubber die de Google satellietplaatjes laten zien. Hier komt Ask met vele malen gedetailleerder fotomateriaal van bijvoorbeeld Schiphol, de haven van Rotterdam, de Deltawerken, of het Binnenhof. Maar goed politici kunnen houden zich alleen maar bezig met populaire onderwerpen. Van Ask hebben ze nog nooit gehoord natuurlijk.

Off note, Gary Price blogt mee op de Ask.com Aerial blog en ze gebruiken Blogger (Geen Bloglines) om te bloggen. Hoe kan het soms lopen.

Bron: Ask blog (7 maart)

Technorati tags: ; ;

Labels: , ,


 

Het mooiste aan Google Finance zijn de plaatjes



Vanochtend werd Google Finance dan eindelijk gelanceerd. Er waren al een tijdje geruchten, maar nu is Google dan met een competitief product voor Yahoo! Finance en MSN Money gekomen.
De startpagina van Google Finance legt het nog af tegen de startpagina van Yahoo! Finance. Waar Google echter wel scoort zijn de grafieken. Deze interactieve grafieken komen te voorschijn wanneer je naar een bedrijf gezocht hebt. Wat een prachtige technologie zit daar achter. Je kunt de schuiven op iedere gewenste tijdspannen zetten. De letters in de grafiek corresponderen met de nieuwsberichten in het rechterframe. Het is echt leuk om met de schuifjes in de bovenste of onderste grafiek te maken.
Natuurlijk eerst alle bedrijven van de verschillende markten in de Verenigde Staten die in Google Finance zitten. Europa zal nog even moeten wachten. Google zal voorlopig wel niet verder kijken dan de FTSE in London. De beurs van Amsterdam zal wel wat lager op het prioriteitenlijstje staan.

(Ik wordt trouwens onderhand wel moe, en moedeloos, van het wachten op Google Maps voor Nederland)

Google Finance is voor Google weer een stap verder om één grote informatiemanager te worden. De zoektechnologie voorbij, nieuwsagent of uitgever worden zijn de nieuwste ambities van Google.

Technorati tags:

Labels:


20 maart 2006

 

De Electronica’s op het boekenbal

Nu we nog middenin de boekenweek zitten neem ik de gelegenheid te baat om een oude, nooit geplaatste, column af te stoffen en op te frissen. Deze column gaat immers over de dans van de softwaregiganten op het bal van de elektronische boeken. De Electronica’s op het boekenbal dus. Ik heb al eens eerder over het elektronische boekenbal geblogd, afgelopen oktober en november. In deze post wil ik proberen de ontwikkelingen op een rij te zetten.

Google Book Search houdt de gemoederen al een tijdje bezig. Het grote tumult ontstond in december 2004 toen Google een samenwerking aankondigde met een drietal Amerikaanse universiteitsbibliotheken, University of Michigan, Harvard University en Stanford University de New York Public Library en de Bodleian Library in Oxford, Engeland (Price, 2004). Google zal de complete collectie scannen en doorzoekbaar maken. Eindelijk de droom die waarheid wordt voor veel mediathecarissen. Alle boeken volledig doorzoekbaar. Echter, slechts de rechtenvrije werken worden compleet getoond. Van de werken waar nog auteursrechten op rusten, zullen slechts kleine stukjes getoond worden, de snippets zoals we die ook van de standaard zoekresultaten kennen. Het vreemde aan het tumult rond Google Book Search is in feite dat het al een veel ouder programma is, dat juist was begonnen in samenwerking met uitgevers. In december 2003 werden de eerste resultaten van dit programma zichtbaar in de algemene Google index (Sherman, 2003). In oktober 2004 werd Google Print als apart programma voor uitgevers in het leven geroepen (Sullivan, 2004). Afgelopen november werd de naam van Google Print veranderd in de huidige naam Google Book Search.

Terwijl het boekenscanprogramma van Google een tijdje heeft stil gelegen. Vooral om betrokken partijen beter te informeren, allianties te sluiten en belangrijke uitgevers over de streep te halen. Is het aantal processen dat Google ondertussen aan de broek heeft gekregen is wel toegenomen. Niet alleen de uitgevers tegen Google, maar ook consumentenorganisaties, Europese regeringsleiders, en het Amerikaanse Congres, roffelden dreigend op hun trommels. Wat mij nog het meest verbaasd is dat in de VS de rechtzaken over het Book Search project zich lijken te concentreren op Fair Use. Volgens insiders mogen de snippets getoond worden op grind van het fair use principe. In Europa, echter, schijnt zoiets niet te bestaan. Hier zou dat dus niet kunnen. Ik ben benieuwd wanneer dit tot een schisma gaat leiden en resulteren in een Amerikaanse en Europese Google Book Search programma.

De concurrenten van Google hebben zich verenigd in de Open Content Alliance (OCA). Begin oktober kwamen ze voor de dag met hun eerste persbericht. Onder de partners ondermeer Yahoo! die de zoektechnologie voor de OCA site zal leveren en het Internet Archive waar de boeken gearchiveerd zullen worden. Bij het Internet Archive is hier al ervaring mee opgedaan in het kader van hun zeer ambitieuze Million Book Project. Het internet archive heeft hier ongeveer 11,000 rechtenvrije boeken gearchiveerd. Zij hebben niet als enige zo’n project: een ander ‘million book project’ is van de University of Michigan en gaat door het leven als de Universal Library. Een proeve van bekwaamheid van het Internet Archive is hun Open Library site waarop waar nog maar 15 boeken staan. Daar is trouwens sindsdien niets aan toegevoegd. Partners HP en Adobe zullen voor de Open Content Alliance vooral technologie leveren voor het scannen, digitaliseren, herkennen en indexeren van de teksten. Klap op de vuurpijl was de aansluiting van Microsoft bij deze organisatie. Microsoft kwam weliswaar wat later op dit elektronische boekenbal, maar heeft wel de diepste zakken van de OCA partners. Microsoft stelt $5 miljoen beschikbaar, voldoende om ongeveer 150.000 boeken te digitaliseren. OCA gaat de problemen uit de weg die Google zich op de hals haalde, door zich voorlopig alleen op rechtenvrije werken te richten. In een apart project hebben nu ook de British Library en Microsoft een samenwerkingsverband aangekondigd om 100.000 rechtenvrije boeken van die collectie te gaan digitaliseren. Microsoft lijkt vooral zijn e-book reader te willlen promoten. Ondertussen zijn een aantal grote Amerikaanse universiteitsbibliotheken die zich hebben aangesloten bij dit project. De lijst van deelnemers groeit gestaag.

Wat veel minder de pers heeft gehaald, is dat wat OCA en Google doen al ouder is dan het Web zelf. Project Gutenberg (PG) startte in 1971 met het digitaliseren van het eerste boek. Sindsdien zijn er via dit project ruim 17.000 boeken gedigitaliseerd, waaronder 143 Nederlandstalige boeken. Voorheen waren alleen de metadata van de boeken doorzoekbaar, maar sinds kort zijn die boeken ook volledig doorzoekbaar op de PG site zelf.

Naast PG zijn er talloze initiatieven en projecten geweest om boeken te digitaliseren. Het probleem met al deze projecten is dat het allemaal kleine zelfstandige projecten zijn, en een overkoepelende zoek-interface voor al die afzonderlijke projecten en gedigitaliseerde werken ontbreekt. Dit is een punt waar alle bibliotheken en archieven het gezamenlijk hebben laten afweten. Daarom komen er nu initiatieven van softwaregiganten om al die informatie, en nog en nog meer, beter te organiseren. Eigenlijk een klus waarop bibliotheken zich al jaren op lopen te beroepen, maar waar ze nooit adequaat aan toegekomen zijn. Helemaal nooit? Gelukkig er zijn enkele onderwerpsgidsen die via een logische indeling talloze van deze elektronische boeken bij elkaar zetten, of metadata doorzoekbaar maken. Enkele daarvan zijn:

Digital Book Index Digital (DBI) http://www.digitalbookindex.org/
Dit is de grootste onderwerpgids op het gebied van elektronische boeken op het web. Het linkt naar zowel vrij toegankelijke boeken als naar boeken die alleen tegen betaling verkrijgbaar zijn. Van de ruim 110.000 boeken opgenomen op deze site zijn er 72.000 vrij toegankelijk. DBI dekt de titels van Project Gutenberg, Bartleby.com en vele universiteitsbibliotheken die boeken hebben gedigitaliseerd. Daarnaast wordt samengewerkt met commerciële uitgevers zoals NetLibrary en Questia.

The Online Book Page (OBP) http://digital.library.upenn.edu/books/
Site van PennState Library geeft toegang tot ongeveer 20.000 boeken die vrij op het web beschikbaar zijn. Er wordt gewerkt aan het vergroten van de collectie door elektronisch te gaan oogsten van digitale archieven. Er kan gezocht worden op auteursnamen en titelwoorden. Sinds oktober 2005 kun je je laten attenderen via een RSS feed op de nieuwste aanwinsten.

Digitale bibliotheek voor de Nederlandse Letteren http://www.dbnl.org/.
In de Digitale Bibliotheek voor de Nederlandse Letteren wordt Nederlandse taal en literatuur verzameld. De site bevat literaire teksten, secundaire literatuur en aanvullende informatie als biografieën en portretten van schrijvers. De site biedt een goede navigatie, zowel op thema's als op tijdsperiode's, titels en auteurs. De zoekmachine is niet zo sterk, maar omdat de site volledig toegankelijk is volstaat een zoekactie met Google of Yahoo! die je beperkt tot dbnl.org door aan de zoekwoorden de opdracht [… site:dbnl.org] toe te voegen.

Universal Library http://www.ulib.org/
Is een project van de Carnegie Mellon University. De verzameling digitale boeken omvat bijna 36000 titels of bij 5 miljoen pagina’s. Het scannen gebeurd in China en India. Wat mijn het meest heeft bevreemd, dat deze collectie totaal geen aandacht lijkt te krijgen in alle nieuws rond Google Book Search en OCA.


Bronnen:
Price, G. (2004). Google partners with Oxford, Harvard & others to digitize libraries. Searchday. http://searchenginewatch.com/searchday/article.php/3447411.
Sherman, C. (2003). Google introduces book searches. Searchday. http://searchenginewatch.com/searchday/article.php/3290351.
Sullivan, D. (2004). Google print opens widely to publishers. Searchday. http://searchenginewatch.com/searchday/article.php/3417941.

Technorati tags: ; ; ;

Labels:


19 maart 2006

 

Achterstallig onderhoud

Volgers van deze blog zullen gemerkt hebben dat de afgelopen weken wat minder frequent is gepost. Het werk speelde weer een tijdje de bovenhand, daardoor kwam ik wat minder aan bloggen toe. “Maar dat doe je toch ’s avonds?” “Tja, helemaal waar”.
Ik was afgelopen maandag dan ook heel verbaasd dat iemand op de Nedbib-l lijst zijn verbazing uitsprak over het feit dat iemand in het weekend op de Nedbib-l had lopen posten. Ik ben weer helemaal verbaasd over die verbazing. Juist dan heb je enigszins de ruimte om dat soort dingen te doen.
Maar ik moet dus wat aan mijn achterstallig onderhoud doen. Het eerste klusje is de melding van de weblog van de basisbibliotheek achterhoekse poort, nog niet zulke frequente schrijvers, maar de twee maartse posts zijn goed genoeg om ze in de gaten te gaan houden. Ik las dit trouwens voor het eerst bij Attendering hun collegae uit de Achterhoek.
Een andere tip die kreeg ik van Edwin, om vooral eens te gaan kijken bij Afred-h. Alfred-h werkt bij de OB Scherpenzeel en heeft al sinds december 2003 een blog. Alleen, tot nu toe heeft hij nog geen grote lezersgemeenschap opgebouwd. Het gebrek aan die gemeenschap lijkt hem terughoudend te maken in het schrijven voor zijn blog. Dat zou jammer zijn, want ik denk dat hij voor de OB gemeenschap wel de juiste trommels roert. Gaat hem lezen!!
Als laatste een blog van een 4e jaars studente IDM in Den Haag. Jos maakt er gewag van op zijn blog. Het is de blog van Karin Weidema. Ze runt twee website’s, één die gebouwd is rond haar blog. Ze doet leuke dingen met blogger, maar uiteindelijk kan ik de atom-feed nergens vinden. Met raden kom je er wel. Mijn bezwaar is dat veel nieuwsitems netjes worden overgenomen van andere sites. Netjes omdat het keurig met bronvermelding gebeurt, maar ik zie liever originele artikelen. Ze kan het wel, getuige haar twee eigen artikelen. Karin ik daag je uit om dat meer en regelmatig te doen.
Haar tweede site is de moeite van het vermelden waard. Zoeken-en-vinden daar lijkt ze een soort startpagina te bouwen met allerlei handige links. Wat ik zou wensen is om daar ook een RSS feed voor te vinden, maar die was door mij niet te raden. De links naar RSS, lijken mij de feeds die Karin leest, maar echt duidelijk wordt dat niet. Kortom om in de gaten te houden.

Bron: Attendering, Jong van Hart

Technorati tags:

Labels:


 

10 tips om beter te zoeken op het Web

Afgelopen vrijdag mocht ik de feestweek van de bibliotheek van het ministerie van justitie afsluiten met een lezing over beter zoeken op het web. De bibliotheek bestond maar liefst 150 jaar. Als afgevaardigde van de Wageningse bibliotheek, of de Vogin, sta je wel even stil bij dit soort respectabele leeftijden. We hebben nog wat jaren te gaan voor we hier aan toe zijn.
Ik denk dat ik tijdens mijn lezing de meeste tijd heb stilgestaan bij het uitleggen wat nu het onzichtbare web behelst, en hoe je daar schatten aan informatie kunt vinden. Daarnaast natuurlijk wat tips om beter te zoeken met Google.
Over Yahoo! kon ik niets kwijt. Die wordt op dit ministerie buitengesloten. Ask mocht wel weer, en Live deed het nog niet.
Het was in eerste instantie de bedoeling om een hands-on training te geven, maar daar was uiteindelijk geen geschikte zaal voor. Het werd dus een monoloog van ongeveer 2 uur. Het mooie was dat ze tot het einde bleven zitten. Zelfs toen het iets langer duurde dan de planning.
De uitsmijter was natuurlijk het tooltje eraser, voor mensen die bij justitie werken een absolute must om van op de hoogte te zijn, vooral wanneer ze hun PC willen afdanken ;)

Lezing: WoW!ter's Wiki

Technorati tags: ; ; ; ;

Labels:


15 maart 2006

 

Wat tools voor de trade

Binnenkort mag ik weer een Internet les verzorgen. Een van de dingen die ik wil laten passeren zijn een paar van die handige tools die je zelf vaak gebruikt, maar eigenlijk weet je niet meer dat je ze gebruikt. Wanneer je andere absolute killers hebt laat me et dan weten via de comments.

Hierbij mijn opsomming:

Tinyurl, DigBig, Doiop of BURL
URL's zijn soms onhandig lang. Per mail versturen van die lange URL's leidt meestal tot problemen bij de ontvanger. Dit zijn een aantal gelijkwaardige programma's om lange URL's te verkorten. Tinyurl en digbig zijn veruit de bekendste in deze soort. De verkleinde URL's blijven vaak maandelang geldig. Het voordeel van Doiop is dat je zelf een keyword aan de verkleinde URL kunt geven in plaats van een willekeurige rijtje karakters, zodat je de URL tenminste kan onthouden. BURL werkt heeft een soortgelijk voordeel als doiop, maar geeft een logischere URL.

Dropload, Filefactory of Sendit
Om grote bestanden (100 MB bij Dropload, tot 1.5GB bij Filefactory) te verzenden naar iemand anders, of wanneer je iets naar een andere PC wilt overbrengen. Het programma stuurt de ontvanger de instructies voor het downloaden van de bestanden. Je kunt jezelf meestal laten attenderen wanneer de ontvanger de bestanden heeft opgehaald. De bestanden worden na een aantal dagen automatisch verwijderd, of ze nu wel of niet opgepikt zijn doet er niet toe. Van Sendit weet ik niet zeker of het ook buiten mijn Universiteit ook werkt.

Eraser
Om bestanden werkelijk van je PC te verwijderen. Eraser overschrijft de verwijderde bestanden 35 keer zodat het ook echt weg is. Wanneer je een bestand op normale wijze van je PC verwijderd is het nog niet echt weg. De inhoudstabel van de harde schijf wordt slechts aangepast. De file blijft op je schijf staan totdat het werkelijk wordt overschreven. Eraser doet dit wanneer je wilt 35 keer. Eraser kan individuele files, directories of de ongebruikte schijfruimte overschrijven. De naadloze integratie met de prullebak van Windows maakt het echt verwijderen van bestanden een peuleschil.

Crapcleaner
Ook in het kader van het schoonhouden van je PC, is er crap cleaner. Verwijdert wanneer je dat wilt, alle tijdelijke files, internet history, cookies, leegt je prullebak, recente documenten of je download geschiedenis. Daarnaast kijkt het de registry van je PC na, op fouten, ongebruikte resten etc... Handig wanneer je veel surft, en de PC erg traag dreigt te worden.

Windows Defender (Beta 2), SpyBot
Twee jaar geleden was ik nog een gebruiker van SpyBot Search and Destroy, een uiterst nuttig programma dat allerhande spyware, adware en malware op je PC opspoorde en onschadelijk maakte. Sinds Microsoft de veiligheid van de PC centraal heeft gesteld en meer doet aan het dichten van lekken en gaten in het Windows besturingssyteem of internet Explorer, is het ook gaan werken aan beveiligingssoftware om spyware uit te schakelen. Straks zal dit integraalonderdeel zijn van Windows Vista, nu al vrij te downloaden bij
Microsoft, als Windows Defender.

Snippy
Soms zegt een plaatje meer dan 1000 woorden. Even snel een screenshot maken van een deel van de je scherm is daarvoor handig. Ctrl+PrintScrn is vaak te veel, maar snippy laat je precies die uitsnede maken die je wilt.

Linksleuth
Meer voor de schrijvers van webpagina's, een krachtig programma voor het checken van de links op ja website. Xenu's Linksleuth.

More, and more
TechSupportAlert (2006) The 46 Best-ever Freeware Utilities.
Bradley, P. (2006) I want to.

Technorati tags: ;

Labels: , ,


 

Scopus en Google Scholar in review

Het laatste winter-nummer van ISTIL is uit. Wat bij mij meteen in het oog sprong waren twee database recensies. Burright (2006) recenseert Google Scholar, of ze haar huiswerk goed gedaan heeft, dat waag ik te betwijfelen omdat ze in haar referentielijstje slechts een artikel heeft staan. Meer gedegen lijkt het overzicht van Dess (2006) over Scopus. Deze heer heeft in elk geval zijn huiswerk gedaan voor hij ging schrijven.
Het zou natuurlijk mooi geweest zijn wanneer deze schrijvers door de editor van dit tijdschrift bij elkaar in een hok gezet waren en samen een recensie laten schrijven over de overeenkomsten en verschillen van deze databases.

Literatuur
Burright, M. (2006). Database reviews and Reports: Google Scholar. Issues in Science and Technology Librarianship. http://www.istl.org/06-winter/databases2.html.
Dess, H.M. (2006). Database Reviews and Reports: Scopus. Issues in Science and Technology Librarianship. http://www.istl.org/06-winter/databases4.html.

Technorati tags: ; ;

Labels:


14 maart 2006

 

Hordes bij het fulltext zoeken

Google Scholar en Google Books zijn natuurlijk prachtige producten. Ze indexeren alles van A-Z van titelpagina tot kaft en alles wat daar tussen zit. Heerlijk om zulke producten tot je beschikking te hebben en alles terug te kunnen vinden. Alles? Meestal lukt het niet. Eric Sieverts (2000) wijde er ooit eens een column aan in de IP. Borges schreef er zelfs een boek over.
Waarom ik er over begin? Het is een opmerking in de blogpost van Jos van Helvoort over digitale bibliotheken. Zijn punten 2 (bibliografische databases) en 4 (fulltext bestanden) lijken dicht bij elkaar te liggen. Maar er is wel een heel groot verschil tussen die twee. Jos merkt nog op dat (IDM-)studenten niet meer zo houden van bibliografische databases omdat de koppeling naar fulltext afwezig is, maar de beschikbaarheid van items is iets voor een andere post (Enter SFX, of welke andere link resolver ook). Bij zijn 4e punt komt Jos denk ik niet met de sterkste voorbeelden. Ik zou komen met als voorbeelden de databases in de eerste alinea, of ScienceDirect, SpringerLink en dat soort databases. Deze databases hebben langzamerhand het verschil tussen bibliografie en fulltext bestand, het verschil tussen bibliografisch zoeken en fulltext-zoeken laten verwateren. Terwijl daar conceptueel heel veel achter zit.
De voorkeur van zeer gespecialiseerde onderzoekers voor fulltext zoeken, daar kan ik me wel wat bij voorstellen. Maar het zal niet voor iedereen altijd ideaal zijn. Een heerlijk artikel hierover stond in de laatste JEP. Garrett (2006) gaat in op het grote verschil tussen zoeken met trefwoorden en de wens om te zoeken met betekenissen, met cognitieve relaties, de semantiek in aanmerking nemend. Hij geeft daarbij nog een voorbeeld van Gross & Taylor over het nut van metadata in een catalogus.
Tot een tijdje terug had ik hier nog weinig bij stilgestaan, te weinig. Onze favoriete webzoekmachines zijn vooral grote fulltext zoekmachines en aan de klassieke bibliografische verrijking wordt ten enenmale voorbijgegaan. Lees daarvoor maar eens wat kritieken van Jacsó (bijv. Jacsó, 2005), op Google Scholar, die totaal niet overweg lijkt te kunnen met de rijke metadata die we in de bibliotheek omgeving zo ontzettend koesteren. Voor GS kan 1996 een paginanummer zijn, maar het lijkt ook een plausibel jaartal, of was het gewoon een cijfer in de tekst?
Die bibliografische zoekmogelijkheden zullen voorlopig hun plaats blijven houden. Het is echter essentieel dat ze wel goed geduid worden. Garrett (2006) kan daarbij helpen.

Literatuur
Jacsó, P. (2005). As we may search - Comparison of major features of the Web of Science , Scopus, and Google Scholar citation-based and citation-enhanced databases. Current Science 89(9): 1537-1547. http://www.ias.ac.in/currsci/nov102005/1537.pdf.
Garrett, J. (2006). KWIC and Dirty? Human Cognition and the Claims of Full-Text Searching. Journal of Electronic Publishing 9(1): 16. http://hdl.handle.net/2027/spo.3336451.0009.106.
Sieverts, E. (2000). Onderzoekers rommelen maar wat aan. Informatie Professional 5: 15. http://www.library.uu.nl/medew/it/eric/rommelen.htm.

Labels:


 

Half a century!

Vandaag zag ik dat de teller bij bloglines op 50 abonnementen staat. Hij heeft even op 51 gestaan, maar die 50 staat er nu weer. Natuurlijk had ik een plaatje in gedachten, maar blogger werkt niet mee aan dat feestje. Daarom gewoon met woorden.
Mooi, geeft weer inspiratie om lekker door te gaan.

Technorati tags:

Labels:


13 maart 2006

 

Welkom terug JEP

Mijn eerste kennismaking met JEP was het artikel van Bergman uit 2001. Het is samen met het boek van Sherman en Price (2001) een van de eerste echte publicaties die de term, en de problematiek van het diepe web beschrijven.
Sinds ik dat artikel heb gelezen, heb ik me altijd afgevraagd wat er met het tijdschrift gebeurd was. Nergens meer terug te vinden en de jarenlang aangekondigde verhuizing naar een andere host leek nooit van de grond gekomen.
Maar nu is JEP weer terug. Heerlijk leesvoer erbij. Het artikel van Bilder (2006) over de sociologische aspecten van de social software revolutie, waar komt het vertrouwen vandaan, hoe werkt dat in de web2.0 omgeving? Of het goed getimede (of zoveelste?) artikel van Friend (2006) over Google Scholar. Allemaal verplicht leesvoer.
Wat wel aardig is aan JEP is wanneer je naar de archieven bladert, dan valt het op dat het voorlaatste volume, volume 7 is uit 2002. Volume 8 is maar overgeslagen en nu zitten we dus alweer op volume 9. Maria Bonn, legt het allemaal uit in haar editorial.

Literatuur
Bergman, K.T. (2001). The deep web : surfacing hidden value. The Journal of Electronic Publishing 7(1). http://www.press.umich.edu/jep/07-01/bergman.html.
Bilder, G. (2006). In Google we trust. Journal of Electronic Publishing 9(1): 15. http://hdl.handle.net/2027/spo.3336451.0009.101.
Bonn, M. (2006). Why We Publish JEP. Journal of Electronic Publishing 9(1). http://hdl.handle.net/2027/spo.3336451.0009.102.
Friend, F.J. (2006). Google Scholar: Potentially Good for Users of Academic Information. Journal of Electronic Publishing 9(1). http://hdl.handle.net/2027/spo.3336451.0009.105.
Sherman, C. & G. Price (2001). The invisible web: Discovering information sources search engines can’t see. Medford NJ, USA, Information today. 439p.

Technorati tags: ;

Labels:


08 maart 2006

 

Ali Farka Toure overleden

Het gaat op deze blog zelden of nooit over muziek, maar naar aanleiding van het overlijden van Ali Farka Toure, een van de grootste West Afrikaanse muzikanten, wilde ik jullie op deze heerlijke blog "Benn loxo du Taccu" attenderen.
Wanneer je over de grenzen van de meer gangbare muziek wilt luisteren is dit een heerlijke plaats om exotische ritmes te voelen, een vrijplaats om lekker te luisteren.

Technorati tags: ;

Labels:


07 maart 2006

 

Ook hier wordt geadverteerd

Kon het nu toch niet meer laten, ik wil eens proberen wat Adsense op een blog als deze doet. Klik dus vooral op die twee boxjes hier boven ;)
BVD

Technorati tags:

Labels:


06 maart 2006

 

De Informatie Professional zijn nieuwe jas

De nieuwste Informatie Professional is in een nieuw jasje gestoken. Het was al aangekondigd op de website, dus geheel als een verrassing kwam het niet voor mij. Ik moest echter tot vandaag mijn geduld bewaren om te zien of de “smallere kolommen, beter leesbaar, meer samenhang en een heldere navigatie” inderdaad tot hun recht zijn gekomen.
Vanochtend ben ik eerst op het werk maar eens op zoek gegaan naar de IP, omdat Jos een blogpost had geplaatst die mij deed blozen. Snel zoekend naar de column van Marijke Verstappen, was mijn eerste impressie dat de nieuwe layout nogal druk was. Ik kreeg de indruk dat er op p.16/17 links of rechts een advertentie stond vanwege het kleurverschil. Maar ik vond daar de column. Volop voer voor mijn blog natuurlijk! Niet omdat zij geen bronvermelding geeft (hetgeen inderdaad erg flauw is mevrouw Verstappen!, maar als columnist mag dat) maar meer omdat het mijn haat liefde relatie met Darlin onderstreept. Daar komt nog wel een blogpost over…. Maar niet vandaag.
Vanmiddag had ik de IP dan ook thuis. Eindelijk eens op mijn gemak doorbladeren. Jammer dat er met het drukken wat mis is gegaan. Sommige kleuren hebben op tegenoverliggende pagina’s zwakke strepen gegeven, die hier en daar enkele regels hinderlijk benadrukken.
Na al dat geblader blijft de nieuwe layout druk. Die eerste indruk beklijft. Neem nou eens pagina 6 en 7. Drie en vier kolommen worden door elkaar gebruikt. In het artikel “Europese consultaties…” worden maar liefst drie verschillende lettertypes gebruikt, naast de kop. Het volgende artikel over Chris Sherman lijkt een weer wat andere puntgrootte te hebben. Kijk dan eens naar pagina 12 en 13, weer drie en vier kolommen door elkaar, maar nu worden hele artikelen vet gedrukt en andere weer niet. Onderaan pagina 13 weer twee artikelen naast elkaar met verschillende lettertypes. De kolom die voorheen links of rechts langs de nieuws artikeltjes liep is nu minder duidelijk onderscheiden, en krijgt verschillende koppen als ‘select’ en ‘zaken’, maar duikt op pagina 12 ineens weer op als antenne, en dan niet meer over de lengte van een pagina. Althans het ballonnetje doet vermoeden dat het meer is in dezelfde categorie.
Gelukkig is het hoofdgerecht beter leesbaar geworden. Ze zijn weer afgestapt van het hijgerige schreefloze lettertje van de eerste pagina’s, maar dat was altijd al zo. De overgang naar drie kolommen is een hele verbetering voor de hoofdartikelen.
Wat mij het meeste stoort aan de vernieuwde layout zijn de foeilelijke headers. Die zijn veel te druk. Bij de hoofdartikelen valt de drukte van de voorafgaande headers nog het meeste op. Daar worden twee simpele sterstreepjes gebruikt. Blader even door en je komt weer in de drukte van headers van ‘agenda’, ‘verschenen’ en ‘exposities’. Die van ‘agenda’ is nog het lelijkst. Wanneer de teksten van de headers consequent gebruikt waren, zou er bij de hoofdartikelen minstens links of rechts nog ‘hoofdartikel’ gestaan moeten hebben, alternerend met een korte kop.
Dat de layout van de Informatie Professional aangepakt moest worden, dat ben ik geheel met de redactie eens. Ik heb er eens wat oude nummers bijgepakt om te zien wat er nu precies veranderd is, maar vooral ook om te zien waar verbetering gewenst was. Dat is vooral in de eerste pagina’s met nieuws. Daar moet meer rust en structuur komen, en daar zijn ze bij de IP tot op heden nog niet in geslaagd.
En o ja, Eric, leuk artikel!

Technorati tags: ;

Labels:


01 maart 2006

 

Mogelijkheden voor de bibliotheekcatalogus

Vandaag heb ik, samen met twee collegea, voor een groep van onze eigen mensen een presentatie mogen geven omtrent ontwikkelingen die spelen rond de bibliotheekcatalogus. Onze catalogus is niet slecht hoor. Eigenlijk ben ik best wel content met sommige aspecten ervan. Het kan alleen nooit kwaad om om je heen te kijken en te zien wat er allemaal aan de andere kant van de schutting gebeurt.
Wanneer je alles van mijn blog trouw zou lezen staat er weinig nieuws in de gelinkte wiki. Wat ik vooral aardig vind om hier te delen, is dat niemand opmerkingen had over het feit dat ik een wiki had gebruikt als presentatievorm. Eigenlijk vond ik het wel aardig gaan, alleen heb ik de pagina's te lang laten worden waardoor ik veel moest scrollen. Niet alle mensen kunnen daar goed tegen.
Met kortere pagina's krijg je echter een navigatie probleem in (deze) wiki. Moet ik maar eens verder mee experimentern. Wat ik wel fijn vond is dat het klikken op links met gewone snelheid gaat en niet op PPT snelheid. Dat blijft een sterk punt.
Tja Twan, jouw tip moet ik nog steeds eens uitpluizen.

Technorati tags: ;

Labels:


 

OCLC|Pica komt met antwoorden

Vandaag kwam PICA met wat antwoorden over wat de stand van zake is omtrent het toevoegen van Nederlands bibliotheekbezit aan open Worldcat. Er volgde een heus persbericht!
Een paar aardige dingen die ik er uit oppikte is dat ze in de NL versies van de grote zoekmachines ook Nederlandstalige interface-achtige kreten komen als "In de bibliotheek". Dat de ranking van het Nederlandse materiaal in de NL versies van Google, Yahoo! en Ask ook hoger zal zijn (lees gemanipuleerd wordt). En dat er waarschijnlijk met postcodes gewerkt gaat worden om lokale bibliotheken op te geven. Allemaal heel aardig.
Hadden ze best eerder op de website mogen zetten.
Trouwens een intrigerend zinnetje in het persbericht:"Na succesvol afsluiten van de pilot zal OCLC PICA Open WorldCat als een abonnementdienst aanbieden." Een abonnement op een open dienst?
Ach, ik begin het nu pas te snappen. Ik denk teveel vanuit het perspectief van gebruiker. OCLC|PICA ziet de Euro's al binnenrollen van de bibliotheken die een abonnement op deze service nemen zodat hun bezit in de zoekmachines boven komt drijven....

Technorati tags: ;

p.s. OCLC|PICA AskJeeves bestaat niet meer ;)

Labels:


 

Na copyrights nu browsingrights

Een opmerkelijk bericht uit de OA blog van Peter Suber. In Australië willen ze scholen een heffing laten betalen wanneer scholieren iets op Internet moeten opzoeken. Dat noem ik nu eens echt ontgooglen!
Het wordt op deze manier wel heel makkelijk om geld te gaan verdienen voor oude instituties. Komen er mondjesmaat alternatieven op gang, helpen ze dat ook weer om zeep door een ouderwetse heffing in te stellen.

Bron: OA Blog

Technorati tags: ;

Labels:


This page is powered by Blogger. Isn't yours?