30 september 2005
Hebben we net Web 2.0 genoemd
De komende dagen wordt in SF de Web 2.0 conferentie gehouden. De lijst van sprekers is meer dan indrukwekkend. Het programma van de workshops geven al een aardige indruk van wat gezien wordt als belangrijke trends, want het programma is toch wel enigszins vaag. Wat is het Web 2.0? Zie voor meer informatie hierover deze wiki waarin verwezen wordt naar de 2004 aflevering van de genoemde conferentie.
De best of the Web, volgens Businessweek
De editors van Businessweek hebben een ‘best of the Web’ lijstje gemaakt. Er zitten de standaard bronnen in die op ieder lijstje voor moeten komen, Google, Amazon en eBay. Maar daarnaast websites waarvan ik denk: Oh ja, maar soms ook mij weer afvraag wat is dat nu weer. Kortom een leuke lijst om verder te verkennen. In elk geval is de indeling niet alledaags, omdat ze als hoofdrubrieken @work, @home, @play, Toolbox en Public Domain gekozen hebben. Bij Frankwatching is een wiki gestart met Nederlandse alternatieven voor de keuzes van Businessweek. Wat ik het aardigst van de discussie bij Frank vind is dat hij meteen een bruggetje probeert te slaan naar Web 2.0. Wanneer ik het gros van de Businessweek lijst bekijk zitten daar veel klassieke Internet concepten, natuurlijk zijn er categorieën als samenwerking, podcasts en veel blogging, maar om het daarom meteen de term nieuwe Web te verbinden met Web 2.0 is een brug te ver.
29 september 2005
FeedShot
Feeshot is een hulp om je Blog feed in een keer bij 20 Blog zoekmachines aan te melden. 20 Blog zoekmachines? Ik moet meteen toegeven dat sommigen ook zeer obscuur zijn. Het lijstje van FeedShot is wel heel leuk om verder te bekijken.
Bron: ResearchBuzz
Bron: ResearchBuzz
Startlog
Een nieuw verzamel initiatief van Weblogs in Nederland. Ik heb deze site ook maar meteen aangemeld, eens zien of dat helpt om populair te worden. Startlog wil de concurrentie aangaan met andere (echte?) nieuwsbronnen, door de weblogs te rubriceren naar interessegebied. Helaas, is de indeling op dit moment niet erg diepgaand. Ik heb gekozen voor ICT, maar zou eigelijk een sticker als Internet of Web willen hebben. Mischien het allerliefst in het hokje van Information Retrieval gestopt willen worden. Dat laatste is zoeken in goed Nederlands. Ik heb de vraag van twee hokjes nu maar even aan me voorbij laten gaan.
Bron: IPonline
Bron: IPonline
28 september 2005
Wat? 9,5 miljard
Gaf ik gisteren nog een truc weg om een beetje een idee te krijgen over de omvang van de Google index, vandaag vind ik met precies dezelfde zoekvraag 1,5 miljard pagina's meer. http://www.google.com/search?q=%2Diopuhjklhh geeft nu 11,2 miljard pagina's. Wanneer ze met dit tempo groeien dan behoort 60 miljard tot de mogelijkheden. Ik moet er wel meteen erbij aangeven dat ik weet dat exact dezelfde zoekacties op hetzelfde moment vanaf twee verschillende PC soms met (behoorlijk)verschillende resultaataantallen kunnen komen. Maar in dit geval krijg ik een donkerbruin vermoeden dat Google wat aan hun index, of resultatenpagina aan het veranderen is. Ik denk dat dit even wordt vervolgd.
Update: vanochtend (29/09) staat de teller weer op 9,6 miljard.
Update: vanochtend (29/09) staat de teller weer op 9,6 miljard.
27 september 2005
Google is jarig, maar vooral groot
Google is zeven jaar oud. De felicitaties waard. In echte mensenleeftijd is dit zeer volwassen. Het gaat allemaal zo snel op het Web. Kortom feestje voor Google. Maar er zit in het bericht nog een bottom-line: "this latest expansion of our index, which makes Google more than 3 times larger than any other search engine". Waar Yahoo! nog een maand geleden een robbertje vechten met zijn concurenten aankondigde, door te claimen meer dan 20 miljard items geindexeerd te hebben. Komt Google nu met het antwoord, we zijn 3 keer zo groot als onze dichtsbijzijnde rivaal (Lees Yahoo!).
Om alles kracht bij te zetten is op de voorpagina het aantal geindexeerde documenten komen te vervallen (was ongeveer 8,5 miljard). Die documenten teller heeft altijd een springerig gedrag gehad, en nooit een vloeiend opgaande lijn zoals je zou verwachten. Geen 8,5 miljard dus, maar hoeveel wel? Dat vertellen ze niet. In de meeste blogs wordt het ook afgedaan als niet belangrijk, de maat doet er niet toe, de kwaliteit van de resultaten telt. Relevantie! Wat dat betreft houd ik nog steeds verdomd veel van Google. De ranking van de resultaten is nog steeds ongeevenaard. Toch vind ik de vraag naar de omvang van de index wel spannend. Een indicatie is een negatieve zoekactie op een niet bestaand woord. [-iopuhjklhh] resulteert in ruim 9,5 miljard documenten. Dan hebben we nog Google images, scholar, print, local, video, news, groups, blogsearch en nog veel meer. Die 20 milard items halen ze wel bij Google. Maar drie keer zo groot zou betekenen 60 miljard items! Dat plaatst de laatste -wetenschappelijke- schatting over de omvang van het web in een wel heel vreemd daglicht. Gulli en Signori telden 11,5 miljard pagina's. De wetenschappers gaan waarschijnlijk de fout in omdat zijn alleen html documenten tellen. Terwijl alle plaatjes, mp3's, en video's een vele malen grotere aanspraak maken op de omvang van het web. Google zelf nodigt iedereen uit om een schatting te geven. Ik denk dat ze 9,5 miljard afgezaagd vinden. Maar het blijft een intrigerende vraag. Hoe groot is het Web? En hoe meet je dat, en waarin druk je dat uit.
Anderen die wat zinnigs over dit onderwerp zeiden:
Charlene Li
John Batelle
Danny Sullivan
Om alles kracht bij te zetten is op de voorpagina het aantal geindexeerde documenten komen te vervallen (was ongeveer 8,5 miljard). Die documenten teller heeft altijd een springerig gedrag gehad, en nooit een vloeiend opgaande lijn zoals je zou verwachten. Geen 8,5 miljard dus, maar hoeveel wel? Dat vertellen ze niet. In de meeste blogs wordt het ook afgedaan als niet belangrijk, de maat doet er niet toe, de kwaliteit van de resultaten telt. Relevantie! Wat dat betreft houd ik nog steeds verdomd veel van Google. De ranking van de resultaten is nog steeds ongeevenaard. Toch vind ik de vraag naar de omvang van de index wel spannend. Een indicatie is een negatieve zoekactie op een niet bestaand woord. [-iopuhjklhh] resulteert in ruim 9,5 miljard documenten. Dan hebben we nog Google images, scholar, print, local, video, news, groups, blogsearch en nog veel meer. Die 20 milard items halen ze wel bij Google. Maar drie keer zo groot zou betekenen 60 miljard items! Dat plaatst de laatste -wetenschappelijke- schatting over de omvang van het web in een wel heel vreemd daglicht. Gulli en Signori telden 11,5 miljard pagina's. De wetenschappers gaan waarschijnlijk de fout in omdat zijn alleen html documenten tellen. Terwijl alle plaatjes, mp3's, en video's een vele malen grotere aanspraak maken op de omvang van het web. Google zelf nodigt iedereen uit om een schatting te geven. Ik denk dat ze 9,5 miljard afgezaagd vinden. Maar het blijft een intrigerende vraag. Hoe groot is het Web? En hoe meet je dat, en waarin druk je dat uit.
Anderen die wat zinnigs over dit onderwerp zeiden:
Charlene Li
John Batelle
Danny Sullivan
De wereld van Wi-Fi
Een leuk, populair geschreven, artikel in de Scientific American, voor de niet ingevoerde techno-buff over Wi-Fi. Je weet wel, draadloos Internet maar dan op het station, je hotel, in de file, op school of in de bibliotheek, bedenk maar waar, overal en altijd toegang. Meestal tegen behoorlijke kosten. Maar die kosten zullen alleen maar dalen. In dit artikel wordt ingegaan op de problemen die zich voordoen, en de oplossingen die zijn gevonden. Daarom Smart Wi-Fi. Ik moet nog een jaar wachten maar dan heeft mijn baas het ook, en kan ik tegen die tijd vertellen of het ook lekker werkt.
Bron: Scientific American: Smart Wi-Fi [ COMMUNICATIONS AND INFOTECH ]
Wireless access to the Internet via Wi-Fi is increasingly popular, so the technology is being upgraded to ensure that users get prompt, reliable service
Bron: Scientific American: Smart Wi-Fi [ COMMUNICATIONS AND INFOTECH ]
Wireless access to the Internet via Wi-Fi is increasingly popular, so the technology is being upgraded to ensure that users get prompt, reliable service
26 september 2005
Nederlands Soortenregister
In het kader van nuttige bronnen. Het Nederlandse soortenregister. Deze database geeft een zo volledig mogelijke lijst van alle in Nederland voorkomende wezens. Schimmels, planten en dieren, alles wat leeft om een zo compleet mogelijk overzicht te geven van de Nederlandse biodiversiteit.
MSN straks ook met eigen advertenties
Volgens de NY Times, gaat MSN met z'n eigen advertentieprogramma komen. Dan staan de grote drie zoekmachines geheel op eigen benen. Het heeft even geduurd, maar begin dit jaar is MSN overgeschakeld van Yahoo! (Intkomi) resultaten naar hun eigen zoekmachine, maar waren ze nog afhankelijk van Yahoo! (Overture) voor de advertenties. Nu gaan ze het geheel dus in eigen hand nemen. In hetzelfde NY Times wordt Microsoft VP Mehdi ook aangehaald met de uitspraak dat MSN de zoekresultaten gaat verbeteren. "a gap Mr. Mehdi says he is working to close". De slag om de gunst van de zoeker is nu in volle hevigheid losgebarsten. Onthoud, zoekmachines zijn niet alleen voor de zoekresultaten maar voor het verkopen van advertenties. En dat is een zeer serieuze business.
25 september 2005
Charlene Li over Google Blogsearch
Op dit moment zit ik mijn komende rubriek over Blogsearch uit te zoeken. Tijdens het uitvoeren van mijn huiswerk kwam ik deze analist van Forrester tegen. Iemand die zeer snel reageert en duidelijk van wanten weet. Een zeer goede eerste reactie.
Het web voor wetenschappelijk onderzoek
Aardig, maar niet bevredigend, artikel waarin wordt gedemonstreerd dat er veel wetenschappelijke informatie te vinden en beschikbaar is op het web. Voor ervaren webzoekers is dat geen geheim, maar het is goed dat het op deze wijze gedocumenteerd is. Wat mijn wel verbaasde in dit artikel is de tijd die de onderzoekers nodig hadden voor het doen van hun zoekacties. De voorbereiding van de zoekactie in Biosis en CAB bedroeg 3,5-4 uur, en het zoeken en evalueren duurde 2,5 uur. Voor de web zoekmachines was de voorbereiding 1,5-2 uur het zoeken nam zelf 3 uur in beslag, maar de controle (post processing) voor de webresultaten nam ook nog eens 3 uur in beslag. Dat een zoekactie goed voorbereid wordt juich ik toe maar wanneer die 3,5 tot 4 uur bedraagt voor Biosis en CAB dan ga ik er vanuit dat het geen ervaren gebruikers van deze databases zijn. Kortom ik verwacht dat de gestructureerde databases een grotere tijdswinst zouden kunnen en moeten geven. Geen ervaren zoekers, en slechts een zoekvraag en daar een heel artikel op baseren, dat is eigenlijk dus geen onderzoek, maar moeten we scharen on anekdotische verhaaltjes.
Doldi, L.M. & E. Bratengeyer (2005). The web as a free source for scientific information: a comparison with fee-based databases. Online Information Review 29(4): 400-411. http://dx.doi.org/10.1108/14684520510617848
Doldi, L.M. & E. Bratengeyer (2005). The web as a free source for scientific information: a comparison with fee-based databases. Online Information Review 29(4): 400-411. http://dx.doi.org/10.1108/14684520510617848
23 september 2005
Mijn eerste post
Natuurlijk niet de eerste blogpost die ik ooit geschreven heb, maar wel de eerste op dit domein. Eigenlijk zou hier moeten staan test, test, test....
Nu zie je ook wel oudere posts hier verschijnen. Die heb ik overgeheveld van mijn Bloglines account. Echt goed kan je die historie niet makkelijk over te krijgen, en ik vraag me af of dat de moeite wel waard is.
Nu zie je ook wel oudere posts hier verschijnen. Die heb ik overgeheveld van mijn Bloglines account. Echt goed kan je die historie niet makkelijk over te krijgen, en ik vraag me af of dat de moeite wel waard is.
22 september 2005
Connotea wint ALPSP prijs
De uitgevers waren unaniem in oordeel over Connotea van Nature. Ben Lund, Project Manager, Nature Publishing Group vertelde tijdens de ontvangst van de prijs: “We are delighted Connotea has won the 2005 ALPSP Publishing Innovation Award. Connotea began as an experiment with the emerging technology of social bookmarking but very quickly became a new information and reference management service for scientists as we realised the potential of this approach.”
Bron: Resourceshelf
21 september 2005
Schrijver klagen Google (Print) aan
Niet alleen uitgevers trekken aan de bel bij Google over Google Print, nu beginnen ook schrijvers. Belletje trekken is in dit geval echter serieuzer dan het ouderwetse spelletje. Hier gaat het om rechtzaken met heuze advocaten en dien aangaande hoge rekeningen. Het gaat in dit geval over schrijvers van boeken, proza en poezie en dat allemaal nog beschermd door het auteursrecht, niet zo zeer de schrijvers die in wetenschappelijke artikelen publiceren.
Bron: NY Times (registratie verplicht)
Microsoft shakes up its business
Toch aardig om te zien dat MSFT de concurrentie nu echt begint te voelen. Google wordt gezien als een hele grote bedreiging, en dan niet alleen op het gebied van zoektechnologie. Als je goed kijkt naar wat Google doet, dan heeft het veel grootsere plannen. Maar naast de Google's is er natuurlijk ook concurrentie van Firefox of van Playstation op andere fronten. Die concurrentie komt trouwens niet alleen van andere bedrijven. Ook de regelgevers houden het bedrijf zwaar in de gaten.
Bron: BBC News
Bron: BBC News
Opera wordt vrij beschikbaar
Opera heeft de ambitie om Internet Explorer en Firefox van de troon te stoten. Opera bestaat al een hele tijd, maar tot nu toe slechts 5e op de lijst van browser software volgens WebAnalytics in mei '05
May 2005 Browser/Market Share:
Microsoft Internet Explorer - 87.23%
FireFox - 8.06%
Netscape - 1.64%
Safari - 1.91%
Mozilla - 0.58%
Opera - 0.51%
Other - 0.07%
Wat doet dit Noorse bedrijf? Ze gaan Opera gratis beschikbaar stellen. Ze hadden het kunnen weten van Microsoft, en vervolgens van Firefox, dat serieuze marktpenetratie pas gemaakt wordt met vrije software. En vrije software dient wel vrij te zijn van reclame, ook dat gaan ze nu doen. WoW!
Ben al een tijd Firefox fan, nu maar eens nadenken over Opera of dat ook de moeite waard is.
May 2005 Browser/Market Share:
Microsoft Internet Explorer - 87.23%
FireFox - 8.06%
Netscape - 1.64%
Safari - 1.91%
Mozilla - 0.58%
Opera - 0.51%
Other - 0.07%
Wat doet dit Noorse bedrijf? Ze gaan Opera gratis beschikbaar stellen. Ze hadden het kunnen weten van Microsoft, en vervolgens van Firefox, dat serieuze marktpenetratie pas gemaakt wordt met vrije software. En vrije software dient wel vrij te zijn van reclame, ook dat gaan ze nu doen. WoW!
Ben al een tijd Firefox fan, nu maar eens nadenken over Opera of dat ook de moeite waard is.
20 september 2005
MSN's Feed Syntax Temporarily Disabled
Had ik net nagedacht over het nieuws rond de Google Blogsearch, die geen blogsearch is maar een feedsearch. Onderwijl mijzelf weer herrinnerd dat MSN onlangs een feed commando had ingevoerd. Lees ik vandaag dat deze mooie feature alweer niet werkt.
Verder onder de grote zoekmachines is er ook beweging waar te nemen bij ASK, zij zijn in Japan begonnen om een speciale zoekmachine voor blogs te introduceren, waarbij weer speciale aandacht uitgaat naar podcasts. ASK is een belangrijke speler in dit veld omdat zij weer de eigenaar naar zijn van Bloglines. Ik denk na Blogger een van de populairste Blogging tools. In het voorjaar kondigde Bloglines al aan in de zomer met de beste blogsearch tool te willen komen. Ondertussen zijn ze overgenomen door ASK, niet de grootste, maar wel een grote zoekmachine, maar is de blogsearch tool nog niet daar. Het beweegt zicht dus in Japan.
Ondertussen de vraag wat doet Yahoo!?
Daarnaast blijven Clusty en Technorati eigenlijk wel de toppers voor blogsearch.
Source: Researchbuzz
Verder onder de grote zoekmachines is er ook beweging waar te nemen bij ASK, zij zijn in Japan begonnen om een speciale zoekmachine voor blogs te introduceren, waarbij weer speciale aandacht uitgaat naar podcasts. ASK is een belangrijke speler in dit veld omdat zij weer de eigenaar naar zijn van Bloglines. Ik denk na Blogger een van de populairste Blogging tools. In het voorjaar kondigde Bloglines al aan in de zomer met de beste blogsearch tool te willen komen. Ondertussen zijn ze overgenomen door ASK, niet de grootste, maar wel een grote zoekmachine, maar is de blogsearch tool nog niet daar. Het beweegt zicht dus in Japan.
Ondertussen de vraag wat doet Yahoo!?
Daarnaast blijven Clusty en Technorati eigenlijk wel de toppers voor blogsearch.
Source: Researchbuzz
15 september 2005
Google doorzoekt nu ook weblogs
Maar natuurlijk weer een volgende zoekmachine. Wie zei er nu dat de enkele zoekbox van Google ideaal is? Die uitspraak kunnen we voorlopig bij het oud papier zetten. Niets is zo lastig als het (goed) zoeken met Google. Ik hoop maar dat ze dat bij Google zich ook maar eens gaan realiseren. Bij Soople hebben ze natuurlijk het potentiele antwoord, maar daar moeten we op dit moment even twee dagen op wachten (ze zijn onder constructie!).
Maar het gaat natuurlijk om de Blogsearch (of in het Nederlands). Het is fijn dat de beste zoekmachine van dit moment ook blogs serieus gaat nemen, maar dat deden ze al door Blogger over te nemen, en zo onstuimig te laten groeien. Dat ze ook hun zoektools aan moesten passen heeft relatief lang geduurd, en dat in een markt die groeistuipen vertoond, en waar geen alles omvattend zoekmachine het voor het zeggen heeft. Tot nu toe kreeg je de beste resultaten op dit gebied met de blogmetazoekmachine (gaat die naar van Dale?). Clusty, die doorzoekt in een keer de belangrijkste blogzoekers zoals Blogdigger, Blogpulse, Daypop, Feedster en Technorati.
Met een stap als deze zal Google beter omgaan dan het blogzoeken door Gigablast die het een tijd lang niet deed. Maar de Google blogzoekmachine zal in de loop van de tijd zijn kracht moeten bewijzen.
Kortom wordt vervolgd.
Maar het gaat natuurlijk om de Blogsearch (of in het Nederlands). Het is fijn dat de beste zoekmachine van dit moment ook blogs serieus gaat nemen, maar dat deden ze al door Blogger over te nemen, en zo onstuimig te laten groeien. Dat ze ook hun zoektools aan moesten passen heeft relatief lang geduurd, en dat in een markt die groeistuipen vertoond, en waar geen alles omvattend zoekmachine het voor het zeggen heeft. Tot nu toe kreeg je de beste resultaten op dit gebied met de blogmetazoekmachine (gaat die naar van Dale?). Clusty, die doorzoekt in een keer de belangrijkste blogzoekers zoals Blogdigger, Blogpulse, Daypop, Feedster en Technorati.
Met een stap als deze zal Google beter omgaan dan het blogzoeken door Gigablast die het een tijd lang niet deed. Maar de Google blogzoekmachine zal in de loop van de tijd zijn kracht moeten bewijzen.
Kortom wordt vervolgd.
02 september 2005
Franstalige bronnen
Tot mijn grote verbazing wordt in dit artikel geclaimed dat er meer Franstalige webcontent is dan Spaans en slechts een beetje minder dan (Mandrijns) Chinees. Het artikel gaat verder in op goede Franstalige bronnnen op het Web. Er wordt natuurlijk gestart met Gallica, maar dan volgen er nog veel meer bronnen die de moeite waard zijn. Natuurlijk vrij veel Canadeze bronnen.
bron: Searcher Sept. 2005
bron: Searcher Sept. 2005
