Hoe groot is de jouwe?
Okay, dacht Arnoud, dat gaan we checken. In zijn post gebruikt hij de "site:{domeinnaam}"-techniek van Google om erachter te komen welke sites de meeste pagina's hebben en komt tot de conclusie dat de rangschikking van SiteDetail fout is. De nummer 1, Hyves, zou veel minder resultaten opleveren dan de nummer 2, eBay. Volgens SiteDetail komt dat doordat de "ajax-pagina's" van Hyves niet in de Google-index worden meegerekend. De met ajax gegenereerde pagina's zouden ook meegenomen moeten worden in de berekening.
Okay, denk ik dan. Daar wil ik, for the sake of argument, best even in meegaan. Wat is dan echter de goede index? Hoeveel pagina's heeft Hyves volgens SiteDetail? En hoeveel heeft eBay er? En hoe zit het met partijen als NU.nl (die volgens hun URL's een indruk wekt over het miljoen heen te zitten als je puur naar nieuwsberichten kijkt) of FOK!?
FOK! staat op plek 32, zegt SiteDetail, en NU.nl op 39. Okay. Met hoeveel pagina's? Is dat nog steeds grotendeels gebaseerd op Google-achtige gegevens, zij het met eigen interpretatie? Want dan wordt het allemaal wel erg arbitrair.
FOK! heeft volgens Google 338.000 pagina's. Dat klopt al niet. We hebben op het forum onlangs de grens van 1 miljoen topics overschreden. Daarbij hebben we ruim 75.000 nieuwsberichten, 3600 reviews en 2000 columns op de frontpage, ruim 16.000 berichten op de FOK!weblog, ruim 17.000 berichten en 8000 productpagina's op FOK!games en meer dan 37.000 nieuwsberichten op FOK!sport. En dan zijn we er nog niet. We hebben nog wat variaties: duizenden fotoboekprofielen, eindeloze overzichtspagina's, uitgebreide sportmanagerstatistieken, niet-meetbare privepagina's, tijdelijke sites voor Big Brother en de Olympische spelen, meerdere pagina's met gebruikersreacties voor elk van de genoemde berichtenpagina's en weet ik wat nog allemaal meer.
De vraag is of SiteDetail dat soort zaken allemaal meerekent. Zo niet, wat wordt er bij de andere sites in de lijst dan wel allemaal niet overgeslagen? Elke site is op een eigen manier ingedeeld, en op z'n eigen manier wel of niet transparant in hoe omvangrijk de site is. Kan een objectieve onderzoeker dat wel allemaal ontdekken?
Ik ben nieuwsgierig naar de exacte (of geschatte) wijze van meten. Wie is er nu echt de grootste? Want als je het toch wil meten (blijkbaar is het belangrijk, misschien een mannendingetje?), doe het dan wel correct.