We weten allemaal dat Joomla een enorm populair CMS is. In het verleden zijn er diverse pogingen gedaan om het aantal websites dat Joomla gebruikt in te schatten. Hoewel deze pogingen waardevolle bijdrage aan de discussie waren, heeft elk van hen gebruikgemaakt van zijn eigen methoden en heeft daarom ook zijn eigen tekortkomingen. Enkele van deze eerdere pogingen zullen besproken worden en een nieuwe methode om het aantal websites dat Joomla gebruikt te schatten zal worden gepresenteerd.

countingjoomla
Foto door: valeblos

Pogingen gedaan door anderen

De eerste en waarschijnlijk meest bekende poging om een aantal websites dat Joomla gebruikt te tellen is gedaan door Barry M. North op zijn blog Compass Designs in juni 2007. Door te kijken naar link data verzameld van Google en Yahoo schatte hij het aantal websites dat Joomla gebruikt op zo'n 30 miljoen.

JoomlaShack plaatste twee jaar later in 2009 op hun blog dat zij het aantal websites dat Joomla gebruiken (gebaseerd op het aantal downloads van Joomla) op dat moment inschatten op 'enkele tientallen miljoenen'.

Een andere poging is een aantal maanden later in augustus van 2009 gedaan door Joomla.me. Anders dan te kijken naar het totale aantal Joomla websites, besloten zij de focus te leggen op het aantal succesvolle Joomla website. Hun analyse, gebaseerd op gegevens van Alexa, toonde dat ongeveer 2,5 % van alle succesvolle website op het Internet op Joomla draaien.

Kritiek op eerdere pogingen

De methoden gebruikt door twee van de eerdere studies hebben kritiek uit de community ontvangen. Bijvoorbeeld Brian Teeman gaf aan dat "het aantal downloads is interessant, maar het geeft ons geen echte getal van het aantal installaties, in het bijzonder omdat je een download honderd keer kunt gebruiken of hem kunt installeren direct vanaf de host.". Een ander punt van kritiek kwam van Alledia die aangaf dat zij de resultaten wat vreemd vonden. Na verdere inspectie van de resultaten gaven zij de schuld aan het gebruik van gegevens van Alexa.com welke zij een "berucht onbetrouwbare bron van website bezoekers getallen noemden".

Interessant genoeg heb ik geen bewijs kunnen vinden dat de studie gedaan door Compass Designs bekritiseerde werd. Laten we ten behoeve van de discussie even aannemen dat de resultaten van deze studie correct waren en er daadwerkelijk 30 miljoen websites op Joomla draaiden in 2007. Volgens studies gedaan door Netcraft waren er in juni 2007 (op het moment dat de blog op Compass Designs werd gepubliceerd) zo'n 55.800.000 actieve domeinen op het Internet. Binnen dit getal worden subdomeinen als example.blogger.com en test.blogger.com als verschillende domeinen gezien. Wanneer dit getal vergeleken wordt tegen het aantal gepubliceerd op de blog van Compass Designs, zou dit betekenen dat op dat moment ongeveer de helft van alle actieve websites op het Internet draaide op Joomla. Zelfs wanneer er gebruik gemaakt wordt van de bodem van de range gekozen om de schattingen op te baseren (10 miljoen websites die draaien op Joomla), zou dit betekenen dat één op de vijf websites (of 20%) op dat moment draaide op Joomla. Nog een andere mogelijke onvolkomenheid aan de studie heeft betrekking op de manier waarop de "powered by Joomla!" melding werd gebruikt.

De bodem van de range blijkt bepaald door het aantal pagina's dat "Powered by Joomla!" bevat. Echter, na een analyse van de eerste 50 resultaten op Google.com voor de zoekterm "Powered by Joomla!" bleek dat slechts één op de tien websites daadwerkelijk de zin "Powered by Joomla!" bevatten en waarbij het woord Joomla ook als link terug naar de Joomla.org website staat ingesteld. Hoewel sommige van deze websites wel daadwerkelijk op Joomla zijn gebouwd en ook een link terug naar joomla.org  bevatten, gebruiken ze niet de originele "powered by" boodschap. Het punt hier is dat Barry (door gebruik te maken van de "Powered by Joomla!" boodschap als een indicator) mogelijk de bodem van zijn range met tot wel 80 % heeft overschat.

Een indicatie van de omvang

De omvang van het Internet is enorm. Om je een impressie te geven van wat de getallen betekenen, kun je het volgende voorstellen. Je staat op een voetbalveld in een rood gemarkeerd blok van 1 bij 1 meter. Dit voetbalveld is ongeveer 8.300 meter lang en 10.000 meter breed. Als het rood gemarkeerd blok jouw domeinnaam is, dan is het voetbalveld het Internet. Wat getallen:

  • Het totale aantal webpagina's geïndexeerd door zoekmachines op 2 juni 2010 volgens WorldWideWebSize is ongeveer 21,59 miljard
  • Het totale aantal domeinen op juni 2010 (met inbegrip van subdomeinen) volgens Netcraft in hun maandelijkse enquête is ongeveer 200 miljoen
  • Het totaal aantal geregistreerde domeinen (met alle subdomeinen tellende als een domein) is volgens DomainTools ongeveer 120 miljoen
  • Het totale aantal hoofddomeinen opgenomen in de index van Linkscape door SEOmoz is ongeveer 86 miljoen
  • Het totale aantal actieve domeinen op juni 2010 (met inbegrip van subdomeinen) volgens Netcraft in hun maandelijkse enquête is ongeveer 83 miljoen

Gezien wij in deze studie kijken naar websites en niet naar webpagina's, kijken we niet naar het getal dat WorldWideWebSize ons geeft. Omdat de studies door Netcraft laten zien dat meer dan de helft van de domeinen inactief zijn (en hierom geen Joomla installatie zullen bevatten) zullen ook niet verder naar dit getal kijken. Een soortgelijke redenering kan worden toegepast op het getal gegeven door DomainTools. Gezien de studies door Netcraft laten zien dat veel domeinen ongebruikt zijn, kun je aannemen dat het getal dat DomainTools geeft een overschatting is van het werkelijke aantal websites op het Internet. Waarnemende dat het aantal domeinen in de SEOmoz Linkscape index nog steeds stijgt met elke update, kunnen we aannemen dat dit getal waarschijnlijk zal stijgen tot zo'n 100 miljoen domeinen. Dit zou verklaren waarom het aantal actieve domeinen zoals gerapporteerd door Netcraft slechts marginaal lager is dan het aantal domeinen zoals opgenomen in de index van Linkscape, ondanks dat de data van Netcraft subdomeinen bevat.

Gezien de lange looptijd van de studie door Netcraft kunnen we aannemen dat deze data waarschijnlijk het meest accuraat is. Hierom definieerden wij hierbij het aantal 'websites' op het Internet voor het doel van deze studie op 83 miljoen.

counting_joomla_field
Foto door: nightthree

Huidige aanpak

In de huidige aanpak zal worden geprobeerd verschillende technieken te integreren die door andere onderzoekers gebruikt zijn. Dit in een poging een betere inschatting te maken van een aantal websites dat gebruikmaakt van Joomla. Eerst zullen we kijken naar twee websites die proberen de technologieën bloot te leggen die ten grondslag liggen aan verschillende website op het Internet.

W3Techs gebruikte Alexa rankings om vast te stellen wat de top 1 miljoen websites zijn. Zowel sub domeinen als doorverwezen domeinen werden uitgesloten uit de onderzoeken. W3Techs geeft aan dat "op dit moment gebruik 19,15 % van de top 1 miljoen websites één van de CMSen die wij waar kunnen nemen". 19,15 % van 83 miljoen betekent dat 15.894.500 enig CMS gebruiken (inclusief Wordpress). Als 11,2 % van deze websites Joomla gebruikt zoals vermeld in hun bevindingen, betekent dit dat 1.780.184 (2,14 % van 83 miljoen) websites gebouwd zijn op Joomla. Wanneer dit aantal vergeleken wordt tegen hetgeen gevonden door Joomla.me (2,5 % van de top 1 miljoen websites die bekeken werden, wat extrapoleert naar 2.075.000 websites in totaal), geeft dit zeer soortgelijke resultaten.

BuiltWith gebruikt een dwarsdoorsnede van de wedstrijd domeinen die ingevoerd worden op BuiltWith.com en de Quantcase Top Million om de distributie van zijn CMS systemen te berekenen. De diepte van de analyse is gebaseerd op wat BuiltWith kan vinden en is normaal gesproken gebaseerd op code van derden. BuiltWith laat zien dat 9,71 % van de websites die werden bekeken gebruik maken van enig CMS dat zij waar kunnen nemen. Als 9,14 % van deze websites gebruikmaken van Joomla zoals zij in hun bevindingen aangeven, betekent dit dat 375.310 (0,43 % van 83 miljoen) websites gebouwd zijn op Joomla. Een mogelijke oorzaak waarom dit getal zoveel lager is dan het percentage gevonden door Joomla.me en W3Techs is de uitsluiting van Wordpress als een CMS in de analyse van BuiltWith.

Link data zoals gerapporteerd door OpenSiteExplorer laat zien dat er ongeveer 264.789 domeinen linken naar Joomla.org (link data zoals gerapporteerd door Google door gebruik te maken van het 'link:' commando wordt niet betrokken in deze analyse aangezien het serieuze tekortkomingen vertoont zoals werd gerapporteerd door de mensen van SEOmoz). Dit getal is veel interessanter dan het aantal webpagina's dat linkt naar Joomla.org, gezien een website die 10.000 pagina's bevat hiermee 10.000 links terug naar Joomla.org zal genereren. Echter, dit getal is veel lager dan de geschatte 1,9 miljoen websites zoals gerapporteerd door W3Techs en Joomla.me. Een waarschijnlijke verklaring hiervoor is dat het aantal mensen dat een commerciële template gebruikt waar geen link terug naar Joomla.org in staat, en het aantal mensen dat de link terug naar Joomla verwijderd van de originele term waarnemende dat de getallen gerapporteerd door SEOMoz, W3techs en Joomla.me, een representatief resultaat vertonen, zou dit betekenen dat meer dan 90 % van alle Joomla gebruikers de link terug naar Joomla.org op enige manier weghaalt.

Conclusie

Al het bovenstaande bewijs in betrekking nemende, schat ik dat er tussen de 1,5 en 2 miljoen websites gebruikmaken van Joomla op het Internet. Ik hoor zeer graag over gemaakte fouten in denkpatronen, statistieken, berekeningen of algemene methoden, zodat ik deze kan corrigeren in het artikel en mogelijk een betere schatting kan maken.

Heb jij net als Theo zelf een artikel geschreven dat je graag met andere Joomla gebruikers wilt delen? Neem dan contact met ons op.

2 reacties

EasyDiscuss Avatar
Sander Potjer
Hartelijk dank voor je artikel Theo. Ik denk dat dit in ieder geval een van de meest onderbouwde en geloofwaardige schatting is.
EasyDiscuss Avatar
ronalduz
Interessant, dank!

Reageer

1000 Resterende tekens