Linux E X P R E S

Facebook

Je Linux opravdu jen na 1 % desktopů?

chartgo.png

Článek z různých úhlů diskutuje metody měření tržního podílu operačních systémů. Dále se soustředí mimo jiné na stereotypní proklamace o jednoprocentním globálním podílu Linuxu. Celý článek hovoří pouze o podílu desktopového Linuxu mezi desktopovými operačními systémy.


Globální tržní podíl

Metodika průzkumu tržního podílu není komplikovaná. Nástroje webové analytiky (např. Piwik, Google Analytics) třídí přístupy v závislosti na operačním systému, kterou extrahuje například z hlaviček. Společnosti nabízející v této sféře své služby kumulují data z mnoha webů, nasbírané údaje zprůměrují a výsledek interpretují jako „tržní podíl operačních systémů“. Wikipedie za nejrelevantnější výzkumy považuje tyto:

Windows

jiný než Windows

Linux

Mac OS X

poměr Mac OS X ku Linuxu [:1]

AT Internet

87,1 %

12,9 %

1,0 %

6,7 %

6,7

Clicky Web Analytics

79,5 %

20,5 %

1,2 %

13,3 %

10,8

Chitika

77,2 %

22,8 %

2,9 %

10,2 %

3,5

Net Market Share

85,0 %

15,0 %

1,1 %

6,4 %

5,8

StatCounter Global

82,1 %

17,9 %

0,7 %

6,8 %

9,7

StatOwl

78,9 %

21,1 %

0,7 %

14,0 %

20,0

W3Counter

80,2 %

19,8 %

1,7 %

8,9 %

5,8

Webmasterpro

85,8 %

14,2 %

1,4 %

6,3 %

4,5

čtenáři Wikipedie

73,8 %

26,2 %

1,5 %

8,5 %

5,7

Na první pohled jsou patrné evidentní nesrovnalosti. Penetrace Linuxu nabývá minima 0,7 % u StatCounteru a čtyřnásobného maxima 2,9 % u Chitiky. I pro Mac OS X se závěry nepřijatelně rozchází. Proporce Linuxu vůči Mac OS X kolísají o několik set procent. Celkově lze zpochybnit samotnou důvěryhodnost metodiky měření, jak bude ještě ukázáno.

Následující informace se zakládají na heslu Internet v Číně na anglické Wikipedii a únorovém veřejném výstupu NetMonitoru, který zkoumá českou internetovou populaci.

Třeba v rozhodném vzorku StatsCounteru připadá Čínské lidové republice přibližně stejná váha jako Maďarsku. Asijský obr má cca pět set milionů uživatelů internetu, což se rovná počtu všech obyvatel Evropské unie. Naopak ve statistice jsou silně nadužívána data o uživatelích ze Spojených států amerických. Vysvětlení disproporcí je prosté. Ačkoli se tvůrci statistik holedbají mamutím rozsahem měření, ve skutečnosti však o reprezentativnosti vzorku nemůže být ani řeč. Vzorky jsou totiž sestaveny hlavně z anglofonních stránek.

Zvyklosti Číňanů vykazují množství jedinečných specifik. V systému posílání zpráv QQ, který zůstává zbytku světa téměř neznámý, komunikuje 710 milionů aktivních účtů. Pro dokreslení: na celém Facebooku se nachází srovnatelných přibližně 750 milionů aktivních účtů. Na Facebook a Twitter rovnou zapomeňte, protože v Číně frčí síť QZone (540 milionů aktivních účtů) a mikroblogovací služba Weibo (310 milionů aktivních účtů). Vyhledávačům dominuje Baidu. Světová jednička Google hraje druhou ligu se společnostmi jako Alibaba a Soho. Rovněž Wikipedia v Číně neuspěla, protože Říši středu ovládly encyklopedie Hudong (5,4 milionů článků) a Baidu Baike (3,5 milionů článků).

Výsledky jsou zkresleny dvěma způsoby:

  • Vzorek je geograficky nevyváženě strukturovaný.

  • Měření nehodnotí průměrného uživatele. Monitorování čínské internetové populace skrze anglofonní stránky podceňuje preference běžných uživatelů a přeceňuje preference atypických uživatelů (např. západní turista s vlastním notebookem).

Různé důvody nasvědčují, že tržní podíl Linuxu v regionech jako Čína překračuje tržní podíl v západních regionech. Mnozí komentátoři proto polemizují se zažitou frází o jednoprocentním podílu Linuxu a někteří skutečné globální číslo u Linuxu odhadují dokonce mezi deseti a patnácti procenty. Tvůrci populárních statistik však lpí na zprofanované metodice, nediskutují její přesnost a neaplikují opravné korekce. Mýtus jednoho procenta funguje jako sebeutvrzující proroctví, protože média se staví ke spekulacím o vysokém globální podílu Linuxu skepticky a nevěřícně. Orientace statistik na USA a obecně anglicky mluvící země ústí ve značný pesimismus u Linuxu.

Situace v České republice

Net Market Share: Praha je Mekkou Linuxu! Net Market Share: Praha je Mekkou Linuxu!

S absurditami se však nesetkáme jen u exotických končin, nýbrž i při hodnocení České republiky. Povězme si nyní více o domněnkách Net Market Sharu. V Praze prý Linux reprezentuje celých 16 % trhu s operačními systémy. Situaci v České republice však nelze paušalizovat. Třeba v Jihočeském kraji a Moravskoslezském kraji se podíl Linuxu drží prý okolo jednoho procenta. Celkově vychází republikový průměr přibližně na osm procent, což představuje zhruba sedminásobek oproti kulturně a geograficky spřízněnému Slovensku.

Návštěvnost zahraničních webů

Čas trávený Čechy na zahraničních webech podle NetMonitoru:

žádný nebo téměř žádný

61,8 %

asi do 10 %

19,7 %

asi 10 % až 30 %

8,3 %

asi 31 % až 50 %

4,5 %

asi 51 % až 70 %

1,8 %

více než 70 %

0,8 %

nevím

3,10 %

Z tabulky vyplývá, že majoritní uživatel nenavštěvuje jakékoli zahraniční weby a tím spíše nenavštěvuje zahraniční weby v angličtině. Navíc dle průzkumů většina Čechů neovládá angličtinu, což sráží motivaci k návštěvě stránek v angličtině.

Znalost angličtiny v EU, zdroj: Eurobarometr Znalost angličtiny v EU, zdroj: Eurobarometr

Pro úplnost poznamenejme, že se v anketě blíže definuje „zahraniční server“ jen jako „čas strávený na zahraničních serverech v cizích jazycích vyjma slovenštiny“. Jak klasifikovat servery (např. YouTube) s převládajícím cizojazyčným obsahem? Jak klasifikovat příhraniční weby (např. web Bayern-Parku) s českou lokalizací? Zahraniční weby nejsou děleny v závislosti na jazyku.

Relevantní výsledky

Relevantní české statistiky pocházejí pouze od lokálních subjektů měřících tuzemský internet. Jejich výstupy vyznívají pro Linux příznivě. Například podle Top Listu Linux dlouhodobě expanduje, přičemž loni zaznamenal stoprocentní nárůst. Aktuální tržní podíl Linuxu v České republice by se měl pohybovat okolo 3,3 procentního bodu.

Různé deviace

Výsledky zatěžují systematická chybová rezidua.

  • Mezi příznivci různých operačních systémů se různé oblibě těší funkce anonymního surfování. Při určitých kombinacích prohlížeče s operačním systém se nezobrazuje informace o operačním systému.

  • Internet procházejí různé stroje, které například pořizují databázi kontaktů pro rozesílání spamu, manipulují internetová hlasování nebo realizují podvody s PPC reklamou. Tyto automaty se skrývají za běžný provoz. Analytické společnosti nejsou schopny rozlišit „falešný“ robotický provoz od „správného“ lidského provozu.

  • Mezi klientem a webovou stránkou může poskytovatel internetu provádět optimalizace, které znemožňují přesná měření. Například místo předání požadavku je vrácena stránka z cachovacího serveru, a tudíž cílový server neví o všech svých čtenářích. Některé firewally mohou ořezávat HTTP hlavičky, což znemožňuje rozpoznání operačního systému.

  • I běžný aplikační software může autonomně surfovat na internetu. Tento bod se týká třeba bezpečnostního softwaru od AVG surfujícího jako uživatel Microsoft Windows s Internet Explorerem.

Portfolio sledovaných portálů musí být tematicky vyvážené, aby byl sledován průměr internetové populace.

  • Různé sociodemografické skupiny preferují odlišné operační systémy i webové stránky.

  • Nedostatky jednotlivých operačních systémů vytvářejí poptávku po specifických stránkách. Například weby nabízející aplikace ke stažení budou atraktivní především pro uživatele, kteří závisí na archaické distribuci softwaru prostřednictvím binárních instalátorů. Uživatelé Linuxu pochopitelně upřednostní modernější způsob distribuce softwaru prostřednictvím repozitářů.

Oscilace dle Clicky Web Analytics Oscilace dle Clicky Web Analytics

Pravidelné výkyvy zahladí až dlouhodobá statistika.

  • Chování uživatelů silně závisí na datu. Ilustrační graf dokazuje týdenní periodicitu a předvádí abnormality v době Vánoc.

  • Mnozí nepravidelní uživatelé si rádi otestují nové verze. Publikační cyklus nejmasovějších distribucí vychyluje statistiku.

I při teoretickém vyloučení rušivých vlivů není výpovědní hodnota statistiky valná. Z pozice obchodníka není zřejmé, co statistika vlastně měří.

  • Jak se projevují počítače, na kterých je instalováno vícero systémů v dualbootu?

  • Jak by se projevily při započítání počítačů, které neslouží k přístupu na internet?

  • Jak se projevují domácnosti s dvěma počítači?

  • Jak se projevuje, když jeden počítač patří mnoha uživatelům?

Tržní podíl a uživatelský podíl

Přesně řečeno rozebíraná webová metrika odhaduje spíše „uživatelský podíl“ (usage share), který nesouhlasí s „tržním podílem“ (market share). Uživatelský podíl odpovídá na otázku: Kolik je uživatelů? Tržní podíl odpovídá na otázku: Jaký obrat generují uživatelé?

Uveďme názorný příklad. Nainstaluji-li si Linux sám, pak nedošlo k uskutečnění žádného obchodu. Stal jsem se uživatelem Linuxu, a proto ovlivňuji „uživatelský podíl“. Přitom jsem se neúčastnil na žádném trhu, takže neovlivňuji „tržní podíl“. Ponechme stranou přesné definice, které se beztak autor od autora odlišují. Oba koncepty se rozcházejí kupříkladu v následujících situacích.

  • Zákazník si koupí sestavu s Windows, protože touž sestavu s Linuxem prostě nesežene. Následně kupující nechtě původní operační systém přeinstaluje počítač na kýžený operační systém. Z optiky „trhu“ se stále jedná o jeden kus prodaný s Windows.

  • Počítače prodané bez operačního systému by statistika „tržního podílu“ neměla brát v úvahu. Analogicky by byly opomenuty i pirátské instalace Windows.

  • Uživatelský podíl závisí na životnosti softwaru. Například vlastníci OEM licencí musí při vyřazení počítače odepsat licenci a zakoupit novou OEM licenci.

Vyhodnocení „uživatelského“ a „tržního“ podílu se může dramaticky odlišovat. Například analytická společnost IDC, kterou rád cituje Microsoft, sleduje útraty za software při prodeji serverů. Zprávy IDC tvrdí, že Linux má tržní podíl na serverech 16,9 % . Pochopitelně hodnota ignoruje instalace Debianu, CentOSu a dalších komunitních distribucí, na serverech velkých společností jako Google, dodatečně doinstalované operační systémy, na osobní počítače využívané jako servery atd., které tvoří desítky procent v „uživatelském“ podílu.

V České republice linuxoví spotřebitelé zpravidla nekupují operační systém a navazující služby. Předpokládám, že „tržní podíl“ Linuxu výrazně zaostává za jeho „uživatelským podílem“.

Velikost trhu v České republice

Principiálně rozeznáváme dvě cesty k získání operačního systému.

  • Prodávají se celé komplety, které sestávají z nainstalovaného operačního systému a hardwaru. Tato jednoduchá cesta se vyplatí především méně kvalifikovaným uživatelům, kteří si přímo nevybírají operační systém.

  • Spotřebitel zakoupí hardware a posléze si svépomocí nainstaluje vlastní operační systém. Tuto cestu volí dostatečně kvalifikovaní a angažovaní uživatelé, kteří si přímo vybírají operační systém.

Řečeno s nadsázkou, vymezují se dva izolované trhy s operačními systémy. Windows a Mac OS X soutěží na obou trzích. V mainstreamových obchodech se prakticky nenabízí sestavy s předinstalovaným Linuxem, takže Linux soutěží jen na jednom omezeném trhu. Pro posouzení růstového potenciálu Linuxu je nutné stanovit zastoupení kvalifikovaných uživatelů, kteří vědí o existenci různých operačních systémů a dokážou se aktivně rozhodnout. Příslušnými kompetencemi se zabývají následující dvě tabulky.

IT znalosti dle NetMonitoru:

Základní

64,5 %

Nadstandardní

32,2 %

Profesionální

3,1 %

Škálování je hrubé a nezahrnuje úroveň pod základními znalostmi. Pro respondenty s omezenou počítačovou gramotností chybí adekvátní zařazení. Podrobné objasnění kategorií není uvedeno, takže respondenti deklarovali úroveň svého vzdělání ryze subjektivně.

O úrovni kvalifikace vypovídají i uživatelem provozované aktivity.

Uživatelské aktivity dle NetMonitoru:

Instalace/odinstalování/aktualizace softwaru

31,6 %

Starám se sám o bezpečnost počítače

27,6 %

Měním sám hardware

12,4 %

Starám se o počítač druhým lidem mimo naši domácnost

8,8 %

Naprogramuji jednoduchý program

6,5 %

Nic z uvedeného

56,9 %

Alternativní statistiky

Ankety

Tazatelé mohou klást respondentům různé otázky ve věci Linuxu. Šetření může mít formu internetové ankety. Například server abclinuxu.cz.

Údaje o stahovanosti

Distributoři a provozovatelé repozitářů uvolňují statistiky stahovanosti, které by měly korespondovat s počtem uživatelů.

Popularita

Místo tržního podílu se můžeme zabývat „popularitou“. Do indexu popularity může zakomponovat hledanost klíčových slov týkajících se Linuxu, počet webů obsahujících tato klíčová slova, návštěvnost tematických serverů o Linuxu, množství vydávaných monografií a nejrůznější další faktory. Společnost Tiobe takto postupuje při sestavování Tiobe indexu popularity programovacích jazyků.

Poznatky stran rozšířenosti konkrétních distribucí novináři často čerpají ze zobrazených údajů o návštěvnosti serveru distrowatch.com.

Diskuze (27) Nahoru