О Linux-статистике

21 ноября издание InternetNews.com опубликовало статью, в которой сообщается о том, что Red Hat Fedora претендует на лидерство в Linux-сообществе. При этом сайт ссылается на руководителя проекта Пола Фрилдса, который утверждает, что дистрибутивы Fedora 7-й, 8-й и 9-й версий в настоящее время используют, как минимум, 9,5 миллионов пользователей. А их основной конкурент Ubuntu может похвалиться только 8 миллионами.

Это дает нам хороший повод поговорить как об этих числах, так и о рейтингах различных свободных продуктов. Насколько они серьезны, стоит ли им верить и кому все это нужно?

Если оставить в покое мировое общественное мнение, которое нам традиционно малоинтересно, российские пользователи Linux, достигшие дееспособного возраста, ко всякой статистике достаточно равнодушны. По крайней мере, с практической точки зрения.

И действительно, что может дать знание того, что некий продукт А популярнее продукта Б? Тем более, если самому пользователю нравится дистрибутив С, менять который на что-то другое он не видит никаких разумных причин. Аргумент, заключающийся в том, что надо делать так, как сосед, всерьез никем не воспринимается — на вкус и цвет, как известно, товарищей нет.

Впрочем, Linuxforum — один из ведущих ресурсов по технической поддержке пользователей Linux — вот уже четвертый год проводит специальный опрос с целью выяснить, какой именно дистрибутив наиболее востребован отечественным пользователем. В 2005 г. акцию поддержало 405 человек, в 2006-м — 263, в 2007-м — 263, в 2008-м — 231. Очевидно, что при таком числе участников говорить о какой-то вменяемой репрезентативности результатов по меньшей мере наивно.

Очевидно, что обсуждение статистических данных очень быстро сходит на сугубо технические рельсы и превращается в обмен мнениями о достоинствах и недостатках каждого продукта. То есть к тому, что имеет хоть бы какой-то практический смысл.

Как правило, если возникает необходимость как-то оценить популярность того или иного дистрибутива, используются данные ресурса Distrowatch.com. Но публикуемые там рейтинги получены не какими-то сложными исследованиями, а определяются количеством кликов по ссылкам, расположенным на этом сайте. Таким образом, результат носит не столько количественный, сколько качественный характер. Да и то только тогда, когда сравниваются два продукта, очень далеко отстоящие один от другого по шкале. Все это знают и относятся к подобного рода сопоставлениям с известной долей иронии.

Более-менее всерьез воспринимаются только заявления одной известной компании о безоговорочном доминировании ее собственной продукции. Но и при этом не приводятся какие-то конкретные данные, а объясняется, что получить реальные числа о использовании Linux малореально, а брать цифры с потолка — некорректно.

Вряд ли кто-то будет проводить серьезные и, соответственно, дорогие исследования на сей счет, а коль возникнет такое желание, то Linux-сообщество быстро отсоветует. Мол, значительно лучше употребить время и деньги на что-то действительно полезное.

Тем не менее, в последнее время наблюдается некоторая тенденция к изменению ситуации. По всей видимости, причина этого в том, что линия на внедрение СПО не только всерьез рассматривается, но и воплощается в ряде государств. В частности, правительство Норвегии выделило два миллиона крон Национальному центру компетенции в области СПО для разрешения одной проблемы, связанной с привязкой Microsoft Office к специализированным серверным приложениям, с которыми не всегда работает OpenOffice.org. Да и у нас в России на реализацию известного школьного проекта государство предусмотрело определенное финансирование.

В связи с этим у некоторых коммерческих предприятий может возникнуть желание как-то поучаствовать в Linux-бизнесе. И, разумеется, им интересно знать, на какой именно дистрибутив лучше ориентироваться с точки зрения наличия спроса. Если это так, то господа зря стараются. Чтобы лучше это понять, проанализируем метод, при помощи которого и были получены данные о лидерстве дистрибутива Fedora. А заодно и узнаем, чего они на самом деле стоят.

Пол Фрилдс сообщил, что подсчет проводился по уникальным IP-адресам, с которых направлялись запросы на обновление дистрибутива. На первый взгляд, достаточно разумный подход, сразу позволяющий отсечь тех, кто по каким-то причинам скачал образ компакт-диска с продуктом, а потом решил не устанавливать систему.

Кстати говоря, способ учета пользователей по числу покупок или скачиваний уже давно раскритикован в пух и прах, поэтому и не применяется. Очевидно, что для свободной ОС нельзя использовать методы, аналогичные оценке объемов продаж. Хотя бы потому, что значительная часть копий не покупается, а бесплатно выкачивается, причем не с официальных, а с альтернативных серверов, расположенных, например, в городских локальных сетях.

Да и Microsoft не стоило бы переоценивать значение этого критерия. Особенно с учетом того, что значительная часть копий системы Windows Vista, предустановленной на ноутбуки, удаляется либо сразу, либо после непродолжительной эксплуатации. А тратить время на официальное оформление этого действия с целью вернуть себе деньги многие пользователи не хотят или не могут.

Вернемся к методике, предложенной Полом Фрилдсом. Она могла бы быть хорошей, если бы все пользователи имели постоянный IP-адрес в глобальной сети. Но в действительности это не так.

Во-первых, провайдеры применяют так называемые динамические адреса. В результате этого одна и та же машина может быть посчитана несколько раз, что приводит к завышению количества пользователей.

Во-вторых, абоненты городских и районных сетей, “спрятавшиеся” за NAT (Network Address Translation), имеют для расположенного в интернете сервера один и то же IP-адрес. И сколько бы их не использовали дистрибутив Fedora, счетчик будет считать, что это одна и та же машина. Это, в свою очередь, приводит к занижению рейтинга.

Как нетрудно догадаться, точность такого результата — плюс-минус два слона. И воспринимать его всерьез вряд ли стоит.

Разумеется, из всего этого не вытекает, что Fedora — плохой продукт. Или что этот дистрибутив лучше или хуже Ubuntu.

Ведь на поставленный вопрос уже давно имеется единственно правильный ответ. Самый лучший дистрибутив — это тот, который используете вы. Оспорить этот тезис не удавалось еще никому.

Главная тема: 
field_vote: 
Пока без оценки

Комментировать

Filtered HTML

  • Use [fn]...[/fn] (or <fn>...</fn>) to insert automatically numbered footnotes.
  • Доступны HTML теги: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd> <blockquote> <strike> <code> <h2> <h3> <h4> <h5> <del> <img>
  • Адреса страниц и электронной почты автоматически преобразуются в ссылки.
  • Строки и параграфы переносятся автоматически.

Plain text

  • HTML-теги не обрабатываются и показываются как обычный текст
  • Адреса страниц и электронной почты автоматически преобразуются в ссылки.
  • Строки и параграфы переносятся автоматически.