родные, всем привет🐸

вот я сижу уже в самолёте в состоянии прекрасной машинки на фото (я называю это отдых), и у меня грустная новость - сегодня мой последний день с вами👀

но есть и хорошая - после меня придёт кто-то потрясающий, а посему для меня большая честь передать эту эстафету✨

но перед уходом я хотел бы подсветить одну очень интересную тему, затронутую одним из подписчиков канала в комментариях: "мне всегда было непонятно
неужели число панелистов достаточно что бы все эти доли рейтинга на мелких телеканалах и узких аудториях считать.
кажется что каждое случайное переключение канала у этого человека переспределяет миллионы рекл бюджетов"

так вот я решил ответить на этот вопрос отдельным небольшим постом, так как методика подсчёта реально интересная☝️

действительно, на первый взгляд кажется, что одно чихание панелиста меняет всё. но вот как это работает на деле:

* статистика спасает
- панель огромная: ~9к+ домохозяйств (6.7к в городах 100к+, 2.3к в малых) + дачи. каждый пиплметр логирует всех в доме по кнопкам (кто смотрит);
- не голые клики
сырые данные калибруют по демографии, региону, прошлым опросам (типа "что ты смотрел вчера?"). одно переключение - это кроха в общей массе, усредняется по тысячам людей

* для мелких каналов
- рейтинги/доли - статистическая экстраполяция на всю популяцию (млн. зрителей). малый канал с 0.1% долей на панели = реальные 100к зрителей после scaling'а;
- рандом не рулит: большая выборка + стратификация (возраст/пол/город) минимизируют шум. если панелист - зумер-каналосёрфер, то его веса корректируют под средний профиль

короче, это как A/B-тесты в ML: один outlier не сломает модель, если датасет солидный. для супер-мелких ниш (типа "Котик ТВ в Урюпинске") данных может не хватить - тогда рейтинг "низкий/нестабильный". подробнее можно глянуть в методологии Mediascope😰

на этой прекрасной ноте я прощаюсь, с вами было очень хорошо!🫶