Про machine learning

Еще давным-давно наши предки изобрели то, что сейчас на хайпе и называется Machine Learning. Я говорю про народные приметы.

«Если муж бьет жену, то он её любит».

Давайте разберемся с этим утверждением. Казалось бы, какая тут может быть взаимосвязь? «А хрен его знает», — скажет умный человек и будет прав. Но блэк бокс, которому на вход дали сигнал «бьет», через неведомую интуитивную связь выносит вердикт: «любит». Может быть, выборка была плохая, может быть веса расставили неверно, а может наш ум не в силах этого понять, потому что слишком много измерений тут замешано…

Но тем не менее на выходе мы получаем утверждение, которое как бы не имеет явной связи, но может быть истинным или хотя бы вероятностно истинным, потому что так решил интеллект.

Что с этим делать? Либо верить, либо не верить. Либо еще вариант — попытаться установить фактическую, а не вероятностную связь.

Мораль моего поста такова: злоупотреблять приметами не стоит; в идеальном розовом мире нужно искать четкий, формальный ответ с конкретной причино-следственной связью.

Про телевидение

Телевидение являет собой странный пример бизнеса, у которого практически нет обратной связи с потребителем. Объясню на примере.

Вот есть, например, компания по производству телефонов. Произвели они, допустим, миллион штук, выложили на полки и в течение года продали, допустим, 800 тыс. штук. Затем разработали новую модель, продали 900 тыс. штук. И так далее.

Производитель может четко понимать спрос на свой товар, чтобы управлять производством.

А как телек считает просмотры и вовлеченность? Просмотры, лайки и репосты — ключевые метрики для видео-материала. Такие метрики есть на побеждающем Ютубе, но их нет в ламповом телевидении.

В итоге, как руководители каналов понимают, что некую передачу лучше поставить утром, вечером или в обед? Все делается по принципу «best guess»? Или главное вообще что-нибудь в эфир поставить? Как провести А/Б тест и узнать а что будет, если вместо ток-шоу о бесконечных людских проблемах и страданиях поставить познавательную передачу про путешествия? Отбросив всю зомботу про политику и типа модерацию из Кремля, как телек формирует повестку? Как он узнает, что хочет смотреть просто русский телезритель?

Мне кажется, такое производство товара, как у телека, является тупиковым. Телевидение абсолютно точно должно научиться точно считать наш выбор в отношении той или иной передачи, измерять демографию того, кто смотрит и должно быть готовым гибко менять, переставлять контент и замерять интерес к нему.

Должен сказать, что телерейтинги на самом-то деле уже считаются: делается это по небольшой заранее отобранной группе потребителей, оснащенных специальными девайсами. У этого способа куча «но», основное — большие вопросы к репрезентативности. И второе — онлайн трансляции каналов на сайтах самих телеканалов — отличный потенциал смотреть вовлеченность в разрезе всего социального профиля посетителя сайта.

Ключевым переломным моментом в соревновании между телеком и Интернетом должен стать тот факт, что интернет станет таким же повсеместным и легко доступным, как и телек. В этом случае телек, подключенный к интернету, получит доступ на огромное количество площадок с контентом, доступным для просмотра, а телеку будет нелегко продолжать втюхивать ненужный контент в глаза телезрителей.

Для интересующихся, нашел для вас хорошую ссылку на страницу с рейтингами телепередач:

http://mediascope.net/services/media/media-audience/tv/national-and-regional/audience/?arrFilter_pf%5BCITY%5D=2192&arrFilter_pf%5BPERIOD%5D=17%2F12%2F2018+-+23%2F12%2F2018&arrFilter_pf%5BTYPE%5D=42470&captcha_code=0aaead588959b694e51cce4c8e930e21&captcha_word=afnwj&set_filter=Y

 

Ложные корреляции

На одну из вакансий аналитика в Яндексе когда-то была следующая задача.

Есть 10 монет, в течение недели вы подбрасываете каждую из них и записываете прогноз на рост курса доллара. Какова вероятность того, что к концу недели хотя бы одна из монет даст 100% верный прогноз на каждый из дней?

Правильный ответ: хотите подумать? Ответ можно найти в конце поста.

Какой практический результат из этого можно извлечь?

Предположим, что вы прикупили биткоины — ваши любимые биточки. Затем, дабы не прогореть с ними и вовремя их сбросить, а может наоборот затариться на всю кассу, вы решаете подписаться на ленту какого-нибудь крутого и заумного аналитика. И чтобы выбрать аналитика поумнее вы решаете посмотреть, кто же из них лучше дает прогноз за прошедший год или два…

А теперь внезапно перемещаем себя на месте эксперта, который пишет аналитику.

Какова вероятность того, что среди 12 лент, в каждой из которых авторами дано по 12 прогнозов (по одному в месяц), одна из них будет содержать безупречно точный ответ? А что если в одиночку вести 12 таких лент и топить менее популярные.

Профит. Игра с вероятностью, ничего личного.

Ответ на задачу: 70%.

С этой записи я начинаю новую рубрику «Аналитика», где хочу подробнее рассказывать об этой, наверное, профессии, и делиться с вами своими фишками.