Истории о применении регрессионного анализа

Всем привет!

Судя по опросу на моём телеграмм-канале, большинству было интересно прочитать истории про применение статистики. Истории не будут связаны с металлургией, но, думаю, продемонстрируют всё силу этого инструмента. Подобное применение данным может найтись и в металлургической промышленности.

Истории я придумал не сам, а честно списал из вот этой замечательной книги Чарльза Уилана «Голая статистика».

БАНКИ

Сочетание огромных объемов цифровых данных и дешевой вычислительной мощности позволяет нам гораздо лучше понимать поведение человека.

[...]

Компании, выпускающие кредитные карточки, находятся на переднем крае такого анализа, поскольку они знают наши личные данные и покупательские привычки, а их модель ведения бизнеса сильно зависит от умения находить клиентов, кредитный риск (то есть риск неплатежа) которых сравнительно невелик. (Идеальные клиенты с точки зрения кредитного риска, как правило, расточительны, так как каждый месяц полностью оплачивают свои счета; клиенты, располагающие крупными балансами с высокими процентными ставками, генерируют солидные прибыли – пока не окажутся неплатежеспособными.) Одно из самых интересных исследований того, кто, скорее всего, оплатит счет, а кто нет, было выполнено Дж. П. Мартином, любителем математики и одним из сотрудников компании Canadian Tire, крупной сети розничной торговли, специализирующейся на продаже широкого спектра автозапчастей и автомобильных аксессуаров, а также ряда других товаров. Когда Мартин проанализировал каждую транзакцию, выполненную с помощью кредитной карточки Canadian Tire за предыдущий год, оказалось, что покупки, совершенные клиентами в прошлом, являются весьма точным предиктором их будущего «покупательского» поведения, если использовать этот показатель в сочетании с такими традиционными инструментами, как величина дохода и кредитная история.

Статья в The New York Times, озаглавленная «Что знает о вас компания, выпустившая вашу кредитную карточку?», содержала описание некоторых из самых интересных выводов Мартина: «Люди, которые покупают дешевые непатентованные моторные масла, с гораздо большей вероятностью уклонятся от платежей по кредитным карточкам, чем те, кто предпочитает дорогостоящие фирменные товары. Те, кто покупает датчики угарного газа для дома или мягкие войлочные подкладки для ножек стульев и табуреток, чтобы не царапать пол в комнате, почти никогда не увиливают от платежей. Практически каждый, кто купил какой-либо из дешевых автомобильных аксессуаров, впоследствии с большой долей вероятности не оплатит свой счет».

[...]

TARGET

Чтобы сегодня оценить потенциал имеющихся у нас данных, достаточно рассмотреть пример сети розничной торговли Target. Подобно большинству компаний, Target стремится повысить прибыль за счет лучшего понимания своих клиентов. Для этого она нанимает специалистов по статистике, перед которыми ставится задача выполнить своего рода «упреждающий анализ» (о нем уже упоминалось в этой книге); они используют данные продаж в сочетании с другой информацией о потребителях, чтобы выяснить, кто, что и почему покупает. Ничего изначально плохого во всем этом нет: просто это означает, что ближайший к вам магазин Target хочет знать, что вам как потребителю может понадобиться.

Но давайте рассмотрим хотя бы один пример того, что могут «вычислить» специалисты по статистике, обосновавшиеся в плотно зашторенных комнатах цокольного этажа корпоративной штаб-квартиры. Target выяснила, что беременность – особенно важное время с точки зрения построения моделей покупательского поведения. У беременных женщин вырабатываются определенные «отношения с розничной торговлей», которые могут длиться десятилетиями. В результате Target хочет выявить беременных женщин – особенно тех, кто на четвертом – шестом месяцах, – и заманить их в свои магазины, чтобы они посещали их как можно чаще. Один из журналистов The New York Times Magazine наблюдал за тем, как бригада специалистов по упреждающему анализу компании Target пыталась это сделать.

Первая часть задачи решалась достаточно просто. У Target есть специальный реестр, в котором беременные женщины регистрируются, чтобы еще до рождения ребенка приобрести все товары, необходимые для новорожденного. Эти женщины уже являются клиентками Target, и они, по сути, сами сообщают магазину о своей беременности. Но здесь есть одна статистическая уловка: компания «вычислила», что другие женщины, которые демонстрируют аналогичное покупательское поведение, также, вероятно, беременны. Например, беременные женщины зачастую переходят на использование неароматизированных лосьонов, начинают покупать витаминные добавки, огромные упаковки ватных тампонов. Специалисты по упреждающему анализу компании Target выявили двадцать пять наименований товаров, которые в совокупности составляют «признак, позволяющий предсказать беременность». Цель этого анализа заключалась в том, чтобы послать беременным женщинам соответствующие купоны в надежде сделать их постоянными покупательницами Target.

Насколько эффективной оказалась данная стратегия? The New York Times Magazine поведал своим читателям историю о мужчине из Миннеаполиса, который зашел в один из магазинов Target, чтобы поговорить с менеджером. Мужчина был разгневан тем, что Target буквально бомбардировал его дочь-старшеклассницу купонами для беременных женщин. «Она еще учится в школе, а вы присылаете ей купоны на детские кроватки и одежду для новорожденного! Может быть, вы предлагаете ей побыстрее забеременеть?!» – возмущался мужчина.

Менеджер извинялся и заверял мужчину, что это не более чем досадная ошибка. Через несколько дней менеджер еще раз позвонил этому мужчине, чтобы извиниться. На сей раз мужчина вел себя гораздо спокойнее и в свою очередь тоже посчитал нужным извиниться. «Понимаете, у меня в доме небольшой переполох, – сказал он. – Одним словом, она должна родить в августе».

Статистики Target узнали, что его дочь беременна, раньше, чем он!

Может быть, они суют нос не в свои дела – или все-таки это их дела? Иногда складывается впечатление, что их внимание к нам чрезмерно. Именно поэтому некоторые компании пытаются делать вид, что знают о нас гораздо меньше, чем им известно на самом деле. Если, например, вы – женщина и находитесь на четвертом – шестом месяце беременности, то в вашем почтовом ящике могут появиться купоны на детскую кроватку и бумажные полотенца – вместе с предложением скидки на газонокосилку и купоном на бесплатные носки для боулинга (при условии покупки любой пары обуви для боулинга). Появление в вашем почтовом ящике купонов для беременных в сочетании с рекламой других товаров, не имеющих никакого отношения к беременности, может показаться вам чистой случайностью. В действительности компания знает, что вы не увлекаетесь боулингом и не стрижете лужайку перед домом. Просто она пытается «замести следы», делая вид, что знает о вас гораздо меньше, чем ей известно на самом деле.

[... ]

FACEBOOK

Facebook, компания, у которой практически нет физических активов, стала одной из самых дорогих в мире. С точки зрения инвесторов (в отличие от пользователей), Facebook располагает одним колоссальным активом – данными. Инвесторам не нравится Facebook, поскольку из-за этой компании они иногда наталкиваются в сети на своих бывших одноклассниц. Инвесторам нравится Facebook, так как каждый щелчок мышью приносит им данные о месте проживания пользователей, о магазинах, где они обычно совершают покупки, о том, какие покупки они делают, и о том, кого они знают и как проводят свободное время.

Крис Кокс, производственный вице-президент Facebook, сказал в интервью The New York Times: «Проблема информационной эпохи заключается в том, как распорядиться информацией».

Вот так-то.

[...]

РЕЗЮМЕ

Мы лишь приступаем к решению проблем, которые находятся на пересечении технологий и персональных данных. Ни одна из них не была настолько актуальна, когда соответствующая информация хранилась на пыльных стеллажах в подвалах серьезных государственных учреждений, а не в цифровых базах данных, в которые в принципе может забраться любой желающий. Статистика в наши дни играет даже более важную роль, чем когда-либо прежде, поскольку сейчас у нас появилось больше возможностей для эффективного использования данных. Однако сами по себе формулы не подскажут нам наилучшие способы их использования. Иными словами, математика не может заменить суждение.

Учитывая вышесказанное, давайте завершим эту книгу, попытавшись найти связь между следующими словами: огонь, ножи, автомобили, крем для удаления волос. Каждая из этих вещей служит важной цели. Каждая делает нашу жизнь лучше. И каждая может создать серьезные проблемы в случае неосторожного с ней обращения.

Теперь вы можете добавить статистику в этот список. Она наверняка поможет вам лучше понять многие явления нашей жизни при условии, что вы будете пользоваться статистическими инструментами разумно и по назначению!

 

Если хотите начать разбираться в этой занимательной и крайне полезной теме, то рекомендую начать с прочтения книги Владимира Савельева «Статистика и котики» — фрагмент книги для ознакомления будет ниже — и  пройти курс Анатолия Карпова «Основы статистики». Успехов!

 

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Поделиться ссылкой:

Рубрика: Анализ данных в Excel. Метки: . Добавьте постоянную ссылку на эту страницу в закладки.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *