Спецпроєкти

Утка года: как расследование Das Magazin ввело всех в заблуждение


1
Почему нам нужно успокоиться и перестать бояться больших данных.

Всю прошлую неделю мир взволнованно обсуждал результаты расследования издания Das Magazin, в котором речь шла о том, как Big Data и таргетированная реклама в соцсетях помогли Дональду Трампу одержать победу на президентских выборах в США. Многие поспешили назвать этот материал текстом года. Объясняем, почему массовая истерия вокруг расследования и изложенные в нем выводы оказались неоправданно преувеличенными и почему мы, скорее всего, имеем дело не с текстом года, а с крупнейшей журналистской уткой уходящего 2016-го.

Что случилось?

maxresdefault-8

В начале декабря швейцарский журнал Das Magazin опубликовал материал о том, как британская компания Cambridge Analytica, объединив в один мощный сплав технологию Big Data, персональные данные пользователей Facebook и таргетированную рекламу в соцсетях, помогла Дональду Трампу стать президентом США вопреки всем ожиданиям. Также выяснилось, что услугами Cambridge Analytica пользовались радикальные организации, настроенные на выход Британии из Евросоюза. Этот материал был переведен на русский язык изданием The Insider, и его принялись массово распространять в качестве ответа, некоего универсального объяснения Трампу в президентском кресле и победы сторонников Brexit.

В начале статьи — история Михала Косински (Michal Kosinski), ученого, который первым, как кажется во время прочтения, придумал «подружить» психометрию с большими данными. Дальше история переключается на компанию Cambridge Analytica, которых представляют такими себе злыми гениями, воспользовавшимися наработками Косински для победы Трампа. Суть метода Cambridge Analytica в следующем: они скупают все доступные (и труднодоступные) массивы данных об интернет-пользователях, а затем на основании полученной информации тщательно создают такую рекламу для соцсетей, которая бы, во-первых, точно привлекла внимание конкретного психотипа, а во-вторых, заставила принять нужное решение (отдать голос за Трампа).

kos

Михал Косински

В ход идет все: лайки, поисковые запросы, геометки — абсолютно все «следы», оставляемые пользователями в интернете. В тексте утверждается, что технология Косински, взятая на вооружение Cambridge Analytica, — это социология совершенно нового типа и по совместительству мощное оружие массового воздействия. Соцопросы и деление по гендерному или географическому признаку уже не работают — это слишком просто. Новый сложный мир, в котором мы живем, требует гораздо более сложных решений.

Уверенный стиль изложения статьи, компоновка достоверных фактов с обилием художественных деталей («задумчивый Косински, прилизанный Никс и широко улыбающийся Трамп») и упрощенная, «разжеванная» логика сложных явлений помогли этому материалу стать, что называется, «вирусным» и получить широчайшее распространение в Сети. Людям, до сих пор возмущенным и обескураженным последними событиями (в том числе победой Трампа), пришлось по душе складное и простое объяснение: оказывается, в их адрес применили новое страшное оружие управления массами. А словосочетание Big Data вместо размытых и абстрактных представлений приобрело отчетливые зловещие оттенки.

В общем, народу преподнесли историю в духе сериала «Черное зеркало»: есть такой благородный ученый Косински, который хотел предупредить мир об опасности, затем нашлись его циничные последователи (Cambridge Analytica), применившие теоретические знания на практике, и есть абсолютный победитель, нажившийся на этом (Трамп). Герои и злодеи. Добро, зло и пострадавшие (мы с вами). И мало кто заметил, что слишком уж подозрительно стройной вышла эта теория о заговоре вокруг больших данных.

Модель OCEAN

20161024_wp_cambridgeanalytica_01441477450998

Директор Cambridge Analytica Александр Никс

В основе метода Михала Косински, который позаимствовали предприимчивые люди из Cambridge Analytica, используется так называемый метод OCEAN — попытка описать тип личности с помощью таких пяти популярных параметров, как открытость, добросовестность, экстраверсия, доброжелательность, нейротизм (в английском переводе эти слова образуют аббревиатуру OCEAN, которая и дала название методу). Еще с XIX века (все началось с исследований основателя психометрики Фрэнсиса Гальтона в 1884 году) психологи пытались дифференцировать этот метод изучения личности, но за прошедшие годы исследований количество параметров было сокращено с более чем сотни до пяти. Сделано это было, очевидно, для удобства применения модели OCEAN, но с ее соответствующим огрублением. В своем нынешнем виде пятифакторная модель личности используется с 1980-х.

В «расследовании Das Magazin» упоминают об этом факте, но после предложения «в 1980-е годы два психолога доказали, что каждая черта характера может быть измерена при помощи пяти измерений» сразу же перескакивают на историю Михала Косински. Это и создает манипулятивный эффект: у тех, кто не слишком-то знаком с развитием психологии как науки, возникает ощущение, что именно Косински всерьез взялся изучать и применять этот метод на практике, а до него этим как будто бы никто не занимался. Но это, конечно, не так.

С 1990-х кадровики уже пытались внедрить модель OCEAN, чтобы иметь возможность оценивать соискателей работы при найме персонала. В 2003 году в SA Journal of Industrial Psychology вышло исследование, целью которого было выявить взаимосвязь между характеристиками личности и качеством выполнения работы. В исследовании приняли участие 159 сотрудников фармацевтической компании, которых попросили пройти NEO PI-R — методику психологической диагностики личности, являющую собой опросник из 240 вопросов. Результаты исследования показали, что эмоциональная устойчивость, экстраверсия, открытость к новому опыту и добросовестность связаны с выполнением рабочих задач и креативностью. А три параметра измерения личности (эмоциональная устойчивость, открытость опыту и уступчивость) объяснили всего лишь 28 % процентов результатов, оказавшихся отклонением от усредненного значения.

То есть модель OCEAN смогла обработать и объяснить меньше трети полученных результатов, да и то с оговорками.

dialoguesclinneurosci-15-135-g001

В дальнейшем количество исследований в этой области — личностные качества сотрудников и то, как эти качества влияют на выполнение рабочих задач — только росло. Было проведено больше сотни исследований, из которых стало понятно, что пятифакторная модель — это, конечно, просто и удобно, но собирать данные для построения модели OCEAN сложно: слишком длинный опросник и слишком высокая вероятность того, что опрашиваемый человек наврет в своих ответах.

С появлением и активным внедрением социальных сетей в нашу жизнь исследователи пятифакторной модели переключились на интернет-пользователей. В период между 2011–2012-м годами Михаил Косински как раз и приобрел известность благодаря своим предупредительным научным работам, в которых изучал потенциал применения этого метода. Чуть позже это подхватили мировые СМИ, и уже в 2013 году, например, на сайте таблоида The Independent появилась статья (одна из множества подобных) о том, как нас легко можно предсказать по нашим лайкам в соцсетях.

В действительности точность предсказаний по пятифакторной модели оказалась довольно спорной. Здесь можно посмотреть на список лайков страниц на фейсбуке и «личностные характеристики», которые они собой означают согласно Five Factor Model.

Умные — это те, кто лайкает кинофильм «Крестный отец» и «Властелин колец», шоу The Colbert Report, песенку Thunderstorms, слово «наука» и т. д. Сторонники Демократической партии — это те, кто залайкали следующие страницы: Joe Biden; Health Care Reform; The White House; Democrats; Being Liberal; Barack Obama 2012.

Не слишком репрезентативная выборка, не правда ли?

В 2013 году стало понятно, что помимо сочетания FFM и Big Datа есть еще Big Big Data и множество более перспективных игровых моделей, на которые и переключились профессиональные исследователи и до сих пор испытывают. Михал Косински тоже не стал зацикливаться на тупиковой (по крайней мере, на сегодняшний день) сфере пятифакторной модели: в декабре 2015 года, например, у него вышла работа, посвященная выяснению причин несовпадения вкусов и пристрастий у супругов и друзей.

Однако в медиа и в сознании людей остался этот конспирологический шлейф вокруг использования больших данных сильными мира сего ради собственной выгоды.

Скажи мне, кто твой лайк

gettyimages-622122640

Об этом нигде нет упоминания в «расследовании», но то самое «страшное оружие» Косински, основанное на анализе Big Data, можно протестировать самостоятельно. Опробовать на себе демоверсию революционной технологий, с помощью которой компания Cambridge Analytica, как утверждается, привела Дональда Трампа к победе на президентских выборах. И уже после этого сделать выводы: действительно ли эта штука способна навязывать людям те или иные поступки?

Тестирование доступно в двух вариантах: анализ вашего фейсбук-аккаунта и анализ написанного вами текста из 1 000 слов.

В первом случае инструмент анализирует ваши лайки по страницам на фейсбуке (любимые фильмы, книги, музыку, общественные организации) и составляет ваш психометрический портрет, определяя те или иные характерные черты. К примеру, в увлечении группой The Cure и сатирическим мультсериалом «Робоцып» программа усматривает «женственность», тогда как шоу Top Gear и канал Comedy Central гарантированно свидетельствуют о вашей маскулинности. Любовь к «Симпсонам» и передаче Saturday Night Live почему-то приравнивается к консерватизму, а вот группа Depeche Mode сразу выдает в вас либералов, трудоголиков и созерцателей (да, коллектив подпадает сразу под три характеристики). И в то же самое время вышеупомянутые лайки группам The Cure и Depeche Mode машина определила как склонность к «менее интеллигентному» поведению.

Этот инструмент не смог с точностью определить религиозную принадлежность автора статьи, засунув его в категорию «другое», куда входят атеизм, агностицизм, буддизм и пастафарианство. Теперь вспоминаем громкие слова из оригинального расследования: «После анализа 70 лайков модель сможет лучше узнать человека, чем его друг. После 150 лайков — лучше, чем родители. После 300 лайков — лучше, чем партнер. С еще большим количеством изученных действий можно было бы узнать о человеке лучше, чем он сам».

Да, кстати, еще с помощью «оружия» удалось выяснить, что лайк официальной странице группы U2 на фейсбуке свидетельствует о «слабо выраженной заинтересованности в психологии».

Big Data и возможность их объединения с психологией — это, безусловно, крайне перспективная сфера, в которой еще предстоит прояснить этический вопрос границ использования личных данных. Но вряд ли эту комбинацию можно назвать стопроцентным оружием, гарантирующим крупную политическую победу или успех в бизнесе. Все-таки человек и его поведенческие паттерны — это слишком труднопрогнозируемая история. Как бы ни хотелось обратного журналистам, сочиняющим манипулятивные статьи, читателям — любителям «простых истин» и политикам, которые по старинке рассчитывают купить голоса.

⇔⇔⇔

При подготовке статьи были использованы материалы из Telegram-канала Сергея Карелова.

#bit.ua
Читайте нас у
Telegram