[«Где же вы теперь, друзья-однополчане?»] Исследователь интернета Лоуренс Александр (Lawrence Alexander) собрал и визуализировал данные по почти 20 500 прокремлёвским аккаунтам в Twitter

отметили
46
человек
в архиве
[«Где же вы теперь, друзья-однополчане?»] Исследователь интернета Лоуренс Александр (Lawrence Alexander) собрал и визуализировал данные по почти 20 500 прокремлёвским аккаунтам в Twitter
Алек Лун, журналист из США, пишущий о России, заметил, как через какие-то часы после убийства Бориса Немцова 27 февраля, группа аккаунтов в Twitter уже пыталась повлиять на изложение фактов:

источник: ic.pics.livejournal.com

Используя программу с открытым исходным кодом NodeXL [анг], я собрал и импортировал полный список аккаунтов, публиковавших в точности эту фразу, в таблицу. Основываясь на этом списке, я также собрал и и импортировал расширенное сообщество пользователей Twitter, составленное из друзей и читателей каждого аккаунта. Это должен был быть интересный тест: если бы оскорбления Немцова были бы лишь незначительным случаем распространения слухов, они бы, вероятно, исходили лишь от нескольких десятком пользователей

Но когда программа закончила перебирать данные, был раскрыт полный масштаб сети: поразительно число в 2 900 аккаунтов. Это число, возможно, можно понять: чтобы фейковый аккаунт в Twitter вызывал доверие, ему необходимо множество читателей — что, в свою очередь, требует больше вспомогательных ботов.

Затем я воспользовался Gephi [анг], другой бесплатной программой по анализу данных, чтобы визуализировать данные в виде диаграммы сущность-связь. Разноцветные круги — называемые узлами — представляют Twitter-аккаунты, а пересекающиеся линии — рёбра — изображают связи вида читаю/читает между ними. Аккаунты сгруппированы в имеющие каждый свой цвет кластеры, основанные на модулярности, которая определяет тесно связанные между собой группы. Размер каждого узла основан на числе связей, которое аккаунт имеет с другими в сети.

Из того, как плотно и близко друг к другу расположены узлы на этом графике, ясно, что это крупная и весьма связная сеть. Большая часть ботов читает многих других, давая друг другу высокий рейтинг читателей/читаемых пользователей. На периферии наблюдается несколько колец менее связанных с другими аккаунтов, что, возможно, указывает на то, что сеть «ботов» продолжала «расти» на момент сбора данных; о ней можно думать как о дереве, ветви которого распространяются вовне.

Но этот анализ имел один ключевой вопрос: как можно быть уверенными, что эта сеть состоит в основном из ботов, а не из реальных людей?
Добавил suare suare 3 Апреля 2015
проблема (1)
Комментарии участников:
1sr
+7
1sr, 3 Апреля 2015 , url
Картинка неполная без анализа противоположной стороны.
Но, " боты" еще не самое плохое в интернет — коммуникациях.
1sr
+8
1sr, 3 Апреля 2015 , url
Наш неутомимый клоун. В конкретном случае, нарушены базовые принципы общенаучной методологии познания.
Одностороннее исследование. Хотя, я могу предположить, что публикуются отрывочные данные из него.
Интереснее было бы посмотреть анализ " битвы ботов")))
То есть, цели публикации — не познавательны. Это — пропаганда. Но, забавно, интересно, вот и проголосовал.

А исследователь обязан делать обработку репрезентативой выборки, на одних принципах, сопоставимую. Иными словами, если Вы смотрите тенденцию с политически ангажированной оценкой со знаком " минус", то обязаны сопоставлять аналогичную с противоположным знаком.
fStrange
-3
fStrange, 3 Апреля 2015 , url
ными словами, если Вы смотрите тенденцию с политически ангажированной оценкой со знаком " минус", то обязаны сопоставлять аналогичную с противоположным знаком.
А как быть если с противоположной стороны нет ботов?

Ах да, вы просто не можете такого представить :)
1sr
+5
1sr, 3 Апреля 2015 , url
Не было противоположных оценок? Если были, то требуется публикация аналогичного анализа.
Ты уж интеллектуально деградировал до уровня дошкольного возраста. Сам не пугаешься?
1sr
+1
1sr, 3 Апреля 2015 , url
Кретин, тебе русским, простым языком объяснено, что не может быть статистики " по стороне".
Если твои обожаемые заокеанские лузеры в своем родном твиттере проигрывают ботам, то расстраивайся вместе с ними.

А для исследования нет " стороны", нерадивый.
V.I.Baranov
+2
V.I.Baranov, 3 Апреля 2015 , url
Та ни! Це игрушка для нашего Льва Мучника. Боты и связи это его хобби. Вот бы его послушать по поводу «исследований» очередного «независимого» корреспондента. Жаль что Лев исчез с наших глаз! Помнится он очень толково опустил наших демокрастов, рассуждавших о нарушение статистических распределений при голосовании в Думу и за Путина.
1sr
+2
1sr, 3 Апреля 2015 , url
)) Замечу, что при иных обстоятельствах, по меньшей мере часть этих " ботов" с превеликим удовольствием засудила бы нашего " исследователя")
suare
+4
suare, 3 Апреля 2015 , url


NodeXL не просто собирает информацию о том, кто кого читает. Он также получает метаданные — находящиеся в открытом доступе детали о каждом Twitter-аккаунте и его поведении. Они показывают, что в сети из 2 900 аккаунтов 87% профилей не имеют информации о часовом поясе и 92% не добавляли ничего в «Избранное». Но в случайной выборке из 11 282 пользователей Twitter (основана на аккаунтах, публиковавших твиты со словом «and») только 51% не имел часового пояса и, что весьма показательно, только 15% не имели «избранных» записей (обе эти черты могут быть посчитаны признаками «человеческого» поведения).

Для дополнительно сравнения ниже приведена диаграмма сущность-связь для случайно выбранной контрольной сети пользователей Twitter. Создавая контраст с визуализацией ботов, эта сеть имеет несколько несвязанных и изолированных кластеров: группы пользователей Twitter, несвязанных между собой — абсолютно нормальное явление для случайной группы пользователей.


Анализ использования слова «and» приводит к несвязанным, изолированным кластерам для случайной группы пользователей Twitter. Автор изображения — Лоуренс Александр.

Обнаружив такую масштабную сеть с помощью одного источника, я решил продолжить охоту на ботов. Проведя поиск в Twitter по таким фразам, как «кремлёвские боты», «пророссийские тролли» и «марионетки Путина», я нашёл нескольких пользователей, которые поделились скриншотами предполагаемой активности ботов. Некоторые также использовали тег #Кремлеботы, чтобы сообщить о наблюдениях.

Используя тот же метод, как и для анти-немцовских твитов, я собрал сети аккаунтов, основанных на использовании ключевых фраз, сообщения о которых нашёёл. Так открылись большие сообщества — или, в некоторых случаях, список включал только пользователей, показанных на скриншоте. Их я разделил на группы, обозначенные A, B, C и D (я подробнее расскажу о причине для этой группировки во второй части анализа).

@PressRuissa — пародийный аккаунт (сейчас его деятельность прекращена) на пророссийские СМИ, соединяя сатиру и комментарии по дезинформации и предвзятости. Один из его твитов стал изначальным источником для сети группы A:

Группа B создана из различных источников подозреваемых аккаунтов-ботов, чьё поведение, как казалось, совпадает с предыдущими образцами. Некоторые были определены по тенденции переходить с русского языка на английский с by одним сообщением об ошибке «RSS in offline mode» — возможно, вызванной глюком в контролирующем их программном обеспечении.

Что касается оставшихся источников, то твит Девина Эклза, аналитика центра CASE Ukraine, предоставил основу для группы C.

И, наконец, Виталий Мороз из Internews Ukraine поделился скриншотом аккаунтов ботов, которые сформировали выборку для группы D.

Все четыре группы были соединены в единый набор данных, в котором в результате оказалось 17 590 Twitter-аккаунтов. Как и для публиковавших антинемцовские твиты, метаданные подтвердили, что большая часть из них действительно является ботами. 93% не указали в профиле местоположения, 96% не имели информации о часовом поясе и 97% не имели записей в «Избранном».

Кроме того, несмотря на то, что каждый аккаунт в среднем опубликовал по 2 830 твитов, они почти никогда не взаимодействовали с другими пользователями Twitter через @ответы или @упоминания.


Боты публикуют твиты. но не взаимодействуют с другими. Автор изображения — Лоуренс Александр.

Любопытно, что многим ботам были даны по-западному звучащие имена, например, barnardgrant, terancebarnaby, terencecoward и duncanstarks.

Но ещё более неожиданный результат был получен, когда я визуализировал отношения типа «читаю» между группами ботов. Даже хотя они были отобраны из четырёх различных источников, объединённая сеть оказалась весьма взаимосвязанной.


Все 17 590 аккаунтов из четырёх источников. Заметьте близкие связи и отсутствие изолированных кластеров. Автор изображения Лоуренс Александр.

данных изолированных групп или выпадающих пользователей нет вообще. Данный факт является серьёзной поддержкой идеи о том, что боты были созданы одним агентством — и свидетельства твёрдо указывают на Москву.

В следующей статье я рассмотрю время создания ботов и то, как оно соотносится с политическими событиями в России и Украине.
nikorn
+3
nikorn, 3 Апреля 2015 , url
Как человек, имеющий отношение к науке, могу сказать, что за внешним наукообразием, скорее всего, скрываются недостоверные результаты.

Эту методику можно было применить к любому другому объекту и получить аналогичный набор «ботов». Видимо, понимая это, автор дополнительно усилил алгоритм ручной подгонкой результатов под «кремлеботов».
Max Folder
+17
Max Folder, 3 Апреля 2015 , url
Я вот не понимаю, какой смысл во всей этой твиттер-бото-истерии?
Например, Собчак что-то написала или там Медведев — это понятно и каким-то боком интересно.
Но то, что пишет какая-то PisyaPisulkina — вот кому это нахрен надо?

Юлька с н2
-2
Юлька с н2, 3 Апреля 2015 , url
Для создания общественного мнения (твиттерского) при помощи пустых аккаунтов, для вывода хэштегов, липовых тем в топ. На н2 темы в топ голосованием выводят и вес аккаунта имеет значение, а в твиттере количеством берется.
И для забивания существующих тем и мнений мусором, чтобы мнения обычных юзеров среди них терялись.
oleg_ws
+5
oleg_ws, 3 Апреля 2015 , url
Не примите меня за тот же ботнет, но с автором поста в Твитере я полностью согласен!
Ну пофиг мне смерть Немцова — он вообще пустое место, давно сыгранная карта.
И припомнили ему скорее всего 90-е и дружбу с майдаунами
fakenews
+7
fakenews, 3 Апреля 2015 , url
Только ленивый не делал ботов в твиттере. А алгоритмы многих основанны на follow-followback циклах, когда бот фалловит всех кого можно, и потом удаляет тах кто не зафалловил обратно. Так и образуются эти кластеры которые ретвитят и фалловят друг друга. Владельцы таких нетворков еще могут «принимать заказы», ну рынок че. Распространение какой-то информации тоже денег стоит.
deas2006
0
deas2006, 3 Апреля 2015 , url
Путину надо вот и делают. На этом сайте тоже своих ботов хватает как и на сотнях других
nikorn
+3
nikorn, 3 Апреля 2015 , url
Можете привести пример? Чисто для любопытства. А то ведь я всех за чистую монету принимаю
rusinvent
+7
rusinvent, 3 Апреля 2015 , url
Меня твиттер давно неожиданно заблокировал непонятно за что. И на мои просьбы разблокировать не разблокировал.
Наверное потому, что я живой человек, а не бот.
Тогда я сказал ему: «Ну и хрен с тобой!»
Теперь давно живу спокойно и не твиттеряюсь
Юлька с н2
-1
Юлька с н2, 3 Апреля 2015 , url
Они довольно легко блокируют молодые аккаунты — по своим алгоритмам и по жалобам.
Может, вы кому-то не угодили.

Разблокируют обычно в течение месяца или быстрее при условии переписки с ними.
fafol
+7
fafol, 3 Апреля 2015 , url
И накуй этот твиттер?!
X86
+4
X86, 3 Апреля 2015 , url
Лучше бы он региональные сайты проанализировал. Я про е1.ру своего города точно могу сказать, что там боты на форуме есть несколько десятков. И это далеко не «кремле»боты.
rusinvent
+5
rusinvent, 3 Апреля 2015 , url
Это Интернет-работа ЦРУ по внедрению в Рунет — скупают популярные ресурсы и публикуют что хотят на правах администраторов
guest1001
+2
guest1001, 3 Апреля 2015 , url
Если бы в twitter не было функции «списки», он был бы совсем бесполезным.
А так, когда я заношу в списки тех, кто мне интересен, мне уже безразлично сколько в твиттере ботов.
madwinterbear
+9
madwinterbear, 3 Апреля 2015 , url
Не пользовался твиттером и не собираюсь, имхо для обычного человека дурь полная.
Юлька с н2
-3
Юлька с н2, 3 Апреля 2015 , url
Интересное исследование, но к чему тут песня про друзей-однополчан? )

Более информативная, правда, тема про смс-переписку администрации президента. Там и про ботов и про остальное есть. Была такая новость?
Хотя, наверно на н2 такая тема — табу.
oleg_ws
+2
oleg_ws, 3 Апреля 2015 , url
В самом Твитере есть специальные опции, которые позволяют массово постить в нем любые сообщения. Причем реализовать что-то подобное там — это пара настроек.

У меня самого уже несколько лет работает пара автоматов, которые собирают информацию по определенным ключам в интернете по новостным лентам и размещают ее в Твиттере.
nskdanila
+1
nskdanila, 4 Апреля 2015 , url
Из того, как плотно и близко друг к другу расположены узлы на этом графике, ясно, что это крупная и весьма связная сеть. Большая часть ботов
Не очень понял переход от одного к другому. А просто тесным сообществом это почему не может быть? Люди близких интересов читают друг друга — это вроде естественно. У меня вот тоже, в основном «про кремлёвские» аккаунты в друзьях. Но я почти уверен, что я не бот.
P66g
+2
P66g, 4 Апреля 2015 , url
а я уже не уверен, что я не бот...


Войдите или станьте участником, чтобы комментировать