Комментарии участников:
В нормальном распределении такой график всегда имеет форму колокола. Всегда. Во всех случаях, когда действует не один фактор, а множество. Что бы ни измерялось на больших количествах.Строго говоря, Центральная предельная теорема тут не применима, но график офигителен и без нее.
пытались тупо подточить результат к «кругленькой» цифре — кто к 60%, кто к 70%, кто к 65%, кому что нравилось.Это напоминает возрастную аккумуляцию в демографии: при переписях (особенно в сельской местности, где народ не всегда помнил год рождения) возраста «концентрируются» на рубежных точках 5-ти и 10-тилетних интервалов — из-за принципа самоопределения — штука эта не имеет отношения к объективной возрастной структуре, искажает реальную картину.
Против мат. анализа не попрешь, чтобы товарищ Чуров вместе с прЭзидентом не пели нам в уши.
Жаль на Н2 нет опции в закладки.
Так статья очень зачетная и по теме.
Жаль на Н2 нет опции в закладки.
Так статья очень зачетная и по теме.
После сегодняшнего дня напряженного созерцания жизни на земле, даже солнце село пошатываясь, сблевав на вечернее небо — оранжевый закат.
А у Чурова — еще профессорская бородка и очки.Это, видать, все что осталось. Совесть давно продана.
Супер, спасибо. Есть с чем играться. Вот вам в подарок тот-же график с резолюцией в 0.1%.
источник: images58.fotki.com
источник: images58.fotki.com
В целом, в таких случаях, надо либо смоделировать дистрибуцию, либо хотя-бы усреднить график, и посмотреть на распределение ошибки (отклонения от модели). Если модель верна, то ошибка да должна быть распределена нормально. Но тут как-бы даже лень напрягаться.
Капнул чуть глубже и склоняюсь к тому что весь этот пост — одна большая ошибка.
Дело в том, что некоторые соотношения типа, 1/2 и 2/3 гораздо более вероятны чем другие. Особенно когда речь идет о малых числах (есть очень много способов получить 1/2 — гораздо больше чем, скажем, 0.501). Поэтому, выделив «подозрительные» участки (пик в районах [ 0.5 0.6 2/3 0.75 0.8 0.95 1.0] ±0.001) — таких оказалось 1993 из 94679 (2.1%), я по быстрому проверил две вещи:
1. Сколько-же в них всего голосов собрано на этих участках? Оказывается, всего 2.4% от общего числа. То есть, даже если они полностью подложные ничего они не меняют.
2. Если мое предположение о том что пики вызваны высокой вероятностью некоторых соотношений когда речь идет о малых числах верно, то среди этих «подозрительных» участков будет значительно больше мелких. Так оно и есть.
источник: images9.fotki.com
На графике показана плотность вероятности (y) участков с определенным колличеством действительных биллютеней (х).
Синий — «вне подозрений», Красный — «подозрительный». Основной эффект — преобладание среди подозрительных мелких участков. Тут нормализация по кол-ву участков, не по кол-ву голосов поэтому громадный перевес в сторону мелких «принижает» относительную долю средних (красная линия под голубой в середине).
В общем, возможны два объяснения.
1. Махинации производились преимущественно в маленьких участках
2. Наблюдаемые пики — результат естественного процесса.
Каждый волен выбирать любой из этих вариантов. Учитывая что махинация все равно не повлияла-бы на результат выборов, ИМХО, дальнейший анализ теряет смысл. Но если кто-то очень-очень хочет и не знает как, могу объяснить как узнать таки 1 или 2. Быстренькое монте-карло вам поможет.
П.С. Мое предположение никак не объясняет несколько более высокую вероятность нахождения среди «подозрительных» крупных участков (1 — на графике красная линия над синей в районе 1800 голосов; 2 — в среднем среди «подозрительных» имеется больше голосов на участок чем среди «неподозрительных»). Возможным объяснением является то что в принципе за ЕДРО голосовали больше на крупных участках (в городах). Понятия не имею так-ли это.
Кстати, может быть и наоборот — за ЕДРО голосовали на очень мелких участках (армия? больницы? тюрьмы?) — и это дополнит мое объяснение: почему эффект виден именно у ЕДРА.
П.П.С. Лень аплоадить график, но пик в районе 50% есть у абсолютно всех партий. Правда микроскопический — у них мало участков где они набрали 50%.
Надеюсь, не перегрузил. Иду спать в (наивном) сознании что одной теорией конспирации в мире стало меньше ;)
Дело в том, что некоторые соотношения типа, 1/2 и 2/3 гораздо более вероятны чем другие. Особенно когда речь идет о малых числах (есть очень много способов получить 1/2 — гораздо больше чем, скажем, 0.501). Поэтому, выделив «подозрительные» участки (пик в районах [ 0.5 0.6 2/3 0.75 0.8 0.95 1.0] ±0.001) — таких оказалось 1993 из 94679 (2.1%), я по быстрому проверил две вещи:
1. Сколько-же в них всего голосов собрано на этих участках? Оказывается, всего 2.4% от общего числа. То есть, даже если они полностью подложные ничего они не меняют.
2. Если мое предположение о том что пики вызваны высокой вероятностью некоторых соотношений когда речь идет о малых числах верно, то среди этих «подозрительных» участков будет значительно больше мелких. Так оно и есть.
источник: images9.fotki.com
На графике показана плотность вероятности (y) участков с определенным колличеством действительных биллютеней (х).
Синий — «вне подозрений», Красный — «подозрительный». Основной эффект — преобладание среди подозрительных мелких участков. Тут нормализация по кол-ву участков, не по кол-ву голосов поэтому громадный перевес в сторону мелких «принижает» относительную долю средних (красная линия под голубой в середине).
В общем, возможны два объяснения.
1. Махинации производились преимущественно в маленьких участках
2. Наблюдаемые пики — результат естественного процесса.
Каждый волен выбирать любой из этих вариантов. Учитывая что махинация все равно не повлияла-бы на результат выборов, ИМХО, дальнейший анализ теряет смысл. Но если кто-то очень-очень хочет и не знает как, могу объяснить как узнать таки 1 или 2. Быстренькое монте-карло вам поможет.
П.С. Мое предположение никак не объясняет несколько более высокую вероятность нахождения среди «подозрительных» крупных участков (1 — на графике красная линия над синей в районе 1800 голосов; 2 — в среднем среди «подозрительных» имеется больше голосов на участок чем среди «неподозрительных»). Возможным объяснением является то что в принципе за ЕДРО голосовали больше на крупных участках (в городах). Понятия не имею так-ли это.
Кстати, может быть и наоборот — за ЕДРО голосовали на очень мелких участках (армия? больницы? тюрьмы?) — и это дополнит мое объяснение: почему эффект виден именно у ЕДРА.
П.П.С. Лень аплоадить график, но пик в районе 50% есть у абсолютно всех партий. Правда микроскопический — у них мало участков где они набрали 50%.
Надеюсь, не перегрузил. Иду спать в (наивном) сознании что одной теорией конспирации в мире стало меньше ;)
Благодарю за анализ, просмотрев данные, по своей, Сахалинской, области так же заметил, что на маленьких участках часто голосуют единогласно, особенно люди которые долго находятся вместе. Ну а там где явка на выборы обязательна (в армии, например), человек который совершенно не интересуется политикой, будет голосовать «как все».
Лев, если вы еще не заснули.
Во-первых, поясните почему «весь этот пост — одна большая ошибка». Я не вижу у вас объяснения аномальной формы графика ЕР по сравнению с остальными.
Во-вторых, вы хотите сказать что пики на 60 и 80% объясняется тем, что есть много участков, где проголосовало 5 человек, из них за ЕР 3-4, и некруглого соотношения быть не может? Но на вашем графике большое количество участков с числом голосов от 500 до 2000, где получить такое соотношение случайно сложнее.
Вы не могли бы показать график ЕР с основной картинки, исключив мелкие участки скажем с <100 голосов?
Во-первых, поясните почему «весь этот пост — одна большая ошибка». Я не вижу у вас объяснения аномальной формы графика ЕР по сравнению с остальными.
Во-вторых, вы хотите сказать что пики на 60 и 80% объясняется тем, что есть много участков, где проголосовало 5 человек, из них за ЕР 3-4, и некруглого соотношения быть не может? Но на вашем графике большое количество участков с числом голосов от 500 до 2000, где получить такое соотношение случайно сложнее.
Вы не могли бы показать график ЕР с основной картинки, исключив мелкие участки скажем с <100 голосов?
Резолюция в посте не позволяет видеть мелких и узких пиков и в других партиях. При более узких столбцах заметно.
Далеко не все участки попавшие в пик маленькие. Маленькие лишь более склонны его возвысить над ожидаемым. Их там больше что и показывает мой график.
Приведут пример. Скажем, нажав участке 100 голосов. Высока вероятность получить числа типа 50%, 75%, 66%. Но совершенно невозможно получить 49.5% (кстати, видите «антипики»?). Если на участке 10000 голосовавших, то можно получить любой процент.
Я не говорю что все чисто, и даже не знаю достаточно ли этого объяснения (ну очень лень писать симуляцию или строить бейзианскую модель), но оно имхо отвечает по крайней мере за часть эффекта.
Далеко не все участки попавшие в пик маленькие. Маленькие лишь более склонны его возвысить над ожидаемым. Их там больше что и показывает мой график.
Приведут пример. Скажем, нажав участке 100 голосов. Высока вероятность получить числа типа 50%, 75%, 66%. Но совершенно невозможно получить 49.5% (кстати, видите «антипики»?). Если на участке 10000 голосовавших, то можно получить любой процент.
Я не говорю что все чисто, и даже не знаю достаточно ли этого объяснения (ну очень лень писать симуляцию или строить бейзианскую модель), но оно имхо отвечает по крайней мере за часть эффекта.
отвечает по крайней мере за часть эффектаБезусловно. Но вы-то дискредитируете весь пост. Хочется понять, почему.
Потому что при наличии простого объяснения требуется особая причина чтобы доказать необходимость более сложного. Автору действителено следует учесть этот эффект и показать что его недостаточно. Я поглядел на довольно многие из пиков и все что проверял именно в таких «удобных местах». На пример пик в 66.6%. Ну Врядли объясняется манипуляцией. Скорее всего это 2/3.
Если хотите, скину завтра графики или код (matlab).
Если хотите, скину завтра графики или код (matlab).
Кстати, конечно изначально хотел откопать махинации. Глянул на статьи о характерных подлогах в Африке. На пример, лажают с переносными урнами. Думал посмотреть на особенности участков где много таких голосов. Но руки не дошли.
LevM, буду благодарен, если глянете это и прокомментируете.
svshift.livejournal.com/108187.html
svshift.livejournal.com/108187.html
Интересный материал.
Комментарии гораздо интереснее самой статьи, которая довольно очевидно промахивается мимо кассы в целом ряде исходных предположений.
Комментарии гораздо интереснее самой статьи, которая довольно очевидно промахивается мимо кассы в целом ряде исходных предположений.
Согласен с юником. И статья интересная, и необоснованых утверждений в ней полно. Она в целом вписывается в вакханалию всех этих анализов производимых всеми кому не лень. Социальные науки они такие науки что помахав руками и цифрами можно «доказать» что хочешь, поэтому надо очень осторожно с выводами. Реально серьезный анализ требует серьезного специалиста, времени и все равно — никаких гарантий. По скольку мы не имеем инструментов убедиться в качестве, верить приходится исходя из того нравится ли нам вывод.
Мое личное мнение о манипуляциях с бюллетенями, если вдруг интересует — что это не имеет никакого значения. Партия интегрированая во власть не нуждается в таких грубых методах для того чтобы украсть выборы. Зачем рисковать попасться на мелком обмане, когда безропотно проходит крупный? Вполне возможно что люди на местах проявили тупую инициативу и что-то там украли. Может даже массово. Но если у них в руках прямой канал в мозг большей части населения, то зачем париться с организацием преступления в котором замешаны сотни тысяч человек? Может они и запарились. Но только из тупости и желания выслужиться. Вполне могли обойтись и без этого.
В качестве пример: СССР. Уверен что считали там честно. Просто ничего кроме ожидаемого результата несчитаться не могло. Еще пример (из личного знакомства с членом комиссии) — Беларусь. Да было давление, да был подлог, и да выборы не отражают голосов. Но в этом не было необходимости. Реально, большая часть населения за Батьку. Он позаботился чтоб не было альтернативы. Он позаботился что-б большинству и в голову не пришла мысль об альтернативе. А крали только потому что привыкли красть и боялись за свою жопу. Вот такая тупость, кстати, и есть основная проблема таких режимов — она делает их страшно неэффективными.
Мое личное мнение о манипуляциях с бюллетенями, если вдруг интересует — что это не имеет никакого значения. Партия интегрированая во власть не нуждается в таких грубых методах для того чтобы украсть выборы. Зачем рисковать попасться на мелком обмане, когда безропотно проходит крупный? Вполне возможно что люди на местах проявили тупую инициативу и что-то там украли. Может даже массово. Но если у них в руках прямой канал в мозг большей части населения, то зачем париться с организацием преступления в котором замешаны сотни тысяч человек? Может они и запарились. Но только из тупости и желания выслужиться. Вполне могли обойтись и без этого.
В качестве пример: СССР. Уверен что считали там честно. Просто ничего кроме ожидаемого результата несчитаться не могло. Еще пример (из личного знакомства с членом комиссии) — Беларусь. Да было давление, да был подлог, и да выборы не отражают голосов. Но в этом не было необходимости. Реально, большая часть населения за Батьку. Он позаботился чтоб не было альтернативы. Он позаботился что-б большинству и в голову не пришла мысль об альтернативе. А крали только потому что привыкли красть и боялись за свою жопу. Вот такая тупость, кстати, и есть основная проблема таких режимов — она делает их страшно неэффективными.
Мое личное мнение о манипуляциях с бюллетенями, если вдруг интересует — что это не имеет никакого значения. Партия интегрированая во власть не нуждается в таких грубых методах для того чтобы украсть выборы. Зачем рисковать попасться на мелком обмане, когда безропотно проходит крупный? Вполне возможно что люди на местах проявили тупую инициативу и что-то там украли. Может даже массово. Но если у них в руках прямой канал в мозг большей части населения, то зачем париться с организацием преступления в котором замешаны сотни тысяч человек?Лев, вы уже отвыкли и забыли. Это система, действия которой определяются не желаниями пары человек, пусть даже самых высокопоставленных. Это система, выстроенная так что иначе не то что не умеет, а не может существовать.
Да, лично Путину по большому счету результат выборов не важен. А губернаторам? С одной стороны, вроде тоже нет. С другой — да как же можно допустить, чтобы в соседнем регионе партия власти получила результат больше? Это же сравнение! Им больше сравниваться нечем, не уровнем же жизни населения, а это показатель прямой и ясный. К тому же им ясно дали понять, что соцсоревнование действительно имеет место. И понеслось далее вниз на всех уровнях.
А политическая вертикаль? Все эти сурковские выкормыши, идеологи, молодогвардейцы, освобожденные работники идеологического фронта? Их что, зря столько лет готовили? К чему? Разве не к вот этому? Для чего тогда все, если не поучаствовать своими руками в «единении России», проголосовав раз двадцать? И т.д.
Поэтому — ни зачем. А потому что так.
Напоминает тот ваш пример с селекцией генетическим алгоритмом. Вроде никто и не планировал, но при определенных стимулах так складывается. К стати, согласитесь что никакие перевыборы или пересчеты ничего не изменят пока не изменится базовая система интеракций, стимул действующий на каждом уровне. Если закона начнут бояться больше чем стыда из-за езды на отечественном автомобиле, то перестанут брать взятки. Аналогично со всем остальным.
согласитесь что никакие перевыборы или пересчеты ничего не изменят пока не изменится базовая система интеракций, стимул действующий на каждом уровнеC этим соглашусь.
Если закона начнут бояться больше чем стыда из-за езды на отечественном автомобиле, то перестанут брать взятки. Аналогично со всем остальным.А здесь вас большинство снова поймет так, что «каждому надо начать с себя и уважать закон, тогда и все в стране наладится».
Что должно произойти, чтобы начали бояться закона? А по-моему, все просто. Закон должен строго и демонстративно применяться на самом высоком уровне. Если верх не позволяет себе беззакония, то и низы не осмелятся. Причем разные части верха должны следить друг за другом и все время держать руку на горле — это я разные ветви власти имею в виду и политическое разнообразие. Иначе, по-моему, никак.
Если закона начнут бояться больше чем стыда из-за езды на отечественном автомобиле, то перестанут брать взятки. Аналогично со всем остальным.Не, мы и тут согласны. Я именно имел в виду что бояться должны. Не самовоспитаться с себя, а увидеть как вокруг всех наказывают и что не стоит оно того.
Да мы-то согласны, это здесь принято правовым нигилизмом и коррумпированностью народу тыкать. Что поделать, дескать, все неприглядности из него же выходят.
Что должно произойти, чтобы начали бояться закона? А по-моему, все просто. Закон должен строго и демонстративно применяться на самом высоком уровне.поддержу.
искренне надеюсь на показательную порку толкающих лажу комиссий
Мое личное мнение о манипуляциях с бюллетенями, если вдруг интересует — что это не имеет никакого значения.на мой скромный взгляд вопрос сейчас актуален только один: заработает едро простое большинство в парламенте при честном подсчете или все таки нет. (сейчас 238/450)
ну и яблочникам обидно. мне они пофиг но в контексте вышесказанного это тоже имеет смысл.
Лев, вот здесь человек попробовал развить вашу идею насчет естественных соотношений. Получилось, честно говоря, не сильно убедительно.
То есть при моделировании появляются ожидаемые пики на 0.5, 0.66, 0.75 — и все. Но и то не столь четко выделенные.
И еще. Я понимаю, что в упрощенной модели, если на участок пришло ровно 20 избирателей, то возможные распределения голосов будут обязательно кратны 5%. И если пришло ровно 40, то с большой вероятностью тоже. Но участки это обычно несколько сот человек, причем довольно случайных по количеству. И от 637 избирателей или 471 получить ровно 70% или ровно 85% как раз гораздо сложнее, чем промежуточное число.
Поэтому продолжаю полагать, что естественные выступы могут быть и должны быть — за счет участков малой численности, как вы и показали, но не могут полностью объяснять наблюдаемую картину.
То есть при моделировании появляются ожидаемые пики на 0.5, 0.66, 0.75 — и все. Но и то не столь четко выделенные.
И еще. Я понимаю, что в упрощенной модели, если на участок пришло ровно 20 избирателей, то возможные распределения голосов будут обязательно кратны 5%. И если пришло ровно 40, то с большой вероятностью тоже. Но участки это обычно несколько сот человек, причем довольно случайных по количеству. И от 637 избирателей или 471 получить ровно 70% или ровно 85% как раз гораздо сложнее, чем промежуточное число.
Поэтому продолжаю полагать, что естественные выступы могут быть и должны быть — за счет участков малой численности, как вы и показали, но не могут полностью объяснять наблюдаемую картину.
К чему «к этому»? Вот как ваша ссылка соотносится с новостью? Для тех кому лень идти — там очередной поток сознания от Старикова. Обычное мозгокрутство.
Вы нас тут жизни не учите, мы уже не одного тролля закормили в усмерть, все полопались. Оставили вот реликтовый экземплярчик, бережем его)
Ахуенно. Очередная победа патриотических сил над происками вражеской науки статистики и ее продажной девкой — математикой!
Но, партий — две. Яблоко тоже как — то…
Но, партий — две. Яблоко тоже как — то…
А что не так с Яблоком? Все тот же классический колокол, только сдвинут дальше так как рейтинг партии существенно отличается.
Ага, я сразу не обратил внимания, что Правого дела и Патриотов нет. Но, по Москве Яблоко вроде бы в 7 процентов вышло?
8.7%. Кажется этот график общероссийский.
У Яблока пик где то около 4%, ЛДПР, СР 14, у комми 21.
Это в целом кореллирует с официальными результатами, с поправкой на «отщипывание». КПРФ — 19,2%, ЛДПР — 12,0%, «Справедливая Россия» — 13,25%
У Яблока пик где то около 4%, ЛДПР, СР 14, у комми 21.
Это в целом кореллирует с официальными результатами, с поправкой на «отщипывание». КПРФ — 19,2%, ЛДПР — 12,0%, «Справедливая Россия» — 13,25%
По вертикальной оси показано количество УИК, где партия набрала такое-то количество голосов в интервале (бине) 0.5%. Вертикальную ось я подрезал, иначе бы Яблоко просто зашкалило бы в нуле — ну, не любят их в народе (площадь под всеми кривыми должна быть одинакова).Это коммент автора графика
А, пардон. Я был невнимателен. Я не хочу упрекнуть автора в подтасовке — это проверяется элементарно, просто у меня была непонятка с Яблоком.
Хотелось бы развить комментарий о том, что в данном случае центральная предельная теорема не совсем применима.
Если это общие данные по всей России, то это означает только то, что для части партий помимо случайных действовали некие факторы, изменяющиеся по некому неслучайному закону. Что это за факторы по графикам сказать нельзя. Нужно сравнивать графики голосования по регионам. Это позволит отделить фактор партийной пропаганды (разная популярность партии в разных регионах) от факторов фальсификаций. Такое разделение можно сделать если верно предположение, что популярность партии зависит от её работы и/или рекламы в регионе и при этом по избирательным участкам в рамках региона охваченные данной пропагандой люди распределены равномерно.
Если в каждом регионе график будет приближен к колоколу, то это будет означать, что в данном регионе на отклонение от мат.ожидания действуют только случайные факторы. А вот если и в регионах будут подобные не колоколо-образные графики либо будут участки с явно выпадающими из общей тенденции процентами, то это будет означать, что либо избиратели ЕдРа в данном регионе как-то странно кучкуются вокруг избирательных участков, либо что на конкретных участках выборы действительно были сфальсифицированы. Причём можно даже попытаться отследить в каких регионах выборы были проведены более-менее честно (хорошие колоколо-образные кривые), а в каких на выборы влияли некоторые дополнительные постоянные факторы. К сожалению слишком сильно мельчить не получится, иначе невозможно применять статистические методы оценки.
Если это общие данные по всей России, то это означает только то, что для части партий помимо случайных действовали некие факторы, изменяющиеся по некому неслучайному закону. Что это за факторы по графикам сказать нельзя. Нужно сравнивать графики голосования по регионам. Это позволит отделить фактор партийной пропаганды (разная популярность партии в разных регионах) от факторов фальсификаций. Такое разделение можно сделать если верно предположение, что популярность партии зависит от её работы и/или рекламы в регионе и при этом по избирательным участкам в рамках региона охваченные данной пропагандой люди распределены равномерно.
Если в каждом регионе график будет приближен к колоколу, то это будет означать, что в данном регионе на отклонение от мат.ожидания действуют только случайные факторы. А вот если и в регионах будут подобные не колоколо-образные графики либо будут участки с явно выпадающими из общей тенденции процентами, то это будет означать, что либо избиратели ЕдРа в данном регионе как-то странно кучкуются вокруг избирательных участков, либо что на конкретных участках выборы действительно были сфальсифицированы. Причём можно даже попытаться отследить в каких регионах выборы были проведены более-менее честно (хорошие колоколо-образные кривые), а в каких на выборы влияли некоторые дополнительные постоянные факторы. К сожалению слишком сильно мельчить не получится, иначе невозможно применять статистические методы оценки.
Нет нужды мельчить до регионов. Общего анализа достаточно, чтобы понять, что с ЕР что-то не так. Если бы Ваши рассуждения были верны, то неравномерность голосования по регионам должна была бы сказаться на всех партиях. Но мы видим, что сказалась она преимущественно на ЕР. ЕР — «избранная»? :)
Ну во-первых, регулярные факторы, влияющие на распределение голосов, могут у разных партий быть разные, во-вторых они могут действовать так сказать с разной силой. Например для слабопопулярной партии разница популяности по регионам может вообще не сказываться. То есть она может быть слабопопулярна везде и иметь колоколообразный график в целом по России. Не колоколообразность кривой может свидетельствовать о потере правящей партии популярности (что есть процесс неравномерный и неслучайный) и о неравномерности влияния контрпропаганды в разных регионах. Короче вполне легитимных неслучайных факторов может быть немало.
Сахалинская область (В портовых городах часто голосовали единогласно, правда человек по 20-30)
источник: images53.fotki.com
там в конце пики на 100%, не видно.
источник: images53.fotki.com
там в конце пики на 100%, не видно.
Прикольно на главном графике наблюдать как ~200 УИК 49% рейтинг ЕР натянули до 50% :)
При том что даже 49% далеко не факт что честные были.
При том что даже 49% далеко не факт что честные были.