?

Log in

avplat
Московские выборы - 3 
24-дек-2009 08:01 pm
Как было совершенно справедливо замечено andirect в комментариях к моему первому посту, посвященному московским выборам 2009 г., описанная там методика не подходит для оценки таких фальсификаций, при которых функция распределения явки или голосов растягивается в ширину без особых искажений формы распределения. Т.е. получается, что методика "не видит" основную часть нарушений, что делает ее непригодной для оценки фальсификаций. Добавлю также, что методика, предложенная во втором посте, также не слишком удачна, ведь верхняя граница облака в нашем случае полностью определяется вбросами.

Поэтому в этот раз я решил подойти к проблеме с другой стороны - я решил смоделировать выборы и фальсификации и подобрать такую модель, которая в итоге наилучшим образом совпадет с реальностью. Параметры такой модели и будут в итоге описанием результатов выборов и фальсификаций на них.

ОПИСАНИЕ МОДЕЛИ

Прежде всего, будем исходить из того, что на итоги выборов не было никакого централизованного целенаправленного воздействия, т.е. грубо говоря, результаты не "нарисованы" от начала до конца некими людьми, вооруженными компьютерами и статистическими программами, а являются результатом более или менее случайных действий избирательных комиссий на местах.

Сразу оговорюсь, что участки в военных частях, больницах и т.д. (около 200 участков с номерами больше 3000 и высокой явкой) я из моделирования исключаю. Вместе они дают всего порядка 50 тыс. голосов.

Будем считать, что явка и голоса распределены нормально. Данный факт мы можем проверить на других выборах, которые считаются относительно честными, например на выборах 2005 г. в МГД.

Затем нам нужно определить некоторые другие параметры:

1. Размер и количество участков. Для ровного счета будем считать, что участков 3100 (в реальности немного меньше), средний размер участка 2250. Будем считать, что размеры участков распределены нормально, со стандартным отклонением, равным 400. В реальности распределение не совсем нормальное (рис.1), но я считаю, что это не очень существенное отличие. Суммарное количество избирателей получается равным приблизительно 7 млн., что и требовалось.

Рис.1

2. В ходе моделирования приходится пробовать распределения явки и голосов с разными средними. Не совсем понятно, откуда брать стандартные отклонения. На основании результатов выборов 2005 г. я приблизительно определил, что стандартное отклонение можно считать равным корню квадратному из среднего (рис.2, по оси X - среднее, по оси Y - стандартное отклонение).

Рис.2

3. Очень важный вопрос - причины искажения формы распределения для явки и голосов за партии (рис.3 - гистограмма явки). Исследования показали, что это связано с неравномерностью вбросов. Если функция распределения вброса - равномерное распределение, то никаких искажений не происходит. В нашем же случае вбросы распределены нормально (см. далее), что и приводит к искажениям. Сравним рис.3 и 4 (на рис.4 - результат моделирования).

Рис.3    Рис.4

4. Другой важный вопрос - параметры вброса. На рис.5 - многократно виденная диаграмма точек (X = явка, Y = доля голосов за ЕР от общего числа избирателей на участке). При вбросе участок на этой диаграмме сдвигается вправо по диагонали, причем расстояние этого сдвига зависит от величины вброса. Поэтому изучим гистограмму распределения расстояний на рис.5 от участков до начала координат (рис.6). Правая часть этой гистограммы образована участками с вброшенными голосами. Похоже на то, что вброс распределен нормально, причем среднее этого распределения - положительное. На рис.7 - результат моделирования.

Рис.5

Рис.6    Рис.7

АЛГОРИТМ

Алгоритм генерирования результатов выборов очень простой:

1. Генерируем размер участка. Используем генератор случайных чисел с нормальным распределением. Параметры см. выше.

2. Генерируем явку. Используем генератор случайных чисел с нормальным распределением. Среднее вычисляется исходя из тестируемой величины вброса, стандартное отклонение равно корню квадратному из среднего.

3. Генерируем долю для каждой партии и долю недействительных бюллетеней. Поскольку в сумме это должно дать 100%, то нормируем полученные цифры таким образом, чтобы в сумме получилось 100%. Используем генератор случайных чисел с нормальным распределением. Среднее вычисляется исходя из тестируемой величины вброса, стандартное отклонение равно корню квадратному из среднего.

4. Генерируем величину вброса на данном участке. Используем генератор случайных чисел с нормальным распределением. Среднее подбираем на основании максимальной похожести на рис.6, стандартное отклонение подбираем на основании величины вброса.

5. Рассчитываем все необходимые параметры для данного участка.

6. Повторяем для всех участков.

РЕЗУЛЬТАТЫ

1. Вброс - 200000 голосов (Рис.8 - распределение явки, рис.9 - распределение голосов за ЕР, рис.10 - распределение расстояний). Пока ничего общего.

Рис.8    Рис.9    Рис.10


2. Вброс - 800000 голосов (Рис.11 - распределение явки, рис.12 - распределение голосов за ЕР, рис.13 - распределение расстояний). Значительно лучше, но все еще не очень.

Рис.11    Рис.12    Рис.13


3. Вброс - 1100000 голосов (Рис.14 - распределение явки, рис.15 - распределение голосов за ЕР, рис.16 - распределение расстояний). Практически идеальное совпадение.

Рис.14    Рис.15    Рис.16


4. Вброс - 1300000 голосов (Рис.17 - распределение явки, рис.18 - распределение голосов за ЕР, рис.19 - распределение расстояний). На всех трех рисунках видно, что вброс уже явно больше, чем нужно.

Рис.17    Рис.18    Рис.19

Не буду плодить картинки, скажу лишь, что с моей точки зрения, результаты модели с вбросом 1100000 больше всего похожи на результаты реальных московских выборов 2009 года.

ВЫВОДЫ

1. Всего на выборах в МГД 2009 г. было вброшено ориентировочно 1 млн. 100 тыс. голосов (в среднем 355 голосов на участок). За вычетом фальшивых голосов, результаты выборов должны были быть такими:

ЛДПР11%
Патриоты России3.3%
Единая Россия39.2%
КПРФ24%
Справедливая Россия9.6%
Яблоко8.5%
Явка19.6%

2. Участков с небольшими нарушениями - очень мало. Например, участков с количеством вброшенных голосов меньше 50 всего 220 (около 7%). Получается, что наблюдатели от других партий не препятствовали нарушениям и практически всегда действовали заодно с нарушителями?

UPDATE

Забыл упомянуть, что результаты на рис.14-16 получены при среднем функции распределения вброса, равном 180. Думаю, что это число можно считать рекомендацией, спущенной в избиркомы - сколько ориентировочно голосов нужно вбросить.
Comments 
24-дек-2009 09:09 pm
Замечательно. Красиво получилось. Перепостил.

Удивительно точное совпадение - я правильно понимаю, что в модели всего один свободный параметр?
25-дек-2009 03:28 pm
Если не считать размер вброса, в модели действительно только один параметр - среднее функции распределения вброса. Все остальное рассчитывается. Изначально был еще один параметр - процент "честных" участков. Я думал, что все-таки наблюдатели хоть как-то делали свою работу, а значит часть участков надо выделить специально. Но оказалось, что модель лучше всего похожа на реальность, когда такие выделенные участки отсутствуют, а количество участков с низкими нарушениями соответствует функции распределения вброса.

Кстати, что касается этого самого среднего, то оно подозрительно близко от половины среднего вброса на участок (средний вброс - 355, среднее функции распределения - 180). Может это не случайно? Но что-то никакие объяснения в голову не приходят.

Позже постараюсь переписать программу на VBA и выложить экселевский файл.
24-дек-2009 09:24 pm
Участков с небольшими нарушениями - очень мало. Например, участков с количеством вброшенных голосов меньше 50 всего 220 (около 7%).

Не означает ли это, что централизованное целенаправленное воздействие таки было, но не в форме рисования, а в форме приказания сделать вброс?

Получается, что наблюдатели от других партий не препятствовали нарушениям и практически всегда действовали заодно с нарушителями?

Очень может быть, если наблюдателям от "независимых" партий мешали препятствовать нарушениям, а наблюдатели от "карманных" партий - закрывали глаза на происходящее.
25-дек-2009 02:39 pm
Не означает ли это, что централизованное целенаправленное воздействие таки было, но не в форме рисования, а в форме приказания сделать вброс?


Ну, не думаю, что комиссии делали вбросы по личной инициативе. :) Конечно, указания были, думаю, что даже рекомендовали, сколько вбрасывать. Но вбрасывали, сколько получится (с ориентацией на рекомендованную цифру) - в результате получилось нормальное распределение.

Я, собственно, имел в виду отсутствие именно математической пред- или пост-обработки результатов.
24-дек-2009 09:25 pm
а ничё так, впечатляет. п2 из модели - это чиста пуассоновская статистика!
25-дек-2009 03:50 pm
Я об этом как-то не подумал, но наверное так и есть. Типа, участок - как бы источник света, а голосующие избиратели - испускаемые фотоны. Выборы - дробовой шум. :)
24-дек-2009 11:54 pm
красиво :)
25-дек-2009 05:47 pm
>2. Участков с небольшими нарушениями - очень мало.
В рамках такой модели, наверное, надо считать "честными" участки с вбросом меньше порога, при котором он "тонет" в дисперсии явки. Где-то половина дисперсии, видимо.
На самом деле их может быть несколько больше. Если посмотреть на распределение по явке отдельно участков без сканеров бюллетеней, оно ощутимо двугорбое (следы двугорбости видны и на общем распределении). Один горб около 22% похож на вклад "честных" участков, второй - на вклад участков с вбросом. При этом распределение участков со сканерами - одногорбое, а средние для обеих групп подозрительно близки.
У меня предположение, что на участках со сканерами работали более систематически, учтя прошлые проколы, а на участках без сканеров вбрасывали не везде, но больше, компенсируя наличие "честных".
30-дек-2009 11:12 pm
Неравномерность связана с возрастными категориями, во все странах такое, у нас в стране до70 процентов на местных выборах.
31-дек-2009 09:26 am
Я был наблюдателем сам забыл номер участка . Фальсификация шла через открепительные удостоверения. Это была школа и все сотрудники школы включая дворников и уборщиц привели все свои семьи проголосовали и отметились в кабинете директора. Всего 84 голоса. Плюс голосование на дому 17 человек все заранее обработанные пенсионеры соцзащитой за Лужкова плюс пайки перед голосованием. Всего проглосовало 400 человек из 2000 на участке . ЕДРО - 41 % КПРФ , ЯБЛОКО , СПРОС , ЛДПР по 10 %. Так что реально без фальсификаций за ЕДРО было не более 30 %.
20-авг-2013 11:04 pm - Выборы в Москве: 1996-2012. О преемственности и причинности
Пользователь nonenoun сослался на вашу запись в записи «Выборы в Москве: 1996-2012. О преемственности и причинности (4/5)» в контексте: [...] (среднее - 300, СКО - 100 бюллетеней). Это крайне примитивная модель фальсификаций (есть лучше [...]
21-авг-2013 11:06 am - Выборы в Москве: 1996-2012. О преемственности и причинности
Пользователь moire_rebma сослался на вашу запись в записи «Выборы в Москве: 1996-2012. О преемственности и причинности - 4/5» в контексте: [...] (среднее - 300, СКО - 100 бюллетеней). Это крайне примитивная модель фальсификаций (есть лучше [...]
This page was loaded май 26 2017, 2:45 pm GMT.