Home
avplat
Свежие записи 

Реклама

Настроить
3-Ноя-2009 10:19 pm - Московские выборы - 2
В сети имеется некоторое количество работ, в которых авторы пытаются аналитически оценить масштаб нарушений на недавних выборах в московскую думу. Особой популярностью пользуется статья Сергея Шпилькина (ЖЖ-пользователь [info]podmoskovnik, если я ничего не путаю). Есть еще пост ЖЖ-пользователя [info]filin, которую он довольно активно продвигал в популярных журналах. Их оценки на порядок отличаются от моей - они оценивают размер фальсификаций в 30% от числа голосовавших, что составляет приблизительно 1 млн. голосов, вброшенных за ЕР.

Также есть посты [info]uborshizzza (uborshizzza.livejournal.com/674242.html) и [info]kireev (kireev.livejournal.com/481926.html), которые одни из первых подняли тему фальсификаций на этих выборах. Они исходят из тех же предположений и дают оценки, сходные с предыдущими авторами, но никаких расчетов нет, это скорее качественный анализ.

Давайте попробуем разобраться в представленных аргументах.

1. [info]filin использует график, на котором для каждого участка отложена пара (x = доля голосов за ЕР, y = явка).

Итак, пусть при Amax избирателях реально пришло голосовать A0, а за ЕР проголосовало A. От этого на графике появилась бы точка с координатами x0 = A/A0 (процент за ЕР) и y0 = A0/Amax (явка).

Теперь пусть в пользу ЕР вбросили долю d от общего числа избирателей, то есть d*Amax штук бюллетеней. Теперь якобы пришло голосовать ( A0 + d*Amax ) человек, из них за ЕР якобы ( A + d*Amax ). Поэтому у точки будут координаты x = ( A + d*Amax ) / ( A0 + d*Amax ) и y = ( A0 + d*Amax ) / Amax

Поделив на Amax и немного пригладив, получаем y = y0 + d (что очевидно) и x = ( x0*y0 + d )/( y0 + d ). При нулевом вбросе d=0 получаем честную точку x0, y0, как и должно быть.

Теперь исключим d и получим простенькую формулу для кривой: y = y0 * ( 1 - x0 ) / ( 1 - x ). У кривой два параметра: y0 - фактическая явка и x0 - фактический процент голосов за ЕР.

И наконец, подгоним эту кривую к графику обычным методом наименьших квадратов (участки со стопроцентным голосованием не считаем).


Вот что получается в результате (фактическая явка - 20%, фактический процент голосов за ЕР - 42%):

Рис.1

Есть ли здесь ошибки? Да, есть. Начало рассуждения безусловно правильно - при условии, что речь идет о выборах в целом. А затем формула, правильная для выборов в целом, начинает применяться к отдельным участками. В этом-то и кроется ошибка - ведь значения, принятые в формуле за константы, на самом деле для отдельных участков константами не являются.

2. [info]podmoskovnik в своих рассуждениях пользуется достаточно общепринятым методом оценки нарушений. На графике для всех участков откладываем пары (x = явка, y = доля партии относительно количества избирателей на участке). Как нетрудно видеть, отношение y к x равно явке. Отсюда делается вывод, что все точки на графике должны группироваться вокруг прямой y=k*x, где k равно явке.

Попробуем нарисовать вышеописанный график для выборов в московскую думу (черная линия соответствует официальной явке):

Рис.2

Легко видеть, что облако точек и прямая y=0,66x явно не очень хорошо соотносятся друг с другом.

Дальше автор делает следующее предположение: "Кроме того, очевидно, что простое вбрасывание/приписывание голосов за кандидатуру власти (самый простой вид манипуляции) на конкретном избирательном участке приводит к смещению этого избирательного участка вместе со всеми его данными (и реальными, и фальсифицированными) в сторону более высоких явок. В результате на низких явках должны оставаться участки с нефальсифицированными данными." Т.е. получается, что "правильную" прямую нужно провести через левую нижнюю оконечность облака. Автор приходит к этому очевидному решению после длинных и запутанных рассуждений, которые мы здесь приводить не будем.

В итоге получается вот что (фактическая явка - 22%, фактический процент голосов за ЕР - 43%):

Рис.3

Есть ли и в этих рассуждениях ошибки? Ответ, опять-таки - да, есть. Причем, ошибка та же самая, что и у [info]filin. Да, действительно, если долю партии от всех избирателей поделить на явку на выборах, получится доля партии от числа голосовавших. Однако переход от выборов в целом к отдельным участкам не совсем корректен, ведь доля партии от числа голосовавших не является константой, она отличается от участка к участку. Как видно, например, здесь, доля партии от числа голосовавших колеблется от участка к участку по нормальному закону. Исходя из правила 3-х сигм, можно заключить, что облако должно быть распределено не вдоль прямой y=kx, а внутри прямых y=(k+3s)*x и y=(k-3s)*x, где s - параметр сигма функции распределения голосов за партию.

Т.е. данный график в отсутствие нарушений на выборах должен выглядеть приблизительно вот так вот:

Рис.4

3. А теперь попробуем применить полученный вывод для оценки фальсификаций на выборах в московскую думу. Вот что у нас получается:

Рис.5

Здесь верхняя прямая проходит вдоль плотных областей "облака", а нижняя проведена таким образом, чтобы почти все участки с явкой, близкой к 100%, попали в промежуток между верхней и нижней прямыми. Биссектриса дает нам искомую оценку явки - 60%.

Итак, данный метод дает оценку фальсификаций с голосами ЕР - 6%. Эта цифра отличается от оценки, полученной в моем предыдущем посте. Однако, как я уже говорил, это все достаточно грубые оценки. В любом случае, это оценки одного порядка.

ВЫВОДЫ

Оценки результатов выборов, сделанные ЖЖ-пользователями [info]filin и [info]podmoskovnik, содержат явные ошибки, которые не позволяют считать эти оценки достоверными.

Мою собственную оценку приходится несколько подкорректировать - я считаю, что приписки в пользу ЕР составили от 2 до 6% (от 50 до 150 тыс. голосов).

27-Окт-2009 03:09 pm - Московские выборы
Последнее время общим местом (причем даже в самых лоялистских кругах) стало признание того, что выборы в московскую думу были бесстыдно и тотально сфальсифицированы. Скачал я данные с сайты избиркома и решил посмотреть - так это или нет. Вообще, последнее время очень часто оказывается, что проводится громкая информационная кампания (в том числе и в государственных СМИ), а в реальности все обстоит в точности наоборот. Например, пару лет назад в СМИ была громкая истерика на тему отравления алкоголем - а в реальности наблюдался спад таких отравлений. Или помню еще истерику по поводу поджогов автомобилей в Москве - но автомобили горят постоянно, и в тот период никакого всплеска в этом отношении не наблюдалось. И т.д.

Итак, хочется изучить имеющиеся цифры. Думаю, наиболее разумно исходить из того, что распределение величин должно быть нормальным.

Для информации. По официальным данным, всего было зарегистрировано 7009468 избирателей, из них приняло участие в выборах 2471608 или 35,3% избирателей. ЕР получила 1637403 голоса или 66,25%. КПРФ получила 328641 голос или 13,3%. Остальные - менее 7%, кого интересуют цифры - можно посмотреть на сайте избиркома.

ДАННЫЕ

Начнем с явки. На первом рисунке - гистограмма распределения явки по всем избирательным участкам, с разбиением по процентам. Т.е. каждый прямоугольник показывает, на скольких участках явка была в пределах указанного значения (если написано, например, 17 - значит в этот интервал попадают значения от 16 до 17). На всплеск явки в районе 100% не обращаем внимание - это просто всякие спецучастки, типа воинских частей. На рисунке 2 я как раз отрезал эти участки с большой явкой, чтобы не мешали (учитываются только участки с явкой менее 80%). Тут добавлена нормальная функция, которая показывает, какое распределение голосов должно быть в идеале при зарегистрированной явке 35%. На рисунке 3 зеленым дополнительно обозначено распределение, которое, как мне кажется, лучше всего описывает имеющиеся данные.

Рис.1

Рис.2

Рис.3

Далее рисунок 4 - распределение голосов за ЕР. Для сравнения, на рисунке 5 - распределение голосов за КПРФ. На обоих рисунках дополнительно нарисована функция распределения, которая, как мне кажется, достаточно хорошо вписывается в имеющиеся данные.

Рис.4

Рис.5

Ну и напоследок, на рисунках 6 и 7 - так с учетом всех участков выглядит та самая зависимость количества голосов за ЕР от явки, которую все почему-то считают доказательством фальсификаций. На рисунке 7 не учитываются участки с явкой более 80% и нарисована наилучшая прямая (если кому интересно - ее уравнение: y=0,92x-9,2).

Рис.6

Рис.7

АНАЛИЗ

Теперь попытаемся проанализировать полученные графики. Во первых, на главный вопрос - были ли фальсификации - можно сходу ответить положительно. В этом нет никаких сомнений - искажения, видимые невооруженным глазом, ясно говорят об этом. Однако хотелось бы оценить размер этих фальсификаций.

Начнем с распределения явки. В левой части гистограммы, в области низкой явки, зияет дыра, вершина гистограммы изломана. Понятно, что это и является признаком фальсификаций. Сколько же голосов вброшено? На рисунке 3 я сдвинул влево функцию распределения на пару процентов - мне кажется, что так она лучше вписывается в данные. Это и дает нам грубую оценку - реальная явка приблизительно на 2% меньше официальных данных (середина нормальной функции распределения - это как раз среднее значение). Увеличение явки на 2% - это 140 тыс. лишних голосов.

Я считаю, что тут два разных типа нарушений. Во-первых, это попытка повысить явку на участках с крайне низкой явкой. Понятно, что такие участки в норме должны быть, однако их нет, а явка резко повышается, начиная приблизительно с 15%, и есть избыточная доля участков с явкой от 20% до 28%. Можно предположить, что на участках, на которых почти никто не пришел, все результаты почти полностью сфальсифицированы, причем понятно, что цифры "нарисованы" всем партиям, а не только ЕР. Посчитаем приблизительное количество участков в пустой области под зеленым графиком и над ним (в левой части). По приблизительной оценке, и там, и там по 150 участков (а значит, зеленую кривую я провел правильно). Это дает нам порядка 50-60 тыс. голосов (средний участок - 2000 чел., с учетом явки получим указанную цифру).

Во-вторых, это вброс голосов конкретно за ЕР на участках с нормальной явкой (зазубренная вершина гистограммы). В середине под гистограммой - порядка 120 участков, и приблизительно столько же - справа над гистограммой. Здесь оценка - тоже 50-60 тыс. голосов.

В сумме получаем около 100-120 тыс., что несколько расходится с первоначальной оценкой в 140 тыс., но думаю, что для грубой оценки это не очень большое расхождение.

Далее, смотрим на рисунок 4. Гистограмма достаточно хорошо вписывается в нормальное распределение. Правда она немного скошена вправо. Это явно результат вбросов голосов за ЕР. Середина распределения - 64%, в то время как официальная цифра - 66,25%. Опять-таки можем грубо оценить размер нарушений - 2,25% или порядка 60 тыс. голосов. Что в общем согласуется с предыдущими оценками.

ВЫВОДЫ

Итак, конечный результат: да, нарушения на выборах были, явка завышена на 2%, доля голосов за ЕР - тоже завышена на 2%. И мне все-таки кажется, что это не совсем согласуется с заявлением, что выборы тотально сфальсифицированы.

Продолжение
23-Мар-2007 01:07 am(без темы)
Мой блог можно читать здесь.

Реклама

Настроить
This page was loaded Ноя 27 2009, 1:14 am GMT.