?

Log in

No account? Create an account
Выборы в Москве: 1996-2012. О преемственности и причинности - 4/5 - nonenoun — LiveJournal
August 21st, 2013
12:53 am

[Link]

Previous Entry Share Next Entry
Выборы в Москве: 1996-2012. О преемственности и причинности - 4/5


1.5. Электоральная статистика

Поскольку оппозиция, социологи и наблюдатели не в состоянии с приемлемой точностью оценить объём фальсификаций (по разным причинам), в России стал расти интерес к статистическим исследованиям выборов - то есть к электоральной статистике. Отмечу, что термин "electoral statistics" в англоязычной среде обозначает статистику выборов (результаты по участкам, округам и т.д.), а не сам анализ. Для обозначения дисциплины, изучающей выборы с помощью статметодов, используется термин psephology (псефология): "Psephology is a branch of political science which deals with the study and scientific analysis of elections. Psephology uses historical precinct voting data, public opinion polls, campaign finance information and similar statistical data." В России этот термин распространён слабо, хотя в некоторых ВУЗах есть курсы по данной дисциплине - например, в ВШЭ. Упрощая, можно сказать, что псефология (электоральная статистика) - это наука на стыке статистики, социологии и политологии. И социологическая часть не менее важна, чем статистическая. Например, партия ЛДПР хоть и содержит в своём названии слово "либеральный", но голоса либерального электората никогда не собирала - она аккумулировала голоса чуть оппозиционного провластного электората (легко проследить, что ЛДПР получала много голосов в тех районах, где и у ЕР были хорошие результаты).

Если в других странах электоральная статистика в основном исследует поведение электората, то российская электоральная статистика - это, прежде всего, поиск электоральных фальсификаций. Существует три направления исследований:

1) Анализ аномалий, которые сами по себе указывают на фальсификации. Есть не меньше десяти таких аномалий:
1.1) Высокий разброс явки/результатов даже при внешней однородности региона (наиболее наглядный пример - разброс результатов на соседних участках даже в тех случаях, когда срез жителей, приписанных к участку, по сути ничем не отличается). Иногда это приводит к появлению второго кластера (как это было в декабре 2011 в Москве) или даже третьего.
1.2) Тяжёлый правый хвост гистограммы явки/результата.
1.3) Левые хвосты оппозиционных партий ("зануление" голосов).
1.4) Крайне низкий разброс результатов (результаты как "под копирку" - особенно часто это встречается на Кавказе).
1.5) Сильная корреляция явки и результата (даже для однородных регионов).
1.6) Пики на круглых процентах на гистограмме явки/результата (75, 80, 85 и т.д.)
1.7) Большое количество нулей в протоколах голосования (причём, чем выше результат, тем больше нулей).
1.8) Резкий рост явки в конце дня.
1.9) Аномально высокое число надомных/открепительных бюллетеней.
1.10) Аномально низкое число недействительных бюллетеней, нарушение пропорции действительных/недействительных бюллетеней.
1.11) Нарушение естественных корреляций (например, между ЕР и ЛДПР) и антикорреляций (таких как ЕР - Яблоко).
1.12) Резкое отличие явки/результата на участках с обычными и электронными урнами.
и т.д.

2) Анализ аномалий в динамике, для чего исследуются выборы за прошлые годы. Исследуются корреляции между выборами, появление и исчезновение перечисленных выше аномалий.
Для подобного анализа важно сохранять адреса и границы участков - чтобы можно было сопоставлять результаты за разные годы (иначе доступно сравнение лишь на уровне ТИК, т.к. границы ТИК меняются гораздо реже). Также полезно знать, какие именно дома прикреплены к участку. Неопределённость позволяет спекулировать такими аргументами, как "ведомственные дома", "военные части", "общежития" - где голосование должно отличаться от среднего по городу (хотя таких участков очень мало). Но и без списка адресов эти аргументы можно отвергать "от обратного", если получить список ведомственных домов, военных частей и общежитий. Также бывают проблемы с получением списка участков, где установлены электронные урны.

3) Анализ причинно-следственных связей. Это наиболее сложное, но в то же время необходимое направление, без которого вряд ли можно говорить о научности электоральной статистики в России. Для этого анализируются:
3.1) Свидетельства наблюдателей - чтобы провести связь между способом фальсификации и аномальным результатом. Например, если наблюдатель рапортует о вбросе бюллетеней, то в большинстве случаев явка и результат у одного из кандидатов окажутся завышенными. Именно благодаря свидетельствам наблюдателей известно, что наиболее популярные способы фальсификации - это вброс бюллетеней и переписывание протоколов, что и приводит к появлению перечисленных выше аномалий. Особую ценность представляют свидетельства, публикуемые прямо во время выборов - их точно не получится назвать подгонкой данных под желаемый вывод. К сожалению, партии редко когда публикуют информацию о нарушениях в разрезе участков - например, для выборов 2011 года в Москве лишь Яблоко опубликовало список нарушений. Стоит помнить, что фиксируется и попадает в хронику лишь малая часть всех нарушений. Помимо свидетельств наблюдателей есть и другой способ фиксации нарушений - веб-камеры на участках. С их помощью можно сравнивать реальную явку с официальной, отмечать вбросы и карусели.
3.2) Судебные хроники - чтобы понять, каким образом система позволяет простым исполнителям безнаказанно фальсифицировать выборы. Например, судьи никогда не удовлетворяют ходатайства о графологической экспертизе подписей на протоколах, даже если один из членов УИК прямо говорит, что эта подпись не его. В целом, у судей есть целый арсенал методов, чтобы отказать заявителям в расследовании фальсификаций. В марте 2013 года состоялось заседание Конституционного суда, которое установило, что суды незаконно запрещали простым гражданам оспаривать итоги выборов на участке. Наблюдатель, даже имея на руках доказательство фальсификации (корректно оформленный протокол, где показатели кандидата от власти существенно меньше официальных) сталкивался с тем, что суды отклоняли подобные иски. Это мотивировалось тем, что лишь партии могут обращаться в суд (хотя они этого не делают). Подобная позиция активно поддерживалась властью (1, 2, 3, 4).
3.3) Социологические исследования - чтобы понять, почему прогнозы социологов удивительным образом совпадают с официальными результатами. До недавнего времени социологи крайне неохотно говорили о фальсификациях и постобработке опросных данных для получения выборных прогнозов. После декабря 2011 стали появляться дискуссии о "социально одобряемом ответе", были озвучены масштабы фальсификаций. Существуют попытки нивелировать влияние "социально одобряемого ответа" за счёт использования альтернативных социологических методик. Нельзя не отметить удачное сочетание социологического исследования и наблюдательской деятельности - эксперимент "Гражданина Наблюдателя", о котором было сказано ранее. Группы подготовленных наблюдателей были отправлены на 156 московских участков (при этом была обеспечена случайность и репрезентативность выборки участков). Детальное освещение этого проекта в день выборов минимизировало возможную субъективность наблюдателей и организаторов. Дальнейший анализ, зафиксированный в статье Ениколопова, Коровкина, Сонина и Захарова, позволил установить, что наблюдатели существенно снизили уровень фальсификаций, а отчёты наблюдателей в деталях осветили методы фальсификации выборов в Москве в 2011 году.
3.4) Социально-экономические факторы.
Опросы показывают, что разные социальные страты голосуют и ходят на выборы по-разному - кто-то активно участвует в выборах, кто-то нет. Кто-то предпочитает голосовать за власть, кто-то - за коммунистов. Комплексный анализ данных переписи и опросов позволяет объяснить, почему в тех или иных районах голосование происходит по-разному. В случае массовых фальсификаций подобный анализ позволяет доказать невозможность получившихся результатов с позиций социологии.

Также заслуживают исследования такие любопытные проявления "вертикали власти" как поощрение фальсификаторов. Напомню про нашумевшую историю учительницы Татьяны Ивановой - она отказалась фальсифицировать выборы (за это ей предлагали 70 тыс рублей) и сообщила подробности в СМИ (на её участке в Санкт-Петербурге ЕР получила один из самых низких процентов в городе). Премия может достигать и более солидных размеров - например, члену ТИК из Петербурга дали 140 тысяч: "Избирком Петербурга премировал главу ТИКа, чей подчиненный дважды убегал с протоколами голосования. Было принято решение о вручении премии в 140 тыс рублей главе ТИК 29 Василию Демкину, где на выборах 4 марта массово удалялись наблюдатели, сообщила депутат СР Оксана Дмитриева. «В подчинении Демкина находится УИК 1717, председатель которой Дмитрий Иванишин на выборах 4 декабря сбежал с итоговым протоколом голосования. К выборам 4 марта наблюдатели уже знали специфику этого участка, поэтому тогда при подведении итогов они выстроились каре, чтобы загородить Иванишину выход. Но тот выпрыгнул в окно и сбежал». На работу ТИК премированного Демкина было подано в общей сложности 37 жалоб. Премии были выделены с формулировкой «за активную работу по проведению выборов». Дмитриева напомнила, что за два месяца до выборов 4 марта петербургский избирком рассматривал вопрос об отстранении Демкина с должности, но тогда было принято решение оставить его на посту." (подробнее об аномальных результатах в ТИК 29). Другие получили не премию, а повышение - "Карпухин, который сп*л мешок и убежал, был назначен директором школы №1308". А особо отличившихся наградил Чуров.

Исследователям не стоит забывать, что электоральная статистика - наука во многом эмпирическая (т.е. построенная на опыте). Чтобы увидеть общие закономерности следует анализировать выборы не только в России, но и в других странах. Также нужно разделять две задачи: 1) доказательство массовых фальсификаций, 2) оценка объёмов фальсификаций. С первой задачей анализ дискретностей (т.е. нулей в протоколах и пиков на круглых значениях) справляется идеально. Для второй задачи предпочтительнее анализ КОИБов, корреляций, дисперсий и хвостов. Все эти методы лишь усиливают друг друга, однако нужно осознавать границы применимости методов. Например, если результаты были однородными (и отличались слабо), а потом ситуация резко изменилась (как в Москве) - значит, что-то здесь не так. А если из года в год наблюдается одна и та же корреляция между явкой и результатом (как в Великобритании) - значит, сказывается естественная неоднородность.

Анализ российских выборов осложнён масштабными фальсификациями - непросто найти эталонные данные, о которых точно известно, что они не содержат фальсификата. Именно поэтому относительно честные выборы 2012 года в Москве имеют столь высокую научную ценность - они подтвердили общие закономерности (что явка не должна так сильно коррелировать с результатом, что нет естественных причин для тяжёлых правых хвостов явки и результата и т.п.), а также подтвердили фальсификации на предыдущих московских выборах.

Напоследок, хотелось бы прокомментировать пропагандистский аргумент, что выборы не являются случайным процессом, поэтому их нельзя анализировать статистическими методами (данный аргумент используется лишь в интернет-спорах и в серьёзной литературе не фигурирует). Разумеется, выборы - это случайный процесс - ведь их результаты невозможно точно предсказать, всегда будет погрешность. Даже про конкретного человека мы не можем точно сказать, за кого он проголосовал (можем лишь оценить вероятность). Когда число факторов, влияющих на исход определённого события, столь велико, что традиционные (детерминистские) методы перестают работать, идут в ход методы статистические (вероятностные). Например, возьмём классический случай подбрасывания монеты. Если мы сможем точно измерить силу и направление броска, будем знать точную форму и плотность монеты, будем знать параметры поверхности, куда приземлится монета - мы сможем точно определить, выпадет орёл или решка. Но на практике сделать подобные измерения крайне трудно. И мы можем лишь оценить вероятность выпадения орла/решки, которая в идеале должна равняться 0.5 (т.е. из 100 бросков примерно 50 будет орлами, а 50 - решками).


2. Анализ выборов

2.1. О преемственности результатов и причинно-следственных связях

Исследование выборов в Великобритании позволило сформулировать более совершенный подход при анализе фальсификаций: необходимо учитывать перепись населения и предыдущие выборы. Результаты выборов в разрезе участков/районов/городов при отсутствии фальсификаций должны иметь тесную взаимосвязь с результатами переписи (если будет доказано иное, то это опровергнет базовые социологические принципы). Также результаты выборов должны коррелировать с результатами предыдущих выборов (это следует из невозможности резких изменений социального среза за время между выборами). Именно в этом и заключаются свойства преемственности и причинности. Приведу два примера - выборы в Польше и в Нью-Йорке (США):



Здесь отображены результаты выборов президента в 2010 году, и выборов в Сейм (польский парламент) в 2007 и 2011 гг. Видно, что сохраняется устойчивая структура - даже на разных по характеру выборах (президент/парламент).

В 2008 году на многих участках Нью-Йорка Обама получил крайне высокий результат - более 90%. На первый взгляд, столь высокие результаты выглядят необычно. Однако, если сравнить карту результатов Обамы с картой темнокожего населения Нью-Йорка (основанной на переписи 2000 года), то всё становится на свои места.



Два социальных фактора, которые надо учитывать при анализе фальсификаций - неоднородность населения (сильно отличающийся срез избирателей на различных участках) и перетекание электората (когда есть несколько похожих партий, между которыми распределяются симпатии избирателей). Неоднородность может приводить к появлению корреляции явки и результата, а также к хвостам на гистограммах явки и результата. Но неоднородность не должна приводить к снижению корреляции результатов между выборами. К подобному снижению приводит перетекание электората - если политическая система позволяет существовать множеству достаточно сильных партий с похожей программой, то партии будут соревноваться за общий электорат. В итоге избиратель будет выбирать из 2-3 вариантов. Хотя даже сочетание неоднородности и перетекания электората не должно приводить к низкой корреляции явки между выборами.

Если фальсификаций нет, то неоднородность можно исследовать по отдельно взятым выборам. Перетекание электората требует исследования нескольких выборов или тщательного анализа выборной социологии. Пример страны, где наблюдается высокая неоднородность, но низкое перетекание электората - это Великобритания. Страна с высокой неоднородностью и высоким перетеканием - это Израиль. На перетекание сильно влияет избирательная система - если в Великобритании она мажоритарная (что приводит к появлению двух/трёх-партийной системы и сокращению пространства выбора), то в Израиле система пропорциональная, причём с очень низким проходным барьером (2% на выборах 2013 года), что приводит к появлению множества партий, конкурирующих за общего избирателя.

Отмечу несколько масштабных исследований по теме:

Vote evolution in Spain, 1977–2007: A spatial analysis at the municipal scale. В статье исследуется процесс перехода Испании от диктатуры Франко к демократии (Spanish transition to democracy) - исследованы результаты выборов с 1977 по 2007 гг. Показано, как в 80-е годы гистограмма результата левых партий постепенно становится всё больше похожей на нормальное распределение. При этом наблюдается высокая корреляция с предыдущими выборами (то есть нет нарушения преемственности).


Особый интерес представляет исследование французских выборов - сравнение 13 распределений явки на выборах с 1992 по 2009 гг. показало, что несмотря на изменение средней явки от выборов к выборам, форма распределения крайне стабильна. Также в статье проанализирована пространственная корреляция явки. Позже авторы расширили статью выборами в Польше, Германии, Румынии и других странах.

В последние годы набирает популярность социофизика (sociophysics) - дисциплина, использующая методы статфизики для социологических исследований. Одно из таких исследований позволило открыть универсальную закономерность для пропорциональных систем с открытым списком - распределение голосов за кандидатов хорошо аппроксимируется логнормальным распределением (хотя это не имеет отношения к России, т.к. в России список закрытый). (1, 2, 3)

Если же говорить о причинности, то первые серьёзные работы по данной тематике появились больше 50 лет назад. В исследовании датских выборов за период 1947-1964 (опубликовано в 1967) рассматривалась связь социальных факторов и результатов партий (краткое содержание, текст). Подобные исследования есть и для российских выборов. Однако надо учитывать, что исследования, где игнорируются массовые фальсификации, представляют сомнительную ценность.

2.2. Методология

При сопоставлении различных выборов важно сравнивать одни и те же территориальные единицы, чтобы обеспечить сохранение социального среза. Если выборы проходят подряд (как было в 2011-2012 гг.), то границы участков, как правило, сохраняются - это позволяет сравнивать, как изменились результаты на участках. Но если выборы разделены годами, то велика вероятность, что границы участков были пересмотрены. В этом случае надо сравнивать результаты в районах (ТИКах). Конечно, даже при сохранении границ социальный срез избирателей меняется - из-за взросления, смерти, миграции и других естественных причин. Но этот процесс очень медленный и на интервале в несколько лет практически незаметен.

Территориальное деление Москвы почти не претерпело изменений за 12 лет (с 2000 по 2012) - город по-прежнему состоит примерно из 120 районов (ТИКов). Единственная сложность возникла с Зеленоградом. Во всех вычислениях он рассматривается как единый ТИК, хотя на некоторых выборах он состоит из нескольких. Например, на выборах 2012 года он состоял из пяти ТИК (Крюково, Матушкино, Савелки, Силино, Старое Крюково), в 2009 году - из трёх (Матушкино-Савелки, Панфиловский, Крюково), а в 2000 - из одного. Чуть сложнее ситуация с территориальным делением для 1996 и 1999 гг. Приведу схему группировки по районам, которая позволяет сравнивать выборы 2000-х с выборами 1996 и 1999 гг.:
1996: Очаково|Матвеевское = Очаково-Матвеевское
      Раменки|Мосфильмовский = Раменки
      Западное Дегунино|Бусиново = Западное Дегунино
      Левобережный-Молжаниновский = Левобережный|Молжаниновский
      Лианозово-Северный = Лианозово|Северный
      Южное Тушино-Куркино = Южное Тушино|Куркино
1999: Очаково|Матвеевское = Очаково-Матвеевское

Для примера, в 1999 году было два района - Очаково и Матвеевское, а в 2000 они были объединены в один - Очаково-Матвеевское. Для более удобного сравнения электоральных карт друг с другом для 1996 года использованы те же границы районов, что и для 2012. Для справки приведу карту Москвы, где указаны названия районов:



В статье анализируются следующие выборы:



Важный момент - под ЕР в статье понимается не только сама партия, но и кандидаты от власти, под КПРФ - кандидаты от КПРФ, под Яблоком - либеральные кандидаты и партии. В таблице учтено разделение провластного электората между двумя кандидатами/партиями в 1996 (Ельцин и Лебедь) и в 1999 (ОВР и Единство). Что касается либеральных партий, то Яблоко и СПС трижды конкурировали за общего избирателя (в 1999, 2003 и 2007). Приведу наглядный пример, показывающий необходимость учитывать перетекание электората:



Здесь показаны результаты первого и второго туров президентских выборов 1996 года. Видно перетекание электората от Лебедя к Ельцину - разброс синих точек существенно выше, чем красных.

Почти у всех гистограмм в статье по вертикали отложено число избирателей (а не участков), а также использовано центрирование бина. Центрирование бина подразумевает, что бин шириной 1% в окрестностях 50% (для примера) охватывает значения [49.5, 50.5), а не [50, 51) как обычно принято. Данные меры гарантируют, что малые участки не будут иметь существенного влияния на форму гистограммы, что важно при анализе хвостов и пиков на круглых процентах. Хотя для Москвы это не столь актуально, т.к. малых участков здесь очень мало (под малыми участками подразумеваются участки, где число зарегистрированных избирателей меньше 500):



В число малых участков попадает большинство спецучастков (вокзалы, больницы, СИЗО). На таких УИК социальный срез существенно отличается от среднего по району, однако это не значит, что там возможны такие результаты, как 90% за ЕР. Характерный пример - ГКБ №10 (УИК 3314), где в 2011 ЕР получила запредельные 95%, а Путин спустя три месяца набрал скромные 59.6%. Интересно, что в 1999 и 2000 гг. результаты на таких участках почти не отличались от средних по городу:



Число избирателей на малых и специальных участках столь мало, что они почти не влияют на итоги выборов. При анализе неоднородностей с помощью среднеквадратического отклонения (СКО), такие участки надо исключать - они мешают анализировать фальсификации на крупных участках. И дело не только в отличающемся социальном срезе, но и в том, что результаты на таких УИК слишком легко сфальсифицировать (там обычно нет наблюдателей).

На выборах 1999 года в состав нескольких районов были включены участки для голосования соотечественников за рубежом. Список таких участков обнаружить не удалось, но удалось найти, какие страны были приписаны к какому району. Чтобы отсечь подобные участки, убирались УИК, где явка меньше 15% (хотя на нескольких графиках, где это некритично, они остались). В некоторых случаях эти УИК видно из названия - например, в Красносельской ТИК есть участки под названием "УИК МИД (Израиль)".

Для 1999 года отсутствуют данные по участкам для двух районов - Метрогородок и Перово (для этих районов есть данные лишь на уровне ТИК). Для 1996 года данных по участкам нет для всего города (только ТИК).

Результаты переписи 2010 года по Москве в разрезе районов были взяты с сайта Росстата. Карта Москвы была взята с Википедии.

В статье используется такое понятие, как явка партии или явка избирателей определённой партии (например, явка ЕР, явка КПРФ). Не следует путать эту величину с общей явкой или результатом партии. Явка избирателей определённой партии - это доля голосов за партию от числа избирателей, внесённых в списки (величина введена по аналогии с общей явкой, которая равна доле выданных бюллетеней от списочного состава). Формула для результата партии содержит в знаменателе число бюллетеней в урне, поэтому вброс бюллетеней за определённую партию меняет результаты всех партий (ведь вброс повышает число бюллетеней в урне), а явка изменится лишь у одной партии (ведь списочное число избирателей остаётся неизменным). То есть анализ явки партии позволяет нивелировать влияние вбросов за другие партии (например, если вброс был за ЕР, то явка ЕР изменится, а явка КПРФ - нет).

2.3. Гистограммы

Российские фальсификации можно разделить на три типа: 1) вброс; 2) переписывание протокола; 3) фальшивые участки. Вброс включает в себя: 1.1) круизное голосование (карусели); 1.2) вброс в урну для выездного голосования; 1.3) вброс на участке для голосования. Переписывание протокола также может делиться на три категории: 2.1) приписывание голосов кандидату/партии; 2.2) приписывание голосов вместе с отъёмом голосов у других кандидатов/партий; 2.3) "рисование" протокола - обеспечение плана по явке и результату (при этом на реальные результаты не обращают внимания). Фальшивые участки - технология достаточно новая и вряд ли она станет популярной. Выборы на таких участках не проходят (на территорию участка не заходит ни один человек, тем более, что доступ на участок чаще всего невозможен). Результаты на фальшивых УИК обычно объявляют фантастические (90% и выше). Технология активно применялась в Санкт-Петербурге на президентских выборах в 2012 году.

Знание технологий фальсификации необходимо для восстановления результата. Например, если все протоколы "рисуют" (как это происходит в некоторых национальных республиках), то восстановление результата не представляется возможным. Но если хотя бы несколько протоколов было занесено в ГАС «Выборы» в неискажённом виде, то восстановить результат вполне реально (и чем больше таких протоколов, тем выше точность восстановления). Надо помнить, что организовать равномерные фальсификации практически невозможно (обычно именно неравномерность указывает на фальсификации). Также далеко не всегда удаётся поставить на участки лояльных председателей, кто согласен фальсифицировать выборы. Есть противодействие и со стороны оппозиционных наблюдателей и членов УИК. Так что почти во всех городах будет хотя бы несколько участков без искажений.

Проведём небольшой численный эксперимент - посмотрим, как влияет вброс на гистограммы явки и результата. В качестве исходных данных возьмём выборы 2012 года. На каждом втором участке добавим Путину случайное число бюллетеней с нормальным распределением (среднее - 300, СКО - 100 бюллетеней). Это крайне примитивная модель фальсификаций (есть лучше), но она позволяет увидеть, как искажаются гистограммы при вбросе:



До вброса гистограммы явки и результата аккуратные (симметричные и остроконечные), причём явка отлично аппроксимируется нормальным распределением. Чёрным цветом показано среднее значение результата при данной явке. Видно, что наблюдается небольшая отрицательная корреляция явки и результата (за исключением хвоста справа, вызванного незначительными фальсификациями - но это тема для отдельной статьи). После вброса симметрия разрушается, возникают зазубрины, хвосты справа, появляется значительная положительная корреляция явки и результата.

Зная, каковы последствия вброса, посмотрим как менялись гистограммы с 1999 по 2012 год:



Для 1999, 2000 и 2003 гг. мы видим похожие графики - симметричные гистограммы без каких-либо хвостов, небольшая отрицательная корреляция явки и результата. Ситуация начала меняться в 2004 году, когда Путин пошёл на второй срок (напомню, что это год появления множества артефактов на выборах по всей России). Причём выборы 2003 и 2004 гг. разделяло всего несколько месяцев - не было никаких оснований для существенных социальных изменений за этот срок. В 2004 году появился хвост явки справа, появилась положительная корреляция явки и результата для высоких явок (для малых и средних явок она осталась отрицательной). В 2005 году ситуация почти повторилась, но здесь мы видим очень высокий разброс результатов при небольшом хвосте явки (такая картина свойственна для массового переписывания протоколов, когда общая явка сохраняется, но голоса перебрасываются от одной партии к другой). Корреляция для малых и средних явок опять была отрицательная. Выборы 2007 года похожи на выборы 2004 года, разве что хвост стал намного значительнее. Самое интересное началось в 2008 году, когда Медведеву довелось сменить Путина. Это было за полгода до разгара мирового кризиса и Россия была на пике экономического роста - оппозиция была крайне ослаблена. Выборы 2008 года оказались в ряду самых грязных в истории России, особенно процветало рисование круглых значений явки и результата. Применялось это и в Москве (впервые) - видны пики на 75, 80, 85%. Выборы 2009 года в Мосгордуму, вошедшие в историю своей скандальностью, стали естественным продолжением того, что было в 2008 году - пики на круглых значениях сохранились, корреляция явки и результата усилилась. Гистограммы перестали даже отдалённо напоминать то, что было в начале 2000-х. На их фоне выборы 2011 года выделяются лишь бимодальностью - было большое количество участков, где результаты были посчитаны честно (и где ЕР получила около 25%) и где результаты рисовали (там ЕР получила 51% и выше). Характерно, что пик наблюдается именно на 51%, а не на 50%. После этих выборов случились массовые уличные протесты, на участках увеличилось количество наблюдателей, появились веб-камеры. И выборы 2012 года почти полностью повторили выборы 2000 года.

Исходя из этих гистограмм, московские выборы 1999-2012 гг. можно разделить на три категории по масштабу фальсификаций:
1) Фальсификации были незначительными: 1999, 2000, 2003, 2012
2) Фальсификации были умеренными (1-5%): 2004, 2005, 2007
3) Фальсификации были масштабными: 2008, 2009, 2011

Рассмотрим пики на круглых процентах в 2008, 2009 и 2011 гг. (для сравнения приведены и выборы 2012 года) при малом бине (0.2%):



Выделяются следующие пики (перечислю лишь наиболее заметные):
2008 год: пики явки на 65, 75, 80, 81, 82, 85, 91%, пики результата на 75, 80, 83, 90%.
2009 год: пики явки на 48, 50%, пики результата на 75, 85%.
2011 год: пик явки на 75%, пик результата на 51%.

Явным образом выделяется 2008 год. Для примера, в бин на 75% явки попало 25 УИК, на 74% - 6, 76% - 8 (причем среди этих 25 участков нет ни одного, где было бы меньше 1000 избирателей). Характерно и то, как проходило в 2008 году голосование на участках с КОИБ:



На участках с электронными урнами хвост еле заметен, а на обычных участках он настолько огромен, что даже привёл к бимодальности. Именно на обычных участках отчётливо видны пики на круглых процентах (что ещё раз показывает эффективность КОИБ в борьбе с фальсификациями).

Пики, появление второго кластера в 2011 году (51% за ЕР при 65% явки), исчезнование статаномалий в 2012 году - всё это указывает на централизованный характер фальсификаций. Избиркомы не фальсифицируют от желания угодить начальству - у них есть план, где кандидат должен набрать определённый процент (например, не меньше 75% в 2008 году или 51% в 2011 году).

Рассмотрим подробнее гистограммы для 2000, 2003, 2012 гг.:



На верхнем левом рисунке мы видим гистограммы явки и здесь бросается в глаза, что гистограммы для 2003 и 2012 гг. очень похожи. Между разными по характеру выборами (парламентскими/президентскими) прошло 9 лет, однако сходство очень высоко. Гистограмма для 2012 года чуть более высокая, однако это естественно, ведь число избирателей увеличилось за эти 9 лет. Чтобы учесть это изменение, на рисунке справа показаны нормированные гистограммы за вычетом среднего. Видно, что все три гистограммы очень похожи, причём они хорошо аппроксимируются нормальным распределением (аппроксимация показана чёрным цветом).

На нижнем левом рисунке сравниваются гистограммы явки для 2012 года с гистограммами для 2008, 2009 и 2011 гг. Видно, сколь мало у них общего. То есть между выборами, которые разделяют всего 1-4 года, общего гораздо меньше, чем между выборами, которые разделяют 9-12 лет.

На нижнем правом рисунке показаны гистограммы результата для 2000, 2003 и 2012 гг. - и опять мы видим высокое сходство. Гистограммы для Зюганова в 2000 и 2012 гг. очень похожи, то же относится и к Путину.

Теперь выясним, как зависит явка от результата для выборов 1999, 2000, 2003, 2011 и 2012, а заодно рассмотрим случай массового отъёма голосов у Яблока в 2011 году:



На верхнем правом рисунке показано, к чему привёл массовый отъём голосов у Яблока в 2011 году - к хвосту слева и пику на 1%. Видно, как 2011 год резко контрастирует с остальными выборами. Если исключить 2011 год, то у ЕР корреляция между явкой и результатом отрицательная, у Яблока - положительная, у КПРФ - тоже положительная, но совсем слабая (у КПРФ другой масштаб по вертикали). Стабильная зависимость явки и результата - это важный итог исследования, хоть и предсказуемый (для выборов в Великобритании данная зависимость тоже стабильная). Отдельно отмечу, что на выборах без существенных фальсификаций у кандидата от власти корреляция отрицательная, а не положительная.

(Продолжение)

(25 comments | Leave a comment)

Comments
 
[User Picture]
From:barouh
Date:August 21st, 2013 11:19 am (UTC)
(Link)
Особая благодарность за заключительные графики этой серии - очень показательно

Кстати, а как именно считались эти графики? Что там бралось за бин/окно?

Edited at 2013-08-21 02:01 pm (UTC)
[User Picture]
From:nonenoun
Date:August 21st, 2013 02:12 pm (UTC)
(Link)
Да, это оплошность - на последнем рисунке не отображён бин. Я планировал изначально объединить два последних рисунка (т.е. сделать 8 графиков в одном рисунке), но потом передумал (уж слишком громоздко получалось). А бин равен 1%, как и на предыдущем рисунке.

Если речь о зависимости явки и результата, то считалась она так:
Участки сортировались по явке (100 бинов от 0 до 100%), для каждого бина считался средневзвешенный результат - т.е. не среднее по результатам, а участки в бине объединялись в один метаучасток и для него считался результат. Полученная зависимость смещалась по оси X и Y на среднее значение явки и результата (по городу).
[User Picture]
From:barouh
Date:August 21st, 2013 02:35 pm (UTC)
(Link)
Понял, спасибо

А для других (до 2011 года) фальсифицированных выборов такие графики не строили?
[User Picture]
From:nonenoun
Date:August 21st, 2013 02:43 pm (UTC)
(Link)
Так они же видны на двумерной гистограмме (теплокарте). Здесь я добавил лишь вычитание средних, для наглядности. Единственное, что может быть интересно - зависимость явки и результата при малых и средних явках (где фальсификации минимальны) для 2004, 2005, 2007 гг. Если нужно, могу построить.
[User Picture]
From:barouh
Date:August 21st, 2013 07:01 pm (UTC)
(Link)
Ну тут как раз интересно совмещение разных выборов на одном графике. Но в общем непринципиально - можно обойтись и без аналогичного графика по фальсифицированным выборам
[User Picture]
From:nonenoun
Date:August 21st, 2013 07:15 pm (UTC)
(Link)
Я для этого и поместил 2011 год, чтобы было понятно сколь велико различие. Другие выборы помешали бы наглядности, получилась бы мешанина из графиков.
[User Picture]
From:dmitrykogan
Date:August 21st, 2013 11:44 am (UTC)
(Link)
Фальсификации на президентских выборах 2012 были незначительными только в Москве, по стране их было не меньше чем на думских - 10-15 млн набежало.
[User Picture]
From:barouh
Date:August 21st, 2013 02:09 pm (UTC)
(Link)
Существенное сокращение уровня фальсификаций было не только в Москве, но и во многих других регионах - например, в Самарской, Тульской областях, на Кубани, в Нижнем Новгороде и т.д. Даже в некоторых республиках - Мордовии, Башкирии, Татарстане - рисовали не так нагло и рьяно

Обратных примеров - роста уровня фальсификаций - очень мало. Мурманск, Волгоградская область - и кажется все

Об уменьшении объемов фальсификаций например написано тут (в т.ч. update в конце - про фальсификации в городах): http://kobak.livejournal.com/104514.html
[User Picture]
From:dmitrykogan
Date:August 21st, 2013 02:36 pm (UTC)
(Link)
Я читал Дмитрия, и Ваш подход к дисперсии как индикатору фальсификаций мне тоже понравился. Тем не менее я насчитал ~10 процентных пунктов вбросов за Путина http://dmitrykogan.livejournal.com/53699.html. Может, конечно, перестарался, но вряд ли.
[User Picture]
From:dmitrykogan
Date:August 21st, 2013 02:39 pm (UTC)
(Link)
Т.е. всего раза в полтора меньше, чем на думских
[User Picture]
From:barouh
Date:August 21st, 2013 07:12 pm (UTC)
(Link)
При всем уважении к Шпилькину, я достаточно критически отношусь к его методике и всем вариациям на ее основе, поскольку я твердо знаю, что различия между городом и селом как в явке, так и в электоральных предпочтениях могут носить вполне естественный характер (у меня диплом и недописанная кандидатская 12-15 лет назад были как раз про электоральные различия города и села)
[User Picture]
From:dmitrykogan
Date:August 21st, 2013 07:34 pm (UTC)
(Link)
Да, методика грубая и не слишком точная, но при этом робастная - т.е. если вбросы есть, она их выявит. А что касается города и села - и там и там кривая Чурова есть где пожиже, где погуще, при таком масштабе фальсификация ошибка в пару процентов несущественна. Но конечно, чем больше методик, тем лучше.
[User Picture]
From:barouh
Date:August 21st, 2013 10:47 pm (UTC)
(Link)
Согласен, что если вбросы есть, то "метод Шпилькина" его заметит. Но возможны и ложные срабатывания, и заметные преувеличения объемов фальсификаций

Показательно, что у вас получилось, что фальсификации были везде - но например для Архангельской области или Карелии кажется нет никаких иных - кроме корреляции явка-Путин на повышенных явка- оснований предполагать наличие фальсификаций
[User Picture]
From:dmitrykogan
Date:August 22nd, 2013 09:05 am (UTC)
(Link)
Ну да, этот задранный чуровский хвост - безошибочный индикатор, на мой взгляд.
[User Picture]
From:barouh
Date:August 22nd, 2013 09:33 am (UTC)
(Link)
Уточните пожалуйста, что именно Вы имеете в виду под "чуровским хвостом"? Появление положительной корреляции между явкой и голосованием за власть на участках с повышенной явкой?

Тогда я не согласен, что это безошибочный индикатор. Если этот хвост состоит из сельских участков (или группы участков, у которой есть какие-то другие объединяющие объективные характеристики), то это нельзя считать обязательно следствием фальсификаций
[User Picture]
From:dmitrykogan
Date:August 22nd, 2013 10:31 am (UTC)
(Link)
Да, это и есть чуровский хвост. В общем случае Вы совершенно правы - он может возникать по естественным причинам. Но вряд ли в данном случае. Во первых, этот хвост возникает всегда - если мы внутри каждого региона рассмотрим городские и сельские районы отдельно, он появится в обоих случаях, только в городских будет более выражен. Что означает, что часть районов в каждой группе сильно затронута вбросами, а часть нет.

Во вторых. Чисто методологически вы также правы - в науке как в суде, при доказательстве гипотезы сомнения трактуются в пользу обвиняемого. Но у нас иная задача - не доказательство, а количественная оценка фальсификаций, и здесь уже работают принцип Оккама и теория вероятности. Своего рода метод максимального правдоподобия - выбирается причина, максимизирующая вероятность официальных результатов выборов. Такой причиной, безусловно, является их фальсификация.
[User Picture]
From:barouh
Date:August 22nd, 2013 09:56 pm (UTC)
(Link)
По хорошему, надо смотреть на конкретные регионы, у которых есть такой чуровский хвост, и про которые при этом из других источников ничего не известно про фальсификации, и смотреть - за счет каких участков возникает хвост в городских ТИКах? и аналогично по сельским ТИКам

Еще раз повторюсь: я не верю, что во всех регионах были фальсификации, которые минимум на 4-6% завышали явку. Если методика показывает, что фальсификации были везде, значит что-то не так с методикой
[User Picture]
From:dmitrykogan
Date:August 23rd, 2013 08:09 am (UTC)
(Link)
Мне кажется странным такой оптимизм. Современная российская политическая система в принципе не может работать честно, это подтверждено всеми возможными способами. Я проверяю методику иначе - переименовываю ЕР например в КПРФ и наоборот, а затем прогоняю тот же сценарий - оценка фальсификаций в этом случае нулевая по всем регионам.
[User Picture]
From:barouh
Date:August 23rd, 2013 01:59 pm (UTC)
(Link)
В рамках современной политической системы вполне возможен честный подсчет голосов на подавляющем большинстве участков того или иного города или района. Доказано Москвой в марте 2012 г. и многими другими городами и в декабре, и в марте. Доказано и многими местными выборами (лично отвечаю за Воскресенск осенью 2012 - там все было чисто)
Вот сейчас я пытаюсь закончить одно свое исследование - там получается, что ровно в половине крупнейших городов России (23 из 46) в декабре 2011 г. не было значимых фальсификаций. Они если и были, то на 1-2-3% участков - и заметного влияния на общегородские результаты оказать не могли
[User Picture]
From:dmitrykogan
Date:August 23rd, 2013 02:29 pm (UTC)
(Link)
Не стоит доказывать недоказуемое. Ложные цели уводят в сторону от истины. Тем более что через 2 недели у нас будет новый материал.
[User Picture]
From:kobak
Date:August 23rd, 2013 03:13 pm (UTC)
(Link)
Любопытно было бы посмотреть!
[User Picture]
From:jemmybutton
Date:September 10th, 2013 11:51 am (UTC)
(Link)
Все круто, но зависимость не обязательно стабильная, видимо. По крайней мере в Венгрии можно проследить как она меняется http://jemmybutton.livejournal.com/2906.html
[User Picture]
From:nonenoun
Date:September 10th, 2013 12:08 pm (UTC)
(Link)
Про Венгрию я у вас читал, да. К сожалению, у вас не построена усреднённая кривая - только облако точек. Порой, это нагляднее. И хорошо бы эти кривые (2006 и 2010 гг.) совместить на одном графике (т.е. как у меня на самом последнем рисунке).
[User Picture]
From:jemmybutton
Date:September 10th, 2013 12:16 pm (UTC)
(Link)
Если вам интересно, то могу, когда доберусь до компьютера и если найду, выложить исходные данные по Венгрии просто.
[User Picture]
From:nonenoun
Date:October 8th, 2013 09:03 am (UTC)
(Link)
Выложить было бы неплохо (на будущее). Стабильность явки и результата, скорее всего, определяется партийной системой. В Великобритании и РФ партий мало, поэтому и зависимость стабильная. Ну и однородность тоже влияет - для Москвы зависимость, очевидно, будет более стабильная, чем для всей России. Я тут построил зависимость для Собянина и Навального - никаких сюрпризов.
free counters Powered by LiveJournal.com