?

Log in

No account? Create an account
Выборы в Москве: 1996-2012. О преемственности и причинности - 5/5 - nonenoun — LiveJournal
August 21st, 2013
12:52 am

[Link]

Previous Entry Share Next Entry
Выборы в Москве: 1996-2012. О преемственности и причинности - 5/5


2.4. Корреляции

Выясним, как зависят результаты выборов в районах (ТИКах) от предыдущих результатов. Например, в Ясенево в 2011 году ЕР получила 53%, а Путин в 2012 году - 45.9%. Сначала узнаем, как изменились результаты 2012 года по сравнению с 2000 годом. Эти выборы взяты не случайно - это максимально отдалённые друг от друга выборы, где список участников сильно пересекается - в них участвовали Путин и Зюганов. В 2000 году Путин участвовал в выборах как новый малоизвестный политик и как преемник Ельцина. В 2012 году он выступал в совсем ином качестве - как политик, про которого известно очень много. Тем удивительнее, что результаты, полученные им в Москве, почти не изменились:



На 70% участков результаты отличались не более, чем на 2%. И это несмотря на 12 лет разницы! Очень слабое изменение результата зафиксировано и у Зюганова. То же относится и к Явлинскому/Прохорову. Явлинский 2000-го года сильно отличается от Прохорова 2012-го года, однако мы видим очень высокую преемственность результатов. Так что расслоение Москвы на три электоральные группы (конформисты, коммунисты и либералы) является крайне устойчивым.

Теперь сделаем такое же сравнение для выборов 2011-2012 гг.:



Ситуация намного хуже. Прошло всего 3 месяца (а не 12 лет), а общего мало. Фальсификации в 2011 году привели к высокой дисперсии результатов. В 2012 году фальсификации были незначительными, поэтому дисперсия тоже была низкой. Это привело к множеству аномалий - например, 60% за ЕР превратились в 40-50% за Путина, 1-5% за Яблоко вдруг выросли до 25-30% за Прохорова, а облако КПРФ/Зюганов получилось горизонтальным.

Кому-то может показаться странным, что сравниваются результаты партий и отдельных кандидатов (например, КПРФ и Зюганова). Но данное сравнение является абсолютно оправданным - ведь при этом сравниваются электораты партий и кандидатов. Очевидно, что электорат КПРФ сильно пересекается с электоратом Зюганова. Чтобы проиллюстрировать правомочность подобного сравнения, сравним результаты 1999 и 2012 гг., а рядом приведём сравнение 2008 и 2009 гг.:



Мы видим, что результаты ОВР и Единства сильно похожи на результаты Путина. И это несмотря на 13 лет разницы между выборами и объединение результатов двух партий в один результат (объединение помогло учесть перетекание электората). Преемственность результатов КПРФ и Зюганова тоже выглядит интересной - получилось очень компактное облако, которое не имеет ничего общего с облаком для 2011-2012 гг. Но самое любопытное - это преемственность либерального электората. Для 1999 года взята сумма результатов двух либеральных партий - Яблока и СПС, а для 2012 года - результат Прохорова. И получилось, что эти результаты почти не отличаются! Хотя Прохоров никогда не был связан ни с Яблоком, ни с СПС.

На рисунке справа сравниваются выборы, которые разделяет всего год (а не 13 лет) - 2008 и 2009 гг. Здесь мы видим огромную дисперсию всех результатов (Медведева, Зюганова, ЕР, КПРФ).

Посмотрим, как менялась явка в районах:



На рисунке слева сравниваются выборы 2000, 2003, 2005, 2012. К федеральным выборам без значимых фальсификаций (2000, 2003, 2012) добавлены региональные выборы с небольшими фальсификациями (2005 год). Это сделано, чтобы показать преемственность явки даже для выборов с сильно отличающейся средней явкой (на региональных выборах в России явка обычно существенно ниже). Видно, что явка является более случайным параметром, чем результат: форма зависимости хоть и отлична от окружности, но не сильно. Тем не менее, и для явки наблюдается преемственность - видно, что там, где наблюдается малая явка, там и на следующих выборах в большинстве случаев явка будет невысокой.

На рисунке справа сравниваются соседние выборы - 2008, 2009, 2011. Здесь мы должны были увидеть ещё более компактные зависимости, чем на рисунке слева, но масштабные фальсификации разрушили всякую преемственность.

Было бы удобно характеризовать подобные зависимости одним числом - например, коэффициентом корреляции Пирсона. Построим таблицу корреляций результатов власти для выборов 1996-2012 гг.:



Таблица отражает классификацию объёма фальсификаций, которая была сделана ранее на основании гистограмм: 1999, 2000, 2003, 2012 - незначительные фальсификации; 2004, 2005, 2007 - умеренные; 2008, 2009, 2011 - масштабные. Стоит обратить особое внимание на 2012 год - он хорошо коррелирует с 1996 годом, но очень плохо - с 2011 годом. Хотя в одном случае прошло всего 3 месяца, а в другом - 16 лет. Любопытно и то, что с 2000 года корреляция с 2012 годом не растёт, а падает - т.е. чем ближе выборы, тем хуже корреляция (хотя в естественных условиях всё должно быть наоборот, но фактор фальсификаций всё перевешивает).

Применительно к оценке фальсификаций у корреляции Пирсона есть один существенный недостаток - она не учитывает дисперсию сравниваемых величин (а лишь показывает, насколько линейна их связь). Характерный пример, когда корреляция оказывается высокой для сфальсифицированных выборов - корреляция между выборами 2008 и 2009 годов, составившая 0.73 (пример был рассмотрен чуть ранее, речь о корреляции результатов Медведева и ЕР). При этом у выборов без существенных фальсификаций - 1999 и 2012 гг. - корреляция оказалась меньше и составила 0.65 (речь об ОВР+Единстве и Путине). Если визуально сравнить эти результаты, то окажется, что зависимость 2008-2009 обладает высокой дисперсией, а у 1999-2012 дисперсия намного ниже. Если величина обладает низкой естественной дисперсий (это актуально для явки, для результатов КПРФ), то корреляция всегда будет невысокой (даже при честных выборах). Поэтому нужна альтернатива корреляции Пирсона, которая в первую очередь должна учитывать дисперсию сравниваемых величин, а уж потом - линейность.

Предлагается следущий подход:



С помощью ортогональной регрессии Деминга находим угол, поворачиваем точки на этот угол и умножаем стандартные отклонения для X и Y. Назовём получившуюся величину произведением ортогональных отклонений - ODP (orthogonal deviation product). Чем выше ODP, тем выше вероятность того, что выборы были сфальсифицированы (у корреляции Пирсона всё наоборот).

Оценим с помощью ODP общую явку, а также явку ЕР, КПРФ и Яблока:



Отличие выборов 2008, 2009, 2011 гг. от остальных стало ещё более заметным. Также видно, на каких выборах практиковался массовый отъём голосов у КПРФ (2008, 2011) и Яблока (2011).

У ODP тоже есть недостаток - ODP не учитывает, что при малых результатах дисперсия должна быть меньше. Например, если партия набрала 10%, а на следующих выборах - 50%, то во втором случае разброс результатов будет выше. Следовательно, нужно нормировать дисперсию. О том, как должна выглядеть подобная нормировка, будет рассказано в следующей главе.

2.5. Отклонения от среднего

Средние результаты партий могут достаточно сильно меняться от выборов к выборам. Например, в 2003 году ЕР получила 34.4%, а в 2005 - 47.2%. Даже если учесть фальсификации в 2005 году, различие получилось порядка 10%. Поэтому при сравнении выборов бывает полезно вычесть среднюю составляющую - то есть проанализировать отклонения от среднего.

Город состоит из множества районов и в каждом свой социальный срез. Если сравнить социальный срез всего города с социальным срезом отдельных районов, то можно обнаружить серьёзные отклонения - где-то выше процент граждан с высшим образованием, где-то выше процент людей пожилого возраста и т.д. Это приводит к отклонению результатов выборов в районах от среднего по городу. Поскольку социальный срез меняется медленно (это относится как ко всему городу, так и к отдельным районам), то можно ожидать и стабильных отклонений результата от среднего. В итоге у города будет своя электоральная география - в каких-то районах будут больше голосовать за власть, в каких-то - за оппозицию.

Стабильность отклонений зависит от числа избирателей в районе (чем меньше избирателей, тем больше вероятность существенных изменений), поэтому в справочных целях приведу число избирателей в районах:



Проанализируем отклонения результата ЕР/Путина/Медведева для двух разных групп выборов - без значимых фальсификаций (2000, 2003, 2012) и с масштабными фальсификациями (2008, 2009, 2011):



Различия налицо - если фальсификаций не было, то наблюдается преемственность отклонений (оппозиционные районы остаются оппозиционными, провластные - провластными). Для сфальсифицированных выборов ситуация иная. Возьмём, для примера, район Арбат - в 2009 году он был оппозиционным (-2.9%), а в 2011 году - резко провластным (16.5%).

Для более детального анализа фальсификаций можно анализировать не только отклонения от среднего, но и разброс результатов внутри района - СКО (среднеквадратическое отклонение).



Красным цветом отмечен аномально высокий СКО: в 2000 году аномален лишь один район, в 2003 - 2, в 2012 - 16 (фальсификации в 2012 году заслуживают отдельной статьи). Несмотря на 16 красных районов, 2012 год резко отличается от 2011 года, где почти все районы - красные. Видно, что если фальсификации незначительны, то СКО является стабильной величиной. СКО крайне полезен при детальном электоральном анализе, т.к. является мерой неоднородности населения внутри района. Зная естественную неоднородность, можно достаточно эффективно находить фальсификации на отдельных участках.

Отобразим СКО на карте:

Здесь видно постепенное нарастание фальсификаций, которое резко прервалось в 2012 году.

Как было сказано ранее, среднее значение влияет на величину разброса. Если партия набрала 10%, а потом 50%, то во втором случае разброс будет выше. Чтобы проиллюстрировать данное утверждение, проведём простейший численный эксперимент. Представим, что электорат состоит из 10% сторонников одной партии и 50% сторонников другой партии (оставшиеся 40% принадлежат другим партиям). При этом вероятность прийти на выборы у всех избирателей одинаковая (в реальности это не так, но мы рассматриваем простейший случай). Теперь представим, что на участок пришло 100 избирателей. Число голосов у партий будет иметь биномиальное распределение, а мода (т.е. наиболее вероятное значение) равна 10 и 50 голосам. Но нас интересует не мода, а дисперсия числа голосов:



Мы видим, что для партии с 50% сторонников дисперсия существенно выше - т.е. результаты будут иметь больший разброс, чем у партии с 10% сторонников. На графике справа показано, как зависит СКО (корень из дисперсии) от доли сторонников партии среди всего электората. Наибольшей дисперсией будут обладать результаты партии, у которой 50% сторонников. Наименьшей - если сторонников нет, либо все поддерживают данную партию. СКО величины с биномиальным распределением можно использовать для нормировки дисперсии (зная средний результат можно определить и СКО, которое ему соответствует). В данной статье представлена лишь концепция нормировки, которая, тем не менее, показала хороший результат.

При анализе сфальсифицированных результатов партий мы сталкиваемся с тем, что вброс за одну партию меняет результаты всех партий. Именно поэтому удобно рассматривать не результаты партий, а их явку (отношение числа голосов за партию к числу зарегистрированных избирателей на участке). Этот метод анализа позволяет убедиться, что аномальными являются голоса лишь одной партии (за которую вбрасывают), а число голосов у других партий следует социальным законам. Однако вброс - это не единственный метод фальсификации. В последние годы набирает популярность переписывание протоколов (оно активно применялось на выборах 2008 и 2011 гг.). При переписывании часто перебрасывают голоса одной партии в пользу другой партии (например, было по 200 голосов у ЕР и КПРФ, а стало 300 за ЕР и 100 за КПРФ). В этом случае анализ явки также предпочтительнее анализа результата - можно заметить, у каких партий отнимали голоса по возникновению хвоста слева.

Проведём анализ явки для трёх электоральных групп (ЕР, КПРФ, Яблоко). Предварительно вычтем средние результаты, чтобы проанализировать стабильность распределений. Отмечу, что по горизонтали отложена не общая явка, а явка партии (одной или двух, если требуется учесть перетекание электората).



На верхнем левом рисунке показана гистограмма явки ЕР. Гистограммы подтвердили классификацию фальсификаций: 1999, 2000, 2003, 2012 - незначительные фальсификации, 2004, 2005, 2007 - умеренные, 2008, 2009, 2011 - масштабные. В случае масштабных фальсификаций гистограммы больше похожи на спектр белого шума, нежели на результат волеизъявления граждан. То есть социальные законы на данных выборах попросту перестают работать.

На верхнем правом рисунке показаны гистограммы явки Яблока - распределения для 1999 и 2012 гг. очень похожи. Слабо от них отличаются и распределения для 2000 и 2003 гг. А вот распределение для 2011 года отличается существенно - появился хвост слева из-за отъёма голосов. Видно, что гистограммы Яблока обладают небольшим хвостом справа (т.е. распределение обладает положительной асимметрией). Это может быть признаком фальсификаций, но, как уже не раз отмечалось, фальсификации сопровождаются целым рядом аномалий (причём крайне нестабильных), а здесь хвост является устойчивым явлением. Любопытно, что такая же ситуация наблюдается у Либерал-демократов в Великобритании.

На нижнем левом рисунке показаны гистограммы явки КПРФ. Гистограммы стабильные, выделяются лишь две - для 2008 и 2011 гг. (где виден хвост слева, связанный с отъёмом голосов). Проведём нормировку дисперсии, используя механизм предложенный ранее. Для этого найдём средний результат партии на выборах, разделим на 100 (так мы получим вероятность p, равную от 0 до 1), далее найдём коэффициент нормировки, равный 0.5/sqrt(p*(1-p)), умножим гистограмму по оси X на этот коффициент, а по оси Y разделим на него. Результат нормировки показан справа - аномальность 2008 и 2011 гг. стала ещё более заметной.

2.6. Электоральные карты

Электоральные карты позволяют наглядно показать результаты выборов - это один из тех методов электорального анализа, который понятен людям, далёким от науки. Тем не менее, в России он используется достаточно слабо.

В данной главе на всех картах будет отображаться отклонение от среднего результата (или средней явки) по городу. Это позволит сравнить разные выборы друг с другом. Нормировка дисперсии здесь применяться не будет, хотя на некоторых картах будет меняться масштаб цветовой шкалы (например, результаты КПРФ умещаются в диапазон от -5 до 5, а результаты ЕР - в диапазон от -10 до 10). Также будет меняться направление цветовой шкалы - где-то более высоким значениям будет соответствовать красный цвет, а где-то - синий.

Начнём анализ с результатов ЕР:

В 1996 году Ельцину противостоял коммунист Зюганов, поэтому Ельцина можно представить и как кандидата от либералов, и как кандидата от власти. Именно поэтому его результаты так однородны. Однако даже тогда проявилась характерная особенность московской электоральной географии - власть получает меньше всего в центре и на юго-западе. Видно, что текущая электоральная география сформировалась ещё в 2000 году - она почти не отличается от 2012 года. Также видно, что в 2004 году фальсификации затронули центр и юго-запад, в 2005 - юго-восток, в 2007 - центр и юго-восток, а в 2008, 2009, 2011 гг. фальсификации стали всеобщими.

Рассмотрим подробнее единичные фальсификации в 1999 и 2003 гг. В 1999 году видно аномальную красную область слева вверху от центра. Это район Сокол, где результат оказался на 3.1% выше среднего. Здесь Единство получило самый высокий процент по Москве - 16%, хотя по городу наиболее популярным результатом было 6-8%. Произошло это за счёт спецучастков (№ > 5000), где результаты достигали 30-40%. На обычных участках данного района Единство получило 5-6%. Это чуть ниже среднего по городу (7%), что совершенно логично, учитывая оппозиционность района - в 1996 году результат власти здесь был на 2.6% меньше среднего, в 2000 - на 7.2%, а в 2012 - аж на 10.1%.

В 2003 году аномалия наблюдается опять слева вверху от центра - в районе Тимирязево. Он был оппозиционным как в 2000, так и в 2012 году, а в 2003 вдруг стал резко провластным. Если посмотреть на обычные участки этого района (с номером меньше 3000), то почти все результаты (18 из 21) действительно ниже среднего по городу (34.4%). А вот на специальных участках (где контроль намного слабее) встречаются 50% и даже 70%.

Отдельно построим карты для 2000, 2003 и 2012 гг. - это позволит убедиться в высокой стабильности электоральной географии Москвы:


Проанализируем результаты Яблока (те, что не были сфальсифицированы):

Также видна устойчивость электоральной географии. Здесь ситуация обратна той, что была у ЕР - у Яблока наивысшие результаты в центре и на юго-западе. Любопытен случай Куркино (северо-запад Москвы), где в 1999 году Яблоко получило крайне низкие результаты, а в 2012 году - очень высокие. Сказывается то, что в районе резко выросло число граждан с высшим образованием (согласно переписи 2002 и 2010 гг. - с 20.8% до 65.2%, хотя в среднем по городу этот показатель вырос с 25.6% до 40.1%).

Теперь рассмотрим географию КПРФ:

Интересно, что у Зюганова в 1996 году было много голосов в центре и на юго-западе, где традиционно сильны позиции либералов. Эта особенность наблюдается также и на парламентских выборах в 1999 и 2003 гг. Это можно объяснить тем, что люди боялись голосовать за Яблоко из-за проходного барьера и голосовали за наиболее оппозиционную партию из оставшихся. Причём на президентских выборах 2000 и 2012 гг. это не наблюдается.

Рассмотрим географию явки:

Карты для несфальсифицированных выборов отдалённо похожи на карты Яблока. Видно, что с 2004 по 2011 гг. география резко менялась от выборов к выборам.

География явки для 2000, 2003 и 2012 гг.:

География не столь отчётливая, как у ЕР или Яблока, хотя преемственность всё же видна.

Теперь рассмотрим явки партий - это позволит нивелировать влияние вбросов на электоральную географию оппозиционных партий. Массовый отъём голосов практиковался далеко не на всех выборах. Как следствие, на тех выборах, где голоса не отнимали, география голосования у КПРФ и Яблока должна быть похожа на ту, что наблюдалась и на несфальсифицированных выборах. Начнём с явки Яблока:

Видно, что действительно массово голоса отнимали лишь в 2009 и 2011 гг. Остальные карты очень похожи.

Рассмотрим явку КПРФ:

Виден массовый отъём голосов в 2008 и 2011 гг. Что касается остальных карт, то хотелось бы ещё раз отметить, что география КПРФ на президентских выборах (кроме выборов 1996 года) отличается от географии на парламентских выборах. На парламентских она похожа на географию Яблока, а на президентских демонстрирует удивительную однородность.

Напоследок рассмотрим географию старейшей партии России - ЛДПР. Данная партия непопулярна в Москве, тем интереснее её география:

Видно, что география совпадает с географией ЕР, т.е. у электората ЕР и ЛДПР немало общего. На картах для 1999, 2000 и 2003 гг. в центре видны районы с активной поддержкой ЛДПР - в частности, в Тверском районе (самый центр Москвы). Если посмотреть на результаты по участкам, то можно увидеть, что среди 39 участков выделяются лишь два, где ЛДПР (выступавшая на выборах как "Блок Жириновского") получила 37.1% и 38.8%. Данные участки являются специальными (у обычных номера от 114 до 144, а у этих участков - 3012 и 3013). Скорее всего эти участки находились в СИЗО (в Тверском районе есть СИЗО), где Жириновский раньше получал высокие результаты.

2.7. Методы восстановления результата

Методы восстановления результата основаны на различных предположениях:
1) Выборка участков репрезентативна.
Принцип - обеспечить честность голосования на некоторой выборке участков, результат на которых отражает результат на всей совокупности участков. Честное голосование можно обеспечить с помощью усиленного наблюдения, либо за счёт использования средств автоматического подсчёта бюллетеней (КОИБ, КЭГ). Примеры, где по выборке определяется результат в городе/стране: эксперимент "Гражданина наблюдателя", выборка наблюдателей "Голоса", результат на участках с КОИБ.
2) Результат партии-победителя слабо зависит от явки (либо вообще не зависит).
Метод Собянина-Суховольского и метод Шпилькина основаны именно на этом предположении.
3) Должны соблюдаться естественные социальные закономерности, должна быть преемственность результатов.
Например, результаты ЕР и ЛДПР должны иметь положительную корреляцию, ЕР и Яблока - отрицательную. Также должны хорошо коррелировать результаты различных выборов - в частности, для 2011-2012 гг. должна наблюдаться корреляция результатов ЕР и Путина, КПРФ и Зюганова, Яблока и Прохорова и т.д. Внезапное появление регионов с высоким разбросом результатов также аномально. Восстановленный результат определяется по тем участкам, где обнаруживаются перечисленные корреляции и нет явных аномалий.

Знание точного результата ЕР в 2011 году позволяет апробировать различные методы восстановления результата. Сколько же ЕР реально получила в 2011 году в Москве при официальных 46.6%? Нередко можно услышать такие оценки как 30% и даже 35%. Однако в Екатеринбурге, городе-миллионнике, где массовых фальсификаций удалось избежать, ЕР получила 26.6% (и нет причин считать, что в Москве результат должен быть выше). Анализ статистических данных позволяет установить, что ЕР в Москве набрала примерно 25%. Именно такая оценка (~25%) озвучивалась различными политиками (Зюгановым, Г.Гудковым), экзит-полл ФОМ показал 23.6%, а наиболее популярным результатом на участках, где проходил эксперимент "Гражданина Наблюдателя" и где не было выявлено нарушений, также было 25%. Если очистить результаты на участках с КОИБ от фальсификаций и убрать смещение выборки, то результат будет такой же - 25%.

Рассмотрим метод восстановления, основанный на свойстве преемственности. Для иллюстрации, возьмём московские выборы 2011-2012 гг. Выборы 2011 года были почти полностью сфальсифицированы, но в некоторых районах фальсификации были небольшими, а выборы 2012 года были почти чистыми (объём фальсификаций не превысил 1%). Для 2012 года мы можем посчитать отклонение результатов по районам от среднего, а потом применить эти отклонения к выборам 2011 года для восстановления среднего результата. Алгоритм следующий: 1) возьмём районы с минимальным результатом на сфальсифицированных выборах, 2) добавим отклонение, посчитанное для предыдущих/следующих выборов, где фальсификаций не было, 3) выберем из полученных результатов наименьший. Попробуем найти реальный результат ЕР в 2011 году, используя данный алгоритм. Возьмём 15 районов с наименьшим результатом ЕР и учтём отклонение, посчитанное для 2012 года.


Из 15 значений 8 лежит в диапазоне 25-27.5%. Наименьшее значение - 25.1%.

Другой способ оценки реального результата - через наиболее вероятное значение (моду). Он основан на преемственности гистограммы результата, т.е. на том, что гистограмма не может измениться слишком сильно, и на том, что далеко не всегда фальсификации меняют моду распределения. Посчитаем гистограмму результата по участкам с крупным и малым шагом (1.0% и 0.2%) и сравним моду со средним результатом по городу:


Когда значительных фальсификаций нет, мода чуть отличается от среднего (разница составляет примерно 1%). В декабре 2011 года фальсификации были столь масштабными, что второй горб, где и были сосредоточены фальсификации, перевесил первый. Для первого горба мода равна 25.4% - если вычесть отклонение в 0.4%, посчитанное для предыдущих нормальных выборов (2000 и 2003 гг.), то результат ЕР составит 25%. То есть оценка реального результата с помощью моды в некоторых случаях достаточно эффективна.

2.8. Связь с социально-экономическими показателями

Электоральные карты показали, что город обладает устойчивой электоральной географией - в центре и на юго-западе голосование существенно отличается от голосования на окраинах. Также была выявлена устойчивая корреляция между явкой и результатом для провластных и либеральных кандидатов. Электоральная география и корреляции должны иметь объяснение с позиций социологии - как минимум, предпосылки для этого должны быть зафиксированы в опросах.

Стоит помнить, что вероятность голосования за того или иного кандидата сильно зависит от социально-экономических факторов. Из всех параметров, влияющих на эту вероятность, образование является ключевым (человек с высшим образованием меньше подвержен влиянию государственных СМИ, склонен к анализу, умеет сопоставлять информацию из разных источников). А поскольку образованные люди обычно более обеспеченные, то у них появляются иные потребности и мотивации, т.е. они находятся на ступеньку выше в иерархии Маслоу - например, начинают думать о правовом государстве, неприкосновенности частной собственности, защите прав человека - то есть задумываются о либеральных ценностях.

Рассмотрим опрос ФОМ, проведённый в январе 2012 года.



Мы видим, что:
1) С ростом образования поддержка Путина падает, а Прохорова - растёт.
2) Среди старшего поколения рейтинг Путина выше.
3) Женщины чаще мужчин голосуют за Путина.
Согласно опросу, голосование почти не зависит от доходов, но максимальный доход на графике не превышает 40 тыс рублей, хотя у многих в Москве зарплата выше этой суммы. Теоретически, для более высоких зарплат зависимости могут быть совсем иные.

Неоднородность голосования по районам Москвы может объясняться либо суммой факторов, либо одним доминирующим фактором. Если проанализировать результаты переписи 2010 года по районам Москвы, то можно увидеть, что неоднородность по возрасту и полу присутствует - разница между максимальным и минимальным значением достигает 10-20% (например, есть районы где женщин 47%, а есть, где 58%). Однако эта неоднородность подавляется таким показателем, как процент граждан с высшим образованием, который меняется от 18% до 65%. То есть электоральная география Москвы объясняется одним доминирующим показателем.





С ростом процента граждан с высшим образованием, результаты Путина падают, а Прохорова растут. Также видно, что повышенная поддержка Жириновского наблюдается в тех районах, где и Путин получает много голосов. Зависимость результатов Путина и Прохорова от образования наблюдается и в масштабах всей страны. При этом Московская область и Санкт-Петербург выделяются аномально высокими результатами Путина - при столь высоком проценте граждан с высшим образованием результат должен быть ниже. Это показывает, что контроль по уровню образования можно использовать для поиска фальсификаций (выборы в этих регионах были весьма грязными).

Мы выяснили, чем объясняется электоральная география Москвы. Теперь выясним, откуда появляется корреляция явки и результата. Рассмотрим опрос ФОМ от сентября 2011 года.



Видно, что явка в сельской местности существенно выше, чем в крупных городах. Также видно, что женщины ходят на выборы чаще, чем мужчины. Интересен график справа - люди с высокими доходами принимают участие в выборах намного чаще остальных. Поэтому электоральная география Москвы может объясняться не только процентом граждан с высшим образованием, но и кумулятивным эффектом от высоких доходов и высокого уровня образования. К сожалению, из опроса ФОМ от 2012 года мы не можем узнать предпочтения граждан с доходами выше среднего (50 тысяч и выше).

Рассмотрим опрос ФОМ от декабря 2007 года. Здесь отображена явка на выборах в зависимости от различных признаков - пола, возраста, дохода, образования и т.д. К сожалению, ФОМ перестал выкладывать подобную статистику в публичный доступ, поэтому приходится пользоваться данными 2007 года.


Мы видим, что:
1) Женщины ходят на выборы чаще мужчин.
2) Старшее поколение активно участвует в выборах, в отличие от молодого.
3) Люди с высшим образованием ходят на выборы чаще, чем люди со средним образованием.

При таких результатах опросов корреляция явки и результата является абсолютно естественной - более образованные чаще ходят на выборы и голосуют против власти и за либералов. Отмечу, что ситуация, когда с возрастом и образованием растёт явка, наблюдается и в США. При этом, в США, как и в России, завышается опросная явка - согласно опросу, в американских выборах приняли участие 61.8%, а реальная явка составила 58.2%.

Посмотрим на карту для явки, высшего образования, женщин и пенсионеров (процент пенсионеров взят из переписи как "Население по источникам средств к существованию - указавшие пенсию, кроме пенсии по инвалидности"):



Теперь выясним, как явка зависит от данных показателей:


Видна слабая зависимость явки от доли женщин и пенсионеров (что логично, учитывая малый диапазон значений этих показателей). Зависимость от доли граждан с высшим образованием достаточно сильная, однако слабее, чем у зависимости результата и образования. Как уже было показано, явка является более случайным параметром, чем результат, поэтому данная ситуация не выглядит странной.

На графике отмечено три района, которые выделяются на фоне остальных - Молжаниновский, Восточный и Покровское-Стрешнево. Первые два района - самые малочисленные в Москве (2 и 8 тыс. избирателей соответственно), а в районе Покровское-Стрешнево была зафиксирована карусель. Фальсификации в итоге и привели к аномально высокой явке, район из оппозиционного стал провластным и было зафиксировано высокое СКО результата Путина.

Если корреляция явки и результата стабильно наблюдается от выборов к выборам, то она связана с неоднородностью социального среза на различных участках и не имеет отношения к фальсификациям. Чтобы понять, насколько естественна корреляция, достаточно провести репрезентативный опрос и проследить, есть ли зависимость между явкой определённой группы избирателей и её политическими предпочтениями. Так, явка пенсионеров и студентов может сильно отличаться, как и их предпочтения. Дальше нужно выяснить, насколько однородно заселены регионы группами с сильными отличиями в явке и предпочтениях (тут могут помочь данные переписи). Если однородно, то причин для корреляции нет. Если неоднородно, то надо исследовать, не происходит ли балансировка предпочтений различных групп избирателей. Например, явка пенсионеров традиционно высока и они охотно голосуют за власть. Однако люди с высшим образованием тоже демонстрируют высокую явку, но голосуют за оппозицию. Смешивая различные группы, мы можем обнаружить почти полное отсутствие корреляции. Видно, что к устойчивой отрицательной корреляции явки и результата власти в Москве приводит доминирование одного показателя - уровня высшего образования.

2.9. Подмосковье, Ясенево, Тёплый Стан

Подтвердить честность выборов можно с помощью результатов в соседних регионах. Для Москвы это особенно актуально - Московская область социально и экономически глубоко интегрирована в столицу. Многие жители Московской области работают в Москве, обладают там родственными и дружескими связями. Социальный срез в регионах хоть и отличается, но не слишком сильно. Например, в области 30.1% обладает высшим образованием, в столице - 41%. В такой ситуации странно ожидать, что результаты в этих регионах будут резко отличаться.



Можно заметить, что почти на всех выборах похожи не только результаты, но и явка. Резко выделяется 2011 год - ЕР в Москве получила на 13.5% больше, явка была на 10.7% выше. В 2012 году ситуация поменялась - Путин получил в области на 9.8% больше, явка была на 3.2% выше. Как уже отмечалось, в 2012 году выборы в Подмосковье были частично сфальсифицированы, причём фальсификации в Долгопрудном и Рузском районе были подкреплены видеодоказательствами. С помощью уравнения регрессии для зависимости результата Путина от уровня высшего образования можно оценить и реальный результат Путина в области - он должен равняться примерно 51%.

То, что применимо к регионам, применимо и к районам. Если у нас есть районы с близким социальным срезом, то и результаты должны быть похожи. Рассмотрим в качестве примера два соседних спальных района Москвы - Ясенево и Тёплый Стан. Ясенево должен быть чуть более провластным, т.к. там проживает 43.1% граждан с высшим образованием, а в Тёплом Стане - 46.9%. Однако в 2011 году результаты в Ясенево были столь аномальны, что о них даже написали в СМИ. Но выборы 2012 года всё расставили по местам.



3. Выводы

Массовые фальсификации на выборах - это крайне интересное социальное явление, в которое вовлечены сотни тысяч человек. Сперва власть создаёт стимулы для фальсификации, потом выстраивает избирательный процесс так, чтобы эти стимулы были реализованы. Всё это должно прикрываться подконтрольными СМИ, социологическими компаниями, правоохранительными органами и судебной властью. Но знание механизма фальсификаций позволяет эффективно их раскрывать и оценивать масштаб. Официальная статистика выборов с сайта ЦИК содержит достаточно информации для подобного анализа. В первой части данной статьи кратко описаны именно эти моменты.

Во второй части анализируются выборы в Москве, проходившие с 1996 по 2012 гг. Главный вывод исследования - что все три электоральные группы (голосующие за власть, КПРФ или либералов) демонстрируют устойчивые характеристики. Устойчивы корреляции, гистограммы, электоральные карты. На этом фоне хорошо заметны фальсификации, появившиеся в 2004 году - впрочем, они имели слабое влияние на средний результат в Москве до 2008 года. После масштабных фальсификаций в 2008 году, ситуация повторились в 2009 и 2011 гг. Массовые митинги после выборов 2011 года привели к тому, что московские власти существенно снизили давление на избиркомы и выборы 2012 года в Москве по многим характеристикам почти полностью совпали с выборами 2000 года. Демонстрация преемственности результатов была одной из главных целей данного исследования. Второй целью было изучение причинно-следственных связей между социально-экономическими факторами и результатами. Было показано, что результаты власти и либералов имеют сильную зависимость от процента граждан с высшим образованием в районе. Чем выше уровень образования, тем меньше голосуют за власть и больше - за либеральных кандидатов.

(16 comments | Leave a comment)

Comments
 
[User Picture]
From:barouh
Date:August 21st, 2013 11:10 am (UTC)
(Link)
По поводу восстановления результатов "методом преемственности" - в Гагаринском районе при общем провале ЕР тем не менее было несколько участков, где им нарисовали под 30% и даже за 30% голосов. Реальный результат ЕР в районе заметно ниже официальных 23%

В Зеленограде в некоторых районах (кажется, в основном в Силино) были явные вбросы (физические вбросы - ведь там КОИБы). Для данной конкретной задачи стоило бы рассматривать районы Зеленограда по отдельности. Впрочем, Зеленоград - это все же не совсем Москва. Не факт, что там динамика настроений избирателей была такая же, как в основной части города

По остальным районам - кажется, фальсификации хотя бы на части участков были везде (может быть, кроме Свиблово и Ростокино - двух единственных районов внутри МКАД, где пристойное СКО)

Так что "метод преемственности" просто не на что опереть
[User Picture]
From:nonenoun
Date:August 21st, 2013 11:20 am (UTC)
(Link)
Так Гагаринский район согласно "методу преемственности" оказывается сильно сфальсифицированным - посмотрите на скорректированный результат (33%). И метод не предполагает, что районы с минимальным результатом - честные. Он предполагает, что только среди них могут попасться честные. И сработал он хорошо - 25% выдал.

Что касается вбросов на зеленоградских КОИБах, то у меня этот вопрос рассмотрен в статье про КОИБы. Основные вбросы были в Строгино, Зеленоград почти не пострадал.
[User Picture]
From:barouh
Date:August 21st, 2013 02:00 pm (UTC)
(Link)
25% этот метод выдал лишь как один из возможных результатов :)

Про Зеленоград - сейчас не помню деталей и нет времени копаться, но я хорошо помню, что целый ряд участков в Зеленограде выбивались аномальной явкой в декабре и аномально маленьким приростом Путина относительно ЕР
[User Picture]
From:nonenoun
Date:August 21st, 2013 02:05 pm (UTC)
(Link)
Разумеется, 25% - это лишь наиболее вероятный результат. Поскольку, если сфальсифицированы были все районы (на чём вы настаиваете), то эта оценка является завышенной. Хотя другие методы подтверждают эту оценку.
[User Picture]
From:barouh
Date:August 21st, 2013 11:18 am (UTC)
(Link)
В Подмосковье заметные фальсификации были не только в 2012 году, но и в 2011-м - притом на парламентских выборах они были, насколько я понимаю, сильнее (Особенность Подмосковья в том, что там фальсификации децентрализованы - они определяются не столько губернатором, сколько районными и городскими властями, и получается мозаичная картинка, когда на одних и тех же выборах в одном городе фальсификации пропадают, а в другом наоборот появляются с нуля)

Вообще стоит учитывать, что если бы фальсификаций не было, мы бы увидели скорее всего постепенное увеличение различий между Москвой и областью в сторону большей провластности второй: на протяжении всего путинского периода его электоральная поддержка все больше смещается в сторону села и поселков (доля которых даже после расширения Москвы все равно в области куда выше)
[User Picture]
From:dima1989
Date:September 13th, 2013 11:30 pm (UTC)
(Link)
В Подмосковье чётко были сфальсифицированы результаты в Реутове и Железке, в меньшей степени - в Истринском районе.
[User Picture]
From:dmitrykogan
Date:August 21st, 2013 11:55 am (UTC)
(Link)
Методом Шпилькина на думских выборах у меня получилось для Москвы 28,5%, возможно, она действительно слишком осторожная. И спасибо за отличный обзор.
[User Picture]
From:corbulon
Date:August 21st, 2013 01:03 pm (UTC)
(Link)
Думается на этой основе нужно сделать короткий (раз в 5 короче) и популярный обзор.

(Свинья я: забыл сказать спасибо за огромную работу!)

Edited at 2013-08-21 04:25 pm (UTC)
[User Picture]
From:travalliero
Date:August 21st, 2013 09:30 pm (UTC)
(Link)
Очень-очень-очень круто, спасибо!
[User Picture]
From:beer_evangelist
Date:August 21st, 2013 10:39 pm (UTC)
(Link)
Спасибо, очень интересно :)
[User Picture]
From:naukarus
Date:September 3rd, 2013 06:30 am (UTC)
(Link)
в связи с выводом, можно оценить результаты, допустим, Гудкова в области?
[User Picture]
From:nonenoun
Date:September 3rd, 2013 07:02 am (UTC)
(Link)
Оценить можно, но мне Московская область не слишком интересна. Хотя, если Гудков наберёт приличный процент, то можно будет посмотреть.
[User Picture]
From:naukarus
Date:September 3rd, 2013 07:08 am (UTC)
(Link)
Я почему говорю о МО, поскольку там нет харизматиков и традиционные электоральные предпочтения должны быть унаследованы. Т.е. можно сделать прогноз с достаточной уверенностью.
Мне самому конечно интересны только выборы в Москве, но не будут ли результаты крайне неожиданны и для власти и для оппозиции?
[User Picture]
From:tov_y
Date:September 11th, 2013 04:54 am (UTC)
(Link)
Скажите, пожалуйста, а где конкретно Вы брали данные по уровню образования для районов Москвы и нельзя мне как-то поиметь эти цифры (желательно, включая и Новую Москву)?
[User Picture]
From:nonenoun
Date:September 11th, 2013 06:38 am (UTC)
(Link)
Вот. С Новой Москвой всё сложнее, т.к. на момент переписи она не была в составе Москвы. Не уверен, что есть данные по отдельным "районам" Подмосковья.
[User Picture]
From:tov_y
Date:September 11th, 2013 01:24 pm (UTC)
(Link)
Мерси!
free counters Powered by LiveJournal.com