Підсумки виборів. Аналіз електоральних переваг
Підсумки виборів. Аналіз електоральних предпочтеній1
Чуров В.Е.2, Арлазаров В.Л.3, Соловйов А.В.4
У статті викладено методологічний підхід до визначення основних тенденцій електоральних переваг на основі статистичних даних. Наведено результати аналізу даних підсумкових протоколів дільничних виборчих комісій на підставі фактора територіальної приналежності виборців. Наведено висновки про подальші напрямки досліджень електоральних переваг, а також короткий опис побудови математичної моделі електоральних переваг.
Позначення і скорочення
ЧФ - людський фактор, ІС - інформаційна система, НС - надзвичайна ситуація, БД - база даних, ДВК - дільнична виборча комісія, ТВК - територіальна виборча комісія, ОДП - оперативно-диспетчерський персонал, ПО - програмне забезпечення
Вступ
Останнім часом в публікації з'явилися статті, в яких робляться спроби обробити електоральну статистику за допомогою математичних методів і виявити очевидні і неочевидні тенденції, що впливають на проведення виборчого процесу [1, 2, 3].
Оскільки практично всі ці дослідження носять критичний характер, спробуємо і ми розібратися в тому масиві статистичних даних, які накопичилися після чергових федеральних виборів.
Для початку визначимо, що ми власне хочемо досліджувати і для чого. Зазвичай в статтях опонентів дається аналіз статистичних даних за двома незалежними параметрами, наприклад, розподіл кількості дільничних виборчих комісій (ДВК) в залежності від явки і розподіл голосів за кандидатів (партії) також в залежності від явки. На підставі аналізу даних протоколів ДВК, що знаходяться у відкритому доступі [4], робиться зазвичай один і той же висновок: оскільки розподіл (наприклад, числа ДВК в залежності від явки) не відповідає нормальному закону розподілу (закону великих чисел) щодо середньої явки, то результати виборів є недостовірними.
Такий висновок можна було б зробити, якби ми мали справу з однорідним масивом, як виборців, так і ДВК, які, підкоряючись якомусь випадковому процесу, брали участь у виборах. Однак це не зовсім так. По-перше, сам процес виборів аж ніяк не випадковий, тому що занадто багато факторів на нього впливає, а по-друге, сам масив, як виборців, так і ДВК аж ніяк не однорідний.
До того ж, досліджуючи різні соціологічні статистичні залежності (наприклад, статистику автомобільних аварій, статистику доходів і т.д.), ми практично ніколи не отримаємо гарне нормальний розподіл. Однак, висновок про те, що результати автомобільних аварій "підтасовані" явно некоректний.
Тому, більш грамотним і глибоким підходом до аналізу електоральної статистики був би, на наш погляд, наступний.
1. Побудова моделі електоральних переваг
Отже, що ж ми хочемо дослідити.
На наш погляд, говорити про однорідність виборців в країні загалом дещо некоректно, отже, ми повинні побудувати модель і по ній досліджувати "ідеальні" електоральні переваги (політичні уподобання виборців), порівняти їх з реальними, отриманими на виборах, і на підставі цього порівняння робити висновок про те, наскільки вони розходяться з "ідеальним" чином середнього пострадянського виборця.
Отже, ми хочемо розбити всі безліч виборців на деякі однорідні підмножини, для кожного підмножини виділити основні тенденції електоральних переваг і побудувати ідеальні функції факторів, що впливають на ці переваги. Далі, на підставі даних протоколів ДВК можна побудувати реальну картину для кожного підмножини виборців і порівняти її з ідеальною.
Потім, підсумуємо всі тенденції і переваги різних підмножин виборців і порівняємо отриману інтегральну картину із загальною реальною картиною на підставі даних протоколів ДВК на виборах.
Побудова «ідеальної» моделі електоральних переваг почнемо з виділення найбільш значущих параметрів, на підставі яких ці переваги можуть формуватися. На нашу думку, таких параметрів кілька. Вони можуть бути віднесені умовно до "основним" і "додатковим".
До основних параметрів моделі електоральних переваг віднесемо наступні:
1) місце проживання (приналежність до певної електоральної географії):
- місто / село, регіон;
- економічний стан регіону;
- соціокультурні традиції (особливо електоральної культури).
2) динаміка економічного добробуту:
- динаміка по групах населення (молодь, що працюють, пенсіонери і т.д.);
- протестні настрої.
3) категорії населення:
- вік / стать / трудовий статус і ін.
На підставі даних численних досліджень ВЦИОМ, ФОМ, РОМИР, ЦПТ, ЦЕССІ і ін. Можна побудувати картину електоральних переваг з точністю до міста, району, окремої категорії населення і вже точно для регіону в цілому.
Звичайно, протоколи ДВК не містять жодних відомостей про вік, економічний добробут і т.д., але містять однозначну прив'язку до регіону, який багато в чому і характеризується проживають там населенням (згадаємо хоча б "червоний пояс" регіонів, які традиційно підтримують КПРФ).
До додаткових параметрів моделі електоральних переваг можна віднести:
1) вплив ЗМІ в регіоні (ті ж соціологічні опитування показують, що близько 97% населення РФ отримує інформацію саме за допомогою телебачення, при цьому 17-20% вважають, що роблять вибір при голосуванні під впливом ЗМІ [8]);
2) динаміка політичний переваг (статистика ВЦИОМ, ФОМ і ін.);
3) робота партій в регіонах (статистика діяльності регіональних відділень партій);
4) вплив помилок ДВК / ТВК на достовірність інформації (тут можна використовувати відомі математичні моделі впливу втомних помилок, помилок некомпетентності на підставі даних про досвід роботи співробітників ДВК / ТВК);
5) оцінка впливу адміністративного ресурсу;
6) вплив виду виборів (регіон / місцеві / федеральні і партії / персоналії), відомо, наприклад, що за персоналії голосують охочіше, ніж за партії (статистика ВЦИОМ).
Можна виділити ще багато інших параметрів, однак вийшла модель може виявитися сильно перевантаженою, і розрахунки по ній методами факторного дисперсійного або регресійного аналізу можуть виявитися вельми громіздкими (див. [5]).
На наш погляд вищенаведених параметрів моделі цілком достатньо, щоб побудована модель була б досить адекватної реальній картині, а розрахунки по ній досить точними, навіть, незважаючи на спотворення і погрішності статистичних даних всіляких соціологічних опитувань.
2. Перевірка вірності основних положень моделі
Для перевірки адекватності припущення про вплив різних параметрів на моделі, проведемо невеличкий аналіз статистичних даних протоколів ДВК.
Були взяті дані протоколів ДВК 25 регіонів європейської частини РФ з виборів Президента РФ 2. березня 2008 року. На території цих регіонів чисельність електорату становила 22223670, що становить близько 21% виборців країни, кількість ДВК - 22318 (приблизно 23% ДВК).
Оскільки даними соціологічних опитувань ми не мали, перевіримо вірність положення моделі про неоднорідність безлічі виборців на основі наявних даних.
Так само як і опоненти проведемо дослідження залежності кількості ДВК від явки виборців. На перший погляд картина повністю відповідає картині, отриманої опонентами. Ні про яке нормальне розподіл мови не йде, однак крива регресії (червоний колір) дає припущення про наявність неоднорідного масиву даних, мабуть з різними тенденціями (див. [6, 7]).
Мал. 1. Залежність кількості ДВК від явки виборців.
Розділимо все безліч ДВК на приналежність до певного місця проживання. Навіть грубе поділ на "місто-село" дає наступну картину.
Мал. 2. Залежність кількості ДВК, розділених за принципом "місто-село" від явки виборців.
Під "іншими" будемо розуміти ДВК, які формально не належать ні до міста, ні в тин: тобто суднові, військові, закриті і інші ДВК, їх кількість досить велика (890 штук або 3,99%), однак кількість виборців на них близько 1% (в середньому близько 290 виборців за списком на один ДВК), отже, внесок в загальну скарбничку голосів також невеликий.
Характерно, що навіть таке грубе поділ всього безлічі ДВК вже виділило 3 абсолютно різні і в той же час стійкі тенденції. Що, правда, зовсім не дивно. У селах, де взаємозв'язку між людьми набагато міцніше і глибше, ніж в місті, набагато вище середня явка і однорідніше переваги. У містах, де ці зв'язки слабкі, явка нижча і переваги змінюються від регіону до регіону, що говорить про більшу неоднорідності самого масиву міст, по відношенню до сіл.
Що стосується суднових, закритих та інших ДВК, то тут, хоча внесок їх по голосах незначний, однорідність досить велика (близько половини мають явку 100%). Дане явище теж можна пояснити, особливо для закритих "військових" ділянок. Дисципліна, як відомо, має бути як на підводному човні, залізна, інакше, що це за військова частина, так що о 9:00 побудова, о 9:15 голосування, направо, кроком руш. Але, підкреслимо, внесок їх у загальну скарбничку голосів досить малий, незважаючи на те, що дані взяті з Калінінградської, Архангельської, Мурманської областях, а також по Ненецькому автономному окрузі.
Якщо дані закритих ділянок виключити із загальної картини голосів, якісна картина розподілу голосів в залежності від явки виборців не зміниться. І, до речі, не факт, що на цих закритих ділянках було порушення "прав осіб" (див. Наприклад, негативний нахил графіка в точці 100% голосів за Дмитра Медведєва).
Мал. 3. Залежність розподілу голосів по кандидатам у відсотках від спискового складу ДВК в залежності від явки.
Мал. 4. Залежність розподілу голосів по кандидатам у відсотках від спискового складу ДВК в залежності від явки (місто).
Мал. 5. Залежність розподілу голосів по кандидатам у відсотках від спискового складу ДВК в залежності від явки (село).
Якщо додатково розкласти ДВК міського і сільського типу за кількістю людей у списку (до 1000, від 1000 до 2000, більше 2000), то виходить наступна картина.
Мал. 6. Залежність розподілу кількості ДВК в залежності від явки і розмірів ДВК (тільки місто).
Мал. 7. Залежність розподілу кількості ДВК в залежності від явки і розмірів ДВК (тільки село).
З графіків видно, що в містах основний внесок, причому практично однаковий, в загальну тенденцію внесли ДВК зі списком понад 1000 виборців (більше 95% виборців), решта 5% припали на дрібні ДВК. Тенденція дрібних міських ДВК відрізняється від загальної тенденції великих і претендує на проведення додаткових досліджень, наприклад, по регіонах, однак на увазі малого вкладу в загальну скарбничку голосів, проводити їх немає великого сенсу.
У селах же навпаки, основний внесок у сільських ДВК (більше 65% виборців і найвища середня явка - понад 80%). Вони і визначили загальну тенденцію для всієї множини сільських ДВК. Чим більше сільські ДВК, тим менше їх внесок (вірніше множин таких ДВК) в загальну скарбничку голосів і нижче явка.
Якщо детально розглянути тенденцію "середніх" сільських ДВК (від 1000 до 2000 виборців, понад 26% виборців), то отримаємо таку картину.
Мал. 8. Залежність розподілу кількості ДВК в залежності від явки і розмірів ДВК (тільки село, ДВК від 1000 до 2000 виборців).
Великі сільські ДВК мають схожу залежність, однак, їх внесок (близько 8% виборців) на загальну картину розподілу голосів практично не впливає.
Якщо скласти всі тенденції, які визначаються кожним конкретним підмножиною ДВК, то, по-перше, можна говорити про неоднорідність всієї множини ДВК, і, по-друге, що в межах кожного підмножини закон розподілу ДВК виявляється близький до нормального, за винятком "закритих" ДВК , які за обумовленими вище причин віднесемо до підмножини "особливої електоральної культури". Але знову ж таки повторимося, що внесок цього підмножини в загальну картину невеликий, а твердження про порушення законодавства спірно.
Мал. 9. Залежність розподілу кількості ДВК в залежності від явки по різним підмножини, що визначаються місцем проживання (за винятком підмножини "особливої електоральної культури").
Мал. 10. Тенденції залежності розподілу кількості ДВК від явки за різними підмножини (червоний - сумарна картина, зелений - місто, блакитний - село, малиновий - інші), що визначаються місцем проживання (дані апроксимації).
До речі, аналогічні наближення можна отримувати не тільки аппроксимацией функціями, але, наприклад, за методом найменших квадратів, або шляхом кластерного аналізу вихідної статистики. Якісна картина при цьому не змінюється, а наближення виходить досить точний (див. Графіки нижче). Середня явка (математичне очікування) для міст дорівнює 62,28%.
Мал. 11. Залежність розподілу кількості ДВК в залежності від явки (тільки місто) без округлення до цілих відсотків.
Мал. 12. Залежність розподілу кількості ДВК в залежності від явки (тільки місто) з точністю до одиниць відсотків.
Мал. 13. Залежність розподілу кількості ДВК в залежності від явки (тільки місто) з точністю до двох відсотків.
Мал. 14. Залежність розподілу кількості ДВК в залежності від явки (тільки місто) з точністю до 10 відсотків.
Дані графіків підтверджують ще раз, що в межах умовно однорідного підмножини ДВК, виділеного за параметром "місце проживання", фактичний розподіл ДВК виявляється близьким до нормального.
Якщо кожному ДВК поставити у відповідність вага, що дорівнює кількості тих, хто проголосував на ньому виборців, то картина буде схожою з розподілом кількості ДВК в залежності від явки, проте менш виражений буде підйом на кінцевій ділянці графіка через те, що ДВК зі 100% явкою дуже маленькі ( "закриті", суднові і інші в середньому мають по 140 виборців при 100% явку), і, отже, їх внесок в загальну скарбничку голосів невеликий.
Мал. 15. Залежність зваженого кількості ДВК (вага дорівнює кількості тих, хто проголосував) від явки виборців.
На наступному малюнку представлено порівняння залежностей кількості ДВК і зваженого кількості ДВК від явки виборців.
Мал. 16. Порівняння залежностей кількості ДВК і зваженого кількості ДВК (пунктирна лінія) від явки виборців.
Якщо проаналізувати залежність зваженого кількості ДВК від місця проживання виборців (місто-село-решта), отримаємо наступні графіки.
Мал. 17. Залежність зваженого кількості ДВК, розділених за принципом "місто-село" від явки виборців.
За даним графіком видно, що внесок "інших" ДВК зовсім незначний і дає невелику надбавку тільки в точці 100% явки, яка, однак, не впливає, на загальну картину, тому що ця надбавка становить менше 0,4% загальної кількості поданих голосів. При цьому помітно, що "міська" тенденція практично "нормальна" (злегка позитивно (зліва) скошена) з невеликими внесками на ділянках 67-75% і 79-85%, що вимагають більш детального вивчення. "Сільська" ж стає більш "розмитою", що говорить про значну неоднорідності, швидше за все пов'язаної з регіональними відмінностями.
В цілому зберігаються і пропорції поданих голосів за кандидатів.
Мал. 18. Залежність голосів за кандидатів від явки виборців.
На кінцевій ділянці графіка (див. Наступний малюнок) пропорція дещо змінена, що відповідає домінуванню "сільської" тенденції (див. Також графіки 3 - 5), де пропорції дещо інші, ніж в містах. Взагалі ж міста дали 67,3% від загального відсотка поданих голосів, села - 31,3%, "інші" - 1,4%.
Мал. 19. Залежність голосів за кандидатів від явки виборців (збільшений кінцевий ділянку графіка).
3. Висновки
На невеликому прикладі ми переконалися у вірності гіпотези про неоднорідність безлічі виборців.
На однорідних подмножествах виборців чітко простежується незалежність розподілів по незалежними параметрами (наприклад, залежно кількості ДВК від явки виборців).
Можливе проведення подальших досліджень по деталізації підмножин виборців на підставі підходу, описаного в розділі 1, з метою побудови повної моделі електоральної поведінки виборців в РФ.
Необхідно порівняння розрахункових даних по моделі з реальними даними електоральної статистики.
література
- Бузин А.Ю. Курс аномальної електоральної ймовірності. http://www.golos.org/IMG/doc/Arifmetika_kak_svidetel_.doc
- Шпількин С. Обробка даних результатів федеральних виборів 2007 - 2008 рр. http://www.golos.org/IMG/ppt/sakharov_080423.ppt
- Любар А.Є. Статистичні аномалії на федеральних виборах 2007 - 2008 років. http://www.golos.org/IMG/ppt/Lyubarev-stat-1.ppt
- Інтернет сайт Центральної виборчої комісії .
- Орлов А.І. Прикладна статистика. - М .: Іспит, 2006. - 671 с.
- Романов В.Н. Теорія вимірів. Методи обробки результатів вимірювань. - СПб .: СЗТВ, 2006. - 127 с.
- Єлісєєва І.І., Юзбашев М.М. Загальна теорія статистики. - М .: Фінанси і статистика, 1996. - 368 с.
- ВЦИОМ: Телебачення - головна зброя виборчих кампаній. ( http://www.iamik.ru/?op=full&what=content&ident=33605 )
1 Матеріал зі збірки «Праці інституту системного аналізу Російської академії наук. Збірник: математика і управління »під редакцією члена-кореспондента РАН професора В.Л.Арлазарова і д.т.н. професора Н.Е.Емельянова, видавництво ЛКИ, 2008 рік. Стилістика, орфографія і пунктуація збережені.
2 Москва, Б.Черкасскій пров., Буд. 9, ЦВК РФ, [email protected]
3 Москва, просп. 60-річчя Жовтня, буд. 9, ІСА РАН, [email protected]
4 Москва, просп. 60-річчя Жовтня, буд. 9, ІСА РАН, [email protected]
Ru/?