?

Log in

No account? Create an account

A Trusted Friend in Science

Kein Macht Für Dich Menschen

Previous Entry Share Next Entry
Статистика - оружие массовой дезинформации
svshift
Цепкие умы давно отметили, что некоторые регионы в России голосуют активнее, чем другие. Явка в большинстве национальных республик намного выше средней по стране. Кроме того -- именно там, где явка выше, ВНЕЗАПНО выясняется, что последние два голосования подряд, результат по ЕР тоже выше. 

и приводятся графики, зависимость результата ЕР от явки: 
(отсюда: http://podmoskovnik.livejournal.com/129843.html )

и по Москве в частности: 

(отсюда: http://uborshizzza.livejournal.com/1701740.html )

Делается феноменальный вывод -- мол, там, где явка высокая -- за ЕР явно вбрасывали! Этот вывод делается из одного единственного предположения -- что "результат ЕР" должен быть статистически независим от "явки". Для того, чтобы такое предположение делать, надо быть очень смелым и очень наивным человеком. А чтобы оценить правомочность такой предпосылки -- надо быть не программистом, и не математиком, а, мать вашу, СОЦИОЛОГОМ !!!! 

Поэтому, проведу пятиминутку по ликбезу в области электоральной социологии, -- слава Гуглу всемогущему, это не трудно. 
1. Явкой >90% сегодня никого не удивить -- см. тут: http://en.wikipedia.org/wiki/Voter_turnout видно, что в странах без обязательной явки высокий процент характерен для стран с однородным этническим составом -- "все свои". В Штатах и в Индии явка меньше чем у нас. 

2. Сильная корреляция между явкой и территориальными результатами наблюдается !!!СЮРПРИЗ!!! не только у нас. 
Прежде всего такая корреляция наблюдается там, где парламенты формируются не пропорционально, как у нас сейчас, а мажоритарно. Если известно, что в округе таком-то лидирует по рейтингам такая-то партия -- сторонники оппонентов просто не пойдут -- явка снижается, причем, соотвественно, чем выше отрыв лидирующей партии в округе, тем выше явка. Если отрыв не очень сильный -- явка вялая -- т.к. сторонников проигрывающей стороны много, и большинство из них по-любому не придет.  Про это есть ссылка даже в приведенной мною статье на википедии. -- т.е. в их случае наблюдается строгая корреляция между вилкой в рейтинге двух лидеров и явкой. При этом, если между двумя лидерами наблюдается почти ничья -- тогда явка снова может возрасти -- типа народ начинает думать, что его голос решающий. 

У нас система пропорциональная, но вывод похожий. Пример: выборы в тайване: при низкой вилке рейтингов (почти ничье) явка неопределенная (зависит от других фаторов), при сильном отрыве лидера в рейтинге - явка всегда высокая. 
http://www.accessecon.com/Pubs/EB/2011/Volume31/EB-11-V31-I2-P173.pdf
выборы в бельгии: http://www.diw.de/documents/dokumentenarchiv/17/41524/Paper-165.pdf (кстати - там явка обязательна)
более полное исследование по венгрии: http://www.etd.ceu.hu/2011/simonovits_gabor.pdf

кстати -- именно этим объясняется феномен т.н. "авторитарных выборов" -- в странах с сильной и популярной в народе авторитарной властью явка на выборы сравнительно высокая, что, как бэ дает повод "голосам со всего мира" повод заявить о "вбросах" и "нарушениях". 

другие исследования на тему ищите по запросу "electoral closeness turnout correlation"

Многочисленные исследования корреляции между явкой и социально-культурными условиями я приводить не буду -- сами найдете. 

PS: я не утверждаю, что вбросов не было -- граждане о них сообщают, даже видео какие-то выкладывают. в новостях были сообщения, что кого-то даже сняли с должности и оштрафовали. Я просто говорю, что приводимая статистика не может являться доказательством этих самых вбросов. 

PPS: согласно этой теории, если верить статистике, то особо тщательной проверке следует проверить как раз те участки, которые выбиваются из этой закономерности -- т.е. там, где при низкой явке особо высокий результат ЕР.

UPDATE:

вот тут (http://esquire.ru/elections) некие активисты пишут, мол в нормальных странах гистограммы распределения голосов "гладенькие" и "симметричные". И тут же садятся в лужу, приближая гистограммы голосов "гауссовым" распределением. Если бы эти люди хорошо учили статистику, то они бы знали, что подобные процессы описываюстся т.н. логнормальным распределением. -- оно отличается от нормального как раз длинным "хвостом" -- оно не симметрично!!! (пример статьи где это изучается:  http://przyrbwn.icm.edu.pl/APP/PDF/114/a114z312.pdf). Естественно, возникает вопрос, а что делать с "пиком" около 100% (наши кавказские республики) -- ведь, кажется, нет на свете мест, где такое отклонение наблюдалось бы. Оказывается есть.  вот реальные данные по реальной стране. Израиль. Роль "чечни" тут выполняет социально-этническая группа "арабы". (см. картинку в конце)  http://web.econ.ku.dk/epru/Social%20Identity%20and%20Voter%20Turnout.pdf -- в этой статье как раз исследуется вопрос о влиянии социокультурных факторов на явку. 

PPPS: для хомячков: я не фанат ЕР, и голосовал за другую партию, если чо. Я опровергаю откровенную дезу. 

UPDATE 2: 

пики на "круглых цифрах" в 60-65-70-75-80-85 и т.д. я вижу, не слепой. исследую детально по-позже, когда сам поимею полные данные до уровня участков за этот и 2007й год, и сравню. А пока -- учитесь как надо:  

посмотрим на выборы 2004года в Аляске. на большистве участков явка была выше 100%, а не некоторых даже более 200% 


UPDATE: 09-12-2011

добрый человек нашел данные по Будестагу:  http://jemmybutton.livejournal.com/1359.html  Там же одно из возможных чисто стохастических объяснений появления пиков у "круглых чисел".
дополнения от себя подвешу позже.

UPDATE 11-12-2011

Людей, разбирающихся в статистике, больше, чем я думал: http://www.wiz-aut.narod.ru/L042_falsifikacii_3_statistika.htm 
thnx. wiz_aut

UPDATE 13-12-2011

Еще популярно про "пики" и прочую статистику: http://eruditor.ru/k/?15



Спасибо за разъяснение!

Хреновое разъяснение. Пишу здесь, потому что на второй странице мой комментарий никто не заметит.

Автору поста: вы, прежде чем утверждать, что кто-то сел в лужу, внимательнее читали бы источники, и свои, и чужие. В статье, где делается вывод о логнормальном распределении, изучается зависимость количества кандидатов, получивших определённый процент голосов, от этого процента. А в материалах "Эсквайра" приводятся зависимости количества избирательных участков, на которых один кандидат получил определённый процент, от этого процента.

Это совершенно разные зависимости! Поэтому в одном случае получается нормальное распределение, а в другом - логнормальное. Не путайте людей, пожалуйста, и читайте внимательно, прежде чем делать далеко идущие выводы.

:) Вот так делается популярность лидера в Ичкерии, там да - вбросов не надо, там они не нужны, я, кстати, допускаю, что там явка была минимальная в реале - все равно в Урус-Мартане или в Ведено ничего проконтролировать нельзя:

http://i28.fastpic.ru/big/2011/1205/e3/f7503c89cb27191c3be206ad2d9659e3.jpg

согласно мировой статистике -- в мононациональных социумах явка всегда высокая. а уж в родо-племенной Чечне, Осетии и Дагестане -- и подавно. там социология вообще перестает работать :-) поэтому не удивлен.

другое дело, конкретно на юге там понаотъехавших на заработки "на материк" много -- а с местными порядками, вычеркнуть их из списков, и вручить по открепительному - не вопрос -- оттого и статистика ч0ткая.

а как быть с более-менее нормальным распределением явки на выборах в Швеции, Мексике, Польше и Болгарии? http://esquire.ru/elections

да, кстати, а можете объяснить, что в статье http://przyrbwn.icm.edu.pl/APP/PDF/114/a114z312.pdf по осям х отложено? Они постоянно говорят о логарифме доли голосующих, но, пардон, это число же должно быть отрицательным?

"наблюдается строгая корреляция между вилкой в рейтинге двух лидеров и явкой" - во-первых, в статье про Тайвань сказано, что это происходит не всегда. Во-вторых, там утверждается ровно обратное - чем меньше ожидание вилки между результатами кандидатов, тем активнее люди приходят на избирательные участки, т.к. в этом случае повышается оценка важности их собственного голоса.

Мало того, что этот эффект не применим к полученным данным (у нас данные по отдельным избирательным участкам, а в той же статье о Тайване говорится о разных выборах и разных информационных ситуациях). Что более важно, обсуждаемый эффект привел бы к обратной тенденции: избиратели ЕдРа, окруженные другими такими же избирателями, ниже оценивали бы важность своего голоса и появлялись бы на участке реже.

чем вилка выше - тем, что характерно, корреляция лучше.
если вилка маленькая - работают другие факторы.

Гм. Умный я, всё=таки )

А сможете ли что=нибудь сказать о пиках на кратных пяти отметках в правой половине графика?

характерные пики в окрестностях "круглых" цыфр -- это обычно признак подтасовок. только на этих двух графиках их нет.-- зато они есть на графиках прошлых лет.

подобный график по этим выборам я еще не строил. для этого было бы неплохо иметь все данные до уровня ТИКов и УИКов - у меня их пока нет (на региональных этого видно не будет) тогда можно будет строить график "к-во участков" от "явки" и "к-во учтастков" от "результат ЕР" -- отдельно посмотреть москву, всю страну по областям, всю страну по республикам, и т.д. тогда можно будет делать выводы, сравнивать, и т.д.

А что скажете насчет пиков на красивых процентах? Аналоги в Иране приведете?

характерные пики в окрестностях "круглых" цыфр -- это обычно признак подтасовок. только на этих двух графиках их нет.-- зато они есть на графиках прошлых лет.

подобный график по этим выборам я еще не строил. для этого было бы неплохо иметь все данные до уровня ТИКов и УИКов - у меня их пока нет (на региональных этого видно не будет) тогда можно будет строить график "к-во участков" от "явки" и "к-во учтастков" от "результат ЕР" -- отдельно посмотреть москву, всю страну по областям, всю страну по республикам, и т.д. тогда можно будет делать выводы, сравнивать, и т.д.

(Deleted comment)
Всё конечно здорово замечательно, но вот пики против "красивых процентов" 50-55-60-65-7-0-75 и т.д. Это вы как интерпретируете?...

да шо ви мелочите -- 70-75-80? учитесь как надо:

посмотрим на выборы 2004года в Аляске. на большистве участков явка была выше 100%, а не некоторых даже более 200% !

http://mudflats.wordpress.com/tag/alaska-election-fraud/

(Deleted comment)
в тайваньской статье есть диаграмма "вилка результата"-"явка". и в венгерской
в какой-то из статей говорится, что основная корреляция наблюдается между викой "первый-второй" и явкой, и что результаты других кандидатов (3й, 4й, т.д.) роли не играют.

Зачем вы обманываете, по поводу феноменальных выводов, о том, что где явка высока, там вбросы? Делается банальное предположение, которое говорит о том, что если пришли 10 человек 100 или 1000, то пропорции за ту или иную партию будут примерно одинаковы. Т.е. если за партию No1, проголосовало общее количество 50%, то в срезе из 10 человек, это будет примерно 5, из 100 - 50 и из 1000 человек 500. Эту тенденцию и показывают все партии, за исключением одной. Линейный рост зависимости одной партии, при нелинейном росте других, говорит о том, что в какой то момент, избиратели приходили голосовать лишь за одну партию. Это хорошо видно в этом посте: http://lex-kravetski.livejournal.com/394082.html

Делается банальное предположение, которое говорит о том, что если пришли 10 человек 100 или 1000, то пропорции за ту или иную партию будут примерно одинаковы.

я русским языком, со ссылками на англоязычные статьи показываю, что это предположение не верно.

умные люди (т.е. не я) в этих статьях говорят, что есть строгая корреляция между разницей результатов (или рейтингов) N1 и N2 и явкой. причем они это доказывают математически, и там же показывают, что результатов корреляции для других кандидатов (т.е. N2,N3,N4 т.д.) нету.


Этот чудик доказывает несостоятельность метода Собянина-Суходольского через % от проголососавших. Ни о чём.

Класс! Спасибо за анализ, вот его-то мне для полноты и не хватало. Жаль, что только $(alpha)% из смотрящих на данные, задумываются о них, и только $(beta)% уже из них имеют достаточную подготовку для интерпретации. Мой оригинальный пост был написан, чтобы помочь анализирующим. Я уже почти жалею, что он оказался подспорьем для confirmation bias'а остальных $(1-alpha)%.

Поставил ссылку на ваш пост в апдейте.

политБиоНИКаАНТИ-иПОСТкризисного миРА

без очищения (от раковых опухолей,
тромбов, перекрывающим другим кислород)
и отрезания загнившего -
гангрена смертельна

Я тоже в эти картинки мало верил, но меня переубедили немного другие сравнения, где приводится явка и результаты по одним и тем же участкам в 2007 и 2011 годах. Там четко видно, что там где явка неестественно и необъяснимо возрасла, число проголосовавших за ЕР намного выше, чем на остальных участках. Лично меня те графики убедили. Вас или суд, возможно, не убедят. Так они и не для суда рисуются, а для российских граждан.

аномалии статистики и графики в суде - не аргумент. там нужны доказательства - копии протоколов, видео, т.д.

Вот жеж парадокс, все партии вполне попадают в гауссово распределение, а ПЖиВ нет)))) Чесное слово, мне начинает казатся что завтра Чуров по первому придумает для них какое-то свое особвенное нано-распределение.

т.е. когда в Венгрии отрыв лидера от N2 кореллирует с явкой -- это "демократия", а у нас -- "нано-полит-технологии" ?

(Deleted comment)
Мне кажется, нужно заменить фразу "где явка высокая -- за ЕР явно вбрасывали" на "где явка высокая - это результат недемократичности выборов". Не важно билютени прсото вбросили или в тюрьме или в армии всех заставили *поддержать* ЕДРО, или Кадыров *попросил* всех прогосовать. Вы как думаете, есть вероятность того что в тюрьме или служебной части все сознательно желают поддержать ЕР?

Сейчас, распределение делалось уже на бумаге, по-моему основной метод был, просто написание протоколов где ничего общего нет с тем что было при подсчете. В этом слуае и график можно контролировать, поскольку результаты писались вполне пропорциональные, кол-во голосовавших могло сохраняться. Волшебство одним словом.

т.е. когда в Израиле в арабских деревнях наблюдается явка 100% на фоне средней по стране 50% -- это демократия. А в Чечне -- "Кадыров попросил" ?

А что вы скажете про вот этот http://keleg.livejournal.com/353195.html график?
Результаты всех партий, кроме ЕдРо (ну и Яблока по противоположной причине) подчиняются нормальному распределению.

я ровно про это и говорю -- результаты лузеров от явки не зависят. а вот отрыв лидера от N2 и явка коррелируют очень сильно.