2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему На страницу 1, 2, 3, 4, 5 ... 14  След.
 
 Исследование честности голосований от Сергея Шпилькина
Сообщение03.07.2020, 21:02 
Заслуженный участник
Аватара пользователя


26/01/14
3857
Да, я в курсе запрета создания новых тем про голосование по Конституции.
Но тут вопрос, который где же и спросить, если не на dxdy.

Можно ли доверять исследованиям Сергея Шпилькина по оцениванию честности голосований?
Например https://meduza.io/feature/2020/07/03/na ... 0-rossiyan ?
Выглядит всё вполне разумно. Но остаются вопросы:
1) Можно ли интерпретировать результаты голосования иначе, чем это делает Шпилькин? Могли ли какие-то неучтённые им факторы привести к таким графикам?
2) Вообще, сами графики достоверные?

Не уверен, что кто-либо на форуме займётся оценкой подлинности графиков (хотя соображения по 1-му вопросу, если они есть, хотелось бы услышать). Поэтому спрошу о том, какую вообще репутацию имеет Шпилькин и его исследования (он ведь не только это голосование исследовал) в профессиональной среде? Известны ли какие-либо перепроверки каких-либо из его результатов, или, наоборот, обоснованная критика? Где с ней можно ознакомиться?

P.S. Не думаю, что эта тема о методике анализа результатов голосований нарушает модераторский запрет на создание тем о голосовании по поправкам в Конституцию. Тем не менее, если тема будет закрыта модераторами, буду очень благодарен, если кто-нибудь ответит мне в личку.

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение03.07.2020, 21:17 
Супермодератор
Аватара пользователя


09/05/12
23721
Кронштадт
 i  Настоятельная просьба ко всем участникам обсуждения: не надо подменять обсуждение статистики обсуждением политики.

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение03.07.2020, 21:36 
Аватара пользователя


11/12/16
9662
уездный город Н
"Диагностика манипуляций" через статистический анализ выглядит разумным методом, и вполне научным.

В связи с этим имеются такие вопросы:

1. Медуза утверждает:
Цитата:
Российские ученые — физики, социологи, экономисты — разработали теорию статистического анализа выборов еще в 1990-е.


Хотелось бы почитать их работы на эту тему. Но медуза не называет никаких других фамилий, кроме Шпилькина.
Кроме того, хотелось бы посмотреть на применение этой теории к выбором 90-х годов. В частности, к выборам президента в 1996 году.

2. Медуза утверждает
Цитата:
С конца 2000-х самым известным исследователем статистики российских выборов стал физик Сергей Шпилькин.

Согласно РИНЦ у Шпилькина всего две работы по этой тематике в 2016 и 2018 годах (обе в соавторстве с Кобаком и Пшеничниковым).
Хотелось бы почитать работы Шпилькина именно конца 2000-х.

3. Шпилькин утверждает

Цитата:
Согласно теории Шпилькина, есть несколько «тестов», позволяющих выявить возможные фальсификации:

Рост доли голосов, поданных за лидера голосования при высокой явке на участке (относительно доли, наблюдаемой на участках с более низкой явкой). Он может свидетельствовать о вбросе оставшихся неиспользованными бюллетеней в пользу лидера. При честном подсчете доли голосов за лидера и остальных должны быть пропорциональны при любой явке, считают ученые.
...

Как некая гипотеза вполне может быть принята. Но хотелось бы посмотреть на её доказательства.
Исходя из банальных соображений подобные корреляции (больше явка - больше "за") вполне могут быть, так как протестный электорат или не пойдет, или не проголосует "против", лояльный электорат пойдет и проголосует "за". Кстати, опрос в закрытой теме наглядно это демонстрирует.

Тоже самое касается и других гипотез.

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение03.07.2020, 21:55 
Заслуженный участник


06/07/11
5615
кран.набрать.грамота
Mikhail_K в сообщении #1472110 писал(а):
Известны ли какие-либо перепроверки каких-либо из его результатов, или, наоборот, обоснованная критика? Где с ней можно ознакомиться?
На "элементах" писали об исследовании фальсификаций на выборах в Госдуму в 2011-м: Выборы в Госдуму как полевой эксперимент. То исследование было опубликовано в журнале PNAS, который вроде бы считается очень хорошим журналом. Можете попробовать сравнить результаты оттуда с результатами Шпилькина для тех же выборов.

И по поводу вашего вопроса в закрытом уже топике:
Mikhail_K в сообщении #1471744 писал(а):
kry в сообщении #1471731 писал(а):
В принципе авторитарные политические режимы обычно долго не живут, так что если не произойдет эволюционной демократизации общества, то перспективы в этом плане крайне печальные: излюбленные способы разрушения таких режимов - революции, внешние и гражданские войны, государственные перевороты, стихийные обрушения власти и экономики (привет от развала СССР).
Есть ли какая-нибудь русскоязычная литература про такие закономерности?
Вот здесь Екатерина Шульман рассказывает о трудах Барбары Геддес, которая составила аж целую базу данных авторитарных режимов.

(Оффтоп)

мне, как профессиональному разработчику баз данных, бесконечно приятно, что кто-то занимается составлением любых баз данных. Когда-нибудь я и сам сделаю базу данных со статистикой всего на свете.

Можете попробовать посмотреть ее труды.

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение03.07.2020, 22:13 
Заслуженный участник


04/03/09
897
EUgeneUS в сообщении #1472113 писал(а):
Хотелось бы почитать их работы на эту тему.

Есть вот такие ссылочки:
1. http://www.vibory.ru/disc-mat.htm
2. Собянин А.А., Суховольский В.Г. Демократия, ограниченная фальсификациями: Выборы и референдумы в России в 1991-1993 гг. М., 1995 http://www.hrights.ru/text/sob/
3. M. Myagkov, P. Ordeshook, D. Shakin, The Forensics of Election Fraud: Russia and Ukraine, Cambridge University Press, 2008; см. также http://vote.caltech.edu/drupal/files/wo ... p_wp63.pdf
4. Mebane, Walter R., Jr., and Kirill Kalinin 2009. «Comparative Election Fraud Detection». http://www.umich.edu/~wmebane/apsa09.pdf
5. Бузин А.Ю., Любарев А.Е. Преступление без наказания. Административные технологии федеральных выборов 2007-2008 годов. Группа Компаний «Никколо М», Панорама, 2008
6. Чуров В.Е., Арлазаров В.Л., Соловьев А.В. Итоги выборов. Анализ электоральных предпочтений. http://www.cikrf.ru/newsite/illuziya/itogi_160908.jsp
7. Шень А. Выборы и статистика: казус «Единой России» (2009). http://alexander.shen.free.fr/elections.pdf Некоторые массивы выборных данных, использованные в статье, размещены на сайте Независимого института выборов, на странице http://www.vibory.ru/elects/UIK.htm
EUgeneUS в сообщении #1472113 писал(а):
Хотелось бы почитать работы Шпилькина именно конца 2000-х.

Насколько я понимаю, в конце нулевых Шпилькин только начал "въезжать" в тему электоральной статистики, так что вряд ли были какие-то прям научные публикации, разве что статьи на ТрВ https://trv-science.ru/tag/sergejj-shpilkin/.
EUgeneUS в сообщении #1472113 писал(а):
Но хотелось бы посмотреть на её доказательства.

Я видел в одной из публикаций некую модель, которая описывала влияние разных способов фальсификаций на распределение явки, голосов и всего прочего. Ссылочку, к сожалению, пока не могу привести, возможно, она есть среди того, что я привел выше. Кроме того, есть некие довольно косвенные свидетельства, вроде сравнения распределений на участках с КОИБами и без них, участков с наблюдателями и без них. Понятно, что чтобы супер надежно проверить, насколько эти все построения верны, надо точно знать, на каких УИКах фальсифицировали, насколько и каким способом, что мало реально.
Кроме того, могу накидать ссылки на людей, которые "исследованиями" (в кавычках потому что посты в соцсетях - это так себе исследование) электоральной статистики занимаются, окромя Шпилькина, вдруг кому интересно:
Дмитрий Кобак https://kobak.livejournal.com/
Александр Киреев https://kireev.livejournal.com/

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение03.07.2020, 22:14 
Аватара пользователя


11/12/16
9662
уездный город Н
Что касается "гипотезы круглых цифр".
Посмотрел у Шпилькина картинки по всем регионам.
Действительно, у некоторых имеется явная группировка по линиям около 95% или около того "за".
Вот которые нашел:
Тамбовская область
Ставропольский край
Ростовская область
Мордовия
Дагестан
Башкирия
Пермский край тут вообще чудесно

-- 03.07.2020, 22:16 --

12d3 в сообщении #1472115 писал(а):
Есть вот такие ссылочки:

Спасибо!

12d3 в сообщении #1472115 писал(а):
Я видел в одной из публикаций некую модель, которая описывала влияние разных способов фальсификаций на распределение явки, голосов и всего прочего. Ссылочку, к сожалению, пока не могу привести, возможно, она есть среди того, что я привел выше.

Вот это было бы просто чудесно. Надеюсь попадется среди ссылок выше.

12d3 в сообщении #1472115 писал(а):
Дмитрий Кобак

Это соавтор Шпилькина.

-- 03.07.2020, 22:31 --

12d3 в сообщении #1472115 писал(а):
Понятно, что чтобы супер надежно проверить, насколько эти все построения верны, надо точно знать, на каких УИКах фальсифицировали, насколько и каким способом, что мало реально.

Можно посмотреть, как проходит "у них". Вот недавно выборы президента Польши происходили, например, или пресловутый Брекзит (на котором, кстати, также в фургонах голосовали).
И сравнить, какие паттерны в данных там отсутствуют, а здесь присутствуют.
Не знаете, кто-то делал такие сравнения?

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение03.07.2020, 23:16 
Аватара пользователя


11/12/16
9662
уездный город Н
Что-то сильно засомневался в картинках Шпилькина.
1. Пермский край > Березниковская городская > УИК №302

Явка 25.9%
"За" 78.06%

2. Вы видите эту точку на картинке Шпилькина?

И еще. Я построил точки только по четырем ТИК Пермского края (164 штук УИК). При этом в квадрат: явка от 30 до 40 %; "За" от 70 до 80 %, у меня попало 30 точек.
Вы видите 30 точек в этом квадрате на картинке Шпилькина, которую он строил по всем 53 территориальным комиссиям Пермского края?

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение03.07.2020, 23:17 
Аватара пользователя


07/03/16
2945
Mikhail_K в сообщении #1472110 писал(а):
1) Можно ли интерпретировать результаты голосования иначе, чем это делает Шпилькин? Могли ли какие-то неучтённые им факторы привести к таким графикам?

Я думаю, что можно.
В нашем поселке живет около 5 тыс. человек. Но на участке голосует еще и дивизия, расположенная рядом. Я не знаю какова численность военнослужащих в этой дивизии, но может быть 15 и более тыс. Голосовать они ходят строем, а как голосуют можно только фантазировать или сравнивать с Дагестаном из которого там большинство.

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение03.07.2020, 23:44 
Заслуженный участник


20/08/14
8538
Россия, Москва
Меня вот кроме всего прочего напрягло фактическое отсутствие на картинках участков с явкой менее примерно 25%. Из более трёх тысяч участков ни одного ... малоправдоподобно.

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение03.07.2020, 23:46 
Заслуженный участник
Аватара пользователя


16/07/14
5098
Москва
Я перепроверил сырые данные Шпилькина (по 5 случайным участкам) - соответствуют сайту ЦИК. Что он рисует - я, откровенно говоря, не очень понимаю. У меня по Пермскому краю получается вот так

(Оффтоп)

Изображение Изображение
(осторожно, горизонтальная ось не с нуля)
А еще у него официальные явка и одобрения подписаны неправильно (должны быть $52.49\%$ и $70.75\%$, а написано $48.25\%$ и $68.39\%$). Может быть этот график по каким-то промежуточным данным?..

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение03.07.2020, 23:52 
Аватара пользователя


11/12/16
9662
уездный город Н
mihaild
Вот и у Вас заполняемость квадрата:
EUgeneUS в сообщении #1472121 писал(а):
явка от 30 до 40 %; "За" от 70 до 80 %,

существенно больше, чем у Шпилькина.

Я брал первые четыре ТИК в Пермском крае (Александровская, Бардымская, Березниковская городская, Березовская)

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение03.07.2020, 23:57 
Заслуженный участник
Аватара пользователя


16/07/14
5098
Москва
Собственно он сам пишет
Шпилькин в facebook писал(а):
результаты могли быть неполные, надо перерисовать по н
свежим данным
. И дает новую картинку. Которая, правда, всё равно несколько отличается от моей (может он иначе округляет до точного числа процентов?).

Да, раз уж я в это полез - принимаются заявки на графики от тех, кто не умеет / кому лень делать самому.

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение04.07.2020, 00:29 
Аватара пользователя


11/12/16
9662
уездный город Н
mihaild в сообщении #1472127 писал(а):
И дает новую картинку
.

Да, на этой картинке есть не найденная мною точка и заполняемость упомянутого выше квадрата нормальная.
Но и аномалий не стало.

mihaild в сообщении #1472127 писал(а):
принимаются заявки на графики от тех, кто не умеет / кому лень делать самому.

Дайте ссылку на сырьё, пожалуйста.
И раз Вам не лень, такие просьбы:

1. На графиках с точками, точки сделать очень небольшими и округлять хотя бы до десятых процентов. Чтобы были видны группировки вокруг "круглых цифр", если они есть.
2. Сделать графики с точками по регионам, где у Шпилькина явно видны "круглые цифры". Список тут.
3. Сделать графики с точками, где у Шпилькина явно видны два кластера. Список чуть позже добавлю.
4. По первому графику. Этим графиком Шпилькин утверждает, что не сохраняется пропорция "за\против" в зависимости от явки. Попробую выбрать регион-два, у которых эта корреляция сильно выражена.

-- 04.07.2020, 00:35 --

EUgeneUS в сообщении #1472129 писал(а):
3. Сделать графики с точками, где у Шпилькина явно видны два кластера. Список чуть позже добавлю.


1. Краснодарский край

2. Липецкая область

3. Башкирия, опять же

4. Мордовия

5. Татарстан вот тут совсем интересно. Также подходит для 4 пункта из прошлого поста.

-- 04.07.2020, 00:55 --

Кстати, посмотрел Татарстан в разрезе ТИК.
Там действительно два кластера. Четко разделяется Казань и "всё остальное".

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение04.07.2020, 00:57 
Заслуженный участник
Аватара пользователя


16/07/14
5098
Москва
Я тот еще специалист по EDA... Вот такой график по Тамбовской области получается

(Оффтоп)

Изображение
Мне интуитивно не нравится (сама визуализация, независимо от данных), но не могу сказать, чем. Если есть соображения - говорите, попробую поправить.

Данные лежат в канале в телеграмме https://t.me/RUElectionData

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение04.07.2020, 05:10 
Аватара пользователя


11/12/16
9662
уездный город Н
mihaild

(Оффтоп)

mihaild в сообщении #1472131 писал(а):
Данные лежат в канале в телеграмме https://t.me/RUElectionData

FGJ, эту ссылку приводил уважаемый 12d3. А я не разобрался, как из телеграмма скачать компьютером :roll:. Думал, может где в вебе есть.
Скачал через телефон. Спасибо и Вам, и уважаемому 12d3.


mihaild в сообщении #1472131 писал(а):
Мне интуитивно не нравится (сама визуализация, независимо от данных), но не могу сказать, чем. Если есть соображения - говорите, попробую поправить.

А мне понравилось.
Что хотелось бы от визуализации - убедиться, есть или нет, группировка точек вдоль целых высоких процентов "ЗА" (по горизонтальным линиям), и вдоль целых высоких процентов явки (по вертикальным линиям).
Наиболее хорошо по картинкам Шпилькина это видно в Башкирии. Будет ли у Вас тот же эффект? Может получится его более наглядно выявить, если он есть.

Что касается остальных особенностей графиков, на которые ссылается Шпилькин (два кластера в некоторых регионах и коррелияция "процент за - процент явки"), то
а) Их и так видно при достаточно мелких точках.
б) Я построил простенькую модельку, из которой следует, что... так и должно быть при честных выборах :mrgreen: Подробно опишу в воскресенье или несколько позже.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 196 ]  На страницу 1, 2, 3, 4, 5 ... 14  След.

Модераторы: Модераторы, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group