2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему На страницу Пред.  1 ... 8, 9, 10, 11, 12, 13, 14  След.
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение06.07.2020, 17:15 
Заслуженный участник


04/03/09
906
EUgeneUS в сообщении #1472652 писал(а):
Но на левой панели никаких особых "сгущений" облака вокруг круглых чисел на оси $x$ вроде как (визуально) нет.

Вроде по всем регионам так, без особых инструкций. Это на общероссийской картинке, когда соотношение сигнал/шум улучшается, пила становится видна на облаке.

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение06.07.2020, 17:24 
Заслуженный участник
Аватара пользователя


16/07/14
8344
Цюрих
Собственно там 4 замечательных самых больших по числу проголосовавших УИК - №440, №1422, №1418 и №247. Мне особенно нравится №440 с 2979 зарегистрированными, 2532 проголосовавшими (84.995%) и 2406 "за" (95.024%).

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение06.07.2020, 17:36 
Аватара пользователя


11/12/16
13195
уездный город Н
mihaild в сообщении #1472655 писал(а):
В участках эти пики имеют высоту в 5-7 участков. Так что например инструкция "докинуть "да" до круглой явки" в небольшом количестве больших участков такой эффект объясняет.


Да, согласен, объясняет.
Кстати, это объясняет и другой эффект - пики на круглых значениях в голосах "против". Если докидываем именно крупный участок, то он смещается в круглую цифру и "тянет" туда же большое значение голосов "против".

Если принять эту гипотезу манипуляций, то
а) можно вычислить с хорошей достоверностью, где проводились вбросы - крупные участки на круглых значениях явки. Их будет не много (в относительных величинах). Туда и слать наблюдателей на следующих выборах.
б) на основании этого, можно будет оценить масштаб манипуляций (имхо он будет заметно ниже, чем оценивает Шпилькин).
в) выкинув "скомпроментированные" участки, рассчитать скорректированный процент явки и результаты.

(Оффтоп)

mihaild в сообщении #1472655 писал(а):
Ну и "визуально две диаграммы дают кажущиеся несогласующимися результаты" могут быть аргументом только в пользу "не надо анализировать диаграммы на глаз", а про реально происходящее они не говорят ничего:)

Конечно, согласен с этим. Но у меня сейчас под рукой только Эксель, а это немного не тот инструмент. :roll:
Спасибо, что посчитали в попугаях участках.

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение06.07.2020, 18:35 
Заслуженный участник
Аватара пользователя


22/06/12
2129
/dev/zero
А почему распределение голосов "За" в зависимости от явки двугорбое?

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение06.07.2020, 19:14 
Аватара пользователя


11/12/16
13195
уездный город Н
mihaild в сообщении #1472623 писал(а):
Если скрытых параметров $0$, то $y$ и $n$ должны быть функциями от $r$, что даже "на глаз" не очень похоже на правду.
Если скрытых параметров $2$ или больше, то можно сразу всё объяснить ими (просто объявляем $y = x$, $n = y$), и предсказательная сила такой модели нулевая.


Боюсь, что все особенности данных объяснить одним скрытым параметром не получится.
В этой статье Шпилькин это подозревает и вводит второй параметр - количество подмененных голосов. И, конечно, всё объясняет.

Но у нас есть особенность данных, которая имеется вообще безо всякого голосования - это кластеризации на два кластера участков по количеству избирателей.
Поэтому не удивительно, что на диаграммах, в каких бы координатах их не рисовали, всегда получается два пятна. Шпилькин же, считает, что пятно должно быть только одно.
С другой стороны, "пила Чурова" не объясняется кластеризацией участков.
Если верна гипотеза, что "пила Чурова" формируется относительно небольшим количеством больших участков, то можно провести такой тест: выкинуть из датасета большие участки с с аномально (для данного размера участка) большой явкой. После чего убедиться, что пила Чурова пропала на оставшихся данных. Например, на этой диаграмме
Изображение провести линию $y = 4000 - 2500x$ (или подобную с другими коэффициентами).
(Историю с Сев. Кавказом и Кемеровской областью тут выводим за скобки).

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение06.07.2020, 19:23 
Заслуженный участник
Аватара пользователя


16/07/14
8344
Цюрих
По участкам с некруглыми явкой и голосами "за".
Число голосов и доля "за" в зависимости от явки
Изображение Изображение
Число зарегистрированных: 65674949 (61.3% от общего)
Число проголосовавших: 44048203 (60.8% от общего)
Число проголосовавших "за": 34349120 (60.7% от общего)
Число проголосовавших "нет": 9332672 (61.2% от общего)
Доля "за": 77.98% (против 78.13% среди всех)
Явка "за": 52.30% (против 52.79% среди всех)

Итого получается, что такие участки ничем особо статистически не выделяются. Есть два очевидных варианта: или пики на круглых значениях вызваны не фальсификациями, или фальсифицируют везде, а подтягивают к круглым значениям не везде.

-- 06.07.2020, 19:27 --

Ну и ИМХО попытки оценить размер фальсификаций - довольно бесполезное занятие. Мы, возможно, можем математическими методами поймать какие-то совсем тупые вбросы, но никак не можем определить, честное ли оставшееся, или там вбрасывали более умно. А наличие тупых вбросов сильно повышает и вероятность умных.

-- 06.07.2020, 19:43 --

На участках с менее чем 800 избирателями (84% голосов приходится на такие участки) явка выше (81% против 73% по всем), исчезает левая мода на гистограмме "процент за - явка", и пила становится только красивее.
Изображение

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение06.07.2020, 19:58 
Аватара пользователя


11/12/16
13195
уездный город Н
mihaild
Поясните, пожалуйста, на последнем графике как считалось значение по вертикальной оси?
$0.04$ как-то слабо похоже на "процент за", и даже на долю "за".

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение06.07.2020, 20:04 
Заслуженный участник
Аватара пользователя


16/07/14
8344
Цюрих
Пардон, подписи остались от копипасты кода)
По оси ординат - доля бюллетеней "за" на участках с данной явкой от всех бюллетеней "за" (всё по участкам с менее чем 800 избирателями). Т.е. площадь под кривой должна быть равна 1/100 (и если бы на всех участках была бы одинаковая явка, то гистограмма представляла бы из себя прямоугольник ширины 0.01 и высоты 1).

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение06.07.2020, 20:38 
Аватара пользователя


11/12/16
13195
уездный город Н
mihaild
В таких координатах, если предпочтения избирателей (за-против) не зависят от явки ("за" всегда голосует доля $k$ от пришедших), график выродится в прямую линию, которая начинается в начале координат.

С одной стороны, не удивительно, что график почти всё время растет.
А с другой стороны, он не является прямой даже там, где нет "пилы" (которую мы считаем индикатором гипотетических манипуляций).
Значит есть положительная корреляция явка - процент "голосов за" (процент от пришедших на участки) еще до возникновения гипотетических безобразий.

-- 06.07.2020, 20:52 --

mihaild в сообщении #1472675 писал(а):
Есть два очевидных варианта: или пики на круглых значениях вызваны не фальсификациями, или фальсифицируют везде, а подтягивают к круглым значениям не везде.

Есть еще третий вариант - подтягивают к ближайшему круглому.

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение06.07.2020, 21:03 
Заслуженный участник
Аватара пользователя


16/07/14
8344
Цюрих
EUgeneUS в сообщении #1472686 писал(а):
которую мы считаем индикатором гипотетических манипуляций
Не совсем так. Наличие пилы где-то является свидетельством в пользу манипуляций даже там, где пилы нет (вероятность, что есть нетупые манипуляции при условии что есть тупые ИМХО выше чем априорная вероятность что есть нетупые манипуляции).
EUgeneUS в сообщении #1472686 писал(а):
подтягивают к ближайшему круглому
Тогда в не-круглых участках ничего не подтягивали, и они должны давать существенно другое распределение.

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение06.07.2020, 21:11 
Аватара пользователя


11/12/16
13195
уездный город Н
mihaild в сообщении #1472689 писал(а):
Наличие пилы где-то является свидетельством в пользу манипуляций даже там, где пилы нет (вероятность, что есть нетупые манипуляции при условии что есть тупые ИМХО выше чем априорная вероятность что есть нетупые манипуляции).

Там - это где? Географически? Или в наборе участков менее 800 человек? Или наличие пилы хоть где-то, хоть на какой выборке, увеличивает вероятность манипуляций везде?

mihaild в сообщении #1472689 писал(а):
Тогда в не-круглых участках ничего не подтягивали, и они должны давать существенно другое распределение.

Почему это? В этом случае подтягивали не сильно, и на какие-то агрегаты это повлияет незначительно.

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение06.07.2020, 21:27 
Заслуженный участник
Аватара пользователя


16/07/14
8344
Цюрих
EUgeneUS в сообщении #1472693 писал(а):
Там - это где?
В какой-то подвыборке.
EUgeneUS в сообщении #1472693 писал(а):
Или наличие пилы хоть где-то, хоть на какой выборке, увеличивает вероятность манипуляций везде?
Да, так.
EUgeneUS в сообщении #1472693 писал(а):
В этом случае подтягивали не сильно
Ну хотя бы 1% там вроде должен получаться.
Еще кстати модель "подтягивают к круглой явке, если до неё немного не хватает" предсказывает, что слева от круглого процента значение меньше, чем справа (потому что значения от левой части перетекают на сам круглый процент, а от правой нет), что соответствует действительности, и что на два процента левее значение должно быть примерно таким же или большим, как на один процент левее от круглого (в зависимости от того, тянут ли эти два процента), что уже не соответствует действительности.

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение06.07.2020, 22:27 
Аватара пользователя


11/12/16
13195
уездный город Н
mihaild в сообщении #1472695 писал(а):
и что на два процента левее значение должно быть примерно таким же или большим, как на один процент левее от круглого (в зависимости от того, тянут ли эти два процента), что уже не соответствует действительности.

Почему же не соответствует? На два процента левее значение примерно такое же, как на один процент левее.
Совсем на чуть-чуть иногда больше, иногда меньше.

-- 06.07.2020, 23:19 --

mihaild в сообщении #1472695 писал(а):
Ну хотя бы 1% там вроде должен получаться.

При сравнении круглых не круглых да, около процента должно получаться.

Вы убрали круглые и сравнили со всем датасетом:
mihaild в сообщении #1472675 писал(а):
Доля "за": 77.98% (против 78.13% среди всех)
Явка "за": 52.30% (против 52.79% среди всех)

Получилось где-то $-0.15$ и $-0.5$ процента.
Если сравнить не со всем датасетом, а между круглыми и не круглыми, то и получится порядка процента.

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение07.07.2020, 00:31 
Аватара пользователя


10/12/11
2416
Москва
Не знаю было ли уже.
Вот критика Шпилькина на ФБ. Другой ссылки не нашел.

https://www.facebook.com/valentin.pivov ... oup_dialog

Сам я не разбирался ни в критике Шпилькина ни в доводах его оппонентах.
Поезд уже ушел и не интересно и одной ногой в отпуске. Но если кто-то хочет разобраться, то почитаю с интересом.

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение07.07.2020, 06:29 
Заслуженный участник


18/01/15
3073
mihaild в сообщении #1472250 писал(а):
Но всё-таки небольшая, поэтому наблюдение "пилы" - свидетельство в пользу гипотез, говорящих, что её появление в каком-то смысле закономерно, против говорящих, что это просто так не повезло.
Вне всякого сомнения. Причем эта закономерность объективная, на зависящая от предполагаемого вмешательства извне (со стороны ВВП и др. злых дядей).

-- 07.07.2020, 05:36 --

alesha_popovich в сообщении #1472285 писал(а):
А пила на круглых процентах откуда?

Позвольте встречный вопрос: а как вы свою гистограмму считали ? Я того кода, что вы написали, извините, не понял. Я понимаю, что это какой-то софт (я с современным софтом почти не знаком), но меня интересует в деталях, какие при этом выполнялись арифметические действия.

-- 07.07.2020, 05:43 --

mihaild в сообщении #1472302 писал(а):
vpb я проверял - если например просто брать случайный знаменатель от $100$ до $1000$ и числитель от $0$ до знаменателя - то никакого перекоса в целую сторону не будет.

Р.Рейган писал(а):
Довъеряй, но провъеряй !
Скажите, а что означает фраза "не будет перекоса в целую сторону" ? Можете, кроме того, написать подробнее о самих вычислениях ?

-- 07.07.2020, 05:49 --

NikolayPrimachenko в сообщении #1472304 писал(а):
Вы это серьёзно?! А собственные попытки? Вот некоторые товарищи выше сочиняют объяснение, которое устроило бы их сознание, определенное их бытием.

Я извиняюсь ! Вы не ошиблись форумом, случайно ? А то вы, кажется, математику не очень любите, а больше предпочитаете острить ...

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 196 ]  На страницу Пред.  1 ... 8, 9, 10, 11, 12, 13, 14  След.

Модераторы: Модераторы, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group