2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему На страницу Пред.  1 ... 6, 7, 8, 9, 10, 11, 12 ... 14  След.
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение06.07.2020, 11:50 
Заслуженный участник
Аватара пользователя


16/07/14
9152
Цюрих
EUgeneUS в сообщении #1472580 писал(а):
По оси абсцисс - "явка за" на участке
По оси ординат - количество "за" на участке.
Если я правильно понял, то вот запрашиваемая гистограмма.
ИзображениеИзображение
По оси абсцисс - $\frac{y}{r}$, по оси ординат - на левой количество участков, на правой сумма $y$ по всем участкам.

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение06.07.2020, 12:05 
Аватара пользователя


11/12/16
13859
уездный город Н
mihaild в сообщении #1472581 писал(а):
Если я правильно понял, то вот запрашиваемая гистограмма.

Вы несколько неверно поняли, я хотел бы посмотреть не гистограмму, а облако, причем в тех же координатах, что и у уважаемого 12d3

Но на Ваших гистограммах тоже четко видно, что участки сильно кластеризованы.
Я правильно понимаю, что $r$ - количество проголосоваших "за", а $y$ - суммарное количество избирателей на участках, попавших в столбик?

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение06.07.2020, 12:11 
Заслуженный участник


04/03/09
910
EUgeneUS в сообщении #1472580 писал(а):
если бы суммарное количество избирателей по участкам, попавших в каждый столбик гистограммы, было бы одинаково.

Вот эта посылка неверная. Изображение
EUgeneUS в сообщении #1472580 писал(а):
По оси абсцисс - "явка за" на участке
По оси ординат - количество "за" на участке.

Изображение
EUgeneUS в сообщении #1472576 писал(а):
А если мы наблюдаем пик в районе 15%, это совсем не означает, что:

Ну давайте просто на калькуляторе посчитаем.
УИК, где меньше 1000 избирателей: их 47001 штука, 19376121 избиратель, 12231642 голоса за, 2696183 голосов против, явка против равна 13,9%.
УИК, где не меньше 1000 избирателей: их 48806 штук, 87801600 избирателей, 44349711 голосов за, 12545929 голосов против, явка против равна 14,3%.

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение06.07.2020, 12:20 
Заслуженный участник
Аватара пользователя


16/07/14
9152
Цюрих
EUgeneUS, нет, $r$ - число зарегистрированных, $y$ - число голосов "за".
Т.е. на второй гистограмме высота столбика - это как раз сумма ординат всех точек в облаке с абсциссой как у данного столбика.

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение06.07.2020, 12:42 
Аватара пользователя


11/12/16
13859
уездный город Н
12d3
Спасибо за картинку!
Всё стало видно и понятно.

1. Линии $y = N x$, это линии участков с одинаковым количеством избирателей $N$.
2. Четко видно два кластера:
а) пятно с большим количеством избирателей. Это крупные города, в которых участки можно побить более-менее равномерно, включая в них количество, близкое к максимальному.
Люди там голосуют "За" более-менее одинаково, примерно с одной и той же явкой.
б) кластер размытый вдоль оси $x$ - это мелкие участки. Условно - сельская местность. Там голосуют по разному. И всякие аномалии с круглыми цифрами тоже сосредоточены там.
в) облако между ними - это мелкие и средние города, где участки "побили", как получилось. Чтобы избирателям не далеко ходить, а уж сколько избирателей вошло - это как получилось.

Первый горб в гистрограмме, как раз и связан с тем, что большое количество крупных участков голосует одинаково. Что неудивительно.

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение06.07.2020, 12:46 
Аватара пользователя


07/03/16

3167
Какие бы диаграммы не рисовал Шпилькин, ему не удастся доказать, что председатель комиссии, выигравшая квартиру в лотерею бюллетений, поступила нечестно.

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение06.07.2020, 12:47 
Аватара пользователя


11/12/16
13859
уездный город Н
12d3 в сообщении #1472589 писал(а):
Ну давайте просто на калькуляторе посчитаем.
УИК, где меньше 1000 избирателей: их 47001 штука, 19376121 избиратель, 12231642 голоса за, 2696183 голосов против, явка против равна 13,9%.
УИК, где не меньше 1000 избирателей: их 48806 штук, 87801600 избирателей, 44349711 голосов за, 12545929 голосов против, явка против равна 14,3%.


Так же посчитаем явку "за", получим
УИК, где меньше 1000 избирателей: $0.63$
УИК, где не меньше 1000 избирателей: $0.50$

Если мы искусственно повышаем явку, где меньше 1000, и это в среднем более лояльные избиратели. То
а) явка "против" вырастет, и вполне может достигнуть таковой на участках, где менее лояльные избиратели.
б) явка "за" вырастет, но ещё больше.
Всё согласуется.

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение06.07.2020, 12:49 
Заслуженный участник


09/05/12
25179
 !  Emergency, недельный бан за оффтопик.

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение06.07.2020, 13:37 
Аватара пользователя


11/12/16
13859
уездный город Н
Теперь можно поговорить про "целые числа".

Вот на этом графике Изображение
есть характерные особенности в районе 0.5, 1, и еще некоторых чисел по оси $x$.
Я сгенерировал в Экселе около 5000 случайных чисел $N$ между 100 и 500, потом сгенерировал столько же случайных чисел между $0.4 N$ и $N$ ("За"), поделил одно на другое ("явка За") и нарисовал облако.
И получил в чистом виде особенности около 0.5, 1. То есть эти особенности однозначно являются артефактами деления целых чисел.

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение06.07.2020, 13:48 
Заслуженный участник


04/03/09
910
EUgeneUS в сообщении #1472599 писал(а):
а) пятно с большим количеством избирателей. Это крупные города, в которых участки можно побить более-менее равномерно, включая в них количество, близкое к максимальному.

Рандомные 10 участков из этого кластера (отсекал по явке за, чтобы меньше 40% была):

(участки кластера)

[1555, 812, 549, 254, 'Костромская область', '15 Мантуровская городская', 'УИК №350']
[1989, 995, 611, 375, 'Свердловская область', '40 Кировградская городская', 'УИК №1976']
[1061, 611, 389, 218, 'Новосибирская область', '6 Венгеровская', 'УИК №147']
[2269, 934, 634, 290, 'Мурманская область', '11 Оленегорская', 'УИК №252']
[740, 584, 276, 303, 'Камчатский край', '3 Вилючинская', 'УИК №88']
[1069, 507, 347, 157, 'Пермский край', '18 Куединская', 'УИК №1806']
[1121, 389, 212, 171, 'город Москва', '102 Гагаринский район', 'УИК №2151']
[1764, 599, 405, 190, 'Пермский край', '55 Пермь, Свердловская №1', 'УИК №3470']
[1969, 867, 572, 281, 'Липецкая область', '15 Липецк, Октябрьская №1', 'УИК №2224']
[3064, 1081, 611, 442, 'Кировская область', '15 Киров, Октябрьская', 'УИК №383']

Из них получилось 4 областных центра.
EUgeneUS в сообщении #1472599 писал(а):
б) кластер размытый вдоль оси $x$ - это мелкие участки. Условно - сельская местность. Там голосуют по разному. И всякие аномалии с круглыми цифрами тоже сосредоточены там.

Рандомные 10 участков из этого кластера (отсечка - количество "ЗА" больше 1000):

(Оффтоп)

[1950, 1766, 1694, 72, 'Ростовская область', '61 Шахтинская городская', 'УИК №2573']
[2716, 2688, 2661, 18, 'Краснодарский край', '35 Новороссийск, Приморская', 'УИК №3513']
[2266, 2195, 2022, 156, 'Республика Башкортостан', '74 Мелеузовская', 'УИК №2556']
[1846, 1563, 1091, 472, 'Республика Северная Осетия - Алания', '3 Владикавказ, Левобережная', 'УИК №305']
[1912, 1426, 1142, 273, 'Тамбовская область', '26 Тамбов, Октябрьская', 'УИК №731']
[1315, 1223, 1169, 54, 'Республика Дагестан', '20 Кайтагская', 'УИК №596']
[1901, 1675, 1511, 161, 'Нижегородская область', '59 Шахунья округ', 'УИК №2150']
[1971, 1596, 1370, 220, 'Рязанская область', '8 Милославская', 'УИК №232']
[1511, 1301, 1236, 65, 'Ставропольский край', '5 Благодарненская', 'УИК №232']
[2079, 1500, 1080, 420, 'Пермский край', '33 Пермь, Орджоникидзевская', 'УИК №3350']

Тут 3 областных центра.
Выборку из маленьких участков я приводил.
Если считать выборку из 10 участков достаточной, то можно сделать вывод, что, да, в левом кластере больше крупных городов, чем в других кластерах, но и небольших городов в нем тоже много, а может и вообще большинство.

-- Пн июл 06, 2020 13:51:55 --

EUgeneUS в сообщении #1472611 писал(а):
То есть эти особенности однозначно являются артефактами деления целых чисел.

Именно про эти особенности речи вообще не шло пока что. Или вы утверждаете, что эти особенности на графике "Явка ЗА" - "Количество ЗА" - это ровно те же самые особенности, что на графике "Явка" - "Процент ЗА"? Если да, то мне это неочевидно.

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение06.07.2020, 13:55 
Заслуженный участник
Аватара пользователя


26/01/14
4845
EUgeneUS в сообщении #1472611 писал(а):
есть характерные особенности в районе 0.5, 1, и еще некоторых чисел по оси $x$.
Не лукавьте.
Верю, что можно объяснить особенности возле $1/2$, $2/3$ или $4/5$.
Но что поддаются естественному объяснению равноотстоящие особенности с шагом в пять процентов (70%, 75%, 80%, 85%, 90%, 95%) - на любом графике - это увольте.

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение06.07.2020, 14:01 
Заслуженный участник


20/08/14
11782
Россия, Москва
EUgeneUS в сообщении #1472611 писал(а):
И получил в чистом виде особенности около 0.5, 1. То есть эти особенности однозначно являются артефактами деления целых чисел.
Можно ли из этого делать вывод что пики на графиках "ЗА(ЯВКА)" обусловлены тем же? Мне думается нет, нельзя. Может быть Вы нарисуете и такой график по своим случайным данным и проверите наличие и величину этих пиков? И на что они окажутся выровнены по ЯВКЕ, на каждый процент или на каждые 5%? Посмотреть интересно, а самому делать лень. :-(
UPD. О как мы синхронно. :D

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение06.07.2020, 14:07 
Аватара пользователя


11/12/16
13859
уездный город Н
12d3 в сообщении #1472613 писал(а):
Если считать выборку из 10 участков достаточной, то можно сделать вывод, что, да, в левом кластере больше крупных городов, чем в других кластерах, но и небольших городов в нем тоже много, а может и вообще большинство.

Почти все участки лежат под линией $y = 2500 x$, а центр этого кластера лежит примерно на линии $y = 2000 x$.
Видимо, это характерные числа, на которые стараются "пилить" участки.
ИМХО, для городов с населением, скажем, более 20 000 тысяч, наверное, можно распределить избирателей так, чтобы участки попали примерно на линию $y = 2000 x$.
Да я ошибся, что там только города-миллионники.

-- 06.07.2020, 14:14 --

Dmitriy40 в сообщении #1472617 писал(а):
Можно ли из этого делать вывод что пики на графиках "ЗА(ЯВКА)" обусловлены тем же? Мне думается нет, нельзя. Может быть Вы нарисуете и такой график по своим случайным данным и проверите наличие и величину этих пиков?

Такое утверждение делать рано, конечно.

Меня останавливают следующие моменты:
1. Не очень понятно, как генерировать модельные данные. Так как особенности появляются только участках с небольшим количеством избирателей. Нужно как-то учитывать распределение участков по количеству.

2. У меня под рукой только Ексель, он умеет только довольно большие маркеры. А генерировать нужно десятки тысяч точек. Всё сольётся.

Может быть кто-нибудь смоделирует на рисовалке от Питона? Очень красиво на ней получается.

-- 06.07.2020, 14:17 --

Mikhail_K в сообщении #1472616 писал(а):
Не лукавьте.

А я и не лукавлю - я же описываю, что делал, и всё.
Выводы, которые ещё являются преждевременными, не делаю.

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение06.07.2020, 14:18 


05/09/16
12067
Хорошо было бы посмотреть на выборы в других странах.
По идее, в той же Америке всё должно быть в открытом доступе, но где именно я не знаю, нужны неравнодушные американцы :)
Некоторые (возможно, злые языки) пишут что "Пила Чурова" появляется и там тоже. Например (статья русского человека) http://reverent.org/elections/us_electi ... ctions.pdf

 Профиль  
                  
 
 Re: Исследование честности голосований от Сергея Шпилькина
Сообщение06.07.2020, 14:26 
Заслуженный участник


04/03/09
910
Давайте сравним, как ведут себя гистограммы для разных величин, если округлять до 0.1% или до 1%.
Явка ЗА:
Изображение Изображение
Видно, что на левой гистограмме явно есть пики на дробях $1/2$, $2/3$ и т.д. На правой гистограмме, при более грубом округлении, они исчезают.

Явка ПРОТИВ:
Изображение Изображение
То же самое происходит.

А теперь просто явка:
Изображение Изображение
Пики на значениях, кратных 5, никуда не деваются.

И процент голосов ЗА:
Изображение Изображение
Тут тоже пики на значениях, кратных 5, никуда не деваются. Более того, на левой гистограмме пик на каждом(!!) целом значении в интервале от 75 до 100.

Как это ни интерпретируй, а пики для верхних четырех гистограмм живут совершенно по другим законам, чем пики на нижних четырех.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 196 ]  На страницу Пред.  1 ... 6, 7, 8, 9, 10, 11, 12 ... 14  След.

Модераторы: Модераторы, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group