Предположим, на выборах голосуют 150 миллионов россиян (точнее, 150-ти миллионами представляется возможность сходить на участок и проголосовать). Итогом будет избрание какого-то президента или парламента.
Теперь предположим, что мы случайным образом отбираем около 150 тысяч россиян (вроде лотереи по номеру паспорта), и даём возможность голосовать только им. Т.е. каждый россиянин может получить возможность проголосовать с вероятностью
. Эти 150 тысяч, очевидно, будут хорошей репрезентативной выборкой всех россиян, и итог голосования будет практически такой же, как при голосовании 150 миллионов. Вопрос, какова конкретно будет статистическая ошибка из-за неполноты выборки? Насколько изменится процент голосов, отданных за какую-то партию, в результате ограничения выборки?
Я вроде сам решил эту задачу, но хотелось бы убедиться что правильно. Насколько я помню, средняя ошибка обратно пропорциональна корню из размера выборки. Можно принять, что если голосует всего один человек, то средняя ошибка будет 50%. Тогда, если голосуют 100 человек, средняя ошибка будет
%. При выборке 150000 человек средняя ошибка будет
%.
Ещё не совсем понятно, какой лучше принять среднюю ошибку при голосовании всего одного человека.
Этот вопрос мне интересен, поскольку на мой взгляд такое ограниченное голосование - хорошая идея. Если голосовать будут только 150 тысяч, государство может дать им какие-то деньги для того, чтобы они внимательно изучили вопрос, поискали информацию в интернете, пообщались на форумах и т.д. Таким образом, эти 150 тысяч проголосуют более компетентно, чем если бы голосовали все 150 миллионов.