Офтоп
Анатолий Чиквин

Ассистент-выборы, или как посчитать явку избирателей и не сойти с ума

Выборы уже не за горами — меньше, чем через две недели состоится Единый день голосования. Многие из читающих эти строки наверняка так или иначе задействованы в них — будут работать наблюдателями, в участковых или территориальных избирательных комиссиях. Постоянные участники этого процесса знают, как остро всегда стоит проблема определения адекватной явки избирателей и, как следствие, выявления вероятных нарушений и реакции на них. Хочу поделиться с вами некоторым опытом и наработками на эту тему.

Последние лет восемь меня активно привлекали для работы в различного рода избирательных штабах, а с 2013 года я вошёл в состав избиркома. Надо ли говорить, что с момента открытия участков и до самого их закрытия количество проголосовавших становится самой горячей новостью?

Избирательные комиссии, как известно, делают срез явки избирателей в день выборов каждые два часа – эти данные аккумулируют территориальные и региональные избиркомы, а потом общую картину обнародует ЦИК. Простому обывателю эти данные мало что говорят, особенно когда складывающуюся картину не с чем сравнить.

Например, нам говорят, что явка на 12 часов дня по вашему городу составила 10%. Много это или мало? Характерно это для вашего города или нет? Можно ли сказать, что где-то она подозрительно высокая или наоборот, низкая?

Чтобы ответить на эти вопросы, надо понять, как люди шли на выборы в предыдущие годы, а также на выборы именно этого уровня. То есть сравнивать явку на муниципальных и президентских выборах бессмысленно – на первые приходит 30-35%, а на вторые – около 55-65% избирателей.

Знать картину по вашему конкретному участку недостаточно – надо сравнить данные хотя бы в целом по округу, чтобы иметь определённую базу. Некоторое время я беспомощно пытался весь этот массив набирать в экселе, но с приходом 2016 года терпение лопнуло. Так родилась идея привлечь на службу гражданскому обществу высокие технологии.

Тимофей Речкалов откликнулся на призыв, запрограммировав все эти бесконечные столбцы и строки, создав удобную, понятную и иллюстративную систему, которая при минимальном участии с вашей стороны создаёт доступную инфографику.

Назвали мы эту систему «Ассистент-выборы», хотя название само по себе достаточно условное.

Вот по этой ссылке работает онлайн демо-версия.

Это — ссылка на скачивание.

Это — ссылка на скачивание документации.

Репозиторий с исходным кодом.

Репозиторий с исходным кодом документации.

Вот так выглядит программа, когда вы её в первый раз открываете:

Для демонстрации возможности системы в ней указаны случайные цифры, лишь примерно похожие на реальные номера участков, численность избирателей и процент явки. Мы представили себе картину на неком абстрактном избирательном округе «Неизведанск» с 11 участками, хотя их может быть сколько угодно — эти данные редактируются и легко подгоняются под вашу конкретную ситуацию.

Данные суммируются по двум условным районам и в целом по городу.

Для того чтобы приступить к детальному анализу хода выборов в вашем округе, вы заполняете соответствующие поля, указывая номера участков, их дислокацию, а также вводите данные по явке. Данные эти являются открытыми и публикуются на сайтах областных и территориальных комиссий. Это самая муторная часть работы, но именно она позволит вам в дальнейшем получить красивую картинку.

По мере поступления информации от избирательных участков, вы вносите данные в систему и формируете базу для сравнения. В этот раз у нас с вами проходят выборы в Государственную Думу, а это значит. Что корректно их сравнивать с предыдущими думскими выборами, то есть с данными за 2011 год.

Для целей демонстрации здесь будет показано сравнение президентских выборов 2008 и 2012 годов.

Учтите при этом, что численность избирателей на том или ином участке – это не константа. Данные меняются в ходе всего дня, поскольку кого-то вносят в списки избирателей, кого-то вычёркивают, приходят люди с открепительными удостоверениями.

Кроме того, из-за открепительных явка на выборах разного уровня на одном участке может оказаться разной – очевидно, что на местных выборах такие люди не голосуют. «Это не баг, это фича».

Исходя из представленных данных видно, что явка по тому или иному участку упала, осталась на том же уровне, или немного изменилась. Участки можно отфильтровать по возрастанию или убыванию нумерации, явки.

Нельзя однозначно утверждать при этом, что на участке со сверхвысокой явкой обязательно происходят нарушения – причин тому может быть несколько. Стоит учитывать местный фактор. В ранние часы, сразу после ночной смены и открытия избиркомов, на таких участках может случиться наплыв избирателей.

Система позволяет сразу же переключить табличный вид данных в диаграмму рассеяния, или scatter plot.

В приведённом на рисунке примере видно, что на участке №34 округа Неизведанск явка избирателей очень сильно упала по сравнению с прошлыми выборами.

Данная программа не осуществит глубокий анализ, но даст вполне исчерпывающую картину. Если на каком-то из участков случится неожиданно высокая, или, наоборот, провальная явка – вы сразу это увидите, а обратить внимание на участок с аномальной явкой конечно же всё же стоит.

Собственно, эта система не делает data mining, но предоставляет всю необходимую базу для него.

В ближайшей перспективе — включить такую дополнительную возможность системы, как наложение диаграмм scatter plot в один график, что позволит отследить прогресс голосования по каждому участку и в целом по округу.

График прогресса голосования на округе с 10 участками

График прогресса голосования на округе с 20 участками

График прогресса голосования на округе с 40 участками

В заключение хочу выразить убеждение, что наш опыт по внедрению этой маленькой разработки пригодится на предстоящих выборах, и Государственную Думу изберут без единого нарушения. В вашем округе уж точно.