В западной социологии все рейтинги давно уже рассчитываются машинными методами на основе больших данных (Big Data). Это позволяет все рейтинги высчитывать косвенно — на основании лишь моделирования самой реальности без прямого опроса, кого Вы поддерживаете. Достоинства этих методов состоят в том, что мы имеем математическую модель социальной реальности с временными рядами. Такую модель невозможно использовать для подделывания рейтингов вообще. Это точные данные без самой возможности фальсификации реальности.
Недавно я закончил научный проект в Польше, где я был руководителем — мы создали модель автоматического мониторинга политического дискурса в Польше на базе машинного анализа интернет ресурсов нескольких общенациональных и локальных польских СМИ. В режиме реального времени мы анализировали порядка 800 польских политиков. Была создана теоретико-игровая модель политического дискурса с возможностью выявления скрытых игроков. С такой моделью нет необходимости проведения опросов. С вероятностью 0,95 она способна предсказывать распределение голосов по партиям на выборы в Сейм и по конкретным политикам. В этой модели для ее настройки собирается порядка 100 тысяч способов замеров с временными рядами не менее 100 данных. Это означает, что для настройки модели мы берем не менее 10 миллиардов самих замеров (100×100 тысяч). Можно ли их собрать вручную? Никогда. Можно ли их обработать вручную? Да, но для этого понадобится порядка 10 тысяч специалистов. А над нашим проектом работало всего 4 специалиста, включая меня, но за нас все считали программы, которые мы создавали, а не мы сами.
Между всеми замерами с 10 миллиардами входных данных строятся взаимосвязи, включая кластеризацию по динамическим группам, статистические корреляции, регрессионные модели. Подделать такую модель не возможно в принципе. Иначе неминуемо возникнут статистические аномалии, которые будут говорить о том, что модель ложна.
Статистические аномалии как доказательство ложности модели
Отличный пример статистических аномалий — данные по заболеванию COVID-19 в Беларуси. Их целых три. Первая аномалия — отсутствие корреляции между ежедневными случаями умерших и ежедневными случаями болеющих. Корреляция должна была быть близка 1, а она казалась близкой 0, что не возможно чисто статистически. Вторая аномалия — стандартное отклонение в ежедневных новых случаях была значительно меньше статистически допустимого предела. Третья аномалия — график активных случаев должен был аппроксимироваться логнормальной кривой (быть левосторонним), а в случае Беларуси он оказался правосторонним.
Итак, за счет того, что данные представляли собой временнее ряды, между разными параметрами должны были быть определенные зависимости, и всех данных было несколько десятков тысяч, фальсификация отдельных данных вызвали статистические аномалии в целом, легко заметные для специалиста. Как видим, с большими данными любая фальсификация окажется заметной. Данные по COVID-19 в Беларуси не соответствуют реальности, и это видно на основании модели заболевания в целом.
Антикварная политическая социология в Беларуси
В Беларуси для расчета рейтингов политиков и экзитполов используются антикварные, страшно устаревшие методы (методы 100 летней давности!). Когда кто-то на коленках на каких-то бумажках собирает около двух тысяч замеров и на их основании делаются выводы о будущем страны на следующие 5 лет. Причем эти кто-то должны получить аккредитацию в Институте социологии НАН Беларуси, и в ее получении срабатывает политическая цензура. Выходит, что кто-то «свой» («проверенный», «наш») считает рейтинг вручную на бумажке на коленках и затем делает выводы о будущем страны, которые использует президентская вертикаль в последующем.
Почему же так делается? А потому что эти бумажки с данными двух тысяч замеров можно заменить многократно: во-первых, на этапе самого сбора данных; во-вторых, на всех последующих этапах их ручного анализа. Их заменить может только один человек за всего пару часов, это Вам не 10 миллиардов замеров, которые и собрать вручную невозможно. Поэтому этим данным «социологов» не может быть доверия в принципе. Именно по этим причинам на Западе давно от них отказались, и бумажки на коленках уже очень давно никто не использует (это метод, который давно себя дискредитировал), а вместо этого антиквара считается все машинными методами на базе больших данных, когда любой рейтинг можно рассчитать без прямого опроса.
Общенародная любовь и рейтинг в 80%
Президентские выборы в Беларуси прошли ожидаемо. На каких-то бумажках проверенными «социологами» был рассчитан рейтинг действующего президента в 80% задолго до выборов. Затем этот рейтинг подтвердился другими «социологами» экзитполом опять на бумажках. И, наконец, подтвердился самим объявлением ЦИК итогов президентских выборов и снова на бумажках. Итак, Александр Лукашенко имеет 80% «бумажной» поддержки, и это означает всенародную любовь к нему и абсолютное общественное одобрение его политики.
К организации и проведению подсчета голосов на выборах президента есть огромное множество претензий и обоснованных сомнений в том, что подсчет голосов был честным вообще. Главная претензия — все те же бумажки бюллетеней (без индивидуальных номеров) и самих протоколов их подсчета, которые всегда можно заменить.
Но всенародную любовь спрятать не возможно, а 80% — это поистине всенародная любовь. А есть ли она в принципе? Именно эту любовь президентская вертикаль хотела продемонстрировать на парадах 9 мая и 3 июля. Но не получилось. На парады собралось рекордно низкое число зрителей, несмотря на все призывы прийти на парады. Массовых пикетов в поддержку действующего президента в период сбора подписей на выдвижения в кандидаты также заметно не было. И, несмотря на разъезды большого числа доверенных лиц Лукашенко по регионам, массовых митингов собрать им не удалось вообще.
Вместе с тем, политической альтернативе (штабам Бабарико, Цепкало и Тихановской) удалось собрать не только в Минске, но и по всем регионам, включая малые города, рекордное число митингующих. Президент не собирал митингов вообще, а вместо этого проводил встречи с силовиками. Президентская вертикаль и не надеялась на выражения всенародной любви, а заранее готовилась к подавлению мирных митингов в день выборов. Так и получилось. Вместо народного ликования, ожидаемого при 80% поддержки, прошли массовые протесты в связи с фальсификацией выборов и брутальное их подавление силовиками. Три ночи подряд минчане засыпали под раскаты взрывов и выстрелов. Именно таким образом силовики давали оценку всенародной любви.
Выводы
С позиции науки ни к рейтингу в 80%, данному «социологами», ни к итогу ЦИК подсчета голосов избирателей нет никакого доверия. Президентская власть является сейчас не только делегитимированной, но и делегализованной.