Predikce výsledků prezidentských voleb STEM/MARK a STEM znovu velmi přesná
Z predikce bylo od začátku patrné, že do druhého kola postoupí Petr Pavel s Andrejem Babišem a rozdíl mezi nimi bude nepatrný. Velmi dobře odhadla také volební účast.
Praxe ze sčítání výsledků z minulých voleb, kdy jsou obvykle nejprve sečteny malé okrsky na vesnicích a až v samotném závěru jsou známé výsledky z velkých okrsků ve městech, se potvrdila i letos. Průběžné součty publikované ČSÚ zpočátku nadhodnocovaly zisk Andreje Babiše, který má vyšší podporu na venkově, a naopak podhodnocovaly volební zisk Petra Pavla, který má svou voličskou základnu spíše ve městech (což znamená ve větších okrscích). Právě tuto nerovnoměrnost predikce STEM/MARK a STEM koriguje.
První volební predikce šla do televizního vysílání těsně po 14:45. Tehdy bylo sečteno něco málo přes 15 % okrsků. „Zatímco průběžné výsledky v tento okamžik ukazovaly relativně vysoké vedení Andreje Babiše, které dosahovalo téměř 40 % a Petr Pavel se pohyboval lehce nad 30 %, výsledky naší predikce předpovídaly již tehdy, že se bude jednat o velmi těsný souboj těchto dvou kandidátů a vedli jsme bouřlivé diskuse, kdo nakonec bude vítězem
1. kola. I přes těsnost průběžných výsledků až do závěrečných chvil jsme byli schopni říct, že Petr Pavel nakonec Andreje Babiše v 1. kole porazí“, komentuje velmi dobrou přesnost predikce ředitel STEM/MARK Jan Tuček.
Během odpoledne se predikce nadále zpřesňovala. „Důležitý okamžik nastal těsně po 15:45 (tehdy bylo sečteno cca 88,6 % okrsků), kdy sice průběžné výsledky stále hlásily vítězství Andreje Babiše o zhruba 3procentní body před Petrem Pavlem, ale predikce STEM/MARK a STEM naopak předpověděla vítězství Petra Pavla“, dodává Tuček. Konečné výsledky voleb pak tento předpoklad potvrdily.
Model volební predikce rovněž dokázal velmi záhy určit pořadí všech kandidátů. Jediným problémem byla právě situace kolem celkového vítěze, jelikož v Praze bylo sčítání kvůli velkým okrskům a nadprůměrně vysoké volební účasti relativně pomalé a odhadované výsledky za skupinu liberálních pražských okrsků tak vykazovaly určitou míru nepřesnosti. Jak upozorňuje datový analytik STEM/MARK Matěj Šimlovič, „nejužším místem naší predikce je právě potenciální změna poměru volební účasti mezi jednotlivými skupinami okrsků a také malý podíl sečtených okrsků uvnitř některé ze skupin“.
Predikce ukázala, že jednotlivé obce Česka volí čím dál rozdílněji a že společnost je opravdu roztříštěná. Zároveň ovšem dokázala, že pomocí analýz a statistických metod lze tuto roztříštěnost odhadnout a poskytnout veřejnosti velmi kvalitní odhad konečných výsledků voleb již cca hodinu a půl po zavření volebních místností.
Ptáte se, jaké výpočty byly za výslednými grafy?
Pro výpočet predikce byly zpočátku zvoleny 2 metody, z nichž se po většinu času analytici klonili k dále popsané. Její algoritmus popisují analytici STEM/MARK v těchto 3 krocích: Nejprve byly všechny volební okrsky rozděleny do 13 skupin podle podobnosti volebních výsledků v minulých volbách. V každé skupině byl znám počet obyvatel, respektive počet voličů a s přihlédnutím k dřívější volební účasti tak bylo možné přiřadit dílčím skupinám odlišnou váhu. Posledním krokem predikce byl předpoklad, že okrsky, které patří do stejné skupiny, se budou i v letošních volbách chovat velmi podobně. Na základě průběžných výsledků v jednotlivých skupinách pak algoritmus dopočítal souhrnnou volební predikci na celostátní úrovni.
Kontakt: Jan Tuček, e-mail: tucek@stemmark.cz, tel.: 724 433 888