Per Laisvės TV, kur mes ir jie laikomės ten, Andrius Tapinas panagrinėjo kandidatų mokesčių ir pajamų statistiką:
Tai man pasirodė visai įdomu ir aš pagalvojau, kad galiu irgi paanalizuoti tuos duomenis kažkaip. Viena tik bėda – duomenis gauti gan keblu. VRK.lt viskas yra, bet duomenys sumėtyti į subpage’us visokius. Jeigu reiktų rankiniu būdu rinktis duomenis, tai užsi…tum. Ėmiau ieškoti kokių nors įrankių, kurių pagalba tą procesą galėčiau automatizuoti. Kažką radęs papostinau į Feisbook’ą džiaugsmingą “ParseHub” atradimą.
Su sąlyga, kad turiu puikių friendų ir followerių, tai ten gan greitai, žmonės viską ėmė ir padarė ir sudėjo į github’ą (čia tie friendai ir followeriai, kurie labiau draugauja su programavimo kalbomis ir visokių duomenų scrapinimu iš web’ų).
Mano friendai ir followeriai yra nerealūs! 🙂
Negana to, tuose pačiuose komentaruose ėmė ir sudėjo nemažai įdomios statistikos naudojant MS Power BI.
Man nelabai beliko ko daryt daugiau. Nebent sugalvočiau kokias įdomesnes koreliacijas. Kol kas nieko įdomesnio nesugalvojau, kaip kandidatų amžiaus histogramą ir šiek tiek informacijos apie nuteistus kandidatus.
Apie amžių:
Manau, kad gan normalu turėti būtent tokį amžiaus pasiskirstymą, nors norėtųsi daugiau jaunų gal. Kaip manot?
Seniausias: Pranas Kavaliauskas, 88 metai
Jauniausias: Dobilas Sinkevičius, 25 metai. Yra ir daugiau 25’mečių, bet ponas Lauras gimęs vėliausiai 1991 metais. Už jį viena diena senesnis yra ponas Modestas Barauskas – save išsikėlęs.
Vyriausiasis kandidatas pas Krivicką-Puteikį – jie gi ir pensininkų partijos nuotrupas kažkokias turi. O jauniausias pas TT.
O čia visų partijų kandidatų amžių histogramos:
Pamėginau paskubomis sudėti histogramas pagal panašumą.
Viršutinė eilutė sąrašų turi daugiau vyresnių kandidatų nei jaunesnių (apatinė irgi lyg ir). LSDP laiptai stačiausi (nuo jaunų į vyresnius žiūrint), tai reiškia, kad pas jų didesnė vyresnių kandidatų koncentracija.
LRLS, tuo tarpu, amžiaus pasiskirstymas tolygiausias ir man tai atrodo kaip geras dalykas 🙂
Daugiausiai jaunų turi Žalieji (bet ne valstiečiai).
Teistumai.
Nupaišiau Pareto diagramą. Tai tokia diagrama, kur stulpeliai – duomenys, jie būna mažėjimo tvarka iš kairės į dešinę, o virš jų esanti linija yra procentų suma, kuri didėja iš kairės į dešinę. Ta procentų suma parodo kur yra didžiausia duomenų koncentracija:
Taigi, lyderiai yra Drąsąkeliai, TT ir Pelėsių TV (Liaudies) partijos, kuriose yra 50 procentų visų nuteistų kandidatų.
LRLS yra du kandidatai abu nuteisti už klaidingą apskaitą.
Update:
Sudėjau visų kandidatų ir sąrašo top 40 amžiaus palyginimą:
LRLS jaunuosius savo kandidatus stumtelėjęs į sąrašo pabaigą, bet ir vyresniųjų nukando. Apie savo partijos reitingavimus ir to rezultatus jau rašiau.
TSLKD antai vyresnieji (55-60 metai) monolitiškai pirmose vietose. Gražu, kad 30-35 kilstelėję į priekį.
LSDP monolitai dar senesni: 60-65. O ir senolius gerai vertina (nuo 70). 25-30 ir 35-40 ruožą išvis išmetę.
Sąrašistai nepasikeitę, nes jų tik ~40 apskritai 😀
TT irgi savo tvirtąją nomenklatūrą siūlo rinkėjams.
DP – lygiai kaip ir TT.
Valstiečių-Žaliųjų ir Žaliųjų irgi mažai, tai niekas ten nesikeičia.
Zuokininkai praspyrę senolius ir jaunuolius 🙂
Tomaševskininkai 40-45 diskriminuoja.
Tautininkų, kaip ir PuteiKrivickininkų, Pelėsių TV (liaudies partija), drąsąkelių – tiesiog mažai.
Na, o be sąrašo eina tiesiog be sąrašo. Įdomiau gal tik tai, kad gan tiksliai atkartoja visų kandidatų histogramos formą.
Tai tiek šiandien Schemos. Daugiau:
Schema #39
Schema #38
Schema #37
Schema #36
Schema #35