Žiūriu aš į tų profesionalių rašytojų straipsnius ir galvoju, kad gal ir aš kada galėčiau panašiai. Bet reikia praktikuoti. Bet nesigauna, nes randu vis įdomesnių užsiėmimų. Pavyzdžiui: daryti duomenų analizę. Pavarčiau aš savo Gephi įrankiu pagamintas diagramas ir prisiminiau vieną darytą Seimui. Tada prisiminiau visokius pokyčius vykusius šiemet (LSDP skilimas, Šakalienės frakcijų keitimai, frakcijų koalicija ir t.t. ir pan.). O kai prisiminiau, tai pagalvojau, kad būtų įdomu pažiūrėti kas gausis jeigu nupieščiau tą diagramą dabar su šviežesniais duomenimis.
Iki šiol savo tarybos posėdžių balsavimo diagramose (žr.: Schema #45, Schema#36) analizavau kaip kokie tarybos nariai balsavo. O čia paanalizuosiu kaip nebalsavo.
Tarybos nariai turi galimybę balsuoti spaudžiant mygtukus “UŽ”, “PRIEŠ, “SUSILAIKAU”, bet gali ir nieko nespausti. Kai nieko nespaudžia – jie neskaičiuojami į kvorumą. Šitaip kone kiekviename posėdyje kvorumus mėgina griauti opozicinės Vilniaus miesto tarybos frakcijos: zuokistai, LLRA ir … TS-LKD. Nors TS-LKD yra pozicija ir dažniausiai elgiasi kai pozicija, bet retkarčiais mėgsta pasielgti kaip opozicija.
Aš atrinkau 2017 metų posėdžių klausimus (žinoma, iš nuostabaus http://github.com/vilnius/taryba) dėl kurių tarybos nariai nebalsavo ir su Gephi nubraižiau diagramas. Tose diagramose yra tarybos nariai surašyti ir nuspalvinti pagal frakcijas: linijos reiškia, jog tas narys nebalsavo dėl to klausimo, nors tame tarybos posėdyje buvo užsiregistravęs ir dėl kitų klausimų balsavo. Tokie nebalsavimai dažnai nutinka ir dėl to, kad posėdis užsitęsia ilgiau nei planuota ir tarybos narys išeina iš posėdžio. Arba viduryje posėdžio kur nors išeina. Arba pražiopso. Tie klausimai dėl kurių nebalsavo nedaug tarybos narių – tikriausiai atsitiktiniai, bet tie, dėl kurių nebalsavo daugiau (o ypač opozicinės frakcijos) – gali reikšti kvorumo griovimo aktą.
Vakar vakare atsidariau antikorupcijos komisijos padėjėjos atsiųstą emeilą ir dėl to miegot ėjau tik ~02 val. Emeile radau excelį su skaičiais! Man patinka exceliai su skaičiais.
Šiuo atveju ten buvo excelis, kuriame parodyta kiek ir kokio amžiaus Vilniaus darželių grupėse buvo registruojama vaikų. Tokie matavimai padaryti kas tris mėnesius nuo 2015 gruodžio iki 2017 vasario. Ten taip pat parašyta kiek tose amžiaus grupėse gali būti maksimaliai vaikų pagal higienos reglamentus.
O antikorupcijos komisija todėl, kad viskas prasidėjo nuo su ponu Vidu Urbonavičiumi susijusio skandalo. Savivaldybės etikos komisija išteisino Vidą, nes, jei teisingai suprantu, nerado tiesioginių etikos pažeidimo įrodymų. Pati skandalo esmė buvo ta, kad kai kurie savivaldybės darbuotojai pakeitė darželio (lyg ir “Žirniukas”) grupių sudėtis taip, kad jaunesni vaikai pateko pas vyresnius į grupes, kad atsirastų vieta įtariamo neetišku elgesiu tarybos nario vaikui. Darbuotojai sakė, kad jautė spaudimą, bet tada paaiškėjo, kad ne tiesiogiai, o per padėjėjus ir spaudimas pasireiškė užklausų dažnumu bei gal tonu… Žodžiu išteisino.
Aš, savo ruožtu, skandalo įkarštyje dar pasiūliau antikorupcijos komisijai ištirti ar nėra čia visame tame reikale korupcijos požymių. Poroje praėjusių posėdžių apie tai kalbėjome. Tyrimo metu buvo nuspręsta pasiaiškinti kiek Vilniaus darželiuose buvo registruojama grupių vaikų viršijimų ir kokių, ir ypač po to, kai įsidiegėme naują priėmimo į darželius sistemą. Mano manymu – tai tik bandymas nukreipti visą komisijos tyrimo eigą nuo kaltinimų korupciniu poveikiu link “what about” retorikos. Ir bandymas vykęs – juoba, kad yra tarybos narių, kurie sako, kad čia labai geras ir gražus žmogaus požymis, nes jis, mat, labai rūpinasi savo vaiku – labai geras tėvas, žiūrėkite koks geras, kaip myli savo vaiką! Vardų neminėsime, nors tai buvo Rudžionis. O be to reikia dar išsiaiškinti kaip galima tuos viršijimus daryti ir ar yra landos korupcijai.
Taigi – aš pamačiau excelį su skaičiais! Kai turime gerus skaičius, tai galime pasakyti kokis viršijimų grupėse tendencijos (didėja ar mažėja), taip pat galima pasakyti kur tokie atvejai dažniausi ir ekstremaliausi. Pirmiausiai susiskaičiavau kiek ir kokios viršijimų tendencijos:
Žiūrėdamas į tuos skaičius pastebėjau, kad jų yra ir neigiamų. T.y., kai kuriose grupėse higienos normos nepasiekiamos. Taigi, analogiškas grafikas, bet jau vaikų “trūkumams” grupėse:
Update: komentatorius vienas Feisbuke iškėlė teoriją, kad galimai vaikų mažėjo, tai dėl to ir viršijimai sumažėjo. Tai tam nupiešiau visų vaikų Vilniaus darželiuose grafiką:
Tada dar sumaniau nupaišyti vaikų viršijimų histogramas kiekvienam iš matavimo taškų, kad pamatyčiau kokių dažniausiai viršijimų pasitaiko:
Tada, žiūrėdamas į tas histogramas išmeditavau skaičių 10. Gražus ir apvalus skaičius. Dabar negaliu pasakyti kodėl, bet galbūt dėl to, kad tai kraštutinis trečdalis histogramų “x” ašyje. Tai tada pasižiūrėjau kuriuose darželiuose tokių viršijimų matavimo taškuose pasitaikė daugiausiai. Rezultatas – Paretto chart’as:
Dabar, gerai būtų išsiaiškinti kodėl tuose darželiuose tie dideli viršijimai pasitaiko kiekviename matavimo taške ir ką dėl to daryti.
Tai principe ir buvo tie 4 grafikai kuriuos nupiešiau vakar vakare.
Tikiuosi, kad ši informacija padės komisijai susifokusuoti į skaidrumo didinimą.
Nežinau kaip kitos Vilniaus miesto savivaldybės tarybos frakcijos, bet mūsiškė turi chat’ą. Chat’e fleiminame, aptarinėjame, diskutuojame. Pastarųjų dienų fleimas paskatino nupiešti šiuos grafikus ir išpostinti į #48’ą schemą čia bloge.
O fleimas vyko dėl kultūrai ir sportui skirtų išlaidų mūsų biudžete. Pro-kultūrininkai skundėsi, kad mažai lėšų ir dėmesio skiriame kultūrai ir per daug sportui, o pro-sportininkai sakė, kad visiems skiriama pakankamai dėmesio ir kultūrai biudžetai tolydžio didinami. Tada pro-kultūrininkai ir pro-sportininkai ėmė naudoti neracionalius argumentus ir man panižo nagai įnešti racionalumo į diskusiją.
Kaip mes įnešame reacionalumo į diskusijas? Ogi skaičiais! Einame va čia: https://github.com/vilnius/biudzeto-ataskaitos, susirenkame duomenis ir analizuojame, diskutuojame racionaliai tada.
Principe to ir užtektų, nes visi duomenys yra – nori eini ir analizuojiesi. Bet žinia, kad yra žmonių, kurie turi humanitarinį mąstymą ir skaičių pjaustymas – ne jiems. Tai paėmiau ir pripaišiau krūvelę histogramų iš 2015-2016-2017 metų duomenų.
Bet tada dar pagalvojau, kad galima pripaišyti kažkokių grafikų iš visų: 2009-2017 esančių duomenų. Ėmiau paišyti ir tada supratau, kad 2009 metai kažkokioje betvarkėje – daugybė besidubliuojančių eilučių, o 2010 irgi betvarkė – išskaidyta į keletą failų, kuriuos susumavus gaunasi kostminiai skaičiai. Github’e prikomentavau, kad blogai. E-miestas tikiuosi padės išspręsti problemas.
Todėl čia bus 2011-2017 metų grafikai. Viskas kas iki 2015 metų – perskaičiuota eurais.
Mantas Zimnickas savo stebuklinga galva ir rankomis sugalvojo kaip iš ganėtinai OpenData not friendly lrs.lt nuscrapinti duomenis apie balsavimus.Tai nuscrapino. Rado balsavimus nuo 1997. Gal tik nuo tada ta informacija buvo renkama patogiu būdu.
Čia žiūrėkite ką jis su kažkokiu “Jupyter” įrankiu prigamino. Man ši informacija įdomi tuo, kad matome kas daugiausiai prisidėjo prie to, kur šiandien esame savo sprendimais paspausti “už”, “prieš” ar “susilaikė”. Dar įdomu, kad daugiausiai balsavimų buvo 2002 ir 2009 metais. 2009 – “naktinės reformos” metai. Metai, kai Lietuvą Kubilius gelbėjo iš krizės. Dėl 2002 metų nepamenu kas ten buvo. Reikia pafollowupinti.
Na, o aš, savo ruožtu, padariau tai ką dariau su Vilniaus taryba. Sudėjau šios kadencijos Seimo narius į Gephi ir padariau realių frakcijų analizę. Ne tai ką politikai suokia, o tai ką paspaudžia pultelyje Seimo posėdžių salės konsolėje. Jei kas nors norės pasiginčyti – eikit ginčytis su skaičiais.
Primenu, kad Gephi turi tokį “Force atlas” algoritmą, kuris padaro štai ką:
Šiandien duše sugalvojau, kad Vilniaus miesto tarybos darbą galima analizuoti ne tik tarybos narių balsavimo kontekste, bet ir sprendimų priėmimo kontekste. T.y. pažiūrėti kurie klausimai buvo priimti ar atmesti mažiausiu balsų skirtumu, bei kurie klausimai buvo sprendžiami daugiausiu ar mažiausiu tarybos narių kiekiu. Na ir, žinoma, už kuriuos daugiausiai balsuota ir prieš kuriuos daugiausiai balsuota, bei dėl kurių daugiausiai susilaikyta nekalbant apie bendru sutarimu priimtus sprendimus.
Ką mums tai duoda? Ogi tai, kad tai mums padės suprasti/charakterizuoti šios kadencijos tarybą.
Pradedu nuo prieštaringiausių klausimų. T.y. klausimų kurių sprendimas buvo nusvertas mažu tarybos narių balsų kiekiu. Pagalvojau, kad mažai yra 5 ir mažiau. Čia mano toks sugalvojimas. Tokie klausimai yra:
Savo 36 schemoje pasakojau apie Vilniaus miesto tarybos koalicijas per balsavimus. Tai yra, paimame mano mylimą Gephi ir sudėliojame balsuotojus į vieną žemėlapį. Balsuotojai pasiskirsto taip, kad už tuos pačius klausimus balsavę žmonės atsiduria daug maž toje pačioje vietoje 2D erdvėje. Ir tie žmonės susidėlioja daug maž taip, kokios frakcijos/koalicijos yra.
Tai dabar aš padariau lygiai tą patį, tik duomenų dabar turime truputį daugiau lyginant su praėjusiu kartu. Tuo pačiu pasitikriname ar pasikeitė kas ar ne ir jei pasikeitė tai kaip.
Čia yra visų balsavimų “UŽ” žemėlapis, kur skaičiukai yra klausimų ID, o linijos reiškia, kad tas žmogus už tą klausimą balsavo (kuo burbulas didesnis – tuo daugiau tas tarybos narys balsavo “UŽ”):
O čia yra paveiksliukas paaiškinantis ką reiškia vietos (spalvos, kaip jau tikiuosi spėjote suprasti, yra frakcijos):
Nebesugalvoju kažko dvasingo parašyti į blogą. Vis schemos ir schemos. Bet tikiuosi, kad kam nors įdomu bus ir tai.
VRK atvėrė visus Lietuvoje balsavusiųjų rinkėjų biuletenių duomenis.
ATVĖRĖ BIULETENIŲ DUOMENIS!!! Tai yra didžiulis kokybinis šuolis skaidrumo ir įdomumo link. Ponas Jonas Bačelis, kuris yra pats geriausias duomenų analitikas, kokį žinau (jis dar, jeigu neklystu, Švedijos Geteborgo universiteto genetikos mokslų daktaras) truputį parodė ką galima su tokiais duomenimis padaryti:
Aš, ta proga, sudėjau visus tuos biuletenius į savo mėgstamą Gephi. Gephi per maždaug ~1 naktį nupiešia vienos partijos žemėlapį. Tai aš per porą naktų paprašiau kompo nupiešti man LRLS i TS-LKD žemėlapius. Šiuose žemėlapiuose yra tik tie rinkėjai, kurie reitingavo nors vieną kandidatą balsuodami už sąrašą:
Aš tikriausiai jau įgrisau jums su savo rinkiminėm schemom. Bet va vieną dar sugalvojau čia įdėti. Vėliau mėginsiu ką nors dvasingesnio parašyti. Gal net kas gausis.
O čia dabar bus mano paties sugalvotas ir jau beveik standartizuotas metodas, parodantis pokyčių Seimo rinkimų sąraše mastą. O tas mastas, savo ruožtu, galbūt atsitiktinai visai koreliuoja su galutiniais rinkimų rezultatais.
O rinkiminis sąrašas, žinia, yra viena karščiausių temų partijos viduje ir taip pat gan gausiai aptarinėjama viešojoje erdvėje. Gerą sąrašą sudaryti nelengva: jis gan svarbus rinkėjams, todėl partija turi suprasti ką rinkėjai galvoja; sąrašas tai pat svarbus kandidatams, todėl jie daro tokią savotišką rinkiminę kampaniją partijos viduje. Tos vidinės kampanijos būna įvairios: nuo kokių nors straipsnių rašymo vidiniuose portaluose ar emeilų siuntinėjimo iki visokių intrigų schemų kūrimo. Suvaldyti visą šį procesą tikrai nelengva.
Nepasakosiu labai čia daug, o tiesiog reikia galų gale kažką į blogą parašyti. Užteks tiesiog šiaip sau į soc. tinklus paveiksliukus šarinti.
Na, tik užsiminsiu, kad buvau Vienoje ir ten išgirdau tokį žodį “Tableau”. Tai labai smagus žaislas – ypač, kai VRK atvėrę savo duomenis patogesniu būdu, nei buvo iki šiol.
Čia bus keletas dot-plot’ų apie amžių grupes registruotas balsuoti ir realiai balsavusias apygardų smulkumu.