Monday, June 2, 2008

Datamining van de stemresultaten van de Eurosong 2008 finale (1)

Naar aanleiding van een post van B.V.L.G. ga ik proberen een soortement analyse te maken van het stemgedrag van de Eurosong 2008 finale. De data is afkomstig van de website van Eurovision.

Deze post is een eerste analyse van een hopelijk ganse reeks benaderingen en correlaties van het stemgedrag.

Vooreerst wat basis-informatie over de verzamelde data:

  • er mochten 43 landen stemmen, waarvan 25 (58%) mogen geclassificeerd worden als Oostblok-landen (weliswaar met een paar twijfelgevallen zoals Turkije, Israël, Griekenland, ...).
  • In de finale zaten 25 landen, waarvan 15 (60%) zogezegde Oostbloklanden.
Op basis hiervan kan men - zonder enige prior kennis te hebben over de liedjes en de manier van stemmen - voorspellen dat er iets meer kans is dat een zogezegd Oostblokland zal winnen.

Elk land mocht in totaal 58 punten geven, te verdelen over 10 landen (1, 2, 3, 4, 5, 6, 7, 8, 10, 12). Let op, deze schaal is niet-lineair!

De gemiddelde score gegeven aan Oostbloklanden bedraagt 44,35 met standaarddeviatie 11,15.

Het aantal landen dat meer dan 29 punten aan Oostbloklanden gegeven heeft bedraagt 37 (horen daar niet bij: Denemarken (22), Zweden (22), Ijsland (12), Andorra (28), Estland (29) en Noorwegen (26)).

Het valt op dat dit vooral Scandinavische landen zijn.

Sorry, no purdy pictures (yet?) ...

(OpenOffice.org Spreadsheet te bemachtigen op aanvraag)

3 comments:

dM3 said...

easy, gewoon een cov matrix opstellen :D
zie mijn thesis ;)

Z? said...

aha, maar dan gaat ge er wel van uit dat al die mannen voor hun eigen land stemmen nee?

boskabout said...

@dM3: sorry, Matlab staat enkel op de kaputte pc :-p
@z?: zoals het een rasecht rioolgazetjournalistje betaamt doe ik niet mee aan het gedetailleerd uitschrijven van de veronderstellingen ;-)