Het is alweer even geleden dat we een publieke visualisatie hebben beet gepakt om te verbeteren. Tijdens de verkiezingen in Portugal op 6 oktober kwam er een visualisatie langs die hier een hele goede aanleiding toe was:
Er vinden in deze visualisatie een aantal zaken plaats die onjuist zijn. Om dit duidelijk te maken hebben we de afbeelding een klein beetje gedraaid en een paar lijnen ter referentie toegevoegd:
Het is ons niet helemaal duidelijk wat de cijfers precies uitdrukken. Nemen we als voorbeeld PAN dan zien we een getal van 9 en 1, wat samen 10 vormt. Kijken we naar het aantal zetels dat PAN werkelijk gewonnen heeft met deze verkiezingen dan zijn dit er 4. Ook lijkt het aan de hoge kant voor een verband met de opkomstcijfers, deze kwam over de gehele populatie uit op 54,5%. Een derde verklaring zou een verhoudingscijfer kunnen zijn in het stemgedrag. Dat het totaal niet uit komt op 100% is in dat geval te verklaren doordat partijen als CH, IL en LIVRE er niet tussen staan. Voor de verdere uitwerking van deze blog doen we de aanname dat de derde verklaring de juiste is.
Wat gaat er hier allemaal verkeerd:
- Het percentage stemmers voor PAN is, in de rechter grafiek, met 1% visueel hoger dan CDS met 3%
- BE heeft in de rechter grafiek 4% van de stemmen en heeft een hogere staaf dan CDU met 6%
- In de linker grafiek is het aandeel van PAN (9%) 3 keer zo groot als het aandeel van het CDU (3%), maar de staaf is niet 3 keer zo hoog, hierdoor lijkt de y-as niet op 0 te beginnen
- De twee grafieken lijken gemaakt te zijn om onderling te vergelijken, maar wanneer we de staven naast elkaar plaatsen klopt hier weinig van
- Wanneer de verklaring van hetgeen gevisualiseerd wordt juist is, zou een extra staaf voor “Overig” ontbreken
Wanneer we de twee grafieken aanhouden en alles in het juiste perspectief plaatsen kom je uit op de volgende weergave:
Deze grafiek leent zich echter niet goed om onderling te vergeleken worden. Om dit mogelijk te maken is het verstandiger om de twee grafieken te combineren in één grafiek. Daar kunnen we dan ook direct het aandeel “Overig” in opnemen:
Bovenstaande grafiek is eenvoudig te lezen en maakt het mogelijk om zaken onderling te vergelijken. Ook uitschieters als PS onder de mensen van 65 jaar en ouder en BE onder de mensen van 18 tot 24 jaar vallen direct op. Het geheel is rustiger te maken door geen staafgrafiek te gebruiken, maar een bullet chart (en wat hulp van Google Translate):
Hoewel bovenstaande grafiek rustiger oogt is het een minder bekend grafiektype. Hierdoor is het de vraag hoe eenvoudig mensen deze kunnen lezen. Het is dan ook maar de vraag of je deze moet gebruiken in een TV-uitzending.
Ben je enthousiast over de blogs van Datadump en wil je eenvoudig op de hoogte worden gehouden over de laatste ontwikkelingen? Volg ons dan via Twitter, LinkedIn, RSS, schrijf je in voor één van onze nieuwsbrieven, of voeg onze auteurs Joost en Dennis toe aan je netwerk.