Datadump - Piechart/taartgrafiek

Piechart! Really?

Leestijd: 7 minuten

Vorige maand schreef ik een blog op Datadump waarin ik een aantal grafiek beschreef. Deze grafieken toonde visueel een ander verhaal dan hoorde bij de onderliggende cijfers. Op deze blog kwamen leuke reacties waardoor ik heb besloten een soortgelijke blog te schrijven, maar dan puur over piecharts.

The good, the bad and the ugly

Het gebruik van piecharts (en donutcharts – wat ook een piechart is, maar dan met een gat erin) wordt in veel gevallen afgeraden. Dit heeft verschillende redenen, maar de twee voornaamste redenen zijn dat ze lastig te lezen zijn en dat er in veel gevallen betere alternatieven zijn. Het belangrijkste alternatief is het gebruik van de horizontale staafgrafiek:

In de praktijk wordt de piechart toch nog vaak ingezet, vooral omdat het er leuk uit ziet. Hierbij worden soms alle extra’s uit de kast getrokken om het gehalte “leuk” op te hogen. Denk hierbij aan 3D-effecten, taartpunten die eruit springen en fel kleurgebruik:

3D exploding piechart
Bron: Wikipedia

Dit heeft ertoe geleid dat er LinkedIn-groepen en blogs zijn die enkel en alleen over dit onderwerp gaan.

Uiteraard is de piechart niet altijd slecht. Er is onderzoek gedaan naar de leesbaarheid van dit grafiektype, voornamelijk om te bepalen welke eigenschappen gebruikt worden om de visualisatie te interpreteren. Hier is uit gekomen dat de cijfers in een piechart of donutchart door de meeste mensen goed te lezen zijn. Kanttekening is wel dat deze studie zich beperkte tot visualisaties bestaande uit slechts twee vlakken.

In de loop van de tijd heb ik zelf een aantal taartgrafieken verzameld die ik op diverse plekken op het internet ben tegen gekomen. Met deze blog is het tijd om deze te delen en een aantal nieuwe voorstellen te doen als alternatief.

Apple

Deze taartgrafiek van Apple is al wat ouder en stamt nog uit de tijd dat Steve Jobs nog aan het roer stond bij Apple. Apple doet er in deze visualisatie alles aan om zijn eigen marktaandeel zo groot mogelijk te laten lijken:

Bron: Engadget

Alhoewel hun aandeel kleiner is dan de groep “Other” krijg je visueel een ander verhaal te zien. Dit hebben ze bij Wired eens verder onderzocht en er blijkt wat gerommeld te zijn met de presentatie:

Bron: Wired

Zoals zichtbaar is hierboven wilde Apple zijn eigen aandeel groter laten lijken. Naar mijn idee hadden ze dit beter kunnen oplossen door een fabrikant uit de groep “Others” te halen en deze als aparte taartpunt toe te voegen. Uiteraard wordt de piechart dan nog kleurrijker. Dit voorkom je door een horizontale staafgrafiek te gebruiken:

Abortus

Waar ik bij deze grafiek moet beginnen weet ik niet. Er is zoveel mis mee:

  • Een negatief resultaat in de verzamelde cijfers (Huntsman: -1%)
  • Het negatieve resultaat dat een aandeel in de taartgrafiek heeft gekregen (er zijn in ieder geval 7 taartpunten en 7 groepen in de legenda)
  • De kleuren in de taartgrafiek die niet overeenkomen met de kleuren uit de legenda
  • De grootste taartpunt (Santorum) lijkt in de piechart iets minder dan 50% te zijn en volgens de legenda 58%
  • Het schaduw-effect aan de rand van de piechart

De belangrijkste oorzaak van deze rotzooi lijkt het negatieve resultaat:

Pie chart abortus- origineel
Bron: Math Fail

Een eenvoudige remake van deze piechart staat hieronder. Hierbij is er bewust voor gekozen om het negatieve resultaat achterwege te laten:

Deze remake zit er natuurlijk een stuk minder spectaculair uit. Het resultaat is wel een rustige grafiek die slechts één kleur bevat, geen 3D-effecten of rare schaduwen en cijfers die in een juiste verhouding tot elkaar worden getoond. Afhankelijk van de boodschap achter de grafiek had ervoor gekozen kunnen worden om één staaf er extra uit te laten springen:

Stemmen 1

De piechart wordt in de politiek veel ge-/misbruikt, zo blijkt welk uit de volgende twee grafieken. In deze eerste visualisatie is een fout gemaakt die regelmatig wordt gemaakt. Het doel van een taartgrafiek is een part-to-whole analyse. Je kunt in dat geval niet drie percentages bij elkaar optellen die bij elkaar op meer of minder dan 100% uitkomen. Dit is wel wat hier gebeurt:

Piechart stemmen - origineel
Bron: onbekend

Het resultaat is dat de groene taartpunt een percentage toont van 58%, maar minder dan 50% van de taartgrafiek inneemt. Dit komt doordat de totale grafiek een percentage van 133% beslaat. Daarnaast is er gekozen voor een onnodig 3D-effect en begint de grafiek niet om 12 uur. Ook is niet duidelijk waarom de taartpunt van “Nonwhite voters” als derde wordt getoond en niet als tweede gezien het bijbehorende percentage.

Ook hier is het gebruik van een horizontale staafgrafiek een beter alternatief:

Stemmen 2

Het doel van de volgende visualisatie is duidelijk om je op het verkeerde been te zetten:

Piechart stemmen 2 - origineel
Bron: Twitter

Bij deze piechart er bewust voor gekozen om verkeerde keuzes te maken in de presentatie. Het doel is duidelijk om de republikeinen er beter uit te laten komen dan de democraten, ondanks dat de cijfers een ander verhaal vertellen. Je wilt in zo’n situatie niet met onechte cijfers aankomen, dus gebruik je andere trucs:

  • Door het 3D-effect is het mogelijk de “voorkant” van de piechart groter te laten lijken
  • Omdat de grafiek niet om 12 uur begint wordt het blauwe vlak naar de achtergrond geduwd en komt rood juist naar voren
  • Het blauwe deel van de democraten valt weg tegen de blauwe achtergrond

Het resultaat is dat het optisch lijkt alsof het vlak van de republikeinen groter is dan die van de democraten. In werkelijkheid had de taartgrafiek er als volgt uit moeten zien ( maar nu correspondeert de grafiek niet met het doel van de visualisatie):

Uitgave

De laatste visualisatie is een donutchart. Op het eerste gezicht lijkt er niet veel mis te zijn met dit resultaat. De percentages tellen keurig op naar 100%, er is geen sprake van 3D-effecten en het is geen allegaartje van kleuren geworden. Dit laatste leidt echter tot een veel groter probleem: de kleuren verschillen zo weinig van elkaar dat de vlakken niet van elkaar te onderscheiden zijn. Was er echter gekozen voor 10 verschillende kleuren dan was het een kleurencircus geworden.

Daarnaast zijn er nog wel een aantal zaken op te merken:

  • De volgorde van de verschillende vlakken lijkt volledig willekeurig te zijn
  • De volgorde van de vlakken is anders dan de volgorde in de legenda
  • Doordat er 10 vlakken in zitten is het lastig om deze onderling te vergelijken
Piechart uitgave - origineel
Bron: Twitter

De grootste uitdaging van deze visualisatie is de vele groepen waaruit de data bestaat. Om een kleurencircus te voorkomen is het nodig om de delen direct te labellen, bijvoorbeeld met een horizontale staafgrafiek. Dit maakt het ook gemakkelijk om de verschillende staven onderling met elkaar te vergelijken:

Samenvatting

We hebben 5 piecharts gezien die, om verschillende redenen, niet de juiste cijfers visualiseren. Op basis van deze voorbeelden zijn er een aantal lessen te trekken uit:

  • Toon altijd de gehele grafiek (er is altijd wel iemand die er achter komt dat er is gerommeld)
  • Presenteer enkel positieve waardes
  • Het totaal van de taartpunten moet 100% zijn
  • Gebruik geen 3D-effecten
  • Het aantal taartpunten moet beperkt zijn

In deze blog is de horizontale staafgrafiek meestal aangereikt als oplossing. Er zijn echter ook andere varianten te gebruiken. In deze blog wordt gekeken naar andere opties zoals een lijngrafiek en de verticale staafgrafiek.

Funcharts

Het is uiteraard niet alleen kommer en kwel als het om piecharts gaat. Op het internet zijn een aantal voorbeelden te vinden van piecharts die zeer vermakelijk zijn:

Fun piechart - Sunny side of the pyramid
Bron: Reddit
Fun piechart - Mr T
Bron: Pinterest
Fun piechart - Pacman
Bron: Funnyjunk
Fun piechart - Japan
Bron: Wanelo

Dennis de Kock is BI consultant bij ProAnalytics. Dagelijks helpt hij organisaties bij het implementeren van Business Intelligence oplossingen. Daarnaast houdt hij zich bezig met zijn persoonlijke ontwikkeling en data visualisatie.

4 reacties

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *