Kategoria: Wizualizacje

  • Wykres graniowy, Tour de France i Joy Division

    Wykres graniowy, Tour de France i Joy Division

    Zupełnym przypadkiem natknąłem się dziś rano na to cudo autorstwa @sanluca.cc:  

    Fani kolarstwa prawdopodobnie zawiedzeni są raczej płaskim profilem pierwszych dziesięciu etapów. Fani Joy Division widzą tu jakąś wariację na temat okładki Unknown Pleasures, natomiast fani wizualizacji danych będą mieli lepszy dzień, bo to świetny ridgeline plot. Minimalistyczna vizka pokazuje w ciekawy sposób profile kolejnych etapów najsłynniejszego kolarskiego Touru – na osi x mamy długość etapu, a na osi y wysokość n.p.m. To, co zwraca uwagę, to nakładające się wykresy, widoczne zwłaszcza w górskich etapach. Jest to celowy zabieg, który pozwala na bezpośrednie porównanie sąsiadujących ze sobą serii. Dodatkowo warto zwrócić uwagę na bardzo sprytny zabieg, polegający na zastosowaniu wykresów powierzchniowych zamiast tradycyjnie stosowanych w tym przypadku wykresów liniowych. Dzięki temu podkreślone zostały etapy o większej amplitudzie wzniesień. Zastosowany kolor ma znaczenie czysto estetyczne dla czytelności wykresu, niemniej jednak fani kolarstwa bezbłędnie skojarzą go z żółtą koszulką lidera klasyfikacji generalnej Touru. Podobny zabieg autor zastosował w innych pracach pokazujących dane dla Giro d’Italia i Vuelta a España.  

    Trochę teorii i historii

    Z tego, co się orientuję nie istnieje oficjalna polska nazwa na tego typu wizualizację. Tłumacząc wprost z angielskiego można powiedzieć o wykresie grzbietowym, ale bardziej podoba mi się nazwa wykres graniowy i tak będę go nazywał. Wykres graniowy został narysowany po raz pierwszy w 1970 roku. Jego autorem był Harold Craft Jr., młody doktorant na uniwersytecie Cornell, który badał pulsary m.in. PSR B1919+21
    i umieścił trzy tego typu wizualizacje (w tym tę najsłynniejszą) w swojej pracy doktorskiej “Obserwacje radiowe profili impulsów i miar dyspersji dwunastu pulsarów”.

    Po kilku latach Peter Saville wykorzystał znalezioną w Encyklopedii Astronomii Uniwersytetu Cambridge grafikę, delikatnie zmodyfikował, a następnie umieścił na okładce debiutanckiego album Joy Division – Unknown Pleasures.  

    Praca Saville’a zyskała w wielu kręgach status kultowej, co zaowocowało propozycją by tego typu wizualizację nazywać “joy plot”. Propozycję tę w 2017 roku wysunęła na platformie X (niegdyś Twitter) Jenny Bryan, doskonale znana ze swojej pracy w języku R. Nazwa ta wciąż funkcjonuje w obiegu, jednak ze względu na co najmniej kontrowersyjną etymologię nazwy zespołu, jest coraz rzadziej stosowana.  

    Zastosowanie

    Ciężko wskazać jeden obszar, w którym użycie wykresów graniowych jest standardem. W galerii (poniżej) pokażę przykłady z różnych dziedzin, niekoniecznie ze sobą związanych. Jeżeli miałbym jednak coś wyróżnić, to mam wrażenie, że ridgeline jest często spotykany w przypadku danych klimatycznych/meteorologicznych. Być może wynika to z faktu bardzo widocznego trendu ocieplania planety, ale może to być też efekt dostępności danych z bardzo długiego okresu, a wykres graniowy dobrze sobie radzi przy wielu seriach.

    Odmiennym tematem jest zastosowanie ridgeline plotów w kartografii. Traktując oś x wykresu jako długość, a oś y jako szerokość geograficzną, można łatwo pokazać różne zjawiska geograficzne za pomocą „wysokości” linii. Przy odpowiednim zagęszczeniu serii można uzyskać ciekawe efekty, wiernie oddające stan faktyczny, np. rzeźbę terenu zatoki San Francisco jak poniżej.

    To zależy

    Czy warto zatem używać wykresów graniowych? Odpowiedź jest oczywista.

    via GIPHY

     Z plusów trzeba podkreślić bardzo atrakcyjną formę tej wizualizacji – górskie szczyty prawdopodobnie lepiej przemawiają do wyobraźni nawet tych, którzy nie przepadają za turystyką górską. Bliskość, czy też nakładanie się poszczególnych serii pomaga w porównaniu wartości. Co rzadkie, wykres znakomicie sprawdza się w przypadku licznych serii. Tak jak w przypadku zwykłych wykresów liniowych możemy uzyskać efekt spaghetti, tak wykres graniowy zyskuje na estetyce i może okazać się przydatny nawet dla kilkunastu serii.  W nieco bardziej abstrakcyjnym ujęciu można napisać, że wykres graniowy sprawdza się przy pokazaniu zmiany rozkładu w miejscu i czasie.

    Ridgeline plot ma też oczywiście swoje wady. Przede wszystkim nie wszystkie zestawy danych dobrze wyglądają na tego typu wykresie. Zbyt dużo albo zbyt mało serii może wpływać na czytelność i jakość prezentowanych danych. 

    Podsumowując

    Wykres graniowy dobrze sprawdzi się w przypadku danych, dla których porównujemy wartości dla kilku-kilkunastu serii, najlepiej o rozkładzie normalnym, z widoczną wyraźną tendencją. Ze względu na dużą atrakcyjność wizualną, będzie to dobre rozwiązanie, gdy chcemy przykuć uwagę na dłużej, pokazać pewien trend i nie skupiać się na jednostkowych wartościach.  

    Galeria

    Rozkład różnicy temperatur w stosunku do średniej z epoki przedindustrialnej

    Zdjęcie 1 z 4

    Źródła