Kaj je vizualizacija podatkov: kaj je in kaj ni. Kaj je vizualizacija, kako deluje Postavite skupni cilj za celotno ekipo

3 D-vizualizacija samozavestno zaseda vodilno mesto v ocenah najbolj obetavnih informacijskih tehnologij. Zakaj se ta segment rešitev krepi in širi svoj položaj, kaj je katalizator povpraševanja, kateri novi trendi se pojavljajo v današnjih težkih razmerah? O tem smo se pogovarjali z Sergej Astahov, vodja konzorcija Interactive Data Visualization Platform (IDVP), finalist tekmovanja "Najboljša informacijska in analitična orodja - 2016".

Kateri so gonilni dejavniki trga interaktivne vizualizacije podatkov? so danes ključni? Katere trende je mogoče prepoznati?

Gonilo povpraševanja po analitičnih orodjih je paradoksalno težka gospodarska situacija. V času krize morajo menedžerji hitro prejeti natančne, objektivne informacije o stanju poslovanja. Drugi dejavnik trga je plazovita rast obsega podatkov, ki zahteva nove pristope k delu z informacijami.

Danes obstaja potreba po tehnologijah, ki imajo sposobnost obdelave velikih količin podatkov, interaktivne infografike in imajo interaktivni vmesnik. Uporabniki so spoznali, da jim lahko vizualizacija in interakcija s podatki najbolje pomaga razumeti podatke.

Tem nalogam je namenjen edinstveni ruski razvoj Interactive Data Visualization Platform (IDVP) - tehnološke platforme za operativno vizualizacijo in analizo podatkov. To orodje za upravljanje temelji na tehnologijah funkcionalnega modeliranja za analizo situacij z uporabo prostorske 3D infografike. Platforma se uporablja za reševanje upravljavskih, ekonomskih in finančno-ekonomskih problemov.

Ko ponudniki analitike govorijo o podatkih o strankah, pogosto govorijo o težavah s podatki. Če pa vzamemo idealen primer, ko so naročnikovi podatki vzorno urejeni, kako ločiti pomembne podatke od nepomembnih, ki neposredno vplivajo na njegove poslovne procese, od nepomembnih?

Najbolj »pomembne« podatke dobimo iz sistemov, ki uporabljajo senzorje in števce, na primer v avtomatiziranih sistemih za vodenje procesov, sistemih za nadzor cevovodov, pridobivanju energije itd., ali iz sistemov, ki avtomatizirajo operativne dejavnosti - bančništvo, plačilni sistemi, logistični sistemi itd. itd., kjer je vloga človeškega dejavnika minimizirana ali pa so informacije vezane na »pravi« denar.

Pravzaprav trenutno poznamo dva načina za izboljšanje kakovosti podatkov: bodisi zmanjšati človeški dejavnik - pridobiti podatke z objektivnimi tehničnimi sredstvi ali vezati informacije za denar.

Na primer, v Centru za spremljanje zdravstvenega informacijskega sistema se razpoložljivost zdravnikov meri samodejno ob naročanju pacienta, brez človeškega faktorja.

Popolnost dodajanja sredstev v sistem se nadzoruje tudi preprosto - zdravnik ne bo mogel prejemati plače, če ni vpisan v sistem in v njem ne dela vsak dan. Medtem ko je računovodstvo obstajalo ločeno od centra za spremljanje, je bilo v ambulantah več zaposlenih, kot je naročenih terminov. Ko so bili enotni, se je vse hitro normaliziralo.

Zato je izdelava analitične rešitve nove generacije ločeno od reorganizacije nižjega sistema, praviloma tako upravljavskega kot informacijskega, praktično nesmiselna.

Kako prepoznati šibke točke v poslovnih procesih naročnika? Za generalnega direktorja je pomembno, da razume preteklost, sedanjost in napovedi razvoja svojega poslovanja, da se zaveda trenutnih kazalnikov uspešnosti in učinkovitosti. Kako se spopadate s tem?

Pri svojem delu se osredotočamo na tri glavna načela.

  1. Vau učinek- zaradi kakovosti grafike, animacije in hitrosti aplikacije delo vsaj ni dolgočasno. Vsi elementi so zasnovani za kakovosten prikaz na "velikih" zaslonih in za vodstvene delavce na mobilnih napravah ali osebnih računalnikih.
  2. Situacijska analiza- zmožnost hitre lokalizacije težave na nadzornih objektih, na primer z uporabo načela semaforja ali določene slike.
  3. Priložnost ne samo lokalizirati problem, ampak tudi razkriti vse možni razlogi njegov videz in s tem potiska k rešitvi problema.

Razvoj vsake analitične rešitve – Monitoring Center, na platformi IDVP se začne z definiranjem primera, podobno kot poslovni primer, ki vključuje različne indikatorje, ki označujejo problem, ki ga rešujejo, in naročniku pokažejo načine za njegovo rešitev.

Potem, ko je primer oblikovan in so izbrani indikatorji za rešitev problema, izumimo in razvijemo tridimenzionalne interaktivne vizualne podobe, ki tvorijo »prostor fenomena«. Poseben program je neposredno odgovoren za vizualizacijo podatkov - "3D predvajalnik", ki je sestavljen pod nadzorom platforme posebej za vsakega uporabnika.

IDVP podpira dokaj velik nabor interaktivnih analitičnih orodij. Imajo možnost skaliranja, spreminjanja položaja v prostoru za boljšo vizualno zaznavo, možnost večkratne izbire prikazanih predmetov ali vrednosti s podporo za vrtanje navzdol neposredno iz grafikona ali grafa.

Na primer, za »Center za spremljanje finančnih organizacij« smo uporabili koncept vizualnega grafičnega interaktivnega vmesnika za »oblak« posojilojemalcev, s katerim je enostavno in priročno delati. V velikosti kroglice v oblaku je kodiran podatek o višini prejetih posojil kreditojemalca, v barvi pa podatek o številu ugotovljenih težav pri kreditojemalcu. Strokovnjak lahko klikne na posojilojemalca, ki ga zanima, in si ogleda diagram njegovih finančnih odnosov z nasprotnimi strankami v različnih razdelkih, odnosih in vrstah.

Aplikacija Center za spremljanje »Inteligentno skladišče« uporablja tridimenzionalni vizualni prikaz skladišča in linijski graf z interaktivno nastavljivim merilom.

Pravzaprav gre za digitalni posnetek skladiščnega poslovanja, v katerem so na intuitiven način predstavljeni odgovori na proizvodne probleme – na primer, zakaj se v skladišču za nakladanje in razkladanje vijejo dolge vrste avtomobilov?

Kako se pristop k analizi informacij v klasičnih analitičnih orodjih razlikuje od vaše rešitve?

Kljub splošno sprejetemu pozicioniranju analitičnih sistemov je njihov uporabnik tradicionalno izurjen analitik, ki vrti »kocke« podatkov in v njih išče vzorce. Za analizo podatkov uporablja tabele, grafe, diagrame in drugo.

Zase smo izbrali drugega uporabnika - to je najprej vodilni direktor, lastnik podjetja, vodilni v panogi, ki je nenehno v omejeni časovni stiski. Hitrost sprejemanja vodstvenih odločitev je zanj pogosto kritična. Hkrati si sodobna zaposlena oseba vedno bolj želi zaznati informacije v obliki tridimenzionalne interaktivne infografike, ki mu omogoča, da z minimalnim časom analizira največje količine informacij, hitro dojame bistvo problema, različne trende spremembe in oceniti možna tveganja. Navajen je obstoja v tridimenzionalnem prostoru.

Zato se pri našem razvoju osredotočamo na tista področja, ki nam omogočajo, da vodjem hitro in učinkovito posredujemo stanje na kompleksnih industrijskih primerih. z velikimi količinami izvornih podatkov. Med njimi so naslednji:

Nove tehnike interaktivnega vizualnega dela z velikimi količinami operativnih in strateških informacij – tehnologija omogoča jasno zaznavo obstoječih problemov in možnih načinov njihovega reševanja preko vizualnih podob. Zaslon hkrati pregleduje številne vidike, ki zadevajo problem, lažje razume informacijske, upravljavske, finančne in ekonomske procese, vidna je njihova medsebojna povezanost in soodvisnost.

Uvedba elementov igrifikacije je nova raven uporabniške interakcije, ki naredi proces analize podatkov zanimiv, poučen in nepozaben. Skladno s tem se poveča raven in kakovost posedovanja informacij.

Uporaba novih 3D analitičnih orodij, ki se ne uporablja v tradicionalnih sistemih poslovnega obveščanja zaradi nezmožnosti pridobivanja običajnih rezultatov na platformah brskalnika, na primer diagrami poteka Sankei, diagrami odnosov mnogo proti mnogo itd.

Poglejte si primere vmesnikov naših analitičnih sistemov. Mislim, da bo brez nadaljnjega vse postalo jasno.

POSEBNI PROJEKT PODJETJAIDVP

Število virov podatkov in orodij za njihovo obdelavo, ki so danes na voljo, jasno kaže, da se še nikoli ni toliko ljudi poskušalo vživeti v svet vizualizacije podatkov. In ko je na voljo toliko materialov za študij, je samo eno vprašanje "Kje začeti?" je lahko zastrašujoče za vsakega novinca. Torej, katere knjižnice so najboljše in kaj priporočajo strokovnjaki? O tem bomo razpravljali v tem članku.

Govoriti o vizualizaciji podatkov in je ne omeniti je, kot bi govorili o zgodovini osebnih računalnikov in ne rekli niti besede o Stevu Jobsu. D3 (Data Driven Documents) je brez pretiravanja najpomembnejša in na trgu prevladujoča odprtokodna knjižnica JavaScript, ki se običajno uporablja za ustvarjanje grafike SVG. SVG (iz angleščine Scalable Vector Graphics) je format vektorske slike, ki ga podpirajo spletni brskalniki, vendar se je prej malo uporabljal.

Knjižnica D3 ima velik del svoje priljubljenosti zaradi nenadnega zanimanja za SVG med spletnimi oblikovalci, kar je v veliki meri posledica tega, kako dobro je vektorska grafika videti na zaslonih z visoko ločljivostjo (zlasti zasloni Retina, ki se uporabljajo v napravah Apple), ki postajajo vse bolj običajni.

»Bodimo iskreni, če je težava vizualizacija podatkov, ki temelji na SVG, potem je vse druge knjižnice niso niti blizu rešitve,« pravi Moritz Stefaner, neodvisni strokovnjak za vizualizacijo podatkov in lastnik podjetja Resnica in lepota. »Obstaja tudi veliko zanimivih projektov, ustvarjenih na osnovi D3, kot je NVD3, ki zagotavlja standardne grafične komponente – pripravljene za uporabo, vendar prilagodljive; ali pa recimo, da je Crossfilter preprosto izjemno orodje za filtriranje podatkov.«

Processing.js je "sestrski" projekt za Processing, ki vam omogoča vizualizacijo podatkov z uporabo spletnih standardov in odpravlja potrebo po kakršnih koli vtičnikih. »Ni vam treba poznati JavaScripta, da začnete uporabljati Processing, ker ima Processing svoj lasten programski jezik,« pojasnjuje nizozemski strokovnjak za vizualizacijo podatkov Jan Willem Tulp. Kot uporabnik preprosto napišete kodo v Processing, jo prilepite na svojo spletno stran in tiho pustite, da Processing.js poskrbi za ostalo.«

»Slaba stran je, ko začnete delati na bolj zapletenih projektih: IDE (integrirano razvojno okolje) se bo zdelo nekoliko omejeno,« nadaljuje Jan Willem Tulp.

In kljub temu inherentna preprostost Processinga, pa tudi velika uporabniška skupnost, ki je kadar koli pripravljena pomagati tistim, ki se soočajo s težavo, odpravi to pomanjkljivost in naredi Processing eno najbolj dostopnih orodij za vizualizacijo podatkov.

Medtem ko D3 in Processing nudita skupna orodja za različne vrste vizualizacije, Gephi rešuje bolj specifične probleme. Gephi je brezplačna in odprtokodna knjižnica za vizualizacijo omrežja. Toda tudi znotraj te ozke specifičnosti ponuja Gephi morje možnosti. Ne glede na to, ali želite modelirati odnose med zaposlenimi v podjetju ali podajanje žog med nogometno igro, vam Gephi lahko pomaga vizualizirati te odnose.

Tako kot Processing je Gephi zelo enostaven za namestitev. Takoj po namestitvi takoj uvozite podatke, jih razvrstite in lahko začnete z vizualizacijo. »Dobljene slike je mogoče izvoziti in prilepiti v kateri koli spletni dokument, tako da jih lahko vaše občinstvo pozneje uporabi in deli v omrežjih,« pravi Benjamin Wiederkehr.

Digrafi

Digrafi je hitra in prilagodljiva odprtokodna knjižnica JavaScript, zasnovana za gradnjo interaktivnih grafov in vam omogoča analizo in interpretacijo zelo gostih nizov podatkov. Za razliko od Vege ponuja knjižnica Dygraphs nastavitve po meri, vendar ima enako prednost, saj deluje v vseh večjih brskalnikih. Poleg tega je Dygraphs izvorno interaktiven, kar pomeni, da so nekatere funkcije (kot so povečava, premikanje ali premikanje miške) privzeto prisotne, medtem ko je, recimo, »pinch-to-zoom« na mobilnih napravah samo prijeten dodatek.

Kje začeti?

Tudi s temi informacijami se lahko svet vizualizacije podatkov začetniku zdi kot temen gozd. Kaj torej svetujejo strokovnjaki?

»Prvo, kar bi predlagal, je, da se seznanite s čim več orodji, ki jih danes obstaja, za hitro ustvarjanje standardnih grafov,« pravi Moritz Stefaner. »Zlasti na začetku projekta je zelo pomembno, da lahko hitro ustvarite veliko grafikonov, da raziščete obseg, globino in »teksturo« podatkov. Osebno uporabljam Tableau in Gephi, poleg njiju pa tudi CartoDB, ki je nepogrešljiv pri delu z zemljevidi, v zadnjem času pa tudi odprtokodno knjižnico RAW, ki je odlična za hitro izdelavo zanimivih grafov.”

Prav tako se morate prepričati, da knjižnica, ki jo izberete, najbolj ustreza informacijam, ki jih želite prikazati.

»Pomembno je, da se že na začetku vprašate, s kakšno obliko zapisa podatkov boste delali,« pravi Scott Murray. »Naloga je vizualizirati časovno obdobje? Ali so to lahko kategorični podatki? Odgovori na takšna vprašanja lahko vplivajo na vašo odločitev. Nekatere knjižnice, kot je D3, so univerzalne in lahko delujejo z različnimi vrstami podatkov. Drugi so bolj specifični za vrste podatkov, kot sta Gephi ali Sigma.js, orodji, zasnovani za vizualizacijo omrežja. Če že od začetka veste, s čim delate, bodite premišljeni in med obstoječimi knjižnicami izberite tisto, ki najbolj ustreza vaši vrsti podatkov."

Kakšne so prednosti spletne skupnosti?

Za tiste, ki šele začenjajo z vizualizacijo podatkov, je pomembna točka pri izbiri knjižnice prisotnost lokalne skupnosti, katere člani so navdušeni nad svojim delom in so pripravljeni pomagati.

»Začetnikom bi za začetek priporočal knjižnice Processing ali D3,« pravi Jan Willem Tulp. "Oba imata veliko baz uporabnikov in solidno število primerov, iz katerih se lahko učita."

Spletna skupnost na področju vizualizacije podatkov ne ponuja le odgovorov na mnoga vprašanja, ampak tudi nazorno prikaže enega glavnih paradoksov infografike. Vsak pride v industrijo s svojim ozadjem in izkušnjami, zato se nekateri strokovnjaki za vizualizacijo podatkov lotevajo problemov z estetskega in umetniškega vidika, drugi pa se osredotočajo na statistično plat vprašanja. Statistiki odlično razumejo velike količine podatkov, vendar se morajo naučiti osnov oblikovanja. Oblikovalci vedo veliko o ustvarjanju estetsko prijetnih slik, vendar se morajo še veliko naučiti o statističnih metodah.

»V središču vsega je dogovor med strankama o vrsti vizualizacije,« pravi programer-oblikovalec.

Če pa sprejmete te funkcije, se vam bodo odprle velike priložnosti. Lahko boste naredili grafiko tipografske kakovosti (ali vsaj tako dobro, kot se začne) in vzljubili boste prilagodljivost R. Če želite, lahko napišete lastne funkcije in pakete za ustvarjanje želene grafike . Lahko pa uporabite tiste, ki so jih drugi dali na voljo v knjižnici R.

R ponuja vse osnovne funkcije risanja, ki vam v bistvu omogočajo ustvarjanje skoraj vseh predmetov, ki jih morda potrebujete. Z risarskim ogrodjem lahko rišete črte, oblike in osi, spet pa ste, tako kot pri drugih programskih rešitvah, omejeni le z vašo domišljijo. Skoraj vse vrste diagramov so na voljo z uporabo različnih paketov R.

Zakaj bi potem uporabljali kaj drugega kot R? Zakaj ne bi naredili vsega z njim? Tukaj je nekaj razlogov. R deluje na namizju, zato ni primeren za dinamične spletne strani. Shranjevanje in umeščanje diagramov in slik na spletno stran ni problem, vendar se ne izvaja samodejno. Grafiko lahko ustvarite sproti neposredno v spletu, vendar obstoječe rešitve za to na tej stopnji niso preveč robustne, zlasti v primerjavi z izdelki, specifičnimi za splet, kot je JavaScript.

R tudi ni najbolj primeren za interaktivno grafiko in animacijo. Seveda lahko to storite z R, vendar obstajajo bolj prilagodljivi, bolj elegantni načini za izvedbo podobne naloge, kot je uporaba Flash ali Processing.

Končno ste morda opazili, da so grafični objekti, predstavljeni na sl. 35 in 36, malo manjka sijaja. Takšne grafike verjetno ne boste nikoli našli v časopisih ali revijah. Oblikovanje v R lahko potisnete na določeno raven z omogočanjem različnih možnosti ali pisanjem dodatne kode, vendar sam običajno uporabljam drugačno strategijo: ustvarim osnovo grafike v R, nato pa jo uredim in izboljšam v kakšni aplikaciji za postavitev dokumentov , kot je Adobe Illustrator – o tem bomo govorili pozneje. Za analizo je surov izdelek R odličen, za predstavitve in pripovedovanje pa bi bilo bolje, da malo delate na estetiki.

Namig. Ko na internetu iščete kar koli, kar je povezano z R, iskalniki morda včasih ne upoštevajo tako kratkega imena in vrnejo sporočilo o napaki ali napačen rezultat. Zato poskusite v svoji poizvedbi navesti "r-projekt" in ne le "R". Rezultati iskanja bi morali biti ustreznejši.

Kompromisi

Učenje novega programa pomeni učenje novega jezika. Jezik, ki ga govori vaš računalnik, je jezik, sestavljen iz bitov in ima svojo logiko. Ko na primer delate z Excelom ali Tableaujem, v bistvu delate s prevajalcem. Vmesnik se z vami pogovarja v vašem jeziku in ko kliknete gumb, program prevede ukaz in nato pošlje prevod v računalnik. Nato ga računalnik izvede in namesto vas nekaj naredi, recimo ustvari graf ali obdela podatke.

Tu čas vsekakor postane velika ovira. Za učenje novega jezika je potreben čas. Za marsikoga je takšna ovira ogromna in razumem ga. Delo morate opraviti zdaj, ker je pred vami gora podatkov in ljudje komaj čakajo na rezultate. Če je tako za vas – imate eno samo nalogo obdelave podatkov in v prihodnosti ni predvidenih več takih nalog – potem je morda dejansko bolje, da se omejite na že pripravljena orodja za vizualizacijo.

Če pa želite razumeti svoje podatke in boste verjetno v prihodnosti še naprej delali na različnih projektih podatkovne znanosti, potem lahko čas, porabljen za učenje programiranja danes, povzroči prihranek časa jutri pri drugih projektih, ki bodo prav tako imeli bolj impresivne rezultate. Z vsakim novim projektom se bo vaše znanje programiranja izboljšalo in vam bo vedno lažje. Kot pri vsakem tujem jeziku tudi v njem ne začneš takoj pisati romanov. Ne, začeli boste z osnovami in nato postopoma širili svoje znanje.

Na vse to lahko pogledaš drugače. Predstavljajte si, da vas vržejo v tujo državo in ne govorite lokalnega jezika. Vendar imate prevajalca. (Poslušajte me do konca, govorim bistvo.) Če želite komunicirati z domačini, morate najprej povedati svojo misel, nato pa mora prevajalec prenesti vaše sporočilo. Kaj pa, če prevajalec ne pozna pomena besede, ki ste jo pravkar povedali, ali ne ve, katero besedo naj uporabi, da bi povedal, kar ste rekli? To besedo lahko preprosto izpusti ali pa, če je dovolj pameten, pogleda v slovar.

Program za že pripravljene vizualne rešitve je prevajalnik. Če ne ve, kako narediti nekaj, potem ste v slepi ulici ali pa boste morali poskusiti drugače. Za razliko od človeškega prevajalca se program ne more sproti učiti novih besed ali, kot v našem primeru, novih vrst grafikonov in grafov ali novih orodij za obdelavo podatkov. Dodatne funkcije so na voljo v obliki posodobitve programa, na videz katere morate počakati. Zakaj se torej jezika ne naučite sami?

Še enkrat, ne govorim vam, da se izogibajte standardnim orodjem. Sam jih ves čas uporabljam. Zaradi njih je veliko dolgočasnih nalog enostavno in hitro rešiti, kar je super. Samo ne dovolite, da vas programska oprema omejuje.

Kot boste videli v naslednjih poglavjih, vam lahko programiranje pomaga opraviti več dela v krajšem času in z manj truda, kot če bi vse delali ročno. Seveda je nekaj nalog, ki jih je bolje opraviti ročno, zlasti ko pripovedujete zgodbe s podatki. In to nas pripelje do naslednje točke, ki leži na nasprotnem koncu vizualizacijskega spektra: ilustracije.

Ilustracija

Poglejmo na področje grafičnih oblikovalcev. Če ste analitik ali imate bolj tehnično znanje, vam je to verjetno neznano področje. S kombiniranjem kode in že pripravljenih orodij za vizualizacijo lahko dosežete veliko, vendar bo grafika, ki jo dobite, skoraj vedno videti nekoliko groba - kot nekaj, kar je samodejno ustvarjeno. Morda napisi ne bodo ravno na pravem mestu ali pa bo legenda malo preobremenjena. Za analizo je tak rezultat običajno zelo primeren - veste, kaj gledate.

Ko pa izdelujete grafikon ali graf za predstavitev, poročilo ali publikacijo, ga morate na splošno izpiliti, da bodo ljudje jasno razumeli, katero zgodbo jim pripovedujete.

Na primer na sl. Slika 35 prikazuje neobdelane rezultate dela v R. Prikazuje število ogledov in komentarjev na spletnem mestu FlowingData za 100 najbolj priljubljenih objav. Objave so razvrščene po kategorijah. Svetlejša kot je zelena, več komentarjev je ustvarila določena objava in večja kot je velikost pravokotnika, več ogledov je prejela. Iz prve različice trimapa tega ne bi uganili, a ko sem pogledal številke, sem točno vedel, kaj vidim, saj sem to kodo napisal sam.

Na sl. 38 prikazuje revidirano različico istega trimapa. Imena so postavljena tako, da so vidna; Na vrh sem dodal uvodno besedilo, da bralci razumejo, kaj je to pred njimi; Rdeči del barvne legende sem v celoti odstranil, ker je nesmisel - objava z negativnim številom komentarjev. Spremenil sem tudi ozadje iz sive v belo preprosto zato, ker se mi je zdelo, da bo tako bolje.

riž. 38. Trimap, ustvarjen v R in urejen v Adobe Illustratorju

Lahko bi uredil kodo, da bi ustrezala vsem mojim potrebam, vendar je bilo veliko lažje klikniti predmet in ga povleči v Adobe Illustrator. Graf ali grafikon lahko ustvarite iz nič v ilustracijskem programu ali pa vanj uvozite grafiko, ki ste jo oblikovali v, recimo, R, in jo uredite, kot želite. V prvem primeru ste omejeni pri izbiri možnosti, saj vizualizacija ni primarna naloga te kategorije programske opreme. Za vse, kar je bolj zapleteno kot palični grafikon, boste bolje uporabili uvoz. V nasprotnem primeru boste morali veliko narediti ročno, to pa je polno napak.

Kar je super pri uporabi programov za urejanje slik, je, da imate več nadzora nad posameznimi elementi in lahko naredite vse z metodo povleci in spusti. Spremenite barvo stolpcev ali posameznega stolpca, povečajte ali zmanjšajte debelino središčnic in označite najpomembnejše značilnosti – vse z nekaj kliki.

Opcije

Programov za delo z ilustracijami je veliko, a med njimi so le redki, ki bi jih uporabljala večina ljudi, in le eden je, ki se uporablja povsod. Najverjetneje bo za vas odločilna cena. Cene se gibljejo od nič (brezplačno in odprtokodno) do nekaj sto dolarjev.

ADOBE ILLUSTRATOR

Vsaka grafika, ki temelji na statističnih podatkih in je videti narejena po meri ali se pojavi v večji publikaciji, je bila najverjetneje na neki stopnji obdelana v programu Adobe Illustrator. Ta program je industrijski standard. Vsaka grafika, ki se pojavi na straneh New York Timesa, je bila ustvarjena ali urejena v Illustratorju.

Priljubljenost Illustratorja v tipografiji je posledica dejstva, da v tem programu delate z vektorji, ne s piksli. To pomeni, da lahko ustvarite veliko grafiko brez ogrožanja kakovosti slike. Primer nasprotnega je, ko morate povečati fotografijo z nizko ločljivostjo in na koncu dobite sliko, razdeljeno na barvne kvadratne slikovne pike.

Ta program je bil prvotno razvit za oblikovanje pisav, kasneje pa je postal priljubljen med ilustratorji kot orodje za ustvarjanje logotipov in umetniške grafike. In točno to je tisto, kar Adobe Illustrator večinoma uporablja še danes.

Vendar pa program omogoča dostop do nekaterih osnovnih funkcij vizualizacije podatkov prek orodja Graph. Z njim lahko ustvarite skoraj vse osnovne vrste grafikonov in grafov, kot so histogrami, tortni grafikoni in grafikoni časovnih vrst. Številke morate vnesti v majhno tabelo, vendar je to približno vse, kar lahko naredi manipulacija s podatki.

Najboljša stvar pri Illustratorju, ko gre za informacijsko grafiko, je, da je prilagodljiv in enostaven za uporabo, z veliko gumbi in funkcionalnostjo. Sprva vas bo njihova številčnost morda nekoliko zmedla, vendar se jih lahko hitro navadite, o čemer se boste prepričali ob branju četrtega poglavja (“Vizualizacija vzorcev skozi čas”). Ta prilagodljivost omogoča najboljšim oblikovalcem informacijske grafike, da ustvarijo objekte, ki so jedrnati in razumljivi.

Illustrator je na voljo v različicah za Windows in Mac. Vendar ima ta program tudi eno pomanjkljivost: ni poceni. Cena se začne zdeti še posebej visoka, ko pomislite, koliko lahko naredite s kodo, ki je na splošno brezplačna (pod pogojem, da že imate stroj, na katerega jo lahko prenesete). Če pa primerjate ceno tega programa z drugimi že pripravljenimi rešitvami, se Illustrator ne bo zdel tako drag.

V času pisanja najnovejša različica Illustratorja stane 599 USD na Adobejevem spletnem mestu, drugje pa lahko dobite znatne popuste (ali dobite starejšo različico). Poleg tega Adobe nudi znatne popuste študentom in drugim članom znanstvene skupnosti, tako da boste morda lahko dobili program za bistveno manj. (To je najdražji program, kar sem jih kdaj kupil, vendar ga uporabljam skoraj vsak dan.)

INKSCAPE

Inkscape je brezplačna (odprtokodna) alternativa Adobe Illustratorju. Če se želite izogniti stroškom, potem je Inkscape vaša najboljša izbira. Vedno uporabljam Illustrator, ker so ga, ko sem se prvič začel učiti o zapletenosti informacijske grafike, uporabljali vsi, in zdelo se mi je, da je to najpametnejša stvar. Vendar sem slišal dobre stvari o Inkscapeu in ker je brezplačen, ni škode, če ga poskusite. Samo ne pričakujte, da boste našli toliko spletnih vadnic o tej temi, kot je za Illustrator.

DRUGO

Illustrator in Inkscape zagotovo nista edina programa, ki ju lahko uporabite za ustvarjanje in poliranje grafikonov in grafov. Samo večina jih uporablja. Obstajajo pa tudi strokovnjaki, ki imajo raje Corel Draw. Ta program obstaja samo v različici za Windows in stane približno enako kot Illustrator. Lahko ga najdete malo ceneje, če veste, kje iskati.

Obstajajo tudi drugi programi, kot sta Aviary's Raven in Lineform, vendar ponujajo manjši nabor orodij. Ne pozabite, da sta Illustrator in Inkscape glavni orodji grafičnih oblikovalcev in imata najbogatejšo funkcionalnost. Če pa želite samo nekoliko prilagoditi nekaj obstoječih diagramov, potem lahko izberete enostavnejšo (cenejšo) programsko opremo.

Kompromisi

Programa, kot sta Illustrator in Inkscape, sta zasnovana samo za eno stvar: ilustracijo. Niso zasnovani posebej za razvoj informacijske grafike. Njihov glavni fokus je grafično oblikovanje, zato marsikdo ne izkoristi vseh funkcionalnosti, ki jih ponujata Illustrator in Inkscape. Oba tudi nista najbolj primerna za upravljanje velikih količin podatkov in se ne primerjata dobro s programi, ki jih napišete sami za posebne namene, ali z drugimi orodji, ki so posebej zasnovana za vizualizacijo podatkov. Z drugimi besedami, grafični urejevalniki so bistveni, če želite narediti grafiko, ki je dovolj visoka za objavo. Ne pripomorejo le k estetiki, ampak tudi naredijo objekt bolj berljiv in razumljiv, kar je pogosto težko doseči pri delu s samodejno ustvarjenimi rezultati.

Kartiranje

Zmogljivosti orodij za preslikavo delno sovpadajo z zmogljivostmi orodij za vizualizacijo, ki smo jih obravnavali zgoraj. Vendar se je v zadnjih letih količina geografskih podatkov močno povečala, s tem pa se je povečalo tudi število načinov izdelave zemljevidov. Storitve mobilnega določanja položaja so v porastu, z vedno večjimi nabori podatkov z zemljepisno širino in dolžino. Poleg tega so zemljevidi neverjetno intuitiven način za vizualizacijo podatkov in si jih je vredno podrobneje ogledati. V prvih letih spleta ustvarjanje zemljevidov ni bilo enostavno. In rezultat ni bil eleganten. Se spomnite dni, ko ste morali iti v MapQuest, slediti kopici navodil in na koncu dobili majhen, statični zemljevid? V nekem trenutku je Yahoo imel takšno storitev. To je trajalo, dokler Google ni implementiral principa premikajočega se zemljevida (slika 39). Čeprav je bila tehnologija izumljena prej, ni prišla v uporabo, dokler se internetne hitrosti večine ljudi niso dovolj povečale, da zagotavljajo neprekinjeno posodabljanje podatkov. Danes smo premikajočih se zemljevidov že vajeni. Z lahkoto se lahko pomikamo po njih in jih povečamo, v nekaterih primerih pa potrebujemo zemljevide za več kot le določanje smeri potovanja - postanejo glavni vmesnik za ogled nabora podatkov.

riž. 39. Navodila lahko dobite tudi na Google Maps

Opomba: Gibljivi zemljevidi so princip za implementacijo kartografskih podatkov, ki je danes postal skoraj univerzalen. Velike karte, ki sicer ne bi prišle na zaslon, so razdeljene na manjše slike (ali ploščice). Vidiš samo tiste ploščice, ki ti padejo na okno, vse ostale pa so skrite. Vendar pa takoj, ko z miško povlečete zemljevid, se prikažejo druge ploščice in tako se zdi, da se premikate po enem velikem zemljevidu. Podoben princip prikaza bi lahko videli tudi pri ogledu fotografij visoke ločljivosti.

Opcije

Ker postajajo geografski podatki vse bolj dostopni v javni domeni, so na voljo nova in bolj raznolika orodja za izdelavo zemljevidov z uporabo teh podatkov. Pri nekaterih od njih je potrebno le malo znanja programiranja, da lahko z njihovo pomočjo nekaj ustvarimo in poženemo. Delo z drugimi orodji zahteva nekoliko večji vložek dela in časa, obstajajo pa tudi rešitve, ki ne zahtevajo znanja programiranja.

GOOGLE, YAHOO IN MICROSOFT MAPS

To je najenostavnejša spletna rešitev, ki pa zahteva tudi vsaj malo znanja programiranja. Boljši kot ste pri kodiranju, več lahko dosežete z API-ji zemljevidov, ki jih ponujajo Google, Yahoo in Microsoft.

Osnovna funkcionalnost je v vseh treh primerih precej podobna, a če šele delate prve korake na tem področju, priporočam, da začnete z Googlom. Mislim, da je to najbolj zanesljiva možnost. Google ima API-je za ustvarjanje zemljevidov v JavaScriptu in Flashu ter druge storitve, povezane z zemljepisom, kot so geokodiranje in navodila. Oglejte si vadnico, da začnete uporabljati sistem, nato pa se poglobite v druge teme, kot so označevanje, iskanje optimalnih poti in dodajanje slojev. Izčrpna navodila z izrezki kode in najboljšimi praksami vam bodo omogočila, da hitro začnete delovati.

riž. 40. Označevanje na Google Zemljevidih

Yahoo ima tudi API za ustvarjanje zemljevidov z uporabo JavaScripta in Flasha ter nekaj geografskih storitev, vendar nisem prepričan, kako dolgo bodo na voljo glede na trenutno stanje podjetja. V času pisanja te knjige je Yahoo svojo pozornost preusmeril z razvoja aplikacij na dostavo vsebine. Microsoft ponuja tudi API za JavaScript (imenovan Bing) in drugega za Silverlight, platformo, ki jo je razvil kot odgovor na Flash.

Zgoraj omenjene spletne storitve za izdelavo zemljevidov so precej preproste glede na to, kaj lahko storijo. Če morate ustvariti bolj zapletene zemljevide, boste najverjetneje morali implementirati funkcionalnost sami. Obstaja pa tudi ArcGIS, ki je bil razvit kot namizna aplikacija za izdelavo zemljevidov. To je zajeten program, ki vam omogoča, da premaknete ogromno količino podatkov na kartico in naredite veliko stvari, kot sta glajenje in obdelava. Vse to lahko storite prek uporabniškega vmesnika, tako da vam ni treba pisati kode.

Skoraj vse grafične storitve in oddelki, ki zaposlujejo strokovnjake za zemljevide, uporabljajo ArcGIS. Nekateri ljudje so nori nanjo. Torej, če vas zanima ustvarjanje podrobnih zemljevidov, si boste morda želeli ogledati ArcGIS.

ArcGIS sem uporabil pri več projektih, ker raje izberem "programsko" pot in preprosto nisem potreboval vseh teh funkcij. Tako bogat nabor orodij ima tudi slabo stran: ukvarjati se morate z enako velikim številom gumbov in menijev. Na voljo so tudi spletne in strežniške rešitve, vendar se v primerjavi z drugimi rešitvami zdijo nekoliko okorne.

SKROMNI ZEMLJEVIDI

Zgoraj sem že omenil skromne zemljevide, ko sem dal primer, prikazan na sl. 29. Prikazal je rast Walmarta. Modest Maps je knjižnica Flash in ActionScript za zemljevide na podlagi ploščic in je združljiva tudi s Pythonom. Knjižnico vzdržuje skupina ljudi, ki razume spletno kartiranje in opravlja odlično delo tako za svoje stranke kot za lastno veselje, kar veliko pove o kakovosti knjižnice.

Smešno je, da je Modest Maps bolj okvir kot API za ustvarjanje zemljevidov, kot jih ponuja Google. Zagotavlja absolutni minimum, kar je potrebno za ustvarjanje spletnega zemljevida, nato pa ne moti vašega dela in vam daje možnost, da izvedete, kar želite. Uporabite lahko ploščice različnih ponudnikov ali pa zemljevid prilagodite svoji aplikaciji. Na primer na sl. 29 prikazuje kartico v modri in črni izvedbi, vendar jo lahko preprosto spremenite v belo in rdečo, kot je prikazano na sl. 41.

riž. 41. Zemljevid v beli in rdeči barvi z uporabo Modest Maps

Modest Maps se distribuira pod licenco BSD, tako da lahko z njimi počnete, kar želite, popolnoma brezplačno. Res je, da se boste za to morali naučiti delati s Flashom in ActionScriptom, vendar bomo o njih govorili v osmem poglavju ("Vizualizacija prostorskih odnosov").

POLIMAPI

Polymaps je neke vrste JavaScript različica knjižnice Modest Maps. Razvili in vzdrževali so ga nekateri isti ljudje in ponuja skoraj enake funkcije, vendar še veliko več. Modest Maps ponuja samo osnovno funkcionalnost izdelave zemljevidov, medtem ko ima Polymaps vgrajene funkcije, kot so kartogrami (slika 42) in mehurčki.

riž. 42. Kartogram, ki prikazuje stopnjo brezposelnosti, implementiran v Polymaps

Ker je vse v JavaScriptu, je objekt lažji (saj zahteva manj vrstic kode) in deluje v sodobnih brskalnikih. Polymaps za prikaz podatkov uporablja razširljivo vektorsko grafiko (SVG) in zato ne deluje v starejših različicah Internet Explorerja, čeprav je večina ljudi v koraku s časom. Mimogrede, samo 5% obiskovalcev spletnega mesta FlowingData uporablja zastarele spletne brskalnike in predvidevam, da bo ta številka kmalu padla na nič.

Osebno pri knjižnicah za ustvarjanje zemljevidov v JavaScriptu najbolj cenim to, da se koda brez težav izvaja v brskalnikih. Ničesar vam ni treba storiti – nobenega prevajanja, nobenega izvoza Flash. Posledično je vse enostavno zagnati in posodobiti.

V svoji osnovni distribuciji R nima funkcije preslikave, vendar obstaja več paketov, ki omogočajo preslikavo tudi v R. Na sl. Slika 43 prikazuje majhen zemljevid, ki sem ga naredil v R. Opombe so bile dodane pozneje, v Adobe Illustratorju.

riž. 43. Zemljevid ZDA, ustvarjen v R

Zemljevidi, izdelani v R, imajo omejene zmogljivosti in dokumentacija ni dobra, zato ta način ustvarjanja zemljevidov uporabljam le, če moram narediti nekaj preprostega in slučajno trenutno delam v R. V drugih primerih se raje zatečem na orodja, ki sem jih že omenil zgoraj.

SPLETNE REŠITVE

Obstaja tudi več rešitev za spletne zemljevide, ki olajšajo vizualizacijo geografskih podatkov. V večini primerov vzamejo kartice, ki jih ljudje najpogosteje uporabljajo, in z njih odstranijo vse nepotrebne stvari. Izkazalo se je nekaj podobnega poenostavljenemu ArcGIS. Dva od teh virov sta prosto dostopna. To sta Many Eyes in GeoCommons. Prvi od njih - o njem smo govorili zgoraj - ima le osnovno funkcionalnost za delo s podatki o državah ali zveznih državah ZDA. Toda GeoCommons ponuja večjo funkcionalnost in bogatejša orodja za interakcijo. GeoCommons podpira tudi najpogostejše formate datotek zemljevidnih podatkov, kot so datoteke oblike in KML.

Obstaja tudi veliko plačljivih rešitev, med katerimi sta najbolj uporabni Indiemapper in SpatialKey. SpatialKey je bolj primeren za podjetja in odločanje, medtem ko je Indiemapper odličen za kartografe in oblikovalce. Na sl. Slika 44 prikazuje primer kartograma, ki sem ga sestavil v Indiemapperju v samo nekaj minutah.

riž. 44. Kartogram, ustvarjen v Indiemapperju

Kompromisi

Programi za kartiranje so na voljo v številnih različnih vrstah in so zasnovani za zadovoljevanje različnih potreb. Odlično bi bilo obvladati en sam program in lahko ustvariti vse vrste zemljevidov, ki si jih lahko zamislite. Na žalost tako ne bo šlo.

ArcGIS ima na primer veliko funkcij, vendar morda ne boste želeli porabiti časa, da bi se ga naučili, ali denarja, da bi ga kupili, če morate ustvariti samo preproste zemljevide. Nasprotno, brezplačni R s svojo osnovno funkcionalnostjo je morda preveč preprost za to, kar želite početi. Če so vaš cilj interaktivni spletni zemljevidi, vam morda ustrezajo Modest Maps in Polymaps, vendar boste takrat potrebovali resnejše znanje programiranja.

Raziščite svoje možnosti

Ta seznam orodij nikakor ne izčrpa vseh možnosti, ki jih lahko uporabite za vizualizacijo podatkov, a na začetku bi vam moralo zadostovati. Veliko je za razmišljati in veliko se igrati. Katera orodja boste na koncu uporabili, je v veliki meri odvisno od tega, kaj želite doseči, in vedno obstaja več pristopov za dokončanje naloge, tudi v enem samem programu. Želite ustvariti grafikon s statičnimi informacijami? Mogoče bi moral ostati pri R ali Illustratorju. Želite zgraditi interaktivno orodje za svojo spletno aplikacijo? Nato poskusite JavaScript ali Flash.

Na spletnem mestu FlowingData sem izvedel anketo, s katero sem poskušal ugotoviti, kaj ljudje predvsem uporabljajo za analizo in vizualizacijo podatkov. Odzvalo se je nekaj več kot 1000 ljudi. Rezultati so predstavljeni na sl. 45.

riž. 45. Kaj bralniki FlowingData uporabljajo za analizo in vizualizacijo podatkov

Med odgovori je več očitnih voditeljev, zlasti glede na temo FlowingData. Na prvem mestu je Excel, sledi mu R. In potem pride do razhajanja v mnenjih in preferencah pri izbiri programske opreme. Več kot 200 ljudi je izbralo kategorijo »Drugo«. Številni komentatorji so izjavili, da združujejo orodja za zadovoljevanje različnih potreb – kar je običajno dolgoročno najučinkovitejši pristop.

Možnosti kombiniranja

Mnogi ljudje radi delajo samo z enim programom - to je enostavno in priročno. Ni se treba učiti ničesar novega. Če je to dovolj za zadovoljitev vaših potreb po vizualizaciji, potem od tega načela ni treba odstopati. Toda po tem, ko ste dovolj dolgo delali s podatki, boste prišli do točke, ko boste ugotovili, da so bile zmogljivosti programske opreme izčrpane. Vedeli boste, kaj morate storiti s podatki ali kako jih vizualizirati, vendar vam program tega ne dovoli ali pa bo postopek bolj zamudil, kot bi moral biti.

Lahko se sprijaznite s to situacijo ali pa začnete uporabljati druge programe, ki vam bodo vzeli čas za učenje, vendar vam bodo pomagali uresničiti vašo oblikovalsko vizijo. Predlagam, da izberete drugo pot. Obvladovanje različnih orodij zagotavlja, da ne boste preobremenjeni s podatki in da imate prilagodljivost za obvladovanje različnih vizualnih nalog in doseganje resničnih rezultatov.

Zavijanje

Ne pozabite: nobeno od teh orodij ni zdravilo. Navsezadnje bosta analiza podatkov in oblikovanje vedno odvisna od vas. Navsezadnje so orodja le orodja. Samo zato, ker imaš kladivo, še ne pomeni, da lahko zgradiš hišo. Prav tako lahko imate na voljo odličen program in superračunalnik, a če teh orodij ne znate uporabljati, jih nimate. Vi se odločite, katera vprašanja boste zastavili, katere podatke boste uporabili in katere vidike boste izpostavili, razumevanje tega pa pride z izkušnjami.

Ampak imaš srečo! Konec koncev je temu namenjen preostanek knjige. V naslednjih poglavjih se boste seznanili z osnovnimi koncepti informacijskega oblikovanja in se naučili, kako prenesti teorijo v prakso z uporabo neke kombinacije orodij, o katerih smo govorili zgoraj. Naučili se boste, kaj iskati v podatkih, ki jih imate, in kako te podatke vizualizirati.

Streamgraph je vrsta zloženega ploščinskega grafikona, ki je zamaknjen okoli osrednje osi, kar ima za posledico čudovite, tekoče oblike (zlasti pri delu z velikimi nabori podatkov). Razvil Lee Byron leta 2008. Generator lahko prenesete z GitHub. Opomba vozni pas

Danes področje vizualizacije raziskuje metode za pretvorbo podatkov v vizualne slike za boljše razumevanje informacij. Ena najpogostejših vizualnih predstavitev, črtni grafikon, se uporablja že več kot tisoč let. Orodja, kot so palični grafikon, tortni grafikon, raztreseni grafikon in histogram, so bila izumljena pred več kot dvema stoletjema.

Od takrat je minilo veliko časa in napredek ni miroval. Dandanes imajo uporabniki na voljo na desetine programov, ki jim omogočajo vizualizacijo podatkov. Hkrati se je vizualizacija že dolgo »preselila« v tridimenzionalni prostor: znanstveniki jo uporabljajo za vizualno predstavitev rezultatov raziskav, meteorologi sestavljajo vremenske karte, menedžerji uporabljajo 3D modele podatkov za sprejemanje hitrih in učinkovitih upravljavskih odločitev.

Toda ali se bo razvoj vizualizacijskih tehnologij tu ustavil? Seveda ne. Kaj nam prinaša prihodnost? Odgovor na to vprašanje lahko najdemo s sledenjem zgodovini vizualizacije, saj ne pravijo zaman: "Brez znanja o preteklosti ni prihodnosti."

Kratek izlet v zgodovino

Ker smo že pri vizualizaciji, predstavimo njeno zgodovino v vizualni obliki – takole jo je upodobil Michael Friendly, avtor knjige Handbook of Data Visualization:

Pred 17. stoletjem – zgodnji zemljevidi in karte

Prvi zametek vizualizacije se je začel v geometrijskih diagramih, tabelah položajev zvezd, ilustracijah delov telesa in navigacijskih kartah.

Med zgodnjimi prikazi kvantitativnih informacij je graf gibanja zvezdnih teles, ki prikazuje gibanje planetov v dvodimenzionalnem koordinatnem sistemu. Ta grafikon dobro prikazuje to obdobje:

1600-1699 – Meritve in teorije

V 17. stoletju je znanstvenike zanimalo, kako izmeriti čas, razdaljo in prostor. Glavni poudarek je bil na zemljevidih ​​in navigaciji.

V tem obdobju se je pojavil koordinatni sistem, rodila se je teorija vernosti in demografska statistika.

Ilustracijo tega časa lahko najdemo v delu Christopherja Scheinerja iz leta 1630. Kasneje je Edward Tufte zanj uporabil izraz "majhni sklopi", kar je pomenilo večkratno ponavljanje enega elementa, da bi prikazali dinamiko in spremembe, ki se dogajajo.

Ta slika prikazuje sončne pege, opažene v mesecu:

1700-1799 – Nove grafične oblike

18. stoletje je bil čas preseganja »očitnega«. Zemljevidi zdaj poskušajo prikazati ne le točko geografske lokacije, pojavljajo se konture in izolinije.

Primeri obdobja: tematski zemljevidi geoloških prelomov, ekonomski izračuni in medicinske ilustracije. Abstraktne vizualizacije so vse pogostejše. Ko se začne kopičiti več informacij o političnih in gospodarskih dogodkih, se pojavi potreba po novih vizualnih oblikah za njihov prikaz.

Spodaj je eden prvih primerov prekrivanja dodatnih podatkov na zemljevidu:

1850 – Začetek moderne grafike

V tem času so se pojavile glavne vrste grafov: tortni, palični in ploščinski grafikoni. Za izhodišče sodobne grafike velja znamenita vizualizacija kolere na ulicah Londona, ki jo je posnel John Snow:

Leta 1858 je britanska medicinska sestra in družbena aktivistka Florence Nightingale izumila prvi tortni grafikon, ki ga je uporabila v krimski vojni, da bi pokazala, da je veliko več vojakov umrlo zaradi bolezni (modra) kot na bojišču (rdeča) ali zaradi drugih vzrokov (črna). ):

1900-1950 – leta težav

Začelo se je filozofsko razmišljanje in delitev ljudi na »bolj vizualne« in »bolj tabularne«. Britanci so se imeli za bolj tabelarne. Moto Britanske akademije v tistih časih je bilo zbiranje podatkov (»nabiranje pšeničnih zrn«), a po njihovem mnenju je bila vizualizacija že iz pekarske serije.

1950 – 1975 – Renesansa

Znanstveniki in pisatelji so začeli aktivno popularizirati idejo vizualizacije. Podobna dela so izhajala dobesedno eno za drugim. Leta 1962 je John Tukey napisal knjigo The Future of Data Analysis, v kateri je ločil matematiko od statistike. In če prva ne prenaša vizualizacij, potem statistika zaradi njih dobi večji pomen in obliko.

V tem času so se pojavile prve interaktivne vizualizacije. Primer je ta vizualizacija Richarda Bakerja:

Leta 1973 je ameriški znanstvenik Herman Chernov uporabil slike obraza za vizualizacijo podatkov. Černov obrazi so prikaz večdimenzionalnih podatkov v obliki človeškega obraza in njegovih posameznih delov. Spodaj je primer odvetniške ocene 12 sodnikov na podlagi Chernovovih oseb:

1975 – danes – Interaktivna in dinamična vizualizacija visoke ločljivosti

Danes imamo širok dostop do orodij za analizo in vizualizacijo podatkov. Ključne trenutke, ki so zaznamovali dobo interaktivne in dinamične vizualizacije, lahko štejemo pojav interaktivnih sistemov, možnost interakcije z modeli (vključno s 3D) in povečanje računalniške moči skupaj s cenejšimi tehnologijami.

Seveda je pri tem ključno vlogo odigral pojav interneta in posledično dostop do velikih količin podatkov.

Osupljiv primer vizualizacije te dobe je internetna vizualizacija, ki jo je izdelal projekt Opte:

Kot lahko zlahka uganete iz imena, je vizualizacija podatkov grafična predstavitev katerega koli podatka. Hkrati sem na internetu našel veliko definicij, ki se nanašajo na vizualizacijo podatkov:

  • Grafi in diagrami,
  • Infografike in diagrami,
  • Predstavitev in analiza podatkov,
  • Interaktivno pripovedovanje zgodb,
  • Poslovna analitika in nadzorne plošče,
  • Znanstveno in medicinsko slikanje,
  • Zemljevidi in kartogrami.

Nato se vsak sam odloči, kaj razume pod vizualizacijo podatkov. Na koncu zapisa vam povem, kaj sem se odločil zase. Medtem pa si podrobneje oglejmo vsako od vrst in poiščimo njihove razlike in značilnosti.

Grafi in grafikoni

Za nas verjetno najbolj znana vrsta vizualizacije podatkov. Uporablja se za predstavitev in analizo podatkov. Lahko jih srečate pri delu, v revijah in znanstvenih poročilih. Znanje o obstoječih vrstah grafikonov in grafov običajno dobimo v šoli ali iz standardnega nabora v Excelu. Vendar le malo ljudi ve, da svet grafov in grafikonov ni omejen na pikčaste grafe, palične grafe in tortne grafe. Obstaja približno 15 dobro znanih vrst grafikonov, skupaj pa jih je več kot 60, njihovo število pa se vsak dan povečuje - ljudje si omislijo nove vrste za vizualizacijo zapletenih in nenavadnih podatkov. Vrste grafov in grafikonov si bomo podrobneje ogledali v eni od naslednjih objav.




Infografike in diagrami

Infografike so v zadnjih letih postale zelo priljubljene, čeprav obstajajo že dolgo časa. Infografika se nanaša na podatkovno novinarstvo, kjer grafi in diagrami pojasnjujejo kakršna koli dejstva o izbrani temi. Običajno so infografike statične in sestavljene iz dolgega »lista« s slikami in besedilom. Posebnost infografike je, da podaja že pripravljene zaključke, torej bralca vodijo za roko skozi izbrano temo in ga hkrati zasipajo s številkami in slikami. Pogosto se uporablja ročno narisan ali risan slog. Nekateri mediji dnevno objavljajo infografike, na primer AiF. Razcvet infografike je povzročil padec splošne ravni kakovosti infografike. Pogosto se uporablja neumestno ali »za lepoto«, čeprav seveda obstajajo čudoviti in zanimivi primeri.

Primeri infografike

Moč Napoleonove vojske med rusko kampanjo, 1869

Prebivalstvo različnih držav, 1912

10 zapovedi tipografije

Zamah s krili

Vegetarijanci v številu

Predstavitev in analiza podatkov

Eden najpogostejših načinov uporabe vizualizacije podatkov je predstavitev informacij v obliki grafikonov ali infografik. In če je s tem mislim, da je vse jasno, potem uporabo vizualizacije za analizo informacij uporabljajo predvsem poslovni analitiki in znanstveniki. Kakšna je razlika?

Pri analizi podatkov z uporabo vizualizacije se uporablja tako imenovana hitra izdelava prototipov – to je ustvarjanje velikega števila različnih vizualnih predstavitev istih podatkov. To je storjeno, da se omogoči iskanje odnosov in odvisnosti, ki so na prvi pogled skrite, ter da se zagotovi začetna ocena nabora podatkov za možnost uporabe bolj zapletenih orodij za analizo v prihodnosti. Ta pristop se imenuje Eploratorna analiza podatkov (EDA), kar lahko v ruščino prevedemo kot raziskovalna analiza podatkov. Glavna razlika od predstavitve podatkov je, da je vizualizacija tukaj lahko "groba" in grda, vendar jo naredi hitro in jo opravi ena oseba ali majhna delovna skupina. Za to se največkrat uporabljajo Excel, R ali Matlab.

EDA je eno od orodij za rudarjenje podatkov; obstajajo celo vadnice, kako to storiti

Primeri vizualizacije za EDA





Interaktivno pripovedovanje zgodb

Pripovedovanje zgodb ali skazatsievo v ruščini (zveni smešno) je predstavitev nekaterih koristnih informacij v obliki zanimive zgodbe. Iz nekega razloga se video pogosto imenuje interaktivno pripovedovanje zgodb, vendar ni, je le še ena vrsta informacijske grafike. Interaktivno pripovedovanje je zgodba, s katero lahko poslušalec sodeluje. V svojem bistvu je blizu podatkovnemu novinarstvu in infografiki, razlikuje pa se po tem, da lahko uporabnik nadzoruje prikaz informacij in poišče tiste odvisnosti, ki jih avtor ni našel. V tem smislu je blizu raziskovalni analizi podatkov, vendar se razlikuje po tem, da so podatki vnaprej obdelani in predstavljeni v obliki, primerni za analizo, obstajajo pa tudi namigi ali vnaprej napisani scenariji uporabe. Zato se interaktivnemu pripovedovanju najpogosteje reče interaktivna infografika, a da bi to postala, ni dovolj, da statični infografiki preprosto dodate pojavna okna.
Interaktivne vizualizacije se danes aktivno razvijajo. Močne primere lahko najdemo v večjih medijih ali v obliki posameznih projektov.

Primeri interaktivnega pripovedovanja zgodb (ob kliku na sliko greste na spletno stran)

Poslovna analitika in nadzorne plošče,

Vizualizacija se aktivno uporablja v poslu. Načelo »pogovarjaj se s podatki« pomaga podjetjem zaslužiti več in strankam zagotoviti boljše storitve. Za enkratno analizo se običajno uporablja Excel ali R. Vendar to ni priročno, če morate nekatere kazalnike (KPI) spremljati sproti. Za spremljanje rutinskih KPI-jev se uporabljajo nadzorne plošče – ​​zasloni, ki prikazujejo vse potrebne indikatorje na enem mestu v obliki grafov, grafikonov in tabel.

Oblikovanje učinkovitih nadzornih plošč je kompleksna in izjemna naloga. Pogosto so preobremenjeni z nepotrebnimi informacijami ali poskušajo uporabiti vse možne vrste predlog grafikonov. Pogosto je za oblikovanje dobre nadzorne plošče potrebno ustvariti nove vrste vizualizacije informacij. Tema se aktivno razvija zaradi vse večje uporabe analitike v poslovanju. Nadzorne plošče se uporabljajo tudi za osebno uporabo (sledilniki telesne pripravljenosti, analiza osebnih stroškov itd.)

Zemljevidi so ena najstarejših metod vizualizacije, ki prikazuje okoliško resničnost. Kartogram je zemljevid z informacijami, natisnjenimi v obliki barv ali drugih sredstev. Morda tukaj ne bom natančen z izrazi, naj mi kartografi oprostijo. Kartogrami se lahko uporabljajo za prikaz vseh informacij - od gostote prebivalstva do pogostosti uporabe psovk v posamezni regiji države. Uporabljajo se lahko v kateri koli vrsti vizualizacij, o katerih smo govorili prej. Izpostavil sem jih v posebnem odstavku, saj je njihova izvedba precej drugačna od drugih vrst vizualizacij (čakamo na opombo o tem).

Primeri kartogramov (pojdite na spletno stran s klikom na sliko)

Če povzamem

Izkazalo se je, da je bankovec nepričakovano velik. Mogoče je dobro, takoj vidiš, koliko je v svetu vizualizacije podatkov. Kaj razumem pod tem konceptom in o čem bo govoril ta blog?
Zame predstavljajo podatki predvsem grafi in grafikoni ter interaktivne infografike. Temu bo namenjena večina zapiskov, zanimivo se bo poglobiti tudi v zemljevide in nadzorne plošče.