Co je vizualizace dat: co to je a co není. Co je vizualizace, jak funguje Stanovte si společný cíl pro celý tým

3 D-vizualizace sebevědomě zaujímá vedoucí pozici v hodnocení nejslibnějších informačních technologií. Proč tento segment řešení posiluje a rozšiřuje svou pozici, co je katalyzátorem poptávky, jaké nové trendy se objevují v dnešních nelehkých podmínkách? Mluvili jsme o tom s Sergej Astakhov, vedoucí konsorcia Interactive Data Visualization Platform (IDVP), finalista soutěže „Nejlepší informační a analytické nástroje – 2016“.

Jaké jsou hnací faktory trhu interaktivní vizualizace dat? jsou dnes klíčové? Jaké trendy lze identifikovat?

Tahounem poptávky po analytických nástrojích je paradoxně obtížná ekonomická situace. Během krize potřebují manažeři rychle získat přesné a objektivní informace o stavu podniku. Dalším hnacím motorem trhu je lavinový růst objemu dat, který vyžaduje nové přístupy k práci s informacemi.

Dnes jsou potřeba technologie, které mají schopnost zpracovávat velké množství dat, interaktivní infografiku a mají interaktivní rozhraní. Uživatelé si uvědomili, že vizualizace a interakce s daty jim může nejlépe pomoci porozumět datům.

Pro tyto úkoly je určen unikátní ruský vývoj Interactive Data Visualization Platform (IDVP) - technologická platforma pro provozní vizualizaci a analýzu dat. Tento nástroj pro správu je založen na technologiích funkčního modelování pro analýzu situací pomocí prostorové 3D infografiky. Platforma slouží k řešení manažerských, ekonomických a finančně-ekonomických problémů.

Když poskytovatelé analytických služeb mluví o zákaznických datech, často mluví o problémech s daty. Vezmeme-li ale ideální případ, kdy jsou data klienta v příkladném pořádku, jak rozeznáme důležitá data od nedůležitých, která přímo ovlivňují jeho obchodní procesy od těch nedůležitých?

„Nejdůležitější“ data jsou získávána ze systémů využívajících senzory a měřiče, například v automatizovaných systémech řízení procesů, potrubních řídicích systémech, výrobě energie atd., nebo ze systémů, které automatizují provozní činnosti – bankovní, platební, logistické systémy atd. atd., kde je minimalizována role lidského faktoru nebo jsou informace vázány na „skutečné“ peníze.

V současné době známe dva způsoby, jak kvalitu dat zlepšit: buď minimalizovat lidský faktor – získávat data objektivními technickými prostředky, nebo vázat informace za peníze.

Například v Monitorovacím centru lékařského informačního systému se dostupnost lékařů měří automaticky v době, kdy se pacient objednává, bez lidského faktoru.

Úplnost přidávání zdrojů do systému je také kontrolována jednoduše - lékař nebude moci pobírat mzdu, pokud není do systému zadán a nepracuje v něm každý den. Zatímco účetní oddělení existovalo odděleně od Monitorovacího centra, na klinikách bylo více zaměstnanců, než bylo objednávek. Když byli sjednoceni, vše se rychle vrátilo do normálu.

Vytváření analytického řešení nové generace proto v izolaci od reorganizace systému nižší úrovně, zpravidla řídícího i informačního, prakticky nemá smysl.

Jak poznáte slabá místa v obchodních procesech vašeho klienta? Pro generálního ředitele je důležité rozumět minulosti, současnosti a prognózám vývoje svého podnikání, být si vědom aktuálních ukazatelů výkonnosti a efektivity. jak se s tím vypořádáte?

V naší práci se zaměřujeme na tři hlavní principy.

  1. Wow efekt- díky kvalitě grafiky, animací a rychlosti aplikace práce alespoň nenudí. Všechny prvky jsou navrženy pro kvalitní zobrazení na „velkých“ obrazovkách a pro vedoucí pracovníky na mobilních zařízeních nebo PC.
  2. Situační analýza- schopnost rychle lokalizovat problém u kontrolních objektů, např. pomocí principu semaforu nebo konkrétního obrázku.
  3. Možnost nejen lokalizovat problém, ale také vše odhalit možné důvody jeho vzhled, čímž tlačí k řešení problému.

Vývoj jakéhokoli analytického řešení - Monitorovacího centra na platformě IDVP začíná definováním případu, obdobného obchodnímu případu, který zahrnuje různé indikátory charakterizující řešený problém a ukazující klientovi cesty k jeho řešení.

Poté, když se vytvoří případ a vyberou se indikátory k vyřešení problému, vymyslíme a vyvineme trojrozměrné interaktivní vizuální obrazy, které tvoří „prostor fenoménů“. Za vizualizaci dat je přímo zodpovědný speciální program – „3D přehrávač“, který je sestaven pod kontrolou platformy individuálně pro každého uživatele.

IDVP podporuje poměrně velkou sadu interaktivních analytických nástrojů. Mají schopnost škálovat, měnit polohu v prostoru pro lepší vizuální vnímání, možnost vícenásobného výběru zobrazených objektů nebo hodnot s podporou rozbalování přímo z tabulky nebo grafu.

Například pro „Centrum monitorování finančních organizací“ jsme použili koncept vizuálního grafického interaktivního rozhraní pro „cloud“ dlužníků, se kterým se snadno a pohodlně pracuje. Velikost koule v cloudu zakóduje informaci o výši přijatých půjček dlužníkem a barevně informaci o počtu zjištěných problémů s dlužníkem. Specialista může kliknout na dlužníka, o kterého má zájem, a prohlédnout si diagram jeho finančních vztahů s protistranami v různých sekcích, vztazích a typech.

Aplikace Monitorovací centrum „Inteligentní sklad“ využívá trojrozměrné vizuální znázornění skladu a spojnicový graf s interaktivně nastavitelným měřítkem.

Ve skutečnosti se jedná o digitální snímek skladového podnikání, ve kterém jsou intuitivním způsobem prezentovány odpovědi na výrobní problémy – například proč jsou ve skladu dlouhé fronty aut na nakládku a vykládku?

Jak se liší přístup k analýze informací v klasických analytických nástrojích od vašeho řešení?

Navzdory obecně uznávanému umístění analytických systémů je jejich uživatelem tradičně vyškolený analytik, který točí „kostky“ dat a hledá v nich vzory. K analýze dat používá tabulky, grafy, tabulky a další.

Vybrali jsme si pro sebe dalšího uživatele – je to především top manažer, majitel firmy, lídr v oboru, který je neustále v omezeném časovém limitu. Pro něj je rychlost rozhodování managementu často kritická. Současně moderní zaneprázdněný člověk stále více chce vnímat informace ve formě trojrozměrné interaktivní infografiky, která mu umožňuje analyzovat maximální množství informací s minimem času, rychle pochopit podstatu problému, různé trendy změn a vyhodnotit možná rizika. Je zvyklý existovat v trojrozměrném prostoru.

Proto se při vývoji zaměřujeme na ty oblasti, které nám umožňují rychle a efektivně zprostředkovat manažerům situaci na složitých oborových případech. s velkým objemem zdrojových dat. Mezi nimi jsou následující:

Nové techniky pro interaktivní vizuální práci s velkým množstvím provozních a strategických informací – technologie poskytuje jasné vnímání existujících problémů a možných způsobů jejich řešení prostřednictvím vizuálních obrazů. Obrazovka současně zkoumá mnoho aspektů ovlivňujících problém, je snazší porozumět informacím, řízení, finančním a ekonomickým procesům a jsou vidět jejich vzájemné vazby a vzájemné závislosti.

Zavedení gamifikačních prvků je nová úroveň uživatelské interakce, díky které je proces analýzy dat zajímavý, vzdělávací a zapamatovatelný. V souladu s tím se zvyšuje úroveň a kvalita držení informací.

Použití nových 3D analytických nástrojů, které se nepoužívají v tradičních systémech BI kvůli nemožnosti získat normální výsledky na platformách prohlížečů, například vývojové diagramy Sankei, diagramy vztahů many-to-many atd.

Podívejte se sami na příklady rozhraní našich analytických systémů. Myslím, že se vše vyjasní bez dalšího.

SPECIÁLNÍ PROJEKT SPOLEČNOSTIIDVP

Množství datových zdrojů a nástrojů pro jejich zpracování, které jsou dnes k dispozici, jasně ukazuje, že nikdy předtím se tolik lidí nepokoušelo zvyknout si na svět vizualizace dat. A když je k dispozici takové množství materiálů ke studiu, je jen jedna otázka "Kde začít?" může být pro každého nováčka zastrašující. Které knihovny jsou tedy nejlepší a co doporučují profesionálové? O tom bude řeč v tomto článku.

Mluvit o vizualizaci dat a nezmínit se o ní je jako mluvit o historii osobních počítačů a neříkat ani slovo o Stevu Jobsovi. D3 (Data Driven Documents) je bez nadsázky nejdůležitější a na trhu dominantní open source knihovna JavaScript, která se běžně používá pro tvorbu grafiky SVG. SVG (z anglického Scalable Vector Graphics) je zase formát vektorových obrázků podporovaný webovými prohlížeči, ale dříve málo používaný.

Knihovna D3 vděčí za svou popularitu náhlému zájmu o SVG mezi webovými designéry, což je z velké části způsobeno tím, jak dobře vektorová grafika vypadá na obrazovkách s vysokým rozlišením (zejména Retina displeje používané v zařízeních Apple), které jsou stále více a více běžný.

„Buďme upřímní, pokud je problémem vizualizace dat založená na SVG, pak všechny ostatní knihovny ani zdaleka problém nevyřeší,“ říká Moritz Stefaner, nezávislý odborník na vizualizaci dat a majitel společnosti. Pravda a krása. „Existuje také mnoho zajímavých projektů vytvořených na bázi D3, jako je NVD3, který poskytuje standardní grafické komponenty – připravené k použití, ale přizpůsobitelné; nebo řekněme, že Crossfilter je prostě vynikající nástroj pro filtrování dat.“

Processing.js je „sesterský“ projekt k Processing, který vám umožňuje vizualizovat data pomocí webových standardů a eliminuje potřebu jakýchkoli pluginů. „Abyste mohli začít se Processingem, nepotřebujete znát JavaScript, protože Processing má svůj vlastní programovací jazyk,“ vysvětluje nizozemský odborník na vizualizaci dat Jan Willem Tulp. Jako uživatel jednoduše napíšete kód do Processing, vložíte ho na svou webovou stránku a v tichosti necháte Processing.js, aby se postaral o zbytek.“

„Nevýhodou je, když začnete pracovat na složitějších projektech: IDE (Integrated Development Environment) se vám bude zdát trochu omezené,“ pokračuje Jan Willem Tulp.

A navzdory tomu neodmyslitelná jednoduchost Processing, stejně jako velká uživatelská komunita, připravená kdykoli pomoci těm, kteří se potýkají s problémem, tento nedostatek vyhladit a učinit Processing jedním z nejdostupnějších nástrojů pro vizualizaci dat.

Zatímco D3 a Processing poskytují společné nástroje pro různé typy vizualizací, Gephiřeší konkrétnější problémy. Gephi je bezplatná a otevřená knihovna pro síťovou vizualizaci. Ale i v rámci této úzké specifičnosti nabízí Gephi moře možností. Ať už chcete modelovat vztahy zaměstnanců v rámci společnosti nebo přihrávání míčů během fotbalového zápasu, Gephi vám může pomoci tyto vztahy vizualizovat.

Stejně jako Processing se Gephi instaluje velmi snadno. Ihned po instalaci data ihned naimportujete, seřadíte a můžete začít s vizualizací. „Výsledné obrázky lze exportovat a vložit do libovolného webového dokumentu, aby je vaše publikum mohlo později použít a sdílet napříč sítěmi,“ říká Benjamin Wiederkehr.

Dygraphs

Dygraphs je rychlá a flexibilní open-source JavaScriptová knihovna navržená pro vytváření interaktivních grafů a umožňující analyzovat a interpretovat velmi husté datové sady. Na rozdíl od Vega nabízí knihovna Dygraphs vlastní nastavení, ale má stejnou výhodu, že funguje ve všech hlavních prohlížečích. Kromě toho je Dygraphs nativně interaktivní, což znamená, že některé funkce (jako je přiblížení, posouvání nebo přejetí myší) jsou ve výchozím nastavení přítomny, zatímco řekněme „přiblížení sevřením“ na mobilních zařízeních je jen příjemným bonusem.

kde začít?

I s těmito informacemi může svět vizualizace dat na začátečníka působit jako temný les. Co tedy odborníci radí?

„První věc, kterou bych navrhoval, je seznámit se s tolika nástroji, jaké jsou dnes k rychlému vytváření standardních grafů,“ říká Moritz Stefaner. „Zejména na začátku projektu je velmi důležité umět rychle generovat mnoho grafů, abyste mohli prozkoumat objem, hloubku a „strukturu“ dat. Osobně používám Tableau a Gephi, ale kromě nich ještě CartoDB, který je pro práci s mapami nepostradatelný, a nově i open source knihovnu RAW, která je skvělá pro rychlé vytváření zajímavých grafů.“

Musíte se také ujistit, že zvolená knihovna nejlépe odpovídá informacím, které chcete zobrazit.

„Je důležité si od začátku položit otázku, s jakým druhem datového formátu budete pracovat,“ říká Scott Murray. „Úkolem je vizualizovat časové období? Mohou to být kategorické údaje? Odpovědi na podobné otázky mohou ovlivnit vaše rozhodnutí. Některé knihovny, jako D3, jsou univerzální a mohou pracovat s různými typy dat. Jiné jsou specifičtější pro datové typy, jako je Gephi nebo Sigma.js, nástroje určené pro vizualizaci sítě. Pokud od začátku víte, s čím pracujete, uvážlivě vyberte ze stávajících knihoven tu, která nejlépe vyhovuje vašemu datovému typu.“

Jaké jsou výhody online komunity?

Pro ty, kteří s vizualizací dat teprve začínají, je důležitým bodem při výběru knihovny přítomnost místní komunity, jejíž členové jsou zapálení pro svou práci a jsou připraveni pomoci.

„Začátečníkům bych doporučil začít s knihovnami Processing nebo D3,“ říká Jan Willem Tulp. "Oba mají velkou uživatelskou základnu a solidní počet příkladů, ze kterých se lze učit."

Online komunita v oblasti vizualizace dat poskytuje nejen odpovědi na mnoho otázek, ale také názorně demonstruje jeden z hlavních paradoxů infografiky. Každý přichází do odvětví s vlastním zázemím a zkušenostmi, takže někteří odborníci na vizualizaci dat přistupují k problémům z estetického a uměleckého hlediska, zatímco jiní se zaměřují na statistickou stránku problému. Statistici jsou skvělí v porozumění velkému množství dat, ale musí se naučit základy návrhu. Designéři vědí hodně o vytváření esteticky příjemných obrázků, ale mají se hodně co učit o statistických metodách.

„V centru všeho je dohoda mezi stranami na typu vizualizace,“ říká programátor-designér

Pokud však tyto funkce přijmete, otevřou se vám skvělé možnosti. Budete schopni vytvářet grafiku v typografické kvalitě (nebo alespoň tak dobrou, jak začíná) a zamilujete si flexibilitu R. Pokud chcete, můžete si napsat své vlastní funkce a balíčky a vytvořit grafiku, kterou chcete. . Nebo můžete použít ty, které jiní lidé zpřístupnili v knihovně R.

R poskytuje všechny základní kreslicí funkce, které v podstatě umožňují vytvořit téměř jakýkoli objekt, který byste mohli potřebovat. Pomocí kreslicího rámce můžete kreslit čáry, tvary a osy a opět, stejně jako u jiných softwarových řešení, jste omezeni pouze svou představivostí. Téměř všechny typy diagramů jsou dostupné pomocí různých R balíčků.

Tak proč používat něco jiného než R? Proč s tím neudělat všechno? Zde je několik důvodů. R běží na ploše, takže není vhodný pro dynamické webové stránky. Ukládání a umísťování diagramů a obrázků na webovou stránku není problém, ale neprobíhá to automaticky. Můžete vytvářet grafiku za běhu přímo na webu, ale stávající řešení pro to nejsou v této fázi příliš robustní, zejména ve srovnání s webovými produkty, jako je JavaScript.

R se také příliš nehodí pro interaktivní grafiku a animace. Samozřejmě to můžete udělat s R, ale existují flexibilnější a elegantnější způsoby, jak provést podobný úkol, jako je použití Flash nebo Processing.

Nakonec jste si mohli všimnout, že grafické objekty uvedené na Obr. 35 a 36, ​​trochu chybí lesk. Je nepravděpodobné, že byste někdy našli takovou grafiku v novinách nebo časopisech. Návrh v R můžete posunout na určitou úroveň povolením různých možností nebo napsáním dalšího kódu, ale já sám obvykle používám jinou strategii: vytvořím základ grafiky v R a poté jej upravím a zpřesním v nějaké aplikaci pro rozložení dokumentu. , jako je Adobe Illustrator – o tom si povíme později. Pro rozbor je raw produkt R skvělý, ale pro prezentace a vyprávění by bylo lepší trochu zapracovat na estetice.

Vodítko. Když na internetu hledáte cokoli souvisejícího s R, vyhledávače někdy nemusí brát tak krátký název v úvahu a vrátí chybovou zprávu nebo nesprávný výsledek. Zkuste tedy ve svém dotazu zadat "r-project" spíše než jen "R". Výsledky vyhledávání by měly být relevantnější.

Kompromisy

Naučit se nový program znamená naučit se nový jazyk. Jazyk, kterým váš počítač mluví, je jazyk složený z bitů a má svou vlastní logiku. Když pracujete například s Excelem nebo Tableau, v podstatě pracujete s překladačem. Rozhraní k vám mluví vaším jazykem, a když kliknete na tlačítko, program přeloží příkaz a poté překlad odešle do počítače. Poté to počítač provede a něco za vás udělá, řekněme vytvoří graf nebo zpracuje nějaká data.

Zde se čas rozhodně stává velkou překážkou. Naučit se nový jazyk nějakou dobu trvá. Pro mnoho lidí je taková překážka zdrcující a já je dokážu pochopit. Práci musíte udělat hned, protože před vámi je hora dat a lidé se nemohou dočkat, až uvidí výsledky. Pokud je to váš případ – máte jediný úkol zpracování dat a v budoucnu se s dalšími podobnými úkoly nepočítá – pak může být ve skutečnosti lepší omezit se na hotové vizualizační nástroje.

Pokud však chcete porozumět svým datům a je pravděpodobné, že budete v budoucnu pokračovat v práci na různých projektech datové vědy, pak čas strávený učením se programování dnes může vést k ušetřenému času zítra na jiných projektech, které také budou mít působivější výsledky. S každým novým projektem se budou vaše programátorské dovednosti zlepšovat a bude to pro vás stále jednodušší. Jako v každém cizím jazyce v něm nezačnete hned psát romány. Ne, začnete se základy a pak své znalosti postupně rozšiřujete.

Na to všechno se můžete dívat jinak. Představte si, že jste uvrženi do cizí země a nemluvíte místním jazykem. Máte však překladatele. (Poslouchejte mě až do konce, mluvím k věci.) Chcete-li komunikovat s místními obyvateli, musíte nejprve vyjádřit svou myšlenku a poté musí překladatel předat vaši zprávu. Co když ale překladatel nezná význam slova, které jste právě řekli, nebo neví, které slovo použít k vyjádření toho, co jste řekli? Toto slovo může jednoduše vynechat, nebo pokud je dostatečně chytrý, nahlédnout do slovníku.

Programem pro hotová vizuální řešení je překladač. Pokud neví, jak něco udělat, pak jste ve slepé uličce nebo budete muset zkusit jinou cestu. Na rozdíl od lidského překladače se program nedokáže za běhu naučit nová slova nebo jako v našem případě nové typy tabulek a grafů nebo nové nástroje pro zpracování dat. Další funkce k němu přicházejí v podobě aktualizace programu, na jejíž vzhled si musíte počkat. Proč se tedy jazyk nenaučíte sami?

Opět vám neříkám, abyste se vyhýbali běžně dostupným nástrojům. Sám je neustále používám. Umožňují snadno a rychle vyřešit spoustu zdlouhavých úkolů, což je skvělé. Jen se nenechte softwarem omezovat.

Jak uvidíte v následujících kapitolách, programování vám může pomoci udělat více práce za kratší dobu a s menší námahou, než kdybyste vše dělali ručně. Samozřejmě existují některé úkoly, které je lepší provádět ručně, zvláště když vyprávíte příběhy s daty. A tím se dostáváme k dalšímu bodu, který leží na opačném konci spektra vizualizace: ilustrace.

Ilustrace

Pojďme se podívat do sféry grafiků. Pokud jste analytik nebo máte více technických znalostí, pravděpodobně je to pro vás neznámá oblast. Kombinací kódu a hotových vizualizačních nástrojů můžete dosáhnout hodně, ale grafika, se kterou skončíte, bude téměř vždy vypadat trochu drsně – jako něco automaticky generovaného. Možná nebudou titulky přesně na správném místě, nebo bude legenda trochu přetížená. Pro rozbor se takový výsledek většinou docela hodí – víte, na co se díváte.

Ale když vytváříte tabulku nebo graf pro prezentaci, pro zprávu nebo pro publikaci, obecně je potřebujete vypilovat, aby lidé jasně pochopili, jaký příběh jim vyprávíte.

Například na Obr. Obrázek 35 ukazuje hrubý výsledek práce v R. Ukazuje počet zobrazení a komentářů na webu FlowingData pro 100 nejpopulárnějších příspěvků. Příspěvky jsou seřazeny podle kategorií. Čím jasnější je zelená, tím více komentářů konkrétní příspěvek vygeneroval a čím větší je velikost obdélníku, tím více zobrazení získal. Z první verze trimapy byste to neuhodli, ale když jsem se podíval na čísla, věděl jsem přesně, co vidím, protože jsem tento kód napsal sám.

Na Obr. 38 ukazuje revidovanou verzi stejné trimapy. Jména jsou umístěna tak, aby byla viditelná; Na začátek jsem přidal úvodní text, aby čtenáři pochopili, co to před nimi je; Červenou část barevné legendy jsem úplně odstranil, protože je to nesmysl - příspěvek se záporným počtem komentářů. Také jsem změnil pozadí z šedé na bílé prostě proto, že se mi zdálo, že to bude lepší.

Rýže. 38. Trimap vytvořený v R a upravený v Adobe Illustrator

Mohl jsem upravit kód tak, aby vyhovoval všem mým potřebám, ale bylo mnohem jednodušší kliknout na objekt a přetáhnout jej do Adobe Illustratoru. Můžete vytvořit graf nebo tabulku od začátku v ilustračním programu, nebo můžete do něj importovat grafiku, kterou jste navrhli, řekněme v R, a upravit ji tak, jak chcete. V prvním případě jste omezeni ve výběru možností, protože vizualizace není primárním úkolem této kategorie softwaru. Pro cokoli složitějšího, než je sloupcový graf, bude lepší použít importy. V opačném případě budete muset hodně dělat ručně a to je plné chyb.

Na používání programů pro úpravu obrázků je skvělé, že máte větší kontrolu nad jednotlivými prvky a vše můžete provádět metodou drag and drop. Změňte barvu sloupců nebo jednoho sloupce, zvětšete nebo zmenšete tloušťku středových čar a označte nejdůležitější vlastnosti – to vše pomocí několika kliknutí.

Možnosti

Programů pro práci s ilustracemi je mnoho, ale mezi nimi je jen pár takových, které by využila většina lidí, a všude je jen jeden. S největší pravděpodobností pro vás bude rozhodující cena. Ceny se pohybují od ničeho (zdarma a open source) až po několik stovek dolarů.

ADOBE ILUSTRATOR

Jakákoli grafika založená na statistických datech, která vypadá jako zakázková nebo se vyskytuje ve velké publikaci, byla s největší pravděpodobností v určité fázi zpracována v aplikaci Adobe Illustrator. Tento program je průmyslovým standardem. Každá grafika, která se objeví na stránkách New York Times, byla vytvořena nebo upravena v Illustratoru.

Popularita Illustratoru v typografii je dána tím, že v tomto programu pracujete s vektory, nikoli s pixely. To znamená, že můžete vytvářet velkou grafiku, aniž byste snížili kvalitu obrazu. Příkladem opaku je situace, kdy musíte zvětšit fotografii s nízkým rozlišením a skončíte s obrázkem rozděleným na barevné čtvercové pixely.

Tento program byl původně vyvinut pro navrhování písem, ale později si získal oblibu mezi ilustrátory jako nástroj pro tvorbu log a umělecké grafiky. A právě k tomu se Adobe Illustrator používá hlavně dodnes.

Program však poskytuje přístup k některým základním funkcím vizualizace dat prostřednictvím nástroje Graph. S ním můžete vytvářet téměř všechny základní typy grafů a grafů, jako jsou histogramy, koláčové grafy a grafy časových řad.Čísla je potřeba zadávat do malé tabulky, ale to je asi tak všechno, co manipulace s daty dokáže.

Nejlepší na Illustratoru, pokud jde o informační grafiku, je to, že je flexibilní a snadno se používá, se spoustou tlačítek a funkcí. Zpočátku vás jejich hojnost může trochu mást, ale dá se na ně rychle zvyknout, jak sami uvidíte při přečtení čtvrté kapitoly („Vizualizace vzorů v průběhu času“). Právě tato flexibilita umožňuje nejlepším návrhářům informační grafiky vytvářet objekty, které jsou stručné a srozumitelné.

Illustrator je k dispozici ve verzi pro Windows i Mac. Tento program má však i jednu nevýhodu: není levný. Cena se začíná zdát obzvláště vysoká, když si pomyslíte, kolik toho můžete udělat s kódem, který je obecně zdarma (za předpokladu, že již máte stroj, na který si jej můžete stáhnout). Pokud však porovnáte cenu tohoto programu s jinými hotovými řešeními, nebude vám Illustrator připadat tak drahý.

V době psaní tohoto článku stojí nejnovější verze Illustratoru na webu Adobe 599 dolarů a jinde můžete získat výrazné slevy (nebo si pořídit starší verzi). Společnost Adobe navíc nabízí výrazné slevy studentům a dalším členům vědecké komunity, takže se vám může stát, že budete moci získat program výrazně levněji. (Toto je nejdražší program, jaký jsem kdy koupil, ale používám ho téměř denně.)

INKSCAPE

Inkscape je bezplatná (open source) alternativa k Adobe Illustratoru. Pokud se chcete vyhnout nákladům, pak je Inkscape vaší nejlepší volbou. Illustrator používám vždy, protože když jsem se poprvé začal učit složitosti informační grafiky, všichni ho používali a zdálo se mi to jako nejchytřejší věc. Ale o Inkscape jsem slyšel dobré věci, a protože je zdarma, není na škodu to zkusit. Jen nečekejte, že na toto téma najdete tolik webových výukových programů jako pro Illustrator.

JINÝ

Illustrator a Inkscape jistě nejsou jediné programy, které můžete použít k vytváření a vylepšování tabulek a grafů. Jen je používá většina lidí. Jsou ale i specialisté, kteří preferují Corel Draw. Tento program existuje pouze ve verzi pro Windows a stojí přibližně stejně jako Illustrator. Můžete to najít o něco levněji, pokud víte, kde hledat.

Existují i ​​jiné programy, jako je Aviary's Raven a Lineform, ale nabízejí menší sadu nástrojů. Pamatujte, že Illustrator a Inkscape jsou hlavními nástroji grafických designérů a mají nejbohatší funkčnost. Pokud ale chcete jen mírně upravit pár stávajících diagramů, můžete zvolit jednodušší (levnější) software.

Kompromisy

Programy jako Illustrator a Inkscape jsou určeny pouze pro jednu věc: ilustraci. Nejsou určeny speciálně pro vývoj informační grafiky. Jejich hlavním zaměřením je grafický design, a proto mnoho lidí nevyužívá všech funkcí, které Illustrator a Inkscape nabízí. Oba také nejsou příliš vhodné pro správu velkého množství dat a nedají se dobře srovnávat s programy, které si sami píšete pro konkrétní účely, nebo s jinými nástroji, které jsou speciálně navrženy pro vizualizaci dat. Jinými slovy, grafické editory jsou nezbytné, pokud chcete vytvořit grafiku, která je dostatečně vysoká, aby ji bylo možné publikovat. Pomáhají nejen s estetikou, ale také dělají objekt čitelnějším a srozumitelnějším, čehož je často obtížné dosáhnout při práci s automaticky generovanými výsledky.

Mapování

Možnosti mapovacích nástrojů se částečně shodují s možnostmi vizualizačních nástrojů, o kterých jsme hovořili výše. V posledních letech však výrazně narostl objem geografických dat a s tím se zvýšil i počet způsobů, jak lze mapy vytvářet. Mobilní služby určování polohy jsou na vzestupu, se stále většími datovými soubory s připojenou zeměpisnou šířkou a délkou. Kromě toho jsou mapy neuvěřitelně intuitivním způsobem vizualizace dat a stojí za to se na ně podívat blíže. V prvních letech webu nebylo vytváření map snadné. A výsledek nebyl elegantní. Pamatujete si časy, kdy jste museli jít na MapQuest, řídit se hromadou instrukcí a skončit s malinkou, statickou mapou? V určitém okamžiku mělo Yahoo takovou službu. To trvalo, dokud Google nezavedl princip pohyblivé mapy (obr. 39). Ačkoli byla tato technologie vynalezena dříve, začala se používat až poté, co se rychlost internetu u většiny lidí zvýšila natolik, aby umožňovala nepřetržité aktualizace dat. Dnes už jsme si na pohyblivé mapy zvykli. Můžeme je snadno posouvat a přibližovat a v některých případech potřebujeme mapy pro více než pouhé určení směru jízdy – stávají se hlavním rozhraním pro prohlížení datové sady.

Rýže. 39. Pokyny můžete získat také v Mapách Google

Poznámka: Pohyblivé mapy jsou principem implementace kartografických dat, který se dnes stal téměř univerzálním. Velké karty, které by se jinak nevešly na obrazovku, jsou rozděleny na menší obrázky (nebo dlaždice). Vidíte pouze ty dlaždice, které padnou na vaše okno, a všechny ostatní jsou skryté. Jakmile však mapu přetáhnete myší, objeví se další dlaždice, a tak se zdá, že se pohybujete po jedné velké mapě. Podobný princip zobrazení jste mohli vidět i při prohlížení fotografií ve vysokém rozlišení.

Možnosti

Vzhledem k tomu, že geografická data jsou stále více dostupná ve veřejné doméně, jsou k dispozici nové a rozmanitější nástroje pro vytváření map pomocí těchto dat. V případě některých z nich stačí jen špetka programátorských dovedností, abyste s jejich pomocí mohli něco vytvořit a spustit. Práce s jinými nástroji vyžaduje o něco větší investici práce a času, ale existují i ​​řešení, která nevyžadují znalosti programování.

MAPY GOOGLE, YAHOO A MICROSOFT

Toto je nejjednodušší online řešení, ale také vyžaduje, abyste měli alespoň malé znalosti programování. Čím lepší jste v kódování, tím více můžete dosáhnout s mapovými API nabízenými společnostmi Google, Yahoo a Microsoft.

Základní funkcionalita je ve všech třech případech dost podobná, ale pokud na tomto poli teprve děláte první krůčky, doporučuji začít s Googlem. Myslím, že toto je nejspolehlivější varianta. Google má rozhraní API pro vytváření map v JavaScriptu i Flashi, stejně jako další geografické služby, jako je geokódování a trasy. Podívejte se na tutoriál, abyste mohli začít se systémem, a poté se ponořte do dalších témat, jako je značení, hledání optimálních tras a přidávání vrstev. Komplexní pokyny s úryvky kódu a doporučené postupy vám pomohou rychle začít pracovat.

Rýže. 40. Označování v Mapách Google

Yahoo má také API pro vytváření map pomocí JavaScriptu a Flashe a některé geo-služby, ale nejsem si jistý, jak dlouho budou k dispozici vzhledem k současnému stavu společnosti. V době, kdy byla tato kniha napsána, Yahoo přesunulo své zaměření z vývoje aplikací na poskytování obsahu. Microsoft také nabízí API pro JavaScript (nazývané Bing) a další pro Silverlight, platformu, kterou vyvinul jako odpověď na Flash.

Výše zmíněné online mapové služby jsou poměrně jednoduché, pokud jde o to, co umí. Pokud potřebujete vytvořit složitější mapy, budete pravděpodobně muset funkcionalitu implementovat sami. Existuje však také ArcGIS, který byl vyvinut jako desktopová aplikace pro tvorbu map. Je to výkonný program, který vám umožňuje přesunout obrovské množství dat na kartu a dělat spoustu věcí, jako je vyhlazování a zpracování. To vše můžete udělat přes uživatelské rozhraní, takže nemusíte psát žádný kód.

Téměř všechny grafické služby a oddělení, která zaměstnávají mapové profesionály, používají ArcGIS. Někteří lidé do ní šílí. Pokud vás tedy zajímá tvorba podrobných map, možná se budete chtít podívat na ArcGIS.

Použil jsem ArcGIS na několika projektech, protože preferuji jít "softwarovou" cestou a prostě jsem nepotřeboval všechny tyto funkce. Takto bohatá sada nástrojů má i nevýhodu: musíte se vypořádat se stejně velkým počtem tlačítek a nabídek. K dispozici jsou také online a serverová řešení, ale ve srovnání s jinými řešeními se zdají být trochu neohrabaná.

SKROMNÉ MAPY

Modest Maps jsem již zmínil výše, když jsem uvedl příklad znázorněný na Obr. 29. Předvedl růst Walmartu. Modest Maps je knihovna Flash a ActionScript pro mapy založené na dlaždicích a je také kompatibilní s Pythonem. Knihovnu spravuje skupina lidí, kteří rozumí online mapování a odvádějí skvělou práci jak pro své zákazníky, tak pro vlastní potěšení, což hodně vypovídá o kvalitě knihovny.

Legrační je, že Modest Maps jsou spíše frameworkem než API pro vytváření map, jaké nabízí Google. Poskytuje naprosté minimum toho, co je potřeba k vytvoření online mapy, a pak nezasahuje do vaší práce a dává vám možnost realizovat to, co chcete. Můžete použít dlaždice od různých poskytovatelů nebo si mapu přizpůsobit tak, aby vyhovovala vaší aplikaci. Například na Obr. 29 ukazuje kartu v modročerném provedení, ale můžete ji snadno změnit na bílou a červenou, jak je znázorněno na Obr. 41.

Rýže. 41. Mapa v bílém a červeném provedení pomocí Modest Maps

Modest Maps jsou distribuovány pod licencí BSD, takže si s nimi můžete dělat, co chcete, zcela zdarma. Je pravda, že se k tomu budete muset naučit pracovat s Flash a ActionScript, ale o nich budeme hovořit v osmé kapitole („Vizualizace prostorových vztahů“).

POLYMAPY

Polymaps je druh JavaScriptové verze knihovny Modest Maps. Byl vyvinut a udržován některými stejnými lidmi a nabízí mnoho ze stejných funkcí, ale mnohem více. Modest Maps poskytuje pouze základní funkce pro tvorbu map, zatímco Polymaps má vestavěné funkce, jako jsou kartogramy (obrázek 42) a bublinové grafy.

Rýže. 42. Kartogram zobrazující míru nezaměstnanosti, implementovaný v Polymaps

Vzhledem k tomu, že je to všechno JavaScript, je objekt lehčí (protože vyžaduje méně řádků kódu) a funguje v moderních prohlížečích. Polymaps používá k zobrazení dat škálovatelnou vektorovou grafiku (SVG), a proto nefunguje ve starších verzích Internet Exploreru, i když většina lidí drží krok s dobou. Mimochodem, pouze 5 % návštěvníků webu FlowingData používá zastaralé webové prohlížeče a mám podezření, že toto číslo brzy klesne na nulu.

Osobně na knihovnách pro tvorbu map v JavaScriptu nejvíce oceňuji, že kód běží v prohlížečích bez problémů. Nemusíte nic dělat – žádné kompilace, žádný export do Flash. Díky tomu lze vše snadno spustit a snadno aktualizovat.

Ve své základní distribuci R nemá funkcionalitu mapování, ale existuje několik balíčků, které vám umožňují provádět mapování také v R. Na Obr. Obrázek 43 ukazuje malou mapu, kterou jsem vytvořil v R. Anotace byly přidány později, v Adobe Illustratoru.

Rýže. 43. Mapa USA vytvořená v R

Mapy vyrobené v R mají omezené možnosti a dokumentace není skvělá, takže tento způsob vytváření map používám pouze v případě, že potřebuji udělat něco jednoduchého a náhodou pracuji v tuto chvíli v R. V ostatních případech se raději uchýlím k nástrojům, které jsem již uvedl výše.

ONLINE ŘEŠENÍ

Existuje také několik online mapových řešení, která usnadňují vizualizaci geografických dat. Ve většině případů vezmou karty, které lidé používají nejčastěji, a odstraní z nich všechny nepotřebné věci. Ukazuje se něco podobného jako zjednodušený ArcGIS. Dva z těchto zdrojů jsou volně přístupné. Jedná se o Many Eyes a GeoCommons. První z nich – o tom jsme hovořili výše – má pouze základní funkcionalitu pro práci s daty o zemích či státech USA. GeoCommons však poskytuje větší funkčnost a bohatší nástroje pro interakci. GeoCommons také podporuje nejběžnější formáty souborů mapových dat, jako jsou shapefiles a KML.

Existuje také mnoho placených řešení, z nichž nejužitečnější jsou Indiemapper a SpatialKey. SpatialKey je vhodnější pro podnikání a rozhodování, zatímco Indiemapper je skvělý pro kartografy a designéry. Na Obr. Obrázek 44 ukazuje příklad kartogramu, který jsem sestavil v Indiemapperu během několika minut.

Rýže. 44. Kartogram vytvořený v Indiemapper

Kompromisy

Mapovací programy existují v mnoha různých typech a jsou navrženy tak, aby vyhovovaly různým potřebám. Bylo by skvělé ovládat jeden jediný program a být schopen vytvořit všechny typy map, které si lze představit. Bohužel to tak nepůjde.

Například ArcGIS má spoustu funkcí, ale možná nebudete chtít trávit čas jeho učením nebo peníze na jeho nákup, pokud potřebujete vytvářet pouze jednoduché mapy. Naopak, free R se svými základními funkcemi může být příliš jednoduché na to, co chcete dělat. Pokud jsou vaším cílem interaktivní online mapy, Modest Maps a Polymaps vám mohou vyhovovat, ale pak budete potřebovat serióznější programátorské dovednosti.

Prozkoumejte své možnosti

Tento výčet nástrojů zdaleka nevyčerpává všechny možnosti, které můžete k vizualizaci dat využít, ale zpočátku by vám měl stačit. Je toho hodně, o čem přemýšlet a s čím si hrát. Které nástroje nakonec použijete, závisí do značné míry na tom, čeho chcete dosáhnout, a vždy existuje několik přístupů k provedení úkolu i v rámci jednoho programu. Chcete vytvořit statickou informační tabulku? Možná bych měl zůstat u R nebo Illustratoru. Chcete vytvořit interaktivní nástroj pro vaši webovou aplikaci? Pak zkuste JavaScript nebo Flash.

Provedl jsem průzkum na webu FlowingData a snažil jsem se zjistit, co lidé primárně používají k analýze a vizualizaci dat. Odpovědělo něco málo přes 1000 lidí. Výsledky jsou uvedeny na Obr. 45.

Rýže. 45. Co čtečky FlowingData používají k analýze a vizualizaci dat

Mezi odpověďmi je několik zjevných lídrů, zejména s ohledem na téma FlowingData. Excel je na prvním místě, následuje R. A pak dochází k rozdílům v názorech a preferencích při výběru softwaru. Více než 200 lidí zvolilo kategorii „Ostatní“. Mnoho komentátorů uvedlo, že kombinují nástroje, aby vyhovovaly různým potřebám – což je obvykle z dlouhodobého hlediska nejúčinnější přístup.

Kombinace možností

Mnoho lidí rádo pracuje pouze s jedním programem - je to snadné a pohodlné. Není potřeba se učit nic nového. Pokud to stačí k uspokojení vašich potřeb vizualizace, není třeba se od tohoto principu odchýlit. Ale poté, co budete s daty pracovat dostatečně dlouho, přijde okamžik, kdy si uvědomíte, že možnosti softwaru byly vyčerpány. Budete vědět, co s daty musíte udělat nebo jak je vizualizovat, ale program vám to nedovolí nebo bude proces časově náročnější, než by měl být.

Můžete se s touto situací smířit, nebo můžete začít používat jiné programy, které zabere čas se naučit, ale které vám pomohou realizovat vaši vizi designu. Navrhuji, abyste zvolili druhou cestu. Zvládnutí různých nástrojů zajišťuje, že nebudete zahlceni daty a že budete mít flexibilitu pro zvládnutí různých vizuálních úloh a získání skutečných výsledků.

Zabalení

Pamatujte: žádný z těchto nástrojů není všelékem. V konečném důsledku bude analýza a návrh dat vždy na vás. Koneckonců, nástroje jsou jen nástroje. To, že máte kladivo, ještě neznamená, že umíte postavit dům. Stejně tak můžete mít k dispozici skvělý program a superpočítač, ale pokud ty nástroje neumíte používat, nemáte je. Vy rozhodujete, jaké otázky položit, jaká data použít a jaké jejich aspekty zvýraznit, a pochopení toho přichází se zkušenostmi.

Ale máte štěstí! Ostatně tomu je věnován zbytek knihy. V následujících kapitolách se seznámíte se základními koncepty informačního designu a naučíte se, jak uvést teorii do praxe pomocí některé kombinace nástrojů, o kterých jsme hovořili výše. Dozvíte se, co hledat v datech, která máte, a jak tato data vizualizovat.

Streamgraph je typ skládaného plošného grafu, který je odsazen kolem středové osy, což vede k nádherným, plynulým tvarům (zejména při práci s velkými datovými sadami). Vyvinutý Lee Byronem v roce 2008. Generátor lze stáhnout z GitHubu. Poznámka pruh

V dnešní době se v oblasti vizualizace objevují metody pro transformaci dat do vizuálních obrazů pro lepší pochopení informací. Jedna z nejběžnějších vizuálních reprezentací, spojnicový graf, se používá již více než tisíc let. A nástroje jako sloupcový graf, koláčový graf, bodový graf a histogram byly vynalezeny před více než dvěma stoletími.

Od té doby uplynulo mnoho času a pokrok se nezastavil. V dnešní době mají uživatelé k dispozici desítky programů, které jim umožňují vizualizovat data. Zároveň vizualizace již dávno „migrovala“ do trojrozměrného prostoru: vědci ji využívají k vizuální prezentaci výsledků výzkumu, meteorologové sestavují povětrnostní mapy, manažeři využívají 3D datové modely k rychlému a efektivnímu rozhodování o řízení.

Zastaví se tím ale vývoj vizualizačních technologií? Samozřejmě že ne. Co nás čeká v budoucnosti? Odpověď na tuto otázku lze nalézt sledováním historie vizualizace, protože ne nadarmo se říká: „Bez znalosti minulosti není budoucnosti“.

Krátký exkurz do historie

Protože se bavíme o vizualizaci, pojďme si představit její historii ve vizuální podobě – takto ji ztvárnil Michael Friendly, autor knihy Handbook of Data Visualization:

Pre-17. století – rané mapy a grafy

První zárodek vizualizace začal v geometrických diagramech, tabulkách poloh hvězd, ilustracích částí těla a navigačních mapách.

Mezi rané ukázky kvantitativních informací patří graf pohybu hvězdných těles, který ukazuje pohyb planet ve dvourozměrném souřadnicovém systému. Tento graf poskytuje dobrou ilustraci tohoto období:

1600-1699 – Měření a teorie

V 17. století se vědci zajímali o to, jak měřit čas, vzdálenost a prostor. Hlavní důraz byl kladen na mapy a navigaci.

Právě v tomto období se objevil souřadnicový systém, zrodila se teorie věrnosti a demografické statistiky.

Ilustraci té doby lze nalézt v díle Christophera Scheinera z roku 1630. Později pro to Edward Tufte použil termín „malé sady“, což znamenalo opakování jednoho prvku mnohokrát, aby se ukázala dynamika a změny, ke kterým dochází.

Tento obrázek ukazuje sluneční skvrny pozorované během měsíce:

1700-1799 – Nové grafické formy

18. století bylo dobou překračování „samozřejmého“. Mapy se nyní snaží zobrazovat nejen bod geografické polohy, ale objevují se vrstevnice a izočáry.

Příklady z doby: tematické mapy geologických zlomů, ekonomické výpočty a lékařské ilustrace. Abstraktní vizualizace jsou stále častější. Jak se začíná hromadit více informací o politických a ekonomických událostech, vyvstává potřeba nových vizuálních forem pro jejich zobrazení.

Níže je uveden jeden z prvních příkladů překrytí dalších dat na geografické mapě:

1850 – Začátek moderní grafiky

Do této doby se objevily hlavní typy grafů: koláčové, sloupcové a plošné grafy. Za výchozí bod moderní grafiky je považována slavná vizualizace cholery v ulicích Londýna od Johna Snowa:

V roce 1858 vynalezla britská zdravotní sestra a sociální aktivistka Florence Nightingalová první koláčový graf, který použila v krymské válce, aby ukázala, že mnohem více vojáků zemřelo na nemoci (modrá) než na bojišti (červená) nebo z jiných příčin (černá). ):

1900-1950 – Roky potíží

Začalo filozofické uvažování a dělení lidí na „vizuálnější“ a „tabulkovější“. Britové se považovali za tabulkovější. Mottem Britské akademie byl v té době sběr dat („sbírání zrn pšenice“), ale podle jejich názoru byla vizualizace již z pekařského seriálu.

1950 – 1975 – renesance

Vědci a spisovatelé začali aktivně popularizovat myšlenku vizualizace. Podobná díla vycházela doslova jedna za druhou. V roce 1962 napsal John Tukey The Future of Data Analysis, oddělující matematiku od statistiky. A pokud si první nepotrpí na vizualizace, tak statistika díky nim dostává větší význam a podobu.

V této době se objevily první interaktivní vizualizace. Příkladem je tato vizualizace od Richarda Bakera:

V roce 1973 použil americký vědec Herman Chernov obrázky obličeje k vizualizaci dat. Černovské tváře jsou zobrazením vícerozměrných dat v podobě lidské tváře a jejích jednotlivých částí. Níže je uveden příklad právního hodnocení 12 soudců na základě osob Černovových:

1975 – současnost – Interaktivní a dynamická vizualizace ve vysokém rozlišení

Dnes máme široký přístup k nástrojům pro analýzu a vizualizaci dat. Za klíčové momenty, které poznamenaly éru interaktivní a dynamické vizualizace, lze považovat vznik interaktivních systémů, schopnost interakce s modely (včetně 3D) a zvýšení výkonu počítače spolu s levnějšími technologiemi.

Klíčovou roli v tomto procesu samozřejmě sehrál vznik internetu a v důsledku toho i přístup k velkému množství dat.

Pozoruhodným příkladem vizualizace této éry je internetová vizualizace vytvořená projektem Opte:

Jak už z názvu snadno uhodnete, vizualizace dat je grafické znázornění jakýchkoli dat. Zároveň jsem na internetu našel mnoho definic, které se týkají vizualizace dat:

  • Grafy a diagramy,
  • Infografiky a diagramy,
  • Prezentace a analýza dat,
  • Interaktivní vyprávění,
  • obchodní analytika a dashboardy,
  • vědecké a lékařské zobrazování,
  • Mapy a kartogramy.

Pak se každý sám rozhodne, co rozumí vizualizací dat. Na konci poznámky vám řeknu, pro co jsem se rozhodl sám. Mezitím se podíváme na každý z typů podrobněji a najdeme jejich rozdíly a vlastnosti.

Grafy a grafy

U nás asi nejznámější typ vizualizace dat. Používá se jak pro prezentaci dat, tak pro analýzu. Můžete se s nimi setkat v práci, v časopisech i ve vědeckých zprávách. Znalosti o existujících typech tabulek a grafů obvykle získáváme ze školy nebo ze standardní sady v Excelu. Málokdo však ví, že svět grafů a tabulek se neomezuje pouze na tečkové grafy, sloupcové grafy a koláčové grafy. Známých typů grafů je asi 15 a celkem jich je více než 60 a jejich počet se každým dnem zvyšuje – lidé vymýšlejí nové typy pro vizualizaci složitých a neobvyklých dat. Na typy grafů a tabulek se podrobně podíváme v některém z následujících příspěvků.




Infografiky a diagramy

Infografiky se v posledních letech staly velmi populárními, i když existují již dlouhou dobu. Infografika odkazuje na datovou žurnalistiku, kde grafy a diagramy vysvětlují jakákoli fakta na vybrané téma. Infografika je obvykle statická a skládá se z dlouhého „listu“ s obrázky a textem. Charakteristickým rysem infografiky je, že poskytuje hotové závěry, to znamená, že čtenář je veden za ručičku zvoleným tématem a zároveň opepřen čísly a obrázky. Často se používá ručně kreslený nebo kreslený styl. Některá média uvolňují infografiku denně, například AiF. Boom infografiky způsobil pokles celkové úrovně kvality infografiky. Často se používá nemístně nebo „pro krásu“, i když samozřejmě existují nádherné a zajímavé příklady.

Infografické příklady

Síla Napoleonovy armády během ruského tažení, 1869

Obyvatelstvo různých zemí, 1912

10 typografických přikázání

Klapka křídel

Vegetariáni v číslech

Prezentace a analýza dat

Jedním z nejběžnějších způsobů využití vizualizace dat je prezentace informací ve formě grafů nebo infografiky. A pokud je s tím, myslím, všechno jasné, pak použití vizualizace pro analýzu informací používají hlavně obchodní analytici a vědci. Jaký je rozdíl?

Při analýze dat pomocí vizualizace se využívá tzv. rapid prototyping – tedy vytváření velkého množství různých vizuálních reprezentací stejných dat. To se provádí proto, aby bylo možné najít vztahy a závislosti, které jsou na první pohled skryté, a také poskytnout počáteční posouzení datové sady pro možnost použití složitějších analytických nástrojů v budoucnu. Tento přístup se nazývá průzkumná analýza dat (EDA), což lze do ruštiny přeložit jako průzkumná analýza dat. Hlavní rozdíl oproti prezentaci dat je v tom, že vizualizace zde může být „drsná“ a nevzhledná, ale je provedena rychle a jednou osobou nebo malou pracovní skupinou. K tomu se nejčastěji používá Excel, R nebo Matlab.

EDA je jedním z nástrojů pro dolování dat, existují dokonce návody, jak na to

Vizualizační příklady pro EDA





Interaktivní vyprávění

Vyprávění nebo skazatsievo v ruštině (zní to legračně) je prezentace některých užitečných informací ve formě zajímavého příběhu. Z nějakého důvodu se video často nazývá interaktivní vyprávění příběhů, ale není tomu tak, je to jen jiný typ informační grafiky. Interaktivní vyprávění je příběh, se kterým může posluchač komunikovat. V jádru má blízko k datové žurnalistice a infografice, liší se však tím, že uživatel může ovládat zobrazování informací a nacházet ty závislosti, které autor nenašel. V tomto smyslu se blíží průzkumné analýze dat, ale liší se tím, že data jsou předem zpracována a prezentována ve formě vhodné pro analýzu a existují také rady nebo předem napsané scénáře použití. Interaktivní vyprávění se proto nejčastěji nazývá interaktivní infografika, ale aby se jím stalo, nestačí ke statickým infografikám jednoduše přidat vyskakovací okna.
Interaktivní vizualizace se v dnešní době aktivně rozvíjejí. Silné příklady lze nalézt ve velkých médiích nebo v podobě jednotlivých projektů.

Příklady interaktivního vyprávění (přechod na web po kliknutí na obrázek)

obchodní analytika a dashboardy,

Vizualizace se aktivně využívá v podnikání. Princip „mluvení s daty“ pomáhá společnostem vydělávat více a zákazníci dostávají lepší služby. Pro jednorázovou analýzu se obvykle používá Excel nebo R. To však není vhodné, pokud potřebujete průběžně sledovat některé ukazatele (KPI). Pro sledování rutinních KPI se používají dashboardy - displeje, které zobrazují všechny potřebné ukazatele na jednom místě ve formě grafů, grafů a tabulek.

Navrhování efektivních přístrojových desek je složitý a mimořádný úkol. Často jsou přetíženi zbytečnými informacemi nebo se snaží použít všechny možné typy šablony grafu. Aby bylo možné navrhnout dobrý dashboard, je často nutné vytvořit nové typy vizualizace informací. Toto téma se aktivně rozvíjí díky rostoucímu využívání analytiky v podnikání. Dashboardy slouží i pro osobní potřebu (fitness trackery, analýzy osobních výdajů atd.)

Mapy jsou jednou z nejstarších metod vizualizace, která zobrazuje okolní realitu. Kartogram je mapa, na které jsou vytištěny informace ve formě barev nebo jiných prostředků. Snad zde nebudu přesný s pojmy, nechť mi kartografové prominou. Kartogramy lze použít k zobrazení libovolných informací – od hustoty osídlení až po četnost používání nadávek v jednotlivých regionech země. Lze je použít v kterémkoli z typů vizualizací, o kterých jsme hovořili dříve. Zvýraznil jsem je v samostatném odstavci, protože jejich implementace je zcela odlišná od jiných typů vizualizací (čekáme na poznámku).

Příklady kartogramů (na stránku přejděte kliknutím na obrázek)

Shrnutí

Zápis se ukázal být nečekaně dlouhý. Možná je to dobře, hned vidíte, kolik toho je ve světě vizualizace dat. Co pod tímto pojmem rozumím a o čem tento blog bude?
Prezentace dat je pro mě především o grafech a grafech a také o interaktivní infografice. Tomu bude věnována převážná část poznámek, zajímavé bude také ponořit se do map a dashboardů.