Kas ir datu vizualizācija: kas tā ir un kas tā nav. Kas ir vizualizācija, kā tā darbojas Uzstādiet kopēju mērķi visai komandai

3 D-vizualizācija pārliecinoši ieņem vadošo pozīciju daudzsološāko reitingos informācijas tehnoloģijas. Kāpēc šis risinājumu segments stiprina un paplašina savas pozīcijas, kas ir pieprasījuma katalizators, kādas jaunas tendences parādās mūsdienu sarežģītajos apstākļos? Mēs par to runājām ar Sergejs Astahovs, Interaktīvās datu vizualizācijas platformas konsorcija vadītājs (IDVP), konkursa finālists "Labākie informācijas un analītiskie rīki — 2016".

Kādi ir interaktīvās datu vizualizācijas tirgus virzošie faktori? šodien ir galvenais? Kādas tendences var noteikt?

Paradoksālā kārtā analītisko rīku pieprasījuma virzītājspēks ir sarežģītā ekonomiskā situācija. Krīzes laikā vadītājiem ātri jāsaņem precīza, objektīva informācija par uzņēmuma stāvokli. Vēl viens tirgus virzītājspēks ir lavīnai līdzīgs datu apjoma pieaugums, kas prasa jaunas pieejas darbam ar informāciju.

Mūsdienās ir vajadzīgas tehnoloģijas, kas spēj apstrādāt lielu datu apjomu, interaktīvas infografikas un kurām ir interaktīvs interfeiss. Lietotāji ir sapratuši, ka datu vizualizācija un mijiedarbība ar tiem vislabāk var palīdzēt viņiem izprast datus.

Šiem uzdevumiem paredzēta unikālā Krievijas izstrādātā Interaktīvā datu vizualizācijas platforma (IDVP) - tehnoloģiskā platforma operatīvai vizualizācijai un datu analīzei. Šis pārvaldības rīks ir balstīts uz funkcionālās modelēšanas tehnoloģijām situāciju analīzei, izmantojot telpisko 3D infografiku. Platforma tiek izmantota, lai risinātu vadības, ekonomiskās un finansi-ekonomiskās problēmas.

Kad analītikas nodrošinātāji runā par klientu datiem, viņi bieži runā par datu problēmām. Bet, ja mēs pieņemam ideālo gadījumu, kad klienta dati ir priekšzīmīgā kārtībā, kā mēs varam atšķirt svarīgus datus no nesvarīgiem datiem, kas tieši ietekmē viņa biznesa procesus no nesvarīgajiem?

“Svarīgākie” dati tiek iegūti no sistēmām, kas izmanto sensorus un skaitītājus, piemēram, automatizētās procesu vadības sistēmās, cauruļvadu kontroles sistēmās, enerģijas ražošanā u.c., vai no sistēmām, kas automatizē operatīvās darbības - banku, maksājumu, loģistikas sistēmas u.c. utt., kur cilvēciskā faktora loma tiek samazināta līdz minimumam vai informācija tiek piesaistīta “īstai” naudai.

Patiesībā mēs šobrīd zinām divus veidus, kā uzlabot datu kvalitāti: vai nu samazināt cilvēcisko faktoru – iegūt datus, izmantojot mērķi tehniskajiem līdzekļiem, vai piesiet informāciju par naudu.

Piemēram, Medicīnas informācijas sistēmas uzraudzības centrā ārstu pieejamība tiek mērīta automātiski brīdī, kad pacients pierakstās, bez cilvēciskā faktora.

Resursu pievienošanas pilnība sistēmai tiek kontrolēta arī vienkārši - ārsts nevarēs saņemt algu, ja netiks ievadīts sistēmā un nestrādās tajā katru dienu. Kamēr grāmatvedība pastāvēja atsevišķi no Uzraudzības centra, klīnikās darbinieku bija vairāk nekā pieņemšanas. Kad viņi bija vienoti, viss ātri atgriezās savās sliedēs.

Līdz ar to jaunas paaudzes analītiskā risinājuma radīšana ir praktiski bezjēdzīga atsevišķi no zemāka līmeņa sistēmas reorganizācijas, kā likums, gan vadības, gan informācijas.

Kā atpazīt vājās vietas sava klienta biznesa procesos? Priekš ģenerāldirektors Svarīgi ir izpratne par pagātni, tagadni un prognozi viņa biznesa attīstībai, apzināties pašreizējos darbības un efektivitātes rādītājus. Kā jūs ar to tiekat galā?

Savā darbā mēs koncentrējamies uz trim galvenajiem principiem.

  1. Wow efekts- grafikas kvalitāte, animācija un aplikācijas ātrums padara darbu vismaz garlaicīgu. Visi elementi ir paredzēti augstas kvalitātes attēlošanai uz “lielajiem” ekrāniem un vadītājiem mobilajās ierīcēs vai personālajos datoros.
  2. Situācijas analīze- spēja ātri lokalizēt problēmu pie vadības objektiem, piemēram, izmantojot luksofora principu vai konkrētu attēlu.
  3. Iespēja ne tikai lokalizēt problēmu, bet arī visu atklāt iespējamie iemesli tā izskatu, tādējādi virzoties uz problēmas risināšanu.

Jebkura analītiskā risinājuma - Monitoringa centra izstrāde IDVP platformā sākas ar gadījuma definēšanu līdzīgi kā biznesa gadījumam, kas ietver dažādus rādītājus, kas raksturo risināmo problēmu un parāda klientam veidus, kā to atrisināt.

Tad, kad tiek izveidots gadījums un izvēlēti indikatori problēmas risināšanai, mēs izgudrojam un izstrādājam trīsdimensiju interaktīvus vizuālos attēlus, kas veido "fenomena telpu". Tieši atbildīgs par datu vizualizāciju īpaša programma- “3D atskaņotājs”, kas tiek samontēts platformas vadībā katram lietotājam atsevišķi.

IDVP atbalsta diezgan lielu interaktīvu analītisko rīku komplektu. Tiem ir iespēja mērogot, mainīt pozīciju telpā, lai nodrošinātu labāku vizuālo uztveri, iespēja vairākkārt atlasīt attēlotos objektus vai vērtības ar dziļuma atbalstu tieši no diagrammas vai grafika.

Piemēram, “Finanšu organizāciju uzraudzības centram” kredītņēmēju “mākonim” izmantojām vizuālas grafiskas interaktīvās saskarnes koncepciju, ar kuru ir viegli un ērti strādāt. Bumbiņas izmērs mākonī kodē informāciju par aizņēmēja saņemto kredītu summu, bet krāsa kodē informāciju par konstatēto problēmu skaitu ar aizņēmēju. Speciālists var noklikšķināt uz viņu interesējošā aizņēmēja un redzēt viņa finansiālo attiecību diagrammu ar darījumu partneriem dažādās sadaļās, attiecībās un veidos.

Uzraudzības centra lietojumprogramma "Intelligent Warehouse" izmanto trīsdimensiju vizuālo noliktavas attēlojumu un līniju grafiku ar interaktīvi regulējamu skalu.

Patiesībā šis ir digitālais noliktavu biznesa momentuzņēmums, kurā intuitīvi tiek pasniegtas atbildes uz ražošanas problēmām – piemēram, kāpēc noliktavā ir garas automašīnu rindas uz iekraušanu un izkraušanu?

Kā pieeja informācijas analīzei klasiskajos analītiskos rīkos atšķiras no jūsu risinājuma?

Neskatoties uz vispārpieņemto analītisko sistēmu pozicionēšanu, tradicionāli to lietotājs ir apmācīts analītiķis, kas griež datu “kubus” un meklē tajos modeļus. Tas izmanto tabulas, diagrammas, diagrammas un daudz ko citu, lai analizētu datus.

Mēs izvēlējāmies sev citu lietotāju - tas, pirmkārt, ir augstākā līmeņa vadītājs, uzņēmuma īpašnieks, nozares līderis, kurš pastāvīgi atrodas ierobežotā laika ierobežojumā. Viņam vadības lēmumu pieņemšanas ātrums bieži ir kritisks. Tajā pašā laikā mūsdienu aizņemts cilvēks arvien vairāk vēlas uztvert informāciju trīsdimensiju interaktīvas infografikas veidā, kas ļauj ar minimālu laiku analizēt maksimālo informācijas daudzumu, ātri aptvert problēmas būtību, dažādas tendences. izmaiņas un novērtēt iespējamos riskus. Viņš ir pieradis eksistēt trīsdimensiju telpā.

Tāpēc savā attīstībā koncentrējamies uz tām jomām, kas ļauj ātri un efektīvi nodot vadītājiem situāciju sarežģītos nozares gadījumos. ar lielu avota datu apjomu. Starp tiem ir šādi:

Jaunas tehnikas interaktīvam vizuālajam darbam ar lieliem operatīvās un stratēģiskās informācijas apjomiem - tehnoloģijas nodrošina skaidru esošo problēmu uztveri un iespējamie veidi savus risinājumus, izmantojot vizuālos attēlus. Ekrānā vienlaikus tiek apskatīti daudzi problēmu ietekmējošie aspekti, ir vieglāk izprast informācijas, vadības, finanšu un ekonomikas procesus, redzamas to savstarpējās attiecības un savstarpējā atkarība.

Gamifikācijas elementu ieviešana-Šo jauns līmenis lietotāja mijiedarbība, kas padara datu analīzes procesu interesantu, izglītojošu un neaizmirstamu. Attiecīgi paaugstinās informācijas iegūšanas līmenis un kvalitāte.

Izmantojot jaunus 3D analītiskos rīkus, netiek izmantots tradicionālajās BI sistēmās, jo pārlūkprogrammu platformās nav iespējams iegūt normālus rezultātus, piemēram, Sankei plūsmas diagrammas, daudzu pret daudziem attiecību diagrammas utt.

Apskatiet mūsu analītisko sistēmu saskarņu piemērus. Domāju, ka viss kļūs skaidrs bez turpmākas runas.

UZŅĒMUMA ĪPAŠAIS PROJEKTSIDVP

Mūsdienās pieejamais datu avotu un to apstrādes rīku skaits skaidri parāda, ka nekad agrāk tik daudz cilvēku nav mēģinājuši pierast pie datu vizualizācijas pasaules. Un, kad ir pieejams tik daudz materiālu izpētei, ir tikai viens jautājums "Kur sākt?" var būt biedējoši ikvienam iesācējam. Tātad, kuras bibliotēkas ir labākās un ko profesionāļi iesaka? Tas tiks apspriests šajā rakstā.

Runāt par datu vizualizāciju un to nepieminēt ir tas pats, kas runāt par personālo datoru vēsturi un nerunāt ne vārda par Stīvu Džobsu. D3 (datu vadīti dokumenti) bez pārspīlējuma ir vissvarīgākā un tirgū dominējošā atvērtā pirmkoda JavaScript bibliotēka, ko parasti izmanto SVG grafikas izveidei. SVG (no angļu valodas Scalable Vector Graphics) savukārt ir vektora attēlu formāts, ko atbalsta tīmekļa pārlūkprogrammas, bet iepriekš maz izmantots.

D3 bibliotēkas popularitāte lielā mērā ir saistīta ar pēkšņo tīmekļa dizaineru interesi par SVG, kas lielā mērā ir saistīts ar to, cik labi vektorgrafika izskatās augstas izšķirtspējas ekrānos (īpaši Retina displejos, ko izmanto Apple ierīces), kas kļūst arvien izplatītāki.

"Būsim godīgi, ja problēma ir uz SVG balstīta datu vizualizācija, tad visas pārējās bibliotēkas pat ne tuvu nav tās risinājumam," saka Morics Stefaners, neatkarīgs datu vizualizācijas eksperts un uzņēmuma īpašnieks. Patiesība un skaistums. “Ir arī daudz interesantu projektu, kas izveidoti uz D3 bāzes, piemēram, NVD3, kas nodrošina standarta grafikas komponentus – gatavas lietošanai, bet pielāgojamas; vai pieņemsim, ka Crossfilter ir vienkārši izcils datu filtrēšanas rīks.

Processing.js ir Processing “māsas” projekts, kas ļauj vizualizēt datus, izmantojot tīmekļa standartus un novēršot vajadzību pēc spraudņiem. "Lai sāktu darbu ar apstrādi, jums nav jāzina JavaScript, jo apstrādei ir sava programmēšanas valoda," skaidro Nīderlandes datu vizualizācijas eksperts Jans Vilems Tulps. Kā lietotājs jūs vienkārši ierakstāt kodu sadaļā Apstrāde, ielīmējiet to savā tīmekļa lapā un mierīgi ļaujiet Processing.js parūpēties par pārējo.

"Negatīvā puse ir tad, kad sākat strādāt pie sarežģītākiem projektiem: IDE (Integrētā izstrādes vide) šķitīs nedaudz ierobežota," turpina Jans Vilems Tulps.

Un neskatoties uz to, apstrādei piemītošā vienkāršība, kā arī liela lietotāju kopiena, kas ir gatava jebkurā laikā palīdzēt tiem, kas saskaras ar problēmu, izlīdzina šo trūkumu un padara apstrādi par vienu no pieejamākajiem datu vizualizācijas rīkiem.

Lai gan D3 un apstrāde nodrošina kopīgus rīkus dažādiem vizualizācijas veidiem, Gefi atrisina specifiskākas problēmas. Gephi ir bezmaksas atvērtā koda bibliotēka tīkla vizualizācijai. Bet pat šajā šaurajā specifikā Gephi sniedz iespēju jūru. Neatkarīgi no tā, vai vēlaties modelēt darbinieku attiecības uzņēmumā vai bumbu piespēlēšanu futbola spēles laikā, Gephi var palīdzēt jums iztēloties šīs attiecības.

Tāpat kā apstrādi, arī Gephi ir ļoti viegli instalēt. Tūlīt pēc instalēšanas jūs nekavējoties importējat datus, sakārtojat tos un varat sākt vizualizāciju. "Iegūtos attēlus var eksportēt un ielīmēt jebkurā tīmekļa dokumentā, lai jūsu auditorija vēlāk varētu tos izmantot un kopīgot tīklos," saka Benjamin Wiederkehr.

Digrāfi

Digrāfi- tas ir ātrs un elastīgs izmantojot JavaScript Atvērtā koda bibliotēka, kas paredzēta interaktīvu grafiku veidošanai un ļauj analizēt un interpretēt ļoti blīvas datu kopas. Atšķirībā no Vega, Dygraphs bibliotēka piedāvā pielāgotus iestatījumus, taču tai ir tāda pati priekšrocība, ka darbojas visās lielākajās pārlūkprogrammās. Turklāt Dygraphs ir sākotnēji interaktīvs, kas nozīmē, ka dažas funkcijas (piemēram, tālummaiņa, panoramēšana vai peles kursora novietošana) ir pieejamas pēc noklusējuma, savukārt, piemēram, mobilajās ierīcēs “piespiešana, lai tuvinātu” ir tikai patīkams pieskāriens.

Kur sākt?

Pat ar šo informāciju datu vizualizācijas pasaule iesācējam var šķist tumšs mežs. Tātad, ko eksperti iesaka?

"Pirmā lieta, ko es ieteiktu, ir iepazīties ar tik daudziem rīkiem, kādi ir šodien, lai ātri izveidotu standarta grafikus," saka Morics Stefaners. “Īpaši projekta sākumā ir ļoti svarīgi spēt ātri ģenerēt daudzas diagrammas, lai izpētītu datu apjomu, dziļumu un “tekstūru”. Personīgi es izmantoju Tableau un Gephi, bet papildus tiem izmantoju arī CartoDB, kas ir neaizstājams darbam ar kartēm, un pēdējā laikā atvērtā pirmkoda bibliotēku RAW, kas ir lieliska, lai ātri izveidotu interesantus grafikus.

Jums arī jāpārliecinās, vai izvēlētā bibliotēka vislabāk atbilst informācijai, kuru vēlaties parādīt.

“Ir svarīgi jau pašā sākumā sev pajautāt, ar kādu datu formātu strādāsit,” saka Skots Marejs. “Uzdevums ir vizualizēt laika periodu? Vai tie varētu būt kategoriski dati? Atbildes uz šādiem jautājumiem var ietekmēt jūsu lēmumu. Dažas bibliotēkas, piemēram, D3, ir universālas un var strādāt ar tām dažādi veidi datus. Citi ir vairāk specifiski datu tipiem, piemēram, Gephi vai Sigma.js, tīkla vizualizācijai paredzēti rīki. Ja jau no paša sākuma zināt, ar ko strādājat, pārdomājiet, izvēloties no esošajām bibliotēkām to, kas vislabāk atbilst jūsu datu tipam.

Kādas ir tiešsaistes kopienas priekšrocības?

Tiem, kas tikko sākuši izmantot datu vizualizāciju, svarīgs punkts bibliotēkas izvēlē ir vietējās kopienas klātbūtne, kuras locekļi aizraujas ar savu darbu un ir gatavi palīdzēt.

“Iesācējiem es ieteiktu sākt ar apstrādes vai D3 bibliotēkām,” saka Jans Vilems Tulps. "Viņiem abiem ir liela lietotāju bāze un daudz piemēru, no kuriem mācīties."

Tiešsaistes kopiena datu vizualizācijas jomā ne tikai sniedz atbildes uz daudziem jautājumiem, bet arī uzskatāmi parāda vienu no galvenajiem infografikas paradoksiem. Ikviens šajā nozarē ierodas ar savu pieredzi un pieredzi, tāpēc daži datu vizualizācijas profesionāļi problēmām pieiet no estētiskā un mākslinieciskā viedokļa, bet citi koncentrējas uz problēmas statistisko pusi. Statistiķi lieliski saprot lielu datu apjomu, taču viņiem ir jāapgūst dizaina pamati. Dizaineri daudz zina par estētiski pievilcīgu attēlu veidošanu, taču viņiem ir daudz jāmācās par statistikas metodēm.

“Visa centrā ir pušu vienošanās par vizualizācijas veidu,” saka programmētājs-dizaineris

Tomēr, ja pieņemsit šīs funkcijas, jums pavērsies lieliskas iespējas. Jūs varēsiet izgatavot tipogrāfiskas kvalitātes grafiku (vai vismaz līmenī, kurā sākas kvalitāte), un jums patīk R elastība. Ja vēlaties, varat rakstīt savas funkcijas un pakotnes, lai izveidotu vajadzīgo grafiku. Vai arī varat izmantot tos, ko citi cilvēki ir padarījuši pieejamus R bibliotēkā.

R nodrošina visas pamata zīmēšanas funkcijas, kas būtībā ļauj izveidot gandrīz jebkuru objektu, kas jums varētu būt nepieciešams. Izmantojot zīmēšanas sistēmu, jūs varat zīmēt līnijas, formas un asis, un atkal, tāpat kā ar citiem programmatūras risinājumiem, jūs ierobežo tikai jūsu iztēle. Gandrīz visu veidu diagrammas ir pieejamas, izmantojot dažādas R pakotnes.

Tad kāpēc izmantot ko citu, izņemot R? Kāpēc gan nedarīt ar to visu? Šeit ir daži iemesli. R darbojas uz jūsu darbvirsmas, tāpēc tas nav piemērots dinamiskas tīmekļa lapas. Diagrammu un attēlu saglabāšana un ievietošana tīmekļa lapā nav problēma, taču tas nenotiek automātiski. Grafiku var izveidot lidojuma laikā tieši tīmeklī, taču esošie risinājumi šajā posmā nav īpaši stabili, it īpaši salīdzinājumā ar tīmekļa produktiem, piemēram, JavaScript.

R nav arī piemērots interaktīvai grafikai un animācijai. Protams, jūs varat to izdarīt ar R, taču ir elastīgāki, elegantāki veidi, kā veikt līdzīgu uzdevumu, piemēram, ar izmantojot Flash vai Apstrāde.

Visbeidzot, jūs, iespējams, pamanījāt, ka grafiskie objekti, kas parādīti attēlā. 35 un 36, nedaudz pietrūkst spīduma. Diez vai jūs kādreiz atradīsit šādus grafikus laikrakstos vai žurnālos. Jūs varat virzīt dizainu R līdz noteiktam līmenim, iespējojot dažādas opcijas vai rakstot papildu kodu, bet es pats parasti izmantoju citu stratēģiju: es izveidoju grafikas pamatu R un pēc tam rediģēju un uzlaboju to kādā dokumenta izkārtojuma lietojumprogrammā. , piemēram, Adobe Illustrator — par to runāsim vēlāk. Analīzei neapstrādātais R produkts ir lielisks, bet prezentācijām un stāstu stāstīšanai būtu labāk nedaudz piestrādāt pie estētikas.

Padoms. Kad internetā meklējat kaut ko ar R saistītu, meklētājprogrammas dažreiz var neņemt vērā tik īsu nosaukumu un parādīt kļūdas ziņojumu vai nepareizu rezultātu. Tāpēc mēģiniet vaicājumā norādīt "r-project", nevis tikai "R". Meklēšanas rezultātiem jābūt atbilstošākiem.

Kompromisi

Apgūt jaunu programmu nozīmē apgūt jaunu valodu. Valoda, kurā runā jūsu dators, ir valoda, kas sastāv no bitiem, un tai ir sava loģika. Piemēram, strādājot ar Excel vai Tableau, jūs būtībā strādājat ar tulkotāju. Interfeiss runā ar jums jūsu valodā, un, noklikšķinot uz pogas, programma pārtulko komandu un pēc tam nosūta tulkojumu uz datoru. Pēc tam dators to izpilda un kaut ko dara jūsu vietā, teiksim, izveido grafiku vai apstrādā dažus datus.

Šeit laiks noteikti kļūst par galveno šķērsli. Ir nepieciešams laiks, lai apgūtu jaunu valodu. Daudziem cilvēkiem šāds šķērslis ir nepārspējams, un es viņus saprotu. Darbs ir jādara tagad, jo jūsu priekšā ir datu kalns, un cilvēki nevar gaidīt, lai redzētu rezultātus. Ja tas attiecas uz jums – jums ir viens datu apstrādes uzdevums, un turpmāk šādi uzdevumi nav paredzēti vairāk, tad patiesībā var būt labāk aprobežoties ar gataviem vizualizācijas rīkiem.

Tomēr, ja vēlaties izprast savus datus un, iespējams, turpināsit strādāt pie dažādiem datu zinātnes projektiem, šodien programmēšanas apgūšanai pavadītais laiks rīt var ietaupīt laiku citos projektos, kuriem arī būs iespaidīgāki rezultāti. Ar katru jaunu projektu jūsu programmēšanas prasmes uzlabosies, un jums tas kļūs vieglāk un vieglāk. Kā ar jebkuru svešvaloda, tajā uzreiz nesāc rakstīt romānus. Nē, jūs sāksit ar pamatiem un pēc tam pakāpeniski paplašināsit savas zināšanas.

Uz to visu var paskatīties savādāk. Iedomājieties, ka esat izmests svešā valstī un jūs nerunājat vietējā valodā. Tomēr jums ir tulks. (Klausieties mani līdz beigām, es runāju līdz galam.) Lai sazinātos ar vietējiem iedzīvotājiem, vispirms ir jāizsaka sava doma, un tad tulkam jānodod jūsu vēstījums. Bet ko darīt, ja tulkotājs nezina jūsu tikko teiktā vārda nozīmi vai nezina, kuru vārdu lietot, lai nodotu jūsu teikto? Viņš var vienkārši izlaist šo vārdu vai, ja viņš ir pietiekami gudrs, ieskatīties vārdnīcā.

Programma gatavam vizuālie risinājumi ir tas pats tulks. Ja viņa nezina, kā kaut ko darīt, tad jūs esat strupceļā vai jums būs jāizmēģina cits ceļš. Atšķirībā no cilvēka tulkotāja, programma nespēj iemācīties jaunus vārdus lidojumā vai, kā tas ir mūsu gadījumā, jauna veida diagrammas un diagrammas vai jaunus datu apstrādes rīkus. Papildu funkcijas nāc pie viņas programmas atjauninājuma veidā, kura parādīšanās ir jāgaida. Tad kāpēc tu pats nemācās valodu?

Es vēlreiz nesaku, ka jāizvairās no gataviem rīkiem. Pats tos izmantoju visu laiku. Tie padara daudz nogurdinošu uzdevumu viegli un ātri atrisināmu, kas ir lieliski. Vienkārši neļaujiet programmatūrai jūs ierobežot.

Kā jūs redzēsit, lasot turpmākās nodaļas, programmēšana var jums palīdzēt vairāk darbaīsākā laikā un ar mazāku piepūli nekā tad, ja visu darītu manuāli. Protams, ir daži uzdevumi, kurus labāk veikt manuāli, it īpaši, ja stāstāt stāstus ar datiem. Un tas mūs noved pie nākamā punkta, kas atrodas vizualizācijas spektra pretējā galā: ilustrācija.

Ilustrācija

Ieskatīsimies grafisko dizaineru jomā. Ja esat analītiķis vai jums ir vairāk tehniskās zināšanas, iespējams, šī ir jums nepazīstama teritorija. Jūs varat sasniegt daudz, apvienojot kodu un gatavus vizualizācijas rīkus, taču iegūtā grafika gandrīz vienmēr izskatīsies nedaudz aptuvena — kā kaut kas automātiski ģenerēts. Iespējams, paraksti nebūs īsti īstajā vietā, vai arī leģenda būs nedaudz pārslogota. Analīzei šāds rezultāts parasti ir diezgan piemērots - jūs zināt, uz ko skatāties.

Bet, veidojot diagrammu vai grafiku prezentācijai, ziņojumam vai publikācijai, parasti tā ir jānoslīpē, lai cilvēki varētu skaidri saprast, kādu stāstu jūs viņiem stāstāt.

Piemēram, attēlā. 35. attēlā parādīts neapstrādāts darba rezultāts R. Tas parāda skatījumu un komentāru skaitu vietnē FlowingData 100 populārākajām ziņām. Ziņas ir sakārtotas pēc kategorijas. Jo spilgtāka ir zaļā krāsa, jo vairāk komentāru konkrēta ziņa ģenerēja, un jo lielāks ir taisnstūra izmērs, jo vairāk skatījumu tā saņēma. Jūs to nevarētu uzminēt pēc pirmās trimap versijas, bet, kad es paskatījos uz skaitļiem, es precīzi zināju, ko es redzu, jo es pats uzrakstīju šo kodu.

Attēlā 38. parādīta tā paša apgriešanas pārskatītā versija. Vārdi ir novietoti tā, lai tie būtu redzami; Augšpusē esmu pievienojis ievadtekstu, lai lasītāji saprastu, kas tas ir viņu priekšā; Es pilnībā noņēmu krāsu leģendas sarkano sadaļu, jo tā ir muļķība - ieraksts ar negatīvu komentāru skaitu. Es arī nomainīju fonu no pelēka uz baltu vienkārši tāpēc, ka man likās, ka tā būs labāk.

Rīsi. 38. Trimap izveidots R un rediģēts programmā Adobe Illustrator

Es varētu rediģēt kodu, lai tas atbilstu visām savām vajadzībām, taču bija daudz vieglāk noklikšķināt uz objekta un vilkt to programmā Adobe Illustrator. Varat izveidot diagrammu vai diagrammu no jauna, izmantojot ilustrācijas programmu, vai arī importēt tajā grafiku, kuru veidojāt, piemēram, ar burtu R un rediģēt to, kā vēlaties. Pirmajā gadījumā jums ir ierobežota iespēju izvēle, jo vizualizācija nav šīs kategorijas galvenais uzdevums programmatūra. Ja vēlaties izmantot kaut ko sarežģītāku par joslu diagrammu, labāk izmantot importēšanu. Pretējā gadījumā jums būs daudz jādara manuāli, un tas ir pilns ar kļūdām.

Lieliski, izmantojot attēlu rediģēšanas programmas, ir tas, ka jums ir lielāka kontrole pār atsevišķiem elementiem un varat darīt visu, izmantojot vilkšanas un nomešanas metodi. Mainiet kolonnu vai vienas kolonnas krāsu, palieliniet vai samaziniet centra līniju biezumu, visvairāk komentējiet svarīgas īpašības- un tas viss tikai ar dažiem klikšķiem.

Iespējas

Ir daudz programmu darbam ar ilustrācijām, taču starp tām ir tikai dažas, kuras izmantotu lielākā daļa cilvēku, un ir tikai viena, kas tiek izmantota visur. Visticamāk, noteicošais faktors jums būs cena. Cenas svārstās no nulles ( bezmaksas programmas atvērtā koda) līdz vairākiem simtiem dolāru.

ADOBE ILLUSTRATOR

Jebkāda grafika, kuras pamatā ir statistikas dati, kas izskatās pēc pasūtījuma vai parādās lielā publikācijā, visticamāk, kādā posmā ir apstrādāta programmā Adobe Illustrator. Šī programma ir nozares standarts. Katra grafika, kas parādās New York Times lapās, tika izveidota vai rediģēta programmā Illustrator.

Illustrator popularitāte tipogrāfijā ir saistīta ar to, ka šajā programmā jūs strādājat ar vektoriem, nevis pikseļiem. Tas nozīmē, ka jūs varat izveidot lielu grafiskie objekti nesamazinot attēla kvalitāti. Pretējs piemērs ir, ja jums ir jāpalielina zemas izšķirtspējas fotoattēls, un attēls ir sadalīts krāsainos kvadrātveida pikseļos.

Šī programma sākotnēji tika izstrādāts burtveidolu projektēšanai, bet vēlāk ieguva popularitāti ilustratoru vidū kā logotipu un mākslas grafikas veidošanas rīks. Un tas ir tieši tas, ko Adobe Illustrator galvenokārt izmanto līdz šai dienai.

Tomēr programma nodrošina piekļuvi dažām pamata datu vizualizācijas funkcijām, izmantojot Graph rīku. Ar to jūs varat izveidot gandrīz visus diagrammu un grafiku pamatveidus, piemēram, histogrammas, sektoru diagrammas un laika rindu diagrammas. Jums ir jāievada skaitļi nelielā tabulā, taču tas ir viss, ko var paveikt ar datu manipulācijām.

Pats labākais par Illustrator, kad runa ir par informācijas grafiku, ir tas, ka tas ir elastīgs un viegli lietojams, ar daudzām pogām un funkcionalitāti. Sākumā to pārpilnība var tevi nedaudz mulsināt, taču pie tām var ātri pierast, par to pārliecināsies pats, izlasot ceturto nodaļu (“Moteru vizualizācija laika gaitā”). Tieši šī elastība ļauj labākajiem informācijas grafikas dizaineriem izveidot kodolīgus un saprotamus objektus.

Illustrator ir pieejams gan Windows, gan Mac versijās. Tomēr šai programmai ir arī viens trūkums: tā nav lēta. It īpaši augsta cena tas sāk šķist, kad domājat par to, cik daudz jūs varat darīt ar kodu, kas parasti ir bezmaksas (pieņemot, ka jums jau ir mašīna, kurā to lejupielādēt). Taču, ja salīdzina šīs programmas cenu ar citiem jau gataviem risinājumiem, Illustrator nešķitīs tik dārgs.

Rakstīšanas laikā jaunākā Illustrator versija Adobe vietnē maksā 599 USD, un jūs varat saņemt ievērojamas atlaides citur (vai saņemt vairāk). vecā versija). Turklāt Adobe piedāvā ievērojamas atlaides studentiem un citiem zinātnieku aprindām, tāpēc jūs, iespējams, varēsit iegūt programmu par ievērojami mazāku cenu. (Šī ir visdārgākā programma, ko jebkad esmu iegādājies, taču es to izmantoju gandrīz katru dienu.)

TINTES SKAITS

Inkscape ir bezmaksas (atvērtā koda) alternatīva programmai Adobe Illustrator. Ja vēlaties izvairīties no izmaksām, Inkscape ir labākā izvēle. Es vienmēr izmantoju programmu Illustrator, jo, kad es pirmo reizi sāku apgūt informācijas grafikas smalkumus, visi to izmantoja, un tas šķita visgudrākais. Bet es dzirdēju labas atsauksmes par Inkscape, un, tā kā tas ir bezmaksas, nav nekā ļauna to izmēģināt. Vienkārši negaidiet, ka par šo tēmu atradīsit tik daudz tīmekļa pamācību, cik ir Illustrator.

CITI

Illustrator un Inkscape noteikti nav vienīgās programmas, kuras varat izmantot, lai izveidotu un pulētu diagrammas un diagrammas. Vienkārši lielākā daļa cilvēku tos izmanto. Bet ir arī speciālisti, kas dod priekšroku Corel Draw. Šī programma pastāv tikai Windows versijā un maksā apmēram tikpat, cik Illustrator. Jūs varat to atrast nedaudz lētāk, ja zināt, kur meklēt.

Ir arī citas programmas, piemēram, Aviary's Raven un Lineform, taču tās piedāvā mazāku rīku komplektu. Atcerieties, ka Illustrator un Inkscape ir galvenie grafisko dizaineru rīki un tiem ir visbagātīgākā funkcionalitāte. Bet, ja vēlaties tikai nedaudz izmainīt dažas esošās diagrammas, varat izvēlēties vienkāršāku (lētāku) programmatūru.

Kompromisi

Tādas programmas kā Illustrator un Inkscape ir paredzētas tikai vienai lietai: ilustrācijai. Tie nav īpaši paredzēti informācijas grafikas izstrādei. Viņu galvenais uzdevums ir Grafiskais dizains, tāpēc daudzi cilvēki neizmanto visas Illustrator un Inkscape piedāvātās funkcijas. Tie arī nav īpaši piemēroti liela datu apjoma pārvaldībai un nav salīdzināmi ar programmām, kuras pats rakstāt konkrētiem mērķiem, vai ar citiem rīkiem, kas ir īpaši izstrādāti datu vizualizācijai. Citiem vārdiem sakot, grafiskais redaktors nepieciešams, ja vēlaties izveidot pietiekami augsta līmeņa grafiku, lai tos publicētu. Tie palīdz ne tikai ar estētiku, bet arī padara objektu lasāmāku un saprotamāku, ko bieži vien ir grūti panākt, strādājot ar automātiski ģenerētiem rezultātiem.

Kartēšana

Kartēšanas rīku iespējas daļēji sakrīt ar vizualizācijas rīku iespējām, par kurām mēs runājām iepriekš. Taču pēdējos gados ir būtiski pieaudzis ģeogrāfisko datu apjoms, un līdz ar to ir pieaudzis arī karšu veidošanas veidu skaits. Mobilās pozicionēšanas pakalpojumi pieaug, un tiem tiek pievienotas arvien lielākas datu kopas ar platuma un garuma grādiem. Turklāt kartes ir neticami intuitīvs veids, kā vizualizēt datus, un tās ir vērts aplūkot tuvāk. Pirmajos tīmekļa gados karšu izveide nebija vienkārša. Un rezultāts nebija elegants. Vai atceraties tos laikus, kad jums bija jāiet uz MapQuest, jāizpilda virkne norādījumu un galu galā tika izveidota maza, statiska karte? Kādā brīdī Yahoo bija šāds pakalpojums. Tas ilga līdz brīdim, kad Google ieviesa kustīgas kartes principu (39. att.). Lai gan tehnoloģija tika izgudrota agrāk, tā netika izmantota, līdz lielākajai daļai cilvēku interneta ātrums pieauga pietiekami, lai nodrošinātu nepārtrauktu datu atjaunināšanu. Šodien mēs jau esam pieraduši pie karšu pārvietošanas. Mēs varam tos viegli ritināt un tuvināt, un dažos gadījumos mums ir vajadzīgas kartes ne tikai braukšanas virziena noteikšanai - tās kļūst par galveno saskarni datu kopas apskatei.

Rīsi. 39. Varat arī saņemt norādījumus pakalpojumā Google Maps

Piezīme: Kustīgās kartes ir kartogrāfisko datu ieviešanas princips, kas mūsdienās ir kļuvis gandrīz universāls. Lielas kartes, kas citādi neietilpst ekrānā, ir sadalīti mazākos attēlos (vai elementos). Jūs redzat tikai tās flīzes, kas nokrīt uz jūsu loga, un visas pārējās ir paslēptas. Taču, tiklīdz velciet karti ar peli, parādās citas flīzes, un līdz ar to šķiet, ka pārvietojaties pa vienu lielu karti. Līdzīgs princips displeju var redzēt arī, skatoties augstas izšķirtspējas fotogrāfijas.

Iespējas

Tā kā ģeogrāfiskie dati kļūst arvien pieejamāki publiskajā telpā, ir pieejami jauni un daudzveidīgāki rīki karšu veidošanai, izmantojot šos datus. Dažiem no tiem ir nepieciešamas tikai nelielas programmēšanas prasmes, lai ar viņu palīdzību varētu kaut ko izveidot un palaist. Darbs ar citiem rīkiem prasa nedaudz lielāku darbaspēka un laika ieguldījumu, taču ir arī risinājumi, kuriem nav nepieciešamas programmēšanas prasmes.

GOOGLE, YAHOO UN MICROSOFT KARTES

Šis ir vienkāršākais tiešsaistes risinājums, taču tas prasa arī vismaz nelielas programmēšanas zināšanas. Jo labāk pārvaldāt kodēšanu, jo vairāk varat paveikt ar Google, Yahoo un Microsoft piedāvātajām karšu API.

Pamata funkcionalitāte visos trīs gadījumos ir diezgan līdzīga, taču, ja šajā jomā tikai sperat pirmos soļus, iesaku sākt ar Google. Es domāju, ka šī ir visuzticamākā iespēja. Google ir API, lai izveidotu kartes gan JavaScript, gan Flash, kā arī citi ar ģeogrāfiju saistīti pakalpojumi, piemēram, ģeokodēšana un norādes. Noskatieties pamācību, lai sāktu darbu ar sistēmu, pēc tam iedziļinieties citās tēmās, piemēram, marķēšanā, optimālo maršrutu atrašanā un slāņu pievienošanā. Visaptveroši norādījumi ar koda fragmentiem un paraugprakse palīdzēs ātri sākt darbu.

Rīsi. 40. Atzīmēšana pakalpojumā Google Maps

Yahoo ir arī API karšu izveidei, izmantojot JavaScript un Flash, kā arī dažus ģeogrāfiskos pakalpojumus, taču es neesmu pārliecināts, cik ilgi tie būs pieejami, ņemot vērā pašreizējo uzņēmuma stāvokli. Laikā, kad tika rakstīta šī grāmata, Yahoo bija novirzījis savu uzmanību no lietojumprogrammu izstrādes uz satura piegādi. Microsoft piedāvā arī API JavaScript (saukta par Bing) un citu platformu Silverlight, kas ir izstrādāta kā atbilde uz Flash.

Iepriekš minētie tiešsaistes karšu veidošanas pakalpojumi ir diezgan vienkārši. Ja nepieciešams izveidot sarežģītākas kartes, visticamāk, funkcionalitāte būs jāievieš pašam. Tomēr ir arī ArcGIS, kas tika izstrādāts kā darbvirsmas lietojumprogramma karšu veidošanai. Tā ir liela programma, kas ļauj pārvietot milzīgu datu apjomu uz karti un veikt daudzas darbības, piemēram, izlīdzināt un apstrādāt. To visu var izdarīt caur lietotāja interfeiss, tāpēc jums nav jāraksta nekādi kodi.

Gandrīz visi grafikas pakalpojumi un nodaļas, kurās strādā karšu profesionāļi, izmanto ArcGIS. Daži cilvēki ir traki pēc viņas. Tātad, ja jūs interesē detalizētu karšu izveide, iespējams, vēlēsities apskatīt ArcGIS.

Esmu izmantojis ArcGIS vairākos projektos, jo es dodu priekšroku "programmatūras" maršrutam, un man tas viss patīk funkcionalitāte tie vienkārši nebija vajadzīgi. Šādam bagātīgam rīku komplektam ir arī mīnuss: jātiek galā ar tikpat lielu skaitu pogu un izvēlņu. Ir pieejami arī tiešsaistes un serveru risinājumi, taču salīdzinājumā ar citiem risinājumiem tie šķiet nedaudz neveikli.

PIETIECĪGAS KARTES

Es jau minēju Modest Maps iepriekš, kad sniedzu piemēru, kas parādīts attēlā. 29. Tas demonstrēja Walmart izaugsmi. Modest Maps ir Flash un ActionScript bibliotēka flīžu kartēm, un tā ir saderīga arī ar Python. Bibliotēku uztur cilvēku grupa, kas saprot tiešsaistes kartēšanu un lieliski strādā gan klientu, gan sava prieka labā, kas daudz pasaka par bibliotēkas kvalitāti.

Smieklīgākais ir tas, ka Modest Maps ir vairāk ietvars, nevis API tādu karšu izveidei, ko piedāvā Google. Tas nodrošina absolūto minimumu no tā, kas nepieciešams tiešsaistes kartes izveidošanai, un pēc tam netraucē jūsu darbam un dod iespēju īstenot to, ko vēlaties. Varat izmantot dažādu pakalpojumu sniedzēju flīzes vai pielāgot karti savai lietojumprogrammai. Piemēram, attēlā. 29. attēlā ir parādīta karte zilā un melnā krāsā, taču to var viegli nomainīt uz baltu un sarkanu, kā parādīts attēlā. 41.

Rīsi. 41. Karte baltā un sarkanā dizainā, izmantojot Modest Maps

Modest Maps tiek izplatīts saskaņā ar BSD licenci, tāpēc varat ar to darīt visu, ko vēlaties, pilnīgi bez maksas. Tiesa, šim nolūkam jums būs jāiemācās strādāt ar Flash un ActionScript, taču par tiem mēs runāsim astotajā nodaļā (“Telpisko attiecību vizualizācija”).

POLIKARTES

Polymaps ir sava veida Modest Maps bibliotēkas JavaScript versija. To izstrādāja un uzturēja daži no tiem pašiem cilvēkiem, un tas piedāvā daudz tādu pašu funkcionalitāti, bet daudz vairāk palaišanas. Modest Maps nodrošina tikai pamata karšu veidošanas funkcionalitāti, savukārt Polymaps ir iebūvētas funkcijas, piemēram, kartogrammas (42. attēls) un burbuļu diagrammas.

Rīsi. 42. Kartogramma, kas parāda bezdarba līmeni, ieviesta programmā Polymaps

Tā kā tas viss ir JavaScript, objekts šķiet vieglāks (jo tas prasa mazāk koda rindiņu) un darbojas mūsdienu pārlūkprogrammās. Polymaps datu attēlošanai izmanto mērogojamu vektorgrafiku (SVG), un tāpēc tas nedarbojas vecākās versijās. Internet Explorer, lai gan lielākā daļa cilvēki nāk ejot līdzi laikam. Starp citu, tikai 5% FlowingData vietnes apmeklētāju izmanto novecojušas tīmekļa pārlūkprogrammas, un man ir aizdomas, ka šis skaits drīz nokritīsies līdz nullei.

Personīgi es visvairāk novērtēju bibliotēkās, kas paredzētas karšu izveidei JavaScript valodā, ir tas, ka kods pārlūkprogrammās darbojas bez aizķeršanās. Jums nekas nav jādara – ne kompilēšana, ne Flash eksportēšana. Tā rezultātā visu ir viegli sākt un viegli atjaunināt.

Pamatizplatījumā R nav kartēšanas funkcionalitātes, taču ir vairākas pakotnes, kas ļauj veikt kartēšanu arī R. Attēlā 43. attēlā parādīta neliela karte, ko izveidoju programmā R. Anotācijas tika pievienotas vēlāk programmā Adobe Illustrator.

Rīsi. 43. ASV karte, kas izveidota R

Kartes, kas izgatavotas R formātā, ir ierobežotas ar iespējām un dokumentācija nav lieliska, tāpēc šo karšu veidošanas metodi izmantoju tikai tad, ja man ir jāizdara kaut kas vienkāršs un es šobrīd strādāju R. Pārējos gadījumos es labprātāk izmantoju rīkiem, kurus jau minēju iepriekš.

TIEŠSAISTES RISINĀJUMI

Ir arī vairāki tiešsaistes karšu risinājumi, kas atvieglo ģeogrāfisko datu vizualizāciju. Vairumā gadījumu viņi paņem kartes, kuras cilvēki izmanto visbiežāk, un noņem no tām visas nevajadzīgās lietas. Izrādās kaut kas līdzīgs vienkāršotajam ArcGIS. Divi no šiem resursiem ir brīvi pieejami. Tie ir Many Eyes un GeoCommons. Pirmajam no tiem - mēs par to runājām iepriekš - ir tikai pamata funkcionalitāte darbam ar datiem par valstīm vai ASV štatiem. Taču GeoCommons nodrošina lielāku funkcionalitāti un bagātīgākus mijiedarbības rīkus. GeoCommons atbalsta arī visizplatītākos karšu datu failu formātus, piemēram, shape failus un KML.

Ir arī daudz maksas risinājumu, no kuriem noderīgākie ir Indiemapper un SpatialKey. SpatialKey ir vairāk piemērots biznesam un lēmumu pieņemšanai, savukārt Indiemapper ir lieliski piemērots kartogrāfiem un dizaineriem. Attēlā 44. attēlā ir parādīts kartogrammas piemērs, ko Indiemapper veidoju tikai dažu minūšu laikā.

Rīsi. 44. Kartogramma izveidota programmā Indiemapper

Kompromisi

Kartēšanas programmām ir daudz dažādu veidu, un tās ir izstrādātas, lai apmierinātu dažādas vajadzības. Būtu lieliski apgūt vienu programmu un spēt izveidot jebkura veida karti, kādu vien var iedomāties. Diemžēl tas tā nedarbosies.

Piemēram, ArcGIS ir daudz funkciju, taču jūs, iespējams, nevēlaties tērēt laiku, lai to apgūtu, vai naudu tā iegādei, ja jums ir jāizveido tikai vienkāršas kartes. Gluži pretēji, bezmaksas R ar tās pamata funkcionalitāti var būt pārāk vienkārša jūsu vēlamajam. Ja tavs mērķis ir interaktīvas tiešsaistes kartes, Modest Maps un Polymaps var būt piemērotas, taču tad būs nepieciešamas nopietnākas programmēšanas prasmes.

Izpētiet savas iespējas

Šis rīku saraksts nekādā gadījumā neizsmeļas visas iespējas, ko varat izmantot datu vizualizēšanai, taču sākumā ar to jums vajadzētu pietikt. Ir daudz par ko domāt un ar ko spēlēties. Izmantotie rīki lielā mērā ir atkarīgi no tā, ko vēlaties sasniegt, un vienmēr ir vairākas pieejas uzdevuma veikšanai pat vienas programmas ietvaros. Vai vēlaties izveidot statisku informācijas diagrammu? Varbūt man vajadzētu palikt pie R vai Illustrator. Vai vēlaties izveidot interaktīvu rīku savai tīmekļa lietojumprogrammai? Pēc tam izmēģiniet JavaScript vai Flash.

Veicu aptauju vietnē FlowingData, mēģinot noskaidrot, ko cilvēki galvenokārt izmanto datu analīzei un vizualizācijai. Atsaucās nedaudz vairāk nekā 1000 cilvēku. Rezultāti ir parādīti attēlā. 45.

Rīsi. 45. Ko FlowingData lasītāji izmanto datu analīzei un vizualizēšanai

Atbilžu vidū ir vairāki acīmredzami līderi, īpaši ņemot vērā FlowingData tēmu. Pirmajā vietā ir Excel, kam seko R. Un tad, izvēloties programmatūru, viedokļi un preferences atšķiras. Kategoriju “Cits” izvēlējās vairāk nekā 200 cilvēku. Daudzi komentētāji norādīja, ka viņi apvieno rīkus, lai apmierinātu dažādas vajadzības – kas parasti ir visefektīvākā pieeja ilgtermiņā.

Opciju apvienošana

Daudziem cilvēkiem patīk strādāt tikai ar vienu programmu - tas ir vienkārši un ērti. Nav jāmācās nekas jauns. Ja ar to pietiek, lai apmierinātu vizualizācijas vajadzības, tad no tā nav jāatkāpjas šis princips. Bet pēc tam, kad būsit pietiekami ilgi strādājis ar datiem, pienāks brīdis, kad sapratīsit, ka programmatūras iespējas ir izsmeltas. Jūs zināt, kas jums jādara ar datiem vai kā tos vizualizēt, taču programma neļaus jums to darīt vai padarīs procesu laikietilpīgāku, nekā tam vajadzētu būt.

Jūs varat samierināties ar šo situāciju vai arī varat sākt lietot citas programmas, kuru apgūšana prasīs laiku, bet kas palīdzēs realizēt jūsu dizaina vīziju. Iesaku izvēlēties otro ceļu. Apgūstot dažādus rīkus, jūs nepārņemat datus un varat elastīgi rīkoties ar dažādiem vizuāliem uzdevumiem un iegūt reālus rezultātus.

Iesaiņošana

Atcerieties: neviens no šiem rīkiem nav panaceja. Galu galā datu analīze un dizains vienmēr būs jūsu ziņā. Galu galā instrumenti ir tikai instrumenti. Tas, ka jums ir āmurs, nenozīmē, ka varat uzcelt māju. Tāpat jūsu rīcībā var būt lieliska programma un superdators, bet, ja jūs nezināt, kā šos rīkus izmantot, jums to nav. Jūs izlemjat, kādus jautājumus uzdot, kādus datus izmantot un kādus to aspektus izcelt, un to saprotot ar pieredzi.

Bet tev ir paveicies! Galu galā tam ir veltīta pārējā grāmatas daļa. Nākamajās nodaļās jūs iepazīsities ar informācijas dizaina pamatjēdzieniem un uzzināsit, kā teoriju īstenot praksē, izmantojot kādu iepriekš apspriesto rīku kombināciju. Jūs uzzināsit, ko meklēt jūsu rīcībā esošajos datos un kā tos vizualizēt.

Streamgrāfs ir stacked apgabalu diagrammas veids, kas ir nobīdīts ap centrālo asi, tādējādi radot skaistas, plūstošas ​​formas (īpaši, strādājot ar lielām datu kopām). Izstrādāja Lī Bairons 2008. gadā. Ģeneratoru var lejupielādēt no GitHub. Piezīme josla

Mūsdienās vizualizācijas jomā tiek pētītas metodes datu pārveidošanai vizuālos attēlos, lai labāk izprastu informāciju. Viens no visizplatītākajiem vizuālajiem attēlojumiem, līniju diagramma, ir izmantots vairāk nekā tūkstoš gadus. Un tādi rīki kā joslu diagramma, sektoru diagramma, izkliedes diagramma un histogramma tika izgudroti pirms vairāk nekā diviem gadsimtiem.

Kopš tā laika ir pagājis daudz laika, un progress nav apstājies. Mūsdienās lietotāju rīcībā ir desmitiem programmu, kas ļauj vizualizēt datus. Tajā pašā laikā vizualizācija jau sen ir “migrējusi” uz trīsdimensiju telpu: zinātnieki to izmanto, lai vizuāli prezentētu pētījumu rezultātus, meteorologi sastāda laikapstākļu kartes, vadītāji izmanto 3D datu modeļus, lai pieņemtu ātrus un efektīvus vadības lēmumus.

Bet vai vizualizācijas tehnoloģiju attīstība apstāsies? Protams, nē. Ko mūs sagaida nākotne? Atbildi uz šo jautājumu var rast, izsekojot vizualizācijas vēsturei, jo ne velti saka: "Bez pagātnes zināšanām nav nākotnes."

Īsa ekskursija vēsturē

Tā kā mēs runājam par vizualizāciju, iepazīstināsim ar tās vēsturi vizuālā formā – šādi to attēlojis Maikls Drīlijs, grāmatas Handbook of Data Visualization autors:

Pirms 17. gadsimta – agrīnās kartes un diagrammas

Pirmā vizualizācijas sēkla sākās ģeometriskās diagrammās, zvaigžņu pozīciju tabulās, ķermeņa daļu ilustrācijās un navigācijas kartēs.

Starp agrīnajiem kvantitatīvās informācijas attēlojumiem ir zvaigžņu ķermeņu kustības grafiks, kas parāda planētu kustību divdimensiju koordinātu sistēmā. Šī diagramma sniedz labu šī perioda ilustrāciju:

1600-1699 – Mērījumi un teorijas

17. gadsimtā zinātniekus interesēja, kā izmērīt laiku, attālumu un telpu. Galvenais uzsvars tika likts uz kartēm un navigāciju.

Tieši šajā periodā parādījās koordinātu sistēma, dzima uzticamības teorija un demogrāfiskā statistika.

Tā laika ilustrācija ir atrodama Kristofera Šīnera darbā, kas datēts ar 1630. gadu. Vēlāk Edvards Tufte tam izmantoja terminu "mazie komplekti", kas nozīmēja viena elementa atkārtošanos daudzas reizes, lai parādītu notiekošo dinamiku un izmaiņas.

Šajā attēlā redzami mēneša laikā novērotie saules plankumi:

1700-1799 – Jaunas grafiskās formas

18. gadsimts bija laiks, kad tika pārsniegts "acīmredzamais". Tagad kartes mēģina attēlot ne tikai ģeogrāfiskās atrašanās vietas punktu, bet arī parādās kontūras un izolētas līnijas.

Laikmeta piemēri: ģeoloģisko defektu tematiskās kartes, ekonomiskie aprēķini un medicīniskās ilustrācijas. Abstraktās vizualizācijas kļūst arvien izplatītākas. Sāk uzkrāties informācijai par politiskajiem un ekonomiskajiem notikumiem, rodas nepieciešamība pēc jaunām vizuālām formām to attēlošanai.

Tālāk ir sniegts viens no pirmajiem piemēriem papildu datu pārklājumam ģeogrāfiskajā kartē.

1850. gads – modernās grafikas sākums

Līdz tam laikam parādījās galvenie diagrammu veidi: sektoru, joslu un apgabalu diagrammas. Mūsdienu grafikas sākumpunkts tiek uzskatīts par slaveno holēras vizualizāciju Londonas ielās, ko veidojis Džons Snovs:

1858. gadā britu medmāsa un sociālā aktīviste Florence Naitingeila izgudroja pirmo sektoru diagrammu, kuru viņa izmantoja Krimas karā, lai parādītu, ka daudz vairāk karavīru nomira no slimībām (zilā krāsā) nekā kaujas laukā (sarkanā krāsā) vai citu iemeslu dēļ (melns). ):

1900.-1950. gadi – nemierīgo gadu

Sākās filozofiskā spriešana un cilvēku dalīšana “vizuālākos” un “tabulārākos”. Briti uzskatīja sevi par tabuliskākiem. Britu akadēmijas devīze tolaik bija datu vākšana (“kviešu graudu vākšana”), taču, viņuprāt, vizualizācija jau bija no maiznīcu sērijas.

1950 – 1975 – Renesanse

Zinātnieki un rakstnieki sāka aktīvi popularizēt vizualizācijas ideju. Līdzīgi darbi iznāca burtiski viens pēc otra. 1962. gadā Džons Tūkijs uzrakstīja grāmatu "Datu analīzes nākotne", nodalot matemātiku no statistikas. Un, ja pirmais necieš vizualizācijas, tad statistika iegūst lielāku nozīmi un formu, pateicoties tām.

Šajā laikā parādījās pirmās interaktīvās vizualizācijas. Piemērs ir šī Ričarda Beikera vizualizācija:

1973. gadā amerikāņu zinātnieks Hermans Černovs izmantoja sejas attēlus, lai vizualizētu datus. Černova sejas ir daudzdimensionālu datu attēlojums cilvēka sejas un tās atsevišķu daļu veidā. Tālāk ir sniegts piemērs advokātu vērtējumam par 12 tiesnešiem, pamatojoties uz Černova personībām:

1975 – tagad - Interaktīva un dinamiska augstas izšķirtspējas vizualizācija

Šodien mums ir plaša piekļuve datu analīzes un vizualizācijas rīkiem. Par galvenajiem momentiem, kas iezīmēja interaktīvās un dinamiskās vizualizācijas laikmetu, var uzskatīt interaktīvu sistēmu rašanos, spēju mijiedarboties ar modeļiem (tostarp 3D) un datora jaudas pieaugumu līdz ar lētākām tehnoloģijām.

Protams, galvenā loma šajā procesā bija interneta parādīšanās un līdz ar to arī piekļuve lielam datu apjomam.

Spilgts šī laikmeta vizualizācijas piemērs ir Opte projekta interneta vizualizācija:

Kā jūs viegli varat uzminēt pēc nosaukuma, datu vizualizācija ir jebkuru datu grafisks attēlojums. Tajā pašā laikā internetā es atradu daudzas definīcijas, kas attiecas uz datu vizualizāciju:

  • Grafiki un diagrammas,
  • Infografikas un diagrammas,
  • prezentācija un datu analīze,
  • Interaktīva stāstu stāstīšana,
  • biznesa analīze un informācijas paneļi,
  • Zinātniskā un medicīniskā attēlveidošana,
  • Kartes un kartogrammas.

Tad katrs pats izlemj, ko saprot ar datu vizualizāciju. Piezīmes beigās es jums pastāstīšu, ko es nolēmu pats. Tikmēr apskatīsim katru no veidiem sīkāk un noskaidrosim to atšķirības un īpašības.

Grafiki un diagrammas

Iespējams, mums vispazīstamākais datu vizualizācijas veids. Izmanto gan datu prezentēšanai, gan analīzei. Jūs varat viņus satikt darbā, žurnālos un zinātniskos ziņojumos. Zināšanas par esošajiem diagrammu un grafiku veidiem parasti iegūstam no skolas vai no standarta komplekta programmā Excel. Tomēr daži cilvēki zina, ka grafiku un diagrammu pasaule neaprobežojas tikai ar punktiem, joslām un sektoru diagramma. Ir aptuveni 15 labi zināmi diagrammu veidi, un kopumā to ir vairāk nekā 60, un to skaits ar katru dienu palielinās - cilvēki izdomā jaunus veidus, lai vizualizētu sarežģītus un neparastus datus. Mēs detalizēti aplūkosim diagrammu un diagrammu veidus vienā no turpmākajām ziņām.




Infografikas un diagrammas

Infografikas pēdējos gados ir kļuvušas ļoti populāras, lai gan tās pastāv jau ilgu laiku. Infografikas attiecas uz datu žurnālistiku, kur grafiki un diagrammas izskaidro visus faktus par izvēlēto tēmu. Parasti infografikas ir statiskas un sastāv no garas “lapas” ar attēliem un tekstu. Atšķirīga iezīme infografika ir tāda, ka tā sniedz jau gatavus secinājumus, tas ir, lasītājs tiek vadīts aiz rokas par izvēlēto tēmu un vienlaikus norūdīts ar cipariem un attēliem. Bieži tiek izmantots ar roku zīmēts vai karikatūras stils. Daži mediji katru dienu izlaiž infografikas, piemēram, AiF. Infografikas bums izraisījis kopējā infografikas kvalitātes līmeņa pazemināšanos. To bieži izmanto nevietā vai "skaistumam", lai gan, protams, ir brīnišķīgi un interesanti piemēri.

Infografikas piemēri

Napoleona armijas spēks Krievijas karagājiena laikā, 1869. g

Dažādu valstu iedzīvotāji, 1912. gads

10 tipogrāfijas baušļi

Spārnu atloks

Veģetārieši skaitļos

Datu prezentācija un analīze

Viens no visizplatītākajiem datu vizualizācijas izmantošanas veidiem ir informācijas sniegšana diagrammu vai infografiku veidā. Un, ja ar to, manuprāt, viss ir skaidrs, tad vizualizācijas izmantošanu informācijas analīzei galvenokārt izmanto tikai biznesa analītiķi un zinātnieki. Kāda ir atšķirība?

Analizējot datus, izmantojot vizualizāciju, tiek izmantota tā sauktā ātrā prototipēšana - tas ir, izveidojot lielu skaitu dažādu vizuālo priekšstatu par tiem pašiem datiem. Tas tiek darīts, lai būtu iespējams atrast no pirmā acu uzmetiena slēptās sakarības un atkarības, kā arī sniegt datu kopas sākotnējo novērtējumu iespējām nākotnē izmantot sarežģītākus analīzes rīkus. Šo pieeju sauc par izpētes datu analīzi (EDA), ko krievu valodā var tulkot kā pētniecisko datu analīzi. Galvenā atšķirība no datu prezentācijas ir tāda, ka vizualizācija šeit var būt “rupja” un neglīta, bet to dara ātri un viena persona vai mazs. darba grupa. Šim nolūkam visbiežāk izmanto Excel, R vai Matlab.

EDA ir viens no datu ieguves rīkiem; ir pat apmācības par to, kā to izdarīt

EDA vizualizācijas piemēri





Interaktīva stāstu veidošana

Stāstīšana vai krievu valodā skazatsievo (izklausās smieklīgi) ir dažu prezentācija noderīga informācija formā interesants stāsts. Kādu iemeslu dēļ video bieži sauc par interaktīvo stāstu stāstīšanu, bet tas tā nav, tas ir tikai cita veida informācijas grafika. Interaktīvā stāstīšana ir stāsts, ar kuru klausītājs var mijiedarboties. Savā būtībā tas ir tuvu datu žurnālistikai un infografikai, taču atšķiras ar to, ka lietotājs var kontrolēt informācijas attēlošanu un atrast tās atkarības, kuras autors nav atradis. Šajā ziņā tā ir tuva pētnieciskai datu analīzei, taču atšķiras ar to, ka dati ir iepriekš apstrādāti un tiek pasniegti analīzei ērtā formā, turklāt ir arī mājieni vai iepriekš uzrakstīti lietošanas scenāriji. Tāpēc visbiežāk interaktīvo stāstu stāstīšanu sauc par interaktīvo infografiku, taču, lai par to kļūtu, nepietiek tikai ar uznirstošo logu pievienošanu statiskajai infografikai.
Mūsdienās aktīvi attīstās interaktīvās vizualizācijas. Spēcīgus piemērus var atrast lielākajos plašsaziņas līdzekļos vai atsevišķu projektu veidā.

Interaktīvās stāstīšanas piemēri (noklikšķinot uz attēla, dodieties uz vietni)

biznesa analīze un informācijas paneļi,

Biznesā aktīvi tiek izmantota vizualizācija. Princips “runāt ar datiem” palīdz uzņēmumiem nopelnīt vairāk un klientiem saņemt labākais serviss. Vienreizējai analīzei parasti tiek izmantots Excel vai R. Tomēr tas nav ērti, ja jums pastāvīgi jāuzrauga daži rādītāji (KPI). Lai izsekotu ikdienas KPI, tiek izmantoti informācijas paneļi - displeji, kas vienuviet parāda visus nepieciešamos rādītājus grafiku, diagrammu un tabulu veidā.

Efektīvu informācijas paneļu projektēšana ir sarežģīts un neparasts uzdevums. Viņi bieži ir pārslogoti ar nevajadzīgu informāciju vai mēģina izmantot visus iespējamos veidņu diagrammas veidus. Bieži vien, lai izveidotu labu informācijas paneli, ir nepieciešams izveidot jaunus informācijas vizualizācijas veidus. Tēma aktīvi attīstās, jo uzņēmējdarbībā arvien vairāk tiek izmantota analītika. Informācijas paneļi tiek izmantoti arī personīgai lietošanai (fitnesa izsekotāji, personīgo izdevumu analīze utt.)

Kartes ir viena no vecākajām vizualizācijas metodēm, kas attēlo apkārtējo realitāti. Kartogramma ir karte ar informāciju, kas uzdrukāta krāsu vai citu līdzekļu veidā. Varbūt es neprecīzos ar terminiem šeit, lai kartogrāfi man piedod. Kartogrammas var izmantot, lai attēlotu jebkādu informāciju – no iedzīvotāju blīvuma līdz lamuvārdu lietošanas biežumam katrā valsts reģionā. Tos var izmantot jebkurā no vizualizāciju veidiem, par kuriem mēs runājām iepriekš. Es tos izcēlu atsevišķā rindkopā, jo to ieviešana ievērojami atšķiras no citiem vizualizāciju veidiem (gaidām piezīmi par to).

Kartogrammu piemēri (dodieties uz vietni, noklikšķinot uz attēla)

Summējot

Piezīme izrādījās necerēti gara. Varbūt tas ir labi, jūs uzreiz varat redzēt, cik daudz ir datu vizualizācijas pasaulē. Ko es saprotu ar šo jēdzienu un par ko būs šis emuārs?
Manuprāt, datu prezentācija galvenokārt ir saistīta ar grafikiem un diagrammām, kā arī interaktīvajām infografikām. Tam tiks veltīta lielākā daļa piezīmju; būs interesanti arī iedziļināties kartēs un informācijas paneļos.