تجسم داده چیست: چیست و چیست. تجسم چیست، چگونه کار می کند یک هدف مشترک برای کل تیم تعیین کنید

3 D-تجسم با اطمینان در رتبه بندی های امیدوار کننده ترین فناوری های اطلاعات موقعیت پیشرو را اشغال می کند. چرا این بخش از راه حل ها در حال تقویت و گسترش موقعیت خود است، کاتالیزور تقاضا چیست، چه روند جدیدی در شرایط دشوار امروز ظهور می کند؟ در این مورد صحبت کردیم با سرگئی آستاخوف، رئیس کنسرسیوم پلتفرم تجسم داده های تعاملی (IDVP، فینالیست مسابقه "بهترین ابزارهای اطلاعاتی و تحلیلی - 2016".

عوامل محرک بازار تجسم داده های تعاملی چیست؟ امروز کلید هستند؟ چه روندهایی را می توان شناسایی کرد؟

محرک تقاضا برای ابزارهای تحلیلی، به طور متناقض، شرایط سخت اقتصادی است. در طول یک بحران، مدیران باید به سرعت اطلاعات دقیق و عینی در مورد وضعیت کسب و کار دریافت کنند. یکی دیگر از محرک های بازار، رشد بهمن مانند در حجم داده ها است که نیازمند رویکردهای جدیدی برای کار با اطلاعات است.

امروزه نیاز به فناوری هایی وجود دارد که توانایی پردازش حجم زیادی از داده ها، اینفوگرافیک های تعاملی و داشتن یک رابط تعاملی را داشته باشند. کاربران متوجه شده اند که تجسم و تعامل با داده ها می تواند به بهترین وجه به آنها کمک کند تا داده ها را درک کنند.

توسعه منحصر به فرد روسی پلت فرم بصری سازی داده های تعاملی (IDVP) برای این وظایف در نظر گرفته شده است - یک پلت فرم فن آوری برای تجسم عملیاتی و تجزیه و تحلیل داده ها. این ابزار مدیریتی مبتنی بر فناوری‌های مدل‌سازی عملکردی برای تحلیل موقعیت‌ها با استفاده از اینفوگرافیک‌های سه بعدی فضایی است. این پلتفرم برای حل مشکلات مدیریتی، اقتصادی و مالی-اقتصادی استفاده می شود.

وقتی ارائه دهندگان تجزیه و تحلیل در مورد داده های مشتری صحبت می کنند، اغلب در مورد مشکلات داده صحبت می کنند. اما اگر حالت ایده‌آل را در نظر بگیریم که داده‌های مشتری در نظم مثالی قرار دارند، چگونه می‌توانیم داده‌های مهم را از داده‌های بی‌اهمیت که مستقیماً بر فرآیندهای تجاری او تأثیر می‌گذارد از داده‌های غیرمهم تشخیص دهیم؟

"مهم ترین" داده ها از سیستم هایی که از حسگرها و مترها استفاده می کنند، به عنوان مثال در سیستم های کنترل فرآیند خودکار، سیستم های کنترل خط لوله، تولید انرژی و غیره، یا از سیستم هایی که فعالیت های عملیاتی را خودکار می کنند - بانکداری، پرداخت، سیستم های لجستیک و غیره به دست می آیند. و غیره، جایی که نقش عامل انسانی به حداقل می رسد یا اطلاعات به پول "واقعی" گره می خورد.

در واقع، ما در حال حاضر دو راه برای بهبود کیفیت داده ها می دانیم: یا به حداقل رساندن عامل انسانی - به دست آوردن داده ها از طریق ابزارهای فنی عینی، یا گره زدن اطلاعات برای پول.

به عنوان مثال، در مرکز نظارت بر سیستم اطلاعات پزشکی، در زمان نوبت دهی بیمار به صورت خودکار و بدون عامل انسانی، در دسترس بودن پزشکان اندازه گیری می شود.

کامل بودن افزودن منابع به سیستم نیز به سادگی کنترل می شود - اگر پزشک وارد سیستم نشود و هر روز در آن کار نکند نمی تواند حقوق دریافت کند. در حالی که بخش حسابداری جدا از مرکز مانیتورینگ وجود داشت، تعداد کارمندان در کلینیک ها بیشتر از قرار ملاقات ها بود. وقتی آنها متحد شدند، همه چیز به سرعت به حالت عادی بازگشت.

بنابراین، ایجاد یک راه حل تحلیلی نسل جدید، به طور معمول، هم مدیریت و هم اطلاعات، جدا از سازماندهی مجدد سیستم سطح پایین عملاً بی معنی است.

چگونه نقاط ضعف در فرآیندهای تجاری مشتری خود را تشخیص می دهید؟ درک درستی از گذشته، حال و پیش‌بینی توسعه کسب‌وکار خود، آگاهی از عملکرد و شاخص‌های کارایی فعلی برای مدیرعامل مهم است. چگونه با این موضوع کنار می آیید؟

در کار ما بر سه اصل اصلی تمرکز می کنیم.

  1. عجب افکتی- کیفیت گرافیک، انیمیشن و سرعت اپلیکیشن باعث می شود کار حداقل خسته کننده نباشد. همه عناصر برای نمایش با کیفیت بالا در صفحه نمایش های "بزرگ" و برای مدیران دستگاه های تلفن همراه یا رایانه های شخصی طراحی شده اند.
  2. تحلیل موقعیتی- توانایی محلی سازی سریع یک مشکل در اشیاء کنترلی، به عنوان مثال، با استفاده از اصل چراغ راهنمایی یا یک تصویر خاص.
  3. فرصتی نه تنها برای بومی سازی مشکل، بلکه برای فاش کردن همه چیز دلایل ممکنظاهر آن، در نتیجه فشار به سمت حل مشکل است.

توسعه هر راه حل تحلیلی - مرکز مانیتورینگ، بر روی پلت فرم IDVP با تعریف یک مورد، مشابه یک مورد تجاری آغاز می شود، که شامل شاخص های مختلفی است که مشکل حل شده را مشخص می کند و راه های حل آن را به مشتری نشان می دهد.

سپس، هنگامی که پرونده تشکیل شد و شاخص‌هایی برای حل مشکل انتخاب شدند، تصاویر بصری تعاملی سه بعدی را اختراع و توسعه می‌دهیم که «فضای پدیده» را تشکیل می‌دهند. یک برنامه ویژه مستقیماً مسئول تجسم داده ها است - "پخش کننده 3 بعدی" که تحت کنترل پلت فرم به صورت جداگانه برای هر کاربر مونتاژ می شود.

IDVP از مجموعه نسبتاً بزرگی از ابزارهای تحلیلی تعاملی پشتیبانی می کند. آنها توانایی مقیاس بندی، تغییر موقعیت در فضا برای ادراک بصری بهتر، توانایی انتخاب چندین اشیا یا مقادیر نمایش داده شده با پشتیبانی دریل به طور مستقیم از نمودار یا نمودار را دارند.

به عنوان مثال، برای "مرکز نظارت بر سازمان های مالی" از مفهوم یک رابط تعاملی گرافیکی بصری برای "ابر" وام گیرندگان استفاده کردیم که کار با آن آسان و راحت است. اندازه توپ در ابر اطلاعات مربوط به میزان وام های دریافتی توسط وام گیرنده را رمزگذاری می کند و رنگ اطلاعات مربوط به تعداد مشکلات شناسایی شده با وام گیرنده را رمزگذاری می کند. یک متخصص می تواند بر روی وام گیرنده مورد نظر خود کلیک کند و نمودار روابط مالی خود را با طرف مقابل در بخش ها، روابط و انواع مختلف مشاهده کند.

اپلیکیشن مرکز مانیتورینگ "انبار هوشمند" از یک نمایش بصری سه بعدی از انبار و یک نمودار خطی با مقیاس قابل تنظیم تعاملی استفاده می کند.

در واقع، این یک عکس دیجیتالی از تجارت انبار است که در آن پاسخ به مشکلات تولید به روشی شهودی ارائه می شود - به عنوان مثال، چرا صف های طولانی ماشین ها در انبار برای بارگیری و تخلیه تشکیل می شود؟

رویکرد تحلیل اطلاعات در ابزارهای تحلیلی کلاسیک چه تفاوتی با راه حل شما دارد؟

علیرغم موقعیت‌یابی عمومی پذیرفته‌شده سیستم‌های تحلیلی، به‌طور سنتی کاربر آن‌ها یک تحلیلگر آموزش‌دیده است که «مکعب‌ها» از داده‌ها را می‌چرخاند و به دنبال الگوهایی در آنها می‌گردد. برای تجزیه و تحلیل داده ها از جداول، نمودارها، نمودارها و موارد دیگر استفاده می کند.

ما کاربر دیگری را برای خود انتخاب کردیم - این اول از همه، یک مدیر ارشد، یک صاحب کسب و کار، یک رهبر صنعت است که دائماً تحت محدودیت زمانی محدود است. برای او، سرعت تصمیم گیری مدیریت اغلب حیاتی است. در عین حال، یک فرد پرمشغله مدرن به طور فزاینده ای می خواهد اطلاعات را در قالب اینفوگرافیک های تعاملی سه بعدی درک کند، که به او امکان می دهد حداکثر مقدار اطلاعات را با حداقل زمان تجزیه و تحلیل کند، به سرعت ماهیت مشکل، روندهای مختلف را درک کند. تغییرات و ارزیابی خطرات احتمالی او به حضور در فضای سه بعدی عادت کرده است.

بنابراین، در تحولات خود، ما بر روی آن حوزه‌هایی تمرکز می‌کنیم که به ما امکان می‌دهد به سرعت و کارآمد وضعیت موارد پیچیده صنعت را به مدیران منتقل کنیم. با حجم زیادی از داده های منبع از جمله موارد زیر است:

تکنیک های جدید برای کار تصویری تعاملیبا حجم زیادی از اطلاعات عملیاتی و استراتژیک - فناوری درک روشنی از مشکلات موجود و راه های ممکن برای حل آنها از طریق تصاویر بصری ارائه می دهد. صفحه نمایش به طور همزمان بسیاری از جنبه های موثر بر مشکل را بررسی می کند، درک اطلاعات، مدیریت، فرآیندهای مالی و اقتصادی آسان تر است و روابط متقابل و وابستگی های متقابل آنها قابل مشاهده است.

معرفی عناصر گیمیفیکیشنسطح جدیدی از تعامل کاربر است که فرآیند تجزیه و تحلیل داده ها را جالب، آموزشی و به یاد ماندنی می کند. بر این اساس سطح و کیفیت در اختیار داشتن اطلاعات افزایش می یابد.

استفاده از ابزارهای جدید تحلیلی سه بعدی، در سیستم های BI سنتی به دلیل عدم امکان به دست آوردن نتایج معمولی در پلتفرم های مرورگر استفاده نمی شود، به عنوان مثال، نمودارهای جریان Sankei، نمودارهای ارتباط چند به چند و غیره.

خودتان به نمونه هایی از رابط های سیستم های تحلیلی ما نگاه کنید. من فکر می کنم همه چیز بدون هیچ بحثی روشن می شود.

پروژه ویژه شرکتIDVP

تعداد منابع داده و ابزارهای موجود برای پردازش آنها امروزه به وضوح نشان می دهد که قبلاً هرگز افراد زیادی سعی نکرده بودند به دنیای تجسم داده ها عادت کنند. و وقتی چنین تعداد مواد برای مطالعه در دسترس باشد، فقط یک سوال وجود دارد "از کجا شروع کنم؟"می تواند برای هر تازه واردی ترسناک باشد. بنابراین، کدام کتابخانه ها بهترین هستند و متخصصان چه چیزی را توصیه می کنند؟ این در این مقاله مورد بحث قرار خواهد گرفت.

صحبت در مورد تجسم داده ها و ذکر نکردن آن مانند صحبت کردن در مورد تاریخچه رایانه های شخصی و نگفتن یک کلمه در مورد استیو جابز است. D3 (Data Driven Documents) بدون اغراق، مهمترین و غالب ترین کتابخانه منبع باز جاوا اسکریپت است که معمولاً برای ایجاد گرافیک SVG استفاده می شود. SVG (از انگلیسی Scalable Vector Graphics) به نوبه خود یک فرمت تصویر برداری است که توسط مرورگرهای وب پشتیبانی می شود، اما قبلاً کمتر استفاده می شد.

کتابخانه D3 بیشتر محبوبیت خود را مدیون علاقه ناگهانی به SVG در بین طراحان وب است، که عمدتاً به دلیل خوب ظاهر گرافیک های برداری در صفحه نمایش های با وضوح بالا (به ویژه نمایشگرهای Retina مورد استفاده در دستگاه های اپل) است که روز به روز بیشتر می شود. مشترک.

موریتز استفانر، کارشناس مستقل تجسم داده ها و مالک شرکت می گوید: "بیایید صادق باشیم، اگر مشکل تجسم داده های مبتنی بر SVG باشد، همه کتابخانه های دیگر حتی به حل آن نزدیک نیستند." حقیقت و زیبایی. همچنین پروژه های جالب زیادی بر اساس D3 ایجاد شده است، مانند NVD3، که اجزای گرافیکی استاندارد را ارائه می دهد - آماده استفاده، اما قابل تنظیم. یا بیایید بگوییم Crossfilter به سادگی یک ابزار برجسته برای فیلتر کردن داده است.

Processing.js یک پروژه "خواهر" برای پردازش است که به شما امکان می دهد داده ها را با استفاده از استانداردهای وب تجسم کنید و نیاز به هر گونه افزونه را از بین ببرید. یان ویلم تولپ، کارشناس تجسم داده هلندی، توضیح می‌دهد: «برای شروع کار با پردازش، نیازی به دانستن جاوا اسکریپت ندارید، زیرا پردازش زبان برنامه‌نویسی خاص خود را دارد. به عنوان یک کاربر، شما به سادگی کدی را در Processing می نویسید، آن را در صفحه وب خود قرار می دهید و بی سر و صدا به Processing.js اجازه می دهید بقیه کارها را انجام دهد.

جان ویلم تولپ ادامه می‌دهد: «نقاط منفی زمانی است که شما شروع به کار روی پروژه‌های پیچیده‌تر می‌کنید: IDE (محیط توسعه یکپارچه) کمی محدود به نظر می‌رسد.

و با وجود این، سادگی ذاتی پردازش، و همچنین یک جامعه کاربری بزرگ، آماده کمک به افرادی که با مشکلی روبرو هستند، این مشکل را برطرف کرده و پردازش را به یکی از در دسترس ترین ابزارها برای تجسم داده ها تبدیل می کند.

در حالی که D3 و پردازش ابزارهای مشترکی را برای انواع مختلف تجسم ارائه می دهند، جفیمشکلات خاص تری را حل می کند. Gephi یک کتابخانه رایگان و متن باز برای تجسم شبکه است. اما حتی در این ویژگی باریک، Gephi دریایی از امکانات را فراهم می کند. چه بخواهید روابط کارمندان را در یک شرکت مدل کنید و چه از پاس دادن توپ در طول بازی فوتبال، Gephi می تواند به شما در تجسم این روابط کمک کند.

نصب Gephi مانند Processing بسیار آسان است. بلافاصله پس از نصب، شما بلافاصله داده ها را وارد می کنید، آنها را مرتب می کنید و می توانید تجسم را شروع کنید. بنجامین ویدرکهر می‌گوید: «تصاویر به‌دست‌آمده را می‌توان صادر کرد و در هر سند وب جای‌گذاری کرد تا مخاطبان شما بتوانند بعداً از آنها استفاده کنند و آنها را در سراسر شبکه‌ها به اشتراک بگذارند.

دیگراف ها

دیگراف هایک کتابخانه جاوا اسکریپت منبع باز سریع و انعطاف پذیر است که برای ساخت نمودارهای تعاملی طراحی شده است و به شما امکان تجزیه و تحلیل و تفسیر مجموعه داده های بسیار متراکم را می دهد. برخلاف Vega، کتابخانه Dygraphs تنظیمات سفارشی را ارائه می‌کند، اما مزیت یکسانی را برای کار در تمام مرورگرهای اصلی دارد. علاوه بر این، Dygraphs به صورت بومی تعاملی است، به این معنی که برخی از ویژگی‌ها (مانند زوم، حرکت یا ماوس) به‌طور پیش‌فرض وجود دارند، در حالی که، مثلا، «نقل به زوم» در دستگاه‌های تلفن همراه فقط یک امتیاز خوب است.

از کجا شروع کنیم؟

حتی با وجود این اطلاعات، دنیای تجسم داده ها می تواند برای یک مبتدی مانند یک جنگل تاریک به نظر برسد. پس کارشناسان چه توصیه ای دارند؟

موریتز استفانر می‌گوید: «اولین چیزی که پیشنهاد می‌کنم این است که با ابزارهای زیادی که امروزه وجود دارد برای ایجاد سریع نمودارهای استاندارد آشنا شوید. "به خصوص در ابتدای پروژه، بسیار مهم است که بتوان به سرعت نمودارهای زیادی را برای کشف حجم، عمق و "بافت" داده ها تولید کرد. من شخصاً از Tableau و Gephi استفاده می کنم، اما علاوه بر آنها، از CartoDB نیز استفاده می کنم که برای کار با نقشه ها ضروری است و اخیراً از کتابخانه منبع باز RAW که برای ایجاد سریع نمودارهای جالب عالی است.

همچنین باید مطمئن شوید که کتابخانه ای که انتخاب می کنید بهترین تناسب با اطلاعاتی است که می خواهید نمایش دهید.

اسکات موری می گوید: «این مهم است که از ابتدا از خود بپرسید که با چه نوع قالب داده ای کار خواهید کرد. «وظیفه تجسم دوره زمانی است؟ آیا این می تواند داده های طبقه بندی شده باشد؟ پاسخ به سوالاتی از این دست ممکن است بر تصمیم شما تأثیر بگذارد. برخی از کتابخانه ها، مانند D3، جهانی هستند و می توانند با انواع مختلف داده کار کنند. برخی دیگر بیشتر به انواع داده ها اختصاص دارند، مانند Gephi یا Sigma.js، ابزارهایی که برای تجسم شبکه طراحی شده اند. اگر از همان ابتدا می‌دانید با چه چیزی کار می‌کنید، در مورد انتخاب کتابخانه‌های موجود فکر کنید که مناسب‌ترین نوع داده‌های شماست."

مزایای یک انجمن آنلاین چیست؟

برای کسانی که تازه شروع به تجسم داده‌ها کرده‌اند، یک نکته مهم در انتخاب کتابخانه، حضور یک جامعه محلی است که اعضای آن مشتاق کار خود هستند و آماده کمک هستند.

جان ویلم تولپ می‌گوید: «برای مبتدیان، کتابخانه‌های Processing یا D3 را برای شروع توصیه می‌کنم. هر دوی آن‌ها پایگاه‌های کاربری بزرگ و نمونه‌های قابل‌توجهی برای یادگیری دارند.»

جامعه آنلاین در زمینه تجسم داده ها نه تنها به بسیاری از سوالات پاسخ می دهد، بلکه یکی از پارادوکس های اصلی اینفوگرافیک را به وضوح نشان می دهد. هرکسی با پیشینه و تجربه خود به این صنعت می آید، بنابراین برخی از متخصصان تجسم داده ها از منظر زیبایی شناختی و هنری به مشکلات برخورد می کنند، در حالی که برخی دیگر بر جنبه آماری موضوع تمرکز می کنند. آماردانان در درک مقادیر زیادی از داده ها عالی هستند، اما باید اصول طراحی را یاد بگیرند. طراحان اطلاعات زیادی در مورد ایجاد تصاویر زیبایی شناختی دارند، اما چیزهای زیادی برای یادگیری در مورد روش های آماری دارند.

این برنامه نویس طراح می گوید: "در مرکز همه چیز توافق بین طرفین در مورد نوع تجسم وجود دارد."

با این حال، اگر این ویژگی ها را بپذیرید، فرصت های بزرگی برای شما باز خواهد شد. می‌توانید گرافیک‌هایی با کیفیت تایپوگرافی بسازید (یا حداقل به همان خوبی که شروع می‌شوند)، و انعطاف‌پذیری R را دوست خواهید داشت. اگر می‌خواهید، می‌توانید توابع و بسته‌های خود را بنویسید تا گرافیک مورد نظر خود را ایجاد کنید. . یا می توانید از مواردی که افراد دیگر در کتابخانه R در دسترس قرار داده اند استفاده کنید.

R تمام توابع اولیه طراحی را ارائه می دهد که اساساً به شما امکان می دهد تقریباً هر شیئی را که ممکن است نیاز داشته باشید ایجاد کنید. با یک چارچوب ترسیمی، می‌توانید خطوط، اشکال و محورها را ترسیم کنید، و دوباره، مانند سایر راه‌حل‌های نرم‌افزاری، تنها با تخیل خود محدود می‌شوید. تقریباً همه انواع نمودارها با استفاده از بسته های R مختلف در دسترس هستند.

پس چرا از چیزی غیر از R استفاده کنیم؟ چرا همه کارها را با آن انجام نمی دهید؟ در اینجا چند دلیل وجود دارد. R روی دسکتاپ شما اجرا می شود، بنابراین برای صفحات وب پویا مناسب نیست. ذخیره و قرار دادن نمودارها و تصاویر در یک صفحه وب مشکلی ندارد، اما به صورت خودکار انجام نمی شود. می‌توانید به‌طور مستقیم در وب، گرافیک ایجاد کنید، اما راه‌حل‌های موجود برای این کار در این مرحله خیلی قوی نیستند، به‌ویژه زمانی که با محصولات خاص وب مانند جاوا اسکریپت مقایسه می‌شوند.

R همچنین برای گرافیک های تعاملی و انیمیشن مناسب نیست. البته، می‌توانید این کار را با R انجام دهید، اما راه‌های انعطاف‌پذیرتر و ظریف‌تری برای انجام یک کار مشابه، مانند استفاده از Flash یا Processing وجود دارد.

در نهایت، ممکن است متوجه شده باشید که اشیاء گرافیکی ارائه شده در شکل. 35 و 36، کمی فاقد براقیت. بعید است که هرگز چنین گرافیکی را در روزنامه ها یا مجلات پیدا کنید. می‌توانید با فعال کردن گزینه‌های مختلف یا نوشتن کد اضافی، طرح را در R به سطح خاصی برسانید، اما من خودم معمولاً از استراتژی متفاوتی استفاده می‌کنم: اساس گرافیک را در R ایجاد می‌کنم و سپس آن را در برخی از برنامه‌های طرح‌بندی سند ویرایش و اصلاح می‌کنم. ، مانند Adobe Illustrator - بعداً در مورد این موضوع صحبت خواهیم کرد. برای تحلیل، محصول R خام عالی است، اما برای ارائه و داستان سرایی، بهتر است کمی روی زیبایی شناسی کار کنید.

سرنخ. هنگامی که هر چیزی مرتبط با R را در اینترنت جستجو می کنید، موتورهای جستجو ممکن است گاهی چنین نام کوتاهی را در نظر نگیرند و پیام خطا یا نتیجه نادرستی را برگردانند. بنابراین سعی کنید "r-project" را در پرس و جو خود به جای "R" مشخص کنید. نتایج جستجو باید مرتبط تر باشد.

سازش

یادگیری یک برنامه جدید به معنای یادگیری یک زبان جدید است. زبانی که کامپیوتر شما به آن صحبت می کند، زبانی است که از بیت ها تشکیل شده و منطق خاص خود را دارد. برای مثال، وقتی با اکسل یا تابلو کار می کنید، اساساً با یک مترجم کار می کنید. رابط به زبان شما با شما صحبت می کند و وقتی روی دکمه ای کلیک می کنید، برنامه دستور را ترجمه می کند و سپس ترجمه را به کامپیوتر می فرستد. پس از آن رایانه آن را اجرا می کند و کاری برای شما انجام می دهد، مثلاً یک نمودار ایجاد می کند یا برخی از داده ها را پردازش می کند.

اینجاست که زمان قطعاً به یک مانع بزرگ تبدیل می شود. یادگیری یک زبان جدید به زمان نیاز دارد. برای بسیاری از مردم، چنین مانعی طاقت فرسا است و من می توانم آنها را درک کنم. شما باید اکنون کار را انجام دهید زیرا کوهی از داده ها در مقابل شما وجود دارد و مردم نمی توانند منتظر دیدن نتایج باشند. اگر این مورد برای شماست - شما یک وظیفه پردازش داده دارید و دیگر چنین وظایفی در آینده پیش بینی نمی شود - در واقع ممکن است بهتر باشد که خود را به ابزارهای تجسم آماده محدود کنید.

با این حال، اگر می‌خواهید داده‌های خود را درک کنید و احتمالاً در آینده به کار بر روی پروژه‌های مختلف علم داده ادامه می‌دهید، در این صورت زمان صرف شده برای یادگیری برنامه‌نویسی امروز می‌تواند منجر به صرفه‌جویی در زمان فردا در پروژه‌های دیگر شود که نتایج چشمگیرتری نیز خواهند داشت. با هر پروژه جدید، مهارت های برنامه نویسی شما بهبود می یابد و این کار برای شما آسان تر و آسان تر می شود. مانند هر زبان خارجی، شما بلافاصله شروع به نوشتن رمان در آن نمی کنید. خیر، شما از اصول اولیه شروع می کنید و سپس به تدریج دانش خود را گسترش می دهید.

شما می توانید به همه اینها متفاوت نگاه کنید. تصور کنید به یک کشور خارجی پرتاب شده اید و به زبان محلی صحبت نمی کنید. با این حال، شما یک مترجم دارید. (تا آخر به من گوش کن، من دارم به اصل مطلب می گویم.) برای برقراری ارتباط با مردم محلی، ابتدا باید نظر خود را بیان کنید و سپس مترجم باید پیام شما را منتقل کند. اما اگر مترجم معنی کلمه ای را که شما گفتید نداند یا نداند از کدام کلمه برای بیان آنچه شما گفتید استفاده کند چه؟ او می تواند به سادگی این کلمه را حذف کند یا اگر به اندازه کافی باهوش است، به فرهنگ لغت نگاه کند.

برنامه راه حل های بصری آماده مترجم است. اگر او نمی داند چگونه کاری را انجام دهد، پس شما در بن بست هستید یا باید مسیر دیگری را امتحان کنید. برخلاف یک مترجم انسانی، یک برنامه قادر به یادگیری کلمات جدید در حال پرواز یا، مانند مورد ما، انواع جدید نمودارها و نمودارها یا ابزارهای پردازش داده جدید نیست. توابع اضافی در قالب یک به روز رسانی برنامه به آن می آیند که باید منتظر ظاهر آن باشید. پس چرا خودتان زبان را یاد نمی گیرید؟

باز هم، من به شما نمی گویم که از ابزارهای خارج از قفسه خودداری کنید. من خودم همیشه از آنها استفاده می کنم. آنها بسیاری از کارهای خسته کننده را آسان و سریع حل می کنند که بسیار عالی است. فقط اجازه ندهید نرم افزار شما را محدود کند.

همانطور که در فصل های بعدی خواهید دید، برنامه نویسی می تواند به شما کمک کند تا کارهای بیشتری را در زمان کمتر و با تلاش کمتر نسبت به انجام هر کاری با دست انجام دهید. البته، برخی از کارها وجود دارند که بهتر است به صورت دستی انجام شوند، به خصوص زمانی که داستان هایی را با داده تعریف می کنید. و این ما را به نقطه بعدی می رساند، که در انتهای مخالف طیف تجسم قرار دارد: تصویرسازی.

تصویر

بیایید نگاهی به قلمرو طراحان گرافیک بیندازیم. اگر شما یک تحلیلگر هستید یا سابقه فنی بیشتری دارید، احتمالاً این منطقه برای شما ناآشنا است. شما می توانید با ترکیب کد و ابزارهای تجسم آماده به چیزهای زیادی دست یابید، اما گرافیکی که در نهایت به دست می آورید تقریباً همیشه کمی خشن به نظر می رسد - مانند چیزی که به طور خودکار تولید می شود. شاید زیرنویس ها دقیقاً در جای مناسب قرار نگیرند یا افسانه کمی بیش از حد بارگذاری شود. برای تجزیه و تحلیل، چنین نتیجه ای معمولاً کاملاً مناسب است - شما می دانید که به چه چیزی نگاه می کنید.

اما وقتی برای ارائه، گزارش یا نشریه نمودار یا نمودار می‌سازید، عموماً باید آن را صیقل دهید تا مردم به وضوح بفهمند که شما چه داستانی را برایشان تعریف می‌کنید.

به عنوان مثال، در شکل. شکل 35 نتیجه خام کار را در R نشان می دهد. تعداد بازدیدها و نظرات در وب سایت FlowingData برای 100 پست محبوب را نشان می دهد. پست ها بر اساس دسته بندی مرتب شده اند. هرچه رنگ سبز روشن‌تر باشد، کامنت‌های بیشتری برای یک پست خاص ایجاد می‌شود و هر چه اندازه مستطیل بزرگ‌تر باشد، بازدیدهای بیشتری دریافت می‌کند. از نسخه اول تری مپ نمی توانستید آن را حدس بزنید، اما وقتی به اعداد نگاه کردم، دقیقاً می دانستم چه چیزی می بینم، زیرا خودم این کد را نوشتم.

در شکل 38 یک نسخه اصلاح شده از همان trimap را نشان می دهد. نام ها طوری قرار می گیرند که قابل مشاهده باشند. من متن مقدماتی را در بالا اضافه کرده ام تا خوانندگان بفهمند که این چه چیزی در مقابل آنها است. من بخش قرمز رنگ افسانه را به طور کامل حذف کردم، زیرا مزخرف است - یک پست با تعداد نظرات منفی. من همچنین پس زمینه را از خاکستری به سفید تغییر دادم فقط به این دلیل که به نظرم می رسید بهتر است.

برنج. 38. Trimap در R ایجاد شده و در Adobe Illustrator ویرایش شده است

می‌توانستم کد را طوری ویرایش کنم که همه نیازهایم را برآورده کند، اما کلیک کردن روی یک شی و کشیدن آن به Adobe Illustrator بسیار ساده‌تر بود. می‌توانید یک نمودار یا نمودار از ابتدا در یک برنامه تصویرسازی ایجاد کنید، یا می‌توانید گرافیکی را که مثلاً در R طراحی کرده‌اید، در آن وارد کنید و آن را به روشی که می‌خواهید ویرایش کنید. در حالت اول، شما در انتخاب گزینه های خود محدود هستید، زیرا تجسم وظیفه اصلی این دسته از نرم افزارها نیست. برای هر چیزی پیچیده تر از نمودار میله ای، بهتر است از واردات استفاده کنید. در غیر این صورت، شما باید کارهای زیادی را به صورت دستی انجام دهید، و این مملو از خطا است.

نکته جالب در مورد استفاده از برنامه های ویرایش تصویر این است که شما کنترل بیشتری روی عناصر جداگانه دارید و می توانید همه کارها را با استفاده از روش کشیدن و رها کردن انجام دهید. رنگ ستون ها یا یک ستون را تغییر دهید، ضخامت خطوط مرکزی را افزایش یا کاهش دهید، و مهمترین ویژگی ها را حاشیه نویسی کنید - همه با چند کلیک.

گزینه ها

برنامه های زیادی برای کار با تصاویر وجود دارد، اما در میان آنها فقط تعداد کمی وجود دارد که توسط اکثر مردم استفاده می شود و تنها یکی وجود دارد که در همه جا استفاده می شود. به احتمال زیاد، عامل تعیین کننده برای شما قیمت خواهد بود. قیمت ها از هیچ (رایگان و متن باز) تا چند صد دلار متغیر است.

ADOBE ILLUSTRATOR

هر گرافیک مبتنی بر داده های آماری که به نظر می رسد سفارشی باشد یا در یک نشریه اصلی ظاهر می شود، به احتمال زیاد در مرحله ای در Adobe Illustrator پردازش شده است. این برنامه استاندارد صنعتی است. هر گرافیکی که در صفحات نیویورک تایمز ظاهر می شود یا در ایلاستریتور ایجاد یا ویرایش شده است.

محبوبیت ایلوستریتور در تایپوگرافی به این دلیل است که در این برنامه شما با وکتور کار می کنید نه پیکسل. این بدان معنی است که می توانید گرافیک های بزرگی را بدون به خطر انداختن کیفیت تصویر ایجاد کنید. یک مثال برعکس زمانی است که شما مجبور هستید یک عکس با وضوح پایین را بزرگ کنید و در نهایت یک تصویر را به پیکسل های مربع رنگی تقسیم کنید.

این برنامه در ابتدا برای طراحی فونت توسعه داده شد، اما بعدها به عنوان ابزاری برای ایجاد لوگو و گرافیک هنری در بین تصویرگران محبوبیت پیدا کرد. و این دقیقاً همان چیزی است که Adobe Illustrator عمدتاً تا امروز مورد استفاده قرار می گیرد.

با این حال، این برنامه از طریق ابزار Graph دسترسی به برخی از عملکردهای اصلی تجسم داده ها را فراهم می کند. با استفاده از آن، می‌توانید تقریباً تمام انواع اصلی نمودارها و نمودارها، مانند هیستوگرام، نمودار دایره‌ای و نمودارهای سری زمانی را ایجاد کنید.

بهترین چیز در مورد Illustrator وقتی صحبت از گرافیک اطلاعاتی به میان می‌آید این است که انعطاف‌پذیر و آسان برای استفاده، با تعداد زیادی دکمه و عملکرد است. در ابتدا، فراوانی آنها ممکن است شما را کمی گیج کند، اما می توانید به سرعت به آنها عادت کنید، همانطور که خودتان با خواندن فصل چهارم («تجسم الگوها در طول زمان») متوجه خواهید شد. این انعطاف‌پذیری است که به بهترین طراحان گرافیک اطلاعاتی اجازه می‌دهد تا اشیایی مختصر و قابل فهم ایجاد کنند.

Illustrator در هر دو نسخه ویندوز و مک ارائه می شود. با این حال، این برنامه یک اشکال نیز دارد: ارزان نیست. وقتی به این فکر می‌کنید که با کدی که عموماً رایگان است چقدر می‌توانید انجام دهید، قیمت شروع به بالا می‌کند (به شرطی که قبلاً دستگاهی برای دانلود آن داشته باشید). با این حال، اگر قیمت این برنامه را با سایر راه حل های آماده مقایسه کنید، ایلاستریتور چندان گران به نظر نمی رسد.

در زمان نگارش این مقاله، آخرین نسخه Illustrator در وب سایت Adobe 599 دلار قیمت دارد و می توانید در جاهای دیگر تخفیف های قابل توجهی دریافت کنید (یا نسخه قدیمی تر را تهیه کنید). علاوه بر این، Adobe تخفیف های قابل توجهی را به دانشجویان و سایر اعضای جامعه علمی ارائه می دهد، بنابراین ممکن است بتوانید این برنامه را با هزینه بسیار کمتری دریافت کنید. (این گران ترین برنامه ای است که تا به حال خریداری کرده ام، اما تقریباً روزانه از آن استفاده می کنم.)

INKSCAPE

Inkscape یک جایگزین رایگان (متن باز) برای Adobe Illustrator است. اگر می خواهید از هزینه اجتناب کنید، Inkscape بهترین انتخاب شما است. من همیشه از Illustrator استفاده می کنم زیرا زمانی که برای اولین بار شروع به یادگیری پیچیدگی های گرافیک اطلاعاتی کردم، همه از آن استفاده می کردند و به نظر هوشمندانه ترین کار بود. اما من چیزهای خوبی در مورد Inkscape شنیده ام و از آنجایی که رایگان است، امتحان کردن آن ضرری ندارد. فقط انتظار نداشته باشید که به اندازه ای که برای ایلاستریتور وجود دارد، در مورد این موضوع آموزش های وب پیدا کنید.

دیگر

مطمئنا Illustrator و Inkscape تنها برنامه هایی نیستند که می توانید برای ایجاد و صیقل دادن نمودارها و نمودارهای خود از آنها استفاده کنید. فقط بیشتر مردم از آنها استفاده می کنند. اما متخصصانی هم هستند که Corel Draw را ترجیح می دهند. این برنامه فقط در یک نسخه برای ویندوز وجود دارد و قیمت آن تقریباً برابر با Illustrator است. اگر بدانید کجا باید جستجو کنید، می توانید آن را کمی ارزان تر پیدا کنید.

برنامه های دیگری مانند Aviary's Raven و Lineform وجود دارد، اما آنها مجموعه کوچکتری از ابزارها را ارائه می دهند. به یاد داشته باشید که Illustrator و Inkscape ابزار اصلی طراحان گرافیک هستند و غنی ترین عملکرد را دارند. اما اگر فقط می‌خواهید چند نمودار موجود را کمی تغییر دهید، می‌توانید نرم‌افزار ساده‌تر (ارزان‌تر) را انتخاب کنید.

سازش

برنامه هایی مانند Illustrator و Inkscape فقط برای یک چیز طراحی شده اند: تصویرسازی. آنها به طور خاص برای توسعه گرافیک اطلاعات طراحی نشده اند. تمرکز اصلی آنها طراحی گرافیک است و بنابراین بسیاری از افراد از تمام قابلیت هایی که Illustrator و Inkscape ارائه می دهند استفاده نمی کنند. هر دو نیز برای مدیریت حجم زیادی از داده ها مناسب نیستند و با برنامه هایی که خودتان برای اهداف خاص می نویسید یا با ابزارهای دیگری که به طور خاص برای تجسم داده ها طراحی شده اند، به خوبی مقایسه نمی شوند. به عبارت دیگر، اگر می‌خواهید گرافیک‌هایی بسازید که به اندازه کافی بالا باشند، ویرایشگرهای گرافیکی ضروری هستند. آنها نه تنها به زیبایی شناسی کمک می کنند، بلکه شیء را خواناتر و قابل فهم تر می کنند، که اغلب هنگام کار با نتایج تولید شده به طور خودکار دستیابی به آن دشوار است.

نقشه برداری

قابلیت‌های ابزارهای نقشه‌برداری تا حدی با قابلیت‌های ابزارهای تجسم که در بالا بحث کردیم، مطابقت دارد. با این حال، در سال های اخیر، حجم داده های جغرافیایی به طور قابل توجهی افزایش یافته است و به همراه آن تعداد راه هایی که می توان از طریق آنها نقشه ها ایجاد کرد، افزایش یافته است. خدمات موقعیت یابی تلفن همراه با مجموعه داده های بزرگتر با طول و عرض جغرافیایی در حال افزایش است. علاوه بر این، نقشه ها روشی فوق العاده بصری برای تجسم داده ها هستند و ارزش نگاه دقیق تر را دارند. در سال های اولیه وب، ایجاد نقشه آسان نبود. و نتیجه ظریف نبود. آیا روزهایی را به خاطر می آورید که مجبور بودید به MapQuest بروید، مجموعه ای از دستورالعمل ها را دنبال کنید و در نهایت با یک نقشه کوچک و ایستا مواجه شدید؟ یه زمانی یاهو همچین سرویسی داشت. این امر تا زمانی ادامه داشت که گوگل اصل نقشه متحرک را پیاده سازی کرد (شکل 39). اگرچه این فناوری زودتر اختراع شده بود، اما تا زمانی که سرعت اینترنت اکثر مردم به اندازه کافی افزایش یافت که به‌روزرسانی مداوم داده‌ها را فراهم کند، مورد استفاده قرار نگرفت. امروز ما به جابجایی نقشه ها عادت کرده ایم. ما می توانیم به راحتی روی آنها اسکرول و بزرگنمایی کنیم، و در برخی موارد به نقشه هایی بیش از تعیین جهت سفر نیاز داریم - آنها به رابط اصلی برای مشاهده مجموعه داده تبدیل می شوند.

برنج. 39.همچنین می‌توانید دستورالعمل‌ها را در Google Maps دریافت کنید

توجه داشته باشید: نقشه های متحرک یک اصل برای پیاده سازی داده های نقشه برداری است که امروزه تقریباً جهانی شده است. کارت های بزرگی که در غیر این صورت روی صفحه قرار نمی گرفتند به تصاویر (یا کاشی) کوچکتر تقسیم می شوند. شما فقط کاشی هایی را می بینید که روی پنجره شما می افتند و بقیه پنهان هستند. با این حال، به محض کشیدن نقشه با ماوس، کاشی های دیگر ظاهر می شوند، و بنابراین به نظر می رسد که شما در حال حرکت در اطراف یک نقشه بزرگ هستید. شما همچنین می توانید یک اصل نمایش مشابه را هنگام مشاهده عکس های با وضوح بالا مشاهده کنید.

گزینه ها

همانطور که داده های جغرافیایی به طور فزاینده ای در دسترس عموم قرار می گیرند، ابزارهای جدید و متنوع تری برای تهیه نقشه ها با استفاده از آن داده ها در دسترس هستند. در مورد برخی از آنها، فقط مهارت های برنامه نویسی اندکی لازم است تا بتوان با کمک آنها چیزی ایجاد کرد و آن را اجرا کرد. کار با ابزارهای دیگر نیاز به سرمایه گذاری کمی بیشتر از کار و زمان دارد.اما راه حل هایی نیز وجود دارد که به مهارت های برنامه نویسی نیاز ندارند.

نقشه های گوگل، یاهو و مایکروسافت

این ساده ترین راه حل آنلاین است، اما همچنین مستلزم آن است که حداقل دانش برنامه نویسی داشته باشید. هرچه در کدنویسی بهتر باشید، می توانید با API های نقشه ارائه شده توسط گوگل، یاهو و مایکروسافت کارهای بیشتری انجام دهید.

عملکرد اصلی در هر سه مورد کاملاً مشابه است، اما اگر به تازگی قدم های اولیه خود را در این زمینه برداشته اید، توصیه می کنم با گوگل شروع کنید. به نظر من این قابل اطمینان ترین گزینه است. Google APIهایی برای ایجاد نقشه در جاوا اسکریپت و فلش و همچنین سایر خدمات مرتبط با جغرافیا مانند کدگذاری جغرافیایی و مسیرها دارد. برای شروع کار با سیستم، آموزش را تماشا کنید، سپس به موضوعات دیگر مانند علامت گذاری، یافتن مسیرهای بهینه و افزودن لایه ها بپردازید. دستورالعمل های جامع با تکه های کد و بهترین روش ها شما را به سرعت راه اندازی می کند.

برنج. 40.برچسب گذاری در نقشه های گوگل

یاهو همچنین یک API برای ایجاد نقشه‌ها با استفاده از جاوا اسکریپت و فلش، به علاوه برخی خدمات جغرافیایی دارد، اما مطمئن نیستم با توجه به وضعیت فعلی شرکت، چه مدت این نقشه‌ها در دسترس باشند. در زمان نگارش این کتاب، یاهو تمرکز خود را از توسعه اپلیکیشن به ارائه محتوا تغییر داده بود. مایکروسافت همچنین یک API برای جاوا اسکریپت (به نام بینگ) و دیگری برای Silverlight، پلتفرمی که به عنوان پاسخی به Flash توسعه داده است، ارائه می دهد.

خدمات نقشه برداری آنلاین که در بالا ذکر شد از نظر کارهایی که می توانند انجام دهند بسیار ساده هستند. اگر نیاز به ایجاد نقشه های پیچیده تری دارید، به احتمال زیاد باید خودتان این قابلیت را پیاده سازی کنید. با این حال، ArcGIS نیز وجود دارد که به عنوان یک برنامه دسکتاپ برای ایجاد نقشه توسعه یافته است. این یک برنامه سنگین است که به شما امکان می دهد حجم عظیمی از داده ها را به کارت منتقل کنید و کارهای زیادی مانند صاف کردن و پردازش را انجام دهید. شما می توانید همه این کارها را از طریق رابط کاربری انجام دهید، بنابراین نیازی به نوشتن هیچ کدی ندارید.

تقریباً تمام خدمات گرافیکی و بخش هایی که متخصصان نقشه را به کار می گیرند از ArcGIS استفاده می کنند. بعضی ها دیوانه او هستند. بنابراین اگر به ایجاد نقشه های دقیق علاقه دارید، ممکن است بخواهید نگاهی به ArcGIS بیندازید.

من از ArcGIS در چندین پروژه استفاده کرده‌ام زیرا ترجیح می‌دهم مسیر «نرم‌افزاری» را طی کنم و به این همه عملکرد نیازی نداشتم. چنین جعبه ابزار غنی یک جنبه منفی نیز دارد: شما باید با همان تعداد زیاد دکمه ها و منوها سر و کار داشته باشید. راه حل های آنلاین و مبتنی بر سرور نیز در دسترس هستند، اما در مقایسه با راه حل های دیگر کمی نامرتب به نظر می رسند.

نقشه های متوسط

من قبلاً در بالا به Modest Maps اشاره کردم وقتی مثال نشان داده شده در شکل را آوردم. 29. رشد Walmart را به نمایش گذاشت. Modest Maps یک کتابخانه Flash و ActionScript برای نقشه های مبتنی بر کاشی است و با پایتون نیز سازگار است. این کتابخانه توسط گروهی از افرادی نگهداری می شود که نقشه برداری آنلاین را درک می کنند و کارهای عالی را هم برای مشتریان خود و هم برای لذت بردن خودشان انجام می دهند که در مورد کیفیت کتابخانه چیزهای زیادی می گوید.

نکته خنده دار این است که Modest Maps بیشتر یک چارچوب است تا یک API برای ایجاد نقشه هایی مانند نقشه های ارائه شده توسط Google. حداقل مطلق چیزی که برای ایجاد یک نقشه آنلاین لازم است را فراهم می کند و سپس در کار شما دخالت نمی کند و به شما فرصت می دهد تا آنچه را که می خواهید پیاده سازی کنید. می توانید از کاشی های ارائه دهندگان مختلف استفاده کنید یا می توانید نقشه را مطابق با برنامه خود سفارشی کنید. به عنوان مثال، در شکل. 29 کارت را در طرح آبی و مشکی نشان می دهد، اما همانطور که در شکل نشان داده شده است به راحتی می توانید آن را به سفید و قرمز تغییر دهید. 41.

برنج. 41.نقشه در طراحی سفید و قرمز با استفاده از نقشه های ساده

Modest Maps تحت مجوز BSD توزیع شده است، بنابراین شما می توانید هر کاری را که می خواهید با آن انجام دهید، کاملا رایگان. درست است، برای این کار باید نحوه کار با Flash و ActionScript را بیاموزید، اما در فصل هشتم ("تجسم روابط فضایی") در مورد آنها صحبت خواهیم کرد.

POLYMAPS

Polymaps نوعی نسخه جاوا اسکریپت کتابخانه Modest Maps است. این توسط برخی از افراد مشابه توسعه یافته و نگهداری می شود و بسیاری از عملکردهای مشابه را ارائه می دهد، اما برای بوت شدن بسیار بیشتر است. Modest Maps فقط عملکرد اولیه نقشه برداری را ارائه می دهد، در حالی که Polymaps دارای ویژگی های داخلی مانند کارتوگرام (شکل 42) و نمودارهای حباب است.

برنج. 42.کارتوگرام نشان دهنده نرخ بیکاری، پیاده سازی شده در Polymaps

از آنجایی که تمام آن جاوا اسکریپت است، شی سبک تر به نظر می رسد (زیرا به خطوط کد کمتری نیاز دارد) و در مرورگرهای مدرن کار می کند. Polymaps از گرافیک های برداری مقیاس پذیر (SVG) برای نمایش داده ها استفاده می کند و بنابراین در نسخه های قدیمی اینترنت اکسپلورر کار نمی کند، اگرچه اکثر مردم با زمان هماهنگ هستند. به هر حال، تنها 5 درصد از بازدیدکنندگان سایت FlowingData از مرورگرهای وب قدیمی استفاده می کنند و من گمان می کنم که این تعداد به زودی به صفر برسد.

من شخصاً از کتابخانه ها برای ایجاد نقشه در جاوا اسکریپت قدردانی می کنم این است که کد بدون مشکل در مرورگرها اجرا می شود. شما لازم نیست کاری انجام دهید - بدون کامپایل، بدون صادرات فلش. در نتیجه، شروع همه چیز آسان و به‌روزرسانی آسان است.

R در توزیع اولیه خود قابلیت نقشه برداری را ندارد، اما بسته های متعددی وجود دارد که به شما امکان می دهد نقشه برداری را در R نیز انجام دهید. در شکل شکل 43 نقشه کوچکی را نشان می دهد که من در R ساخته ام. حاشیه نویسی ها بعداً در Adobe Illustrator اضافه شدند.

برنج. 43.نقشه ایالات متحده ایجاد شده در R

نقشه‌های ساخته شده در R دارای قابلیت‌های محدود هستند و مستندات آن عالی نیست، بنابراین من فقط در صورتی از این روش برای ایجاد نقشه استفاده می‌کنم که لازم باشد کار ساده‌ای انجام دهم و اتفاقاً در حال حاضر در R کار می‌کنم. در موارد دیگر، ترجیح می‌دهم متوسل شوم. به ابزارهایی که قبلاً در بالا ذکر کردم.

راه حل های آنلاین

همچنین چندین راه حل نقشه آنلاین وجود دارد که تجسم داده های جغرافیایی را آسان می کند. در بیشتر موارد، کارت‌هایی را که مردم بیشتر استفاده می‌کنند، می‌گیرند و همه چیزهای غیر ضروری را از آن‌ها حذف می‌کنند. به نظر می رسد چیزی شبیه به یک ArcGIS ساده شده است. دو مورد از این منابع به صورت رایگان در دسترس هستند. اینها چندین چشم و GeoCommons هستند. اولین مورد - که در بالا در مورد آن صحبت کردیم - فقط عملکرد اولیه برای کار با داده ها در کشورها یا ایالات ایالات متحده دارد. اما GeoCommons قابلیت های بیشتر و ابزارهای غنی تری را برای تعامل فراهم می کند. GeoCommons همچنین از رایج ترین فرمت های فایل داده نقشه مانند shapefiles و KML پشتیبانی می کند.

راه حل های پولی زیادی نیز وجود دارد که مفیدترین آنها Indiemapper و SpatialKey هستند. SpatialKey برای کسب و کار و تصمیم گیری مناسب تر است، در حالی که Indiemapper برای نقشه کشان و طراحان عالی است. در شکل شکل 44 نمونه ای از یک کارتوگرام را نشان می دهد که من تنها در چند دقیقه در Indiemapper جمع آوری کردم.

برنج. 44. Cartogram ایجاد شده در Indiemapper

سازش

برنامه های نقشه برداری انواع مختلفی دارند و برای رفع نیازهای مختلف طراحی شده اند. عالی خواهد بود که به یک برنامه تسلط داشته باشید و بتوانید هر نوع نقشه ای را که قابل تصور است ایجاد کنید. متأسفانه اینطوری کار نخواهد کرد.

به عنوان مثال، ArcGIS دارای ویژگی های زیادی است، اما اگر فقط نیاز به ایجاد نقشه های ساده دارید، ممکن است نخواهید زمان صرف یادگیری آن یا پول خرید آن کنید. برعکس، R رایگان با عملکرد اولیه‌اش ممکن است برای کاری که می‌خواهید انجام دهید بسیار ساده باشد. اگر هدف شما نقشه های آنلاین تعاملی است، Modest Maps و Polymaps ممکن است برای شما مناسب باشد، اما در این صورت به مهارت های برنامه نویسی جدی تری نیاز خواهید داشت.

گزینه های خود را کاوش کنید

این لیست از ابزارها به هیچ وجه تمام گزینه هایی را که می توانید برای تجسم داده ها استفاده کنید را خسته نمی کند، اما در ابتدا باید برای شما کافی باشد. چیزهای زیادی برای فکر کردن و بازی کردن با آنها وجود دارد. اینکه در نهایت از کدام ابزار استفاده می کنید تا حد زیادی به آنچه می خواهید دست یابید بستگی دارد و همیشه چندین رویکرد برای انجام یک کار حتی در یک برنامه واحد وجود دارد. آیا می خواهید نمودار اطلاعات ثابت ایجاد کنید؟ شاید باید به R یا Illustrator بچسبم. آیا می خواهید یک ابزار تعاملی برای برنامه وب خود بسازید؟ سپس جاوا اسکریپت یا فلش را امتحان کنید.

من یک نظرسنجی در وب سایت FlowingData انجام دادم و سعی کردم بفهمم مردم عمدتاً از چه چیزی برای تجزیه و تحلیل و تجسم داده ها استفاده می کنند. فقط بیش از 1000 نفر پاسخ دادند. نتایج در شکل ارائه شده است. 45.

برنج. 45.آنچه خوانندگان FlowingData برای تجزیه و تحلیل و تجسم داده ها استفاده می کنند

در میان پاسخ ها، چندین رهبر واضح وجود دارد، به خصوص با توجه به موضوع FlowingData. اکسل در رتبه اول قرار دارد و پس از آن R. و سپس در انتخاب نرم افزار اختلاف نظرها و ترجیحات وجود دارد. بیش از 200 نفر دسته «سایر» را انتخاب کردند. بسیاری از نظر دهندگان اظهار داشتند که آنها ابزارها را برای برآوردن نیازهای مختلف ترکیب می کنند - که معمولاً مؤثرترین رویکرد در دراز مدت است.

ترکیب گزینه ها

بسیاری از مردم دوست دارند تنها با یک برنامه کار کنند - این آسان و راحت است. نیازی به یادگیری چیز جدیدی نیست. اگر این برای رفع نیازهای تجسم شما کافی است، دیگر نیازی به عدول از این اصل نیست. اما پس از اینکه به اندازه کافی با داده ها کار کردید، به نقطه ای می رسد که متوجه می شوید که قابلیت های نرم افزار تمام شده است. شما می‌دانید که باید با داده‌ها چه کاری انجام دهید یا چگونه آن‌ها را تجسم کنید، اما برنامه به شما اجازه نمی‌دهد این کار را انجام دهید یا فرآیند را بیش از آنچه که باید وقت‌گیر می‌کند.

شما می توانید این وضعیت را بپذیرید یا می توانید از برنامه های دیگری استفاده کنید که یادگیری آنها زمان بر است، اما به شما کمک می کند تا دیدگاه طراحی خود را درک کنید. پیشنهاد می کنم مسیر دوم را انتخاب کنید. تسلط بر ابزارهای مختلف تضمین می کند که تحت تأثیر داده ها قرار نگیرید و انعطاف پذیری لازم برای انجام انواع کارهای بصری و دریافت نتایج واقعی را دارید.

بسته شدن

به یاد داشته باشید: هیچ یک از این ابزارها نوشدارویی نیستند. در نهایت، تجزیه و تحلیل و طراحی داده ها همیشه به عهده شما خواهد بود. بالاخره ابزارها فقط ابزار هستند. فقط به این دلیل که چکش دارید به این معنی نیست که می توانید خانه بسازید. به همین ترتیب، شما می توانید یک برنامه عالی و یک ابر کامپیوتر در اختیار داشته باشید، اما اگر نمی دانید چگونه از آن ابزارها استفاده کنید، آنها را ندارید. شما تصمیم می گیرید که چه سوالاتی بپرسید، از چه داده هایی استفاده کنید، و چه جنبه هایی از آن را برجسته کنید، و درک این موضوع با تجربه همراه است.

اما تو خوش شانسی! به هر حال، این همان چیزی است که بقیه کتاب به آن اختصاص دارد. در فصل‌های بعدی، با مفاهیم اولیه طراحی اطلاعات آشنا می‌شوید و یاد می‌گیرید که چگونه تئوری را با استفاده از ترکیبی از ابزارهایی که در بالا مورد بحث قرار دادیم، عملی کنید. شما یاد خواهید گرفت که در داده هایی که دارید به دنبال چه چیزی بگردید و چگونه آن داده ها را تجسم کنید.

استریم گراف نوعی نمودار ناحیه انباشته است که حول یک محور مرکزی جابجا می شود و در نتیجه شکل های زیبا و روان (به خصوص هنگام کار با مجموعه داده های بزرگ) به وجود می آید. توسط لی بایرون در سال 2008 ساخته شد. ژنراتور را می توان از GitHub دانلود کرد. توجه داشته باشید مسیر

امروزه حوزه تجسم روش هایی را برای تبدیل داده ها به تصاویر بصری برای درک بهتر اطلاعات مورد بررسی قرار می دهد. یکی از رایج ترین نمایش های بصری، نمودار خطی، بیش از هزار سال است که مورد استفاده قرار گرفته است. و ابزارهایی مانند نمودار میله ای، نمودار دایره ای، نمودار پراکندگی و هیستوگرام بیش از دو قرن پیش اختراع شدند.

زمان زیادی از آن زمان گذشته است و پیشرفت هنوز متوقف نشده است. امروزه کاربران ده ها برنامه در اختیار دارند که به آنها امکان تجسم داده ها را می دهد. در عین حال، تجسم مدت‌هاست که به فضای سه‌بعدی «مهاجرت» کرده است: دانشمندان از آن برای ارائه بصری نتایج تحقیقات استفاده می‌کنند، هواشناسان نقشه‌های آب و هوا را جمع‌آوری می‌کنند، مدیران از مدل‌های داده‌های سه‌بعدی برای اتخاذ تصمیم‌های مدیریتی سریع و مؤثر استفاده می‌کنند.

اما آیا توسعه فناوری های تجسم در همین جا متوقف می شود؟ البته که نه. آینده برای ما چه خواهد بود؟ پاسخ این سوال را می توان با ردیابی تاریخچه تجسم یافت، زیرا بی جهت نیست که می گویند: "بدون آگاهی از گذشته آینده ای وجود ندارد."

گشتی کوتاه در تاریخ

از آنجایی که ما در مورد تجسم صحبت می کنیم، بیایید تاریخچه آن را به صورت بصری ارائه کنیم - مایکل فرندلی، نویسنده کتاب هندبوک تجسم داده ها، آن را اینگونه به تصویر کشیده است:

قبل از قرن هفدهم - نقشه ها و نمودارهای اولیه

اولین بذر تجسم در نمودارهای هندسی، جداول موقعیت ستاره ها، تصاویر اعضای بدن و نمودارهای ناوبری آغاز شد.

در میان نمایش‌های اولیه اطلاعات کمی، نموداری از حرکت اجرام ستاره‌ای است که حرکت سیارات را در یک سیستم مختصات دو بعدی نشان می‌دهد. این نمودار تصویر خوبی از این دوره ارائه می دهد:

1600-1699 - اندازه گیری ها و نظریه ها

در قرن هفدهم، دانشمندان به چگونگی اندازه گیری زمان، فاصله و فضا علاقه مند بودند. تاکید اصلی بر روی نقشه ها و ناوبری بود.

در این دوره بود که یک سیستم مختصات ظاهر شد، نظریه وفاداری و آمار جمعیتی متولد شد.

تصویری از آن زمان را می توان در کار کریستوفر شاینر، مورخ 1630 یافت. بعداً ادوارد توفت برای آن از اصطلاح «مجموعه‌های کوچک» استفاده کرد، یعنی تکرار یک عنصر به دفعات برای نشان دادن پویایی و تغییرات ایجاد شده.

این تصویر لکه های خورشیدی مشاهده شده در طول ماه را نشان می دهد:

1700-1799 - فرم های گرافیکی جدید

قرن هجدهم زمان فراتر رفتن از «بدیهی» بود. نقشه‌ها اکنون در تلاش هستند تا نه تنها نقطه‌ای از یک موقعیت جغرافیایی را نشان دهند، خطوط و خطوط منفرد ظاهر می‌شوند.

نمونه هایی از دوران: نقشه های موضوعی گسل های زمین شناسی، محاسبات اقتصادی و تصاویر پزشکی. تجسم های انتزاعی رایج تر می شوند. با شروع به جمع آوری اطلاعات بیشتر در مورد رویدادهای سیاسی و اقتصادی، نیاز به فرم های بصری جدید برای نمایش آنها پدیدار می شود.

در زیر یکی از اولین نمونه های همپوشانی داده های اضافی بر روی نقشه جغرافیایی آورده شده است:

1850 - آغاز گرافیک مدرن

در این زمان، انواع اصلی نمودارها ظاهر شدند: نمودار دایره ای، میله ای و منطقه ای. نقطه شروع گرافیک مدرن تجسم معروف وبا در خیابان های لندن است که توسط جان اسنو ساخته شده است:

در سال 1858، فلورانس نایتینگل، پرستار بریتانیایی و فعال اجتماعی، اولین نمودار دایره‌ای را اختراع کرد که در جنگ کریمه از آن استفاده کرد تا نشان دهد که تعداد سربازان بیشتری بر اثر بیماری (آبی) نسبت به میدان جنگ (قرمز) یا به دلایل دیگر (سیاه) جان خود را از دست داده‌اند. ):

1900-1950 - سالهای مشکلات

استدلال فلسفی و تقسیم افراد به "بصری تر" و "جدول تر" آغاز شد. انگلیسی ها خود را جدولی تر می دانستند. شعار آکادمی بریتانیا در آن روزها جمع آوری داده ها ("جمع آوری دانه های گندم") بود، اما به نظر آنها، تجسم از قبل از سری نانوایی ها بود.

1950 - 1975 - رنسانس

دانشمندان و نویسندگان به طور فعال ایده تجسم را رایج کردند. آثار مشابه به معنای واقعی کلمه یکی پس از دیگری منتشر شد. در سال 1962، جان توکی کتاب آینده تحلیل داده ها را نوشت و ریاضیات را از آمار جدا کرد. و اگر اولی تجسم ها را تحمل نکند، به لطف آنها آمار معنا و شکل بیشتری پیدا می کند.

در این زمان، اولین تجسم های تعاملی ظاهر شد. یک مثال این تجسم توسط ریچارد بیکر است:

در سال 1973 دانشمند آمریکایی هرمان چرنوف از تصاویر چهره برای تجسم داده ها استفاده کرد. چهره‌های چرنوف نمایش داده‌های چند بعدی به شکل چهره انسان و بخش‌های جداگانه آن هستند. در زیر نمونه ای از ارزیابی وکلا از 12 قاضی بر اساس افراد چرنوف آورده شده است:

1975 - اکنون - تجسم تعاملی و پویا با وضوح بالا

امروزه ما به ابزارهای تجزیه و تحلیل داده ها و تجسم دسترسی گسترده ای داریم. لحظات کلیدی که دوران تجسم تعاملی و پویا را مشخص کرده اند را می توان ظهور سیستم های تعاملی، توانایی تعامل با مدل ها (از جمله سه بعدی) و افزایش قدرت رایانه همراه با فناوری های ارزان تر در نظر گرفت.

البته ظهور اینترنت و در نتیجه دسترسی به حجم زیادی از داده ها نقش اساسی در این فرآیند داشت.

نمونه بارز تجسم این دوره، تجسم اینترنتی ساخته شده توسط پروژه Opte است:

همانطور که می توانید به راحتی از نام آن حدس بزنید، تجسم داده ها یک نمایش گرافیکی از هر داده است. در همان زمان، در اینترنت تعاریف زیادی پیدا کردم که به تجسم داده ها مربوط می شود:

  • نمودارها و نمودارها،
  • اینفوگرافیک و نمودار،
  • ارائه و تجزیه و تحلیل داده ها،
  • داستان گویی تعاملی،
  • تجزیه و تحلیل کسب و کار و داشبورد،
  • تصویربرداری علمی و پزشکی،
  • نقشه ها و کارتوگرام ها

سپس هر کس برای خود تصمیم می گیرد که با تجسم داده ها چه چیزی را درک می کند. در پایان یادداشت به شما خواهم گفت که چه تصمیمی برای خودم گرفتم. در این میان، بیایید هر یک از انواع را با جزئیات بیشتری بررسی کنیم و تفاوت ها و ویژگی های آنها را پیدا کنیم.

نمودارها و نمودارها

احتمالاً آشناترین نوع تجسم داده برای ما است. هم برای ارائه و هم برای تجزیه و تحلیل داده ها استفاده می شود. شما می توانید آنها را در محل کار، در مجلات و در گزارش های علمی ملاقات کنید. ما معمولاً اطلاعات مربوط به انواع نمودارها و نمودارهای موجود را از مدرسه یا از مجموعه استاندارد در اکسل به دست می آوریم. با این حال، افراد کمی می دانند که دنیای نمودارها و نمودارها به نمودارهای نقطه ای، نمودارهای میله ای و نمودارهای دایره ای محدود نمی شود. حدود 15 نوع نمودار شناخته شده وجود دارد و در مجموع بیش از 60 مورد وجود دارد و تعداد آنها هر روز در حال افزایش است - مردم انواع جدیدی را برای تجسم داده های پیچیده و غیر معمول ارائه می دهند. در یکی از پست های بعدی به تفصیل به بررسی انواع نمودارها و نمودارها خواهیم پرداخت.




اینفوگرافیک و نمودار

اینفوگرافیک ها در سال های اخیر بسیار محبوب شده اند، اگرچه مدت زیادی است که وجود داشته اند. اینفوگرافیک ها به روزنامه نگاری داده اشاره دارند، جایی که نمودارها و نمودارها هر واقعیتی را در مورد یک موضوع انتخاب شده توضیح می دهند. به طور معمول، اینفوگرافیک ها ثابت هستند و از یک "برگ" طولانی با تصاویر و متن تشکیل شده اند. ویژگی متمایز اینفوگرافیک این است که نتیجه گیری های آماده ارائه می دهد، یعنی خواننده با دست در موضوع انتخاب شده هدایت می شود و در عین حال با اعداد و تصاویر همراه می شود. اغلب از سبک طراحی دستی یا کارتونی استفاده می شود. برخی از رسانه ها به صورت روزانه اینفوگرافیک منتشر می کنند، به عنوان مثال AiF. رونق اینفوگرافیک باعث کاهش سطح کلی کیفیت اینفوگرافیک شده است. اغلب از آن بی جا یا "برای زیبایی" استفاده می شود، اگرچه نمونه های شگفت انگیز و جالبی وجود دارد.

نمونه های اینفوگرافیک

قدرت ارتش ناپلئون در طول لشکرکشی روسیه، 1869

جمعیت کشورهای مختلف، 1912

10 فرمان تایپوگرافی

بال زدن

گیاهخواران به تعداد

ارائه و تجزیه و تحلیل داده ها

یکی از رایج ترین روش های استفاده از تجسم داده ها، ارائه اطلاعات به صورت نمودار یا اینفوگرافیک است. و اگر با این، من فکر می کنم همه چیز روشن است، پس استفاده از تجسم برای تجزیه و تحلیل اطلاعات عمدتا تنها توسط تحلیلگران و دانشمندان تجاری استفاده می شود. تفاوت در چیست؟

هنگام تجزیه و تحلیل داده ها با استفاده از تجسم، به اصطلاح نمونه سازی سریع استفاده می شود - یعنی ایجاد تعداد زیادی نمایش بصری مختلف از همان داده ها. این کار برای یافتن روابط و وابستگی هایی که در نگاه اول پنهان هستند و همچنین برای ارائه ارزیابی اولیه از مجموعه داده ها برای امکان استفاده از ابزارهای تحلیل پیچیده تر در آینده انجام می شود. این رویکرد تحلیل داده های اکتشافی (EDA) نامیده می شود که می تواند به روسی به عنوان تجزیه و تحلیل داده های اکتشافی ترجمه شود. تفاوت اصلی با ارائه داده در این است که تجسم در اینجا می تواند "خشن" و زشت باشد، اما به سرعت و توسط یک فرد یا یک گروه کاری کوچک انجام می شود. برای این کار اغلب از Excel، R یا Matlab استفاده می شود.

EDA یکی از ابزارهای داده کاوی است؛ حتی آموزش هایی نیز در مورد نحوه انجام آن وجود دارد

نمونه های تجسم برای EDA





داستان سرایی تعاملی

داستان سرایی یا skazatsievo در روسی (به نظر خنده دار می رسد) ارائه برخی اطلاعات مفید در قالب یک داستان جالب است. به دلایلی، ویدئو اغلب داستان سرایی تعاملی نامیده می شود، اما اینطور نیست، بلکه نوع دیگری از گرافیک اطلاعاتی است. داستان سرایی تعاملی داستانی است که شنونده می تواند با آن تعامل داشته باشد. در هسته خود، به روزنامه نگاری داده و اینفوگرافیک نزدیک است، اما در این تفاوت که کاربر می تواند نمایش اطلاعات را کنترل کند و وابستگی هایی را که نویسنده پیدا نکرده است، پیدا کند. از این نظر، به تجزیه و تحلیل داده های اکتشافی نزدیک است، اما از این جهت متفاوت است که داده ها از قبل پردازش شده و به شکلی مناسب برای تجزیه و تحلیل ارائه می شوند، و همچنین نکات یا سناریوهای استفاده از پیش نوشته شده وجود دارد. بنابراین، اغلب داستان‌سرایی تعاملی، اینفوگرافیک تعاملی نامیده می‌شود، اما برای تبدیل شدن به آن، افزودن پنجره‌های پاپ‌آپ به اینفوگرافیک‌های ایستا کافی نیست.
تجسم های تعاملی امروزه به طور فعال در حال توسعه هستند. نمونه های قوی را می توان در رسانه های بزرگ یا در قالب پروژه های فردی یافت.

نمونه هایی از داستان گویی تعاملی (رفتن به وب سایت با کلیک بر روی تصویر)

تجزیه و تحلیل کسب و کار و داشبورد،

تجسم به طور فعال در تجارت استفاده می شود. اصل "گفتگو با داده ها" به شرکت ها کمک می کند تا درآمد بیشتری داشته باشند و مشتریان خدمات بهتری دریافت کنند. برای تجزیه و تحلیل یک بار، معمولاً از اکسل یا R استفاده می شود. با این حال، اگر نیاز به نظارت مداوم بر برخی شاخص ها (KPI) دارید، این کار راحت نیست. برای ردیابی KPIهای معمول، از داشبوردها استفاده می شود - نمایشگرهایی که تمام شاخص های لازم را در یک مکان به شکل نمودارها، نمودارها و جداول نمایش می دهند.

طراحی داشبوردهای موثر یک کار پیچیده و خارق العاده است. آنها اغلب مملو از اطلاعات غیر ضروری هستند یا سعی می کنند از هر نوع نمودار قالب ممکن استفاده کنند. اغلب، برای طراحی یک داشبورد خوب، لازم است انواع جدیدی از تجسم اطلاعات ایجاد شود. این موضوع به دلیل افزایش استفاده از تجزیه و تحلیل در تجارت به طور فعال در حال توسعه است. داشبوردها همچنین برای استفاده شخصی (ردیاب های تناسب اندام، تجزیه و تحلیل هزینه های شخصی و غیره) استفاده می شوند.

نقشه ها یکی از قدیمی ترین روش های تجسم هستند که واقعیت اطراف را به تصویر می کشند. کارتوگرام نقشه ای است که اطلاعاتی بر روی آن به صورت رنگی یا وسایل دیگر چاپ شده است. شاید من در اینجا در مورد شرایط دقیق نباشم، ممکن است نقشه‌برداران مرا ببخشند. از کارتوگرام ها می توان برای نمایش هر گونه اطلاعات استفاده کرد - از تراکم جمعیت گرفته تا دفعات استفاده از کلمات ناسزا در هر منطقه از کشور. آنها را می توان در هر یک از انواع تجسم هایی که قبلاً در مورد آنها صحبت کردیم استفاده کرد. من آنها را در یک پاراگراف جداگانه برجسته کرده ام، زیرا اجرای آنها کاملاً با سایر انواع تجسم متفاوت است (ما منتظر یادداشتی در این مورد هستیم).

نمونه هایی از کارتوگرام (با کلیک روی عکس به سایت بروید)

جمع بندی

یادداشت به طور غیرمنتظره ای طولانی بود. شاید خوب باشد، بلافاصله می توانید ببینید که چقدر در دنیای تجسم داده ها وجود دارد. من از این مفهوم چه می فهمم و این وبلاگ درباره چه چیزی خواهد بود؟
برای من، ارائه داده ها در درجه اول مربوط به نمودارها و نمودارها و همچنین اینفوگرافیک های تعاملی است. این همان چیزی است که بخش عمده ای از یادداشت ها به آن اختصاص خواهد یافت؛ همچنین بررسی نقشه ها و داشبوردها جالب خواهد بود.