Веб-аналитик мобильных приложений компании Citrus.ua Олег Омельченко рассказал о том, как строить графики и дашборды и как их читать.

С чего все берется

Разберемся, с чего все берется. Обычно есть какой-то набор данных. Хорошо, если это набор структурированных данных. Плохо, если это набор «сырых» данных. В таком случае надо их обработать и отформатировать до создания визуализации.

С помощью количественных, качественных, цифровых и текстовых данных можно создать любого вида график либо визуализацию. Данные – это такая единичная сущность, которая отображает какую-то визуализацию.

Следующая сущность – это дашборд. Дашборд состоит из визуализации, графиков, таблиц. Цель дашборда – давать ответ на какой-то вопрос. Не всегда набор графиков и таблиц на одной и той же странице можно смело назвать дашбордом.

Еще есть одно понятие – инфографика. Она отличается от дашборда и любой другой визуализации.

Графики

Графики могут быть разные: горизонтальные или вертикальные гистограммы, чарты, круговые диаграммы, скетрплот – точечная диаграмма. На одной странице может быть несколько графиков и диаграмм.

Мы хотим всегда извлечь из данных какую-то информацию. И первая цель графиков и дашбордов – дать нам эту информацию.

Что такое инфографика

Инфографику можно сравнить с графиком. Но разница в том, что в графике и визуализации гораздо проще и эффективнее автоматизировать (обновлять) какие-то данные. При небольших усилиях данные могут меняться, и будет прослеживаться какая-то динамика.

Что касается инфографики, то обычно она выполняет единичную цель – дает понятие человеку или аудитории о какой-то одной вещи. Это можно сделать способами, выходящими за рамки возможностей простых визуализаций.

Например, инфографика, показывающая, как быстро растет население Земли: какое количество людей умирает и рождается каждый год. Также можно просмотреть, какое количество людей уже прожило на Земле. Эта информация облечена в форму, которая вроде бы не несет никакой информативности, но в то же время дает дополнительный эмоциональный оттенок. Она помогает лучше воспринять цифры, которые без визуальной составляющей не были бы так понятны.

Инфографика может быть основана не только на цифрах. Она может быть основана на взаимосвязях.

Например, инфографика может не содержать никаких цифровых значений, она просто содержит взаимоотношения. В данном случае показано, как называть скопление островов и стран, которые находятся за Ла-Маншем: Шотландия, Уэльс и Англия вместе составляют Великобританию. А вместе с Северной Ирландией это United Kingdom.

Можно, взглянув один раз на такую визуализацию-инфографику, сразу понять, что из чего состоит. Если все описывать просто текстом, это займет довольно много времени и места. А вот в таком виде все может быть предоставлено очень компактно и информативно.

Еще один пример инфографики. Диаграмма показывает путь армии Наполеона до Москвы. Видно, как войско уменьшалось, разделялось. Инфографика показывает масштаб того, что произошло во время войны 1812 года. Здесь нет цифр, но можно одним взглядом, окинув изображение, понять, что происходило: какое огромное количество народа начинало свой путь и какая небольшая часть осталась.

Инфографика зачастую содержит много ручного труда, ее трудно автоматизировать. Не обязательно показывать числовые значения. Главное, чтобы она имела ценность. А визуализация – это что-то автоматизированное и в 90 % случаев имеет числовые данные.

Что такое дашборд

Самый простой пример дашборда, с которым наверняка все встречались, это дашборд главной страницы Google Analytics. Он сразу дает представление о том, что можно назвать дашбордом. Это, во-первых, несколько визуализаций. Во-вторых, они показывают какую-то главную информацию за определенные промежутки времени. Например, количество пользователей, количество дохода за последние 7 дней, распределение посетителей по времени суток, какую-то оперативную информацию о пользователе, который находится на сайте в данный момент времени.

Отличия дашборда от визуализации

Дашборд должен показывать сложную информацию в упрощенном виде, чтобы всем было понятно.

Хороший дашборд должен рассказывать какую-то историю. Если это касается бизнеса, то он показывает, к чему стремится компания. Это стратегический дашборд.

Тактический дашборд дает ответ на вопрос, что у нас происходит прямо сейчас.

Дашборд помогает раскрыть смысл данных. Бывают ситуации, когда используется правильная визуализация, но при этом показываются неправильные данные.

Дашборд можно детализировать по мере необходимости. Этим занимается BI-система (Business Intelligence), у которой есть целый специальный набор программных продуктов или один программный продукт, который дает возможность использовать на одном и том же наборе визуализаций различные фильтры, сортировку и прочие вещи, которые не касаются непосредственно изменения самого графика, но помогают выделить важную информацию из дашборда.

Правила создания дашбордов

Что же нужно для того, чтобы дашборд получился понятным, хорошим и качественным? Главное, нужно понять – какую цель, какой ответ мы хотим получить. Например, дашборд за первые 5 секунд просмотра должен дать ответ на вопрос «Как дела?» – хорошо или плохо.

Следующий момент– это принцип инвертированной пирамиды, когда в верхней части дашборда показывается какая-то важная информация. На втором уровне идет подробная информация, которая раскрывает суть того, что находится на первом уровне. А на третьем уровне уже идет какая-то детализация, которая, может пригодиться или нет, но она должна быть.

Также важен еще один момент. Хороший дашборд не должен быть перегружен множеством элементов. Есть такое правило «7 +/- 2». Большинство людей могут одновременно обратить внимание и держать в памяти от 5 до 9 элементов. Главное, чтобы количество было в рамках от 5 до 9. Наше сознание держит информацию об этих вещах. Это правило следует распространить на элементы дашборда.

И еще один немаловажный момент. Из всего существующего набора визуализаций надо выбрать ту, которая соответствует цели (их по большому счету может быть немного).

Разберем пример. На дашборде видны три уровня инвертированной пирамиды. На первом уровне – информация о KPI, о главных показателях, о том, на что нужно ориентироваться для того, чтобы делать какие-то выводы. Следующий уровень – это детали, разбивка тех же самых показателей по времени или каким-то категориям. И третий уровень – это уже детализация. Это может быть разбивка по нескольким категориям либо выбор какого-то комбинированного графика, который больше детализирует. Иногда данные будут заставлять вас задавать какие-то вопросы, на которые детализация третьего уровня сразу же может дать ответ.

Типы дашборды: оперативные, тактические, стратегические

Какие бывают типы дашбордов для целей, которые они должны решать? Первый – это оперативные дашборды. Самый простой пример оперативного дашборда – это отчет в реальном времени Google Analytics. Он может дать ответ на вопрос, что прямо сейчас происходит на сайте. Такие дашборды ставятся в похожих на Google Analytics системах. В BI-системах они не очень распространены, так как BI-системы работают с большим объемом данных. В режиме реального времени это очень затруднительно.

Тактические дашборды дают ответ на вопрос, что происходит сейчас. Они дают выборку по какому-то периоду прошедшего времени. Дают ответ на вопрос, что происходит, правильно ли было сделано то или иное выбранное решение.

Стратегические дашборды, в противовес тактическим, смотрят в будущее. Они помогают человеку принимать решение, определиться с тем, что нужно сделать, чтобы достичь каких-то целей.

Информация на дашборде

У дашбордов могут быть различные цели, их могут просматривать разные специалисты. Например, люди, которые настраивают контекстную рекламу, должны оперировать большим количеством информации. Поэтому дашборды должны показывать всю необходимую информацию.

Существует обратная зависимость: чем выше уровень принятия решений, тем меньше нужно иметь различных типов данных, чтобы принимать решения. Обычно нужно ограничить выбор из тех вариантов данных, которые предоставляются. Это значит, что та информация, которую предоставляет дашборд, должна быть в наиболее сжатом виде, чтобы она могла дать один ответ на один вопрос.

Типы визуализаций

Выбор визуализации может производиться на основании четырех целей, на которые может дать ответ конкретная визуализация. Она может сравнить какие-то данные между собой. Например, прошлый месяц с текущим месяцем по посещаемости сайта.

Композиция отвечает на вопрос, какое количество пользователей составляет какую-то долю из общего числа.

Распределение и взаимосвязь дают ответ на вопрос, как какие-то категории пользователей соотносятся с такими-то. Например, если речь идет о сайте, то может быть такой вопрос: какие пользователи (или какие каналы) приводят на такие-то страницы.

Тренды похожи на сравнения с той лишь разницей, что тут сравнение идет в динамике по какому-то временному промежутку.

Вот основные типы визуализации на одном изображении. Также эту схему можно назвать инфографикой, которая помогает направить человека на четыре разных пути.

Пользуясь этой инфографикой, можно, задав цель, которую надо достигнуть, выбрать подходящий тип визуализации.

Улучшаем визуализацию

Для того, чтобы улучшить визуализацию данных, не обязательно придумывать какой-то крутой или необычный график. Достаточно сделать акцент на том, что важно.

Можно убрать все лишнее, что мешает работать с данными: убрать фон, лишние метки, тени, границы. Самое главное – не переусердствовать. Иначе может потеряться какая-то важная информация, которая сделает график не очень понятным. Например, если совсем убрать ось по вертикали, то будет уже сложно понять, что за числа представляют те или иные столбцы.

Какие визуализации не надо делать

Визуализация данных – это такая область, в которой очень трудно дать универсальный совет о том, как надо делать. Зато есть сразу несколько универсальных советов, как делать не надо.

Простой пример: инфографика потребления алкоголя в США в период с 1970 по 1978 год. На изображении слева видно, что вертикальная ось начинается не с нуля. Создается впечатление, что с 70 по 78 год чуть ли не в 5 раз выросло потребление алкоголя. На самом деле тут данные с 100 до 160 (меньше чем в 2 раза).

Второй момент – это то, что в качестве точек на визуализации были выбраны объемные фигуры. Люди привыкли воспринимать такие объекты в контексте плоскости и объема. И если сравнивать, то начальные и конечные точки отличаются в 9 раз!

Человеческий глаз натренирован, чтобы различать площади и объемы. Если смотреть на такую инфографику, то «сбивается прицел», и информация воспринимается как абсолютно нерелевантная настоящим данным.

На инфографике справа график начинается с нуля, точки выполнены в одном размере. Поэтому инфографика воспринимается нормально.

Следующий пример. Раньше было красиво и модно делать круговые диаграммы в объемном виде. Сейчас это воспринимается как ложное ощущение объема.

Если цель – правильно и грамотно оценить данные, то такая визуализация будет неправильная. На рисунке справа видно, что серая доля больше, чем синяя и красная. Ведь на рисунке слева все доли одинаковые.

Еще один пример того, что оси надо начинать с нуля.

Это пример говорит о применении различных цветов. Если говорить о ситуации, когда надо показать однородные составляющие, то желательно их организовывать по одному и тому же цвету.

Например, оценка обслуживания от среднего до лучшего. На рисунке слева цвета не говорят абсолютно ни о чем, а на рисунке слева цвета данных average и awful («среднее» и «худшее») как будто поменяны местами. Надо было там, где 15 %, (average – худшая оценка), сделать оттенок светлее.

Люди, которые смотрят на такие визуализации, могут сделать неправильные выводы, если не будут внимательнее читать подписи к данным.

С помощью каких программ можно визуализировать данные

Для создания графиков и диаграмм многие пользуются такими программами, как Excel или Google Spreadsheets. Обычно они помогают быстро создать визуализацию, чтобы провести начальный анализ. С Google-таблицами удобно работать в команде.

Есть еще сервис Google Data Studio, который позволяет делать визуализации в виде дашбордов. Он уже работает с гораздо большим числом источников данных, чем Excel и Google Spreadsheets.

Google Data Studio полезен для маркетинга, так как можно использовать такие источники, как Google Analytics и Google AdWords.

Microsoft Power BI и Tableau – микросистемы, которые на более высоком уровне позволяет обрабатывать данные. Это не только сервисы по визуализации построения дашбордов, но также сервисы по извлечению, трансформации и загрузке данных в саму систему.

Следующий этап – это Python и R. Это уже уровень программирования, в результате которого можно делать различные визуализации. Здесь много возможностей по обработке данных.

Также существует множество онлайн-систем, которые решают задачи по визуализации данных. Иногда полезно не лезть в дебри BI-систем, а воспользоваться одной из таких систем.

Дополнительные материалы

Советуем ознакомиться со статьями по теме:

Дашборд – что это и почему он будет вам полезен, или современный способ сделать тайное явным

Дашборды, стратегические и тактические. Лучшие примеры, советы и способы создания

Data Visualization 101: How to Choose the Right Chart or Graph for Your Data

А для вдохновения полезно будет изучить:

Канал dataisbeautiful на Reddit

Канал Infographics на Reddit

Ответы на вопросы

Может ли Google Data Studio перекрыть потребности образовательной офлайн-платформы? Если, например, надо отслеживать регистрации, формы подписки и прочее?

Google Data Studio может служить таким источником, особенно потому, что он может использовать в качестве источников данных не только таблицы, но и какие-то подключения баз данных. Поэтому, если у вашей офлайн-платформы или CRM-системы есть возможность выгрузки данных или хранения данных в базе данных, то можно без проблем подключить эту СУБД и отправлять отчеты напрямую в Google Data Studio.

В каких случаях Google Data Studio не подходит?

Google Data Studio не подходит, когда онлайн-данные и данные об офлайн-событиях нужно объединять. С этой задачей справляется система Power BI. Для какого-то сведения данных и более подробной обработки данных лучше пользоваться ею.

Если не шарю в визуализации, с чего начать? И как относишься к базовым отчетам Google Analytics?

К базовым отчетам Google Analytics отношусь хорошо. Это замечательный пример для того, чтобы начать понимать, для чего нужны визуализации, какие они бывают и как их использовать.

Так что начать можно, если вы связаны с аналитикой сайта, с базовых отчетов. Интерфейс Google Analytics дает возможность создавать пользовательские отчеты. С одной стороны, это поможет чуть-чуть подробнее понять, какие визуализации, для чего использовать. С другой стороны, понять, как работает сам Google Analytics. На самом деле этот инструмент достаточно непростой, как может показаться.

Какое количество данных оптимально выгружать в одну инфографику?

Инфографика не имеет таких строгих рамок, как в дашбордах. Главное, чтобы она выполняла цель, которую вы ей ставите. Например, я видел детальную инфографику, которая была основана на вопросе «Что лучше – Python или R». Она занимала несколько разворотов экрана.

Размер инфографики будет зависеть от того, что вы хотите показать.

Дашборд Google Analytics: как его правильно настроить, и какие данные ставить в приоритете при показе отчетности начальству?

В зависимости от того, какие нужны ответы начальству. Если речь идет о бизнесе, то наверняка одним из первых пунктов будут идти продажи. Это отчеты конверсий в Google Analytics.

Если ресурс связан с электронной торговлей, то следует настроить расширенную электронную торговлю.

Запомните правило: дашборд не должен вызывать еще больше вопросов, он должен давать ответ.

Есть ли возможность в Google Data Studio менять запрос непосредственно от каждого объекта дашборда?

Они формируются не оптимально, поэтому дашборд очень медленно работает. Именно из-за этого я в свое время начал изучать другие возможности, другие BI-системы, в том числе Microsoft Power BI.