Правдивость визуализации заключается в том, что мы не врём на диаграммах и графиках, не искажаем реальность и не приукрашиваем её. Возможно, я бы не выделяла этот само собой разумеющийся принцип, но после выступлений мне до сих пор задают вопросы вроде «Как отрицательный тренд показать на дашборде в положительном ключе?» Ответ, разумеется: «Никак.»

Я хочу поговорить о философской и практической стороне дела. С философской точки зрения, я не могу представить ситуации, когда специалист уважающий себя и данные, с которыми работает, может пойти на сознательный обман. Всё это время в советах мы обсуждали, как полнее, нагляднее, осмысленнее и многограннее раскрыть данные. Это непростая задача, иногда — настоящий вызов, показать общий план и важные нюансы. Манипуляции с данными, наоборот, нацелены на то, чтобы исказить или скрыть эту полную картину, вычленить из неё «удобные» и «позитивные» срезы, умышленно оставив остальное за кадром. Для меня подобные манипуляции — это не один из навыков работы с данными, это профессиональный тупик. Работа специалиста по визуализации в том, чтобы помочь заказчику увидеть сложную реальность, упакованную в данные, — её закономерности, её противоречия, её суть, её правду. Если заказчик сам не хочет знать правду о своих данных, не тратьте на него время. Вы ничему не научитесь в таком проекте, только испортите репутацию.

Что касается практической стороны, давайте обсудим, что вообще считается искажением данных, и как не соврать случайно.

Мне нравится формулировка из книги Эдварда Тафти Visual Display of Quantitative Information. Он рекомендует: «Показывайте числа объектами, физические размеры которых прямо пропорциональны передаваемым значениям.» Обратите внимание, что речь тут идёт о размерах. Для столбика на бар‑чарте воспринимаемым размером будет высота (если, конечно, все столбики одинаковой ширины), а для кружочка — площадь.

Мой любимый пример нарушения этого принципа — показанная в книге иллюстрация из газеты «Правда» (хи‑хи :‑)

Здесь кружочки даже близко не прямо пропорциональны показанным значениям, в лучшем случае можно говорить о качественном соответствии «больше число, больше кружок». На горизонтальной шкале тоже безобразие — временной промежуток в 30 лет между 1940 и 1970 годами передан отрезком меньшей длины, чем годовой промежуток между 1981 и 1982 годом.

В той же книге Тафти посвящает искажениям целую главу Graphical Integrity, стр. 53⁠—77. Не думаю, что смогу сказать лучше. Читайте Тафти, если ещё не.

К счастью, в современных инструментах визуализации многие принципы сработают по умолчанию. Скажем, в Табло невозможно воспроизвести график из «Правды» даже если очень постараться. Инструмент автоматически отобразит равномерные оси и построит кружки, пропорциональные исходным значениям.

Картина роста производства, кстати, впечатляющая. Но не в актуальных для автора 1981 и 1982 годах.

И всё же есть в Табло опасная настройка, которая может испортить аккуратность изображения. Мы можем увеличить размер кружков через панель «Marks», тогда масштаб сохранится. Тут всё ок с точки зрения правдивости:

Но если воспользоваться панелью «Edit sizes» и выбрать режим «By range», наша честная прямая пропорциональность будет нарушена, стоит нам подвинуть левый край ползунка. И мы приблизимся к не правдивому графику из «Правды»:

Манипулировать изображением всеми доступными средствами — не сработает. Вы должны хорошо понимать, что за операцию совершаете, и ни в коем случае не нарушать прямо пропорциональное соответствие количественных значений и размеров на визуализации.

Ещё в Табло можно прибегнуть к классике искажений — выдернуть данные из контекста и обрезать ось, продемонстрировав таким образом взрывной рост там, где его нет:

Моё дело здесь предостеречь: не обрубайте столбиковую диаграмму, столбики всегда растут от нуля. А сама эта манипуляция настолько явная и наивная, что её раскусит большинство зрителей. И автор потеряет самое ценное — внимание и доверие аудитории.

Визуализация данныхПринципы визуализацииПравдивость
Отправить
Поделиться
Запинить

Комментарии

И всё‑таки в вашем представлении данных из Правды тоже допущена ошибка — в оригинале в 1982 году значение 537, а не 517

3 апр 2024

Вы совершенно правы! Вбивала датасет вручную и опечаталась. Посыпаю голову пеплом и несу исправленные картинки 😌

4 апр 2024

Правдивость во многом зависит от знания контекста. Когда визуализации не содержит опоры, нам не с чем сравнить даже самые объективные показатели. А иногда нужно отсечь лишнее, чтобы избавиться от визуального мусора и сосредоточиться на отдельных деталях. Например, столбики могут расти не от нуля, а от показателя предыдущего периода, если нам важно сосредоточиться, за счет чего происходит изменение (рост или падения показателя). Я бы назвал это принципом «абсолютной и относительной правдивости».

10 окт 2024

Александр, данные никогда не бывают визуальным мусором. Мы можем показывать не все точки, управляя фокусом пользователя, но всегда стараемся сохранить правильный общий контекст, чтобы спрятанные данные «оставили след» на урезанном отображении.

У Тафти сформулирован базовый принцип, который нельзя нарушать: размер объектов на графике прямо пропорционален отображаемому значению. Поэтому оторвать столбик от нуля — это всегда соврать. Нет никакой относительной правды 😌

26 ноя 2024

Рекомендуем другие советы