Лабиринты визуализации

Визуализация полученных результатов на основе многочисленных данных в различных срезах - непростая задача. На примере анализа объективности заработной платы в западной компании, мы увидим, в чем тут могут быть проблемы.

Давайте предположим, что вас недавно выдвинули на должность вице-президента отдела управления персоналом в компании, входящей в число лидеров в отрасли. Отличная новость! Плохая новость состоит в том, что завтра утром у вас встреча с делегацией из Комиссии по вопросу равных возможностей занятости. Это агентство, которое приводит в исполнение законы против дискриминации сотрудников. Есть подозрение, что кто-то подал жалобу на вашу компанию по поводу дискриминации в оплате труда: женский труд оплачивается дешевле мужского.

Чтобы подготовиться к данной встрече, вы просите сотрудников отдела бизнес-анализа подготовить для вас презентацию в графическом виде. Стараясь выполнить ваш информационный запрос, оказалось, что два аналитика прислали графики – каждый свой. Данные, представленные на рисунках 1 и 2 – это фактические данные одной из лидирующей компании, хотя и завуалированные.
Какой из графиков вы скорее покажете на завтрашней встрече – первый или второй?

Примите решение, прежде чем продолжить чтение.


Рис.1


Рис. 2

Посмотрев эти два рисунка, большинство обычно быстро решает, что первый график выглядит намного лучше. На каждом уровне средняя заработная плата мужчин и женщин выглядит примерно одинаковой. Второй график сильно похож на зубья пилы. Очевидно, что на втором рисунке неравенство средней заработной платы мужчин и женщин сильно заметно на большинстве уровней.

Те, кто принимает это быстрое и часто окончательное решение, неизменно сильно удивляются, узнав, что данные на рисунках 1 и 2 абсолютно одинаковы. Нет совершенно никакой разницы в данных этих двух рисунков!

Теперь, многие читатели, вероятно, призадумались. Здесь всего три измерения и всего 14 чисел на графике. Что же вносит путаницу в наши ощущения?

Чтобы решить проблему, давайте посмотрим на измерения.
На обоих рисунках: и на первом и на втором, три измерения:
• Заработная плата, соотношение размеров, на вертикальной оси;
• Уровень должности, порядковое измерение, на горизонтальной оси;
• Пол (М/Ж), номинальное измерение, также на горизонтальной оси.

Уровень должности – это то, что мы называем первичной сортировкой, так как именно в этой последовательности проводится сортировка вначале на горизонтальной оси. Последовательность идет от самого нижнего уровня слева к самому высокому уровню справа. Это ожидаемый порядок, и мы бы удивились, увидев обратное.

Пол – это вторичная сортировка на обоих рисунках. Здесь нет заранее ожидаемого порядка. На рисунке 1 представлен более галантный порядок – «сначала дамы, затем кавалеры».
При первичной сортировке (Уровень должности) на обоих рисунках присутствует ожидаемая тенденция того, что средняя заработная плата сотрудников будет повышаться с повышением Уровня. На рисунке 1 с галантной сортировкой по Полу, средняя заработная плата женщин всегда выводится первой, и отображается слева, а средняя заработная плата мужчин отображается справа на каждом Уровне. Так как превалирующая тенденция первичной сортировки заставляет нас ожидать подъема заработной платы наряду с движением глаз по графику вправо. Тот факт, что почти на каждом уровне средняя заработная плата мужчин выше, чем у женщин, практически не заметен.

Когда последовательность вторичной сортировки меняется, как показано на рисунке 2, заработная плата женщин, которая теперь оказывается справа от заработной платы мужчин, на каждом Уровне, кажется, заметно ниже. Средняя заработная плата женщин, оказываясь более низкой, справа, идет против тенденции первичной сортировки, и в глаза бросается эффект «пилы». Единственная разница между двумя рисунками в кажущейся безобидной последовательности вторичной сортировки. Люди с хорошими знаниями законов графики знают, что такая проблема может возникнуть, если вторичная сортировка – это номинальное измерение, где нет ожиданий в сортировке.

[Перепечатка материалов 12NEWS.ru разрешается только с предварительного согласования с редакцией или автором. Если вы читаете этот материал на другом ресурсе, пожалуйста, сообщите нам об этом editor@12news.ru]

Манипулирование графикой:

В реальной ситуации, описанной выше, исходное создание рисунков 1 и 2 получилось по ошибке. Тем не менее, варианты их использования поднимают тему «манипулирования». Если бы вы действительно были данным вице-президентом отдела управления персоналом, разве можно было бы вас винить за использование рисунка 1 на встрече с Комиссией по вопросам равных возможностей занятости и рисунка 2 на следующем внутреннем собрании руководства?

К сожалению, худшие манипулирующие графики создаются теми, у кого есть знания в области графики для нечестных целей. Единственный способ бороться с этим – это пройти обучение графике, чтобы выявлять подобные старания. Все больше презентации используют оперативные данные. Дни проекторов или 35 миллиметровой пленки остались далеко позади. Что будет останавливать людей от использования способов нечестной графики – это страх, что кто-то из аудитории спросит: «Не могли бы вы изменить вторичную сортировку прямо сейчас?». Так как все больше менеджеров интересуются проблемами графики, подобным этим (и другим также), можно ожидать сокращение манипулирования графикой и увеличение числа решений, принятых спокойно, основываясь на полном понимании данных.

Будет ли это лучшим показателем в вопросе объективности заработной платы?

Отходя от вопроса манипулирования графикой, если вы действительно хотите понять сущность данных, будет ли среднее – лучшим показателем? Среднее часто используется во многих компаниях, потому что оно легко рассчитывается и понятно для аудитории. Оглядываясь на рисунки 1 и 2, мы можем понять, чего стоило получить те 14 чисел, представленных там.

Каждый сотрудник в платежной ведомости компании был отсортирован по категориям по Уровням должностей, и каждая категория была рассортирована по подкатегориям на мужчин и женщин. Затем заработные платы всех женщин в каждой подкатегории были просуммированы, и сумма была разделена на число женщин в подкатегории. Таким образом, получились средние заработные платы всех женщин на данном Уровне должностей. То же самое было повторено для мужчин на том же Уровне должностей и снова для каждого другого Уровня. С данными по более чем 50000 сотрудникам, используемых на рисунках 1 и 2, наличие компьютера для суммирования, подсчета и деления было удачей.

Описанный выше процесс был настоящей проблемой для середины XX-го столетия. Но времена меняются, и новые технологии предоставляют нам новые возможности.


По материалам Data Management Review and SourceMedia, Inc.
Перевод и адаптация: Алексей Маринин
12NEWS©

© Издание 12NEWS (ИП Маринин А.Л.), 2008


Комментарии на публикацию Лабиринты визуализации

Визуализация полученных результатов на основе многочисленных данных в различных срезах - непростая задача. На примере анализа объективности заработной платы в западной компании, мы увидим, в чем тут могут быть проблемы.
Гость
Тема/заголовок:
Комментарий: