Что делать, если после всей проделанной здесь работы мы обнаружим, что данных, которые мы расценили как необходимые для нашего исследования, нет?
Наиболее эффективный подход заключается в том, чтобы изучить высший уровень массива данных и понять, какие данные у нас на самом деле есть и необходим ли дополнительный сбор сведений, прежде чем проект сможет двигаться вперед. Опять же, это означает общение с правильными людьми – теми, кто отвечает за существующие данные компании. Благодаря такому общению мы сможем получить более полное представление о том, где в данных могут обнаружиться проблемы и где нам может понадобиться дополнительная информация, чтобы гарантировать статистическую значимость выбранных нами данных. Этот шаг немного напоминает дилемму курицы и яйца, ведь мы должны знать, какие вопросы задать данным, прежде чем мы увидим эти базы данных. Но мы также должны убедиться в том, что уже на ранней стадии имеем нужные данные, – иначе потеряем много времени, прежде чем приступим к следующему этапу процесса анализа данных.
Практика – лучший путь к освоению этого. Вспомните свои мысли о том, какие типы данных будут полезны для ответа на ваши вопросы. Напишите их рядом с вопросами и делайте отметки, чтобы понять, что вам нужно в каждой контрольной точке. На первом проекте это может напомнить одновременное жонглирование многими тарелками, но с опытом все станет намного проще.
Кейс: восполнение пробелов
Рубен Коугел – руководитель отдела данных калифорнийской технологической компании VSCO, фокусирующейся на сфере искусства. На базе онлайн-подписки компания дает художникам возможность создавать цифровые инструменты взаимодействия с пользователями. На момент своего назначения Коугел был в VSCO единственным аналитиком данных, и стандартизированная практика создания отчетов, основанных на данных, в компании отсутствовала. Но Коугел увидел в имеющихся данных возможность ответить на ключевые вопросы, важные для компании: кем являются люди, которые покупают подписки VSCO, и ведут ли они себя «по-другому» после покупки?
Рубен знал, что проблема требовала обращения к бесплатным учетным записям пользователей, перешедших впоследствии на платные услуги подписки. Но это была только верхушка айсберга – Рубену нужно было начинать «бурение» и копать все глубже: