Работа с данными в любой сфере (Еременко) - страница 50

.

Таким образом, даже если вопрос был сформулирован заранее и ваш босс спрашивает, почему вы не занимаетесь обработкой данных, не думайте о себе как о сумасброде. Изложите свои доводы. Просто предложить вопрос недостаточно – он должен быть переформулирован в терминах, которые будут соответствовать имеющимся данным, иначе реализация проекта застопорится.

Как решить такую проблему, как…

Задания, которые поступают от руководства организации или от инвесторов, часто постулируются как открытые пути к вопросу, а не реальный вопрос как таковой: «Мы недопоставляем единицы продукции», или «Наши клиенты покидают нас быстрее, чем ожидалось», или «В нашем продукте есть дефект». Ни одно из этих утверждений не является вопросом. Я призываю читателей применять следующий поэтапный подход к выявлению и решению проблемы на основе данных. Это сделает первый этап более эффективным и снизит риск того, что вы сосредоточитесь на неправильной проблеме.

1. Поймите проблему

Любой, кто планирует участвовать в проектах, связанных с данными, должен прежде всего знать о ловушке, в которую он может невольно попасть еще до того, как работа начнется: если последовать решению коллеги относительно того, какими вопросами следует заняться, можно фактически выбрать ошибочную проблему. Коллега может иметь благие намерения и пытаться быть более полезным, представляя разработанные им вопросы, но они необязательно будут пригодны для запроса, адресованного данным. Заманчиво, получив несколько, по-видимому, хорошо сформулированных запросов, не беспокоиться о том, чтобы идентифицировать вопрос самостоятельно. Но это может привести к катастрофе в дальнейшем процессе; именно от вас зависит определение всех параметров бизнес-проблемы, потому что вы обучены тому, как это сделать. Слепое заимствование набора вопросов у специалиста, не связанного с данными, и применение их к вашему проекту может увенчаться решением не той проблемы или просто не привести к каким-либо результатам, потому что у вас нет для них необходимых данных.

Хватит нюхать розы

Несмотря на то что хороший аналитик данных должен начать с постановки проблемы и иметь четкое представление о ее различных аспектах, не беспокойтесь, если на этом этапе проявятся несколько неожиданных отклонений. На первой стадии процесса мы активно изучаем архив информации компании, большая часть которого, возможно, никогда ранее не обрабатывалась, – а также проводим весомую черновую работу, чтобы понять проблему компании, поэтому нас не должны пугать сюрпризы на пути. Не списывайте эти отклонения как второстепенные, отмечайте их по мере своего продвижения вперед. Именно этим маршрутом и является наука о данных, а дополнительная аналитика – ее важная часть. Иногда отклонения могут не иметь отношения к проблеме, но обладать дополнительной ценностью для бизнеса. Порой я обнаруживал, что внезапные идеи могут принести еще большую ценность, чем само решение проблемы, которой меня попросили заняться.