Работа с данными в любой сфере (Еременко) - страница 76

Компании, имеющие опыт работы с данными, разрабатывают строгие процедуры, которым аналитики данных должны следовать буквально, прежде чем проводить какой-либо анализ. В некоторых даже есть консультанты, проверяющие ваши действия столько времени, сколько на это потребуется. Неверный результат будет по меньшей мере стоить денег, а в худшем случае может серьезно повлиять на бизнес-операции. Вот почему так важно убедиться, что контроль качества выполнен, прежде чем перейти к следующему шагу.

Теперь, когда у вас есть прекрасное хранилище кристально чистых данных и вы знаете вопрос или серию вопросов, которые вы хотите им задать, вы можете наконец перейти к моему любимому этапу: анализу.

06

Анализ данных (часть I)

Специалисты, пытающиеся раскрыть принципы науки о данных незнакомым с ней людям, как правило, теряют свою аудиторию, лишь только речь заходит об анализе данных. Но это больше связано с психологией, чем с чем-либо еще: иррациональный страх перед словом «аналитика» автоматически заставляет многих почувствовать себя не в своей тарелке.

То, что я хочу сделать в следующих двух главах, – это не просто объяснить, как работают отдельные алгоритмы, но также выделить контекст, в котором их используют аналитики данных. В отличие от справочников, где подробно описываются теоретические тонкости алгоритма, я нахожу, что контекстуальный подход гораздо больше годится для всех типов учеников, независимо от их умений и способностей. В предыдущих двух главах мы рассмотрели: 1) как можно подойти к задаче, касающейся данных, и 2) как подготовить эти данные для анализа. Теперь мы наконец готовы приступить к анализу данных. Этот этап на самом деле описывается подходом «подключи и работай». Самая трудная часть процесса анализа данных состоит в том, чтобы понять многоаспектность проблемы и учитывать ее переменные. После того как мы поняли задачу и вопросы, которые надо поставить, применить алгоритм для ответа на эти вопросы должно быть проще простого.

Не пропустите этот шаг

Даже если вы считаете, что у вас нет необходимых инструментов или математических способностей, не позволяйте себе соблазниться и пропустить следующие две главы, думая, что можете просто нанять кого-то, чтобы сделать предварительный анализ за вас. Искушенность в математике или другой научной дисциплине может быть полезной в этот момент, но не является обязательным условием. И хотя вы можете добиться успеха, просто зная, как представлять, готовить и собирать данные, все равно нужно по крайней мере понимать каждый этап процесса, чтобы стать профессиональным аналитиком данных.