Специалисты, пытающиеся раскрыть принципы науки о данных незнакомым с ней людям, как правило, теряют свою аудиторию, лишь только речь заходит об анализе данных. Но это больше связано с психологией, чем с чем-либо еще: иррациональный страх перед словом «аналитика» автоматически заставляет многих почувствовать себя не в своей тарелке.
То, что я хочу сделать в следующих двух главах, – это не просто объяснить, как работают отдельные алгоритмы, но также выделить контекст, в котором их используют аналитики данных. В отличие от справочников, где подробно описываются теоретические тонкости алгоритма, я нахожу, что контекстуальный подход гораздо больше годится для всех типов учеников, независимо от их умений и способностей. В предыдущих двух главах мы рассмотрели: 1) как можно подойти к задаче, касающейся данных, и 2) как подготовить эти данные для анализа. Теперь мы наконец готовы приступить к анализу данных. Этот этап на самом деле описывается подходом «подключи и работай». Самая трудная часть процесса анализа данных состоит в том, чтобы понять многоаспектность проблемы и учитывать ее переменные. После того как мы поняли задачу и вопросы, которые надо поставить, применить алгоритм для ответа на эти вопросы должно быть проще простого.
Даже если вы считаете, что у вас нет необходимых инструментов или математических способностей, не позволяйте себе соблазниться и пропустить следующие две главы, думая, что можете просто нанять кого-то, чтобы сделать предварительный анализ за вас. Искушенность в математике или другой научной дисциплине может быть полезной в этот момент, но не является обязательным условием. И хотя вы можете добиться успеха, просто зная, как представлять, готовить и собирать данные, все равно нужно по крайней мере понимать каждый этап процесса, чтобы стать профессиональным аналитиком данных.