Четвертая мировая война. Будущее уже рядом (Курпатов) - страница 75

Но оказалось, что с машинным обучением всё иначе…

Если вы имеете нечто в реальности — нечто действительное и настоящее, что сообщает вам о себе невероятно большим количеством данных, то зачем вам эксперт? Тем более если это эксперт, я прошу прощения, с человеческими — то есть весьма ограниченными и пристрастными — мозгами.

Нет, это плохая идея! Лучше просто возьмите все эти данные, перетрясите их, так сказать, хорошенько, а затем разложите в непротиворечивой структуре. Как результат вы получите закономерности, описывающие работу системы, и сможете, таким образом, влиять на неё.

Впрочем, кто мог до этого додуматься, когда никаких «больших данных» (Big Data) не было и в помине, а только их жесточайший дефицит, дороговизна и рутинное производство? Но ускоряющаяся отдача, как мы видим, работала…

Согласно общепринятой статистике, в 2002 году человечеством было произведено 18–10>18 байт (18 экзабайт) информации. А уже в 2014 году, по данным исследования, опубликованного в Supercomputing Frontiers and Innovations, выяснилось, что примерный объём данных в интернете равен 10>24 байтам (1 млн эксабайт).

Знаменитый эксперт по экономике будущего Бретт Кинг приводит такие данные, позволяющие хоть как-то представить масштаб этого информационного потопа:

Библиотека Конгресса США, являющаяся крупнейшим в мире книгохранилищем (где кроме книг есть ещё 13 млн фотографий, 4 млн карт, 500 000 млн фильмов и 3,5 млн звукозаписей) в отцифрованном виде составляет около трёх петабайт данных;

• в 2016 году мы в сутки производили в 8500 раз больше данных, чем хранится в Библиотеке Конгресса, а за секунду — в тысячу раз больше интернет-контента, нежели 130 млн печатных книг, изданных за всю историю человечества.

Проще говоря, количество цифровой информации растёт по той самой экспоненте (только вот абсолютно непонятно, в какой точке этого графика мы сейчас находимся). А что такое эта современная цифровая информация?

Это не просто данные, не просто большие данные, а связанные между собой большие данные! Не те старые книжки, стоящие на пыльной полке в ожидании случайно обнаружившего их читателя, а по сути — живой организм, полный взаимнопересекающихся отношений и связей, гипер-гипер мультиссылок.

Тут важно понимать вот что: каждый байт современной цифровой информации — это не просто байт. Он произведён кем-то, кто сам является для нас информационной структурой: все его действия, активности, решения — вся эта информация тоже есть и хранится.

Причём это вовсе не обязательно какой-то живой человек, который что-то постит на своей странице в социальной сети, — вовсе нет! Это может быть тот самый умный холодильник, мусорный бак, кассовый аппарат, детектор на входе в любое учреждение, медицинское оборудование, натыканные теперь везде уже камеры и т. д., и т. п.