— По-хорошему, нужно индексировать все, включая комментарии, что в блогах мы делать пока не умеем, — говорит Сегалович, — но при поиске следует понимать разную ценность разных частей — очевидно ведь, что первое сообщение форума важнее всех остальных. Форумы отдают RSS так, как они его отдают, и отрезать первое сообщение от остальных трудно. Но мы уже умеем искать отдельно по форумам и отдельно по блогам (это появится в ближайшей версии). Они у нас не в одной куче, это только так кажется.
Форумы и блоги отделены от «большого робота», потому что важный признак, объединяющий форумы и блоги и четко отделяющий их от всего остального, — это время. Даже выдача на запрос по умолчанию сортируется по времени.
— Вот эта временная шкала совершенно перестраивает мозги, — продолжает Илья, — это не алгоритм PageRank, а совершенно иная мера.
— Неслучайно мы по умолчанию выдаем результаты, отсортированные по времени, — замечает Андрей Себрант. — Трехлетней давности сообщение в форуме представляет скорее исторический интерес, каким бы релевантным оно ни казалось.
Несмотря на всю полезность поиска по блогам он явно не дотягивает до зарубежных аналогов и в первую очередь — до Technorati. Аркадий Волож с такой оценкой не согласен, но даже если и так, отмечает он, сервис не заброшен, работа над ним ведется очень активно. Илья Сегалович идет еще дальше.
— Technorati — лишь первый шаг в нужном направлении. Там есть задел, но нужно двигаться вперед. В блогах часто попадается ценная информация, но как ее оттуда извлечь? Мы уже решили похожую проблему с новостями, создав полностью автоматизированный сервис (руками только добавляются сами ресурсы). Ни один редактор не пострадал. Такой должности, как журналист, в «Яндексе» нет. Вот.
В голосе Ильи слышится такая неподдельная радость, что оба редактора нервно поправляют свои розовые кофточки, ожидая в следующую минуту услышать классическое «А теперь встали и вышли отсюда».
— Что касается блогов, — продолжает суровый директор по технологиям, — то есть чудовищный соблазн сделать что-то интересное. Прошлый год уже показал, что в блогосфере есть настоящие жемчужины, которые нужно доносить до внимания общественности. Они перетекают в новости в полуразмытом виде, и нужно научиться их находить и выделять. Вопрос — как это сделать. Технически это очень нетривиально.
Яндекс.Конкуренты
Место действия: большая переговорная в старом офисе «Яндекса».
Действующие лица те же.
Волож: Я против разговоров о том, что Google придет в Россию. Черная рука идет по улице, черная рука стучится в ваш подъезд…