Яндекс научился искать в реальном времени

отметили
67
человек
в архиве
Яндекс научился искать в реальном времени
Яндекс ищет в реальном времени

Интернет, 9 июля 2010 года. Яндекс разработал и внедрил новую поисковую технологию, которая позволяет находить совсем свежие документы — через минуты после их появления в интернете.

Достаточно много поисковых запросов (от 2% в спокойные дни до 8% в дни важных событий) посвящено событиям, которые случились совсем недавно. Задавая эти запросы, пользователи ожидают найти в том числе и документы, которые были созданы только что. Чтобы хорошо отвечать на такие запросы, Яндекс, во-первых, научился выявлять их среди общего потока, и во-вторых, внедрил нового поискового робота — Orange. Orange работает в режиме реального времени. Он умеет находить свежие документы, как только они появились в интернете, индексировать их и выкладывать на поисковые сервера буквально за несколько секунд.

Некоторые сайты интернета обновляются не очень часто, а на других — например, на новостных ресурсах — новые документы создаются постоянно. Orange обходит такие сайты и добавляет новые документы в поиск по мере их появления, без задержек.

Чтобы определять, нужна ли свежая информация в ответ на те или иные запросы, Яндекс разработал несколько детекторов. Они анализируют самую разную информацию — например, тематику сообщений в СМИ или рост количества поисковых запросов по той или иной теме.

«В интернете сейчас все больше real-time информации, которая нужна людям прямо сейчас. И мы хотим дать им возможность находить её прямо сейчас, — говорит Федор Романенко, менеджер качества поиска. — Это только первый шаг, конечно, мы будем улучшать качество поиска по новостным запросам и дальше. Новая технология дает возможность делать это сравнительно легко».
Добавил Vlad2000Plus Vlad2000Plus 9 Июля 2010
проблема (3)
Комментарии участников:
NoMan
+12
NoMan, 9 Июля 2010 , url
Яндекс радует в последнее время, хорошая компания, хороший сервис, успехов им.
Exoul
0
Exoul, 9 Июля 2010 , url
Яндекс очень давно с блогами в ЖЖ работает почти в реальном времени: я зачастую спешил исправить пост после публикации пока в кеш не попал (в течении 5 минут, как они это делают не знаю).
sheller
-1
sheller, 10 Июля 2010 , url
у них договор с ЖЖ был о каких-то бонусах
rocknroll
0
rocknroll, 9 Июля 2010 , url
оказываиццо иногда и приятно почитать про яндекс, типа они еще что-то делают, кроме обувалова клиентов в яндекс-директе… малаццы типа и все такое…
Ivan_IV
0
Ivan_IV, 9 Июля 2010 , url
давай яндех, мочи гуглов! )))
X86
0
X86, 10 Июля 2010 , url
Некоторые сайты интернета обновляются не очень часто, а на других — например, на новостных ресурсах — новые документы создаются постоянно. Orange обходит такие сайты и добавляет новые документы в поиск по мере их появления, без задержек.

Интересно, списки новостных сайтов вручную забиваются? Или же роботы каким-то образом проверяют каждые пять минут все индексируемые сайты?
borisow
-3
borisow, 10 Июля 2010 , url
Спиздили идею у гугла, и уверен, что реализация будет хуже, чем у гугла…


Войдите или станьте участником, чтобы комментировать