Яндекс научился искать оригиналы веб-страниц

отметили
101
человек
в архиве
Яндекс научился искать оригиналы веб-страниц
Яндексу удалось создать алгоритм, определяющий, какая из веб-страниц с одинаковым текстом является оригиналом, сообщается в блоге Яндекс.Поиск. Этот алгоритм уже работает в российской формуле ранжирования, а через некоторое время он будет включен и для всех остальных стран.

Как сообщается, алгоритм еще не обладает стопроцентными полнотой и точностью, но Яндекс работает над его улучшением.
Добавил nik191 nik191 18 Декабря 2009 (исправил Vlad2000Plus Vlad2000Plus)
проблема (4)
Комментарии участников:
Vlad2000Plus
+2
Vlad2000Plus, 18 Декабря 2009 , url
1. Это лучше в поиск, сео
2. Первоисточник здесь, придется исправить
linews
+3
linews, 18 Декабря 2009 , url
алгоритм еще не обладает стопроцентными полнотой и точностью
вот это точно. Когда какой-нибудь site.ua сообщает эксклюзивную новость российских информационных агентств якобы на 10 минут раньше — это полная лажа и 100-процентная неточность.
Dreammaker
0
Dreammaker, 18 Декабря 2009 , url
Там после этого опубликована новость о усовершенствовании АГС, интересно это ещё больше качественных сайтов будут вылетать из выдачи?

http://yandex.ru/yandsearch?text=rhost%3D%22ru.remontnik.*%22|rhost%3D%22ru.remontnik.www.*%22&pag=u&lr=1


Отличный строительный портал, сайт не мой, я просто скоро запускаю нечто подо
бное, только попроще и смотрю, что есть интересного по тематике — так этот сайт был для меня примером, как сделать качественный портал и выделиться на общем фоне. И что же? 10 страниц в индексе.

Вот он качественный поиск от яндекса… :(
Max Folder
0
Max Folder, 18 Декабря 2009 , url
Не будем здесь разводить еще и сео-срач;-), но, по-моему, сайт организован не лучшим образом — больше 200 ссылок с одной страницы. На каждого мастера есть как минимум одна лишняя страница — "подробнее", которая напоминает страничку из г-каталога с двумя строчками текста, но пятью рекламными объявлениями. Так что, Яндексу есть на что обижаться, хотя бы гипотетически.
Но без сеошных придирок — очень приличный и достойный сайт.
Dreammaker
-1
Dreammaker, 18 Декабря 2009 , url
Ну там есть и ещё некоторые вещи, за которые можно прицепиться (например, облако брендов на подробной странице и ссылки на категории), но это какбы общий вид для таких сайтов. И тут вспоминается понятие "правовое государство", когда за одно и тоже правонарушение для всех и всегда аналогичные наказания. А не одного отпустили, другого избили, третьего расстреляли. :)

Хотя да, сео-срач тут не нужен, для этого сёрч есть )
Max Folder
0
Max Folder, 18 Декабря 2009 , url
Посмотрите best-stroy.ru — по-моему, почти тоже самое, но нет 200 ссылок со страницы и лишних страниц, хотя рекламы даже больше.
Dreammaker
-1
Dreammaker, 18 Декабря 2009 , url
best-stroy.ru/catalog/24709 вот тоже подробная страница для компаний. Из монстров ещё вспоминается stroyportal.ru, там тоже есть подробные страницы.

В целом сама идея подробных страниц имеет смысл, на них аккумулируется всё инфа по компании и тогда не нужно всё это выводить в перечень компаний, который какбы не совсем для этого предназначен.

Хотя конечно это всё близко к каталогам, но в данном случае, имхо, имеет больше смысла.
Max Folder
0
Max Folder, 18 Декабря 2009 , url
Не-не. Страница с расширенной информацией должна быть — никто не спорит. Но посмотрите на сайт remontnik. Попадаем на страничку со списком компаний, кликаем по названию компании — попадаем на страницу с расширенной информацией, у кого-то даже есть фотки — это нужно, никто не спорит. Но уже на этой странице есть еще одна ссылка "подробнее" (она даже не особо заметна), которая ведет на бессмысленную страницу с двумя строчками текста и контекстной рекламой. На best-stroy нет именно этой дополнительной подробной страницы, и на stroyportal такой нет.
Dreammaker
-1
Dreammaker, 18 Декабря 2009 , url
точно, не заметил :) Значит поделом им, ибо, действительно, смысла в такой странице для пользователей нету.
linews
+1
linews, 18 Декабря 2009 , url
вот живой пример:


По "делу Сюсюры" объявлен в розыск полковник ФСБ


три новости в перечне
Полит.ру, Газета.ру и "Живая Кубань" переписали эту новость с Life News (а первоисточника в списке нет). Более того, в этом перечне нет и rian.ru, которому потребовалось 25 минут, чтобы выставить заг, подзаг и две строчки новости, а потом уже дополнить ее. риан не ссылается, им — западло. Life News на лентах риа новости обычно проходит как "источник в правоохранительных органах". Это уже, к сожалению, привычная ситуация.

partner.news.yandex.ru выдает "ноль" цитируемых сообщений в принципе.
Max Folder
0
Max Folder, 18 Декабря 2009 , url
Life News на лентах риа новости обычно проходит как "источник в правоохранительных органах"

Повесьте на главной подзаголовок "Наша служба и опасна, и трудна".
Может быть, этот вопрос надо решить в личных переговорах с Яндексом? Вы — немелкое учреждение, если Вы действительно выдаете это в интернеты раньше всех, то какого хрена люди должны читать какую-то "Живая Кубань"?
У поисковиков вообще странная логика подбора источников новостей. Смешно, когда статью про Бритни Спирс публикуют РИАН, Лента.ру и "Трудовой Донбасс". По-моему, без лишних слов понятно, что "Донбасс" её где-то прихватил.
Точно также, когда в очередной раз прошла телега про Путина и Кабаеву, я полез искать новости в Гугл, в Гугл мне выдал какой-то варезник с уродским оформлением на стандартном движке. Если это они считают источником новостей, News2, SMI2, Newsland — это не источники, это боги.
manny21
0
manny21, 18 Декабря 2009 , url
> Новый алгоритм, основанный примерно на ста факторах, стал значительно умнее, быстрее и полнее старого, при этом его точность продолжает оставаться очень высокой.

Что ж это за сто факторов? У кого какие будут предположения?
ramstor
0
ramstor, 18 Декабря 2009 , url
кто первый того и тапки скорее всего
и еще 99 мелочей совсем неважных
Ivan_IV
0
Ivan_IV, 18 Декабря 2009 , url
а как с этим обстоят дела у Гуголя?


Войдите или станьте участником, чтобы комментировать