Какой вариант более правильный?
Комментарии участников:
поисковик отдельно, теги отдельно )
я регулярно проверяю наличие новости или связных тем кликая по тегам. рекомендую
я регулярно проверяю наличие новости или связных тем кликая по тегам. рекомендую
два — три десятка меток не заменят поисковик. куча новостей остается без связки, последнее время плюнул на это дело
плюнул — другим не мешай. скептиса я и без помощи могу излить столько что эту тему можно ыбло бы и не начинать
по поводу америки — это континент. даже два. как правило речь в новостях идет исключительно о США, поэтому я считаю логичным использовать для штатовских новостей тег сша. а если будет что-то затрагивающее еще и канаду/мексику/латиносов — вот тогда и америка пригодится
Кстати, если уж говорить об Америке, то в головах людей Америка и США связаны. Когда говоришь "Америка" никто не подумает на Канаду или Бразилию…
мне кажется, что без разницы — как назвать: германия или фрг) главное — выделить ключевые слова из текста: допустим, имя с фамилией героя, название какого-то населенного пункта и пр.
не надо выбирать между "россия" и "russia". если берут сомнения, надо писать и то и другое — это ж тэги
не буду тыкать пальцем, но некоторые топовые участники вообще теги игнорируют, а категории выбирают всякие несуразные, чтоб получить "статус эксперта" в них. уж очень смахивает на кармадрочерство
Вообще различных тегов, может быть уйма. Илья, ты предлагаешь их всех обсудить?
Предлагаю вариант — ориентироваться по Wiki.
Например вот что там про
Белорусь. 3-и раза удаляли статью с таким именем.
И непосредственно сама статья
Белоруссия
Предлагаю вариант — ориентироваться по Wiki.
Например вот что там про

И непосредственно сама статья

как видим Командер говорит о регионах, как о частном случае тегов
поэтому к консенсусу прийти не удасца, надо просто прикрутить полный список регионов\городов с возможностью выбора нескольких к форме создания\редактирования новости
работы на 20 минут и никаких споров
а рассуждать какой вариант лучше можно аж пока майтрея прийдет
поэтому к консенсусу прийти не удасца, надо просто прикрутить полный список регионов\городов с возможностью выбора нескольких к форме создания\редактирования новости
работы на 20 минут и никаких споров
а рассуждать какой вариант лучше можно аж пока майтрея прийдет
делюсь полезной ссылкой по этому вопросу
разного рода базы стран\регионов\городов на русском
разного рода базы стран\регионов\городов на русском
от не поленился!
вот вам и пример реализации, для ускорения процесса пару строк скопипиздить можно
вот вам и пример реализации, для ускорения процесса пару строк скопипиздить можно
ну если ты считаешь что проще что-то прикрутить — значит ни разу не дискутировал с Григорием )
кстати решением многих проблем стал бы краудсорсинг движка, но хозяева на такое предложение не отреагировали. будешь лоббистом? :)
кстати решением многих проблем стал бы краудсорсинг движка, но хозяева на такое предложение не отреагировали. будешь лоббистом? :)
примеры мультитега: авто/автомобиль/машина, мвд/менты/милиция и т.д. просто они в топовое облако попадают реже
надо просто прикрутить полный список регионов\городов с возможностью выбора нескольких к форме создания\редактирования новостиОб этом Григорий мне говорил года 2 назад и ничего =)
работы на 20 минут и никаких споров
Например вот что там про Белорусь. 3-и раза удаляли статью с таким именем.Я раньше спорил по этому вопросу с Григорием. Он сказал что если я буду писать "Беларусь", то будет принимать ко мне меры. Так что многие за "Беларусь", а аминистрация против, вот вам и вопрос. Так что пусть каждый пишет как хочет или то и другое.
И непосредственно сама статья Белоруссия
я думаю мнением григория можно пренебречь в виду исключительной мифичности этой личности ;)
просто поставим его перед фактом
просто поставим его перед фактом
Главное, о чем Илья говорит, необходимость просто ставить теги ))
По геопривязке можно предложить простые правила — официальное название страны, используемое в РФ.
По иным тегам — исключить все, кроме существительных в единственном числе.
Однако согласен со Skrt — для поиска по сайту использую часто google.
По геопривязке можно предложить простые правила — официальное название страны, используемое в РФ.
По иным тегам — исключить все, кроме существительных в единственном числе.
Однако согласен со Skrt — для поиска по сайту использую часто google.
Навести некий порядок в тегах было бы неплохо.
Но его не будет, пока теги вводятся только вручную, без возможности выбора из готового списка (но не ограничиваясь им).
Но я категорически против "безжалостного исправления" (поскольку это минус в рейтинг по текущему алгоритму, как я понимаю) и прочего стучания по голове. Интернет — зона свободы, не надо и сюда в сапогах приходить и по росту строить.
Но его не будет, пока теги вводятся только вручную, без возможности выбора из готового списка (но не ограничиваясь им).
Но я категорически против "безжалостного исправления" (поскольку это минус в рейтинг по текущему алгоритму, как я понимаю) и прочего стучания по голове. Интернет — зона свободы, не надо и сюда в сапогах приходить и по росту строить.
но ведь можно просто договорится и обойтись без всяких санкций. или интернет следует читать как ЭГОнэт?
не знаю кому как, а мне комфортнее в веб2.0 где каждый вкладывает сколько хочет а _сообщество_ "нормализует" данные.
мы конечно не википедия, но что мешает нам к этому стремится?
мы конечно не википедия, но что мешает нам к этому стремится?
Интернет — зона свободы, не надо и сюда в сапогах приходить и по росту строить.
но ведь можно просто договорится и обойтись без всяких санкций
Если не согласен по голове настучим, а если согласился, то будем считать что просто договорились в добровольно-принудительном порядке. =))
мое мнение, что не стоит коверкать русский езык:) белорусь это по белорусьськи, а по-русски белоруссия, точно так же как кигргизия вместо кыргызыы, алма-ата вместо алматы и так далее, а то мы тут скоро не только в тегах запутаемся:)
белорусь это по белорусьськиПравильно БелАрусь — это официальное название республики на русском языке. А белоруссия была при СССР и до официальной смены названия в Беларусии, но россияне продолжают ее так называть.
мое мнение, что зря стали коверкать русский язык! это то же самое. что "кофе" в среднем роде, к сожалению, сейчас времена баранов и коррупционеров, без изменений не вышло бы попилить бюджеты на новые справочники, а по сути эти люди — бараны тупые imho…
это то же самое, что лужков забетонировал дома 18 века, теперь стоят как новенькие, но многие считают и будут считать его дебилом…
что касается стран: можно сделать менюшку стран мира, как они официально называются МИДом, которая будет появляться перед ньюсхантером при постановке новости в разделе регионы
лучше вводить гпс координаты, по которым через апи гугла будет выбираться страна)))Это рассказ про Н2 в 2030 году? ))
Я считаю что если у страны есть несколько самых распространённых названий, то нужно в «регионах» ставить оба. Например США, Америка КНДР, Северная Корея и. т. д. Более того, я так и делаю. Кашу маслом не испортишь, а новость с помощью поиска сможет найти большеее количество читателей.
Не превращайте русский язык в математику! :)
Просто тэгов надо лепить как можно больше. Я в свои новости стараюсь побольше тэгов уместить, мешаю английские и русские названия и т.д.
Например, новость про Лукашенко, Беларусь и тракторы можно обозначить тэгами так:
Просто тэгов надо лепить как можно больше. Я в свои новости стараюсь побольше тэгов уместить, мешаю английские и русские названия и т.д.
Например, новость про Лукашенко, Беларусь и тракторы можно обозначить тэгами так:
Лукашенко, Батька, Белоруссия, Беларусь, Belarus, трактор, тракторы, производство.
Я уже намекал в узких кругах, а с кем то и общался личноИлья, если узкий клуб это те, с кем мы постоянно общаемся, заходя периодически в подвальчик с винцом, то возможно благие намеренья, так и останутся намереньями. Хотя возможно вы что-то и не договаривайте и общаетесь еще с теми, кого мы простые смертные, видеть не можем. :)
Проблема с унификацией в том что она касается именно тех тэгов которые не эффективны, 'хвоста' дистрибуции. Ну кто в здравом уме будет искать по тегу 'Россия'. 2/3 новостей на н2 попадут в эту категорию.
Унифицировать менее полулярные тэги так-же бессмысленно, т.к. их немеряное мноество и половина из них вызовет холивар. Корея? Южная Корея? Республика Корея? или Майкрософт? МС? MS? масдай? Великое Зло? Мы никогда не сойдемся.
Однако, если проблема действительно жмет многим, могу предложить решение: можно имплементировать простенький алгоритм который по каждому тэгу выдаст ассоциированные с ним тэги. Если найдется желающий заняться веб-интерфейсом к проекту, могу взять на себя алгоритм и создать базу запросов-ответов. В принципе, можно автоматизировать это дело и скрыть этот элемент. Скажем, на запрос "пиндосия", база выдаст все ассоциации (от пиндостан до США) и сразу запустит поиск по н2. Но это уже геморрой того кто займется интерфейсом.
Кстати, самое интересное в этом пайлот-проекте — переход н2 на 'самообслуживание'. Инициативные пользователи могут сами позаботиться о дополнении сайта фичерами. Наверняка придумаем как интегрировать дополнительные фичи в н2. Григорий наверняка не будет против линка на вспомогательный сайт.
Унифицировать менее полулярные тэги так-же бессмысленно, т.к. их немеряное мноество и половина из них вызовет холивар. Корея? Южная Корея? Республика Корея? или Майкрософт? МС? MS? масдай? Великое Зло? Мы никогда не сойдемся.
Однако, если проблема действительно жмет многим, могу предложить решение: можно имплементировать простенький алгоритм который по каждому тэгу выдаст ассоциированные с ним тэги. Если найдется желающий заняться веб-интерфейсом к проекту, могу взять на себя алгоритм и создать базу запросов-ответов. В принципе, можно автоматизировать это дело и скрыть этот элемент. Скажем, на запрос "пиндосия", база выдаст все ассоциации (от пиндостан до США) и сразу запустит поиск по н2. Но это уже геморрой того кто займется интерфейсом.
Кстати, самое интересное в этом пайлот-проекте — переход н2 на 'самообслуживание'. Инициативные пользователи могут сами позаботиться о дополнении сайта фичерами. Наверняка придумаем как интегрировать дополнительные фичи в н2. Григорий наверняка не будет против линка на вспомогательный сайт.
Это детали, но думаю да. Хостить можно даже у меня. Сервер не проблема. Проблема в том что лично меня не возбуждает разработка веб-приложения. А сделать табличку следуюшего формата — не проблема.
search_term, associated_term, weight
На каждый search_term может найтись несколько associated_term с разной "силой" севязи. Простенький алгоритм находящий эти ассоциации я тестировал по интересам и юзерам в ЖЖ. Работает на удивление хорошо (особенно учитывая примитивность алгоритма). В ЖЖ тэги — либо интерес, либо юзер. Задача найти схожие интересы, либо схожих юзеров.
Проблема ЖЖ — размер. Там основной гемор был обработать запрос за 100-200 мсек. Я вычисления делал в реальном времени. Тут, учитывая скромный размер базы данных можно пред-вычислить все запросы и складировать их в таблице.
search_term, associated_term, weight
На каждый search_term может найтись несколько associated_term с разной "силой" севязи. Простенький алгоритм находящий эти ассоциации я тестировал по интересам и юзерам в ЖЖ. Работает на удивление хорошо (особенно учитывая примитивность алгоритма). В ЖЖ тэги — либо интерес, либо юзер. Задача найти схожие интересы, либо схожих юзеров.
Проблема ЖЖ — размер. Там основной гемор был обработать запрос за 100-200 мсек. Я вычисления делал в реальном времени. Тут, учитывая скромный размер базы данных можно пред-вычислить все запросы и складировать их в таблице.
альтернативный сайт использующий базу Н2 — самое доступное решение при несговорчивых админах. но при этом и самое дорогое, как в плане ресурсов так и в плане раскрутки
а без раскрутки это извините нафиг никому не надо
а без раскрутки это извините нафиг никому не надо
Если речь идет только о наименованиях государств, предлагаю взять за основу ГОСТ 7.67-2003 Система стандартов по информации, библиотечному и издательскому делу. Коды названий стран
Когда-то уже приводил ссылку на него.
Когда-то уже приводил ссылку на него.