Запись опубликована 03.12.2007 в 8:24 пп и размещена в рубрике Без рубрики. Вы можете следить за обсуждением этой записи с помощью ленты RSS 2.0. Вы можете перейти в конец и оставить комментарий. Уведомления сейчас отключены.
Проверка весов (обратных частот терминов)
http://miratools.ru/koldun/ – как и обещал.
Веса слов берет из базы.
Слова, отсутствующие в базе – ставятся в очередь.
Ограничение 10 слов.
Морфологию пока не прикрутили, потому задавайте
сущ. – ед. число, Им. падеж
глаг. – неопр. форма
и т.д.
36 Responses to “Проверка весов (обратных частот терминов)”
Оставить комментарий




Весьма зачетно. Спрашивать как формируется база не буду – думаю нет смысла
.
Система юзает «щадаящий» режим хоть?
S, разумеется.
Все слова выдаются из базы на нашем сервере.
Отсутствующие в базе ставятся в очередь, затем фильтруются на очевидные абракадабры и слова, являющиеся словоформами уже проверенных терминов.
Алгоритм не использует сложных комбинаций языка запросов.
Обращения к яндексу идут с «золотых» IP, отследить весьма сложно.
Спасибо за сервис, Михаил! Но меня интересует такой вопрос, кроме помощи в составлении правильных анкоров как можно использовать веса слов в самой оптимизации сайта? Я ответа что-то не нашел, может кто-то хотя бы даст ссылку, где можно об этом почитать? Был бы очень благодарен…
Михаил, на форуме встретил цитату из написанного Вами:
“blah запрос blah blah”, где “blah” – любые слова с весом много меньшим “запроса”.
Глянул через Ваш сервис:
гороскоп – 9371
зодиакальный – 1193146
То есть получается, что анкором «зодиакальный гороскоп», я буду продвигать запрос «зодиакальный», а не запрос «гороскоп» – я правильно понял? Или как раз наоборот?
Алексей, перечитайте еще раз, неправильно поняли.
Михаил, то есть вес всеже обратная величина от той, что выдается в Вашем замечательном сервисе? То есть чем больше значение, тем меньше вес? (просто смотрел такие слова как «погода», «скачать» – значение не превышает 5000… И при этом, например «жираф» получает 177066.
Теперь я правильно понял?
Алексей, определение веса есть на страничке сервиса
А почему тогда не использовать слово «блаблалба» в ссылке с однословником, ведь ее вес явно вообще минимальный?
вообще цель – найти слова с наименьшим весом?
Хм…
А как тогда поступать с двусловником?
Брать разбавляющие слова весом меньшем обоих? Вроде так…
с меньшим весом и неплохой частотой
Ууу, весь день сегодня изучал все про этот вес. Многое стало понятно, даже немного из того, как определить относительный вес

Свои прежние вопросы снимаю, понял свою наивность
HanSolo – как раз у «балаабаб» будет очень высокий вес – вес обратная величина от частоты.
Михаил, я так понял нужно разбавлять словами с много меньшим весом, чтобы как бы сделать основной ключ наиболее значимым? Но ведь это будет работать только при большом количестве ссылок в анкор-листе… А если продвигать всего несколькими мордами это не так важно…?
Да. интересно интересно
Позновательно, что сказать
Скажите пожалуйста, вот есть слово тетрадки, чем мне их разбавлять словами у которых вес высокий или низкий?
Какие у вас результаты по этому методу?
Спасибо!
АААААААААУУУУУУУУУУУУУ
Dimon, подобные исследования вряд ли пойдут в паблик
А сервис вроде перестал работать?
Вес слов для яндекса в сервисе считается на основе статистики слов (под формой поиска яндекса) и математических формул для IDF (логарифмы, деление, etc)?
Михаил, сервис не работает. Как же так?! ((
Михаил, с новым алгоритмом похоже веса сменили, не сходятся Ваши веса с новыми, или я ошибаюсь.
mexboy, частично.
Некоторым словам резко уменьшили веса.
да я уже на форуме темку прочитал, пока непонятно по каким критериям выбираются «особые» термины, думаю старую базу не стоит все-таки сносить, по крайней мере пока
ЗЫ: при запросах
печать::новый вес
печать
выдачи различаются, похоже что в границу кворума что-то из ссылочного подмешивают
по особым терминам я имею ввиду
При запросе:
запрос::(вес для запроса из базы миралаба)
получается выдача, которая была до смена алгоритма.
Скажите, как часто обновляются веса в вашей базе и обновляются ли вообще?
Что произошло с сервисом?
Пишет 404 ошибку – не найдена.
Действительно, сервис не доступен
баг
http://miratools.ru/koldun/?words=%E3%EE%F0%FF%F9%E8%E9
Сервис жив! Спасибо разработчикам!
Парсинг через Я.блоги или как?
Интересно, у какого слова из коллекции IDF самая маленькая?
Михаил, сервис до сих пор показывает устаревшие веса:
слово вес сервиса вес правильный
adidas 91 352 020 288 995
hugo 240 444 377 046
mercedes 43 780 370 26 908
антисептик 375 704 467 769
брадобрей 6 801 614 6 184 700
брахман 985 896 1 415 736
из-за чего перестал быть интересным…
А не хотите ли возобновить работу сервиса, показывая актуальные веса?
Михаил, сервис до сих пор показывает устаревшие веса:
слово | вес сервиса | вес правильный
adidas | 91 352 020 | 288 995
hugo | 240 444 | 377 046
mercedes | 43 780 370 | 26 908
антисептик | 375 704 | 467 769
брадобрей | 6 801 614 | 6 184 700
брахман | 985 896 | 1 415 736
из-за чего перестал быть интересным…
А не хотите ли возобновить работу сервиса, показывая актуальные веса?
Я, а смысл?
Те кому это интересно, сами могут определить.
Для остальных – это не более чем игрушка.
Смысл в том, что я не умею и не могу этот процесс автоматизировать, а проверять каждое слово руками достаточно муторно. Я не спорю, это не так часто требуется, но все-таки…
Вобщем на нет и суда нет:)