Читая многих “супер-пупер-мега сеошников”, я нигде не встречал хоть какие-то намеки на поисковый механизм яндекса. Они любят писать, о том куда потратили пару лямов и какую крутую тачку купили. Вот только кому это интересно? Поэтому их давно нет в моей ленте.
Последнею неделю занимался анализом выдачи яндекса (делал программные интерфейсы на основе поиска яндекса), и подчерпнул некоторые интересные данные, о которых раньше не знал, или знал частично.
1) Самый интересный момент. Робот яндекса при индексации вашей страницы, делит ее на “пасажи”, то есть это некоторый аналог предложений. Но яндекс почему-то подчеркивает, что пассаж — это одно предложение, особенно если оно не слишком длинное.  На основе пассажей строится выдача. Т.е. если вы задали запрос “тиц яндекса”, то яндекс сначала найдет пассажи в которых встречаются оба слова, а остальные нам и неинтересны:)
Кроме этого добавлю, что пассажи бывают двух типов - обычные, и найденные по ссылке. Второй вариант думаю объяснять не надо.

Проверенная информация о пассажах:
Сколько бы релевантных пассажей не было на странице, title+единтсвенный пассаж в выдаче всегда будут выше чем даже 10 релевантных пассажей, но без нужного title. Title имеет максимальный приоритет.
Если вы спросили в поиске слово “яндекс”, то слова “яндексу” и “в яндексе” будут абсолютно идентичны по силе релеватности (подробности во втором пункте).

Предположение по поводу пассажей:

На основе пассажей определяется уникальность документа. Скорее всего механизм яндекса проверяет % соотношение пассажей, из всего этого вывод - перемешивать предложения бессмысленно. Уникальности вы этим не добьетесь.

2) Существует несколько типов словесных соответствий запросу.  Это phrase - буквальное соответствие (скорее всего имеются ввиду падежи), strict - точное соответствие (найдены все слова), all - все остальное (наверняка частичное вхождение слов из запроса)

3) Яндекс зачем-то имеет информацию о колличестве страниц с одного сайта соответствующих запросу (и называет это статистическими данными). Но на выдачу это никак не влияет. Мой сайт находится на первом месте в выдаче и имеет в этом параметре значение 4096, воторой сайт имеет значение 1.  Для чего эти данные тогда? Не врубился. Но отсюда вывод, что сайт может иметь абсолютное несоответствие тем на страницах. То есть одну страницу вы можете прокачивать текстами про то, как сделать молоко, а на другой писать про seo. Каждая страница будет равна в потенциале попасть в топ.

На сегодня все. Буду продолжать изучать механизмы поиска яндекса.

P.S. Начал делать свой сайт http://linkfeedator.ru для своего биржевого клиента. Конечно дизайнер из меня никакущий, но надеюсь навигация и содержание будут понятны. Сейчас сделал главную страницу:) Оцените пожалуйста, как вам оно?

Усиленно читают у меня в блоге:

Google Bookmarks Digg del.icio.us Technorati Yahoo My Web News2.ru БобрДобр.ru Memori.ru МоёМесто.ru Mister Wong