Иллюстрированные комментарии Мэтта Каттса о процессе индексации Google

Комментарии Мэтта Каттса об индексации сайтов Гуглом

Неделю назад Эрик Энж опубликовал интервью с Мэттом Каттсом, руководителем отдела Гугл по борьбе со спамом. Давно Мэтт не давал таких обширных и крайне полезных интервью. Мэтт затронул очень много аспектов поисковой оптимизации:

  • Индексация и объем краулинга сайта
  • Отношение Гугл бота к ссылкам партнерских программ
  • Важность архитектурного дизайна сайта
  • Дублированный контент и его последствия
  • Фасетированная или многогранная навигация
  • Индексация PDF и сканирование JavaScript и др.

На русском языке интервью можно почитать на searchengines.ru (Часть I, Часть II), пока что опубликованы первые две части интервью, но, думаю, остальное тоже переведут.

Мне очень понравилась идея Рэнда Фишкина из SEOmoz.org визуально представить самые важные комментарии Мэтта Каттса. Это облегчает восприятие материала и добавляет развлекательный аспект. Поэтому я решила перевести и опубликовать иллюстрации Рэнда для русскоязычной аудитории.

#1. У Гугла нет фиксированного “потолка индексации”, но у объема краулинга сайта есть свои ограничения

Мэтт Каттс об индексации

Зависимость краулинга от Гугл PageRank
Мэтт Каттс: “… количество страниц, которое мы краулируем, примерно пропорционально вашему PageRank.”

“Страницы, на которые часто ссылаются, имеют тенденцию к тому, имеют тенденцию к тому, чтобы их нашли и проиндексировали достаточно быстро. Страницы с более низким PageRank краулируются не так часто.”

#2. Дублированный контент может негативно сказаться на индексации сайта

Мэтт Каттс о дублированном контенте

“…дублированный контент не является самым значительным фактором, определяющим, какое количество страниц будет прокраулировано, но он может быть фактором.”

Мэтт Каттс:
“Идея состоит в том, что если у вас есть определенный показатель PageRank, мы только за то, чтобы проиндексировать как можно больше с этого сайта. Однако некоторые из этих страниц могут быть забракованы, что, в некоторой степени, будет излишней тратой. Также сайт может иметь ограничения по нагрузке на веб узел, когда мы не сможем просканировать такое большое количество страниц.”

Совет Мэтта: “Вы можете разместить рекламу целевых страниц в партнерской программе в отдельной URL директории, которую затем заблокировать, к примеру, через robots.txt файл. Как и реклама, в большинстве своем партнерские ссылки создаются для пользователей, а не для поисковых систем. Поэтому их очень легко отследить, и вам не нужно волноваться о том, что партнерские коды «просочатся» и создадут проблемы дублированного контента, если эти страницы никогда не краулируются в первую очередь.”

О каноническом теге:
“…идея канонического тега состоит в том, чтобы дать вам возможность показать поисковым системам, что 2 страницы контента являют собой одно и то же. Возможно, вы не хотите ставить различия между красной и черной версиями продуктов, если у вас в наличии продукт 11 разных цветов.

Вы можете захотеть создать только одну страницу продукта по умолчанию, которая будет умно организована с выпадающим меню или чем-то в этом роде. Хороший способ использования тега rel=canonical – это показывать минимальные различия продукта, отметив все эти страницы rel=canonical.”

#3. Ссылочный вес партнерок

Если Google бот видит партнерскую ссылку, как он ее рассматривает: как поддержку сайта или как рекламу?
Гугл и партнерские ссылки

#4. Редиректы 301 передают часть, но не весь ссылочный вес исходной страницы

Редиректы 301 и 302

#5. Низкокачественные, не уникальные страницы могут снизить индексацию сайта

Уникальность контента сайта

#6. Фасетированная/многогранная навигация сайта и процесс постройки PageRank остаются противоречивыми темами

seo для электронной коммерции

Мэтт Каттс: “Способов навигации по одному участку сайта может быть множество, но желательно, чтобы каждая страница контента имела свой отдельный адрес URL. Есть множество способов «нарезать» данные. Если вы можете самостоятельно решить, какой способ подачи отдельного участка контента самый важный, то тогда вы можете попытаться создать некую иерархию параметров URL.”

“По возможности хорошим приемом будет организация более простых промежуточных страниц. Если кому-то придется кликнуть 7 раз через 7 слоев навигации, чтобы добраться до одного-единственного продукта, он может просто потерять терпение.”
О процессе постройки PageRank

google.com bobrdobr.ru del.icio.us technorati.com linkstore.ru news2.ru rumarkz.ru memori.ru moemesto.ru

Тэги:

21/03/2010 · Категория: Поисковая Оптимизация

3TAJIOH March 28, 2010 at 12:00

Вот уж не думал что количество страниц от PR зависит. Спасибо за полезный пост.

Александр Жданеев April 28, 2011 at 14:05

Очень доволен, что зашел сюда. Спасибо за полезную информацию. Просто и доходчиво, да еще с картинками. Отлично.

narsana August 6, 2011 at 16:06

кх кх )) пару статей на моем сайте скопированы под копирку ))) не думал что малое звено может поставить под удар основной костяк.

Leave a Comment