SlideShare a Scribd company logo
Как поисковые системы оценивают и
учитывают возраст документа
Алексей Трудов
alexeytrudov.com
Что мы достоверно знаем
про влияние возраста url?
Ничего
* по крайней мере, в открытом
доступе информации исчезающе мало
Но возраст все равно на слуху.
«Чем больше – тем лучше!»
 Анализ конкурентов, расчет KEI
 Проверка склейки, «состаривание»
301-м редиректом
 «Почему просел трафик? Ну возраст
наверное обнулили...»
Для определения возраста используется:
• modtime в Яндекс.Xml и поиск по «date:» (Яндекс);
• дата в сниппете (Google)
Меня терзают смутные
сомнения... Три кейса:
 Сайт вошел в индекс спустя полгода по письму
Платону. Modtime = 1 визит робота.
 Недоступность полтора месяца, вылет из
индекса, заливка другого контента. Мodtime не
поменялся, сайт ведет себя почти как новый.
 Свистопляска с канонической страницей.
Modtime подклеился, но трафик стремительно
падает.
+ возраст по modtime и по «date:» весьма отличаются
https://devaka.ru/articles/operator-date
Отражает ли modtime возраст,
который учитывается Яндексом?
Проверим!
Идея очень проста:
1. Находим url с обнуленным modtime
2. Сравниваем трафик с Яндекса до и после
3. Если «возраст» по modtime важен - то увидим
статистически значимое снижение
посещаемости
5846
сайтов
4880
url c обнуленным modtime (обнуление – не
редкость!)
113 523
url c детальными данными о динамике трафика
Медиана изменения = 0
При дроблении выборки по сегментам
(возраст сайта, даты обнуления,
количество трафика…) результат не
менялся
Что насчет Google?
Дата из будущего:
Дата из прошлого:
alexeytrudov.com Creation Date: 2012-11-22T07:21:39Z
Циферки, которые показывают
поисковые системы, далеко не всегда
отражают адекватный возраст
документа — в любом понимании.
Попробуем оценить влияние
реального возраста
Яндекс:
13 131 url с трафиком, вышедшим
на плато;
Медиана 12 месяцев.
Google:
10 971 url с трафиком, вышедшим
на плато;
Медиана 16 месяцев.
Различия по t-критерию
достоверны (вероятность более
99,99%)
На этой выборке я замерил еще много-
много показателей – без особой пользы.
Нужно зайти с другой стороны…
На 6 заглушках разместил
генерированный текст
Старые url Новые url
Соль в том, чтобы страницы были максимально близки по текстовым
факторам, но не склеивались как дубли. Пришлось поломать голову.
*Способ не расскажу (даже на афтепати). У меня на него большие
планы 
VS
Еще два конкурента на новом домене
newsite.ru/page-name.html newsite.ru/name-page.html
Новый конкурент на том же домене
oldsite.ru/name-page.html
Исходный url
oldsite.ru/page-name.html
Под каждый запрос – 4 страницы
Всего в эксперименте
участвовало 12 сайтов:
Нулевой возраст
домена
Домен старше 3 лет
Нулевой возраст
страницы 318 url 159 url
Страница старше 3
лет - 159 url
954 поисковых запроса (по 6 на исходную страницу)
Индексация
 Ни одна страница не была удалена в Яндексе
как дубль
 243 url на новых удалено как недостаточно
качественные. На старых – 8.
 ��оличество страниц в поиске Google, согласно
Search Console, стабильно
Страницы-лидеры в Яндексе
На новых сайтах: 35
Новые url на
старых: 216
Старые url: 685
* Относительно
достоверно. Коэффициент
вариации для доли старых
url по разным сайтам –
4,4%
Страницы-лидеры в Google
На новых сайтах:
97
Новые url на
старых: 400
Старые url:
421
* Относительно достоверно.
Коэффициент вариации для
доли старых url по разным
сайтам – 9,4%
И заодно:
Сайт на заглушке, которая была недоступна в
течение 1,5 месяцев (домен не окончился) +
аналог на свежем
 Modtime сохранился
 В Яндексе вылетело 23 страницы из 45
 В Google по всем запросам доминирует новый
сайт
Это единичный пример! Просто информация к
размышлению
Выводы
1. Надежного универсального способа оценить дату первичной индексации
страницы чужого сайта не существует.
2. Возраст по modtime напрямую не учитывается, хотя и может коррелировать с
оценкой других факторов. Обнуление modtime не ведет к снижению трафика.
3. Длительное нахождение url в индексе – положительный фактор для Яндекса,
для Google влияния не обнаружено. Это не значит, что его нет: зависимость
может быть нелинейной.
4. Но «в среднем по больнице» трафик из Google выходит на плато позже, чем в
Яндексе. Неудивительно: с возрастом коррелирует много факторов.
5. В обоих поисковиках важны хостовые характеристики. BAD_QUALITY в
Вебмастере связан в том числе с показателями всего сайта.
На заметку для практики
1. Нет смысла оценивать по modtime эффективность склейки. Учет этого
параметра в анализе конкурентов вносит «зашумленные» данные.
2. На старте сайта полезно заранее создать заглушку для «накопления»
факторов, связанных с возрастом. При продвижении под Яндекс стоит
озаботиться также наличием url, на которых будут размещены наиболее
важные документы.
3. Использовать вылетевшие из индекса домены для новых проектов
небезопасно, даже в отсутствие санкций. Хотите красивый дропнутый домен?
Учитывайте риски! Разумеется, сохранившаяся ссылочная масса может их
перевешивать.
4. Условные ориентиры по достижению максимального трафика: 16 месяцев в
Google и 12 в Яндексе (нужны для прогноза по сроку возвра��а инвестиций).
5. Если есть проблемы с BAD_QUALITY в Вебмастере, можно поработать над
более успешными разделами, чтобы получить трафик уже сейчас и заодно
улучшить хостовые факторы. Они будут способствовать увеличению % страниц
в индексе.
Спасибо за внимание!
Заходите в гости:
alexeytrudov.com (блог)
bez-bubna.com (анализ сайта)
optimumprofit.ru (консультации)

More Related Content

Трудов Алексей. Как поисковые системы учитывают и оценивают возраст страницы

  • 1. Как поисковые системы оценивают и учитывают возраст документа Алексей Трудов alexeytrudov.com
  • 2. Что мы достоверно знаем про влияние возраста url? Ничего * по крайней мере, в открытом доступе информации исчезающе мало
  • 3. Но возраст все равно на слуху. «Чем больше – тем лучше!»  Анализ конкурентов, расчет KEI  Проверка склейки, «состаривание» 301-м редиректом  «Почему просел трафик? Ну возраст наверное обнулили...» Для определения возраста используется: • modtime в Яндекс.Xml и поиск по «date:» (Яндекс); • дата в сниппете (Google)
  • 4. Меня терзают смутные сомнения... Три кейса:  Сайт вошел в индекс спустя полгода по письму Платону. Modtime = 1 визит робота.  Недоступность полтора месяца, вылет из индекса, заливка другого контента. Мodtime не поменялся, сайт ведет себя почти как новый.  Свистопляска с канонической страницей. Modtime подклеился, но трафик стремительно падает. + возраст по modtime и по «date:» весьма отличаются https://devaka.ru/articles/operator-date
  • 5. Отражает ли modtime возраст, который учитывается Яндексом? Проверим!
  • 6. Идея очень проста: 1. Находим url с обнуленным modtime 2. Сравниваем трафик с Яндекса до и после 3. Если «возраст» по modtime важен - то увидим статистически значимое снижение посещаемости
  • 7. 5846 сайтов 4880 url c обнуленным modtime (обнуление – не редкость!) 113 523 url c детальными данными о динамике трафика
  • 8. Медиана изменения = 0 При дроблении выборки по сегментам (возраст сайта, даты обнуления, количество трафика…) результат не менялся
  • 11. Дата из прошлого: alexeytrudov.com Creation Date: 2012-11-22T07:21:39Z
  • 12. Циферки, которые показывают поисковые системы, далеко не всегда отражают адекватный возраст документа — в любом понимании.
  • 13. Попробуем оценить влияние реального возраста Яндекс: 13 131 url с трафиком, вышедшим на плато; Медиана 12 месяцев. Google: 10 971 url с трафиком, вышедшим на плато; Медиана 16 месяцев. Различия по t-критерию достоверны (вероятность более 99,99%) На этой выборке я замерил еще много- много показателей – без особой пользы. Нужно зайти с другой стороны…
  • 14. На 6 заглушках разместил генерированный текст Старые url Новые url Соль в том, чтобы страницы были максимально близки по текстовым факторам, но не склеивались как дубли. Пришлось поломать голову. *Способ не расскажу (даже на афтепати). У меня на него большие планы  VS
  • 15. Еще два конкурента на новом домене newsite.ru/page-name.html newsite.ru/name-page.html Новый конкурент на том же домене oldsite.ru/name-page.html Исходный url oldsite.ru/page-name.html Под каждый запрос – 4 страницы
  • 16. Всего в эксперименте участвовало 12 сайтов: Нулевой возраст домена Домен старше 3 лет Нулевой возраст страницы 318 url 159 url Страница старше 3 лет - 159 url 954 поисковых запроса (по 6 на исходную страницу)
  • 17. Индексация  Ни одна страница не была удалена в Яндексе как дубль  243 url на новых удалено как недостаточно качественные. На старых – 8.  Количество страниц в поиске Google, согласно Search Console, стабильно
  • 18. Страницы-лидеры в Яндексе На новых сайтах: 35 Новые url на старых: 216 Старые url: 685 * Относительно достоверно. Коэффициент вариации для доли старых url по разным сайтам – 4,4%
  • 19. Страницы-лидеры в Google На новых сайтах: 97 Новые url на старых: 400 Старые url: 421 * Относительно достоверно. Коэффициент вариации для доли старых url по разным сайтам – 9,4%
  • 20. И заодно: Сайт на заглушке, которая была недоступна в течение 1,5 месяцев (домен не окончился) + аналог на свежем  Modtime сохранился  В Яндексе вылетело 23 страницы из 45  В Google по всем запросам доминирует новый сайт Это единичный пример! Просто информация к размышлению
  • 21. Выводы 1. Надежного универсального способа оценить дату первичной индексации страницы чужого сайта не существует. 2. Возраст по modtime напрямую не учитывается, хотя и может коррелировать с оценкой других факторов. Обнуление modtime не ведет к снижению трафика. 3. Длительное нахождение url в индексе – положительный фактор для Яндекса, для Google влияния не обнаружено. Это не значит, что его нет: зависимость может быть нелинейной. 4. Но «в среднем по больнице» трафик из Google выходит на плато позже, чем в Яндексе. Неудивительно: с возрастом коррелирует много факторов. 5. В обоих поисковиках важны хостовые характеристики. BAD_QUALITY в Вебмастере связан в том числе с показателями всего сайта.
  • 22. На заметку для практики 1. Нет смысла оценивать по modtime эффективность склейки. Учет этого параметра в анализе конкурентов вносит «зашумленные» данные. 2. На старте сайта полезно заранее создать заглушку для «накопления» факторов, связанных с возрастом. При продвижении под Яндекс стоит озаботиться также наличием url, на которых будут размещены наиболее важные документы. 3. Использовать вылетевшие из индекса домены для новых проектов небезопасно, даже в отсутствие санкций. Хотите красивый дропнутый домен? Учитывайте риски! Разумеется, сохранившаяся ссылочная масса может их перевешивать. 4. Условные ориентиры по достижению максимального трафика: 16 месяцев в Google и 12 в Яндексе (нужны для прогноза по сроку возврата инвестиций). 5. Если есть проблемы с BAD_QUALITY в Вебмастере, можно поработать над более успешными разделами, чтобы получить трафик уже сейчас и заодно улучшить хостовые факторы. Они будут способствовать увеличению % страниц в индексе.
  • 23. Спасибо за внимание! Заходите в гости: alexeytrudov.com (блог) bez-bubna.com (анализ сайта) optimumprofit.ru (консультации)