SlideShare a Scribd company logo
SEARCH
ENGINE
EDUCATION
Технический аудит

                    День 4
seo.in.russia@gmail.com
                                               Латыпов Артур

       Технический аудит, основные пункты


-   Добавить сайт в панель Яндекс.Вебмастер
    webmaster.yandex.ru

1. Главное зеркало
2. Проверка индексирования, выявление мусора
3. Отсутствие дублей
4. Поиск битых ссылок
5. Валидация кода
6. Проверка контента на уникальность
7. Наличие правильно настроенного robots.txt
8. Наличие sitemap.xml
9. Уникальность внутри сайта title, h1-h6, мета-тэгов
10.Структура url (ЧПУ)
11.Ответы сервера в http заголовках, скорость загрузки, размер
seo.in.russia@gmail.com
                                                Латыпов Артур

                Главное зеркало

Пример настройки 301 редиректа в .htaccess (без www. редирект
ведет на www.)

Options +FollowSymLinks
RewriteEngine On
RewriteCond %{HTTP_HOST} ^domain.ru$ [NC]
RewriteRule ^(.*)$ http://www.domain.ru/$1 [R=301,L]

www и БЕЗ www
В панели Вебмастера смотрим страницы в индексе, ищем на
первых трех листах страницы с www и БЕЗ www

Сторонние сайты зеркала
Если есть доступ до сайта, тогда на сайте зеркале делаем полный
дубль основного сайта. В файле robots.txt прописываем строку:
Host: www.основной-сайт.ru
Поиск мусора
Дубли главной страницы вида «http://www.name.ru/index.php»              или
«http://www.name.ru/main.php?p=index»;

Фильтры товара в интернет-магазинах, различные результаты сортировки;

Страницы с постоянной 404-й ошибкой, на которые есть ссылки. Ищутся также в
панели вебмастера в разделе “Исключено роботом”;

Страницы с результатами поиска по сайту;

Страницы для печати;

Страницы с профилями пользователей, личный кабинет, формы регистрации 
авторизации;

Страницы создания новой темы, формы добавления комментария и им
подобные;

Ввести     адрес       страницы       «www.name.ru/abrakadabra»        или
«www.name.ru/razdel/abrakadabra» - если при этом загружается страница – это
мусор;
Поиск мусора
Нечеткие дубли
Поиск мусора
Страницы должны быть закрыты от индексации в файле
robots.txt.

На эти страницы не должны вести индексируемые ссылки.

Не существующие страницы должны отдавать http заголовок
- 404 ошибка.

Страницы–листинги, нечеткие дубли иметь тэг rel=canonical
первую (основную) страницу.

<link rel="canonical"   href="http://www.site.ru/osnovnaya-
stranica.html" >
Поиск битых ссылок
Валидация кода
• http://validator.w3.org – добавляем сайт

• Количество ошибок должно стремиться к нулю

• Для решения проблем привлекаем верстальщика
  или исправляем самостоятельно
Скрытие ссылок
Работающий метод скрытия ссылок от индексации – только
через ajax NOINDEX и NOFOLLOW не работают
Структура кода
Большие технические блоки (скрипты, меню, грязный код)
уменьшают значение основного контентного блока.
Чистота в верстке
• Подключаем jquery итехнических блоков, наличие спец. Информации “размывают”
    Большое количество нужный нам скрипт в <head></head>
    объем полезного контента страницы по отношению ко всему коду. Т.е. страницы
  <script src='/js/jquery.js' type='text/javascript'></script>
    фактически могут являться дублями.
 <script src="/js/jquery.history.js" type="text/javascript"></script>
 <script src='/js/jqall.js' type='text/javascript'></script>
  Примеры грязной верстки:
  <div id=blok1>
 ----------------------------------------------------------------------------------------------------------------
  <ul class="menu2">
  <li class="menu2" id="s1" style="display: none;">
  <a href="/odnodnevnye-kontaktnye-linzy">Однодневные контактные линзы</a></li>
 Содержимое файла jqall.js:
  <li class="menu2" id="s2" style="display: none;">
 /*подгрузка данных с помощью ajax 7.html*/ линзы</a></li>
  <a href="/dvuhnedelnie-kontaktnye-linzy">Двухнедельные
 $.get("txt/name.txt", function(data){
  </ul>
  </div>      $("#ajax_ankor").html(data);
              }, "text");
  Пример чистой верстки со скрытыми блоками контента:
  <div id=blok1>
 ----------------------------------------------------------------------------------------------------------------
  <ul>
  <li id=«ajax_ankor"></li>
 Содержимое фала name.txt в папке /txt/ :
  <li id=“ankor_v_texte"><a href="/dvuhnedelnie-kontaktnye-linzy">Двухнедельные линзы</a></li>
  </ul>
 <a href="/odnodnevnye-kontaktnye-linzy">Однодневные контактные линзы</a>
  </div>
robots.txt & sitemap
Правильное содержание robots.txt:

       User-agent: Yandex
       Disallow: /links.php
       Host: www.site.ru

       User-agent: *
       Disallow: /links.php

   http://help.yandex.ru/webmaster/?id=996567 - использование
       robots.txt в Яндексе;
   http://robotstxt.org.ru - подробно описан стандарт robots.txt;
   http://www.htmlweb.ru/analiz/sitemap.php - создание sitemap.
   Yazzle также отлично справляется с созданием sitemap
Пример robots.txt
User-agent: Yandex
Disallow: /cgi-bin
Disallow: /category/*/*
Disallow: */trackback
Disallow: /*?*
Disallow: /*?
Disallow: /projects/category/news$
Host: site.ru
Уникальность контента
• Программа eTXT антиплагиат
• http://www.etxt.ru/antiplagiat/

• Проверяем весь сайт на уникальность
  контента. О��НОВНОЙ КОНТЕНТ ДОЛЖЕН
  БЫТЬ УНИКАЛЬНЫЙ!
Уникальностьналичие
•   Уникальность текстов внутри сайта
•   Уникальность title внутри сайта
•   Уникальность h1-h6
•   Уикальностьналичие мета-тэгов
seo.in.russia@gmail.com
                                       Латыпов Артур




            Ссылки на сервисы и софт


PageWeight            http://www.page-weight.ru/
Advego                http://advego.ru/text/seo/
CS Yazzle             http://www.yazzle.ru/
eTXT Антиплагиат      http://www.etxt.ru/antiplagiat/
Site Auditor          http://www.site-auditor.ru
Чек лист              http://www.seochecklist.ru/
Анализ сайтов         http://a.megaindex.ru
Скорость загрузки
      http://mainspy.ru/skorost_zagruzki_sajta
Пример аудита
Определение главного зеркала
Поиск мусорных страниц
Есть раздел, который нужно закрыть от
индексации /wp-content/
В задании на аудит, задание программисту -
исправить некоторые url на транслит.
Битые ссылки
Уникальность контента
Валидация
• Практически без ошибок
• Задание верстальщику на исправление
Чистота кода
В html копии страницы (исходный код) встречаются:
- Списки стилей
<style type="text/css">
div#fancy_inner {border-color:#BBBBBB}
div#fancy_close {left:-15px;top:-12px}
div#fancy_bg {background-color:#000000}
div#fancy_title table {display:none}
</style>

- Java скрипты в коде в том числе в тэге <head>
<script type="text/javascript">
$('textarea').autoResize({
  onResize : function() { $(this).css({opacity:0.8}); },
  animateCallback : function() { $(this).css({opacity:1}); },
  animateDuration : 300,
  extraSpace : 15
});</script>

- Так же в коде встречаются ссылки href=#
, бесполезные тэги, технические блоки.
Чистота кода
    Технический блок – отправка сообщения
 <div class="widgetcontact">
 <div class="wpcf7" id="wpcf7-f5-t1-o1"><form action="/#wpcf7-f5-t1-o1" method="post" class="wpcf7-form">
<div style="display: none;">
<input type="hidden" name="_wpcf7" value="5" />
<input type="hidden" name="_wpcf7_version" value="3.0.1" />
<input type="hidden" name="_wpcf7_unit_tag" value="wpcf7-f5-t1-o1" />
</div><h3>Контакт с нами</h3>
<p><span class="wpcf7-form-control-wrap text-86"><input type="text" name="text-86" value="" class="wpcf7-text
wpcf7-validates-as-required wpcf7-use-title-as-watermark" size="40" title="ваши ф.и.о." /></span></p>
<p><span class="wpcf7-form-control-wrap e-mail"><input type="text" name="e-mail" value="" class="wpcf7-text
wpcf7-validates-as-email wpcf7-validates-as-required wpcf7-use-title-as-watermark" size="40" title="ваш e-mail"
/></span></p>
<p><span class="wpcf7-form-control-wrap text-878"><input type="text" name="text-878" value="" class="wpcf7-text
wpcf7-use-title-as-watermark" size="40" title="ваш телефон" /></span></p>
<p><span class="wpcf7-form-control-wrap textarea-818"><textarea name="textarea-818" id="resize" class="wpcf7-
validates-as-required autoResize wpcf7-use-title-as-watermark" cols="40" rows="10" title="ваше
сообщение"></textarea></span></p>
<p><input type="submit" value="отправить" class="wpcf7-submit" /><img class="ajax-loader" style="visibility:
hidden;" alt="Отправка..." src="http://airmagistral.ru/wp-content/plugins/contact-form-7/images/ajax-loader.gif"
/></p><div class="wpcf7-response-output wpcf7-display-none"></div></form></div>
     </div>
Ответы сервера
• Вбиваю различные варианты в строку
  браузера
Airmagistral.ru/111 – 404 ошибка
Airmagistral.ru/111/ - 404 ошибка
Airmagistral.ru/news/111 – 404 ошибка
Airmagistral.ru/product/111 – 200 ОК
Airmagistral.ru/about/111 - 200 ОК
Airmagistral.ru/contacts/123 – 200 ОК
Airmagistral.ru/products/flazhki-2/123 – 200 ОК
Нужно подключать программиста.
презентация Day4
Robots.txt
• На сайте стандартный WordPress файл
  robots.txt.
• Меняем его по шаблону, с учетом
  найденных мусорных страниц и битых
  ссылок
Sitemap.xml
• Для небольших сайтов, с редко
  изменяемым контентом можем сами
  сгенерировать при помощи Yazzle
• Для больших сайтов и сайтов с часто
  изменяемым контентом – нужно
  привлекать программиста
Проверяем созданный файл в ручную, удаляем
ошибочные страницы
Webmaster.yandex.ru
• Добавление сайта в панель Вебмастера
a.megaindex.ru
Проверка title, h1-h6, мета
Проверка title, h1-h6, мета
• Отсутствуют заполненные мета-тэги
  keywords и description
Проверка title, h1-h6, мета
• С h1 в целом все ОК
Структура URL (чпу)
• ЧПУ сайта работает нормально
• Часть URL нужно перевести в транслит
  (необязательно)
Скорость загрузки, размер
•   Домен - airmagistral.ru
•   Скорость (Кб/сек) - 25.36
•   Время (сек) - 0.64
•   Размер (Кб) - 16.33
Итог
• Итогом работ по техническому аудиту является
  файл – практически ТЗ.
• Подготовил файл с аудитом по всем
  вышесказанным пунктам.
• Файл будет доступен после выполнения ДЗ.
  Условия уже стандартные:
- выполняете задание;
- отписываетесь в группе Вконтакте;
- пишите mail Ярославу;
- получаете файл 
Латыпов Артур
                                 Seo.in.russia@gmail.com




ВОПР СЫ

 Вопросы – это тайный путь к …

More Related Content

презентация Day4

  • 2. seo.in.russia@gmail.com Латыпов Артур Технический аудит, основные пункты - Добавить сайт в панель Яндекс.Вебмастер webmaster.yandex.ru 1. Главное зеркало 2. Проверка индексирования, выявление мусора 3. Отсутствие дублей 4. Поиск битых ссылок 5. Валидация кода 6. Проверка контента на уникальность 7. Наличие правильно настроенного robots.txt 8. Наличие sitemap.xml 9. Уникальность внутри сайта title, h1-h6, мета-тэгов 10.Структура url (ЧПУ) 11.Ответы сервера в http заголовках, скорость загрузки, размер
  • 3. seo.in.russia@gmail.com Латыпов Артур Главное зеркало Пример настройки 301 редиректа в .htaccess (без www. редирект ведет на www.) Options +FollowSymLinks RewriteEngine On RewriteCond %{HTTP_HOST} ^domain.ru$ [NC] RewriteRule ^(.*)$ http://www.domain.ru/$1 [R=301,L] www и БЕЗ www В панели Вебмастера смотрим страницы в индексе, ищем на первых трех листах страницы с www и БЕЗ www Сторонние сайты зеркала Если есть доступ до сайта, тогда на сайте зеркале делаем полный дубль основного сайта. В файле robots.txt прописываем строку: Host: www.основной-сайт.ru
  • 4. Поиск мусора Дубли главной страницы вида «http://www.name.ru/index.php» или «http://www.name.ru/main.php?p=index»; Фильтры товара в интернет-магазинах, различные результаты сортировки; Страницы с постоянной 404-й ошибкой, на которые есть ссылки. Ищутся также в панели вебмастера в разделе “Исключено роботом”; Страницы с результатами поиска по сайту; Страницы для печати; Страницы с про��илями пользователей, личный кабинет, формы регистрации авторизации; Страницы создания новой темы, формы добавления комментария и им подобные; Ввести адрес страницы «www.name.ru/abrakadabra» или «www.name.ru/razdel/abrakadabra» - если при этом загружается страница – это мусор;
  • 6. Поиск мусора Страницы должны быть закрыты от индексации в файле robots.txt. На эти страницы не должны вести индексируемые ссылки. Не существующие страницы должны отдавать http заголовок - 404 ошибка. Страницы–листинги, нечеткие дубли иметь тэг rel=canonical первую (основную) страницу. <link rel="canonical" href="http://www.site.ru/osnovnaya- stranica.html" >
  • 8. Валидация кода • http://validator.w3.org – добавляем сайт • Количество ошибок должно стремиться к нулю • Для решения проблем привлекаем верстальщика или исправляем самостоятельно
  • 9. Скрытие ссылок Работающий метод скрытия ссылок от индексации – только через ajax NOINDEX и NOFOLLOW не работают
  • 10. Структура кода Большие технические блоки (скрипты, меню, грязный код) уменьшают значение основного контентного блока.
  • 11. Чистота в верстке • Подключаем jquery итехнических блоков, наличие спец. Информации “размывают” Большое количество нужный нам скрипт в <head></head> объем полезного контента страницы по отношению ко всему коду. Т.е. страницы <script src='/js/jquery.js' type='text/javascript'></script> фактически могут являться дублями. <script src="/js/jquery.history.js" type="text/javascript"></script> <script src='/js/jqall.js' type='text/javascript'></script> Примеры грязной верстки: <div id=blok1> ---------------------------------------------------------------------------------------------------------------- <ul class="menu2"> <li class="menu2" id="s1" style="display: none;"> <a href="/odnodnevnye-kontaktnye-linzy">Однодневные контактные линзы</a></li> Содержимое файла jqall.js: <li class="menu2" id="s2" style="display: none;"> /*подгрузка данных с помощью ajax 7.html*/ линзы</a></li> <a href="/dvuhnedelnie-kontaktnye-linzy">Двухнедельные $.get("txt/name.txt", function(data){ </ul> </div> $("#ajax_ankor").html(data); }, "text"); Пример чистой верстки со скрытыми блоками контента: <div id=blok1> ---------------------------------------------------------------------------------------------------------------- <ul> <li id=«ajax_ankor"></li> Содержимое фала name.txt в папке /txt/ : <li id=“ankor_v_texte"><a href="/dvuhnedelnie-kontaktnye-linzy">Двухнедельные линзы</a></li> </ul> <a href="/odnodnevnye-kontaktnye-linzy">Однодневные контактные линзы</a> </div>
  • 12. robots.txt & sitemap Правильное содержание robots.txt: User-agent: Yandex Disallow: /links.php Host: www.site.ru User-agent: * Disallow: /links.php http://help.yandex.ru/webmaster/?id=996567 - использование robots.txt в Яндексе; http://robotstxt.org.ru - подробно описан стандарт robots.txt; http://www.htmlweb.ru/analiz/sitemap.php - создание sitemap. Yazzle также отлично справляется с созданием sitemap
  • 13. Пример robots.txt User-agent: Yandex Disallow: /cgi-bin Disallow: /category/*/* Disallow: */trackback Disallow: /*?* Disallow: /*? Disallow: /projects/category/news$ Host: site.ru
  • 14. Уникальность контента • Программа eTXT антиплагиат • http://www.etxt.ru/antiplagiat/ • Проверяем весь сайт на уникальность контента. ОСНОВНОЙ КОНТЕНТ ДОЛЖЕН БЫТЬ УНИКАЛЬНЫЙ!
  • 15. Уникальностьналичие • Уникальность текстов внутри сайта • Уникальность title внутри сайта • Уникальность h1-h6 • Уикальностьналичие мета-тэгов
  • 16. seo.in.russia@gmail.com Латыпов Артур Ссылки на сервисы и софт PageWeight http://www.page-weight.ru/ Advego http://advego.ru/text/seo/ CS Yazzle http://www.yazzle.ru/ eTXT Антиплагиат http://www.etxt.ru/antiplagiat/ Site Auditor http://www.site-auditor.ru Чек лист http://www.seochecklist.ru/ Анализ сайтов http://a.megaindex.ru Скорость загрузки http://mainspy.ru/skorost_zagruzki_sajta
  • 19. Поиск мусорных страниц Есть раздел, который нужно закрыть от индексации /wp-content/ В задании на аудит, задание программисту - исправить некоторые url на транслит.
  • 22. Валидация • Практически без ошибок • Задание верстальщику на исправление
  • 23. Чистота кода В html копии страницы (исходный код) встречаются: - Списки стилей <style type="text/css"> div#fancy_inner {border-color:#BBBBBB} div#fancy_close {left:-15px;top:-12px} div#fancy_bg {background-color:#000000} div#fancy_title table {display:none} </style> - Java скрипты в коде в том числе в тэге <head> <script type="text/javascript"> $('textarea').autoResize({ onResize : function() { $(this).css({opacity:0.8}); }, animateCallback : function() { $(this).css({opacity:1}); }, animateDuration : 300, extraSpace : 15 });</script> - Так же в коде встречаются ссылки href=# , бесполезные тэги, технические блоки.
  • 24. Чистота кода Технический блок – отправка сообщения <div class="widgetcontact"> <div class="wpcf7" id="wpcf7-f5-t1-o1"><form action="/#wpcf7-f5-t1-o1" method="post" class="wpcf7-form"> <div style="display: none;"> <input type="hidden" name="_wpcf7" value="5" /> <input type="hidden" name="_wpcf7_version" value="3.0.1" /> <input type="hidden" name="_wpcf7_unit_tag" value="wpcf7-f5-t1-o1" /> </div><h3>Контакт с нами</h3> <p><span class="wpcf7-form-control-wrap text-86"><input type="text" name="text-86" value="" class="wpcf7-text wpcf7-validates-as-required wpcf7-use-title-as-watermark" size="40" title="ваши ф.и.о." /></span></p> <p><span class="wpcf7-form-control-wrap e-mail"><input type="text" name="e-mail" value="" class="wpcf7-text wpcf7-validates-as-email wpcf7-validates-as-required wpcf7-use-title-as-watermark" size="40" title="ваш e-mail" /></span></p> <p><span class="wpcf7-form-control-wrap text-878"><input type="text" name="text-878" value="" class="wpcf7-text wpcf7-use-title-as-watermark" size="40" title="ваш телефон" /></span></p> <p><span class="wpcf7-form-control-wrap textarea-818"><textarea name="textarea-818" id="resize" class="wpcf7- validates-as-required autoResize wpcf7-use-title-as-watermark" cols="40" rows="10" title="ваше сообщение"></textarea></span></p> <p><input type="submit" value="отправить" class="wpcf7-submit" /><img class="ajax-loader" style="visibility: hidden;" alt="Отправка..." src="http://airmagistral.ru/wp-content/plugins/contact-form-7/images/ajax-loader.gif" /></p><div class="wpcf7-response-output wpcf7-display-none"></div></form></div> </div>
  • 25. Ответы сервера • Вбиваю различные варианты в строку браузера Airmagistral.ru/111 – 404 ошибка Airmagistral.ru/111/ - 404 ошибка Airmagistral.ru/news/111 – 404 ошибка Airmagistral.ru/product/111 – 200 ОК Airmagistral.ru/about/111 - 200 ОК Airmagistral.ru/contacts/123 – 200 ОК Airmagistral.ru/products/flazhki-2/123 – 200 ОК Нужно подключать программиста.
  • 27. Robots.txt • На сайте стандартный WordPress файл robots.txt. • Меняем его по шаблону, с учетом найденных мусорных страниц и битых ссылок
  • 28. Sitemap.xml • Для небольших сайтов, с редко изменяемым контентом можем сами сгенерировать при помощи Yazzle • Для больших сайтов и сайтов с часто изменяемым контентом – нужно привлекать программиста
  • 29. Проверяем созданный файл в ручную, удаляем ошибочные страницы
  • 30. Webmaster.yandex.ru • Добавление сайта в панель Вебмастера
  • 33. Проверка title, h1-h6, мета • Отсутствуют заполненные мета-тэги keywords и description
  • 34. Проверка title, h1-h6, мета • С h1 в целом все ОК
  • 35. Структура URL (чпу) • ЧПУ сайта работает нормально • Часть URL нужно перевести в транслит (необязательно)
  • 36. Скорость загрузки, размер • Домен - airmagistral.ru • Скорость (Кб/сек) - 25.36 • Время (сек) - 0.64 • Размер (Кб) - 16.33
  • 37. Итог • Итогом работ по техническому аудиту является файл – практически ТЗ. • Подготовил файл с аудитом по всем вышесказанным пунктам. • Файл будет доступен после выполнения ДЗ. Условия уже стандартные: - выполняете задание; - отписываетесь в группе Вконтакте; - пишите mail Ярославу; - получаете файл 
  • 38. Латыпов Артур Seo.in.russia@gmail.com ВОПР СЫ Вопросы – это тайный путь к …