SlideShare a Scribd company logo
Поиск для сайта:
зачем он нужен, как с ним работать,
как и зачем его улучшать

Дмитрий Вульбрун
Менеджер проектов


Я.Субботник, Минск, 2 июня 2012 года
Поиск для сайта




2                 http://clck.ru/18DUh
О чем мы сегодня поговорим

— Схема работы сервиса Яндекс.Поиск для сайта (ПДС)

— HTML-код поисковой формы и результатов поиска

— Уточнения поиска. Архитектура и принцип работы

— Индексирование по запросу. Пингеры




  3
Общая схема работы сервиса




4
1. Создание нового поиска


ПДС                               вебмастер




5                                 Поиск для сайта
1. Создание нового поиска


ПДС   2. Получение кода поисковой формы
                                          вебмастер




6                                         Поиск для сайта
1. Создание нового поиска


ПДС   2. Получение кода поисковой формы
                                          вебмастер

                                              3. Размещение
                                              поисковой формы
                                              на сайте




                            Сайт вебмастера




7                                         Поиск для сайта
1. Создание нового поиска


ПДС   2. Получение кода поисковой формы
                                          вебмастер

                                              3. Размещение
                                              поисковой формы
                                              на сайте


                                                        4. Поисковый запрос


                            Сайт вебмастера                               пользователь




8                                         Поиск для сайта
1. Создание нового поиска


  ПДС        2. Получение кода поисковой формы
                                                 вебмастер

                                                     3. Размещение
                                                     поисковой формы
                                                     на сайте



        5. Поисковый запрос + ID поиска                        4. Поисковый запрос
                   (searchid)

SERP ПДС                            Сайт вебмастера                              пользователь




                                                   * SERP - Search engine results page




 9                                               Поиск для сайта
1. Создание нового поиска


          ПДС        2. Получение кода поисковой формы
                                                         вебмастер

                                                             3. Размещение
                                                             поисковой формы
6. ID поиска
                                                             на сайте
   (searchid)


                5. Поисковый запрос + ID поиска                        4. Поисковый запрос
                           (searchid)

 SERP ПДС                                   Сайт вебмастера                              пользователь




                                                           * SERP - Search engine results page




        10                                               Поиск для сайта
1. Создание нового поиска


          ПДС               2. Получение кода поисковой формы
                                                                вебмастер

                                                                    3. Размещение
                                                                    поисковой формы
6. ID поиска    7. Область поиска, настройки поиска,
                                                                    на сайте
   (searchid)   дизайн, данные о показе рекламы.


                       5. Поисковый запрос + ID поиска                        4. Поисковый запрос
                                  (searchid)

 SERP ПДС                                              Сайт вебмастера                          пользователь




                                                                  * SERP - Search engine results page




        11                                                      Поиск для сайта
1. Создание нового поиска


          ПДС                2. Получение кода поисковой формы
                                                                 вебмастер

                                                                     3. Размещение
                                                                     поисковой формы
6. ID поиска     7. Область поиска, настройки поиска,
                                                                     на сайте
   (searchid)    дизайн, данные о показе рекламы.


                        5. Поисковый запрос + ID поиска                        4. Поисковый запрос
                                   (searchid)

 SERP ПДС                                               Сайт вебмастера                          пользователь



      8. Преобразованный
      запрос
                                                                   * SERP - Search engine results page

                 Основной индекс

        12
                        +
                   Индекс ПДС                                    Поиск для сайта
1. Создание нового поиска


          ПДС                2. Получение кода поисковой формы
                                                                 вебмастер

                                                                     3. Размещение
                                                                     поисковой формы
6. ID поиска     7. Область поиска, настройки поиска,
                                                                     на сайте
   (searchid)    дизайн, данные о показе рекламы.


                        5. Поисковый запрос + ID поиска                        4. Поисковый запрос
                                   (searchid)

 SERP ПДС                                               Сайт вебмастера                          пользователь



      8. Преобразованный
      запрос                       9. Результаты
                                   поиска                          * SERP - Search engine results page

                 Основной индекс

        13
                        +
                   Индекс ПДС                                    Поиск для сайта
1. Создание нового поиска


          ПДС                2. Получение кода поисковой формы
                                                                 вебмастер

                                                                     3. Размещение
                                                                     поисковой формы
6. ID поиска     7. Область поиска, настройки поиска,
                                                                     на сайте
   (searchid)    дизайн, данные о показе рекламы.


                        5. Поисковый запрос + ID поиска                        4. Поисковый запрос
                                   (searchid)

 SERP ПДС                                               Сайт вебмастера                            пользователь
                               10. Выдача поиска                               10. Выдача поиска



      8. Преобразованный
      запрос                       9. Результаты
                                   поиска                          * SERP - Search engine results page

                 Основной индекс

        14
                        +
                   Индекс ПДС                                    Поиск для сайта
РСЯ                              Создание рекламной площадки
                                           в партнерском интерфейсе
                                           Рекламной сети Яндекса




                                 1. Создание нового поиска


          ПДС                2. Получение кода поисковой формы
                                                                   вебмастер

                                                                           3. Размещение
                                                                           поисковой формы
6. ID поиска     7. Область поиска, настройки поиска,
                                                                           на сайте
   (searchid)    дизайн, данные о показе рекламы.


                        5. Поисковый запрос + ID поиска                              4. Поисковый запрос
                                   (searchid)

 SERP ПДС                                               Сайт вебмастера                                  пользователь
                               10. Выдача поиска                                     10. Выдача поиска



      8. Преобразованный
      запрос                       9. Результаты
                                   поиска                                * SERP - Search engine results page

                 Основной индекс

        15
                        +
                   Индекс ПДС                                      Поиск для сайта
РСЯ                               Создание рекламной площадки
                                            в партнерском интерфейсе
                                            Рекламной сети Яндекса
  Данные        Данные о показе
  о поисках     рекламы на поисках


                                 1. Создание нового поиска


          ПДС                2. Получение кода поисковой формы
                                                                    вебмастер

                                                                            3. Размещение
                                                                            поисковой формы
6. ID поиска     7. Область поиска, настройки поиска,
                                                                            на сайте
   (searchid)    дизайн, данные о показе рекламы.


                        5. Поисковый запрос + ID поиска                               4. Поисковый запрос
                                   (searchid)

 SERP ПДС                                               Сайт вебмастера                                   пользователь
                               10. Выдача поиска                                      10. Выдача поиска



      8. Преобразованный
      запрос                         9. Результаты
                                     поиска                               * SERP - Search engine results page

                 Основной индекс

        16
                        +
                   Индекс ПДС                                       Поиск для сайта
HTML-код поисковой формы
и результатов поиска




17
Код для вставки на сайт




18
Код поисковой формы
<div class="ya-site-form ya-site-form_inited_no"                            'searchid': '1902945',
 onclick="return {
                     'searchid': '1902945',                                 'action': 'http://mysite.ru/poisk.html',
                     'action': 'http://mysite.ru/poisk.html',               'type': 0,
                     'type': 0,                                             'arrow': true,
                     'arrow': true,
                     'logo': 'rb',
                                                                            'logo': 'rb',
                     'webopt': true,                                        'webopt': true,
                     'websearch': false,                                    'websearch': false,
                     'bg': '#3399ff',
                     'fg': '#ffffff',                                       'bg': '#3399ff',
                     'fontsize': 12,                                        'fg': '#ffffff',
                     'target': '_self',                                     'fontsize': 12,
                     'suggest': true,
                     'site_suggest': true,                                  'target': '_self',
                     'language': 'ru',                                      'suggest': true,
                     'tld': 'ru'                                            'site_suggest': true,
 }">
 <form action="http://yandex.ru/sitesearch" method="get" target="_self">
         <input type="hidden" name="searchid" value="1902945" />            'language': 'ru',
         <input type="hidden" name="l10n" value="ru" />                     'tld': 'ru'
         <input type="hidden" name="reqenc" value="windows-1251" />
         <input type="text" name="text" value="" />
         <input type="submit" value="Найти" />
 </form>
</div>
<style type="text/css">.ya-page_js_yes .ya-site-form_inited_no { display:
none; }</style>
<script type="text/javascript">(function(w,d,c){var
s=d.createElement('script'),h=d.getElementsByTagName('script')[0];
s.type='text/javascript';s.async=true;s.charset='utf-8';                    <input type="hidden" name="searchid" value="1902945" />
s.src=(d.location.protocol==='https:'?'https:':'http:')
+'//site.yandex.net/v2.0/js/all.js'; h.parentNode.insertBefore(s,h);
(w[c]||(w[c]=[])).push(function() {Ya.Site.Results.init()})})               <input type="hidden" name="l10n" value="ru" />
(window,document,'yandex_site_callbacks'); </script>                        <input type="hidden" name="reqenc" value="windows-1251" />




     19
JS переменные

Язык интерфейса поиска
'language': 'ru‘

Домен, в котором будет производиться поиск.
Различия в индексах и ранжировании.
'tld': 'ru'




20
HTML теги формы
Домен, в котором будет производиться поиск.
Различия в индексах и ранжировании.
<form action="http://yandex.ru/...

Язык интерфейса поиска:
<input type="hidden" name="l10n"
value="ru" />

Кодировка сайта:
<input type="hidden" name="reqenc"
value="windows-1251" />

21
Код результатов поиска
<div id="ya-site-results"                      'tld':'ru',
 onclick="return {
             'tld': 'ru',
                                               'language':'ru',
             'language': 'ru',                 'encoding':'windows-1251'
             'encoding': 'windows-1251'
             }">
</div>
<script
type="text/javascript">(function(w,d,c){var
s=d.createElement('script'),
h=d.getElementsByTagName('script')[0];
s.type='text/javascript';
s.async=true;s.charset='utf-8';
s.src=(d.location.protocol==='https:'?'https
:':'http:')+
'//site.yandex.net/v2.0/js/all.js';h.parentN
ode.insertBefore(s,h);
(w[c]||(w[c]=[])).push(function(){Ya.Site.Re
sults.init()})})
(window,document,'yandex_site_callbacks');</
script>




       22
JS переменные
Язык интерфейса поиска
'language': 'ru‘

Домен, в котором будет производиться поиск.
Различия в индексах и ранжировании.
'tld': 'ru'

Кодировка сайта
'encoding':'windows-1251'

23
Уточнения поиска
Архитектура и принцип работы




24
Уточнения. Как выглядят.




25
Уточнения. Как настраиваются.




26
Уточнения. Как работают.




27
Уточнения. Как работают.
                              вебмастер


                             1. область
                              поиска,
                             уточнения


                       ПДС




28
Уточнения. Как работают.
                                  вебмастер

            пользователь
                                 1. область
            2. запрос             поиска,
                                 уточнения


           SERP ПДС        ПДС




29
Уточнения. Как работают.
                                                   вебмастер

                    пользователь
                                                  1. область
                    2. запрос                      поиска,
     3. запрос                                    уточнения


     ЛМ             SERP ПДС            ПДС
4. дерево запроса




30
                             *ЛМ – Лингвистический модуль
Уточнения. Как работают.
                                                     вебмастер

                    пользователь
                                                    1. область
                    2. запрос                        поиска,
     3. запрос                     5. searchid      уточнения


     ЛМ             SERP ПДС             ПДС
4. дерево запроса                     6. XML с
                                      настройками




31
                             *ЛМ – Лингвистический модуль
Уточнения. Как работают.
                                                          вебмастер

                        пользователь
                                                         1. область
                        2. запрос                         поиска,
     3. запрос                         5. searchid       уточнения


     ЛМ                SERP ПДС              ПДС
4. дерево запроса                         6. XML с
                                          настройками
     7. дерево запроса с уточнениями и областью поиска


                        ПОИСК
32
                                 *ЛМ – Лингвистический модуль
Уточнения. Как работают.
                                                          вебмастер

                        пользователь
                                                         1. область
                        2. запрос                         поиска,
     3. запрос                         5. searchid       уточнения


     ЛМ                SERP ПДС              ПДС
4. дерево запроса                         6. XML с
                                          настройками
     7. дерево запроса с уточнениями и областью поиска


                        ПОИСК
33
                                 *ЛМ – Лингвистический модуль
http запрос от пользователя в Яндекс
http://yandex.ru/sitesearch?
       text=персонаж+lineage
       &searchid=1775761
       &constraintid=8




  34
Уточнения. Как работают.
                                                          вебмастер

                        пользователь
                                                         1. область
                        2. запрос                         поиска,
     3. запрос                         5. searchid       уточнения


     ЛМ                SERP ПДС              ПДС
4. дерево запроса                         6. XML с
                                          настройками
     7. дерево запроса с уточнениями и областью поиска


                        ПОИСК
35
                                 *ЛМ – Лингвистический модуль
Лингвистический модуль
персонаж lineage


                            ЛМ

(
         персонаж ^ personage
)
&&/(-7 7)
(
      lineage ^ линейка ^ !!линейдж ^ !!линейка ^
      ((line &/(1 1) age )) ^ (лайн &/(1 1) аге) ^
      лайнаге
)

    36
Уточнения. Как работают.
                                                          вебмастер

                        пользователь
                                                         1. область
                        2. запрос                         поиска,
     3. запрос                         5. searchid       уточнения


     ЛМ                SERP ПДС              ПДС
4. дерево запроса                         6. XML с
                                          настройками
     7. дерево запроса с уточнениями и областью поиска


                        ПОИСК
37
                                 *ЛМ – Лингвистический модуль
Данные в XML от ПДС в SERP
...
<urllist>
        <url loc=“http://alltogame.ru” ...></url>
        ...
</urllist>
...
<constraints>
   <constraint id=“8”>
       <multiselect value=“false”>
       <name value=“Объявления”>
       <type type-id=“5”>
       <value value=“url:http://alltogame.ru/notice |
                     url:http://alltogame.ru/notice*”>
   </constraint>
   ...
</constraints>
...

  38
Уточнения. Как работают.
                                                          вебмастер

                        пользователь
                                                         1. область
                        2. запрос                         поиска,
     3. запрос                         5. searchid       уточнения


     ЛМ                SERP ПДС              ПДС
4. дерево запроса                         6. XML с
                                          настройками
     7. дерево запроса с уточнениями и областью поиска


                        ПОИСК
39
                                 *ЛМ – Лингвистический модуль
Преобразование дерева запроса
(
         персонаж ^ personage
)
&&/(-7 7)
(
      lineage ^ линейка ^ !!линейдж ^ !!линейка ^
      ((line &/(1 1) age )) ^ (лайн &/(1 1) аге) ^
      лайнаге
)




    40
Преобразование дерева запроса
(
         персонаж ^ personage
)
&&/(-7 7)
(
      lineage ^ линейка ^ !!линейдж ^ !!линейка ^
      ((line &/(1 1) age )) ^ (лайн &/(1 1) аге) ^
      лайнаге
)

<< url:"alltogame.ru/notice" | url:"alltogame.ru/notice*"




    41
Преобразование дерева запроса
(
         персонаж ^ personage
)
&&/(-7 7)
(
      lineage ^ линейка ^ !!линейдж ^ !!линейка ^
      ((line &/(1 1) age )) ^ (лайн &/(1 1) аге) ^
      лайнаге
)

<< url:"alltogame.ru/notice" | url:"alltogame.ru/notice*"

         << (rhost:"ru.alltogame" | rhost:"ru.alltogame.*")




    42
Индексирование по запросу
Пинги и Пингеры




43
Дополнительный поисковый индекс
                     SERP ПДС
            Запрос                    Запрос




 Основной индекс                  Индекс ПДС


       Результаты
                     SERP ПДС           Результаты

                         Результаты

  44
Индексирование по запросу
  Вебмастер   Отправка HTTP-
                               Плагин для CMS
  (вручную)      запроса




  45
Индексирование по запросу
  Вебмастер    Отправка HTTP-
                                          Плагин для CMS
  (вручную)       запроса
              Пинг (отправка URL документа)

       ПДС




  46
Индексирование по запросу
  Вебмастер         Отправка HTTP-
                                               Плагин для CMS
  (вручную)            запроса
                   Пинг (отправка URL документа)

       ПДС
        URL документа


 Робот ПДС



  47
Индексирование по запросу
  Вебмастер         Отправка HTTP-
                                               Плагин для CMS
  (вручную)            запроса
                   Пинг (отправка URL документа)

       ПДС
        URL документа
                           URL документа

 Робот ПДС              Содержимое документа
                                                   Сайт



  48
Индексирование по запросу
  Вебмастер         Отправка HTTP-
                                               Плагин для CMS
  (вручную)            запроса
                   Пинг (отправка URL документа)

       ПДС
        URL документа
                           URL документа

 Робот ПДС              Содержимое документа
                                                   Сайт
        Содержимое документа


Индекс ПДС

  49
Индексирование по запросу
  Вебмастер         Отправка HTTP-
                                               Плагин для CMS
  (вручную)            запроса
                   Пинг (отправка URL документа)

       ПДС
        URL документа
                           URL документа

 Робот ПДС              Содержимое документа
                                                   Сайт
        Содержимое документа


Индекс ПДС

  50
Плагины-пингеры для CMS

       1. Реакция на событие (сохранение документа)


       2. Получение информации о документе (URL)


                3. Отправка запроса в Я.ПДС
              http://site.yandex.ru/ping.xml?...


            4. Расшифровка ответа, запись в БД


  51
Индексирование по запросу
  Вебмастер         Отправка HTTP-
                                               Плагин для CMS
  (вручную)            запроса
                   Пинг (отправка URL документа)

       ПДС
        URL документа
                          URL документа

 Робот ПДС              Содержимое документа
                                                   Сайт
        Содержимое документа


Индекс ПДС

  52
Прием и обработка пингов в ПДС

                       1. Прием пинга


       2. Идентификация отправителя (IP + ключ + Я.ВМ)


           3. Проверка на попадание пинга в квоту


                4. Отправка пинга в Робот ПДС

  53
Формула для распределения квот
скачивания для Робота ПДС
                Q(host) = f(F1, F2, …, Fn)
где:

        F1 – Фактор кол-ва запросов к поисковой площадке

        F2 – Признак того, что площадка недавно добавлена

        …




       54
Индексирование по запросу
  Вебмастер         Отправка HTTP-
                                               Плагин для CMS
  (вручную)            запроса
                   Пинг (отправка URL документа)

       ПДС
        URL документа
                          URL документа

 Робот ПДС              Содержимое документа
                                                   Сайт
        Содержимое документа


Индекс ПДС

  55
Робот ПДС



  SERP ПДС

   Индекс ПДС




  56
Робот ПДС



  SERP ПДС

   Индекс ПДС




  57
Робот ПДС           URL
                    документа



                crawler

  SERP ПДС

   Индекс ПДС




  58
Робот ПДС                      URL
                               документа



                Internet   crawler

  SERP ПДС

   Индекс ПДС




  59
Робот ПДС                        URL
                                 документа



                Internet   crawler
                                 Содержимое
                                 документа
  SERP ПДС
                           Построение
                            индекса

   Индекс ПДС




  60
Робот ПДС                        URL
                                 документа



                Internet   crawler
                                 Содержимое
                                 документа
  SERP ПДС
                           Построение
                            индекса

   Индекс ПДС




  61
Робот ПДС                        URL
                                 документа



                Internet   crawler
                                 Содержимое
                                 документа
  SERP ПДС
                           Построение
                            индекса

   Индекс ПДС




  62
Ваши вопросы?




63
            http://clck.ru/18DUh
Дмитрий Вульбрун
Менеджер проектов

wulbrun@yandex-team.ru

@wulbrun

More Related Content

Дмитрий Вульбрун "Поиск для сайта: зачем он нужен, как с ним работать, как и зачем его улучшать"

  • 1. Поиск для сайта: зачем он нужен, как с ним работать, как и зачем его улучшать Дмитрий Вульбрун Менеджер проектов Я.Субботник, Минск, 2 июня 2012 года
  • 2. Поиск для сайта 2 http://clck.ru/18DUh
  • 3. О чем мы сегодня поговорим — Схема работы сервиса Яндекс.Поиск для сайта (ПДС) — HTML-код поисковой формы и результатов поиска — Уточнения поиска. Архитектура и принцип работы — Индексирование по запросу. Пингеры 3
  • 5. 1. Создание нового поиска ПДС вебмастер 5 Поиск для сайта
  • 6. 1. Создание нового поиска ПДС 2. Получение кода поисковой формы вебмастер 6 Поиск для сайта
  • 7. 1. Создание нового поиска ПДС 2. Получение кода поисковой формы вебмастер 3. Размещение поисковой формы на сайте Сайт вебмастера 7 Поиск для сайта
  • 8. 1. Создание нового поиска ПДС 2. Получение кода поисковой формы вебмастер 3. Размещение поисковой формы на сайте 4. Поисковый запрос Сайт вебмастера пользователь 8 Поиск для сайта
  • 9. 1. Создание нового поиска ПДС 2. Получение кода поисковой формы вебмастер 3. Размещение поисковой формы на сайте 5. Поисковый запрос + ID поиска 4. Поисковый запрос (searchid) SERP ПДС Сайт вебмастера пользователь * SERP - Search engine results page 9 Поиск для сайта
  • 10. 1. Создание нового поиска ПДС 2. Получение кода поисковой формы вебмастер 3. Размещение поисковой формы 6. ID поиска на сайте (searchid) 5. Поисковый запрос + ID поиска 4. Поисковый запрос (searchid) SERP ПДС Сайт вебмастера пользователь * SERP - Search engine results page 10 Поиск для сайта
  • 11. 1. Создание нового поиска ПДС 2. Получение кода поисковой формы вебмастер 3. Размещение поисковой формы 6. ID поиска 7. Область поиска, настройки поиска, на сайте (searchid) дизайн, данные о показе рекламы. 5. Поисковый запрос + ID поиска 4. Поисковый запрос (searchid) SERP ПДС Сайт вебмастера пользователь * SERP - Search engine results page 11 Поиск для сайта
  • 12. 1. Создание нового поиска ПДС 2. Получение кода поисковой формы вебмастер 3. Размещение поисковой формы 6. ID поиска 7. Область поиска, настройки поиска, на сайте (searchid) дизайн, данные о показе рекламы. 5. Поисковый запрос + ID поиска 4. Поисковый запрос (searchid) SERP ПДС Сайт вебмастера пользователь 8. Преобразованный запрос * SERP - Search engine results page Основной индекс 12 + Индекс ПДС Поиск для сайта
  • 13. 1. Создание нового поиска ПДС 2. Получение кода поисковой формы вебмастер 3. Размещение поисковой формы 6. ID поиска 7. Область поиска, настройки поиска, на сайте (searchid) дизайн, данные о показе рекламы. 5. Поисковый запрос + ID поиска 4. Поисковый запрос (searchid) SERP ПДС Сайт вебмастера пользователь 8. Преобразованный запрос 9. Результаты поиска * SERP - Search engine results page Основной индекс 13 + Индекс ПДС Поиск для сайта
  • 14. 1. Создание нового поиска ПДС 2. Получение кода поисковой формы вебмастер 3. Размещение поисковой формы 6. ID поиска 7. Область поиска, настройки поиска, на сайте (searchid) дизайн, данные о показе рекламы. 5. Поисковый запрос + ID поиска 4. Поисковый запрос (searchid) SERP ПДС Сайт вебмастера пользователь 10. Выдача поиска 10. Выдача поиска 8. Преобразованный запрос 9. Результаты поиска * SERP - Search engine results page Основной индекс 14 + Индекс ПДС Поиск для сайта
  • 15. РСЯ Создание рекламной площадки в партнерском интерфейсе Рекламной сети Яндекса 1. Создание нового поиска ПДС 2. Получение кода поисковой формы вебмастер 3. Размещение поисковой формы 6. ID поиска 7. Область поиска, настройки поиска, на сайте (searchid) дизайн, данные о показе рекламы. 5. Поисковый запрос + ID поиска 4. Поисковый запрос (searchid) SERP ПДС Сайт вебмастера пользователь 10. Выдача поиска 10. Выдача поиска 8. Преобразованный запрос 9. Результаты поиска * SERP - Search engine results page Основной индекс 15 + Индекс ПДС Поиск для сайта
  • 16. РСЯ Создание рекламной площадки в партнерском интерфейсе Рекламной сети Яндекса Данные Данные о показе о поисках рекламы на поисках 1. Создание нового поиска ПДС 2. Получение кода поисковой формы вебмастер 3. Размещение поисковой формы 6. ID поиска 7. Область поиска, настройки поиска, на сайте (searchid) дизайн, данные о показе рекламы. 5. Поисковый запрос + ID поиска 4. Поисковый запрос (searchid) SERP ПДС Сайт вебмастера пользователь 10. Выдача поиска 10. Выдача поиска 8. Преобразованный запрос 9. Результаты поиска * SERP - Search engine results page Основной индекс 16 + Индекс ПДС Поиск для сайта
  • 17. HTML-код поисковой формы и результатов поиска 17
  • 18. Код для вставки на сайт 18
  • 19. Код поисковой формы <div class="ya-site-form ya-site-form_inited_no" 'searchid': '1902945', onclick="return { 'searchid': '1902945', 'action': 'http://mysite.ru/poisk.html', 'action': 'http://mysite.ru/poisk.html', 'type': 0, 'type': 0, 'arrow': true, 'arrow': true, 'logo': 'rb', 'logo': 'rb', 'webopt': true, 'webopt': true, 'websearch': false, 'websearch': false, 'bg': '#3399ff', 'fg': '#ffffff', 'bg': '#3399ff', 'fontsize': 12, 'fg': '#ffffff', 'target': '_self', 'fontsize': 12, 'suggest': true, 'site_suggest': true, 'target': '_self', 'language': 'ru', 'suggest': true, 'tld': 'ru' 'site_suggest': true, }"> <form action="http://yandex.ru/sitesearch" method="get" target="_self"> <input type="hidden" name="searchid" value="1902945" /> 'language': 'ru', <input type="hidden" name="l10n" value="ru" /> 'tld': 'ru' <input type="hidden" name="reqenc" value="windows-1251" /> <input type="text" name="text" value="" /> <input type="submit" value="Найти" /> </form> </div> <style type="text/css">.ya-page_js_yes .ya-site-form_inited_no { display: none; }</style> <script type="text/javascript">(function(w,d,c){var s=d.createElement('script'),h=d.getElementsByTagName('script')[0]; s.type='text/javascript';s.async=true;s.charset='utf-8'; <input type="hidden" name="searchid" value="1902945" /> s.src=(d.location.protocol==='https:'?'https:':'http:') +'//site.yandex.net/v2.0/js/all.js'; h.parentNode.insertBefore(s,h); (w[c]||(w[c]=[])).push(function() {Ya.Site.Results.init()})}) <input type="hidden" name="l10n" value="ru" /> (window,document,'yandex_site_callbacks'); </script> <input type="hidden" name="reqenc" value="windows-1251" /> 19
  • 20. JS переменные Язык интерфейса поиска 'language': 'ru‘ Домен, в котором будет производиться поиск. Различия в индексах и ранжировании. 'tld': 'ru' 20
  • 21. HTML теги формы Домен, в котором будет производиться поиск. Различия в индексах и ранжировании. <form action="http://yandex.ru/... Язык интерфейса поиска: <input type="hidden" name="l10n" value="ru" /> Кодировка сайта: <input type="hidden" name="reqenc" value="windows-1251" /> 21
  • 22. Код результатов поиска <div id="ya-site-results" 'tld':'ru', onclick="return { 'tld': 'ru', 'language':'ru', 'language': 'ru', 'encoding':'windows-1251' 'encoding': 'windows-1251' }"> </div> <script type="text/javascript">(function(w,d,c){var s=d.createElement('script'), h=d.getElementsByTagName('script')[0]; s.type='text/javascript'; s.async=true;s.charset='utf-8'; s.src=(d.location.protocol==='https:'?'https :':'http:')+ '//site.yandex.net/v2.0/js/all.js';h.parentN ode.insertBefore(s,h); (w[c]||(w[c]=[])).push(function(){Ya.Site.Re sults.init()})}) (window,document,'yandex_site_callbacks');</ script> 22
  • 23. JS переменные Язык интерфейса поиска 'language': 'ru‘ Домен, в котором будет производиться поиск. Различия в индексах и ранжировании. 'tld': 'ru' Кодировка сайта 'encoding':'windows-1251' 23
  • 28. Уточнения. Как работают. вебмастер 1. область поиска, уточнения ПДС 28
  • 29. Уточнения. Как работают. вебмастер пользователь 1. область 2. запрос поиска, уточнения SERP ПДС ПДС 29
  • 30. Уточнения. Как работают. вебмастер пользователь 1. область 2. запрос поиска, 3. запрос уточнения ЛМ SERP ПДС ПДС 4. дерево запроса 30 *ЛМ – Лингвистический модуль
  • 31. Уточнения. Как работают. вебмастер пользователь 1. область 2. запрос поиска, 3. запрос 5. searchid уточнения ЛМ SERP ПДС ПДС 4. дерево запроса 6. XML с настройками 31 *ЛМ – Лингвистический модуль
  • 32. Уточнения. Как работают. вебмастер пользователь 1. область 2. запрос поиска, 3. запрос 5. searchid уточнения ЛМ SERP ПДС ПДС 4. дерево запроса 6. XML с настройками 7. дерево запроса с уточнениями и областью поиска ПОИСК 32 *ЛМ – Лингвистический модуль
  • 33. Уточнения. Как работают. вебмастер пользователь 1. область 2. запрос поиска, 3. запрос 5. searchid уточнения ЛМ SERP ПДС ПДС 4. дерево запроса 6. XML с настройками 7. дерево запроса с уточнениями и областью поиска ПОИСК 33 *ЛМ – Лингвистический модуль
  • 34. http запрос от пользователя в Яндекс http://yandex.ru/sitesearch? text=персонаж+lineage &searchid=1775761 &constraintid=8 34
  • 35. Уточнения. Как работают. вебмастер пользователь 1. область 2. запрос поиска, 3. запрос 5. searchid уточнения ЛМ SERP ПДС ПДС 4. дерево запроса 6. XML с настройками 7. дерево запроса с уточнениями и областью поиска ПОИСК 35 *ЛМ – Лингвистический модуль
  • 36. Лингвистический модуль персонаж lineage ЛМ ( персонаж ^ personage ) &&/(-7 7) ( lineage ^ линейка ^ !!линейдж ^ !!линейка ^ ((line &/(1 1) age )) ^ (лайн &/(1 1) аге) ^ лайнаге ) 36
  • 37. Уточнения. Как работают. вебмастер пользователь 1. область 2. запрос поиска, 3. запрос 5. searchid уточнения ЛМ SERP ПДС ПДС 4. дерево запроса 6. XML с настройками 7. дерево запроса с уточнениями и областью поиска ПОИСК 37 *ЛМ – Лингвистический модуль
  • 38. Данные в XML от ПДС в SERP ... <urllist> <url loc=“http://alltogame.ru” ...></url> ... </urllist> ... <constraints> <constraint id=“8”> <multiselect value=“false”> <name value=“Объявления”> <type type-id=“5”> <value value=“url:http://alltogame.ru/notice | url:http://alltogame.ru/notice*”> </constraint> ... </constraints> ... 38
  • 39. Уточнения. Как работают. вебмастер пользователь 1. область 2. запрос поиска, 3. запрос 5. searchid уточнения ЛМ SERP ПДС ПДС 4. дерево запроса 6. XML с настройками 7. дерево запроса с уточнениями и областью поиска ПОИСК 39 *ЛМ – Лингвистический модуль
  • 40. Преобразование дерева запроса ( персонаж ^ personage ) &&/(-7 7) ( lineage ^ линейка ^ !!линейдж ^ !!линейка ^ ((line &/(1 1) age )) ^ (лайн &/(1 1) аге) ^ лайнаге ) 40
  • 41. Преобразование дерева запроса ( персонаж ^ personage ) &&/(-7 7) ( lineage ^ линейка ^ !!линейдж ^ !!линейка ^ ((line &/(1 1) age )) ^ (лайн &/(1 1) аге) ^ лайнаге ) << url:"alltogame.ru/notice" | url:"alltogame.ru/notice*" 41
  • 42. Преобразование дерева запроса ( персонаж ^ personage ) &&/(-7 7) ( lineage ^ линейка ^ !!линейдж ^ !!линейка ^ ((line &/(1 1) age )) ^ (лайн &/(1 1) аге) ^ лайнаге ) << url:"alltogame.ru/notice" | url:"alltogame.ru/notice*" << (rhost:"ru.alltogame" | rhost:"ru.alltogame.*") 42
  • 44. Дополнительный поисковый индекс SERP ПДС Запрос Запрос Основной индекс Индекс ПДС Результаты SERP ПДС Результаты Результаты 44
  • 45. Индексирование по запросу Вебмастер Отправка HTTP- Плагин для CMS (вручную) запроса 45
  • 46. Индексирование по запросу Вебмастер Отправка HTTP- Плагин для CMS (вручную) запроса Пинг (отправка URL документа) ПДС 46
  • 47. Индексирование по запросу Вебмастер Отправка HTTP- Плагин для CMS (вручную) запроса Пинг (отправка URL документа) ПДС URL документа Робот ПДС 47
  • 48. Индексирование по запросу Вебмастер Отправка HTTP- Плагин для CMS (вручную) запроса Пинг (отправка URL документа) ПДС URL документа URL документа Робот ПДС Содержимое документа Сайт 48
  • 49. Индексирование по запросу Вебмастер Отправка HTTP- Плагин для CMS (вручную) запроса Пинг (отправка URL документа) ПДС URL документа URL документа Робот ПДС Содержимое документа Сайт Содержимое документа Индекс ПДС 49
  • 50. Индексирование по запросу Вебмастер Отправка HTTP- Плагин для CMS (вручную) запроса Пинг (отправка URL документа) ПДС URL документа URL документа Робот ПДС Содержимое документа Сайт Содержимое документа Индекс ПДС 50
  • 51. Плагины-пингеры для CMS 1. Реакция на событие (сохранение документа) 2. Получение информации о документе (URL) 3. Отправка запроса в Я.ПДС http://site.yandex.ru/ping.xml?... 4. Расшифровка ответа, запись в БД 51
  • 52. Индексирование по запросу Вебмастер Отправка HTTP- Плагин для CMS (вручную) запроса Пинг (отправка URL документа) ПДС URL документа URL документа Робот ПДС Содержимое документа Сайт Содержимое документа Индекс ПДС 52
  • 53. Прием и обработка пингов в ПДС 1. Прием пинга 2. Идентификация отправителя (IP + ключ + Я.ВМ) 3. Проверка на попадание пинга в квоту 4. Отправка пинга в Робот ПДС 53
  • 54. Формула для распределения квот скачивания для Робота ПДС Q(host) = f(F1, F2, …, Fn) где: F1 – Фактор кол-ва запросов к поисковой площадке F2 – Признак того, что площадка недавно добавлена … 54
  • 55. Индексирование по запросу Вебмастер Отправка HTTP- Плагин для CMS (вручную) запроса Пинг (отправка URL документа) ПДС URL документа URL документа Робот ПДС Содержимое документа Сайт Содержимое документа Индекс ПДС 55
  • 56. Робот ПДС SERP ПДС Индекс ПДС 56
  • 57. Робот ПДС SERP ПДС Индекс ПДС 57
  • 58. Робот ПДС URL документа crawler SERP ПДС Индекс ПДС 58
  • 59. Робот ПДС URL документа Internet crawler SERP ПДС Индекс ПДС 59
  • 60. Робот ПДС URL документа Internet crawler Содержимое документа SERP ПДС Построение индекса Индекс ПДС 60
  • 61. Робот ПДС URL документа Internet crawler Содержимое документа SERP ПДС Построение индекса Индекс ПДС 61
  • 62. Робот ПДС URL документа Internet crawler Содержимое документа SERP ПДС Построение индекса Индекс ПДС 62
  • 63. Ваши вопросы? 63 http://clck.ru/18DUh