Дмитрий Вульбрун "Поиск для сайта: зачем он нужен, как с ним работать, как и зачем его улучшать"
- 1. Поиск для сайта:
зачем он нужен, как с ним работать,
как и зачем его улучшать
Дмитрий Вульбрун
Менеджер проектов
Я.Субботник, Минск, 2 июня 2012 года
- 3. О чем мы сегодня поговорим
— Схема работы сервиса Яндекс.Поиск для сайта (ПДС)
— HTML-код поисковой формы и результатов поиска
— Уточнения поиска. Архитектура и принцип работы
— Индексирование по запросу. Пингеры
3
- 6. 1. Создание нового поиска
ПДС 2. Получение кода поисковой формы
вебмастер
6 Поиск для сайта
- 7. 1. Создание нового поиска
ПДС 2. Получение кода поисковой формы
вебмастер
3. Размещение
поисковой формы
на сайте
Сайт вебмастера
7 Поиск для сайта
- 8. 1. Создание нового поиска
ПДС 2. Получение кода поисковой формы
вебмастер
3. Размещение
поисковой формы
на сайте
4. Поисковый запрос
Сайт вебмастера пользователь
8 Поиск для сайта
- 9. 1. Создание нового поиска
ПДС 2. Получение кода поисковой формы
вебмастер
3. Размещение
поисковой формы
на сайте
5. Поисковый запрос + ID поиска 4. Поисковый запрос
(searchid)
SERP ПДС Сайт вебмастера пользователь
* SERP - Search engine results page
9 Поиск для сайта
- 10. 1. Создание нового поиска
ПДС 2. Получение кода поисковой формы
вебмастер
3. Размещение
поисковой формы
6. ID поиска
на сайте
(searchid)
5. Поисковый запрос + ID поиска 4. Поисковый запрос
(searchid)
SERP ПДС Сайт вебмастера пользователь
* SERP - Search engine results page
10 Поиск для сайта
- 11. 1. Создание нового поиска
ПДС 2. Получение кода поисковой формы
вебмастер
3. Размещение
поисковой формы
6. ID поиска 7. Область поиска, настройки поиска,
на сайте
(searchid) дизайн, данные о показе рекламы.
5. Поисковый запрос + ID поиска 4. Поисковый запрос
(searchid)
SERP ПДС Сайт вебмастера пользователь
* SERP - Search engine results page
11 Поиск для сайта
- 12. 1. Создание нового поиска
ПДС 2. Получение кода поисковой формы
вебмастер
3. Размещение
поисковой формы
6. ID поиска 7. Область поиска, настройки поиска,
на сайте
(searchid) дизайн, данные о показе рекламы.
5. Поисковый запрос + ID поиска 4. Поисковый запрос
(searchid)
SERP ПДС Сайт вебмастера пользователь
8. Преобразованный
запрос
* SERP - Search engine results page
Основной индекс
12
+
Индекс ПДС Поиск для сайта
- 13. 1. Создание нового поиска
ПДС 2. Получение кода поисковой формы
вебмастер
3. Размещение
поисковой формы
6. ID поиска 7. Область поиска, настройки поиска,
на сайте
(searchid) дизайн, данные о показе рекламы.
5. Поисковый запрос + ID поиска 4. Поисковый запрос
(searchid)
SERP ПДС Сайт вебмастера пользователь
8. Преобразованный
запрос 9. Результаты
поиска * SERP - Search engine results page
Основной индекс
13
+
Индекс ПДС Поиск для сайта
- 14. 1. Создание нового поиска
ПДС 2. Получение кода поисковой формы
вебмастер
3. Размещение
поисковой формы
6. ID поиска 7. Область поиска, настройки поиска,
на сайте
(searchid) дизайн, данные о показе рекламы.
5. Поисковый запрос + ID поиска 4. Поисковый запрос
(searchid)
SERP ПДС Сайт вебмастера пользователь
10. Выдача поиска 10. Выдача поиска
8. Преобразованный
запрос 9. Результаты
поиска * SERP - Search engine results page
Основной индекс
14
+
Индекс ПДС Поиск для сайта
- 15. РСЯ Создание рекламной площадки
в партнерском интерфейсе
Рекламной сети Яндекса
1. Создание нового поиска
ПДС 2. Получение кода поисковой формы
вебмастер
3. Размещение
поисковой формы
6. ID поиска 7. Область поиска, настройки поиска,
на сайте
(searchid) дизайн, данные о показе рекламы.
5. Поисковый запрос + ID поиска 4. Поисковый запрос
(searchid)
SERP ПДС Сайт вебмастера пользователь
10. Выдача поиска 10. Выдача поиска
8. Преобразованный
запрос 9. Результаты
поиска * SERP - Search engine results page
Основной индекс
15
+
Индекс ПДС Поиск для сайта
- 16. РСЯ Создание рекламной площадки
в партнерском интерфейсе
Рекламной сети Яндекса
Данные Данные о показе
о поисках рекламы на поисках
1. Создание нового поиска
ПДС 2. Получение кода поисковой формы
вебмастер
3. Размещение
поисковой формы
6. ID поиска 7. Область поиска, настройки поиска,
на сайте
(searchid) дизайн, данные о показе рекламы.
5. Поисковый запрос + ID поиска 4. Поисковый запрос
(searchid)
SERP ПДС Сайт вебмастера пользователь
10. Выдача поиска 10. Выдача поиска
8. Преобразованный
запрос 9. Результаты
поиска * SERP - Search engine results page
Основной индекс
16
+
Индекс ПДС Поиск для сайта
- 19. Код поисковой формы
<div class="ya-site-form ya-site-form_inited_no" 'searchid': '1902945',
onclick="return {
'searchid': '1902945', 'action': 'http://mysite.ru/poisk.html',
'action': 'http://mysite.ru/poisk.html', 'type': 0,
'type': 0, 'arrow': true,
'arrow': true,
'logo': 'rb',
'logo': 'rb',
'webopt': true, 'webopt': true,
'websearch': false, 'websearch': false,
'bg': '#3399ff',
'fg': '#ffffff', 'bg': '#3399ff',
'fontsize': 12, 'fg': '#ffffff',
'target': '_self', 'fontsize': 12,
'suggest': true,
'site_suggest': true, 'target': '_self',
'language': 'ru', 'suggest': true,
'tld': 'ru' 'site_suggest': true,
}">
<form action="http://yandex.ru/sitesearch" method="get" target="_self">
<input type="hidden" name="searchid" value="1902945" /> 'language': 'ru',
<input type="hidden" name="l10n" value="ru" /> 'tld': 'ru'
<input type="hidden" name="reqenc" value="windows-1251" />
<input type="text" name="text" value="" />
<input type="submit" value="Найти" />
</form>
</div>
<style type="text/css">.ya-page_js_yes .ya-site-form_inited_no { display:
none; }</style>
<script type="text/javascript">(function(w,d,c){var
s=d.createElement('script'),h=d.getElementsByTagName('script')[0];
s.type='text/javascript';s.async=true;s.charset='utf-8'; <input type="hidden" name="searchid" value="1902945" />
s.src=(d.location.protocol==='https:'?'https:':'http:')
+'//site.yandex.net/v2.0/js/all.js'; h.parentNode.insertBefore(s,h);
(w[c]||(w[c]=[])).push(function() {Ya.Site.Results.init()})}) <input type="hidden" name="l10n" value="ru" />
(window,document,'yandex_site_callbacks'); </script> <input type="hidden" name="reqenc" value="windows-1251" />
19
- 20. JS переменные
Язык интерфейса поиска
'language': 'ru‘
Домен, в котором будет производиться поиск.
Различия в индексах и ранжировании.
'tld': 'ru'
20
- 21. HTML теги формы
Домен, в котором будет производиться поиск.
Различия в индексах и ранжировании.
<form action="http://yandex.ru/...
Язык интерфейса поиска:
<input type="hidden" name="l10n"
value="ru" />
Кодировка сайта:
<input type="hidden" name="reqenc"
value="windows-1251" />
21
- 22. Код результатов поиска
<div id="ya-site-results" 'tld':'ru',
onclick="return {
'tld': 'ru',
'language':'ru',
'language': 'ru', 'encoding':'windows-1251'
'encoding': 'windows-1251'
}">
</div>
<script
type="text/javascript">(function(w,d,c){var
s=d.createElement('script'),
h=d.getElementsByTagName('script')[0];
s.type='text/javascript';
s.async=true;s.charset='utf-8';
s.src=(d.location.protocol==='https:'?'https
:':'http:')+
'//site.yandex.net/v2.0/js/all.js';h.parentN
ode.insertBefore(s,h);
(w[c]||(w[c]=[])).push(function(){Ya.Site.Re
sults.init()})})
(window,document,'yandex_site_callbacks');</
script>
22
- 23. JS переменные
Язык интерфейса поиска
'language': 'ru‘
Домен, в котором будет производиться поиск.
Различия в индексах и ранжировании.
'tld': 'ru'
Кодировка сайта
'encoding':'windows-1251'
23
- 30. Уточнения. Как работают.
вебмастер
пользователь
1. область
2. запрос поиска,
3. запрос уточнения
ЛМ SERP ПДС ПДС
4. дерево запроса
30
*ЛМ – Лингвистический модуль
- 31. Уточнения. Как работают.
вебмастер
пользователь
1. область
2. запрос поиска,
3. запрос 5. searchid уточнения
ЛМ SERP ПДС ПДС
4. дерево запроса 6. XML с
настройками
31
*ЛМ – Лингвистический модуль
- 32. Уточнения. Как работают.
вебмастер
пользователь
1. область
2. запрос поиска,
3. запрос 5. searchid уточнения
ЛМ SERP ПДС ПДС
4. дерево запроса 6. XML с
настройками
7. дерево запроса с уточнениями и областью поиска
ПОИСК
32
*ЛМ – Лингвистический модуль
- 33. Уточнения. Как работают.
вебмастер
пользователь
1. область
2. запрос поиска,
3. запрос 5. searchid уточнения
ЛМ SERP ПДС ПДС
4. дерево запроса 6. XML с
настройками
7. дерево запроса с уточнениями и областью поиска
ПОИСК
33
*ЛМ – Лингвистический модуль
- 34. http запрос от пользователя в Яндекс
http://yandex.ru/sitesearch?
text=персонаж+lineage
&searchid=1775761
&constraintid=8
34
- 35. Уточнения. Как работают.
вебмастер
пользователь
1. область
2. запрос поиска,
3. запрос 5. searchid уточнения
ЛМ SERP ПДС ПДС
4. дерево запроса 6. XML с
настройками
7. дерево запроса с уточнениями и областью поиска
ПОИСК
35
*ЛМ – Лингвистический модуль
- 37. Уточнения. Как работают.
вебмастер
пользователь
1. область
2. запрос поиска,
3. запрос 5. searchid уточнения
ЛМ SERP ПДС ПДС
4. дерево запроса 6. XML с
настройками
7. дерево запроса с уточнениями и областью поиска
ПОИСК
37
*ЛМ – Лингвистический модуль
- 38. Данные в XML от ПДС в SERP
...
<urllist>
<url loc=“http://alltogame.ru” ...></url>
...
</urllist>
...
<constraints>
<constraint id=“8”>
<multiselect value=“false”>
<name value=“Объявления”>
<type type-id=“5”>
<value value=“url:http://alltogame.ru/notice |
url:http://alltogame.ru/notice*”>
</constraint>
...
</constraints>
...
38
- 39. Уточнения. Как работают.
вебмастер
пользователь
1. область
2. запрос поиска,
3. запрос 5. searchid уточнения
ЛМ SERP ПДС ПДС
4. дерево запроса 6. XML с
настройками
7. дерево запроса с уточнениями и областью поиска
ПОИСК
39
*ЛМ – Лингвистический модуль
- 40. Преобразование дерева запроса
(
персонаж ^ personage
)
&&/(-7 7)
(
lineage ^ линейка ^ !!линейдж ^ !!линейка ^
((line &/(1 1) age )) ^ (лайн &/(1 1) аге) ^
лайнаге
)
40
- 41. Преобразование дерева запроса
(
персонаж ^ personage
)
&&/(-7 7)
(
lineage ^ линейка ^ !!линейдж ^ !!линейка ^
((line &/(1 1) age )) ^ (лайн &/(1 1) аге) ^
лайнаге
)
<< url:"alltogame.ru/notice" | url:"alltogame.ru/notice*"
41
- 42. Преобразование дерева запроса
(
персонаж ^ personage
)
&&/(-7 7)
(
lineage ^ линейка ^ !!линейдж ^ !!линейка ^
((line &/(1 1) age )) ^ (лайн &/(1 1) аге) ^
лайнаге
)
<< url:"alltogame.ru/notice" | url:"alltogame.ru/notice*"
<< (rhost:"ru.alltogame" | rhost:"ru.alltogame.*")
42
- 47. Индексирование по запросу
Вебмастер Отправка HTTP-
Плагин для CMS
(вручную) запроса
Пинг (отправка URL документа)
ПДС
URL документа
Робот ПДС
47
- 48. Индексирование по запросу
Вебмастер Отправка HTTP-
Плагин для CMS
(вручную) запроса
Пинг (отправка URL документа)
ПДС
URL документа
URL документа
Робот ПДС Содержимое документа
Сайт
48
- 49. Индексирование по запросу
Вебмастер Отправка HTTP-
Плагин для CMS
(вручную) запроса
Пинг (отправка URL документа)
ПДС
URL документа
URL документа
Робот ПДС Содержимое документа
Сайт
Содержимое документа
Индекс ПДС
49
- 50. Индексирование по запросу
Вебмастер Отправка HTTP-
Плагин для CMS
(вручную) запроса
Пинг (отправка URL документа)
ПДС
URL документа
URL документа
Робот ПДС Содержимое документа
Сайт
Содержимое документа
Индекс ПДС
50
- 51. Плагины-пингеры для CMS
1. Реакция на событие (сохранение документа)
2. Получение информации о документе (URL)
3. Отправка запроса в Я.ПДС
http://site.yandex.ru/ping.xml?...
4. Расшифровка ответа, запись в БД
51
- 52. Индексирование по запросу
Вебмастер Отправка HTTP-
Плагин для CMS
(вручную) запроса
Пинг (отправка URL документа)
ПДС
URL документа
URL документа
Робот ПДС Содержимое документа
Сайт
Содержимое документа
Индекс ПДС
52
- 53. Прием и обработка пингов в ПДС
1. Прием пинга
2. Идентификация отправителя (IP + ключ + Я.ВМ)
3. Проверка на попадание пинга в квоту
4. Отправка пинга в Робот ПДС
53
- 54. Формула для распределения квот
скачивания для Робота ПДС
Q(host) = f(F1, F2, …, Fn)
где:
F1 – Фактор кол-ва запросов к поисковой площадке
F2 – Признак того, что площадка недавно добавлена
…
54
- 55. Индексирование по запросу
Вебмастер Отправка HTTP-
Плагин для CMS
(вручную) запроса
Пинг (отправка URL документа)
ПДС
URL документа
URL документа
Робот ПДС Содержимое документа
Сайт
Содержимое документа
Индекс ПДС
55
- 58. Робот ПДС URL
документа
crawler
SERP ПДС
Индекс ПДС
58
- 59. Робот ПДС URL
документа
Internet crawler
SERP ПДС
Индекс ПДС
59
- 60. Робот ПДС URL
документа
Internet crawler
Содержимое
документа
SERP ПДС
Построение
индекса
Индекс ПДС
60
- 61. Робот ПДС URL
документа
Internet crawler
Содержимое
документа
SERP ПДС
Построение
индекса
Индекс ПДС
61
- 62. Робот ПДС URL
документа
Internet crawler
Содержимое
документа
SERP ПДС
Построение
индекса
Индекс ПДС
62