SlideShare a Scribd company logo
SEO без границ. 
Осенняя практика от MegaIndex.tv 
«Практические примеры 
фильтрации семантики» 
23.09.2014
Игорь Бакалов 
• В клиентском SEO с 2010 года 
• Опыт продвижения: более 60 проектов 
• Автор блога http://bakalov.info/
Для кого этот доклад 
Данный доклад будет полезен, если: 
• Вам часто приходится подбирать СЯ в 
коммерческих нишах; 
• Объем составляемых СЯ в среднем от 
нескольких сотен, до нескольких тысяч 
запросов; 
• Вы стараетесь минимизировать объем 
ручного труда;
План доклада 
1. Фильтрация навигационных запросов 
2. Фильтрация омонимов 
3. Фильтрация не явных adult запросов 
4. Хаки при фильтрации семантики
Фильтрация навигационных запросов 
Навигационный запрос – это запрос, по которому 
пользователь ищет конкретную фирму или сайт. 
Чаще встречаются в тематиках: стоматология, 
недвижимость, фаст-фуд, финансы, и т.д. 
Примеры запросов: «агентство недвижимости этажи», 
«стоматология мастер дент», «суши терра»… 
Какие существуют способы фильтрации?
Фильтрация навигационных запросов 
Способ №1: Проверить все запросы руками 
Плюсы: 
• Это просто 
Минусы: 
• Очень долго и не рационально – в ряде тематик до 50% 
запросов могут быть навигационными, например «агентство 
недвижимости»; 
• Большая вероятность ошибки, например: «отель премиум 
санкт петербург», «гостиница у фонтана санкт петербург» 
- это все навигационные запросы;
Фильтрация навигационных запросов 
Способ №2: Проверить запросы через Яндекс.XML 
Плюсы: 
• Высокая скорость обработки; 
• Высокая точность – если Яндекс определил запрос как навигационный 
и по данному запросу есть витальный сайт, то это видно в XML: 
Минусы: 
• Нужны XML лимиты; 
• Нужен скрипт для проверки;
Фильтрация навигационных запросов 
Способ №3: Проверить запросы через выдачу Google 
Плюсы: 
• Можно определить навигационные запросы, по которым в Яндексе нет витальных 
сайтов. Пример выдачи по запросу «отель премиум санкт петербург» : 
Минусы: 
• Нужно писать скрипт для парсинга результатов поиска; 
• Сопутствующие расходы на каптчу и прокси; 
• Иногда бывают «ложные» срабатывания;
Фильтрация навигационных запросов 
Способ №4: Проверить запросы через выдачу Яндекса 
По многим навигационным запросам Яндекс отображает в топ-10 больше 
1 страницы витального сайта. 
Плюсы: 
• Это просто! Нужно лишь собрать топ-10 и выгрузить в Excel. 
• Это можно делать при помощи KeyCollector!  
Минусы: 
• Выявляются не все навигационные запросы – не редки случаи, когда 
витальный сайт занимает только одну позицию. 
Подробное описание метода: 
http://bakalov.info/filtraciya-navigacionnyx-zaprosov-v-keycollector.html
Фильтрация омонимов 
Омонимы - разные по значению, но одинаковые по звучанию и написанию слова © 
Википедия 
Задача: собрать СЯ для магазина по продаже ковров. 
Что делаем? Парсим вордстат по запросам «магазин ковров», «продажа ковров»… 
И кроме целевых, получаем еще пачку вот таких запросов: 
магазины в коврове 
город ковров магазины 
ковров недвижимость продажа 
продажа недвижимости в коврове 
продажа квартир г ковров 
интернет магазин в коврове 
мото продажа в коврове 
город ковров продажа квартир 
продажа машин в коврове 
продажа собак в коврове 
Как быть?
Фильтрация омонимов 
1. Фильтруем руками 
Это же не наш метод 
Фильтрация омонимов 
Шаг первый: при помощи Regex выделяем запросы с топонимом. В KeyCollector в 
«Быстрый фильтр» вставляем: 
(^гs|sгs|sг$|^городs|sгородs|sгород$|^городеs|sгородеs|sгороде$) 
Получаем: 
г ковров магазины 
город ковров магазины 
продажа квартир г ковров 
город ковров продажа квартир 
продажа квартир в городе коврове 
продажа домов в городе коврове 
продажа квартир в г коврове 
авито продажа квартиры г ковров 
интернет магазин город ковров 
мебельные магазины г ковров 
эльдорадо интернет магазин город ковров 
Удаляем такие запросы и переходим к шагу №2.
Фильтрация омонимов 
Шаг второй: в случае частичной омонимии разбираем омоформы. Мы 
имеем: 
• ковров – в случае города это: ед. число, им. падеж; 
• ковров – в случае «плотное ткан��е изделие» это: мн. число, родит. 
падеж от слова «ковер». 
Предложный падеж для города «Ковров» будет «Коврове», а для 
«Ковры» это будет «Коврах». Фильтруем по «Коврове» и получаем: 
магазины в коврове 
интернет магазин в коврове 
продажа квартир в коврове 
продажа домов в коврове 
продажа авто в коврове 
авито продажа квартир в коврове 
продажа недвижимости в коврове 
Удаляем подобные запросы и переходим к шагу №3.
Фильтрация омонимов 
Шаг третий: фильтрация омонимов по сниппетам. Поисковые системы 
весьма не плохо умеют «понимать» значение омонима по контексту 
поискового запроса. Как это использовать? 
Берем запросы с «ковров», собираем топ-10 по каждому ключу, проверяем 
сниппеты на наличие словоформы «коврове», делаем выборку и получаем: 
продажа авто на авито ковров 
ковров продажа квартир 
продажа ковров на авито 
ковров недвижимость продажа 
продажа авто ковров 
продажа машин ковров 
ковров продажа квартир объявления 
ковров продажа домов 
ковров мебельные магазины 
Перед удалением на всякий случай проверяем нет ли косяков 
Фильтрация не явных adult запросов 
Явный adult запрос – это запрос, в котором в явном виде 
указано, что пользователю нужен контент «18+». 
Фильтруются подобные запросы весьма просто - при помощи 
словаря стоп слов: 
порно, порнуха, проститутки, секс, ххх, грудастой, изнасиловал, 
лесбиянки, лесби, малолетки, маструбация, минет... (всего около 
250 слов) 
НЕ явный adult запрос – это запрос, который не содержит 
порно лексики, но подразумевает соответствующий 
пользовательский интент. Чаще всего такие запросы 
встречаются в тематиках: «массаж», «нижнее женское 
белье» и др…
Фильтрация не явных adult запросов 
Как это выглядит на практике. Например, вы спарсили вордстат для 
салона красоты по запросу «массаж», почистили от явной порно лексики, 
глянули, а там: 
пришла на массаж русское 
скрытая камера массаж 
мужик делает массаж мужику 
массаж зрелой женщине 
массаж а потом 
русская на массаже 
брат делает массаж 
во время массажа 
муж делает жене массаж 
брат и сестра массаж 
Хотят ли эти пользователи стать клиентом массажного салона? 
Фильтрация не явных adult запросов 
Смотрим выдачу Яндекса по запросу «пришла на массаж 
русское»: 
Принцип фильтрации – собираем топ-10 по каждому запросу и 
проверяем на наличие «взрослых» слов (делается в KeyCollector).
Хаки при фильтрации семантики 
Хак первый: выделяем запросы с «мусорными» предлогами. Для 
быстрого фильтра в KeyCollector используем Regex: 
(^(о|об)s|s(без|в|где|для|до|за|из|или|и|к|над|на|не|но|ну|об|от|о|п 
од|по|при|про|со|с|те|чем|что)$) 
Получаем: 
акция пластиковые окна двухкомнатная квартира за 
арочные пластиковые окна и 
пластиковые окна профили в 
застекление балкона или пластиковые окна под 
благодаря этому пластиковые окна и 
Очень актуально, если вы не только парсите вордстат/подсказки, но и 
работаете с базами ключевых слов.
Хаки при фильтрации семантики 
Хак второй: хитрая фильтрация запросов с латиницей. 
Входные данные: ~700 запросов про «видеорегистратор 
dvr». 
Задача: оставить общие запросы («видеорегистратор dvr 
купить», «dvr видеорегистратор отзывы», «автомобильный 
видеорегистратор dvr» и т.п.), исключить запросы про 
конкретные бренды/модели («видеорегистратор eplutus 
dvr», «видеорегистратор vehicle dvr» и и т.п.). Для решения 
используем Regex: 
([a-z]s.*dvr|dvrs.*[a-z]) 
На выходе получаем ~ 150 «чистых» запросов: 
видеорегистратор dvr, dvr видеорегистратор отзывы, инструкция видеорегистратор dvr, 
автомобильный видеорегистратор dvr, dvr видеорегистратор купить...
Хаки при фильтрации семантики 
Хак от КО: если вы постоянно работаете с семантикой, 
то у вас просто обязательно должны быть свои списки 
стоп-слов. 
Наглядный пример: собранно ~3700 запросов про 
«доставку пиццы» для сайта из Нижнего Новгорода. 
Список-стоп слов по городам позволяет сразу отсеять 
~2500 запросов, т.е. 67%! 
В идеале делить стоп-слова на группы: 
информационные, adult, навигационные, 
образовательные, развлекательные…
Хаки при фильтрации семантики 
А вот так список стоп-слов может выглядеть на практике:
Спасибо за внимание! 
Игорь Бакалов 
Подписывайтесь на мой блог: 
http://bakalov.info/ 
И добавляйтесь в соц сетях: 
https://www.facebook.com/bakalov.igor 
https://twitter.com/Bakalov_Igor

More Related Content

Seo без границ осенняя практика от mega index.tv

  • 1. SEO без границ. Осенняя практика от MegaIndex.tv «Практические примеры фильтрации семантики» 23.09.2014
  • 2. Игорь Бакалов • В клиентском SEO с 2010 года • Опыт продвижения: более 60 проектов • Автор блога http://bakalov.info/
  • 3. Для кого этот доклад Данный доклад будет полезен, если: • Вам часто приходится подбирать СЯ в коммерческих нишах; • Объем составляемых СЯ в среднем от нескольких сотен, до нескольких тысяч запросов; • Вы стараетесь минимизировать объем ручного труда;
  • 4. План доклада 1. Фильтрация навигационных запросов 2. Фильтрация омонимов 3. Фильтрация не явных adult запросов 4. Хаки при фильтрации семантики
  • 5. Фильтрация навигационных запросов Навигационный запрос – это запрос, по которому пользователь ищет конкретную фирму или сайт. Чаще встречаются в тематиках: стоматология, недвижимость, фаст-фуд, финансы, и т.д. Примеры запросов: «агентство недвижимости этажи», «стоматология мастер дент», «суши терра»… Какие существуют способы фильтрации?
  • 6. Фильтрация навигационных запросов Способ №1: Проверить все запросы руками Плюсы: • Это просто Минусы: • Очень долго и не рационально – в ряде тематик до 50% запросов могут быть навигационными, например «агентство недвижимости»; • Большая вероятность ошибки, например: «отель премиум санкт петербург», «гостиница у фонтана санкт петербург» - это все навигационные запросы;
  • 7. Фильтрация навигационных запросов Способ №2: Проверить запросы через Яндекс.XML Плюсы: • Высокая скорость обработки; • Высокая точность – если Яндекс определил запрос как навигационный и по данному запросу есть витальный сайт, то это видно в XML: Минусы: • Нужны XML лимиты; • Нужен скрипт для проверки;
  • 8. Фильтрация навигационных запросов Способ №3: Проверить запросы через выдачу Google Плюсы: • Можно определить навигационные запросы, по которым в Яндексе нет витальных сайтов. Пример выдачи по запросу «отель премиум санкт петербург» : Минусы: • Нужно писать скрипт для парсинга результатов поиска; • Сопутствующие расходы на каптчу и прокси; • Иногда бывают «ложные» срабатывания;
  • 9. Фильтрация навигационных запросов Способ №4: Проверить запросы через выдачу Яндекса По многим навигационным запросам Яндекс отображает в топ-10 больше 1 страницы витального сайта. Плюсы: • Это просто! Нужно лишь собрать топ-10 и выгрузить в Excel. • Это можно делать при помощи KeyCollector!  Минусы: • Выявляются не все навигационные запросы – не редки случаи, когда витальный сайт занимает только одну позицию. Подробное описание метода: http://bakalov.info/filtraciya-navigacionnyx-zaprosov-v-keycollector.html
  • 10. Фильтрация омонимов Омонимы - разные по значению, но одинаковые по звучанию и написанию слова © Википедия Задача: собрать СЯ для магазина по продаже ковров. Что делаем? Парсим вордстат по запросам «магазин ковров», «продажа ковров»… И кроме целевых, получаем еще пачку вот таких запросов: магазины в коврове город ковров магазины ковров недвижимость продажа продажа недвижимости в коврове продажа квартир г ковров интернет магазин в коврове мото продажа в коврове город ковров продажа квартир продажа машин в коврове продажа собак в коврове Как быть?
  • 11. Фильтрация омонимов 1. Фильтруем руками Это же не наш метод 
  • 12. Фильтрация омонимов Шаг первый: при помощи Regex выделяем запросы с топонимом. В KeyCollector в «Быстрый фильтр» вставляем: (^гs|sгs|sг$|^городs|sгородs|sгород$|^городеs|sгородеs|sгороде$) Получаем: г ковров магазины город ковров магазины продажа квартир г ковров город ковров продажа квартир продажа квартир в городе коврове продажа домов в городе коврове продажа квартир в г коврове авито продажа квартиры г ковров интернет магазин город ковров мебельные магазины г ковров эльдорадо интернет магазин город ковров Удаляем такие запросы и переходим к шагу №2.
  • 13. Фильтрация омонимов Шаг второй: в случае частичной омонимии разбираем омоформы. Мы имеем: • ковров – в случае города это: ед. число, им. падеж; • ковров – в случае «плотное тканое изделие» это: мн. число, родит. падеж от слова «ковер». Предложный падеж для города «Ковров» будет «Коврове», а для «Ковры» это будет «Коврах». Фильтруем по «Коврове» и получаем: магазины в коврове интернет магазин в коврове продажа квартир в коврове продажа домов в коврове продажа авто в коврове авито продажа квартир в коврове продажа недвижимости в коврове Удаляем подобные запросы и переходим к шагу №3.
  • 14. Фильтрация омонимов Шаг третий: фильтрация омонимов по сниппетам. Поисковые системы весьма не плохо умеют «понимать» значение омонима по контексту поискового запроса. Как это использовать? Берем запросы с «ковров», собираем топ-10 по каждому ключу, проверяем сниппеты на наличие словоформы «коврове», делаем выборку и получаем: продажа авто на авито ковров ковров продажа квартир продажа ковров на авито ковров недвижимость продажа продажа авто ковров продажа машин ковров ковров продажа квартир объявления ковров продажа домов ковров мебельные магазины Перед удалением на всякий случай проверяем нет ли косяков 
  • 15. Фильтрация не явных adult запросов Явный adult запрос – это запрос, в котором в явном виде указано, что пользователю нужен контент «18+». Фильтруются подобные запросы весьма просто - при помощи словаря стоп слов: порно, порнуха, проститутки, секс, ххх, грудастой, изнасиловал, лесбиянки, лесби, малолетки, маструбация, минет... (всего около 250 слов) НЕ явный adult запрос – это запрос, который не содержит порно лексики, но подразумевает соответствующий пользовательский интент. Чаще всего такие запросы встречаются в тематиках: «массаж», «нижнее женское белье» и др…
  • 16. Фильтрация не явных adult запросов Как это выглядит на практике. Например, вы спарсили вордстат для салона красоты по запросу «массаж», почистили от явной порно лексики, глянули, а там: пришла на массаж русское скрытая камера массаж мужик делает массаж мужику массаж зрелой женщине массаж а потом русская на массаже брат делает массаж во время массажа муж делает жене массаж брат и сестра массаж Хотят ли эти пользователи стать клиентом массажного салона? 
  • 17. Фильтрация не явных adult запросов Смотрим выдачу Яндекса по запросу «пришла на массаж русское»: Принцип фильтрации – собираем топ-10 по каждому запросу и проверяем на наличие «взрослых» слов (делается в KeyCollector).
  • 18. Хаки при фильтрации семантики Хак первый: выделяем запросы с «мусорными» предлогами. Для быстрого фильтра в KeyCollector используем Regex: (^(о|об)s|s(без|в|где|для|до|за|из|или|и|к|над|на|не|но|ну|об|от|о|п од|по|при|про|со|с|те|чем|что)$) Получаем: акция пластиковые окна двухкомнатная квартира за арочные пластиковые окна и пластиковые окна профили в застекление балкона или пластиковые окна под благодаря этому пластиковые окна и Очень актуально, если вы не только парсите вордстат/подсказки, но и работаете с базами ключевых слов.
  • 19. Хаки при фильтрации семантики Хак второй: хитрая фильтрация запросов с латиницей. Входные данные: ~700 запросов про «видеорегистратор dvr». Задача: оставить общие запросы («видеорегистратор dvr купить», «dvr видеорегистратор отзывы», «автомобильный видеорегистратор dvr» и т.п.), исключить запросы про конкретные бренды/модели («видеорегистратор eplutus dvr», «видеорегистратор vehicle dvr» и и т.п.). Для решения используем Regex: ([a-z]s.*dvr|dvrs.*[a-z]) На выходе получаем ~ 150 «чистых» запросов: видеорегистратор dvr, dvr видеорегистратор отзывы, инструкция видеорегистратор dvr, автомобильный видеорегистратор dvr, dvr видеорегистратор купить...
  • 20. Хаки при фильтрации семантики Хак от КО: если вы постоянно работаете с семантикой, то у вас просто обязательно должны быть свои списки стоп-слов. Наглядный пример: собранно ~3700 запросов про «доставку пиццы» для сайта из Нижнего Новгорода. Список-стоп слов по городам позволяет сразу отсеять ~2500 запросов, т.е. 67%! В идеале делить стоп-слова на группы: информационные, adult, навигационные, образовате��ьные, развлекательные…
  • 21. Хаки при фильтрации семантики А вот так список стоп-слов может выглядеть на практике:
  • 22. Спасибо за внимание! Игорь Бакалов Подписывайтесь на мой блог: http://bakalov.info/ И добавляйтесь в соц сетях: https://www.facebook.com/bakalov.igor https://twitter.com/Bakalov_Igor