SEspider возможности
Интерфейс
Окно анализа позиций
Основные настройки
Экспорт данных
Определение основных параметров сайта
Преимущества
Сбор позиций
Полезные сервисы
1.26M
Category: internetinternet

Основы поисковой оптимизации. Часть первая

1.

КУРСЫ: Основы поисковой оптимизации.
Часть первая
Вениамин МОИСЕЕВ
Заместитель начальника SEO отдела в компании «Сео Дрим»
Москва, 2009 г.

2.

Основы поисковой оптимизации
Курсы SEO - всестороннее изучение современных факторов,
влияющих на продвижение сайта в поисковых системах.
По ходу занятий Вам будут предложены:
разминка для ума;
юмор;
развенчивание мифов;
ответы «я не знаю».

3.

Терминология
Документ - страница в интернете, имеющая уникальный адрес (url)
(ссылки с якорями (#) не в счет).
Ссылка - прямая ссылка вида <a href="">текст или картинка</a>,
нажав на которую пользователь переходит на указанный адрес.
Анкор (anchor) – текст ссылки.
Донор: документ, на котором стоит ссылка на продвигаемый документ.
Акцептор: документ, на который ведет ссылка с донора.
Стоп-слова – служебные часть речи: союзы и предлоги.
Коллекция — совокупность всех документов в базе данных (БД или индекс)
поисковой системы (ПС).
Апдейт — обновление информации в базе данных ПС.
Дэнс — процесс изменения выдачи, видимый пользователю.
Кэш — сохраненная страница выдачи по определенному запросу.

4.

Алгоритмы работы ПС
Прямой поиск
Последовательный перебор всех имеющихся документов коллекции.
+ нет искажений,
- очень долго.

5.

Алгоритмы работы ПС
Прямой поиск
Последовательный перебор всех имеющихся документов коллекции.
+ нет искажений,
- очень долго.
Инвертированные индексы
Инвертированный (обратный) индекс — файл, содержащий список слов
документа в алфавитном порядке с указанием позиций и других
параметров вхождения этого слова в документ.
+ быстродействие,
- потеря информации.

6.

Алгоритмы работы ПС
Прямой поиск
Последовательный перебор всех имеющихся документов коллекции.
+ нет искажений,
- очень долго.
Инвертированные индексы
Инвертированный (обратный) индекс — файл, содержащий список слов
документа в алфавитном порядке с указанием позиций и других
параметров вхождения этого слова в документ.
+ быстродействие,
- потеря информации.

7.

Алгоритмы работы ПС
Пример обратного индекса – глоссарий (алфавитно-предметный указатель)
Адвокат, защитник
право на помощь адвоката: ст. 48
право подозреваемого, обвиняемого на защиту: ст. 48
Акты органов власти
акты Президента РФ: ст. 90
акты, применяемые при разрешении
споров: ст. 15.4, ст. 76.5
действие актов СССР и РСФСР: часть II
обжалование в суд актов органов власти: ст. 46.2
обратная сила нормативных актов: ст. 54, ст. 57
опубликование актов министерств, ведомств: ст. 15.3
опубликование федеральных законов: ст. 15.3
подготовка законов: ст. 104.3
применение неопубликованных нормативных
правовых актов: ст. 15.3
приостановление актов субъекта РФ: ст. 85.2
толкование нормативных актов: ст. 125.5
Амнистия и помилование
помилование: ст. 50.3
Арбитражный суд
Высший Арбитражный Суд: ст. 127
назначение судей: ст. 128
стаж юридический для кандидатов в судьи: ст. 119
Арест. Заключение под стражу
арест: ст. 22
сроки содержания под стражей: ст. 22
Источник: http://www.kremlin.ru/articles/alfabet01.shtml

8.

Алгоритмы работы ПС
Документ:
Трусоват был Ваня бедный:
Раз он позднею порой,
Весь в поту, от страха бледный,
Чрез кладбище шел домой.
Горе! малый я не сильный;
Съест упырь меня совсем,
Если сам земли могильной
Я с молитвою не съем.
Бедный Ваня еле дышит,
Спотыкаясь, чуть бредет
По могилам; вдруг он слышит,
Кто-то кость, ворча, грызет.
Что же? вместо вурдалака (Вы представьте Вани злость!)
В темноте пред ним собака
На могиле гложет кость.
Ваня стал; - шагнуть не может.
Боже! думает бедняк,
Это верно кости гложет
Красногубый вурдалак.

9.

Алгоритмы работы ПС
Документ:
Трусоват был Ваня бедный:
Раз он позднею порой,
Весь в поту, от страха бледный,
Чрез кладбище шел домой.
Горе! малый я не сильный;
Съест упырь меня совсем,
Если сам земли могильной
Я с молитвою не съем.
Бедный Ваня еле дышит,
Спотыкаясь, чуть бредет
По могилам; вдруг он слышит,
Кто-то кость, ворча, грызет.
Что же? вместо вурдалака (Вы представьте Вани злость!)
В темноте пред ним собака
На могиле гложет кость.
Ваня стал; - шагнуть не может.
Боже! думает бедняк,
Это верно кости гложет
Красногубый вурдалак.
Обратный индекс:
Трусоват (1,1,1)

10.

Алгоритмы работы ПС
Документ:
Трусоват был Ваня бедный:
Раз он позднею порой,
Весь в поту, от страха бледный,
Чрез кладбище шел домой.
Горе! малый я не сильный;
Съест упырь меня совсем,
Если сам земли могильной
Я с молитвою не съем.
Бедный Ваня еле дышит,
Спотыкаясь, чуть бредет
По могилам; вдруг он слышит,
Кто-то кость, ворча, грызет.
Что же? вместо вурдалака (Вы представьте Вани злость!)
В темноте пред ним собака
На могиле гложет кость.
Ваня стал; - шагнуть не может.
Боже! думает бедняк,
Это верно кости гложет
Красногубый вурдалак.
Обратный индекс:
Трусоват (1,1,1)
Был (1,1,2)

11.

Алгоритмы работы ПС
Документ:
Трусоват был Ваня бедный:
Раз он позднею порой,
Весь в поту, от страха бледный,
Чрез кладбище шел домой.
Горе! малый я не сильный;
Съест упырь меня совсем,
Если сам земли могильной
Я с молитвою не съем.
Бедный Ваня еле дышит,
Спотыкаясь, чуть бредет
По могилам; вдруг он слышит,
Кто-то кость, ворча, грызет.
Что же? вместо вурдалака (Вы представьте Вани злость!)
В темноте пред ним собака
На могиле гложет кость.
Ваня стал; - шагнуть не может.
Боже! думает бедняк,
Это верно кости гложет
Красногубый вурдалак.
Обратный индекс:
Трусоват (1,1,1)
Был (1,1,2)
Ваня (1,1,3; 2,1,2; 3,1,1; 5,2,3)

12.

Математические модели ПС
Математическая модель — упрощение реальности, в результате
которого получается формула, позволяющая считать документы
найденными и ранжировать их.

13.

Математические модели ПС
Математическая модель — упрощение реальности, в результате
которого получается формула, позволяющая считать документы
найденными и ранжировать их.
Булевские — есть слово — документ найден.

14.

Математические модели ПС
Математическая модель — упрощение реальности, в результате
которого получается формула, позволяющая считать документы
найденными и ранжировать их.
Булевские — есть слово — документ найден. 2247 млн страниц
Векторные: вес документа = TF * IDF, где
TF — частота слова в документе,
IDF — редкость слова в коллекции.

15.

Математические модели ПС
Математическая модель — упрощение реальности, в результате
которого получается формула, позволяющая считать документы
найденными и ранжировать их.
Булевские — есть слово — документ найден.
Векторные: вес документа = TF * IDF, где
TF — частота слова в документе,
IDF — редкость слова в коллекции.

16.

Математические модели ПС
Математическая модель — упрощение реальности, в результате
которого получается формула, позволяющая считать документы
найденными и ранжировать их.
Булевские — есть слово — документ найден.
Векторные: вес документа = TF * IDF, где
TF — частота слова в документе,
IDF — редкость слова в коллекции.
Вероятностные — сравнивание с набором эталонных документов.

17.

Математические модели ПС
Математическая модель — упрощение реальности, в результате
которого получается формула, позволяющая считать документы
найденными и ранжировать их.
Булевские — есть слово — документ найден.
Векторные: вес документа = TF * IDF, где
TF — частота слова в документе,
IDF — редкость слова в коллекции.
Вероятностные — сравнивание с набором эталонных документов.
Релевантность — степень отношения к делу.

18.

Качество поиска
Математическая модель нуждается в настройке. Асессоры.
Критерии качества:
Точность — доля релевантных документов в выдаче.
Полнота — доля найденных релевантных документов в общем числе
релевантных документов коллекции.
Актуальность — соответствие ссылок в выдаче реальным документам в
интернете.
Поисковые системы сегодня далеки от совершенства.

19.

Лицензии ПС
Общие пункты всех лицензий:
• Запрет на коммерческое использование результатов поиска, их
тиражирование и автоматический доступ к ним.
• Отказ от гарантий на содержание сайтов, на точность, полноту и
актуальность информации, т.е. на качество поиска.
• Право как предоставлять, так и не предоставлять услуги. Соблюдение
robots.txt.
• Гарантия неподкупности результатов поиска.
• Декларация борьбы с поисковым спамом.
• Политика конфиденциальности.

20.

Индексация документов
Сбор информации — получение документа напрямую и дальнейший
переход по ссылкам (документы прямой видимости).
Особенности индексации
Инверсный индекс плюс прямой индекс (сохраненная копия).
Ограничения по доменам. Иноземные зоны для Яндекса.
Объем индексации на одном сайте - домены 2-го и 3-го уровня.
Частота переиндексации.

21.

Особенности морфологии
Морфология поисковых систем
Лингвистическая обработка при индексировании. Словари.
Служебные символы не индексируются: точки, пробелы, знаки препинания.
Стоп-слова — полноценные участники ранжирования.
Словоформы.

22.

Проблемы ПС
Все эти проблемы сегодня не имеют решения:
Размер индекса
Дубликаты
Поисковый спам
Обновление
Понимание пользователя

23.

Виды запросов пользователей
1 пользователь = 5 запросов = 1-2 страницы.
1,2 слова (1997) => 2.5 слова (2008).
Одно слово – 27%
Два слова – 27%
Три слова – 20%
Четыре и более – 26%
Существительные – 75%
Прилагательные – 26%
Глаголы – 5%
14-15% всех запросов содержат различные ошибки и искажения. Две трети всех
ошибок — орфографические (пропущенные буквы, неправильное написание
слов и т.п.).

24.

Виды запросов пользователей
Информационные запросы - Тип запросов, когда пользователь хочет получить
конкретную информацию, отвечающую на его вопрос. Примеры таких запросов –
рефераты по экономике, слова песни ... и т.д.
Навигационные запросы (10%) - Тип запросов, когда пользователь хочет получить
указание на место в Сети. Примеры запросов – сайт Дом-2, сайт Путина, одноклассники и
т.д.
Транзакционные запросы (4%) - Тип запросов, когда пользователь хочет получить
указание на место, где находится интересующий его товар. При этом пользователь не
имеет особых предпочтений относительно места. Как правило, транзакционные запросы
связаны с желанием пользователя приобрести товар.
Пример купить костюмы олимпийской сборной России.
Источник:
http://download.yandex.ru/company/yandex_search_autumn_2008_ru.pdf

25.

SEspider
Определись с позициями

26.

SEO
Проверка позиций
сайта в
поисковой выдаче
Веб-сервисы
Локальные
программы

27.

Требования
Расходы по
трафику
Возможности
настройки
Веб-сервисы
Локальные
приложения
Браузер для
работы
Необходима
установка
Низкие
Высокие
Нет
Детальная
настройка оп
каждому проекту
Низкое
Удобство работы
Обусловлено тем, что вебсервисы ограничены
возможностями браузера

28. SEspider возможности

Программа работает с 9-ю поисковыми системами. В их числе: Google.ru, Yandex.ru,
Rambler.ru, Mail.ru, Google.com, Google.com.ua, Google.lv, Yahoo.com, Live.com.
2 алгоритма поиска позиций.
4 языка интерфейса (английский, русский, латышский, украинский)
Есть возможность использовать proxy
Обход капчи.
Возможность импорта проектов из semonitor и Site-Auditor.
Определение самых релевантных и количества страниц на сайте по заданым
ключевым словам (фразам).
Проверка данных по сайту: Google Pr, Yandex тИЦ, Число страниц в индексе Google,
Число страниц в индекске Yandex, наличие в каталоге Yandex.

29. Интерфейс

Окно выбора
ключевых слов
Окно выбора
Анализируемых
сайтов
Окно выбора
Поисковых
систем

30. Окно анализа позиций

Какая страница
анализируется
Лучшая позиция
Изменения
Текущая позиция
Красный цвет
обозначает, что
текущая позиция
самая высокая за
всю историю анализа
Сколько страниц
будет
проанализировано

31. Основные настройки

Настройки анализа поисковой системы

32. Экспорт данных

Экспорт

33. Определение основных параметров сайта

34. Преимущества

Программный продукт распространяется совершенно бесплатно
Регулярные обновления
Возможность анализировать региональную выдачу Яндекса
Стабильность – все настройки и проекты сохраняются при обновлении
программы

35. Сбор позиций

Сервисы
www.seumka.ru
www.siteposition.ru
Программы
Sespider.ru
semonitor.ru
yazzle.ru

36. Полезные сервисы

Сервисы, программы, бары:
www.tekto.biz/sick/ns.php
www.developing.ru/seobar
www.yazzle.ru
www.whois-search.ru

37.

ВОПР СЫ
Вопросы – это тайный путь к …

38.

www.academir.ru
СПАСИБО ЗА ВНИМАНИЕ
Вениамин МОИСЕЕВ
Заместитель начальника SEO отдела в компании «Сео Дрим»
English     Русский Rules