Similar presentations:
Основы поисковой оптимизации. Часть первая
1.
КУРСЫ: Основы поисковой оптимизации.Часть первая
Вениамин МОИСЕЕВ
Заместитель начальника SEO отдела в компании «Сео Дрим»
Москва, 2009 г.
2.
Основы поисковой оптимизацииКурсы SEO - всестороннее изучение современных факторов,
влияющих на продвижение сайта в поисковых системах.
По ходу занятий Вам будут предложены:
разминка для ума;
юмор;
развенчивание мифов;
ответы «я не знаю».
3.
ТерминологияДокумент - страница в интернете, имеющая уникальный адрес (url)
(ссылки с якорями (#) не в счет).
Ссылка - прямая ссылка вида <a href="">текст или картинка</a>,
нажав на которую пользователь переходит на указанный адрес.
Анкор (anchor) – текст ссылки.
Донор: документ, на котором стоит ссылка на продвигаемый документ.
Акцептор: документ, на который ведет ссылка с донора.
Стоп-слова – служебные часть речи: союзы и предлоги.
Коллекция — совокупность всех документов в базе данных (БД или индекс)
поисковой системы (ПС).
Апдейт — обновление информации в базе данных ПС.
Дэнс — процесс изменения выдачи, видимый пользователю.
Кэш — сохраненная страница выдачи по определенному запросу.
4.
Алгоритмы работы ПСПрямой поиск
Последовательный перебор всех имеющихся документов коллекции.
+ нет искажений,
- очень долго.
5.
Алгоритмы работы ПСПрямой поиск
Последовательный перебор всех имеющихся документов коллекции.
+ нет искажений,
- очень долго.
Инвертированные индексы
Инвертированный (обратный) индекс — файл, содержащий список слов
документа в алфавитном порядке с указанием позиций и других
параметров вхождения этого слова в документ.
+ быстродействие,
- потеря информации.
6.
Алгоритмы работы ПСПрямой поиск
Последовательный перебор всех имеющихся документов коллекции.
+ нет искажений,
- очень долго.
Инвертированные индексы
Инвертированный (обратный) индекс — файл, содержащий список слов
документа в алфавитном порядке с указанием позиций и других
параметров вхождения этого слова в документ.
+ быстродействие,
- потеря информации.
7.
Алгоритмы работы ПСПример обратного индекса – глоссарий (алфавитно-предметный указатель)
Адвокат, защитник
право на помощь адвоката: ст. 48
право подозреваемого, обвиняемого на защиту: ст. 48
Акты органов власти
акты Президента РФ: ст. 90
акты, применяемые при разрешении
споров: ст. 15.4, ст. 76.5
действие актов СССР и РСФСР: часть II
обжалование в суд актов органов власти: ст. 46.2
обратная сила нормативных актов: ст. 54, ст. 57
опубликование актов министерств, ведомств: ст. 15.3
опубликование федеральных законов: ст. 15.3
подготовка законов: ст. 104.3
применение неопубликованных нормативных
правовых актов: ст. 15.3
приостановление актов субъекта РФ: ст. 85.2
толкование нормативных актов: ст. 125.5
Амнистия и помилование
помилование: ст. 50.3
Арбитражный суд
Высший Арбитражный Суд: ст. 127
назначение судей: ст. 128
стаж юридический для кандидатов в судьи: ст. 119
Арест. Заключение под стражу
арест: ст. 22
сроки содержания под стражей: ст. 22
Источник: http://www.kremlin.ru/articles/alfabet01.shtml
8.
Алгоритмы работы ПСДокумент:
Трусоват был Ваня бедный:
Раз он позднею порой,
Весь в поту, от страха бледный,
Чрез кладбище шел домой.
Горе! малый я не сильный;
Съест упырь меня совсем,
Если сам земли могильной
Я с молитвою не съем.
Бедный Ваня еле дышит,
Спотыкаясь, чуть бредет
По могилам; вдруг он слышит,
Кто-то кость, ворча, грызет.
Что же? вместо вурдалака (Вы представьте Вани злость!)
В темноте пред ним собака
На могиле гложет кость.
Ваня стал; - шагнуть не может.
Боже! думает бедняк,
Это верно кости гложет
Красногубый вурдалак.
9.
Алгоритмы работы ПСДокумент:
Трусоват был Ваня бедный:
Раз он позднею порой,
Весь в поту, от страха бледный,
Чрез кладбище шел домой.
Горе! малый я не сильный;
Съест упырь меня совсем,
Если сам земли могильной
Я с молитвою не съем.
Бедный Ваня еле дышит,
Спотыкаясь, чуть бредет
По могилам; вдруг он слышит,
Кто-то кость, ворча, грызет.
Что же? вместо вурдалака (Вы представьте Вани злость!)
В темноте пред ним собака
На могиле гложет кость.
Ваня стал; - шагнуть не может.
Боже! думает бедняк,
Это верно кости гложет
Красногубый вурдалак.
Обратный индекс:
Трусоват (1,1,1)
10.
Алгоритмы работы ПСДокумент:
Трусоват был Ваня бедный:
Раз он позднею порой,
Весь в поту, от страха бледный,
Чрез кладбище шел домой.
Горе! малый я не сильный;
Съест упырь меня совсем,
Если сам земли могильной
Я с молитвою не съем.
Бедный Ваня еле дышит,
Спотыкаясь, чуть бредет
По могилам; вдруг он слышит,
Кто-то кость, ворча, грызет.
Что же? вместо вурдалака (Вы представьте Вани злость!)
В темноте пред ним собака
На могиле гложет кость.
Ваня стал; - шагнуть не может.
Боже! думает бедняк,
Это верно кости гложет
Красногубый вурдалак.
Обратный индекс:
Трусоват (1,1,1)
Был (1,1,2)
11.
Алгоритмы работы ПСДокумент:
Трусоват был Ваня бедный:
Раз он позднею порой,
Весь в поту, от страха бледный,
Чрез кладбище шел домой.
Горе! малый я не сильный;
Съест упырь меня совсем,
Если сам земли могильной
Я с молитвою не съем.
Бедный Ваня еле дышит,
Спотыкаясь, чуть бредет
По могилам; вдруг он слышит,
Кто-то кость, ворча, грызет.
Что же? вместо вурдалака (Вы представьте Вани злость!)
В темноте пред ним собака
На могиле гложет кость.
Ваня стал; - шагнуть не может.
Боже! думает бедняк,
Это верно кости гложет
Красногубый вурдалак.
Обратный индекс:
Трусоват (1,1,1)
Был (1,1,2)
Ваня (1,1,3; 2,1,2; 3,1,1; 5,2,3)
12.
Математические модели ПСМатематическая модель — упрощение реальности, в результате
которого получается формула, позволяющая считать документы
найденными и ранжировать их.
13.
Математические модели ПСМатематическая модель — упрощение реальности, в результате
которого получается формула, позволяющая считать документы
найденными и ранжировать их.
Булевские — есть слово — документ найден.
14.
Математические модели ПСМатематическая модель — упрощение реальности, в результате
которого получается формула, позволяющая считать документы
найденными и ранжировать их.
Булевские — есть слово — документ найден. 2247 млн страниц
Векторные: вес документа = TF * IDF, где
TF — частота слова в документе,
IDF — редкость слова в коллекции.
15.
Математические модели ПСМатематическая модель — упрощение реальности, в результате
которого получается формула, позволяющая считать документы
найденными и ранжировать их.
Булевские — есть слово — документ найден.
Векторные: вес документа = TF * IDF, где
TF — частота слова в документе,
IDF — редкость слова в коллекции.
16.
Математические модели ПСМатематическая модель — упрощение реальности, в результате
которого получается формула, позволяющая считать документы
найденными и ранжировать их.
Булевские — есть слово — документ найден.
Векторные: вес документа = TF * IDF, где
TF — частота слова в документе,
IDF — редкость слова в коллекции.
Вероятностные — сравнивание с набором эталонных документов.
17.
Математические модели ПСМатематическая модель — упрощение реальности, в результате
которого получается формула, позволяющая считать документы
найденными и ранжировать их.
Булевские — есть слово — документ найден.
Векторные: вес документа = TF * IDF, где
TF — частота слова в документе,
IDF — редкость слова в коллекции.
Вероятностные — сравнивание с набором эталонных документов.
Релевантность — степень отношения к делу.
18.
Качество поискаМатематическая модель нуждается в настройке. Асессоры.
Критерии качества:
Точность — доля релевантных документов в выдаче.
Полнота — доля найденных релевантных документов в общем числе
релевантных документов коллекции.
Актуальность — соответствие ссылок в выдаче реальным документам в
интернете.
Поисковые системы сегодня далеки от совершенства.
19.
Лицензии ПСОбщие пункты всех лицензий:
• Запрет на коммерческое использование результатов поиска, их
тиражирование и автоматический доступ к ним.
• Отказ от гарантий на содержание сайтов, на точность, полноту и
актуальность информации, т.е. на качество поиска.
• Право как предоставлять, так и не предоставлять услуги. Соблюдение
robots.txt.
• Гарантия неподкупности результатов поиска.
• Декларация борьбы с поисковым спамом.
• Политика конфиденциальности.
20.
Индексация документовСбор информации — получение документа напрямую и дальнейший
переход по ссылкам (документы прямой видимости).
Особенности индексации
Инверсный индекс плюс прямой индекс (сохраненная копия).
Ограничения по доменам. Иноземные зоны для Яндекса.
Объем индексации на одном сайте - домены 2-го и 3-го уровня.
Частота переиндексации.
21.
Особенности морфологииМорфология поисковых систем
Лингвистическая обработка при индексировании. Словари.
Служебные символы не индексируются: точки, пробелы, знаки препинания.
Стоп-слова — полноценные участники ранжирования.
Словоформы.
22.
Проблемы ПСВсе эти проблемы сегодня не имеют решения:
Размер индекса
Дубликаты
Поисковый спам
Обновление
Понимание пользователя
23.
Виды запросов пользователей1 пользователь = 5 запросов = 1-2 страницы.
1,2 слова (1997) => 2.5 слова (2008).
Одно слово – 27%
Два слова – 27%
Три слова – 20%
Четыре и более – 26%
Существительные – 75%
Прилагательные – 26%
Глаголы – 5%
14-15% всех запросов содержат различные ошибки и искажения. Две трети всех
ошибок — орфографические (пропущенные буквы, неправильное написание
слов и т.п.).
24.
Виды запросов пользователейИнформационные запросы - Тип запросов, когда пользователь хочет получить
конкретную информацию, отвечающую на его вопрос. Примеры таких запросов –
рефераты по экономике, слова песни ... и т.д.
Навигационные запросы (10%) - Тип запросов, когда пользователь хочет получить
указание на место в Сети. Примеры запросов – сайт Дом-2, сайт Путина, одноклассники и
т.д.
Транзакционные запросы (4%) - Тип запросов, когда пользователь хочет получить
указание на место, где находится интересующий его товар. При этом пользователь не
имеет особых предпочтений относительно места. Как правило, транзакционные запросы
связаны с желанием пользователя приобрести товар.
Пример купить костюмы олимпийской сборной России.
Источник:
http://download.yandex.ru/company/yandex_search_autumn_2008_ru.pdf
25.
SEspiderОпределись с позициями
26.
SEOПроверка позиций
сайта в
поисковой выдаче
Веб-сервисы
Локальные
программы
27.
ТребованияРасходы по
трафику
Возможности
настройки
Веб-сервисы
Локальные
приложения
Браузер для
работы
Необходима
установка
Низкие
Высокие
Нет
Детальная
настройка оп
каждому проекту
Низкое
Удобство работы
Обусловлено тем, что вебсервисы ограничены
возможностями браузера
28. SEspider возможности
Программа работает с 9-ю поисковыми системами. В их числе: Google.ru, Yandex.ru,Rambler.ru, Mail.ru, Google.com, Google.com.ua, Google.lv, Yahoo.com, Live.com.
2 алгоритма поиска позиций.
4 языка интерфейса (английский, русский, латышский, украинский)
Есть возможность использовать proxy
Обход капчи.
Возможность импорта проектов из semonitor и Site-Auditor.
Определение самых релевантных и количества страниц на сайте по заданым
ключевым словам (фразам).
Проверка данных по сайту: Google Pr, Yandex тИЦ, Число страниц в индексе Google,
Число страниц в индекске Yandex, наличие в каталоге Yandex.
29. Интерфейс
Окно выбораключевых слов
Окно выбора
Анализируемых
сайтов
Окно выбора
Поисковых
систем
30. Окно анализа позиций
Какая страницаанализируется
Лучшая позиция
Изменения
Текущая позиция
Красный цвет
обозначает, что
текущая позиция
самая высокая за
всю историю анализа
Сколько страниц
будет
проанализировано
31. Основные настройки
Настройки анализа поисковой системы32. Экспорт данных
Экспорт33. Определение основных параметров сайта
34. Преимущества
Программный продукт распространяется совершенно бесплатноРегулярные обновления
Возможность анализировать региональную выдачу Яндекса
Стабильность – все настройки и проекты сохраняются при обновлении
программы
35. Сбор позиций
Сервисыwww.seumka.ru
www.siteposition.ru
Программы
Sespider.ru
semonitor.ru
yazzle.ru
36. Полезные сервисы
Сервисы, программы, бары:www.tekto.biz/sick/ns.php
www.developing.ru/seobar
www.yazzle.ru
www.whois-search.ru
37.
ВОПР СЫВопросы – это тайный путь к …
38.
www.academir.ruСПАСИБО ЗА ВНИМАНИЕ
Вениамин МОИСЕЕВ
Заместитель начальника SEO отдела в компании «Сео Дрим»