Тема: Деятельность в сети Интернет. Поисковые системы.
По принципу действия различают несколько типов поисковых систем, а именно:
Задача 2 Сколько страниц будет найдено по запросу дыня?
Решение задачи 2
Модуль индексирования
Задание на повторение
Домашнее задание
Адресация в Интернет (числовая)
Доменные адреса
Протоколы Интернета
Популярные сервисы Интернета
Электронная почта
Электронная почта
Электронная почта
Электронная почта (Нетикет)
World Wide Web (WWW)
Браузеры
Служба FTP
Пример задачи на определение маски сети
Самостоятельное задание
Вопросы для повторения:
Домашнее задание
734.50K
Category: internetinternet

Тема_1_7_Поиск_информации_в_сети_интернет_адресация_и_задачи_на

1. Тема: Деятельность в сети Интернет. Поисковые системы.

2.

Поисковые системы
Информацию в Интернете ищут с помощью
информационно-поисковых систем (ИПС).
• Поисковая
система — это программноаппаратный комплекс, предназначенный для
поиска информации во Всемирной паутине.
• Поисковая машина — программная часть
поисковой
системы;
комплекс
программ,
предназначенный для поиска информации.

3.

1. История появления поисковых
систем
В 1995 году появились поисковые системы
Lycos и AltaVista. Последняя долгие годы
была
лидером
в
области
поиска
информации в сети Интернет.
В 1997 году создали поисковую машину
Google в рамках исследовательского
проекта в Стэндфордском университете.
В настоящий момент Google - самая
популярная поисковая система в мире!
В сентябре 1997 года была официально
анонсирована поисковая система Yandex,
являющаяся
самой
популярной
в
русскоязычном Интернете.

4. По принципу действия различают несколько типов поисковых систем, а именно:

- поисковые каталоги, управляемые человеком;
- системы, использующие поисковых роботов;
- гибридные поисковые системы.
Действие поисковых систем, использующих
поисковых роботов (другое название этого
вида
поисковой
службы

поисковые
указатели),
основано
на
постоянном,
последовательном изучении всех страниц
всех сайтов Всемирной паутины.

5.

Типы поиска информации:
• Поиск по адресам URL
• Поисковые системы (поиск по
ключевым словам
Запрос формируется с помощью ключевых слов (одного
или
нескольких).
Результаты
поиска
выдаются
пользователю в виде списка адресов (гиперссылок) и
краткой аннотации к ним.
Ключевое слово — это лексическая единица, являющаяся
существительным,
прилагательным,
глаголом,
числительным,
наречием или местоимением естественного языка, которая в
наибольшей степени отражает содержание всего искомого документа.

6.

Поиск по ключевым словам
(операторы в поисковых запросах)
Синтаксис
оператора
Что означает оператор
Пример запроса
|
Логическое ИЛИ
фото | фотография | снимок |
фотоизображение
+
Обязательное наличие
слова в найденном
документе
+быть или +не быть
""
Поиск фразы
"красная шапочка"
&
Логическое И
фото & фотография

7.

Рассмотрим задачу.
В языке запросов некой поисковой машины для обозначения
логической операции ИЛИ используется символ «|», а для
логической операции И — символ «&».
В таблице приведены запросы к поисковому серверу. Расположите запросы в
порядке возрастания количества страниц, которые найдет поисковый cepвeр
по каждому запросу.
С подобными задачами вы встречались в курсе информатики основной
школы и знаете, что условие «логическое И» приводит к уменьшению
количества найденных страниц. Соответственно, применение нескольких
«логических И» еще более уменьшает число найденных страниц. В отличие
от «И», «логическое ИЛИ» приводит к увеличению числа найденных страниц

8.

• Соответственно, применение нескольких «логических ИЛИ» еще
более увеличивает количество найденных страниц.
• Наименьшее количество страниц будет найдено по
запросу принтеры & сканеры & продажа, (принтеры и сканеры
и продажа) так как в документах должны встречаться все три
слова.
• Наибольшее количество страниц будет найдено по
запросу: принтеры | продажа | сканеры (принтеры или
продажа или сканеры).
• В этом случае достаточно хотя бы одного слова в документе. По
запросу принтеры & продажа будет найдено меньше
документов, чем па запросу принтеры | продажа, так как
«логическое И» требует присутствия каждого слова из запроса.
Ответ: принтеры & сканеры & продажа
принтеры & продажа
принтеры | продажа
принтеры | продажа | сканеры

9. Задача 2 Сколько страниц будет найдено по запросу дыня?

Задача 2
Сколько страниц будет найдено по
запросу дыня?
Запрос
Тыква
Арбуз
Тыква & Арбуз
Тыква &Дыня
Арбуз &Дыня
Тыква & Арбуз
&Дыня
Тыква | Арбуз |Дыня
Количество найденных страниц (тысяч
страниц)
3500
2800
1400
900
1700
500
7200

10. Решение задачи 2

Для решения задачи воспользуемся формулой
включений и исключений из комбинаторики.
Заметим, что для трех переменных (X, Y, Z) формула
включений и исключений выглядит так.
X|Y|Z = X+Y+Z– (X&Y + X&Z + Y&Z)+ X&Y&Z
Обозначим количество страниц, найденных по запросу
дыня, через Х. И подставим данные в формулу:
7200= 3500+2800+Х-(1400+900+1700)+500
7200= 2800+Х
Х= 4400.

11.

Состав и принципы работы поисковой системы
Модуль
индексирования
База данных
Поисковый
сервер
Spider(паук)
Crawler(«путешествующий
паук»)
Indexer(робот-индексатор)
Система
хранения данных
Важнейший
элемент всей
системы

12. Модуль индексирования

Indexer (робот-индексатор) - программа,
которая анализирует веб-страницы, скаченные
пауками.
Индексатор разбирает страницу на составные
части и анализирует их, применяя собственные
лексические и морфологические алгоритмы.

13.

Crawler («путешествующий» паук) –
программа, которая автоматически проходит
по всем ссылкам, найденным на странице.
Выделяет все ссылки, присутствующие на
странице.
Его задача - определить, куда дальше должен
идти паук, основываясь на ссылках или исходя
из заранее заданного списка адресов.

14.

База данных
База данных, или индекс поисковой
системы - это система хранения
данных, информационный массив, в
котором
хранятся
специальным
образом преобразованные параметры
всех
скачанных
и
обработанных
модулем индексирования документов.

15. Задание на повторение

В языке запросов поискового сервера для обозначения логической
операции «ИЛИ» используется символ «|», а для обозначения
логической операции «И» – символ «&».
В таблице приведены запросы и количество найденных по ним
страниц некоторого сегмента
сети Интернет.
Запрос
Найдено страниц
(в сотнях тысяч)
Пирамида
54
Инки
29
Египет
38
Пирамида | Инки | Египет
88
Пирамида & Инки
25
Инки & Египет
0
Какое количество страниц (в сотнях тысяч) будет найдено по
запросу Пирамида & Египет?

16. Домашнее задание

РЭШ 13 урок, 11 кл. используя конспект урока
ответить на вопросы
1)Какую информацию называют релевантной?
2) По каким параметрам оценивают эффективность
поиска, опишите их подробно.
3) На что необходимо обращать внимание при оценке
достоверности информации, полученной в результате
поиска в сети Интернет?
4) Для чего применяют геолокационные сервисы (примеры)
5) Что такое интернет-торговля, приведите примеры (ее
преимущества и недостатки).

17. Адресация в Интернет (числовая)

В сети Интернет принята числовая система
адресации

18. Доменные адреса

Компьютеры предпочитают числа, а люди – имена, так
как имена легче запомнить.
Поэтому в Интернете была введена система доменных
имен.
• Домен – это группа компьютеров, объединенных по
некоторому признаку.
• Адрес документа в Интернете

19.

Вся последовательность
символов,
используемых в адресе,
называется URL
Единый указатель ресурсов (URL )
определитель местонахождения) ресурса.
URL — это стандартизированный способ записи
адреса ресурса в сети Интернет.

20.

Изобретатель адреса URL
URL был изобретён
Тимом Бернерсом-Ли
в 1990 году в Женеве, Швейцария.
URL стал фундаментальной
инновацией в Интернете.
Сейчас URL применяется для обозначения адресов
ресурсов Интернета.

21.

Российские поисковые серверы:
• «Яндекс» — www.yandex.ru;
• «Рамблер» — www.rambler.ru;
• «Mail» — www.mail.ru

22.

Рейтинг Российских поисковых
систем

23. Протоколы Интернета

• Протокол – это набор соглашений и правил,
определяющих
порядок
обмена
информацией в компьютерной сети.
• Главный протокол Интернет - TCP/IP
(1974г)
– TCP (Transmission Control Protocol)
• файл делится на пакеты размером не более 1,5 Кб
• пакеты передаются независимо друг от друга
• в месте назначения пакеты собираются в один файл
– IP (Internet Protocol)
• определяет наилучший маршрут движения пакетов

24. Популярные сервисы Интернета

1.Электронная почта
2.Всемирная паутина(WWW)
3.Служба FTP

25. Электронная почта

Одним из наиболее используемых сервисов
Интернет является электронная почта.
В 1971 г. Рэй Томлинс разработал первую программу
для работы с электронной почтой SENDMSG, и это
событие было рождением e-mail. Самое первое
почтовое сообщение состояло всего из 10 символов,
соответствующих
верхнему
ряду
стандартной
клавиатуры: «QWERTYUIOP».
В 1972 г. Томлинс ввел в обиход символ «@» (часто
называемый
собакой)
и
предложил
систему
организации почтовых адресов вида «user@computer»,
позволившую явно указать адресата конкретного
послания.

26. Электронная почта

Электронная почта (E- mail) по сравнению с обычной имеет
ряд преимуществ:
скорость передачи информации;
компактность передаваемой информации;
независимость от времени;
передача информации без соответствующего перемещения
человека.
• Каждый пользователь имеет свой почтовый ящик –
поименованная область дисковой памяти на почтовом
сервере, отведенном для пользователя.
Сюда помещается входящая и исходящая информация.
Почтовый ящик имеет уникальное имя, владелец получает
к нему доступ через пароль.

27. Электронная почта

Электронный адрес используется для определения
местонахождения почтового ящика адресата в сети.
Электронный адрес включает в себя две части,
отделенные друг от друга символом @:
<имя почтового ящика>@<адрес почтового сервера>
• первая часть – имя пользователя – задается самим
пользователем при регистрации почтового ящика;
• вторая часть – доменное имя сервера – представляет
собой доменное имя сервера, на котором пользователь
зарегистрировал свой почтовый ящик.
По электронной почте можно пересылать тексты, рисунки,
фотографии, звукозаписи и другую информацию.

28. Электронная почта (Нетикет)

• Нетикет (net + etiquette) – правила
хорошего тона при общении в Интернете.
• Электронная почта:
– тема сообщения, приветствие, подпись
– не набирать предложения заглавными буквами
– не посылать большие файлы без
договоренности
– не пересылать исполняемые файлы (*.exe)
- не использовать нецензурных и жаргонных
выражений.

29. World Wide Web (WWW)

• WWW или просто веб (Web).
• Всемирная паутина — это сервис Интернета,
основанный на системе гипертекстовых ссылок,
хранилище
информации,
в
котором
информационные объекты связаны структурой
гипертекста.
• В WWW содержится информация, представленная в
текстовом, графическом, видео- и аудиоформатах.
• Аббревиатура WWW сегодня для многих стала
символом
Интернета.
Однако
глобальная
компьютерная сеть существовала задолго до того,
как Тим Бернерс-Ли в 1991 г. запустил свой
первый Web-узел.

30. Браузеры

• Для работы в WWW требуется
специальная
программа
просмотра — браузер. Первый
браузер, работавший с htmlдокументами, Mosaic, выводил
только текст.
• Популярны
у
пользователей
браузеры Google Crome, Mozilla
Firefox, Opera. Принципиальной
разницы между браузерами нет,
ведь каждый браузер имеет
встроенную электронную почту,
клиент-программу
поддержки
групп новостей.
Рейтинг браузеров
1. Google Chrome —
31%;
2. Opera — 18%;
3. FireFox — 15,11%;
4. Яндекс.Браузер —
13,3%;

31. Служба FTP

• Эта служба Интернет предназначена для
копирования с FTP-сервера разнообразных
бесплатных и условно-бесплатных программ.
• Протокол FTP (File Transfer Protocol) —
протокол передачи файлов — появился
практически одновременно с возникновением
сети, которая тогда еще называлась
ARPANET.

32. Пример задачи на определение маски сети

В терминологии сетей TCP/IP маской сети называется двоичное число,
определяющее, какая часть IP–адреса узла сети относится к адресу сети,
а какая – к адресу самого узла в этой сети. Обычно маска записывается
по тем же правилам, что и IP–адрес, – в виде четырёх байтов, причём каждый байт
записывается в виде десятичного числа. При этом в маске сначала (в старших
разрядах) стоят единицы, а затем с некоторого разряда – нули.
Для узла с IP–адресом 147.192.92.64 адрес сети равен 147.192.80.0.
Чему равно значение третьего слева байта маски? Ответ запишите в
виде десятичного числа.
Дано: IP–адрес 147.192.92.64 адрес сети 147.192.80.0.
Очевидно Маска будет иметь вид 255.255.xxx.0
В маске после единицы может идти ноль или один, а после нуля только ноль. Байт
маски в двоичной системе ВСЕГДА из восьми цифр.
Адрес сети это маска умноженная на IP–адрес
То есть 92·X=80 (Умножение посимвольное в двоичной системе)
92=010111002
80=010100002
X= 111100002=24010
Ответ: 240

33. Самостоятельное задание

В терминологии сетей TCP/IP маской сети называется двоичное
число, определяющее, какая часть IP-адреса узла сети относится к
адресу сети, а какая – к адресу самого узла в этой сети.
Обычно маска записывается по тем же правилам, что и IP-адрес, – в
виде четырёх байтов, причём каждый байт записывается в виде
десятичного числа. При этом в маске сначала (в старших разрядах)
стоят единицы, а затем с некоторого разряда – нули. Адрес сети
получается в результате применения поразрядной конъюнкции к
заданному IP-адресу узла и маске.
Например, если IP-адрес узла равен 231.32.255.131, а маска равна
255.255.240.0, то адрес сети равен 231.32.240.0.
Для узла с IP-адресом 147.192.94.64 адрес сети равен
147.192.82.0. Чему равно значение третьего слева байта маски?
Ответ запишите в виде десятичного числа.

34. Вопросы для повторения:

1. С помощью чего выполняют поиск информации
в Интернет?
2. Назовите первые поисковые системы?
3. Назовите популярные российские поисковики?
4. Какая адресация есть в Интернет (пример
адреса)
5. Что такое браузер? Назовите 3 популярных
браузера?
6. Перечислите популярные сервисы Интернет?
7. Назовите главный протокол в Интернет?
8. Выполнить задания на определение маски сети.

35. Домашнее задание

1)Для узла с IP-адресом 147.192.98.64 адрес
сети равен 147.192.88.0. Чему равно значение
третьего слева байта маски? Ответ
запишите в виде десятичного числа.
2)Для узла с IP-адресом 111.81.206.27 адрес
сети равен 111.81.190.0. Чему равно
наименьшее возможное значение третьего
слева байта маски? Ответ запишите в
виде десятичного числа.
English     Русский Rules