39060

Компьютерные технологии поиска информации в науке

Доклад

Информатика, кибернетика и программирование

Поиск информации представляет собой процесс выявления в некотором множестве документов текстов всех тех которые посвящены указанной теме предмету удовлетворяют заранее определенному условию поиска запросу или содержат необходимые соответствующие информационной потребности факты сведения данные. Полнотекстовый поиск поиск по всему содержимому документа. Пример полнотекстового поиска любой интернетпоисковик например www.

Русский

2013-09-30

323 KB

8 чел.

Компьютерные технологии поиска информации в науке.

Поиск информации представляет собой процесс выявления в некотором множестве документов (текстов) всех тех, которые посвящены указанной теме (предмету), удовлетворяют заранее определенному условию поиска (запросу) или содержат необходимые (соответствующие информационной потребности) факты, сведения, данные.

Полнотекстовый поиск — поиск по всему содержимому документа. Пример полнотекстового поиска — любой интернет-поисковик, например www.yandex.ru,www.google.com.

Поиск по метаданным — это поиск по неким атрибутам документа, поддерживаемым системой — название документа, дата создания, размер, автор и т. д. Пример поиска по реквизитам — диалог поиска в файловой системе (например, MS Windows).

Поиск изображений — поиск по содержанию изображения. Поисковая система распознает содержание фотографии (загружена пользователем или добавлен URL изображения).

Адресный поиск -  процесс поиска документов по чисто формальным признакам, указанным в запросе.

Семантический поиск - процесс поиска документов по их содержанию.

Документальный поиск - процесс поиска в хранилище информационно-поисковой системы первичных документов или в базе данных вторичных документов, соответствующих запросу пользователя.

Фактографический поиск - процесс поиска фактов, соответствующих информационному запросу.

Различают два вида:

  •  Документально-фактографический, заключается в поиске в документах фрагментов текста, содержащих факты.
  •  Фактологический (описание фактов), предполагающий создание новых фактографических описаний в процессе поиска путем логической переработки найденной фактографической информации.

Информационный поиск — большая междисциплинарная область науки, стоящая на пересечении когнитивной психологии, информатики, информационного дизайна, лингвистики, семиотики, и библиотечного дела.

Поиск информации — процесс выявления в массиве информации записей, удовлетворяющих заранее определенному условию поиска или запросу.

Запрос — это формализованный способ выражения информационных потребностей пользователем системы. Для выражения информационной потребности используется язык поисковых запросов, синтаксис варьируется от системы к системе. Кроме специального языка запросов, современные поисковые системы позволяют вводить запрос на естественном языке.

Объект запроса — это информационная сущность, которая хранится в базе автоматизированной системы поиска.

Поисковая система – это специальное программное обеспечение, основная цель которого – обеспечить быстрый, точный и качественный поиск информации, в частном случае, в сети Интернет.

Виды поисковых систем:

  •  Локальные, осуществляющие поиск в рамках локальных сетей или определенных ресурсов.
  •  Глобальные, предназначенные для поиска информации в сети интернет.Глобальные поисковые системы могут быть:

Универсальные. Такие ПС предоставляют своим пользователям возможность поиска любого вида контента: текстового, графического, аудио, видео.

Специализированные. Задачей данного вида ПС является поиск информации, отвечающей определенным требованиям.

Тематические. ПС такого вида осуществляют поиск лишь той информации в интернете, которая интересна определенным группам общества (религиозным, профессиональным и т.п.).

Согласно схеме на рис.1 реальными носителями информации о ресурсах, которыми располагает Сеть, являются поисковые машины (автоматические индексы) и каталоги. В силу того, что они, хотя и различными средствами, самостоятельно обеспечивают все этапы обработки информации от ее получения с узлов-первоисточников до предоставления пользователю возможности поиска, их часто называют автономными системами.

Автономные поисковые системы могут различаться по принципу отбора информации, который в той или иной степени присутствует и в алгоритме сканирующей программы автоматического индекса, и в регламенте поведения сотрудников каталога, отвечающих за регистрацию. Как правило, сравниваются два основных показателя: пространственный масштаб, в котором работает ИПС, и ее специализация.

Яндекс — поисковая машина, способная по вашему запросу найти в русскоязычной части интернета наиболее подходящие веб-страницы, новости, картинки, статьи энциклопедий или товары, дать ответ на вопрос о погоде или культурных событиях.

Поисковый алгоритм — сложная математическая модель, позволяющая поисковой системе составить поисковую выдачу, наиболее релевантную запросу пользователя. Представляет собой классический «черный ящик» с набором параметров, на входе в который задается проблема, а на выходе — ее решение.

Индекс - база данных служит хранилищем известных поисковой системе адресов сайтов и их страниц, а также всех слов, ссылок и прочей информации, на них размещенных.

Апдейт — своеобразная ревизия базы данных ПС, во время которой из нее исключаются одни и добавляются другие ресурсы и их страницы.

Закрыть от индексации поисковыми роботами все содержимое сайта или только часть информации, размещенной на нем, можно с помощью файла robots.txt и его директив:

  •  User-agent — обращение к конкретному роботу конкретнойПС.
  •  Disallow — может закрывать как сайт, так и отдельные его страницы.
  •  Host — сигнализирует роботу, под URL какого индексируется ресурс.

Поисковый робот— специальная программа, принадлежащая определенной поисковой системе и предназначенная для индексирования (занесения в базу сайтов поисковой системы) веб-сайтов и их страниц, найденных в интернет-пространстве.

Примеры поисковых запросов:

1. Поиск точнойфразы.С помощью оператора " ". Заключите фразу или слово в кавычки, и Яндекс будет искать веб-страницы, где есть ровно такая фраза (форма слова).

2. Поиск цитаты, в которой пропущено слово.Если вы забыли слово в цитате, возьмите всю цитату в кавычки, а вместо пропущенного слова поставьте звездочку *. Цитата найдется вместе с забытым словом.

3. Поиск  любого из нескольких слов.Просто перечислите все подходящие варианты через вертикальный слеш: |. Яндекс будет искать документы с любым из этих слов.

4.Поиск слова в пределах одного предложения. Используйте оператор с красивым именем «амперсанд» — &. Если соединить слова амперсандом, Яндекс найдет документы, где эти слова стоят в одном предложении.

5. Поиск документа, содержащего определённое слово. Поставьте перед нужным словом плюс, не отделяя его от слова пробелом.

6. Как исключить слово из поиска. Поставьте минус перед словом, которое вы не хотите видеть в ответах.

7. Поиск на определенном сайте. Для этого подойдет оператор site. Он позволяет прямо в запросе указать сайт, на котором нужно искать

8. Поиск документа определенного типа. Вам нужен оператор mime. Поставьте в запросе mime, двоеточие и затем тип документа, который вам нужен.

9. Поиск на сайтах на определенном языке

После lang нужно поставить двоеточие и написать, на каком языке вам нужны документы.Если это русский язык, то нужно указать ru, если украинский — uk. Белорусский язык обозначается как be, английский — en, французский — fr.


 

А также другие работы, которые могут Вас заинтересовать

84400. Outstanding people of Uzbekistan Abu-Rayhon Beruniy 117.38 KB
  Abu-Rayhon Beruniy – a remarkable scientist, amazing with variety of his scientific interests, boldness of idea, the author of more than 150 works devoted to actual issues of natural sciences, philosophy, history, philology, great encyclopaedist – the thinker, the humanist of the Middle Ages epoch.
84401. Muhammad ibn Muso al-Khorazmiy 164.28 KB
  Muhammad ibn Muso al-Khorazmiy (783 - 850) Nickname Al – Khorezmi specifies his native land – the Central Asian state Khoresm (nowadays territory of Uzbekistan), Bin Mussa – son of Mussa, and one of nicknames of the scientist – Al – Madjusi– speaks about his origin from a sort of magicians...
84402. Alisher Navoi (1441-1501) 163.92 KB
  An ingenious poet and the thinker, the musician and the artist, the teacher and the scientist, a great statesman and one of the most cultural persons of his time. Alisher Navoi was the conventional head of the cultural life of Herat, the patron of numerous representatives of sciences, arts and cultures.
84403. Imam al-Bukhoriy (810-870) 37.33 KB
  Al – Bukhari, Muhammad Ismail Abu Abdullah al – Djufi (810 - 870) – well-known Sunni muhaddist – traditionalist. He was born in the family of Iranian origin in Bukhara, has died in the Hartanka settlement (near Samarkand).
84404. Amir Temur (Tamerlane) (1336-1405) 128.66 KB
  Amir Temur was born in 8th April 1336 in Hodja Ilgor village (Yakkabag) near Kesh (Shahrisabz). His father emir Muhammad Taragaj was from notable family of a Turkic sort barlas. He was the influential person and had the big authority in Movarounnahr.
84405. DIE UKRAINE: LAND UND LEUTE 20.22 KB
  Die Ukraine ist ein verhältnismäßig junger Staat. Einst war sie eine der Sowjetrepubliken. Am 24. August 1991 wurde ihre Unabhängigkeit bekanntgegeben. Jetzt hat die Ukraine ihre eigene Verfassung, Regierung, den Obersten Rat und Währung — die Grywnja.
84406. LEHRERTÄTIGKEIT 19.92 KB
  Lehrer unterstützen und fördern die persönliche Entwicklung ihrer Schüler und vermitteln anderen ihr Fachwissen. Die Aufgaben eines Lehrers sind vielseitig. Es geht nicht nur um die Vermittlung von Bildungsinhalten und das Einhalten des vorgeschriebenen Lehrplans.
84407. SEHENSWÜRDIGKEITEN BERLINS 20.26 KB
  Berlin ist die Hauptstadt der Bundesrepublik Deutschland. Es wurde im 13. Jahrhundert gegründet. Im 19. Jahrhundert hatte sich Berlin zu einer der größten Städte Europas entwickelt. Berlin war bis 1945 das Kulturzentrum Europas.
84408. UMWELTSCHUTZ IN DEUTSCHLAND 18.21 KB
  Die räuberische Einmischung des Menschen in die Natur führte zur ökologischen Tragödie in der ganzen Welt. Es gibt viele Beispiele dazu: der sterbende Wald, verseuchtes Wasser, verpestete Luft, drohende Klimaveränderungen.