39060

Компьютерные технологии поиска информации в науке

Доклад

Информатика, кибернетика и программирование

Поиск информации представляет собой процесс выявления в некотором множестве документов текстов всех тех которые посвящены указанной теме предмету удовлетворяют заранее определенному условию поиска запросу или содержат необходимые соответствующие информационной потребности факты сведения данные. Полнотекстовый поиск поиск по всему содержимому документа. Пример полнотекстового поиска любой интернетпоисковик например www.

Русский

2013-09-30

323 KB

8 чел.

Компьютерные технологии поиска информации в науке.

Поиск информации представляет собой процесс выявления в некотором множестве документов (текстов) всех тех, которые посвящены указанной теме (предмету), удовлетворяют заранее определенному условию поиска (запросу) или содержат необходимые (соответствующие информационной потребности) факты, сведения, данные.

Полнотекстовый поиск — поиск по всему содержимому документа. Пример полнотекстового поиска — любой интернет-поисковик, например www.yandex.ru,www.google.com.

Поиск по метаданным — это поиск по неким атрибутам документа, поддерживаемым системой — название документа, дата создания, размер, автор и т. д. Пример поиска по реквизитам — диалог поиска в файловой системе (например, MS Windows).

Поиск изображений — поиск по содержанию изображения. Поисковая система распознает содержание фотографии (загружена пользователем или добавлен URL изображения).

Адресный поиск -  процесс поиска документов по чисто формальным признакам, указанным в запросе.

Семантический поиск - процесс поиска документов по их содержанию.

Документальный поиск - процесс поиска в хранилище информационно-поисковой системы первичных документов или в базе данных вторичных документов, соответствующих запросу пользователя.

Фактографический поиск - процесс поиска фактов, соответствующих информационному запросу.

Различают два вида:

  •  Документально-фактографический, заключается в поиске в документах фрагментов текста, содержащих факты.
  •  Фактологический (описание фактов), предполагающий создание новых фактографических описаний в процессе поиска путем логической переработки найденной фактографической информации.

Информационный поиск — большая междисциплинарная область науки, стоящая на пересечении когнитивной психологии, информатики, информационного дизайна, лингвистики, семиотики, и библиотечного дела.

Поиск информации — процесс выявления в массиве информации записей, удовлетворяющих заранее определенному условию поиска или запросу.

Запрос — это формализованный способ выражения информационных потребностей пользователем системы. Для выражения информационной потребности используется язык поисковых запросов, синтаксис варьируется от системы к системе. Кроме специального языка запросов, современные поисковые системы позволяют вводить запрос на естественном языке.

Объект запроса — это информационная сущность, которая хранится в базе автоматизированной системы поиска.

Поисковая система – это специальное программное обеспечение, основная цель которого – обеспечить быстрый, точный и качественный поиск информации, в частном случае, в сети Интернет.

Виды поисковых систем:

  •  Локальные, осуществляющие поиск в рамках локальных сетей или определенных ресурсов.
  •  Глобальные, предназначенные для поиска информации в сети интернет.Глобальные поисковые системы могут быть:

Универсальные. Такие ПС предоставляют своим пользователям возможность поиска любого вида контента: текстового, графического, аудио, видео.

Специализированные. Задачей данного вида ПС является поиск информации, отвечающей определенным требованиям.

Тематические. ПС такого вида осуществляют поиск лишь той информации в интернете, которая интересна определенным группам общества (религиозным, профессиональным и т.п.).

Согласно схеме на рис.1 реальными носителями информации о ресурсах, которыми располагает Сеть, являются поисковые машины (автоматические индексы) и каталоги. В силу того, что они, хотя и различными средствами, самостоятельно обеспечивают все этапы обработки информации от ее получения с узлов-первоисточников до предоставления пользователю возможности поиска, их часто называют автономными системами.

Автономные поисковые системы могут различаться по принципу отбора информации, который в той или иной степени присутствует и в алгоритме сканирующей программы автоматического индекса, и в регламенте поведения сотрудников каталога, отвечающих за регистрацию. Как правило, сравниваются два основных показателя: пространственный масштаб, в котором работает ИПС, и ее специализация.

Яндекс — поисковая машина, способная по вашему запросу найти в русскоязычной части интернета наиболее подходящие веб-страницы, новости, картинки, статьи энциклопедий или товары, дать ответ на вопрос о погоде или культурных событиях.

Поисковый алгоритм — сложная математическая модель, позволяющая поисковой системе составить поисковую выдачу, наиболее релевантную запросу пользователя. Представляет собой классический «черный ящик» с набором параметров, на входе в который задается проблема, а на выходе — ее решение.

Индекс - база данных служит хранилищем известных поисковой системе адресов сайтов и их страниц, а также всех слов, ссылок и прочей информации, на них размещенных.

Апдейт — своеобразная ревизия базы данных ПС, во время которой из нее исключаются одни и добавляются другие ресурсы и их страницы.

Закрыть от индексации поисковыми роботами все содержимое сайта или только часть информации, размещенной на нем, можно с помощью файла robots.txt и его директив:

  •  User-agent — обращение к конкретному роботу конкретнойПС.
  •  Disallow — может закрывать как сайт, так и отдельные его страницы.
  •  Host — сигнализирует роботу, под URL какого индексируется ресурс.

Поисковый робот— специальная программа, принадлежащая определенной поисковой системе и предназначенная для индексирования (занесения в базу сайтов поисковой системы) веб-сайтов и их страниц, найденных в интернет-пространстве.

Примеры поисковых запросов:

1. Поиск точнойфразы.С помощью оператора " ". Заключите фразу или слово в кавычки, и Яндекс будет искать веб-страницы, где есть ровно такая фраза (форма слова).

2. Поиск цитаты, в которой пропущено слово.Если вы забыли слово в цитате, возьмите всю цитату в кавычки, а вместо пропущенного слова поставьте звездочку *. Цитата найдется вместе с забытым словом.

3. Поиск  любого из нескольких слов.Просто перечислите все подходящие варианты через вертикальный слеш: |. Яндекс будет искать документы с любым из этих слов.

4.Поиск слова в пределах одного предложения. Используйте оператор с красивым именем «амперсанд» — &. Если соединить слова амперсандом, Яндекс найдет документы, где эти слова стоят в одном предложении.

5. Поиск документа, содержащего определённое слово. Поставьте перед нужным словом плюс, не отделяя его от слова пробелом.

6. Как исключить слово из поиска. Поставьте минус перед словом, которое вы не хотите видеть в ответах.

7. Поиск на определенном сайте. Для этого подойдет оператор site. Он позволяет прямо в запросе указать сайт, на котором нужно искать

8. Поиск документа определенного типа. Вам нужен оператор mime. Поставьте в запросе mime, двоеточие и затем тип документа, который вам нужен.

9. Поиск на сайтах на определенном языке

После lang нужно поставить двоеточие и написать, на каком языке вам нужны документы.Если это русский язык, то нужно указать ru, если украинский — uk. Белорусский язык обозначается как be, английский — en, французский — fr.


 

А также другие работы, которые могут Вас заинтересовать

46977. Аудит нематериальных активов организации 40.5 KB
  Соглно ПБУ14 07 для принятия актива в качве НМА н мо сущестное выполне опредых усл:отсут матвещ формывозмть идентифик использе в прве прод. Цель Ата НМАформире мнения о достоверности БО по разделу НМА и устане соответсвия применяемых Мек учета и н о операций с НМА действующму законодву РФ. При Ате проверяются= :постановка кля за наличием НМА ведение синтго учета по поступю и выбытию НМА начислие и отражие амортизации. Инфая база для Ара:НА поб у и н обл НМА;уч пол;регистры бух учета;первич док;БО.
46978. Настроечные базы 40.97 KB
  Для осуществления настройки станка относительно определенных поверхностей заготовки необходимо чтобы эти поверхности занимали на станке при смене заготовок неизменное положение относительно упоров станка определяющих конечное положение обрабатывающего инструмента. К таким поверхностям относятся опорные поверхности заготовки что и предопределяет широкое их использование в крупносерийном производстве в качестве опорных...
46979. Эпоха Просвещения. Конец XVII в.-середина ХVIII в 41 KB
  Академия скульптуры и живописи во Франции Академия изящных искусств первая система высшего художественного образования. Академия в Филадельфии Бенджамина Франклина Школа Декарта картезианская первое педагогическое нововведение алгебра вместо арифметики и геометрия. Королевская Академия во Франции уходила в прошлое религиозная живопись и каноны придворного искусства все более становились ведущими светские реалистические и галантные жанры. В 1563 году открывается академия художеств во Флоренции в 1577г.
46980. СПП 41 KB
  СПП – это сложное предложение, части которого связаны подчинительными союзами или союзными словами, относительными местоимениями. Опираясь на связь между главным и придаточным и на о к чему относится придаточное СПП делятся на СПП расчлененной и нерасчлененной структуры. СПП нерасчлененной структуры реализуют присловную связь, т.е. придаточное относистся к ОДНОМУ слову в главной части.
46984. Средневековая цивилизация Запада 41.64 KB
  От лоскутной цивилизации к единому историческому пространству. Религия структурообразующий компонент Западноевропейской средневековой цивилизации. Основные достижения Западноевропейской средневековой цивилизации. Новая жизнь имперской идеи История Средневековой цивилизации знает две попытки создания в Западной Европе универсальных империй.