39060

Компьютерные технологии поиска информации в науке

Доклад

Информатика, кибернетика и программирование

Поиск информации представляет собой процесс выявления в некотором множестве документов текстов всех тех которые посвящены указанной теме предмету удовлетворяют заранее определенному условию поиска запросу или содержат необходимые соответствующие информационной потребности факты сведения данные. Полнотекстовый поиск поиск по всему содержимому документа. Пример полнотекстового поиска любой интернетпоисковик например www.

Русский

2013-09-30

323 KB

8 чел.

Компьютерные технологии поиска информации в науке.

Поиск информации представляет собой процесс выявления в некотором множестве документов (текстов) всех тех, которые посвящены указанной теме (предмету), удовлетворяют заранее определенному условию поиска (запросу) или содержат необходимые (соответствующие информационной потребности) факты, сведения, данные.

Полнотекстовый поиск — поиск по всему содержимому документа. Пример полнотекстового поиска — любой интернет-поисковик, например www.yandex.ru,www.google.com.

Поиск по метаданным — это поиск по неким атрибутам документа, поддерживаемым системой — название документа, дата создания, размер, автор и т. д. Пример поиска по реквизитам — диалог поиска в файловой системе (например, MS Windows).

Поиск изображений — поиск по содержанию изображения. Поисковая система распознает содержание фотографии (загружена пользователем или добавлен URL изображения).

Адресный поиск -  процесс поиска документов по чисто формальным признакам, указанным в запросе.

Семантический поиск - процесс поиска документов по их содержанию.

Документальный поиск - процесс поиска в хранилище информационно-поисковой системы первичных документов или в базе данных вторичных документов, соответствующих запросу пользователя.

Фактографический поиск - процесс поиска фактов, соответствующих информационному запросу.

Различают два вида:

  •  Документально-фактографический, заключается в поиске в документах фрагментов текста, содержащих факты.
  •  Фактологический (описание фактов), предполагающий создание новых фактографических описаний в процессе поиска путем логической переработки найденной фактографической информации.

Информационный поиск — большая междисциплинарная область науки, стоящая на пересечении когнитивной психологии, информатики, информационного дизайна, лингвистики, семиотики, и библиотечного дела.

Поиск информации — процесс выявления в массиве информации записей, удовлетворяющих заранее определенному условию поиска или запросу.

Запрос — это формализованный способ выражения информационных потребностей пользователем системы. Для выражения информационной потребности используется язык поисковых запросов, синтаксис варьируется от системы к системе. Кроме специального языка запросов, современные поисковые системы позволяют вводить запрос на естественном языке.

Объект запроса — это информационная сущность, которая хранится в базе автоматизированной системы поиска.

Поисковая система – это специальное программное обеспечение, основная цель которого – обеспечить быстрый, точный и качественный поиск информации, в частном случае, в сети Интернет.

Виды поисковых систем:

  •  Локальные, осуществляющие поиск в рамках локальных сетей или определенных ресурсов.
  •  Глобальные, предназначенные для поиска информации в сети интернет.Глобальные поисковые системы могут быть:

Универсальные. Такие ПС предоставляют своим пользователям возможность поиска любого вида контента: текстового, графического, аудио, видео.

Специализированные. Задачей данного вида ПС является поиск информации, отвечающей определенным требованиям.

Тематические. ПС такого вида осуществляют поиск лишь той информации в интернете, которая интересна определенным группам общества (религиозным, профессиональным и т.п.).

Согласно схеме на рис.1 реальными носителями информации о ресурсах, которыми располагает Сеть, являются поисковые машины (автоматические индексы) и каталоги. В силу того, что они, хотя и различными средствами, самостоятельно обеспечивают все этапы обработки информации от ее получения с узлов-первоисточников до предоставления пользователю возможности поиска, их часто называют автономными системами.

Автономные поисковые системы могут различаться по принципу отбора информации, который в той или иной степени присутствует и в алгоритме сканирующей программы автоматического индекса, и в регламенте поведения сотрудников каталога, отвечающих за регистрацию. Как правило, сравниваются два основных показателя: пространственный масштаб, в котором работает ИПС, и ее специализация.

Яндекс — поисковая машина, способная по вашему запросу найти в русскоязычной части интернета наиболее подходящие веб-страницы, новости, картинки, статьи энциклопедий или товары, дать ответ на вопрос о погоде или культурных событиях.

Поисковый алгоритм — сложная математическая модель, позволяющая поисковой системе составить поисковую выдачу, наиболее релевантную запросу пользователя. Представляет собой классический «черный ящик» с набором параметров, на входе в который задается проблема, а на выходе — ее решение.

Индекс - база данных служит хранилищем известных поисковой системе адресов сайтов и их страниц, а также всех слов, ссылок и прочей информации, на них размещенных.

Апдейт — своеобразная ревизия базы данных ПС, во время которой из нее исключаются одни и добавляются другие ресурсы и их страницы.

Закрыть от индексации поисковыми роботами все содержимое сайта или только часть информации, размещенной на нем, можно с помощью файла robots.txt и его директив:

  •  User-agent — обращение к конкретному роботу конкретнойПС.
  •  Disallow — может закрывать как сайт, так и отдельные его страницы.
  •  Host — сигнализирует роботу, под URL какого индексируется ресурс.

Поисковый робот— специальная программа, принадлежащая определенной поисковой системе и предназначенная для индексирования (занесения в базу сайтов поисковой системы) веб-сайтов и их страниц, найденных в интернет-пространстве.

Примеры поисковых запросов:

1. Поиск точнойфразы.С помощью оператора " ". Заключите фразу или слово в кавычки, и Яндекс будет искать веб-страницы, где есть ровно такая фраза (форма слова).

2. Поиск цитаты, в которой пропущено слово.Если вы забыли слово в цитате, возьмите всю цитату в кавычки, а вместо пропущенного слова поставьте звездочку *. Цитата найдется вместе с забытым словом.

3. Поиск  любого из нескольких слов.Просто перечислите все подходящие варианты через вертикальный слеш: |. Яндекс будет искать документы с любым из этих слов.

4.Поиск слова в пределах одного предложения. Используйте оператор с красивым именем «амперсанд» — &. Если соединить слова амперсандом, Яндекс найдет документы, где эти слова стоят в одном предложении.

5. Поиск документа, содержащего определённое слово. Поставьте перед нужным словом плюс, не отделяя его от слова пробелом.

6. Как исключить слово из поиска. Поставьте минус перед словом, которое вы не хотите видеть в ответах.

7. Поиск на определенном сайте. Для этого подойдет оператор site. Он позволяет прямо в запросе указать сайт, на котором нужно искать

8. Поиск документа определенного типа. Вам нужен оператор mime. Поставьте в запросе mime, двоеточие и затем тип документа, который вам нужен.

9. Поиск на сайтах на определенном языке

После lang нужно поставить двоеточие и написать, на каком языке вам нужны документы.Если это русский язык, то нужно указать ru, если украинский — uk. Белорусский язык обозначается как be, английский — en, французский — fr.


 

А также другие работы, которые могут Вас заинтересовать

26104. Культура как способ самореализации человека 14.83 KB
  Человек выступает одновременно и как субъект культуры ее творец и как объект ее воздействия. Воспитание определенного типа личности главная цель в функционировании духовной культуры. В основе функционирования всей духовной культуры лежит деятельность по производству и воспроизводству духовных ценностей а также деятельность по овладению этими ценностями.
26105. Понятие затрат, издержек и расходов. Классификация затрат для принятия управленческих решений 48 KB
  Например: швейной фабрикой был закуплен материал на 100 тыс руб. Однако находится предприятие которое согласно купить изделия из этого материала за 300 тыс руб. при этом дополнительные затраты на изготовление этой продукции составят 260 тыс руб. целесообразно ли принимать заказ Затраты в сумме 100 тыс руб произведены и не будут изменяться в зависимости от выбранного варианта решения.
26106. Классификация затрат для исчисления себестоимости 29.5 KB
  1Прямые это те затраты которые экономически обосновано напрямую включаются в себестоимость отдельного вида продукции работ услуг. Материалы могут основными и вспомогательными прямые трудовые зарплата основных производственных рабочих 2Косвенные общепроизводственные расходы их нельзя напрямую отнести на готовою продукцию они распределяются между отдельными изделиями согласно выбранной на предприятии методики пропорционально базе распределения косвенных расходов Себестоимость продукции это выраженные в денежной форме...
26107. Понятие и объекты калькулирования 32.5 KB
  Задача калькулирования определить размер затрат приходящихся на единицу продукции. фактическая отчетная калькуляция отражает совокупность всех затрат на производство и реализацию продукции. Для рациональной организации учета издержек необходимо правильно выбрать метод учета затрат и калькулирования себестоимости продукции работ услуг. Под методом учета затрат и калькулирования себестоимость понимают совокупность документирования и отражения производственных затрат обеспечивающих определение фактической себестоимости продукции а т.
26108. Попроцессный метод учета затрат на производств и калькулирование себестоимости продукции 31 KB
  Попроцессный метод учета затрат на производств и калькулирование себестоимости продукции Структура ответа: Сфера и условия применения. Особенности таких видов производства массовый тип производства непродолжительный цикл ограниченность номенклатуры выпускаемой продукции единые единицы измерения полное отсутствие либо не значительные размеры незавершенного производства.простой используется при отсутствии запасов готовой продукции на конец отчетного периода. Себестоимость = затраты за отчетный период объем произведенной продукции в...
26109. Попередельный метод учета затрат на производств и калькулирование себестоимости продукции 39.5 KB
  Объектом калькулирования продукт каждого передела. Сущность метода заключается в том что прямые затраты в текущем учете отражаются не по видам продукции а по переделам. Особенностями организации учета при этом методе является: открытие аналитических счетов к синтетическому счету 20 для каждого передела 20. Учет затрат на производство ведется без бухгалтерских записей при передаче полуфабриката из одного передела в другой.
26110. Позаказный метод учета затрат на производств и калькулирование себестоимости продукции 28 KB
  проблема распределения косвенных расходов между отдельными производственными заказами выполняемыми в отчетном периоде решается с помощью бюджетной ставки распределения косвенных расходов. Бюджетная ставка предварительный норматив который рассчитывается бухгалтерской службой накануне отчетного периода по следующему алгоритму: определяется сумма ожидаемых косвенных расходов предстоящего периода выбирается база для распределения косвенных расходов и прогнозируется ее величина. Расчет бюджетной ставки путем деления суммы прогнозируемых...
26111. Калькулирование сокращенной себестоимости по системе «директ-кост» 31.5 KB
  Общехозяйственные расходы так же исключаются из калькулирования они являются периодическими и полностью включаются в себестоимость реализованной продукции. В конце отчетного периода указанные общехозяйственные расходы списываются Д90 2 К26. Операционная прибыль = маржинальный доход постоянные расходы. в маржинальный доход включаются постоянные расходы и операционная прибыль.
26112. Анализ безубыточности производства 34 KB
  Прибыль = выручка себестоимость Прибыль = выручка совокупные переменные расходы совокупные постоянные расходы Прибыль = объем реализации цена реализации за единицу объем реализации удельные переменные совокупные постоянные Прибыль = объем реализации цена реализации за единицу удельные переменные совокупные постоянные т. точка безубыточности = 0 то Объем реализации цена реализации за единицу удельные переменные совокупные постоянные = 0 объем реализации в точке безубыточности х х = совокупные постоянные ...