8137

Обучение с использованием знаний. Логическая формулировка задачи обучения

Лекция

Информатика, кибернетика и программирование

Обучение с использованием знаний. Логическая формулировка задачи обучения Обучение с использованием знаний Рассмотрим логические связи между гипотезами, описаниями примеров и классификациями. Пусть Descriptions обозначает коньюнкцию всех описаний пр...

Русский

2013-02-04

78.5 KB

3 чел.

Обучение с использованием знаний.

Логическая формулировка задачи обучения

Обучение с использованием знаний

Рассмотрим логические связи между гипотезами, описаниями примеров и классификациями. Пусть Descriptions обозначает коньюнкцию всех описаний примеров в обучающем множестве, а Classifications – коньюнкцию всех классификаций примеров. В таком случае гипотеза, которая позволяет “объяснить результаты наблюдений”, должна удовлетворять следующему свойству:

Hypothesis & Descriptions |= Classifications

Связь такого рода называется ограничением логического следствия, в котором Hypothesis представляет собой “неизвестное”. Например, если дерево решений рассматривается как логическая формула, то дерево решений, совместимое со всеми примерами, удовлетворяет данному уравнению.

Современный подход состоит в том, что должны проектироваться агенты, которые уже что-то знают и пытаются освоить в процессе обучения некоторую дополнительную информацию. Схема, которая показывает, как в процессе обучения с накоплением знаний используется и со временем обогащается запас фоновых знаний, изображена на рис. 4.

Рис. 4

Агент может начать свое существование без какого-либо запаса знаний, осуществляя индуктивные выводы в условиях отсутствия знаний. В дальнейшем агент должен использовать свои фоновые знания для все более эффективного обучения. Вопрос заключается в том, как фактически следует использовать знания в обучении.

Рассмотрим общеизвестные примеры обучения на основе фоновых знаний.

1. В первом примере пещерный человек поджаривает на огне ящерицу, насаженную на заостренную палочку. За ним наблюдает и обучается толпа соплеменников, которые до сих пор разогревали пищу над огнем, держа ее голыми руками.

2. Во втором примере путешественник, прибывший в Бразилию, встречает первого в своей жизни бразильца. Услышав от него речь на португальском языке, путешественник делает вывод, что бразильцы говорят на португальском, но узнав, что его собеседника зовут Фернандо, он не делает вывод, что все бразильцы носят это же имя. Аналогичный пример из научной области: когда студент-физик измеряет плотность и проводимость медного образца при определенной температуре, он обобщает эти данные на все предметы из меди. Но измерив массу этого образца, студент не рассматривает гипотезу, что все предметы из меди имеют такую же массу, хотя он может сделать такое обобщение относительно всех монет одинакового достоинства.

3. Следующий пример: студент-медик присутствует на консультации, которую дает пациенту опытный терапевт. После ряда вопросов и ответов специалист сообщает пациенту, чтобы он прошел курс лечения конкретным антибиотиком. Студент-медик делает вывод, что данный антибиотик является эффективным средством лечения при данном конкретном типе инфекции.

В данных примерах использование фоновых знаний обеспечивает гораздо более быстрое обучение по сравнению с тем, чего можно ожидать при использовании метода чисто индуктивного обучения.

Рассмотрим какие ограничения приведенного выше логического следствия применяются в каждом из этих случаев. В таких ограничениях, кроме гипотезы, описаний наблюдаемых примеров и классификации, применяются фоновые знания Backgraund.

В первом примере используется обобщение, получившее название обучения на основе объяснения (EBLExplanation-Based Learning). Здесь общее правило следует логически из фоновых знаний, которыми обладают пещерные люди:

Hypothesis & Descriptions |= Classifications

Backgraund |= Hypothesis

Во втором примере априорные знания Backgraund касаются релевантности множества характеристик по отношению к целевому предикату. Эти знания, наряду с результатами наблюдений, позволяют агенту вывести новое, общее правило, которое объясняет результаты наблюдений, следующим образом:

Hypothesis & Descriptions |= Classifications

Backgraund &Descriptions & Classifications |= Hypothesis

Обобщение такого рода называется обучением с учетом релевантности (RBLRelevance-Based Learning).

В третьем примере для объяснения примеров объединяются фоновые знания и новая гипотеза:

Backgraund & Hypothesis & Descriptions |= Classifications

Как и при чисто индуктивном обучении, алгоритм обучения должен выдвигать гипотезы, которые являются как можно более простыми и совместимыми с данным ограничением. Такие алгоритмы называются алгоритмами индуктивного обучения на основе знаний (KBILKnowledge-Based Inductive Learning).

Логическая формулировка задачи обучения

Для создания логической формулировки задачи обучения гипотеза представляется в виде множества логических высказываний. Описания примеров и определения классов также заданы в виде логических высказываний, а классификация нового примера может быть выполнена путем логического вывода классификационного высказывания из гипотезы и описания примера. Такой подход обеспечивает инкрементное формирование гипотез и дает возможность использовать априорные знания, так как уже известные высказывания могут помочь при классификации новых примеров.

Рассмотрим логическую формулировку задачи обучения на примере задачи обучения с рестораном, в которой требуется изучить правило принятия решения о том, при каких условиях следует ждать освобождения столика. В логической формулировке задачи атрибуты становятся унарными предикатами. Пусть Xi – обозначение i-го примера. Каждый пример может быть описан с помощью примерно таких высказываний:

Alternate(Xi)&¬Bar(Xi)&¬Fri/Sat(Xi)&Hungry(Xi)& …

Полное обучающее множество представляет собой коньюнкцию всех описательных и классификационных высказываний.

Целью индуктивного обучения в логической постановке задачи является поиск эквивалентного логического выражения для целевого предиката Q, который может использоваться для правильной классификации примеров. Подобное выражение – потенциальное определение целевого предиката – предлагается в каждой гипотезе. Используя Ci для обозначения потенциального определения, можно утверждать, что каждая гипотеза Hi представляет собой высказывание в форме  x Q(x)  Ci(x). В частности, дерево решений представляет собой утверждение, что целевой предикат принимает истинное значение по отношению к какому-то объекту тогда и только тогда, когда выполняются условия в одной из ветвей, ведущих к листовому узлу со значением true. Таким образом, на рис. 4 в графической форме выражено следующее логическое определение Hr:

r WillWait(r) Patrons(r,Some)

 or Patrons(r,Full)&WaitEstimate(r,0-10)

 or Patrons(r,Full)&WaitEstimate(r,30-60)&

   ¬Alternate(r)&Reservation(r)

 or Patrons(r,Full)&WaitEstimate(r,30-60)&

   ¬Alternate(r)&¬Reservation(r)&Bar(r)

 or Patrons(r,Full)&WaitEstimate(r,30-60)&

   Alternate(r)&Fri/Sat(r)

 or Patrons(r,Full)&WaitEstimate(r,10-30)&¬Hungry(r)

 or Patrons(r,Full)&WaitEstimate(r,10-30)&Hungry(r)&

   ¬Alternate(r)

 or Patrons(r,Full)&WaitEstimate(r,10-30)&Hungry(r)&

   Alternate(r)&Raining(r)

Каждая гипотеза предсказывает, что некоторое множество примеров, соответствующих ее потенциальному определению, будет представлять собой примеры целевого предиката. Такое множество называется расширением предиката. Две гипотезы с разными расширениями логически несовместимы и две гипотезы, имеющие одно и то же расширение, логически эквивалентны.

Алгоритм обучения позволяет утверждать, что одна из гипотез является правильной, т.е. что истинно следующее высказывание:

H1 or H2 or H3 or … or Hn

По мере поступления новых примеров появляется возможность исключать гипотезы, не совместимые с этими примерами. Примеры могут быть двух видов по отношению к гипотезе. Пример ложно отрицателен, если гипотеза утверждает, что он должен быть отрицательным, а он фактически положителен. Пример ложно положителен для данной гипотезы, если в гипотезе утверждается, что он должен быть положительным, но фактически он является отрицательным. Если некоторый пример является ложно положительным или ложно отрицательным применительно к некоторой гипотезе, то данный пример и данная гипотеза являются логически несовместимыми друг с другом, что и позволяет исключить данную гипотезу. Операция исключения гипотезы полностью аналогична операции применения правила резолюции в логическом выводе. Дизьюнкция гипотез соответствует выражению, а пример соответствует литералу, который взаимно уничтожается с одним из литералов выражения. Например, если пример I1 несовместим с выражениями H2 и H3, а пространство гипотез представляет собой высказывание H1 or H2 or H3 or H4, то система логического вывода сформирует новое высказывание H1 or H4, соответствующее уточненному пространству гипотез.

Таким образом, индуктивное обучение в логической постановке задачи есть процесс постепенного устранения гипотез, несовместимых с примерами. Но поскольку пространство гипотез велико (бесконечно для логики первого порядка), то обычно система обучения не создается с использованием доказательства на основе резолюции и полного перебора пространства гипотез.


Апр
иорные знания

Гипотезы

Индуктивное

обучение на основе знаний

Наблюдения

Предсказания


 

А также другие работы, которые могут Вас заинтересовать

46837. Independent elements of the sentence 32.5 KB
  Independent elements of the sentence s the term implies generlly re not grmmticlly dependent on ny prticulr prt of the sentence but s rule refer to the sentence s whole. Only occsionlly they my refer to seprte prt of the sentence. Its position is more free thn tht of ny other prts of the sentence nd ccordingly it my occur in different positions in the sentence.
46840. Специфика обучения в дошкольном возрасте 32.5 KB
  Обучение и развитие в дошкольном возрасте С развитием ребенка меняется и характер обучения ребенка. Кро говорит о ребенке 3 лет: уже становится возможным какаято программа обучения и воспитания не школьная программа а программа самого ребенка. Раньше определенного возраста ребенка бесполезно обучать например держать ложку а позже определенного возраста это делать просто бесполезно. В педологии пользуются только нижней границей ниже известного уровня нельзя ребенка обучать тому или ному предмету.
46842. Grammar. Grammatical meaning 32.5 KB
  When we name very general statements about grammar, we are idealizing about the language system, identifying broad patterns. grammar has evolved to fossilitate the expression of basic meanings. Meanings which are so inexpensible and so commonly occuring, that we require an economical means of expressing them. It would be absurd if we had to elaborate entirely new strings of words whenever we wanted to observe things around us. grammatical meaning is closely
46843. Основные принципы построения закладываемые при создании вычислительных систем 32.83 KB
  Вычислительная система ВС совокупность взаимосвязанных и взаимодействующих процессоров или ЭВМ периферийного оборудования и программного обеспечения предназначенную для сбора хранения обработки и распределения информации. Телекоммуникационная вычислительная сеть ТВС это сеть о6мена и распределенной обработки информации образуемая множеством взаимосвязанных абонентских систем и средствами связи; средства передачи и обработки информации ориентированы в ней на коллективное использование общесетевых ресурсов аппаратных...
46844. Творчество Н.М.Карамзина, повести 33 KB
  Карамзин представитель сентиментализма в России всязи с этим новизной его прозы являются: 1. Карамзин ввел в русскую литературу целый ряд важных тем. Идеологические аспекты дружбы важные для Радищева отходят у Карамзина на второй план. Карамзин сумел показать атмосферу детства навсегда ушедшую из души взрослого человека но в чемто и оставшуюся притягательную и желанную.
46845. Роль и место текстологии в процессах редакционно-издательской деятельности 33 KB
  текста 2 проверки его по первоисточникам и устранения в нем погрешностей ошибок произвольных изменений внесенных вопреки воле и замыслу автора. текста напр. текста аппарата издания. Но он не может быть признан основным чисто механически; для этого требуется изучение всех источников текста обстоятельств жизни автора всей истории текста и т.