21707

Разделы модуля «Базовые понятия. Методы извлечения знаний»

Лекция

Информатика, кибернетика и программирование

Методы извлечения знаний [1] История и этапы развития искусственного интеллекта [2] Подходы к созданию систем искусственного интеллекта [3] Искусственный интеллект в России [4] Направления развития искусственного интеллекта [5] Основные определения [6] Методы извлечения знаний [7] Классификация методов извлечения знаний [8] Пассивные методы [9] Наблюдения [10] Анализ протоколов мыслей вслух [11] Лекции [12] Активные методы [13] Активные индивидуальные методы [14] Анкетирование [15] Интервью [16] Свободный диалог [17] Активные групповые методы...

Русский

2013-08-03

368 KB

2 чел.

Разделы модуля «Базовые понятия. Методы извлечения знаний»

[1] История и этапы развития искусственного интеллекта

[2] Подходы к созданию систем искусственного интеллекта

[3] Искусственный интеллект в России

[4] Направления развития искусственного интеллекта

[5] Основные определения

[6] Методы извлечения знаний

[7] Классификация методов извлечения знаний

[8] Пассивные методы

[9] Наблюдения

[10] Анализ протоколов "мыслей вслух"

[11] Лекции

[12] Активные методы

[13] Активные индивидуальные методы

[14] Анкетирование

[15] Интервью

[16] Свободный диалог

[17] Активные групповые методы

[18] Метод круглого стола

[19] Мозговой штурм

[20] Экспертные ролевые игры

[21] Текстологические методы

[22] Подготовка к проведению экспертизы

  1.  История и этапы развития искусственного интеллекта

Идея создания искусственного подобия человека для решения сложных задач и моделирования человеческого разума витала в воздухе еще в древнейшие времена. Так, в древнем Египте была создана «оживающая» механическая статуя бога Амона. У Гомера в «Илиаде» бог Гефест ковал человекоподобные существа-автоматы. В литературе эта идея обыгрывалась многократно: от Галатеи Пигмалиона до Буратино папы Карло. Однако родоначальником искусственного интеллекта считается средневековый испанский философ, математик и поэт Раймонд Луллий, который еще в XIII веке попытался создать механическую машину для решения различных задач на основе разработанной им всеобщей классификации понятий.

Позже Лейбниц и Декарт независимо друг от друга продолжили эту идею, предложив универсальные языки классификации всех наук. Эти работы можно считать первыми теоретическими работами в области искусственного интеллекта.

Окончательное рождение искусственного интеллекта как научного направления произошло только после создания ЭВМ в 40-х гг. ХХ века. В это же время Норберт Винер создал свои основополагающие работы по новой науке — кибернетике.

Термин «искусственный интеллект» — ИИ — (AI — artificial intelligence) был предложен в 1956 г. на семинаре с аналогичным названием в Дартсмутском колледже (США). Семинар был посвящен разработке методов решения логических, а не вычислительных задач. В английском языке данное словосочетание не имеет той слегка фантастической антропоморфной окраски, которую оно приобрело в довольно неудачном русском переводе. Слово intelligence означает «умение рассуждать разумно», а вовсе не «интеллект», для которого есть английский аналог: intellect.

Вскоре после признания искусственного интеллекта отдельной областью науки произошло разделение его на два направления: нейрокибернетика и «кибернетика черного ящика». Эти направления развиваются практически независимо, существенно различаясь как в методологии, так и в технологии. И только в настоящее время стали заметны тенденции к объединению этих частей вновь в единое целое.

  1.  Подходы к созданию систем искусственного интеллекта

В основу этого подхода положен принцип, противоположный нейрокибернетике. Не имеет значения, как устроено «мыслящее» устройство. Главное, чтобы на заданные входные воздействия оно реагировало так же, как человеческий мозг.

Сторонники этого направления мотивировали свой подход тем, что человек не должен слепо следовать природе в своих научных и технологических поисках. Вспомним, что колеса в природе нет. К тому же пограничные науки о человеке не смогли внести существенного теоретического вклада, объясняющего, хотя бы приблизительно, как протекают интеллектуальные процессы у человека, как устроена память и как человек познает окружающий мир.

Это направление искусственного интеллекта было ориентировано на поиски алгоритмов решения интеллектуальных задач на существующих моделях компьютеров. Существенный вклад в становление новой науки внесли ее пионеры: Маккарти, Минский, Ньюэлл, Саймон, Шоу, Хант и др.

В 1956-63 гг. велись интенсивные поиски моделей и алгоритмов человеческого мышления и разработка первых программ на их основе. Представители существующих гуманитарных наук — философы, психологи, лингвисты — ни тогда, ни сейчас не в состоянии были предложить такие алгоритмы. Тогда кибернетики начали создавать собственные модели. Так последовательно были созданы и опробованы различные подходы.

1. В конце 50-х гг. родилась модель лабиринтного поиска. Этот подход представляет задачу как некоторое пространство состояний в форме графа, и в этом графе проводится поиск оптимального пути от входных данных к результирующим. Была проделана большая работа по разработке этой модели, но для решения практических задач эта идея не нашла широкого применения.

2. Начало 60-х — это эпоха эвристического программирования. Эвристика — правило, теоретически не обоснованное, которое позволяет сократить количество переборов в пространстве поиска. Эвристическое программирование — разработка стратегии действий на основе известных, заранее заданных эвристик.

3. В 1963-70 гг. к решению задач стали подключать методы математической логики. Робинсон разработал метод резолюций, который позволяет автоматически доказывать теоремы при наличии набора исходных аксиом. Примерно в это же время выдающийся отечественный математик Ю.С.Маслов предложил так называемый обратный вывод, впоследствии названный его именем, решающий аналогичную задачу другим способом. На основе метода резолюций француз Альбер Кольмероэ в 1973 г. создает язык логического программирования ПРОЛОГ. Большой резонанс имела программа «Логик-теоретик», созданная Ньуэллом, Саймоном и Шоу, которая доказывала школьные теоремы. Однако большинство реальных задач не сводится к набору аксиом, и человек, решая производственные задачи, не использует классическую логику, поэтому логические модели при всех своих преимуществах имеют существенные ограничения по классам решаемых задач

4. История искуственного интеллекта полна драматических событий, одним из которых стал в 1973 г. так называемый «доклад Лайтхилла», который был подготовлен в Великобритании по заказу Британского совета научных исследований. Известный математик Лайтхилл, никак с искусственным интеллектом профессионально не связанный, подготовил обзор состояния дел в этой области. В докладе были признаны определенные достижения, однако их уровень определялся как разочаровывающий, и общая оценка была отрицательной с позиций практической значимости. Этот отчет отбросил европейских исследователей примерно на пять лет назад, так как финансирование работ существенно сократилось.

5. Примерно в это же время существенный прорыв в развитии практических приложений искусственного интеллекта произошел в США, когда в середине 70-х гг. на смену поискам универсального алгоритма мышления пришла идея моделировать конкретные знания специалистов-экспертов. В США появились первые коммерческие системы, основанные на знаниях, или экспертные системы (ЭС). Стал применяться новый подход к решению задач искусственного интеллекта — представление знаний. Созданы MYCIN и DENDRAL, ставшие уже классическими, две первые экспертные системы для медицины и химии. Существенный финансовый вклад вносит Пентагон, предлагая базировать новую программу министерства обороны США на принципах искусственного интеллекта. Уже вдогонку упущенных возможностей Европейский Союз в начале 80-х объявляет о глобальной программе развития новых технологий ESPRIT, в которую включена проблематика искусственного интеллекта.

6. В конце 70-х в гонку включается Япония, объявив о начале проекта машин V поколения, основанных на знаниях. Проект был рассчитан на десять лет и объединял лучших молодых специалистов крупнейших японских компьютерных корпораций. Для этих специалистов был создан специально новый институт ICOT, и они получили полную свободу действий, правда, без права публикации предварительных результатов. В результате они создали достаточно громоздкий и дорогой символьный процессор, программно реализующий ПРОЛОГо-подобный язык, не получивший широкого признания. Однако положительный эффект этого проекта был очевиден. В Японии появилась значительная группа высококвалифицированных специалистов в области искуственного интеллекта, которая добилась существенных результатов в различных прикладных задачах. К середине 90-х гг. японская ассоциация искусственного интеллекта насчитывает 40 тысяч человек.

7. Нейрокибернетика. Основную идею этого направления можно сформулировать следующим образом: единственный объект, способный мыслить, — это человеческий мозг, поэтому любое мыслящее устройство должно каким-то образом воспроизводить его структуру. Таким образом, нейрокибернетика ориентирована на программно-аппаратное моделирование структур, подобных структуре мозга. Усилия нейрокибернетики были сосредоточены на создании элементов, аналогичных нейронам, и их объединении в функционирующие системы, т.е. в нейронные сети.

Первые нейросети были созданы в 1956-65 гг. Это были не очень удачные попытки создать системы, моделирующие человеческий глаз и его взаимодействие с мозгом. Постепенно в 1970-80 гг. количество работ по этому направлению искусственного интеллекта стало снижаться. Слишком неутешительны были первые результаты. Авторы объясняли неудачи малой памятью и низким быстродействием существующих в то время компьютеров.

Однако в Японии в рамках проекта «ЭВМ V поколения» был создан первый нейрокомпьютер, или компьютер VI поколения. К этому времени ограничения по памяти и быстродействию были практически сняты. Появились транспьютеры — параллельные компьютеры с большим количеством процессоров.

Транспьютерная технология — это только один из десятка новых подходов к аппаратной реализации нейросетей, которые моделируют иерархическую структуру мозга человека.

Сегодня можно выделить три подхода к созданию нейросетей: аппаратный (создание специальных компьютеров, нейрочипов, плат расширения, наборов микросхем); программный (создание программ и инструментариев, рассчитанных на высокопроизводительные компьютеры; сети создаются в памяти компьютера, всю работу выполняют его собственные процессоры); гибридный (комбинации первых двух).

Начиная с середины 1980-х гг., повсеместно происходит коммерциализация искусственного интеллекта. Растут ежегодные капиталовложения, создаются промышленные экспертные системы. Растет интерес к самообучающимся системам. Издаются десятки научных журналов, ежегодно собираются международные и национальные конференции по различным направлениям искусственного интеллекта.

В настоящее время искусственный интеллект становится одной из наиболее перспективных и престижных областей информатики. Количество работ в этой области, начиная с 2001 года, интенсивно растет, появляются новые направления, технологии. В различных сферах деятельности интеллектуальные системы, приборы, устройства становятся привычным делом.

  1.  Искусственный интеллект в России 

В 1954 г. в МГУ начал работу семинар «Автоматы и мышление» под руководство академика А.А.Ляпунова (1911-1973), одного из основателей российской кибернетики. В этом семинаре принимали участие физиологи, лингвисты, психологи, математики. Принято считать, что именно в это время родился искусственный интеллект в России. Как и за рубежом, выделились два основных направления — нейрокибернетики и кибернетики «черного ящика».

В 1954—64 гг. создаются отдельные программы и проводятся исследования в области поиска решения логических задач. В ЛОМИ — Ленинградское отделение Математического института им. Стеклова —- создается программа АЛПЕВ ЛОМИ, автоматически доказывающая теоремы. Она основана на оригинальном обратном выводе Маслова, аналогичном методу резолюций Робинсона. Среди наиболее значимых результатов, полученных отечественными учеными в 60-е гг., следует отметить алгоритм «Кора» М.М.Бонгарда, моделирующий деятельность человеческого мозга при распознавании образов. Большой вклад в становление российской школы искусственного интеллекта внесли выдающиеся ученые М.Л.Цетлин, В.Н.Пушкин, М.А.Гаврилов, чьи ученики и явились пионерами этой науки в России.

В 1965-80 гг. происходит рождение нового направления — ситуационного (соответствует представлению знаний, в западной терминологии). Основателем этой научной школы стал проф. Д.А.Поспелов. Были разработаны специальные модели представления ситуаций — представления знаний.

При том что отношение к новым наукам в советской России всегда было настороженное, наука с таким «вызывающим» названием тоже не избежала этой участи и была встречена в Академии наук в штыки. К счастью, даже среди членов Академии наук СССР нашлись люди, не испугавшиеся столь необычного словосочетания в качестве названия нового научного направления.

Только в 1974 г. при Комитете по системному анализу при президиуме АН СССР был создан научный Совет по проблеме «Искусственный интеллект», его возглавил Г.С.Поспелов.

По инициативе Совета было организовано пять комплексных научных проектов, которые были возглавлены ведущими специалистами в данной области: «Диалог» (работы по пониманию естественного языка), «Ситуация» (ситуационное управление), «Банк» (банки данных), «Конструктор» (поисковое конструирование), «Интеллект робота».

В 1980-90 гг. проводятся активные исследования в области представления знаний, разрабатываются языки представления знаний, экспертные системы. В МГУ создается язык РЕФАЛ.

В 1988 г. создается АИИ — Ассоциация искусственного интеллекта, президентом единогласно избирается Д.А.Поспелов, выдающийся ученый, чей вклад в развитие искусственного интеллекта в России трудно переоценить. В рамках Ассоциации проводится большое количество исследований, организуются школы для молодых специалистов, семинары, симпозиумы, раз в два года собираются объединенные конференции, издается научный журнал.

Уровень теоретических исследований по искусственному интеллекту в России ничуть не ниже мирового. К сожалению, начиная с 80-х гг. на прикладных работах начинает сказываться постепенное отставание в технологии.

На данный момент отставание в области разработки промышленных интеллектуальных систем составляет порядка 10-15 лет по разным направлениям искусственного интеллекта.

  1.  Направления развития искусственного интеллекта 

Искусственный интеллект - это одно из направлений информатики, цель которого разработка аппаратно-программных средств, позволяющих пользователю-непрограммисту ставить и решать свои задачи, традиционно считающиеся интеллектуальными, общаясь с ЭВМ на ограниченном подмножестве естественного языка.

Представление знаний и разработка систем, основанных на знаниях

Это основное направление искусственного интеллекта. Оно связано с разработкой моделей представления знаний, созданием баз знаний, образующих ядро экспертных систем (ЭС). В последнее время включает в себя модели и методы извлечения и структурирования знаний и сливается с инженерией знаний (см. гл. 17).

Игры и творчество

Традиционно искусственный интеллект включает в себя игровые интеллектуальные задачи - шахматы, шашки, го. В основе лежит один из ранних подходов - лабиринтная модель плюс эвристики. Сейчас это скорее коммерческое направление, так как в научном плане эти идеи считаются тупиковыми.

Разработка естественноязыковых интерфейсов и машинный перевод

В 50-х п. одной из популярных тем исследований искусственного интеллекта являлась область машинного перевода. Первая программа в этой области - переводчик с английского языка на русский. Первая идея - пословный перевод, оказалась неплодотворной. В настоящее время используется более сложная модель, включающая анализи синтез естественно-языковых сообщений, которая состоит из нескольких блоков. Для анализа это:

морфологический анализ - анализ слов в тексте;

синтаксический анализанализ предложений, грамматики и связей между словами;

семантический анализ - анализ смысла каждого предложения на основе некоторой предметно-ориентированной базы знаний;

прагматический анализ - анализ смысла предложений в окружающем контексте на основе собственной базы знаний. Синтез включает аналогичные этапы, но несколько в другом порядке,

Распознавание образов

Традиционное направление искусственного интеллекта, берущее начало у самых его истоков. Каждому объекту ставится в соответствие матрица признаков, по которой происходит ею распознавание. Это направление близко к машинному обучению, тесно связано с нейрокибернетикой.

Новые архитектуры компьютеров

Это направление занимается разработкой новых аппаратных решений и архитектур, направленных на обработку символьных и логических данных. Создаются Пролог- и Лисп-машины, компьютеры V и VI поколений. Последние разработки посвящены компьютерам баз данных и параллельным компьютерам.

Интеллектуальные роботы

Роботы - это электромеханические устройства, предназначенные для автоматизации человеческого труда.

Идея создания роботов исключительно древняя. Само слово появилось в 20-х гг. Его автор - чешский писатель Карел Чапек. Со времени создания сменилось несколько поколений роботов.

Роботы с жесткой схемой управления. Практически все современные промышленные роботы принадлежат к первому поколению. Фактически это программируемые манипуляторы.

Адаптивные роботы с сенсорными устройствами. Есть образцы таких роботов, но в промышленности они пока не используются.

Самоорганизующиеся, или интеллектуальные, роботы. Это конечная цель развития робототехники. Основная проблема при создании интеллектуальных роботов - проблема машинного зрения-

В настоящее время в мире изготавливается более 60 тыс. роботов в год.

Специальное программное обеспечение

В рамках этого направления разрабатываются специальные языки для решения задач невычислительного плана. Эти языки ориентированы на символьную обработку информации - LISP, PROLOG, SMALLTALK, РЕФАЛ и др. Помимо этого создаются пакеты прикладных программ, ориентированные на промышленную разработку интеллектуальных систем, или программные инструментарии искусственного интеллекта, например KEE, ARTS[10].Достаточно популярно создание так называемых пустых экспертных систем, или "оболочек", - BXSYS, Ml и др., в которых можно наполнять базы знаний, создавая различные системы.

Обучение и самообучение

Активно развивающаяся область искусственного интеллекта. Включает модели, методы и алгоритмы, ориентированные на автоматическое накопление знаний на основе анализа и обобщения данных. Включает обучение по примерам (или индуктивное), а также традиционные подходы распознавания образов.

  1.  Основные определения 

Данные и знания

При изучении интеллектуальных систем традиционно возникает вопрос - что же такое знания и чем они отличаются от обычных данных, десятилетиями обрабатываемых ЭВМ. Можно предложить несколько рабочих операций, в рамках которых это становится очевидным.

Данные - это отдельные факты, характеризующие объекты, процессы и явления в предметной области, а также их свойства.

При обработке на ЭВМ данные трансформируются, условно проходя следующие этапы:

  •  данные как результат измерений и наблюдений;
  •  данные на материальных носителях информации (таблицы, протоколы, справочники;
  •  модели (структуры) данных в виде диаграмм, графиков, функций;
  •  данные в компьютере на языке описания данных;
  •  базы данных на машинных носителях.

Знания связаны с данными, основываются на них, но представляют результат мыслительной деятельности человека, обобщают его опыт, полученный в ходе выполнения какой-либо практической деятельности. Они получаются эмпирическим путем.

Знания - это выявленные закономерности предметной области (принципы, связи, законы), позволяющие решать задачи в этой области. При обработке на ЭВМ знания трансформируются аналогично данным:

  •  знания в памяти человека как результат мышления;
  •  материальные носители знаний (учебники, методические пособия);
  •  поле знаний - условное описание основных объектов предметной области, их атрибутов и закономерностей, их связывающих;
  •  знания, описанные на языках представления знаний (продукционные языки, семантические сети, фреймы - см. далее);
  •  базы знаний.

Часто используются такие определения знаний:

знания - это хорошо структурированные данные, или данные о данных, или метаданные.

Существует множество способов определять понятия. Один из широко применяемых способов, основан на идее интенсионала. Интенсионал понятия - это определение через понятие более высокого уровня абстракции с указанием специфических свойств. Этот способ определяет знания. Другой способ определяет понятие через перечисление понятий более низкого уровня иерархии или фактов, относящихся к определяемому. Это есть определение через данные, или экстенсионал понятия.

Знания могут быть классифицированы по следующим категориям:

поверхностные - знания о видимых взаимосвязях между отдельными событиями и фактами в предметной области;

глубинные - абстракции, аналогии, схемы, отображающие структуру и процессы в предметной области.

Современные экспертные системы работают в основном споверхностными знаниями. Это связано с тем, что на данный момент нет адекватных моделей, позволяющих работать с глубинными знаниями.

Кроме того, знания можно разделить на процедурные и декларативные. Исторически первичными были процедурные знания, т.е. знания, "растворенные" в алгоритмах. Они управляли данными. Для их изменения требовалось изменять программы. Однако с развитием искусственного интеллекта приоритет данных постепенно изменялся, и все большая часть знаний сосредоточивалась в структурах данных (таблицы, списки, абстрактные типы данных), т.е. увеличивалась роль декларативных знаний.

Сегодня знания приобрели чисто декларативную форму, т.е. знаниями считаются предложения, записанные на языках представления знаний, приближенных к естественному и понятных неспециалистам.

Существуют десятки моделей (или языков) представления знаний для различных предметных областей. Большинство из них может быть сведено к следующим классам:

продукционные; семантические сети; фреймы; формальные логические модели и мноие другие. Эти и другие модели мы рассмотрим в следующих разделах курса

Стратегии получения знаний

Существует несколько стратегий получения знаний. Наиболее распространенные:

  •  приобретение;
  •  извлечение;
  •  формирование.

Под приобретением знаний понимается способ автоматизированного построения базы знаний посредством диалога эксперта и специальной программы (при этом структура знаний заранее закладывается в программу). Эта стратегия требует существенной предварительной проработки предметной области. Системы приобретения знаний действительно приобретают готовые фрагменты знаний в соответствии со структурами, заложенными разработчиками систем. Большинство этих инструментальных средств специально ориентировано на конкретные экспертные системы с жестко обозначенной предметной областью и моделью представления знаний, т.е. не являются универсальными.

Термин извлечение знаний касается непосредственного живого контакта инженера по знаниям и источника знаний. Авторы склонны использовать этот термин как более емкий и более точно выражающий смысл процедуры переноса компетентности эксперта через инженера по знаниям в базу знаний экспертной системы.

Термин формирование знаний традиционно закрепился за чрезвычайно перспективной и активно развивающейся областью инженерии знаний, которая занимается разработкой моделей, методов и алгоритмов анализа данных для получения знаний и обучения. Эта область включает индуктивные модели формирования гипотез на основе обучающих выборок, обучение по аналогии и другие методы.

  1.  Методы извлечения знаний 
    1.  Классификация методов извлечения знаний

Извлечение знаний - то процедура взаимодействия эксперта с источником знаний, в результате которой становятся явными процесс рассуждений специалистов при принятии решения и структура их представлений о предметной области.

Изложим классификацию методов извлечения знаний, которая может помочь, в зависимости от конкретной задачи и ситуации, выбрать конкретный метод.

Разделение этих групп методов на верхнем уровне классификации не означает их антагонистичности, обычно инженер по знаниям комбинирует различные методы, например, сначала изучает литературу, затем беседует с экспертами, или наоборот.

Рисунок  Классификация методов извлечения знаний.

Основной принцип деления связан с источником знаний. Коммуникативные методы охватывают все виды контактов с живым источником знаний - специалистами и экспертами, а текстологические касаются методов извлечения знаний из документов (методик, пособий, руководств) и специальной литературы (статей, монографий, учебников). Обычно аналитик комбинирует различные методы.

Коммуникативные методы, в свою очередь, можно разделить на две группы.

Пассивные методы подразумевают, что ведущая роль в процедуре извлечения передается эксперту, а аналитик только протоколирует рассуждения эксперта во время его реальной работы по принятию решений или записывает то, что эксперт считает нужным самостоятельно рассказать в форме лекции.

В активных методах, напротив, инициатива переходит к аналитику, который активно контактирует с экспертом - в играх, диалогах, беседах "за круглым столом" и т. д.

Следует подчеркнуть, что и активные, и пассивные методы могут чередоваться даже в рамках одного сеанса извлечения знаний. Например, если аналитик застенчив и не имеет большого опыта, то вначале он может использовать пассивные методы, а постепенно, ближе знакомясь с экспертом, захватывать инициативу и переходить в "наступление".

Пассивные методы на первый взгляд просты, но на самом деле требуют от аналитика умения четко анализировать "поток сознания" эксперта и выявлять в нем значимые фрагменты знаний. Отсутствие обратной связи (пассивность аналитика) значительно ослабляет эффективность этих методов, чем и объясняется то, что обычно они играют вспомогательную роль. Пассивные методы подразумевают, что ведущая роль в процедуре извлечения знаний как бы передается эксперту, а инженер по знаниям только протоколирует рассуждения эксперта во время его реальной работы по принятию решений или записывает то, что эксперт считает нужным самостоятельно рассказать в форме лекции. В активных методах, напротив, инициатива полностью в руках инженера по знаниям, который активно контактирует с экспертом различными способами - в играх, диалогах, беседах за "круглым столом" и т.д.

Активные методы можно разделить на две группы в зависимости от числа экспертов-специалистов. Если экспертов больше одного, то целесообразно, помимо серии индивидуальных контактов с каждым, применять и методы групповой работы. Такие групповые методы обычно активизируют мышление участников дискуссий и позволяют выявлять весьма нетривиальные аспекты их знаний. В свою очередь, индивидуальные методы на сегодняшний день остаются ведущими, поскольку столь деликатная процедура, как "отъем знаний", не терпит лишних свидетелей.

О выборе метода

На выбор метода влияют три фактора: личностные особенности аналитика и эксперта и характеристика предметной области.

Одна из возможных классификаций людей по психологическим характеристикам выделяет три их типа:

  •  мыслитель (познавательный тип);
  •  собеседник (эмоционально-коммуникативный тип);
  •  практик (практический тип).

Мыслители ориентированы на интеллектуальную работу, учебу, теоретические обобщения и обладают аналитическим способностями. Собеседники - это общительные, открытые люди, готовые к сотрудничеству. Практики предпочитают действие разговорам, хорошо реализуют замыслы других, направлены на результативность работы. В соответствии с этой классификацией практикующий аналитик может подобрать для себя наиболее подходящие методы.

Для характеристики моделируемых знаний можно предложить следующую классификацию:

  •  хорошо документированные;
  •  среднедокументированные;
  •  слабодокументированные.

Эта классификация связана с соотношением двух видов знаний Z1 и Z2, где Z1 - это экспертное "личное" знание, a Z2 - материализованное в документах "общее" знание в данной конкретной области.

Кроме этого, бизнес-процессы, характеризующие деятельность предприятия, можно разделить по критерию структурированности знаний. Под структурированностью будем понимать степень выявленности основных закономерностей и принципов, действующих в данной предметной области.

По степени структурированности знаний предметные области могут быть:

  •  хорошо структурированными - с четкими определениями, устоявшейся технологией и терминологией;
  •  среднеструктурированными - с определившейся терминологией, развивающейся технологией, явными взаимосвязями между процессами;
  •  слабоструктурированными - с размытыми определениями, часто меняющейся структурой, скрытыми взаимосвязями, с большим количеством "белых пятен".

Приведенные классификации методов и предметных областей помогут разработчикам ИС, четко определив свою предметную область, соотнести ее с предложенными типами и наметить подходящий метод или группу методов извлечения знаний. Заметим, однако, скорее всего, реальная работа полностью зачеркнет его выбор, и окажется, что хорошо документированная область на самом деле - слабо документированная, а метод наблюдений надо срочно заменять играми!

Так же достаточно широко в настоящее время используются игровые методы в социологии, экономике, менеджменте, педагогике, для подготовки руководителей и политиков. Игра - это особая форма деятельности и творчества, где человек раскрепощается и чувствует себя свободнее, чем в обычной трудовой деятельности.

Рассмотрим подробнее все выделенные группы методов и особенности их применения на практике

  1.  Пассивные методы

Название "пассивные" не должно вызывать иллюзий, поскольку этот термин введен как противовес к "активным" методам. В реальности же пассивные методы требуют от инженера по знаниям не меньшей отдачи, чем такие активные методы, как игры и диалог. Согласно классификации приведенной на рисунке к этой группе относятся:

  •  наблюдения;
  •  анализ протоколов "мыслей вслух";
  •  лекции.

Сравнительная характеристика пассивных методов извлечения знаний представлена в таблице.

Пассивные методы извлечения знаний

Метод

Достоинства

Недостатки

Желаемые
качества эксперта

Требования к аналитику

Характерис-тики предметной области

Наблю-дения

Отсутствие субъективного влияния аналитика
Приближение аналитика к процессу

Нет обратной связи
Фрагментар-ность

"Мыслитель"/ "практик"

"Мыслитель"

Слабо- и средне-структуриро-ванные;
слабо- и средне-документиро-ванные

"Мысли вслух"

Обнаженность структур знаний
Свобода самовыраже-ния для специалиста

Нет обратной связи
"Зашумлен-ность" лишней информа-цией

"Собеседник"/ "мыслитель"

"Мыслитель"/ "собеседник"

То же

Лекции

Высокая концентрация знаний
Отсутствие субъективного влияния аналитика

Мало хороших лекторов
Слабая обратная связь

"Мыслитель" с лекторскими способностями

"Мыслитель"

Слабо-документиро-ванные и слабо-структуриро-ванные

  1.  Наблюдения

В процессе наблюдений инженер по знаниям находится непосредственно рядом с экспертом во время его профессиональной деятельности или имитации этой деятельности; При подготовке к сеансу извлечения эксперту необходимо объяснить цель наблюдений и попросить максимально комментировать свои действия.

Во время сеанса аналитик записывает все действия эксперта, его реплики и объяснения. Может быть сделана и видеозапись в реальном масштабе времени. Непременное условие этого метода - невмешательство аналитика в работу эксперта хотя бы на первых порах.

Существуют две разновидности проведения наблюдений: наблюдение за реальным процессом; наблюдение за имитацией процесса.

Обычно используют обе разновидности.

Сеансы наблюдений могут потребовать от инженера по знаниям:

  •  овладения техникой стенографии для фиксации действий эксперта в реальном масштабе времени;
  •  ознакомления с методиками хронометрирования для четкого структурирования производственного процесса по времени,
  •  развития навыков "чтения по глазам", наблюдательности к жестам, мимике и другим невербальным компонентам общения;
  •  серьезного предварительного знакомства с предметной областью, так как из-за отсутствия "обратной связи" иногда многое непонятно в действиях экспертов.

Протоколы наблюдений после сеансов в ходе домашней работы тщательно расшифровываются, а затем обсуждаются с экспертом. Таким образом, наблюдения - один из наиболее распространенных методов извлечения знаний на начальных этапах разработки. Обычно он применяется не самостоятельно, а в совокупности с другими методами.

  1.  Анализ протоколов "мыслей вслух"

Протоколирование "мыслей вслух" отличается от наблюдений тем, что эксперта просят не просто прокомментировать свои действия и решения, но и объяснить, как это решение было найдено, т.е. продемонстрировать всю цепочку своих рассуждений. Во время рассуждения эксперта все его слова протоколируются инженером по знаниям: при этом полезно отмечать даже паузы и междометия. Вопрос об использовании для этой цели магнитофонов и диктофонов является дискуссионным, поскольку магнитофон иногда действует на эксперта парализующе, разрушая атмосферу доверительности, которая может и должна возникать при непосредственном общении.

Основной трудностью при протоколировании "мыслей вслух" является принципиальная сложность для любого человека объяснить, как он думает. При этом существуют экспериментальные психологические доказательства, что люди не всегда в состоянии достоверно описать мыслительные процессы. Кроме того, часть знаний, хранящихся в невербальной форме (например, различные процедурные знания типа "как завязывать шнурки"), вообще слабо коррелируют с их словесным описанием.

Автор теории фреймов М.Минский считает, что "только как исключение, а не как правило человек может объяснить то, что он думает"

Расшифровка полученных протоколов производится инженером по знаниям самостоятельно с коррекциями на следующих сеансах извлечения знаний. Удачно проведенное протоколирование "мыслей вслух" является одним из наиболее эффективных методов извлечения, поскольку в нем эксперт может проявить себя максимально ярко, он ничем не скован, он как бы свободно парит в потоке своих умозаключений и рассуждений. Для большого числа экспертов это самый приятный и лестный способ извлечения знаний.

  1.  Лекции

Лекция - очень старый способ передачи знаний. Лекторское искусство издревле высоко ценилось во всех областях. Но нас сейчас интересует не столько способность к подготовке и чтению лекций, сколько способность эту лекцию слушать, конспектировать и усваивать. Если эксперт имеет опыт преподавателя, то можно воспользоваться таким концентрированным фрагментом знаний, как лекция.

В лекции эксперту предоставлено много степеней свободы для самовыражения; однако, аналитик должен сформулировать эксперту тему и задачу лекции. Например, тема цикла лекций может звучать как "Заключение контракта - подготовка документации", тема конкретной лекции "Подготовка соглашения о намерениях", задача - передать знания по преддоговорной деятельности. При такой постановке опытный лектор может заранее структурировать свои знания и ход рассуждений. От аналитика в этой ситуации требуется лишь грамотно законспектировать лекцию и в конце ее задать необходимые вопросы.

Студенты знают, что конспекты лекций в группе существенно различаются. Люди, умело ведущие конспект, - обычно сильные студенты (именно их конспект копируют остальные).

Искусство ведения конспекта заключается в "помехоустойчивости": записывать главное, опускать второстепенное, выделять фрагменты знаний (параграфы, подпараграфы), записывать только осмысленные предложения, уметь обобщать.

Хороший вопрос по ходу лекции помогает и лектору, и слушателю. Серьезные и глубокие вопросы могут существенно поднять авторитет аналитика в глазах эксперта.

Опытный лектор знает, что вопросы можно условно разбить на три группы:

  умные вопросы, углубляющие лекцию;

  глупые вопросы или вопросы не по существу;

  вопросы "на засыпку", или провокационные.

Если аналитик задает вопросы второго типа, то возможны две реакции. Вежливый эксперт-специалист будет разговаривать с таким аналитиком, как с ребенком, который сейчас ничего не понимает и все равно уже не поймет. Заносчивый эксперт просто выйдет из контакта, не желая терять время. Если же аналитик захочет продемонстрировать свою эрудицию вопросами третьего типа, то ничего, кроме раздражения и отчуждения, он, по-видимому, в ответ не получит.

Продолжительность лекции рекомендуется стандартная - от 40 до 50 мин и через 5-10 мин - еще столько же.

Метод извлечения знаний в форме лекций, как и все пассивные методы, используют в начале разработки как эффективный способ быстрого погружения аналитика в предметную область.

И в заключение шесть советов аналитику, как правильно слушать лекции:

1. К лекции подготовьтесь, т. е. познакомьтесь с деятельностью предприятия.

2. Слушайте с максимальным вниманием, для этого устраните мешающие факторы (скрип двери, шорохи) и удобно устройтесь.

3. Дайте отдохнуть Вашему вниманию - делайте паузы (например, когда лектор приводит незначительные факты).

4. Слушайте одновременно и лектора, и самого себя (параллельно с мыслями лектора по ассоциации возникают собственные мысли).

5. Записывайте сокращенно, используя условные значки, и расшифруйте записи в тот же день.

6. Не спорьте с лектором в процессе лекции.

  1.  Активные методы

Согласно классификации приведенной на рисунке к этой группе относятся

  Активные индивидуальные методы

  Активные групповые методы

  1.  Активные индивидуальные методы

Активные индивидуальные методы извлечения знаний на сегодняшний день-наиболее распространенные. В той или иной степени к ним прибегают при разработке практически любой экспертной системы.

К основным активным методам можно отнести:

  анкетирование;

  интервью;

  свободный диалог;

  игры с экспертом.

В этих методах активную функцию выполняет инженер по знаниям, который пишет сценарий и режиссирует сеансы извлечения знаний. Игры с экспертом существенно отличаются от других методов. Три оставшихся метода очень схожи между собой и отличаются лишь по степени свободы, которую может себе позволить инженер по знаниям при проведении сеансов извлечения знаний.

Для удобства сравнения активных индивидуальных методов извлечения знаний их достоинства и недостатки сведены в таблицу. Следует еще раз подчеркнуть, что при выборе метода для конкретной ситуации он должен подходить как ключ к замку. И только после успешных процедур извлечения данных и знаний можно переходить к моделированию и автоматизации.

Сравнительные характеристики активных индивидуальных методов извлечения знаний

Метод

Достоинства

Недостатки

Анкетирование

Возможность стандартизованного опроса нескольких специалистов
Не требует напряжения от аналитика во время процедуры анкетирования
 

Требует опыта составления анкет
Нет обратной связи. Вопросы анкеты могут быть неправильно поняты специалистами
 

Интервью

Наличие обратной связи (возможность уточнений и разрешения противоречий)

Требует значительного времени на подготовку вопросов интервью

Свободный диалог

Гибкость
Сильная обратная связь
Возможность изменения сценария и формы сеанса

Требует от аналитика высочайшего напряжения
Отсутствие формальных методик проведения
Трудность протоколирования результатов
 

  1.  Анкетирование

Анкетирование - наиболее жесткий метод, т.е. наиболее стандартизованный. Инженер по знаниям заранее составляет вопросник или анкету, размножает ее и использует для опроса нескольких экспертов. Это основное преимущество анкетирования.

Сама процедура может проводиться двумя способами:

  аналитик вслух задает вопросы, и сам заполняет анкету по ответам эксперта;

  эксперт самостоятельно заполняет анкету после предварительного инструктирования.

[ 11, 13 ].

Выбор способа зависит от конкретных условий (например, от оформления анкеты, ее понятности, готовности специалистов компании). Второй способ нам кажется предпочтительным, так как эксперт не ограничен временем на обдумывание ответов.

Вопросник (анкета) заслуживает особого внимания. Существует несколько общих рекомендаций при составлении анкет, наибольший опыт работы с которыми накоплен в социологии и психологии. Вот несколько рекомендаций, которые достаточно универсальны, т. е. не зависят от предметной области.

Анкета не должна быть монотонной и однообразной, т.е. вызывать скуку или усталость. Это достигается вариациями формы вопросов, сменой тематики, вставкой вопросов-шуток и игровых вопросов.

Анкету следует приспосабливать к языку специалистов предприятия.

Вопросы влияют друг на друга, поэтому их последовательность должна быть строго продуманной.

Желательно стремиться к оптимальной избыточности. Известно, что в анкете всегда много лишних вопросов; часть из них необходима — это так называемые контрольные вопросы (о них мы скажем ниже), а другая часть должна быть минимизирована.

Анкете необходимы «хорошие манеры», т.е. ее язык должен быть ясным, понятным, предельно вежливым.

Методическим мастерством составления анкеты овладевают только на практике.

  1.  Интервью

Под интервью понимаем специфическую форму общения инженера по знаниям и эксперта, в которой инженер по знаниям задает эксперту серию заранее подготовленных вопросов с целью извлечения знаний о предметной области. Наибольший опыт в проведении интервью накоплен также в журналистике и социологии [ 11 , 13 , 20 ].

Интервью очень близко к анкетированию, когда аналитик сам заполняет анкету, занося туда ответы эксперта. Основное отличие в том, что интервью позволяет аналитику опускать ряд вопросов в зависимости от ситуации, вставлять новые вопросы в анкету, изменять темп, разнообразить ситуацию общения. Кроме того, у аналитика появляется возможность "взять в плен" эксперта своим обаянием, заинтересовать его самой процедурой и тем самым увеличить эффективность сеанса извлечения.

Теперь подробнее о центральном звене активных индивидуальных методов - о вопросах. Инженеры по знаниям редко задумываются: умеют ли они задавать вопросы? В философии и математике эта проблема обсуждается с давних пор. Существует даже специальная ветвь математической логики - логика вопросов.

Укажем три основные характеристики вопросов [20 ], которые влияют на качество интервью:

  стиль вопроса (понятность, лаконичность, терминология);

  порядок вопросов (логическая последовательность и немонотонность);

  уместность вопросов (этика, вежливость).

Вопрос в интервью - это не просто средство общения, но и способ передачи мыслей и позиции аналитика. Отсюда необходимость фиксировать в протоколах не только ответы, но и вопросы, предварительно отработав их форму и содержание.

Очевидно, что любой вопрос имеет смысл только в контексте. Поэтому вопросы может готовить инженер по знаниям, уже овладевший ключевым набором знаний.

Вопросы для эксперта имеют диагностическое значение - несколько откровенно "глупых" вопросов полностью разочаруют эксперта и отобьют у него охоту к дальнейшему сотрудничеству.

  1.  Свободный диалог

Свободный диалог — это метод извлечения знаний в форме беседы аналитика и специалиста предприятия, в которой нет жесткого регламентированного плана и вопросника. Это определение не означает, что к свободному диалогу не надо готовиться. Напротив, внешне свободная и легкая форма требует серьезной профессиональной и психологической подготовки. Подготовка занимает разное время в зависимости от степени профессионализма аналитика, но в любом случае она необходима, так как несколько уменьшает вероятность самого нерационального метода — проб и ошибок.

Квалифицированная подготовка к диалогу помогает аналитику стать истинным драматургом, т.е. запланировать гладкое течение процедуры извлечения знаний: приятное впечатление в начале беседы с переходом к профессиональному контакту через пробуждение интереса и завоевание доверия эксперта. Для поддержания желания специалиста продолжать беседу полезны бывают «поглаживания» (в терминологии Э. Берна), т.е. подбадривающие собеседника фразы-вставки: «Я Вас понимаю...», «...это очень интересно» и т. п. Так, в одном из исследований по технике ведения профессиональных журналистских диалогов экспериментально доказано, что одобрительное и поощрительное «хмыканье» интервьюера увеличивает длину ответов респондента. При этом одобрение должно быть искренним, как показал опрос интервьюеров Института демоскопии Германии: «Лучшая уловка — это избегать всяких уловок: относиться к опрашиваемому с истинным человеколюбием, не с наигранным, а с подлинным интересом». Чтобы разговорить собеседника, можно сначала рассказать о себе, о своей работе и т.д.

Известный эксперт по социальному интервьюированию Ноэль так охарактеризовал идеального аналитика: «Он должен выглядеть здоровым, спокойным, уверенным, внушать доверие, быть искренним, веселым, проявлять интерес к беседе, быть опрятно одетым, ухоженным». Хороший аналитик может личным обаянием и умением скрыть изъяны подготовки. Ноэль приводит и блестящую краткую характеристику интервьюера — «общительный педант».

В свободном диалоге важно выбрать правильный темп или ритм беседы: без больших пауз, так как специалист может отвлечься, но и без «гонки», иначе оба участника быстро утомляются и нарастает напряженность; кроме того, некоторые люди говорят и думают медленно. Умение чередовать разные темпы, напряжение и разрядку в беседе существенно влияет на результат.

Подготовка к диалогу, так же, как и к другим активным методам извлечения знаний, включает составление плана проведения сеанса, в котором необходимо предусмотреть следующие стадии.

Начало беседы (знакомство, создание у специалиста предприятия «образа» аналитика, объяснение целей и задач работы).

Диалог по извлечению знаний.

Заключительная стадия (благодарность за потраченное время, подведение итогов, договоренность о последующих встречах).

Так, в одном из исследований по технике журналистских диалогов экспериментально доказано, что одобрительное и поощрительное "хмыканье" интервьюера увеличивает длину ответов респондента. Чтобы разговорить собеседника, аналитику следует рассказать о себе, о работе, т.е. поговорить самому.

В свободном диалоге важно выбрать правильный темп или ритм беседы: без больших пауз, так как эксперт может отвлечься, но и "без гонки", иначе быстро утомляются оба участника и нарастает напряженность; кроме того, некоторые люди говорят и думают очень медленно. Умение чередовать разные темпы; напряжение и разрядку существенно влияет на результат беседы.

Подготовка к диалогу так же, как и к другим активным методам извлечения знаний, включает план сеанса извлечения, в котором необходимо предусмотреть следующие стадии:

  начало беседы (знакомство, создание у эксперта "образа" аналитика, объяснение целей и задач работы);

  диалог по извлечению знаний;

  заключительная стадия (благодарность эксперту, подведение итогов, договор о последующих встречах).

  1.  Активные групповые методы

К групповым методам извлечения знаний относятся:

  ролевые игры;

  дискуссии за круглым столом с участием нескольких экспертов;

  мозговой штурм.

Основное достоинство групповых методов - это возможность одновременного поглощения знаний от нескольких экспертов, взаимодействие которых вносит элемент принципиальной новизны от наложения разных взглядов и позиций.

  1.  Метод круглого стола 

Метод круглого стола (термин заимствован из журналистики) предусматривает обсуждение какой-либо проблемы из выбранной предметной области, в котором принимают участие с равными правами несколько экспертов. Обычно вначале участники высказываются в определенном порядке, а затем переходят к живой свободной дискуссии. Число участников дискуссии колеблется от трех до пяти-семи. Существует и специфика, связанная с поведением человека в группе.

Во-первых, от инженера по знаниям подготовка круглого стола потребует дополнительных усилий, как организационных (место, время, обстановка, минеральная вода, чай, кворум и т.д.), так и психологических (умение вставлять уместные реплики, чувство юмора, память на имена и отчества, способность гасить конфликтные ситуации и т.д.).

Во-вторых, большинство участников будут говорить под воздействием "эффекта фасада" совсем не то, что они сказали бы в другой обстановке, т.е. желание произвести впечатление на других экспертов будет существенно "подсвечивать" их высказывания.

Задача дискуссии - коллективно, с разных точек зрения, под разными углами исследовать спорные гипотезы предметной области. Обычно эмпирические области богаты таким дискуссионным материалом. Для остроты на круглый стол приглашают представителей разных научных направлений и разных поколений, это также уменьшает опасность получения односторонних знаний.

Несколько практических советов по процедурным вопросам круглого стола перед началом дискуссии ведущему следует:

  убедиться, что все правильно понимают задачу (т.е. происходит сеанс извлечения знаний);

  установить регламент и четко сформулировать тему.

По ходу дискуссии проследить, чтобы слишком эмоциональные и разговорчивые эксперты не подменили тему и критика позиций друг друга была обоснованной.

  1.  Мозговой штурм

Мозговой штурм или мозговая атака - один из наиболее распространенных методов раскрепощения и активизации творческого мышления. Впервые этот метод был использован в США как способ получения новых идей в условиях запрещения критики. Замечено, что боязнь критики мешает творческому мышлению, поэтому основная идея штурма - это отделение процедуры генерирования идей в замкнутой группе специалистов от процесса анализа и оценки высказанных идей.

Как правило, штурм длится около 40 мин. Участникам (до 10 человек) предлагается высказывать любые идеи (шутливые, фантастические, ошибочные) на заданную тему (критика запрещена). Обычно высказывается более 50 идей. Регламент до двух минут на выступление. Самый интересный момент штурма - это наступление пика (ажиотажа), когда идеи начинают "фонтанировать",т.е. происходит непроизвольная (бессознательная) генерация гипотез участниками. При последующем анализе всего лишь 10 - 15% идей оказываются разумными, но среди них бывают весьма оригинальные. Оценивает результаты обычно группа экспертов, не участвовавшая в генерации.

Ведущий мозгового штурма - инженер по знаниям - должен свободно владеть аудиторией, подобрать активную группу экспертов - "генераторов", не зажимать плохие идеи - они могут служить катализатором хороших. Искусство ведущего - это искусство задавать вопросы аудитории, "подогревая" генерацию. Вопросы служат "крючком"[ 19 ], которым извлекаются идеи. Вопросы также могут останавливать многословных экспертов и служить способом развития идей других.

Основной девиз штурма - "чем больше идей, тем лучше". Фиксация сеанса - традиционная (протокол или магнитофон).

  1.  Экспертные ролевые игры

Игрой называют такой вид деятельности, который отражает (воссоздает) другие ее виды. Понятие экспертной игры, или игры с экспертами, в целях извлечения знаний восходит к трем источникам - это понятие деловой игры, широко используемое при подготовке специалистов и моделировании, и понятие диагностической игры, а также компьютерные игры, все чаще применяемые в обучении.

Рис. Классификация экспертных игр

Под деловой игрой чаще всего понимают эксперимент, где участникам предлагается производственная ситуация, а они на основе своего жизненного опыта, общих и специальных знаний и представлений принимают решения. Решения анализируются, и вскрываются закономерности мышления участников эксперимента. Именно эта анализирующая часть деловой игры полезна для получения знаний. И если участниками такой игры становятся эксперты, то игра из деловой превращается в экспертную. Из трех основных типов деловых игр (учебных, планово-производственных и исследовательских) к экспертным ближе всего исследовательские, которые используются для анализа систем, проверки правил принятия решений.

Диагностическая игра - это та же деловая игра, но применяемая конкретно для диагностики методов принятия решения в медицине (диагностика методов диагностики). Эти игры возникли при исследовании способов передачи опыта от квалифицированных врачей новичкам. В нашем понимании диагностическая игра - это игра, безусловно, экспертная без всяких оговорок, только с жестко закрепленной предметной областью - медициной.

В соответствии с введенной классификацией разделим экспертные игры на:

  •  индивидуальные;
  •  групповые.

А так же предполагающие использование специального оборудования и применение компьютерной техники.

Плодотворность моделирования реальных ситуаций в играх подтверждается сегодня практически во всех областях науки и техники. Они развивают логическое мышление, способности быстро принимать решения, вызывают интерес у экспертов.

Индивидуальные игры с экспертом

В этом случае с экспертом играет инженер по знаниям, который берет на себя какую-нибудь роль в моделируемой ситуации. Например, игра "Учитель и ученик", в которой инженер по знаниям берет на себя роль ученика и на глазах эксперта выполняет его работу, а эксперт поправляет ошибки "ученика". Эта игра - удобный способ разговорить застенчивого эксперта.

В другой игре инженер по знаниям берет на себя роль врача, который хорошо знает больного, а эксперт - роль консультанта. Консультант задает вопросы, делает прогноз о целесообразности применения того или иного вида лечения. Такая игра "двух врачей" позволила, например, выявить, что эксперту понадобилось всего 30 вопросов для успешного прогноза, в то время как первоначальный вопросник, составленный медиками для этой же цели, содержал 170.

Основные советы инженеру по знаниям по проведению индивидуальных игр:

  •  играйте смелее, придумывайте игры сами; не навязывайте игру эксперту, если он не расположен; в игре "не давите" на эксперта;
  •  не забывайте цели игры; играйте весело, нешаблонно; не забывайте о времени и о том, что игра утомительна для эксперта.

 

Ролевые игры в группе

Групповые игры предусматривают участие в игре нескольких экспертов. К такой игре обычно заранее составляется сценарий, распределяются роли, к каждой роли готовится портрет-описание и разрабатывается система оценивания игроков.

Существует несколько способов проведения ролевых игр. В одних играх игроки придумывают себе новые имена и играют под ними; в других - игроки переходят на "ты"; в третьих роли выбирают игроки, в четвертых роли вытягивают по жребию. Роль - это комплекс образцов поведения. Роль связана с другими ролями. "Короля играет свита". Поскольку в нашем случае режиссером и сценаристом является инженер по знаниям, то ему и предоставляется полная свобода в выборе формы проведения игры.

Создание игровой обстановки потребует немало фантазии и творческой выдумки от инженера по знаниям. Ролевая игра, как правило, требует некоторых простейших заготовок (например, табличек "Директор", "Бухгалтерия", "Плановый отдел", специально напечатанных инструкций с правилами игры). Но главное, конечно, чтобы эксперты в игре действительно "заиграли", раскрепостились и "раскрыли свои карты".

Игры с тренажерами

Игры с тренажерами в значительной степени ближе не к играм, а к имитационным упражнениям в ситуации, приближенной к действительности.

Наличие тренажера позволяет воссоздать почти производственную ситуацию и понаблюдать за экспертом. Тренажеры широко применяют для обучения (например, летчиков или операторов атомных станций). Очевидно, что применение тренажеров для извлечения знаний позволит зафиксировать фрагменты "летучих" знаний, возникающих во время и на месте реальных ситуаций и выпадающих из памяти при выходе за пределы ситуации.

Компьютерные экспертные игры

Идея использовать компьютеры в деловых играх известна давно. Но только когда компьютерные игры взяли в плен практически всех пользователей персональных ЭВМ от мала до велика, стала очевидной особая притягательность игр такого рода. Компьютерные игры обычно разделяют на:

  •  позиционные игры (шахматы, шашки, го);
  •  динамические игры (связанные со скоростью реакции - стрельба по движущейся мишени);
  •  зрелищные или диалоговые фильмы, где пользователь может влиять на сюжет;
  •  обучающие, в которых пользователь, играя, осваивает какие-то навыки или узнает что-то новое для себя.

Очевидно, что экспертные игры должны сочетать элементы перечисленных выше классов.

Одна из первых отечественных экспертных компьютерных игр описана в [ 5 ]. Основной принцип игры "Зоосад" состоит в создании игровой ситуации при организации диалога с экспертом. При этом задача извлечения знаний маскируется нацеленностью на решение чисто игровой задачи: необходимо определить содержимое "черного ящика", в котором находится некое животное, при этом надо набрать наибольшее количество очков, не истратив выделенного ресурса денег. В ходе игры эксперт делает ставки на различные гипотезы, указывая при этом, какими признаками обладает то или иное животное. После каждого ответа он получает необходимую информацию о своих результатах. По ходу игры невидимо для эксперта формируются правила, отражающие знания эксперта на основании сделанных им ходов. В данной игре - это знания о том, какими признаками обладают те или иные животные. Таким образом, выявляется алфавит значимых признаков для диагностики и классификации животных.

  1.  Текстологические методы

Группа текстологических методов объединяет методы извлечения знаний, основанные на изучении специальных текстов из учебников, монографий, статей, методик и других носителей профессиональных знаний.

Задачу извлечения знаний из текстов можно сформулировать как задачу понимания и выделения смысла текста. Сам текст на естественном языке является лишь проводником смысла, а замысел и знания автора лежат во вторичной структуре (смысловой структуре или макроструктуре текста), настраиваемой над естественным текстом

При этом можно выделить две такие смысловые структуры: M1 смысл, который пытался заложить автор, это его модель мира, и М2 смысл, который постигает читатель, в данном случае инженер по знаниям (см. рисунок) в процессе интерпретации I. При этом Т - это словесное одеяние М1, т.е. результат вербализации V.

Сложность процесса заключается в принципиальной невозможности совпадения знаний, образующих М1 и M2, из-за того, что М1 образуется за счет совокупности представлений, потребностей, интересов и опыта автора, лишь малая часть которых находит отражение в тексте Т. Соответственно и М2 образуется в процессе интерпретации текста Т за счет привлечения всей совокупности научного и человеческого багажа читателя.

Рис. Извлечение знаний из текстов

Встает задача выяснить, за счет чего можно достичь максимальной адекватности М1 и М2, помня о том, что понимание всегда относительно. Рассмотрим подробнее, какие источники питают модель М1 и создают текст Т. Как правило присутствуют два компонента любого научного текста. Это первичный материал наблюдений и система научных понятий в момент создания текста. В дополнение к этому, на наш взгляд, помимо объективных данных экспериментов и наблюдений, в тексте обязательно присутствуют субъективные взгляды автора, результат его личного опыта, а также некоторые "общие места", или "вода". Кроме того, любой научный текст содержит заимствования из других источников (статей, монографий) и.т.д.

При извлечении знаний аналитику, интерпретирующему текст, приходится решать задачу декомпозиции этого текста на перечисленные выше компоненты для выделения истинно значимых для реализации базы знаний фрагментов. Сложность интерпретации научных и специальных текстов заключается еще и в том, что любой текст приобретает смысл только в контексте, где под контекстом понимается окружение, в которое "погружен" текст.

Основными моментами понимания текста являются:

  •  выдвижение предварительной гипотезы о смысле всего текста (предугадывание);
  •  определение значения непонятных слов (т.е. специальной терминологии);
  •  возникновение общей гипотезы о содержании текста (о знаниях);
  •  уточнение значения терминов и интерпретация отдельных фрагментов текста под влиянием общей гипотезы (от целого к частям);
  •  формирование некоторой смысловой структуры текста за счет установления внутренних связей между отдельными важными (ключевыми) словами и фрагментами, а также за счет образования абстрактных понятий, обобщающих конкретные фрагменты знаний;
  •  корректировка общей гипотезы относительно содержащихся в тексте фрагментов знаний (от частей к целому);
  •  принятие основной гипотезы, т.е. формирование М2.

Следует отметить наличие как дедуктивной (от целого к частям), так и индуктивной (от частей к целому) составляющей процесса понимания.

Центральными моментами процесса I являются шаги формирования смысловой структуры или выделения "опорных", или ключевых, слов, а также заключительное охватывание "смысловых вех" в единую семантическую структуру. В качестве ключевого слова может служить любая часть речи (существительное, прилагательное, глагол и т.д.) или их сочетание. Существует гипотеза лингвостатистики о том, что наиболее употребляемые слова являются наиболее важными с точки зрения содержания текста, т.е. отражают его тематическую структуру.

Подготовкой к прочтению специальных текстов является выбор совместно с экспертами некоторого "базового" списка литературы, который постепенно введет аналитика в предметную область. В этом списке могут быть учебники для начинающих, главы и фрагменты из монографий, популярные издания. Только после ознакомления с "базовым" списком целесообразно приступать к чтению специальных текстов.

Наиболее простым методом является анализ учебников, в которых логика изложения обычно соответствует логике предмета, и поэтому макроструктура такого текста будет, наверное, более значима, чем структура текста какой-нибудь специальной статьи. Анализ методик затруднен как раз сжатостью изложения и практическим отсутствием комментариев, т.е. фоновых знаний, облегчающих понимание для неспециалистов. Поэтому можно рекомендовать для практической работы комбинацию перечисленных методов.

В заключение предложим одну из возможных практических методик анализа текстов с целью извлечения и структурирования знаний.

  •  Составление "базового" списка литературы для ознакомления с предметной областью и чтения по списку.
  •  Выбор текста для извлечения знаний.
  •  Первое знакомство с текстом (беглое прочтение). Для определения значения незнакомых слов - консультации со специалистами или привлечение справочной литературы.
  •  Формирование первой гипотезы о структуре текста.
  •  Внимательное прочтение текста с выписыванием ключевых слов и выражений, т.е. выделение "смысловых вех" (компрессия текста).
  •  Определение связей между ключевыми словами, разработка макроструктуры текста в форме графа или "сжатого" текста (реферата).
  •  Формирование поля знаний на основании структуры текста.

  1.  Подготовка к проведению экспертизы

Для проведения качественной экспертизы, необходимо учитывать все аспекты общения с экспертом (см. рис.)

Рис. Этапы подготовки к активным и пассивным методам экспертизы

Роль вопросов в интервью

Есть три основные характеристики вопросов, которые влияют на качество интервью. Это:

язык вопроса (понятность, лаконичность, терминология);

порядок вопросов (логическая последовательность и немонотонность);

уместность вопросов (этика, вежливость).

Вопрос в интервью — это не просто средство общения, но и способ передачи мыслей и позиции аналитика. Отсюда необходимость в протоколах фиксировать не только ответы, но и вопросы, предварительно тщательно отрабатывая их форму и содержание.

Очевидно, что любой вопрос имеет смысл только в контексте. Поэтому вопросы может готовить только аналитик, уже овладевший спецификой работы компании.

Вопросы имеют для специалистов компании диагностическое значение — несколько откровенно глупых вопросов могут полностью разочаровать специалиста и отбить у него охоту к дальнейшему сотрудничеству. Известен ответ Маркса на вопрос Прудона: «Вопрос был до такой степени неправильно поставлен, что на него невозможно было дать правильный ответ».

Виды вопросов

Аналитики редко сомневаются в своей способности задавать вопросы. В то же время в философии и математике эта проблема обсуждается с давних лет. Существует даже специальная ветвь математической логики — эротетическая логика (логика вопросов). Есть интересная работа Белнапа «Логика вопросов и ответов»; из отечественных работ полезны книги Н. Шумилиной по интервьюированию, но, к сожалению, использовать полученные ими результаты непосредственно при разработке интеллектуальных систем и систем управления знаниями не удается.

Все вопросительные предложения можно разбить на два типа.

Вопросы с неопределенностью, относящиеся ко всему предложению (например: «Действительно Вы столкнулись с трудностями при внедрении «1С»?).

Вопросы с неполной информацией (например: «При каких условиях «1С» Вас не устраивает?»), часто начинающиеся со слов «кто», что», «где», «когда» и т.д.

Открытый вопрос называет тему или предмет, оставляя экспертам полную свободу в том, что касается формы и содержания ответа («Как Вы боретесь со срывами графика поставок?»).

В закрытом вопросе специалист предприятия выбирает ответ из набора предложенных. Например: «Укажите, пожалуйста, что Вы делаете при срыве графика поставок: а) наказываю виноватых, б) подключаю дополнительные ресурсы, в) обращаюсь к партнерам, г) докладываю начальству». Закрытые вопросы легче обрабатывать при последующем анализе, но они более опасны, так как «закрывают» ход рассуждений специалиста и «программируют» его ответ в определенном направлении. При составлении сценария интервью полезно чередовать открытые и закрытые вопросы, особенно тщательно продумывая закрытые, поскольку для их составления требуется определенная эрудиция в предметной области.

Личный вопрос касается непосредственно индивидуального опыта специалиста («Скажите, пожалуйста, Иван Данилович, в Вашей практике как Вы определяете себестоимость продукта?»). Личные вопросы обычно активизируют мышление специалиста, «играют» на его самолюбии; они всегда украшают интервью.

Безличный вопрос направлен на выявление наиболее распространенных и общепринятых закономерностей предметной области («Что влияет на себестоимость?»).

При составлении вопросов следует учитывать, что языковые способности специалиста, как правило, ограничены и вследствие скованности, замкнутости или робости он может не сразу высказать свое мнение и предоставить знания, которые от него требуются (даже если предположить, что он их четко для себя формулирует). Поэтому часто при «зажатости» сотрудников компании аналитик использует не прямые вопросы, которые непосредственно указывают на предмет или тему («Применяете ли Вы методы сетевого планирования?»), а косвенные, которые лишь неявно указывают на интересующий предмет («А что Вы думаете о целесообразности применения…»). Иногда приходится задавать несколько десятков косвенных вопросов вместо одного прямого.

Вербальные вопросы — это традиционные устные вопросы. Вопросы с использованием наглядного материала разнообразят интервью и снижают утомляемость интервьюируемого. В таких вопросах используют фотографии, рисунки и карточки. Например, специалисту предлагаются цветные картонные карточки, на которых выписаны документы, с которыми он работает. Затем аналитик просит разложить эти карточки в порядке убывания значимости.

Деление вопросов по функции на основные, зондирующие, контрольные связано с тем, что часто основные вопросы интервью, направленные на выявление знаний, не срабатывают, специалист по каким-то признакам уходит в сторону от вопроса, отвечает нечетко. Тогда аналитик использует зондирующие вопросы, которые направляют рассуждения специалиста в нужную сторону. Например, если не сработал основной вопрос “Кто имеет право подписи договора?”, аналитик начинает задавать зондирующие вопросы: «Всегда ли процесс оформления договора визирует директор? А если его нет?» и т.д.

Контрольные вопросы применяют для проверки достоверности и объективности информации, полученной в интервью ранее («Скажите, пожалуйста, а Ваши филиалы также считают себестоимость?»). Контрольные вопросы должны быть составлены хитро, чтобы не обидеть работников компании недоверием (для этого используют повторение вопросов в другой форме, уточнения, ссылки на другие источники).

И, наконец, о нейтральных и наводящих вопросах. В принципе интервьюеру рекомендуют быть беспристрастным, следовательно, и вопросы его должны носить нейтральный характер, т.е. не должны указывать на отношение интервьюера к данной теме. Наводящие вопросы, напротив, заставляют респондента (в данном случае специалиста предприятия) прислушаться или даже принять во внимание позицию интервьюера. К примеру, нейтральный вопрос может звучать так: «Какие факторы Вы учитываете при начислении премии сотрудникам?». Наводящий вопрос в той же ситуации: «Не правда ли, очень трудно оценить личные качества сотрудников при премировании?».

Кроме перечисленных выше, полезно различать и включать в интервью следующие вопросы:

контактные (ломающие лед между аналитиком и специалистом предприятия); буферные (для разграничения отдельных тем интервью);

оживляющие память специалистов (для реконструкции отдельных случаев из практики);

провоцирующие (для получения спонтанных, неподготовленных ответов).

Таким образом, мы рассмотрели различные методы извлечения знаний, которые с применением различных способов представления можно будет использовать в среде интеллектуальных систем.


 

А также другие работы, которые могут Вас заинтересовать

19423. Процесс передачи информации, источник и приемник информации, канал передачи информации. Скорость передачи информации 437 KB
  Процесс передачи информации источник и приемник информации канал передачи информации. Скорость передачи информации. Развитие человечества не было бы возможно без обмена информацией. С давних времен люди из поколения в поколение передавали свои знания извещали об опа...
19424. Понятие алгоритма. Исполнитель алгоритма. Система команд исполнителя (на примере учебного исполнителя) 70 KB
  Понятие алгоритма. Исполнитель алгоритма. Система команд исполнителя на примере учебного исполнителя. Свойства алгоритма. Способы записи алгоритмов; блоксхемы. Появление алгоритмов связывают с зарождением математики. Более 1000 лет назад в 825 году ученый из города Хор
19425. Основные алгоритмические структуры: следование, ветвление, цикл; изображение на блок-схемах 87.5 KB
  Основные алгоритмические структуры: следование ветвление цикл; изображение на блоксхемах. Разбиение задачи на подзадачи. Вспомогательные алгоритмы. Основные виды алгоритмов алгоритмических структур: 1. Линейный алгоритм еще называют следование; 2. Циклический а
19426. Величины: константы, переменные, типы величин. Присваивание, ввод и вывод величин. Линейные алгоритмы работы с величинами 62.5 KB
  Величины: константы переменные типы величин. Присваивание ввод и вывод величин. Линейные алгоритмы работы с величинами. Вам уже известно что всякий алгоритм составляется для конкретного исполнителя. Сейчас в качестве исполнителя мы будем рассматривать компьютер осн...
19427. Логические величины, операции, выражения. Логические выражения в качестве условий в ветвящихся и циклических алгоритмах 44 KB
  Логические величины операции выражения. Логические выражения в качестве условий в ветвящихся и циклических алгоритмах. Для того чтобы понять работу ветвящихся и циклических алгоритмов рассмотрим понятие логического выражения. В некоторых случаях выбор варианта де...
19428. Представление о программировании: язык программирования (на примере одного из языков высокого уровня) 32 KB
  Представление о программировании: язык программирования на примере одного из языков высокого уровня; примеры несложных программ с линейной ветвящейся и циклической структурой. Для представления алгоритма в виде понятном компьютеру служат языки программирования. С
19429. Основные компоненты компьютера, их функциональное назначение и принципы работы. Программный принцип работы компьютера 306 KB
  Основные компоненты компьютера их функциональное назначение и принципы работы. Программный принцип работы компьютера. С давних времен люди стремились облегчить свой труд. С этой целью создавались различные машины и механизмы усиливающие физические возможности челов...
19430. Программное обеспечение компьютера, состав и структура. Назначение операционной системы. Командное взаимодействие пользователя с компьютером 673 KB
  Программное обеспечение компьютера состав и структура. Назначение операционной системы. Командное взаимодействие пользователя с компьютером. Графический пользовательский интерфейс. В 5060е годы когда компьютер еще назывался ЭВМ электронновычислительная машина он...
19431. Понятие файла и файловой системы организации данных (папка, иерархическая структура, имя файла, тип файла, параметры файла) 76 KB
  Понятие файла и файловой системы организации данных папка иерархическая структура имя файла тип файла параметры файла. Основные операции с файлами и папками выполняемые пользователем. Понятие об архивировании и защите от вирусов. Все программы и данные хранятся в д...