45435

Модели языка. Синтез и анализ языковых фрагментов. Проблема представления знаний

Доклад

Информатика, кибернетика и программирование

Проблема представления знаний Язык Человек лингвизирует свой мир живет в мире пересотворяемом с помощью его собственного языка. Границы языка границы мира. Если два языка подобны некой системе то они подобно друг другу.

Русский

2013-11-17

351 KB

1 чел.

  1.  Модели языка. Синтез и анализ языковых фрагментов. Проблема представления знаний

Язык

           Человек лингвизирует свой мир, живет в мире, пересотворяемом с   помощью его собственного языка. Центральные места в его мире оказываютс обозначенными собственными именами. Границы языка - границы мира. Мы можем  понять, познать и совершить только то, что заложено в языке.

          Отношение знаков к объектам - семантика. Отношение знаков к знакам  синтаксис. Отношение знаков к людям - прагматика.

           Язык отражает наши мысли, он подобен мышлению. Мышление подобно окружающему миру. Отсюда, можно сделать вывод, что язык уподобляется  реальному миру. Если два языка подобны некой системе, то они подобно друг другу. Именно поэтому возможен перевод с одного языка на другой.

            Различия в языках связаны с потребностями народов, их   употребляющих. Например, у северных народов есть десятки слов,  обозначающих снег в разном качестве. Этим народам жизненно важны  различия, нюансы этого понятия. В русском языке таких нюансов нет, так как отсутствует таковая потребность. При переводе один термин развернется в объяснение, абзац, лирическое отступление или определение "x это y, связанный как-то с z". Если мы не знаем, что такое метро, то нам развернуто объяснят "метро - это подземная электрическая железная дорога".  

            В языке действует Закон экономии языковых средств. Это один из основных законов лингвистики. Посмотрите как одно и тоже слово trouble в зависимости от позиции в предложении или связок между словами меняет свою функцию в английской фразе. Don't trouble troubles until trouble troubles you/ Не буди лихо, пока оно тихо.

          Еще пример. В английском языке окончание -ing присуще семи частям речи и то, как оно будет прочитано, зависит от окружения.

     Reading - чтение;

     Is reading - поглощена чтением;

     Like reading - любит читать;

     Like her reading - то, как ты читаешь;

     Her having read - то как вы прочитали.

          В развитии языка постоянно происходят процессы конструирования, одной стороны, и упрощения конструкций, с другой. Язык в ходе развития пытается ввести максимум понятий и приобрести максимум гибкости, но при этом заботится о минимизации количества затраченных на это средств.  Выделяют следующие направления развития:

     появление новых понятий;

     упрощение в произношении;

        Языки подразделяются на письменные и устные. Письменные, в свою   очередь, можно разделить на звукобуквенные (30-40-50 знаков); иероглифические (2000-20000 знаков); рисуночные (количество знаков бесконечно велико). Язык электрических схем - рисуночный, но имеет ограниченное число знаков (около 140). Языковая среда может использовать сразу несколько языков, например, Stratum: рассмотрим пример из  электротехники (рис.13.2).

             

           рис.13.2 рис.13.3

           Имиджи предметной области   Соединение имиджей в схему для решения частной  

                                                                                                    задачи

          Модель сопротивления имеет вид:

     fi1- fi2 = r*i

     u := ~fil - ~fi2

     ? fi1,fi2,i

     Модель источника напряжения имеет вид:

     fi2-fi1 = е - r*i

     ? fil,fi2,i

     Модель токового узла имеет вид:

     il + i2 + i3 = О

     ? il,i2,i3

     Модель заземлителя имеет вид:

     fi=0 ?fi

     Модель индуктивности имеет вид:

     il:=i

     L * (i - ~il) = (fi1 - fi2) * dt

     ? fi1, fi2

     u := ~fil - ~fi2

     Модель емкости имеет вид:

     du/dt = i/c

     fil - fi2 = ~u

     ? fil,fi2,i

      

     рис.13.4

     Электротехническая схема с интерфейсом управления экспериментом

          Из полученных имиджей можно собрать различные схемы - простейший контур (рис.13.3), последовательное, параллельное соединение (рис. 3), любые виды комбинированных соединений. На рисунках представлен ряд  вариантов. Условными обозначениями (линии) представлены связи имиджей Теперь к схеме можно присоединить служебные имиджи - окна, управляторы,  осциллографы. За счет такой организации можно изучать графически  зависимость тока или напряжения ветви от значения сопротивления  (рис.13.4).

          Рис. 3 представляет собой сообщение. Оно имеет законченный смысл. Рис.13.2 представляет алфавит языка. Как видно, язык специфичный - символы  не пишутся в строчку, а используют двухмерное поле написания сообщения. В   тоже время, есть общие свойства языков. Если некто пишет фразу на таком  языке, то другой сможет понять ее смысл, в сообщении содержится смысл, из  элементов алфавита можно строить новые фразы, существуют законы  составления фраз (схем), фраза интерпретирует (описывает) мысль (объект),  представляет его свойства.

          Сообщение может само интерпретироваться, если помещено в языковую   среду. Интерпретироваться, то есть реализовать свойства предметов, о  которых говорится в тексте.

          Главная цель языка - понимание между народами, людьми, организмами,машинами.

          Язык имеет сложную структуру. Но при этом он имеет несомненную   логику, которая сравнима с математической логикой. Более того, можно  построить математическую модель языка. Каждый язык имеет свои инструменты, закономерности. Например, русский язык - 6 падежей и три времени, а  английский - 6 времен, 2 падежа. Логика иерархична, на разных структурах  языка - свои законы.

Звук

Фонетика

Единица восприятия

Морфема

Морфология

Мельчайшая единица смысла в языке. Единица значения

Слово

Лексика

Выделяет в мире предмет и является идентификатором этого предмета. Ударение отделяет одно слово от другого в устной речи, на письме для этого используются знаки препинания и пробелы

Словосочетание

Грамматика

Единица для определения грамматических законов. Словосочетание состоит из словоформ. Предложение Единица выражения мысли. Это то, относительно чего можно

всегда сказать "Да" или "Нет". Для мысли важно отношение - позитив или негатив. Центр предложения - глагол. Глагол - отношение между словами (понятиями).

Текст

Единица познания названий и понимания информации.

                       

          Проследим на примере логику образования форм языка.

     Рук-а

     Рук-ой

     Рук-у

     Рук-ами

      Ясно, что "рук"- не изменяемая часть одного объекта языка. Продолжая

     Ног-а

     Ног-ой

     Ног-у

     Ног-ами

          Ясно, что "ног"-неизменяемая часть другого объекта языка. Ясно также, что "-а", "-ой", "-ами" - общее в словообразовании и выражает отношение между словами. Какое логическое заключение из рассмотрения этих языковых единиц можно сделать?

     1.Та же грамматическая часть должна существовать в том же значении с

     другими лексическими частями (корни).

     2.Та же лексическая часть должна прослеживаться в других словах с другими

     грамматическими частями (окончания, суффиксы, приставки).

          Теперь, используя эти заключения, можно проводить анализ с другими словами.

          Примеры закономерностей на других уровнях языка: в согласных звукахинформации больше, чем в гласных. "Смлт" ясно понимается как "самолет", а в буквах "аооео" вы не узнаете слово "закономерность". Звукосочетание "мр" легко произносится и присутствует в словах (мрак), а "мь + р" может  находиться только на разрыве слов ("восемь раз").

          

Языковая структура

          Понимание языкового сообщения сродни дешифровке. Применение логики помогает понять неизвестное сообщение. Этот принцип есть основа машинного понимания текста.

          Письменность хеттских племен была расшифрована благодаря закономерностям в языке. Было найдено шесть табличек, и была выдвинута гипотеза о том, что им соответствуют шесть понятий: две страны (Хамату и   Палаа), два города (Куркума, Туванава) и два царя (Варпалава, Таркумува).

       

           Сосчитаем количество слогов в известных нам словах и количество  знаков в табличках. Количество знаков равно количеству слогов плюс один. Первый вывод - это письмо слоговое. Заметим, что некоторые знаки  встречаются только в конце. Очевидно, что это какие-то служебные символы.  Продолжая рассуждения, мы придем к выводу, что одному знаку соответствует один слог.

           Рассматривая первую табличку и сравнивая ее со словом Вар-па-ла-ва, можно сообразить, что первый и четвертый знаки, как и слоги, одинаковы, за  исключением черточки и буквы "р". Значит черточка означает букву "р".  Зная, как пишется "ва", можно определиться с третьей и шестой табличкой. Вторая табличка - Куркума, так как два одинаковых идут слога друг за другом и есть черточка, означающая букву "р". теперь мы знаем, как пишется "ма". Легко найти "Хамату" на шестой табличке. Зная все переводы, логически установим смысл служебных знаков в конце слов. Последний знак говорит о классе понятия - страна, город, царь. Заметим, что возможна расшифровка и другим путем, значит информация избыточна. После расшифровки   можно написать самому сообщение на хеттском языке.

          Расшифровка языка Муйув (Папуа-Новая Гвинея)

     Известные фразы:

     atok - Я стою около него.

     kuton - Ты стоишь в стороне.

     isiw - Он остается около тебя.

     kusim - Ты остаешься около меня.

     iw - Он идет к тебе.

     Расшифровка с учетом закономерностей

     1. a - я;

        ku - ты;

        i - он;

     2. w - к тебе;

        m - ко мне;

        k - к нему;

        n - в сторону;

     3. to - стоять;

        si - остается;

        _ - идет.

     ak - Я иду к нему.

     asin - Я остаюсь в стороне.

     kun - Ты уходишь.

Диаметр сообщения

           В тексте присутствуют неоднозначности, в силу того, что мы сами говорим неоднозначно.

          Пример. "Письма знакомой из Киева не заменят фотографии его любимой и милой дочери Марии" - фраза, имеющая более 1000 смыслов. Обратите внимание:

     - "письма (чьи?) знакомой" или "письма (кому?) знакомой";

     - письма из Киева или знакомая из Киева?

     - дочери (кого) Марии или дочери по имени Мария?

     - "любимая" и "милая дочь" это одно лицо или два разных человека?

          Расшифровка сообщений - процесс итерационный. Выдвигается какая-либо гипотеза, если далее по тексту она не подтверждается, то мы вынуждены  возвращаться и менять гипотезу.

          Чем больше сообщение, тем меньше неоднозначности будет при восприятии  текста. Поэтому требуется передавать избыточные сообщения. Чем больше текста, тем больше вероятность, что вас поймут. Диаметр сообщения для однозначного его прочтения зависит от числа графем (гавайский - 19, русский - 33, армянский - 38), от числа звуков, обозначенной одной  графемой (твердые - мягкие), от степени избыточности (количества знаков  дублирующих друг друга). Обычно у буквенных языков избыточность составляет  70 -80%. У словесного языка (Китай) избыточность - 50%. У слогового - 60%.

Наименьшая длина сообщения для однозначного прочтения называется  диаметром сообщения. В гавайском языке диаметр составляет 20 знаков, в русском языке - 70 знаков, в армянском - 80 знаков, в китайском - 1000000знаков.

          Еще закономерности.

          Начало письма там, где выровнен край. Грамматических морфем   (окончания, предлоги, союзы) меньше, чем лексических (корни). Они чаще встречаются и сочетаются с большим числом разнообразных лексических морфем. Текст сжимается к концу строки. Перед глаголом не может быть предлога. Между подлежащим и сказуемым не бывает союза. И так далее. Общий  свод правил пока не составлен. Выявляют закономерности и более сложными   исследованиями.

Алгоритм Шеворошкина – Сухотина

          Вот как работает алгоритм отделения гласных от согласных. Возьмём  фразу из статьи "Загадочные письмена" "Один из..." и представим себе, что перед нами текст на неизвестном языке. Где здесь гласные, а где согласные?  Запишем текст без пробелов между словами, но оставляя знаки препинания -   они как бы разрывают звуковую цепь. Для каждой буквы выпишем всех её  непосредственных левых и правых соседей внутри звуковой цепи. Для первой  буквы о это будут сочетания: од, бол, ров, воч, гор, мов, бот, хот, вор,   рош, ров, ког, гоп (удобнее записывать их в столбик). Теперь выделим повторяющиеся пары (независимо от того, какая буква является левым, а   какая правым соседом). Для первых четырёх букв о, д, и, н получим:

           Для о                      Для д                           Для и                  Для н

           о: в (5 раз)             д: и (2 раза)  и: н (5 раз) н: и (5 раз)

                                          д: е (2 раза)         и: р (4 раза) н: ы (4 раза)

           о: р (5 раз)                                         и: ш (3 раза) н: е (3 раза)

           о: г (3 раза)        и: д (2 раза) н: а (2 раза)

           о: б (2 раза)       и: т (2 раза) н: с (2 раза)

           о: т (2 раза)       и: ф (2 раза)

      и: м (2 раза)

           Из первого и третьего можно предположить, что о и и относят-ся к  одному классу, так как у них общие соседи р и т тогда в, р, г, б, т, н. д, ш, ф, м относятся к другому классу. Но из четвёртого следует, что н в свою очередь противопоставлено и, ы, е, а, с, которые должны принадлежать первому классу. Таким образом, мы получаем разбиение: первый класс - о, и, ы, е, а, с; второй класс - в, р, г, б, т, н, д, ш, ф, м. Данные второго пункта подтверждают его.

          Как решить, какой из выделенных классов составляют гласные, а какой -согласные? Обычно в звуковой системе языка разных гласных меньше, чем разных согласных; соответственно и в алфавите гласных букв должно быть  меньше. Очевидно, первый класс - гласные, второй - согласные. Вы видите, что в одном случае алгоритм дал ошибку: с попала в класс гласных. Однако  если взять более длинный текст для анализа, скорее всего ошибка исчезнет.

          Выводы сделаны на очень небольшом материале, и тем не менее мы  получили верное распределение для 15 букв из 16. Алгоритм Шеворошкина - Сухотина проверяли на материале русского, английского, немецкого, французского и испанского языков в текстах по 10 тыс. знаков. На материале немецкого языка алгоритм дал три ошибки (за счёт однозвучных буквосочетаний), на английском, русском и французском материале - по одной ошибке, на испанском - ни одной.

Координатная сетка Алисы Кобер

          Идея Алисы Кобер в общих чертах заключается в том, чтобы, словно  рентгеновским лучом, просветить структуру слоговых знаков неизвестного  письма, отделив согласные от гласных.

          Анализируя критские глиняные таблички, Алиса Кобер обнаружила, что в них записаны изменяемые слова. На это указывали общие знаки основы и разные окончания. Многие из слов могли быть существительными - при них стояли числа (знаки для чисел дешифровал ещё Эванс). Изменяемые слова можно было собрать в парадигмы - вроде наших склонений. Только у критских существительных в текстах выделялись всего три падежные формы. Если сопоставить с русскими словами, это могло выглядеть, допустим, так:

           раб-а            дом-а

           раб-ами       дом-ами

           раб-у           дом-у

          В критском письме эти слова записывались бы слоговыми знаками:

           x1-y1         x2-y2

           ра-ба         до-ма

           х1-у1-а     x2-y2-a

           ра-ба-ми  до-ма-ми

           x1-z1        x2-z2

           ра-бу       до-му.

          Здесь х - графическая основа слов, у, уа, z - разные падежные  окончания.

          Исследуя изменяющиеся слова, Вентрис заметил, что в роли у  используются не любые знаки, а лишь немногие. Из этого он заключил, что в разных у имеется один и тот же гласный Г1, характерный для данного  падежного окончания, и разные согласные (С1, С2...), относящиеся к разным корням. Тогда для каждой тройки тот же конечный согласный корня (С1, С2...) должен иметься и в z в паре с другим гласным Г2, соответствующим  третьему падежному окончанию.

          Этот вывод можно представить в виде таблицы:

Согласный

   Гласный

Г1

Г2

С1

y1(ба)

z1 (бу)

С2

y2 (ма)

z2 (му)

           

          Эта таблица и есть зародыш координатной сетки, открывающей два   измерения критских слоговых знаков - "согласное" и "гласное". Отыскивая  новые "существительные", продолжим ряд С (допустим, стол-а - С3 = л, жук-а  - С4= к). Отыскивая новые типы изменений слов, можно продолжить ряд   гласных. Если учесть все типы слов (допустим, могут быть изменения типа   грамматического рода прилагательных - хорош-ая, хорош-ий, хорош-ее), то в  виде подобной таблицы, но с гораздо большим числом ячеек можно представить  всю грамматику языка (систему изменений слов), по крайней мере  используемую в текстах.

          Пока, однако, в таблице - координатной сетке - ещё нет ни одного  звукового значения, которое могло бы связать полученную грамматику с  конкретным языком (наши русские подстановки не в счёт). Вот эти конкретные  звуковые значения и надо получить методом подстановки, пробуя грамматические окончания разных языков. Правильно найденный язык, оказавшись "ключом", сразу откроет звуковые значения многих знаков, из  которых сложатся слова известного языка.   А. Кобер указала путь, по которому в процессе систематических и кропотливых поисков можно прийти к верному результату. Пройти этот путь до конца сумел Майкл Вентрис.

Алгоритм Хэрриса

          Выдающийся представитель американской дескриптивной лингвистики Зеллиг Хэррис (1909-1992) разработал алгоритм деления высказывания на морфемы на незнакомом языке. Обычно, когда требуется разобрать слово по  составу, мы ищем однокоренные слова, т. е. слова, сходные не только по  звучанию, но и по значению. Алгоритм Хэрриса хорош тем, что он не требует  обращения к значению, ведь он задуман для работы с неизвестным языком. Однако информацию об исследуемом языке алгоритм, конечно, получает - в виде исходного текста большого объёма, из которого выбирают высказывание  для анализа. Текст обрабатывают не вручную, а на компьютере.

          Идея, лежащая в основе алгоритма, проста и знакома многим по игре в  "балду". Играющие по очереди составляют слово из букв. Первая буква может быть любой, с каждой следующей возможность выбора значительно уменьшается,  а для последней обычно остаётся только один вариант. Примерно так же строится и связный текст. Неопределённость выбора буквы (количество  вариантов) постепенно падает от начала к концу слова и резко возрастает на   границах слов.

          Итак, в исходном тексте (где слова могут быть записаны без пробелов,  а у Хэрриса ещё и в фонетической транскрипции - ведь он работал с бесписьменными индейскими языками) выбирают для анализа некоторое высказывание. Его можно рассматривать как цепочку букв или знаков   транскрипции между точками или паузами. На первом шаге берут первую букву   высказывания и выписывают из текста все её сочетания с другими буквами.

      Если верна исходная гипотеза, что разнообразие букв больше на границах слов (морфем), чем внутри слова (морфемы), то большие числа  должны указывать на такие границы - пики неопределённости.

          Чтобы уточнить результаты деления на морфемы, эту же процедуру проделывают от конца высказывания, вычисляя число "предшественников" сначала последней буквы, затем двух последних и т. д. Отделив часть слова от границы, можно начать процедуру анализа со следующей исходной точки, в  данном случае со слова выходе.

          Надёжность результата зависит от объёма текста. Алгоритм Хэрриса проверили на 100 предложениях английского текста, в 85 % случаев морфемы оказались выделены правильно. Правда, тексты пришлось взять в транскрипции: английская орфография заметно отстала от развития самого языка.

          

          Покажем фрагмент математической модели русского языка.

       

          Используя эту модель можно провести как анализ слов, так и синтез   слов в предложении. Заметим, что это не полная таблица.

Анализ текста

          Анализ текста происходит по следующему алгоритму.  По списку знаков препинания текст и предложения следует разбить на слова.

     Определить окончания у каждого слова.

     Определить часть речи и уточнить атрибуты у каждого слова. Конфликты разбираются с помощью    ряда специальных правил (например: у глагола нет предлога; глагол на "-оть" употребляется с    существительным в  винительном падеже без предлога; между подлежащим и сказуемым нет союза).

     Определить части предложения (пример правила - дополнение - это  существительное с предлогами для    в родительном падеже, за в творительном падеже, под в винительном падеже, без в родительном    падеже  и так далее).

     Определить субъекты и объекты в тексте и наличие связей между ними.

     Объекты и субъекты образуют в своих отношениях модель проблемы.

     Привнесение вопроса к модели    замыкает ее. Теперь можно решать любые обратные задачи, задавая вопросы к тексту.

          Вопросы могут быть 4 уровней.

     1 уровень. Вопросы, ответ на которые содержится в тексте. "Куда пошла

     Красная Шапочка?"

     2 уровень. Вопросы, ответ на которые можно получить логическим выводом.

     "Что было раньше: выход из дома или вход в лес?"

     3 уровень. Вопросы, для ответа на которые требуется наличие дополнительной

     базы знаний. "Где была Красная Шапочка между 13-00 и 15-00?". Здесь

     требуется знание скорости пешехода, характера Красной Шапочки, зависимости

     скорости, времени и пути, карты местности и так далее.

     4 уровень. Вопросы, на которые можно найти ответ, зная модель поведения,

     аргументы поведения личности. "Почему Красная Шапочка не пошла в компании

     с охотниками?"

Фоносемантика

          Слово обладает двумя свойствами: понятийное ядро и ореол. Понятийное ядро заключает в себе смысл, ореол - окраску слова. Например, слова папа, папулечка, отец несут один смысл (родитель - мужчина), но несут разную эмоциональную окраску. Но если ореол объективно существует, то его можно измерить.

          Возьмем группу людей (для определенности - 50 чел.). И по шкале от 1 (очень хорошо) до 5 (очень плохо) просим определить оценку задаваемому слову. Измеряем частость оценок. Например, если на слово "дом" получили следующие оценки: 1 (очень хорошо) - 35 человек, 2 (хорошо) - 10 человек, 3 (нейтрально) -3 человек, 4 (плохо)- 2 человек, 5 (очень плохо) - 0 человек. Вычисляем среднее - 1*35+2*10+3*3+4*2+5*0=72; 72/50 = 1.44; 1.44 - ореол слова "дом". Померили ореолы других слов и нанесли на шкалу.

     Разные слова заняли разное положение на шкале.

          Всего было опробовано около 75 шкал. Их назвали шкалами Осгуда. Из 75

     - базовыми оказались три.

     Фактор оценки (хорошее - плохое, светлое - темное и др.).

     Фактор силы (большое - малое, сильное - слабое и др.).

     Фактор активности (статичное - динамичное, быстрое - медленное, и др.).

          Иногда выделяют еще одну шкалу родокомфортности (женское - мужское,   круглое - угловатое, нежное - грубое и др.).

          Три базовых шкалы отложили в пространстве - получили куб Осгуда.  Любое слово имеет свою точку в кубе Осгуда.

      

          Но некоторые понятия могут и растекаться, иметь некоторую область, - например, "дождь".

      

          В 60-х годах Ю. Орлов высказал мысль, что между звучанием и значением    есть соответствие. Звуки измеримы по шкале Осгуда. о - светлый; р -устрашающий; к - быстрый; ш - медленный и т.д. По наличию звуков, можно  вычислить слово и определить его местоположение в кубе Осгуда. При этом нужно учитывать следующие особенности:

     слово нужно раскладывать на звуки, а не буквы (например, акно, йаблако);

     требуется различать, какой звук идет за исследуемым;

     нужно вносить поправку на ударение;

     первый звук - самый важный; часто встречающиеся звуки - малозаметные.

          Оценки, даваемые людьми, и оценки, получаемые в ходе разбора слова, совпадали. Можно понять смысл слова по его звучанию. Эта теория объясняет происхождение языка. Язык возникал как звукоподражание (шорох, рык, писк, шелест, набат, храп, лепет, взрыв).

Звукоцвет

          Исследования (статистические опросы) показали, что звуки имеют цвет:

     а - густокрасный, е - зеленый, а - красный, и - синий, ю - голубоватый и  т.д. Это значит, что тексты имеют окраску.

          АОЕИ - опорные буквы и главные цвета (подобно RGB состовляющим).

          Если соответствия звуков речи определенным цветам существуют, пусть даже в подсознании, то они должны где-то проявляться, звукоцвет должен  как-то функционировать в речи. И пожалуй, прежде всего нужно искать  проявление звукоцветовых ореолов в поэзии: там, где звуковая сторона  особенно важна. Эффект звукоцвета может сыграть свою роль в том случае, когда в стихотворении создается определенная цветовая картина, и рисунок  гласных стиха должен бы поддержать, <подсветить> эту картину звуками соответствующего цвета.

          Если это так, то естественно ожидать, что при описании, например, красных предметов и явлений в тексте будет подчеркнута роль красных А и Я;  они будут встречаться чаще, чем обычно, особенно в наиболее важных,   наиболее заметных позициях (скажем, в ударных). Описание чего-либо синего будет сопровождаться нагнетением синих И, Ю, У; зеленого - нагнетением Е,  Ё и т. д.

          Стоило начать проверку этой гипотезы, как в сухих статистических  подсчетах стала на глазах проявляться живая игра звукоцветовых ореолов   поэтического языка, поражающая своей неожиданностью, своим разнообразием и точным соответствием понятийному смыслу и общему экспрессивно-образному строю произведений. Судите сами. У А. Блока есть стихотворение, которое он написал под впечатлением от картины В. Васнецова <Гамаюн, птица вещая>.  Стихотворение о грозных пророчествах передает трагический колорит картины   - мрачно-багровый цвет казней, пожаров, крови.

       Исследования показали, что газетный текст, текст инструкций - серый, не выраженный, а заговоры, песни, молитвы ярко окрашены.

          Окраска произведения может меняться по мере изменения сюжета. Поэтому  оценивать необходимо не все произведение, а частями. Смесь красок частей  может дать необоснованно серый цвет. Замечено, что чем гениальнее поэт,  тем четче выражена окраска произведения.

          Одно сообщение на разных языках имеет сходную окраску. Это объясняет   единство происхождения языков.

Формула Сводеша

          Для знатоков математики приведём формулу, по которой определяется  время дивергенции в глоттохронологии:

     С (А, В) = rt, откуда t(A, В) = log С(A, B) : log r,

     где t - время в тысячелетиях, возраст дивергенции между языками A и В; С -доля общих для языков А и В слов из 100-словного списка Сводеша (от 0 до 1); r - индекс сохранности базового словаря за одно тысячелетие (для  100-словного списка r=0,86, log r=-0,0655).

          Можно подсчитать, что если, например, не совпадают всего семь слов из  базовых 100, языки разделились примерно 500 лет назад; если 26 - то  разделение произошло примерно 2 тыс. лет назад, а если совпадают лишь 22   слова из 100, то 10 тыс. лет назад, и т. д.

          На графике показано, как, по Сводешу зависит процент совпадающих слов

     от времени (t), когда разошлсь языки.

      

Дерево языков

    

Суггестивная лингвистика

           С помощью звуковых сообщений можно управлять человеком. Широко   используется в религии и рекламных компаниях.

          Механизм таков - звук имеет окраску, окраска влияет на эмоции, сильные эмоции провоцируют действия. Известно, что слова воздействуют на мозг, нервную систему. Не удивительно, что зубную боль можно "заговорить", так как боль - возбуждение определенного участка мозга. С помощью слов  можно изменить картину очагов возбуждения в мозгу.

          Суггестивная лингвистика - осознанный вход в подсознание,  целенаправленное воздействие на подсознание. Можно говорить о суггестивной    лингвистике как о внушении, т.е. как о словесном воздействии,   воспринимаемой без критики (в отличии от убеждения).

          Многие исследователи проводили анализ показателей текста, чтобы  выявить закономерности - что именно действует на человека как внушение.

     Внутреннее представление данных и проблема проектирования

          Сначала несколько вопросов, начиная с самого сложного.

     Как мы начинаем хотеть новые знания?

     Как добываются новые знания?

     Как добавляются новые знания к уже существующим?

     Как хранятся знания внутри нас?

     Как мы решаем задачи, используя знания?

          Ответив на эти вопросы, мы приблизимся к ответу, как построить систему, манипулирующую знаниями. Начать придется с ответов на самые  простые вопросы. Пока, готового ответа на эти вопросы нет, но последние пять лет дали новые подходы и методы решения этих проблем. После бурных 60-х годов, и затишья 80-х, снова появляется оптимизм.

          Как существуют знания внутри нас? В виде чего? Какова структура знания? Без фиксации знаний, мы не можем ими пользоваться.

     1)  Мыслеформа. Это не текст, не формула, не картинка. Это все вместе. И   не просто сложено в стопочку, а связано между собой. Это многогранная  структура, которая может проявиться любой стороной. Каждый раз той, какой  удобно для использования. И в ней есть динамика. И есть связи с другими мыслеформами. И эти связи то появляются, то исчезают. Мыслеформа это элемент знания. Каждая мыслеформа хорошо различимое целое.

     2)  Мыслеформа живая. Она меняется. Она представляет свойства объекта,  которого имитирует из реального мира. Или абстракции, если это мыслеформа стоит на вершине бесконечной пирамиды других мыслеформ.

     3)  Мыслеформ много, они добавляются, детализируются (иерархически),  удаляются, собираются в структуры для решения проблемы, сопоставляются,   потом рассыпаются.

     4)  Среда хранит мыслеформы, оперирует ими, связывает в системы и иерархично, детализирует, интерпретирует. Цель среды - решение проблем,  задач. Для этого среда выбирает нужные мыслеформы, связывает их. Они  образуют новую композицию с новыми свойствами, и среда интерпретирует эту совокупность свойств. Результат интерпретации - решение проблемы.

          Представим мыслеформу комплексной моделью (формула, картинка, текст, связь, звук, и так далее). Модель имеет те же свойства, что и мыслеформа. Она динамична, потенциально содержит в себе всю информацию об объекте,  имитируя его, связывается с другими, преобразовывается, детализируется на  модели, связанные снова друг с другом, и укрупняется. Модель может  решаться. У модели нет входа и выхода. Они появляются во время связывания   при решении конкретной задачи. Модель может состоять из новых моделей, связанных между собой. Модель может быть связана с другими моделями  связями. Модель со связями может быть объявлена новой моделью.

          Все это описание напоминает проектирование систем. Что-то состоит из  чего-то. Собирается и разбирается. Усложняется, связывается в новые  системы. Где-то есть конструктор. И кто-то из конструктора собирает на  рабочем поле нечто. В самом низу - простейшие объекты. Связываясь, они образуют более крупные. Потом появляются абстрактные объекты.

          Моделирование помогает оживить спроектированную систему.  Интерпретирует каждый элемент по правилам оперирования. Вместе они  проявляют новые свойства. Во время моделирования появляется ответ,  результат задачи. Таким образом, для начала отметим, что как минимум мышление напоминает проектирование объектов и моделирование проектов в нашем  сознании.

          Хорошая система проектирования - вот прототип искусственного интеллекта в первом приближении. А что такое <хорошая>? А это значит, что абстрактная (а не узопредметная), объектная (а не функциональная), интерпретатор, содержит возможности оперирования объектами (и манипуляциями, и описаниями), имеет все возможные редакторы.

          Поэтому далее имеет смысл поговорить о системах проектирования.  Существуют две крайности:

     1)  Очень большое количество элементов. Из этого огромного числа можно

     сделать всё, что угодно, но при этом существует высокая трудоемкость.

     Например, из атомов можно сделать всё, но вряд ли кто-то на это решится.

     2)  Небольшое количество элементов. Это дает низкую трудоемкость при

     сборке системы, но собрать другие системы весьма затруднительно - у

     элементов невысокая степень универсальности. Автомобиль "Форд" можно

     разбить на 10 частей, но потом как ни собирай, "Жигули" не получишь.

          Как найти золотую середину? Должен существовать небольшой, но

     универсальный набор элементов. Но как его найти? Существует более десяти

     систем, предлагающих различные универсальные наборы.


 

А также другие работы, которые могут Вас заинтересовать

49292. Составление математической модели турбокомпрессора по заданным расходным характеристикам 149.54 KB
  В качестве недостатка таких методов можно привести пример когда для вновь создаваемого или форсируемого двигателя основной технической проблемой становится к примеру выбор параметров турбокомпрессора или топливного насоса высокого давления ТНВД. Применительно к турбокомпрессорам это могут быть расходные характеристики которые широко распространяются их производителями с целью увеличения рынка сбыта. 1 составить математическую модель турбокомпрессора.
49293. Учет заработной платы сотрудников предприятия 354.85 KB
  Задача «Учет заработной платы сотрудников предприятия» решается с целью получения сведений о средней и суммарной заработной плате каждого сотрудника с начала года до указанного месяца, упорядоченные по алфавиту.
49295. Разработка грузового плана нефтеналивного судна т/х «Сейфула Кади» 161.78 KB
  В данной работе разрабатывается грузовой план нефтеналивного судна т х Сейфула Кади выполняется расчет ходовых запасов; размещение груза расчет кренящего момента дифферентовка и соответствующее принятие балласта расчет остойчивости и прочности составления чертежа грузового плана. Основные характеристики и размерения судна: Тип Стальное однопалубное двухвинтовое наливное судно без седловатости с двойным дном двойным бортом с баком с машинным отделением и рубками расположенными в корме с 6 грузовыми танками.9 1438 63257...
49296. Автоматизация поддержания параметров микроклимата в животноводческом помещении 1.02 MB
  Состояние микроклимата закрытых животноводческих помещений определяет комплекс физических факторов температура влажность движение воздуха солнечная радиация атмосферное давление освещение и ионизация газовый состав воздуха кислород углекислый газ аммиак сероводород и др. Описание работы технологической линии ОВС включает калорифер радиальный центробежный вентилятор магистральный воздуховод и воздуховоды равномерной раздачи воздуха выходные отверстия которых оборудованы жалюзийными решетками. Отопительновентиляционная...