422

Построение эмпирических формул методом наименьших квадратов

Курсовая

Информатика, кибернетика и программирование

Нахождение эмпирических формул методом наименьших квадратов (МНК) посредством возможностей пакета Microsoft Excel, Mathcad, MATLAB. Уравнения различных видов с помощью аппроксимации линейной, квадратичной и экспоненциальной зависимостей.

Русский

2013-01-06

575.5 KB

305 чел.

Министерство образования и науки Российской Федерации

Национальный минерально-сырьевой университет «Горный»

КУРСОВАЯ РАБОТА

по дисциплине  _Информатика ______________________________________________

_____________________________________  ___________________________________

(наименование учебной дисциплины согласно учебному плану)

ПОЯСНИТЕЛЬНАЯ ЗАПИСКА

Тема: Построение эмпирических формул методом наименьших квадратов

Автор: студент гр.   __ММ-11___       __________________    /Бондаренко П.П./                            (шифр группы)                  (подпись)       (Ф.И.О.)

ОЦЕНКА: _____________

Дата: _____________

ПРОВЕРИЛ:

Руководитель работы     _Доцент __         ____________        /Саттарова Н. И. /

             (должность)                         (подпись)                                         (Ф.И.О.)

Санкт-Петербург

2012

Аннотация

Пояснительная записка представляет собой отчет о выполнении курсовой работы. В ней рассматриваются вопросы по нахождению эмпирических формул методом наименьших квадратов (МНК) посредством возможностей пакета Microsoft Excel, Mathcad, MATLAB. В работе получены уравнения различных видов с помощью аппроксимации линейной, квадратичной и экспоненциальной зависимостей. По окончании работы сделан вывод, каким методом задача решена лучше всего.

Страниц 34, рисунков 21.

Abstract

The explanatory note represents the report on term paper performance. In it questions on a finding of empirical formulas by a method of the least squares (МНК) by means of possibilities of package Microsoft Excel, Mathcad, MATLAB are considered.. In work the equations of various kinds by means of approximation linear, square-law and экспоненциальной dependences are received. Upon termination of work the conclusion is drawn, the problem is solved by what method is better.

Pages 34, figures 21.

Оглавление

Аннотация

Введение

Теоретические сведения.

Задание.

Расчёт с помощью таблиц, выполненных средствами Microsoft Excel.

Расчеты в системе Mathcad.

Заключение.

Список литературы


Введение

Аппроксимация (от латинского "approximare" - "приближаться") - приближенное выражение каких-либо математических объектов (например, чисел или функций) через другие более простые, более удобные в использовании или просто более известные. В научных исследованиях аппроксимация применяется для описания, анализа, обобщения и дальнейшего использования эмпирических результатов. Целью курсовой работы является углубление знаний по информатике, развитие и закрепление навыков работы с табличным процессором Microsoft Excel, и применение  их  для  решения  с помощью ЭВМ задач из предметной области, связанной с исследованиями.  

В каждом задании формулируются условия задачи, исходные данные, форма выдачи результатов, указываются основные математические зависимости для решения задачи. В соответствии с методом решения задачи разрабатывается алгоритм решения, который представляется в графической форме. Поставленные задачи анализа данных так же можно решить с помощью инструментария MATLAB. Контрольный расчет  в среде Mathcad позволяет убедиться в правильности решения задачи.

Теоретические сведения.

Построение эмпирических формул методом наименьших квадратов.

Метод наименьших квадратов (МНК) – один из методов теории ошибок для оценки неизвестных величин по результатам измерений, содержащим случайные ошибки.

Метод наименьших квадратов применяют также для приближенного представления заданной функции другими (более простыми) функциями и часто МНК   оказывается полезным при обработке наблюдений.  

Очень часто, особенно при анализе эмпирических данных возникает необходимость найти в явном виде  функциональную зависимость  между величинами x и y , которые получены в результате измерений.

При аналитическом исследовании взаимосвязи между двумя величинами x и y производят ряд наблюдений, и в результате получается таблица значений (Рис.1):

X

x1

x2

xi

xn

Y

y1

y2

yi

yn

Эта таблица обычно получается как итог каких-либо экспериментов, в которых xi (независимая величина) задается экспериментатором, а yi получается в результате опыта. Поэтому значения yi называются опытными или эмпирическими значениями. Между величинами x и y существует функциональная зависимость, но её аналитический вид обычно неизвестен, поэтому возникает практически важная задача – найти эмпирическую формулу:

          (1)

(где - параметры), значения которой при возможно мало отличались бы от опытных значений

Обычно указывается класс функций (например, множество линейных, степенных, показательных и т. п.), из которого выбирается функция , и далее определяются наилучшие значения параметров.

Если в эмпирическую формулу (1) подставить исходные , то  получим теоретические значения , где

Согласно методу наименьших квадратов, наилучшими коэффициентами  считаются те, для которых сумма квадратов отклонений найденной эмпирической функции от заданных значений функции

      (2)

будет минимальной.

Геометрический смысл метода наименьших квадратов.

Каждая пара чисел из исходной таблицы определяет точку на плоскости XOY. Используя формулу (1) при различных значениях коэффициентов  можно построить ряд кривых, которые являются графиками функции (1). Задача состоит в определении коэффициентов  таким образом, чтобы сумма квадратов расстояний по вертикали от точек до графика функции (1) была наименьшей (рис. 2).

       

                                     y                                                                                                                                 

                                       yn      Мn

 

                                       yi                    Мi

        

           di

  y1    М1           M3  

                                      

      М4           Мi+1

                                         y2                                    М2

                                                     

                                                                                    

                                                    x1             x2                               xi                                                        xn       x      

  

Построение эмпирической формулы состоит из двух этапов: выяснение общего вида формулы и определение её наилучших параметров.

Если неизвестен характер зависимости между данными величинами x и  y, то вид эмпирической зависимости является произвольным. Предпочтение отдается простым формулам, обладающим хорошей точностью. Удачный выбор эмпирической формулы в значительной мере зависит от знаний исследователя в предметной области, используя которые, он может указать класс функций из теоретических соображений. Большое значение имеет  изображение полученных данных в декартовых иди специальных системах координат (полулогарифмической, логарифмической и т. д.). По положению точек можно примерно угадать общий вид зависимости путем установления сходства между построенным графиком и образцами известных кривых.

Определение наилучших коэффициентов , входящих в эмпирическую формулу производят хорошо известными аналитическими методами.

Для того, чтобы найти набор коэффициентов , которые доставляют минимум функции S, определяемой формулой (2), используем необходимое условие экстремума функции нескольких переменных – равенство нулю частных производных. В результате получим нормальную систему для определения коэффициентов

          (3)

Значит, нахождение коэффициентов  сводится к решению системы (3).

Эта система упрощается, если эмпирическая формула (1) линейна относительно параметров , тогда система (3) будет линейной. Конкретный вид системы (3) зависит от того, из какого класса эмпирических формул находится зависимость (1). В случае линейной зависимости система примет вид:

(4)

Эта линейная система может быть решена любым известным методом (методом Гаусса, простых итераций, методом Крамера). В случае квадратичной зависимости  система (3) примет вид:

         (5)

Линеаризация экспотенциальной зависимости.

В ряде случаев в качестве эмпирической формулы  берут функцию в которую неопределенные коэффициенты входят нелинейно. При этом иногда задачу удается линеаризовать т. е. свести к линейной. К числу таких зависимостей относится экспотенциальная зависимость:

   (6)

где и  неопределенные коэффициенты.

         Линеаризация достигается путем логарифмирования равенства (6), после чего получаем соотношение:

                (7)

Обозначим и соответственно через t и c, тогда зависимость (6) может быть записана в виде , что позволяет применить формулы (4) с заменой на c и на .

Элементы  теории корреляции.

Коэффициент корреляции является мерой линейной связи между зависимыми случайными величинами: он показывает, насколько хорошо в среднем может быть представлена одна из величин в виде линейной функции от другой.

Коэффициент корреляции вычисляется по формуле:

,                                                                         (8)

где    , и   среднее арифметическое значение соответственно по x и y.

Коэффициент корреляции между случайными величинами по абсолютной величине не больше 1. Чем ближе  к 1, тем теснее линейная связь между x и y.

В случае нелинейной корреляционнной связи условные средние значения располагаются около кривой линии. В этом случае в качестве характеристики силы связи рекомендуется использовать корреляционное отношение, интерпретация которого не зависит от вида исследуемой зависимости.

Корреляционное отношение вычисляется по формуле:

,                                                                           (9)

где  , а числитель характеризует рассеяние условных средних  около безусловного среднего .

Всегда . Равенство  соответствует некоррелированным случайным величинам;  тогда и только тогда, когда имеется точная функциональная связь между y и x. В случае линейной зависимости y от x корреляционное отношение совпадает с квадратом коэффициента корреляции. Величина  используется в качестве индикатора отклонения регрессии от линейной.

Корреляционное отношение является мерой корреляционной связи y с x в какой угодно форме, но не может дать представления о степени приближенности эмпирических данных к специальной форме. Чтобы выяснить насколько точно построенная кривая отражает эмпирические данные вводится еще одна характеристика коэффициент детерминированности.

Для его описания рассмотрим следующие величины.  - полная сумма квадратов, где  среднее значение  .

Можно доказать следующее равенство      .

Первое слагаемое равно  и называется остаточной суммой квадратов. Оно характеризует отклонение экспериментальных данных от теоретических.

Второе слагаемое равно и называется регрессионной суммой квадратов и оно характеризует разброс данных.

Очевидно, что справедливо следующее равенство  .

Коэффициент детерминированности определяется по формуле:            .             (10)

Чем меньше остаточная сумма квадратов по сравнению с общей суммой квадратов, тем больше значение коэффициента детерминированности , который показывает, насколько хорошо уравнение, полученное с помощью регрессионного анализа, объясняет взаимосвязи между переменными. Если он равен 1, то имеет место полная корреляция с моделью, т.е. нет различия между фактическим и оценочным значениями  y. В противоположном случае, если коэффициент детерминированности равен 0, то уравнение регрессии неудачно для предсказания значений y

Коэффициент детерминированности всегда не превосходит корреляционное отношение. В случае, когда выполняется равенство  то можно считать, что построенная эмпирическая формула наиболее точно отражает эмпирические данные.

Задание.

Постановка задачи.

Приведены экспериментальные данные о содержании ионов Cl- (с, мг-экв/л) и плотность (p, кг/м3), поступающей в скважину вместе с нефтью. Необходимо исследовать эмпирическую зависимость содержания ионов Cl- от плотности воды, поступающей в скважину вместе с нефтью, построить графики уравнений зависимости. вычислить и сравнить коэффициенты детерминированности общего и "специализированного" уравнений, вычислить абсолютную и относительную разницу прогнозных значений.

Исходные данные.

Приведены экспериментальные данные (Рис. 3.) о насыщении подземных вод газом  и общей минерализации.

Общая минерализация, г/л

Коэффициент насыщения

x

y

20,6

0,4

21,3

0,54

22,4

0,59

22,5

0,42

23,6

0,41

25

0,7

27,6

0,82

29

0,83

30,4

0,64

31,1

0,76

31,3

0,86

32,3

0,73

33,2

0,86

34,2

0,84

35,2

0,96

36

0,89

36,4

0,86

37,5

0,9

37,5

0,86

38,3

0,99

38,8

0,88

39,2

0,95

41

0,99

43,1

1,07

43,7

1,02

43,8

0,99


Расчёт с помощью таблиц, выполненных средствами
Microsoft Excel.

Расчет коэффициентов «специализированного» уравнения.

Для проведения расчётов, данные целесообразно расположить в виде таблицы, (Рис.4-5.) используя средства табличного процессора Microsoft Excel.

Пояснение к составлению таблицы в среде MS Excel, представленной на рис. 4.

Для определения коэффициентов зависимости необходимо:

- в ячейки В7-В32 вводим значения общей минерализации;

- в ячейки С7-С32 вводим значения коэффициента насыщения;

- В ячейку D7 вводится формула =B7*В7 и копируется до ячейки D32;

- В ячейку E7 вводится формула =В7*С7 и копируется до ячейки E32;

- В ячейку F7 вводится формула =C7-$C$34 и копируется до ячейки F32;

- В ячейку G7 вводится формула =F7^2и копируется до ячейки G32;

После этого считаем суммы получившихся значений (с помощью автосуммы ), для этого в ячейку B33 вводим формулу = СУММ(B7:B32), после чего копируем ее до ячейки L33, пропустив ячейку D33.

Так же необходимо посчитать средние значения ρ и с, для этого в ячейку В34вводим формулу =СРЗНАЧ(В7:В32) и в ячейку С34 формулу =СРЗНАЧ(С7:С32) соответственно.

Коэффициент корреляции r в ячейке В36, (в ячейку В36 введем формулу =КОРРЕЛ(В7:В32;С7:С32) равен 0,911. Это значение близко к единице, следовательно, коэффициент насыщения и общая минерализация связанны линейной зависимостью.

Коэффициент с коэффициента насыщения, характеризующий концентрацию, находится в ячейке F36 и в данном случае равен 0.024 (для этого в ячейке F36 необходимо ввести формулу =E33/D32). Итак, искомое специализированное уравнение имеет вид:

(11)

Вычислим коэффициент детерминированности R2, (Рис. 6-7.) значение которого равно  0,831. Для этого в ячейку I35 введем формулу =1-J33/G33. Коэффициент примерно равен единице, значит, что «специализированное» уравнение составлено верно.

 Рис. 6. Расчеты для «специализированного» уравнения на листе  MS Excel в режиме отображения данных (окончание).

 Рис. 7. Расчеты для «специализированного» уравнения на листе  MS Excel в режиме отображения формул (окончание).

Пояснение к составлению таблицы в среде MS Excel, представленной на рис. 6.

- В ячейку H7 вводится формула ==$E$43*B7+$E$42 и копируется до ячейки H32;

- В ячейку I7 вводится формула =H7-C7, копируется до ячейки I32;

- В ячейку J7 вводится формула =I7^2 и копируется до ячейки J32;

- В ячейку K7 вводится формула ==H7-$C$34 и копируется до ячейки K32;

- В ячейку L7 вводится формула =K7^2 и копируется до ячейки L32;

  1.  
    1.  Расчет коэффициентов «общего» уравнения.

Расчеты для определения коэффициентов «общего» уравнения с использованием MS Excel (Рис. 8-9.).

Рис. 8. Расчеты для «общего» уравнения на листе  MS Excel 

в режиме отображения данных (начало).

Рис. 9. Расчеты для «общего» уравнения на листе  MS Excel 

в режиме отображения формул (начало).

При этом коэффициенты системы (4) определяются интервалом ячеек В33:D33. Таким образом, система нормальных уравнений принимает вид:

Коэффициенты матрицы системы содержатся в интервале ячеек B39:C40; вектор правых частей – в интервале ячеек Е39:Е40. Для нахождение решения используется обратная матрица, которая в ячейках В42:С43. Вектор решения в интервале ячеек Е42:Е43.

Следовательно, а1=-0.0065, а2= 0.0244. А уравнение общего вида  записывается так:  

«Общее» уравнение так же верно описывает эмпирические данные, как и «специализированное» уравнение, для которого коэффициент равен 0,831

Расчет прогнозных значений.

Расчеты по этим уравнениям прогнозных значений величины коэффициента насыщения, если общая минерализация равна заданному значению ρпрогноз, эти значения приведены на рисунках 10-11.

Рис. 10. Решение задачи. Расчеты для определения прогнозного значения на листе  MS Excel 

в режиме отображения данных.

Рис. 11. Решение задачи. Расчеты для определения прогнозного значения на листе  MS Excel 

в режиме отображения формул.

Для определения величины ρпрогноз в ячейку C47 вводим формулу, соответствующую выражению: ,

Где ρmax и ρmin – максимальное и минимальное значение плотности, в таблице на интервале ячеек B7:Е32.

В результате получаем значение ρпрогноз, равное 41.48. Для вычисления прогнозных значений величины содержания ионов, подставим это значение полученные уравнения. Полученные прогнозные значения величин содержащихся ионов для «специализированного» и «общего» уравнений находятся в ячейках D51 и D52. А абсолютная и относительная разности прогнозных значений приведены в ячейках Е51 и F51.

Построение Графиков зависимости насыщения подземных вод газом от общей минерализации.

Коэффициент с зависимости можно найти с помощью средств MS Excel, а именно, возможностью средства «Диаграмма-Тренд». Для этого на вкладке параметры необходимо установить отметку в элементе управления с надписью «пересечение прямой с осью Y в точке 0».

 

Рис. 12. Решение задачи. Построение средством «Диаграмма-Тренд»
зависимости для «специализированного» уравнения на листе  
MS Excel.

Коэффициенты уравнения «общего» вида так же определяются средствами MS Excel «Диаграмма-Тренд». При данном построении все полученные данные так же совпали с рассчитанными значениями.

Рис. 13. Решение задачи. Построение средством «Диаграмма-Тренд»
зависимости для «общего» уравнения на листе  
MS Excel.


Расчеты в системе Mathcad.

Для проведения расчетов в системе Mathcad необходимо записать исходные данные в текстовом файле. При этом нужно скопировать данные из ячеек В7:С32 и перенести их в текстовый файл, созданный при помощи редактора «Блокнот». Затем сохраняем полученный файл с именем mnk_oil.txt. (Рис. 14).

Для ввода данных в рабочую область Mathcad используется команда Вставка→ Компонент из главного меню Mathcad. После этого выполняется ввод данных, а результат находится в двумерном массиве W. Затем, эти данные присваиваются одномерным массивам х и у, с которыми и производятся дальнейшие операции.

Решение Задачи в системе Mathcad представлено на рисунках 15-21

 

Заключение.

Основные выводы по решению задачи. Все вычисленные величины и коэффициенты зависимостей в системе Mathcad полностью совпали с соответствующими значениями, вычисленными в MS Excel.

Эмпирические зависимости коэффициента насыщения от общей минерализации (ρ , г/л) могут быть записаны в виде:

- «специализированное» уравнение;

- уравнение «общего» вида.

Графики этих зависимостей, приведённые на рис.12-13, отличаются весьма незначительно. Поэтому, для описания зависимости коэффициента насыщения от общей минерализации можно использовать «специализированное» уравнение, так и «общее».

Прогнозные значения коэффициента насыщения, вычисленные по этим уравнениям при ρпрогиозн =1162 равны 1,0075 и 1,0088. Отклонение этих величин незначительно и равно 0,13%. 

Список литературы:

  1.  Демидович Б.П., Марон И.А.. Основы вычислительной математики. М.: Государственное издательство физико-математической литературы, 1963.

  1.  Информатика. Информационные процессы в переработке нефти и газа: Методические указания к курсовой работе/Санкт-Петербургский государственный горный институт (технический университет). Сост.: Беляев В.В., Саттарова Н.И. СПб, 2011. 46 с.

  1.  Информатика: Практикум по технологии работы на компьютере/ Под ред. проф. Н.В. Макаровой. М.: Финансы и статистика, 1997.

  1.  Информатика: Учебник/Под ред. проф. Н.В. Макаровой. М.: Финансы и статистика, 1997.

  1.  Очков В.Ф. Mathcad 14 для студентов и инженеров; русская версия. СПб.: BHV-Петербург. 2009, 512 с.


 

А также другие работы, которые могут Вас заинтересовать

73907. Українська школа марженалізму на межі 18-20 століття. М. І. Туган-Барановський, О. Білімович, р. Орженецький, М. Ковалевський, Є. Слуцький, А. Антонович 46 KB
  Він детально викладає теорію цінності Менгера підтримує критику австрійською школою трудової теорії вартості і особливо теорії вартості К. Білимович бачить заслугу австрійської школи саме в тім що вона виступила проти трудової теорії вартості завдяки чому всі теоретичні розробки Маркса положення про двоїстий характер праці робочу силу як товар додаткову вартість як і вся теорія експлуатації зависла у повітрі1. Сприйняття і пропаганду суб\'єктивнопсихологічної теорії цінності австрійської школи в Росії й Україні було доповнено...
73908. Революційно-демократичний напрям економічної думки в Україні. АС. Подолинський, І. Франко, О. Терлецький, В Навроцький 61 KB
  Франко О. Франко та інші. Франко 1856 1916 великий український письменник мислитель історик філософ літературознавець. Франко дослідженню економіки Галичини становищу селянства й робітничого класу.
73909. Ліберальні напрями економічної думки в Україні в 19 столітті. М. Зібер, М. Драгоманов, М. Довнар-Запольський 33 KB
  Драгоманов М. Михайло Петрович Драгоманов 1841 1895 видатний український мислитель історик публіцист етнограф літературний критик. Драгоманова як політично неблагонадійного було звільнено з посади викладача. Драгоманова в розвитку української і національної ідеї.
73910. Сучасний монетаризм М. Фрідмен 57.5 KB
  Монетаризм являє собою одну з найвпливовіших шкіл сучасної економічної науки, що належать до некласичного напряму. Він розглядає явища господарського життя крізь призму процесів, що відбуваються у сфері грошового обігу...
73911. Економічна думка країн Давнього Сходу й Передньої Азії. Давньоєгипетські джерела. Закони Ешнунни. Ліпіт Іштара. Хаммурапі 28.5 KB
  До нашої доби дійшли Повчання гераклеопольського царя своєму синові Мерікара Проречення Іпусера Пророцтво Неферті Повчання Ахтоя сина Дуауфа своєму синові Піопі різні адміністративногосподарські та юридичні документи. Так наприклад Повчання гераклеопольського царя своєму синові Мерікара XXII ст. Тоді вони працюватимуть задля царя як один загін і не буде серед них бунтарів1. є закони вавилонського царя Хаммурапі.
73912. Економічна думка в Україні в пореформений період 19 століття. М. Бунге, Д. Піхно, С. Вітте, І. Сокальський 22 KB
  Бунге Д. Бунге професор згодом ректор Київського університету у 80ті рр. Бунге вказував на велике значення для розвитку політичної економії правильного визначення її предмета і вважав що складність такого визначення пояснюється позицією ліберальної економічної школи та соціалістів. Бунге критикував соціалістів за те що вони засуджували існуючий порядок і вбачали свій ідеал у новій організації праці у вигаданих формах суспільного устрою3.
73913. Створення К. Марксом і Ф. Енгельсом пролетарської політекономії : початок формування економічного вчення марксизму. Структура та основні проблеми “Капіталу” Пізні наукові праці 42 KB
  Структура та основні проблеми Капіталу Пізні наукові праці . Теоретичні проблеми Капіталу К. Кілька рукописних варіантів Капіталу 1857 1865 Критика політичної економії До критики політичної економії другий та третій попередні варіанти Капіталу у вигляді нарисів та закінчених теоретичних викладок давно були готові до друку однак Маркс намагався надати цьому твору характеру вичерпної логічно закінченої теорії. Однак вихід у світ одночасно всіх томів Капіталу не пощастило забезпечити: праця тривала надалі а...
73914. Маржинальна революція: австрійська школа “граничної корисності” (К. Менгер, Ф. Візер, О. Бьом-Баверек). Принципи економікс А. Маршалла 36.5 KB
  Маржинальна революція : австрійська школа граничної корисност К. Її теоретичними принципами були субєктивний ідеалізм та теорія граничної корисності. Центральне місце в концепціях австрійської школи посідає так звана теорія граничної корисності.Візер розвивав ідеї Менгера у працях Походження й основні закони господарської цінності 1884 Природна цінність 1889 Закон влади 1926 використовуючи принцип граничної корисності для оцінки вартості витрат виробництва.
73915. Релігія та демократія: конгруенція і конфлікт 35 KB
  За Андерсоном демократія може варіюватися проте в своїй основі вона повинна мати такі складові як рівність влада народу участь всіх конкуренція згода і в випадках ліберальної демократії захист прав меншинств та окремих індивідів. Якщо не пояснювати йдеться про політичну економічну соціальну рівність чи рівність можливостей то дана характеристика не може бути надійним покажчиком демократії. Щодо інших індикаторів демократії то вони також на мою думку є досить суперечливими проте за браком місця не будемо їх розглядати. Скажемо...