15701

КОРРЕЛЯЦИЯ И ПРОСТАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ

Лабораторная работа

Информатика, кибернетика и программирование

Лабораторная работа 3. Корреляция и простая линейная регрессия Коэффициент корреляции это показатель степени связи. Он изменяется от 1 до 1. Величина по модулю коэффициента корреляции показывает силу связи чем больше величина тем сильнее с

Русский

2013-06-15

109.5 KB

18 чел.

Лабораторная  работа 3.

Корреляция и простая линейная регрессия

Коэффициент корреляции – это показатель степени связи. Он изменяется от –1 до +1. Величина (по модулю) коэффициента корреляции показывает силу связи (чем больше величина, тем сильнее связь). Знак коэффициента корреляции показывает направление отношений (“+” - прямая зависимость, “-” – обратная).

Задание 3: поможем студенту сделать курсовую работу! 

Студент пишет курсовую работу на тему «Взаимозависимость личностных и профессиональных качеств». Он собрал у испытуемых (студентов ФФСН в прошлом году) следующие данные:

  1.  Показатель, характеризующий какой вы друг (переменная FRIEND) – изменяется от 10 до 30 баллов.

Если вы набрали от 21 до 30 баллов, то вы действительно хороший друг. Ваши друзья верят вам и восхищаются вами. Если вы набрали от 15 до 20 баллов, то, как и большинство из нас, иногда не проявляете в отношениях с друзьями должного понимания. Если вы набрали от 10 до 14 баллов, то склонны больше обращать внимания на себя, чем на окружающих. Эта черта – барьер перед подлинной дружбой.

  1.  Показатель, характеризующий какой вы психолог (переменная PSYCHOL) – изменяется от 10 до 38 баллов. Сумма 35 и более баллов: вам очень легко составить мнение о человеке, вам достаточно посмотреть на кого-либо, и вы уже знаете, что он за птица. От 26 до 34 баллов: вы умеете объективно оценивать ситуации и окружающих, у вас действительно есть «нюх» на людей, и для вас не составит сложности угадать характер человека; из вас вышел бы отличный психолог. От 16 до 25 баллов: вы, как правило, не бываете уверены в своем мнении, легко принимаете постороннюю точку зрения, таким образом, ваша наблюдательность притупляется, и все это в конце концов может привести к тому, что вы вообще не сможете сформулировать свое самостоятельное мнение. 15 и менее баллов: вы .чрезвычайно доверчивы и судите о людях лишь по внешним признакам.
  2.  Уровень самооценки (переменная EVALUAT) – изменяется от 0 до 60 баллов.

Если уровень самооценки меньше 10 баллов, вам надо избавляться от чувства превосходства над окружающими, зазнайства, хвастовства. Если сумма превышает 30 баллов, то вы себя недооцениваете. Набранное количество баллов от 10 до 30 свидетельствует о психологической зрелости, которая проявляется прежде всего в адекватности самоотражения, т.е. реалистической оценке своих сил, возможностей, внешности.

  1.  Рост (в см) (переменная HEIGHT)
  2.  Размер обуви (переменная SIZE)
  3.  Средний балл за сданные сессии (переменная RATING)
  4.  Показатели по 8 шкалам теста Лири – изменяются от 0 до 16 баллов. Чем больше балл, тем ярче выражено личностное качество, определяемое шкалой:
  5.  Властный-лидирующий (переменная LIRY_1)
  6.  Независимый-доминирующий (переменная LIRY_2)
  7.  Прямолинейный-агрессивный (переменная LIRY_3)
  8.  Недоверчиво-скептический (переменная LIRY_4)
  9.  Покорно-застенчивый (переменная LIRY_5)
  10.  Зависимый-послушный (переменная LIRY_6)
  11.  Сотрудничающий-конвенциальный (переменная LIRY_7)
  12.  Ответственно-великодушный (переменная LIRY_8)

Надо помочь студенту провести корреляционный анализ и правильно интерпретировать результаты.

  1.  Загрузите файл данных.
    1.  Скопируйте файл Correlation.xls в свою рабочую папку.
    2.  Запустите программу STATISTICA.
    3.  Импортируйте файл Correlation.xls:  File  Open

В графе «Тип файла» выберите Excel Files (*.xls). Найдите нужный файл в своей папке и нажмите кнопку Открыть. Появится окно Opening file. Нажмите кнопку Import selected sheet to a Spreadsheet. Это значит, что надо импортировать только один лист из всего файла. (Если вы захотите импортировать все листы, нажмете кнопку Import all sheets to a Workbook). Согласитесь импортировать лист под названием «Данные». Когда нажмете кнопку ОК, увидите окно Open Excel File. Как правило, программа сама правильно определяет ту часть файла, которую надо импортировать, но на всякий случай проверьте: должно быть 14 переменных и 101 наблюдение. Теперь задайте дополнительные требования:

 Get case names from the 1st column of specified rangeпервый столбец превращается 

в имена (или номера) наблюдений

Get variable names from the 1st row of specified rangeпервая строчка превращается 

в имена переменных

Import cell formattingимпортировать формат ячеек 

Нажмите ОК и сохраните файл под удобным для вас названием. Правда, получилось очень красиво?

2. Подсчет коэффициента корреляции Пирсона.

Коэффициент корреляции Пирсона можно посчитать так

Statistics  Basic Statistics/Tables Correlation Matrices

2.1 Загрузим этот модуль Statistics  Basic Statistics/Tables Correlation Matrices   Вы попадаете в окно, где можно задать различные условия подсчета коэффициентов корреляции

Закладка Quick:

Выбор переменных:

One variable list – задаем все переменные, которые нас интересуют, в результате получается квадратная матрица корреляций всех переменных со всеми

Two lists (rect. matrix) – задаем два списка переменных, в результате получается прямоугольная матрица корреляций.

Summary: Correlation matrix – кнопка, которую нажимаем в самом конце, когда все условия заданы. Она, как и кнопка Summary, служит для вычисления коэффициентов корреляции.

Scatterplot Matrix for selected variables – показывает матричную диаграмму рассеяния, по которой можно приблизительно оценить силу и направление связи.

Закладка Advanced/Plot:

Тут добавляются еще кнопки

- это кнопка, которая служит для сохранения корреляционной матрицы в виде файла данных программы STSTISTICA. Такая матрица может понадобиться вам для проведения каких-либо более сложных анализов.

2D Scatterp. – показывает диаграмму рассеяния с коэффициентом корреляции, регрессионной прямой и ее уравнением, а также доверительный эллипс

3D Scatterp. – показывает трехмерную диаграмму рассеяния и больше ничего.

Categ. Scatterp. – очень интересная диаграмма рассеяния, которая позволяет рассмотреть отдельно разные группы испытуемых (как пользоваться этой кнопкой, описано ниже)

Закладка Options (выбираем условия вычислений):

Display simple matrix (highlight p) – корреляционная матрица в самом компактном виде (значимые коэффициенты корреляции выделены красным цветом)

Display r, p-levels, and N’s – кроме коэффициентов корреляции приведены точные значения уровня статистической значимости для каждого коэффициента и число пар значений, использовавшихся для подсчета; информации больше, но вид у матрицы более громоздкий

Display detailed table of results – вывод результатов не в матричной форме; кроме коэффициентов корреляции посчитаны средние значения, стандартные отклонения, r2, регрессионные коэффициенты и др.

Display long variable names – при выводе результатов указывается длинное имя переменной (или формула, по которой вычислялась переменная), если оно было задано (задать длинное имя можно в том же окне, где и формулу для вычисления переменной: двойной щелчок мыши на название переменной)

Extended precision calculations – повышенная точность вычислений – стоит использовать это условие для «трудных» данных, когда одна или несколько переменных имеют очень маленькие относительные дисперсии (например, стандартное отклонение, деленное на среднее, меньше, чем 0,0000000000001)

Обратите внимание, что для всех закладок доступны следующие возможности:

MD deletion – обработка пропусков

Casewise – если помечено это условие, то из анализа исключаются все (!) испытуемые, у которых нет хотя бы одного показателя;

Pairwise – если помечено это условие, то испытуемые исключаются из анализа только тех коэффициентов корреляции, куда входят переменные, у которых не хватает значений

  1.  Посчитайте корреляционную матрицу для всех переменных, сначала пометив условие Casewise Deletion of MD, а затем Pairwise. Сравните получившиеся матрицы. Есть ли разница?
    1.  Теперь посчитайте корреляционную матрицу, отметив условие Display r, p-levels, and N’s. Найдите на матрице точные значения уровня статистической значимости коэффициента корреляции. Какой вид матрицы вам нравится больше?
    2.  Посчитайте корреляционную матрицу, отметив условие Detailed table of results. Попробуйте найти средние значения и стандартные отклонения для переменных PSYCHOL и FRIEND, а также коэффициенты регрессионной прямой.
    3.  Постройте диаграммы рассеяния для переменных PSYCHOL и FRIEND. Проверьте, есть ли на диаграмме выбросы (экстремальные значения). Попробуйте удалить такой выброс и заново построить диаграмму рассеяния. Что изменилось?
    4.  Постройте диаграмму рассеяния для всех остальных пар переменных. Оцените направление и силу зависимости. Найдите на графике регрессионную прямую и ее уравнение.
    5.  Определите, насколько вы станете лучше как психолог, если ваша самооценка улучшится на 1 балл.
    6.  Определите, как изменится размер вашей обуви, если вы вырастете еще на 10 см. А на сколько при этом изменится ваша «завимость-послушность» (значения по шкале 6 теста Лири)?
    7.  Проанализируйте зависимость между ростом и средним баллом. Определите, какой у вас будет средний балл в зимнюю сессию при вашем росте.
    8.  Можно ли предсказать средний балл по какой-либо шкале теста Лири?
    9.  Попробуем теперь, что дает кнопка Categ. Scatterp. (закладка Advanced/Plot). Для этого выберите только две переменные для подсчета коэффициента корреляции – PSYCHOL и FRIEND. Нажмите кнопку Categ. Scatterp. В появившемся окне опять выберите эти же переменные – одну справа, а другую слева. Нажмите ОК. Появится еще одно окно со списком всех переменных. Предположим, что мы хотим оценить связь между «психологией» и «дружбой» у тех, кто учится на 7, и тех, кто учится на 8. Поэтому в появившемся окне слева выберем переменную RATING. Нажмем на ОК и в появившемся маленьком окошке наберем интересующие нас уровни этой переменной – 7 и 8 через пробел или запятую. Нажмите на ОК и полюбуйтесь диаграммами рассеяния. Такие диаграмму удобно строить, например, для группы мужчин и для группы женщин, т.е. каждый раз, когда вы хотите рассмотреть связи в частях выборки.

  1.  Подсчет коэффициентов корреляции для шкал порядка.

Если данные у вас непаметрические, то следует считать другие коэффициенты корреляции. Их в программе STATISTICA целых три: Спирмена, Кендалла и G. Тау Кендалла эквивалентен коэффициенту корреляции Спирмена по вычислительной мощности, однако отличается от него по величине, потому что логика вычислений и формулы разные. Эти коэффициенты также имеют различные интерпретации. Коэффициент корреляции Спирмена может быть интерпретирован, как и коэффициент корреляции Пирсона, в терминах объясненной дисперсии (разброса данных). Тау Кендалла представляет собой вероятность, т.е. это разность между вероятностью того, что данные двух переменных упорядочены одинаково, и вероятностью того, что данные двух переменных упорядочены по-разному. Гамма (G) предпочтительнее коэффициентов Спирмена и Кендалла, когда данные имеют много связанных наблюдений (одинаковых). По интерпретации Гамма больше похожа на коэффициент корреляции Кендалла (это тоже вероятность)

Все эти коэффициенты корреляции можно посчитать в модуле

Statistics Nonparametric Statistics Correlations (Spearman, Kendall tau, gamma)

  •  

Загрузите этот модуль. Вы попадаете в окно, где можно задать различные условия подсчета коэффициентов корреляции:

  1.  Посчитайте корреляционную матрицу, используя коэффициент корреляции Спирмена. Определите значимость коэффициентов корреляции.
    1.  Сравните матрицу корреляций Пирсона с матрицей корреляций Спирмена. Какие коэффициенты больше по абсолютной величине? Какой коэффициент корреляции (параметрический или непараметрический) следует использовать для этих данных?
    2.  Посчитайте корреляционную матрицу, используя коэффициент корреляции Кендалла. Определите значимость коэффициентов корреляции. Сравните с матрицей коэффициентов Спирмена. Что изменилось?
    3.  Посчитайте корреляционную матрицу, используя коэффициент корреляции Гамма. Определите значимость коэффициентов корреляции. Сравните с матрицей коэффициентов Спирмена и Кендалла. Какой из непараметрических коэффициентов корреляции кажется вам наиболее подходящим?

4. Напишите отчет в MS Word, используя таблицы и графики, которые считаете нужными. Этот отчет должен представлять собой анализ и интерпретацию данных для курсовой работы

  •  Для отчета выберите подходящий коэффициент корреляции (Пирсона или Спирмена) и обязательно обоснуйте свой выбор.
  •  Если вы исключали из анализа какие-либо данные (например, выбросы), то это должно быть обязательно отмечено в отчете.
  •  Обязательно приведите в отчете корреляционную матрицу, укажите уровень статистической значимости коэффициентов
  •  Обязательно проинтерпретируйте все возможные коэффициенты корреляции. Попробуйте объяснить с психологической точки зрения получившиеся зависимости. Что можно сказать о взаимозависимости личностных и профессиональных качеств?

 

А также другие работы, которые могут Вас заинтересовать

32191. Тактические особенности допроса несовершеннолетнего обвиняемого 27.5 KB
  Тактика допроса несовершеннолетних в значительной степени обусловлена особенностями их психики повышенной внушаемостью и самовнушаемостью склонностью к фантазированию высокой эмоциональностью неустойчивостью поведения и др. Наоборот на несовершеннолетних в возрасте 15 17 лет официальная обстановка места допроса оказывает положительное влияние: проникаясь чувством ответственности они скорее скажут правду. Ложные показания несовершеннолетних в возрасте до 14 лет помимо сознательного отказа говорить правду могут объясняться самовнушением...
32192. Понятие предъявления для опознания. Его виды 27 KB
  Понятие предъявления для опознания. Предъявление для опознания следственное действие осуществляемое в регламентируемом уголовнопроцессуальным законом порядке и состоящее в том что свидетель потерпевший подозреваемый или обвиняемый обозревает предъявленные ему сходные объекты мысленно сопоставляет их признаки с запечатленным в его памяти образом и решает вопрос о наличии или отсутствии тождества либо групповой принадлежности. Суть опознания объекта состоит в его идентификации по чувственноконкретному отображению сохранившемуся в...
32193. Тактические особенности допроса несовершеннолетнего свидетеля 28.5 KB
  Тактические особенности допроса несовершеннолетнего свидетеля. Тактика допроса несовершеннолетнего строится с учетом его возрастных особенностей. При подготовке к допросу необходимо получить сведения об уровне развития несовершеннолетнего его интересах склонностях привычках своеобразии семейной микросреды взаимоотношениях с лицом в отношении которого будет проводиться допрос. Эти лица должны быть предупреждены о недопустимости какихлибо подсказок наводящих вопросов назидательного тона раздражения в отношении несовершеннолетнего.
32194. Тактические основы проверки показаний на месте 30.5 KB
  Тактические основы проверки показаний на месте. Проверка показаний на месте должна быть организована проведена а ее результаты зафиксированы так чтобы впоследствии не возникло сомнений в объективности производства этого следственного действия. При проверке показаний нескольких лиц проверка производится с каждым из них по отдельности и так чтобы они не могли общаться друг с другом и особенно с лицами чьи показания на месте уже проверены. Понятым нужно разъяснить сущность следственного действия и объяснить что они должны не просто...
32195. Тактика задержания и личного обыска 33 KB
  Тактика задержания и личного обыска Задержание это неотложное следственное действие с целью захватить лицо подозреваемое в совершении преступления доставить и водворить в изолятор временного содержания. Подготовка к задержанию и аресту включает в себя: 1 изучение лица подлежащего задержанию и аресту; 2 определение времени и места задержания; 3 решение вопроса о количественном и персональном составе группы задержания; 4 определение обязанностей участников задержания какие действия и в какой последовательности им надлежит совершать до...
32196. Особенности предъявления для опознания трупов 28.5 KB
  Особенности предъявления для опознания трупов Трупы предъявляются для опознания в тех случаях когда нет возможности установить личность умершего по документам либо когда внешность трупа значительно изменена. При обнаружении такого трупа прежде всего устанавливают кто из жителей данной местности региона города поселка деревни пропал без вести. Раздельное предъявление трупа и предметов находившихся при нем одежда очки дипломат трость часы и т. позволяют точнее соблюсти норму закона о порядке предъявления каждого из объектов...
32197. Понятие следственной ситуации. Классификация следственных ситуаций и их роль в раскрытии и расследовании преступлений 34.5 KB
  Понятие следственной ситуации. Характеристика следственной ситуации носит по отношению к процессу расследования преимущественно внешний характер: это характеристика условий в которых протекает данный процесс. Объективные факторы это те не зависящие от участников расследования причины которые вызывают изменения ситуации; субъективные факторы причины порождаемые действиями и поведением участников расследования и иных лиц оказавшихся в той или иной степени втянутыми в сферу судопроизводства. Сочетание всех этих компонентов обусловливает...
32198. Соотношение следственного действия, тактического приема и нормы права 23.5 KB
  Соотношение следственного действия тактического приема и нормы права. Следственные действия действия по собиранию и проверке доказательств осуществляемые следователем органом дознания прокурором судом в установленном законом порядке. Следственными действиями являются: допрос очная ставка обыск и выемка арест имущества осмотр и освидетельствование предъявление для опознания людей и предметов следственный эксперимент. Тактический прием адекватный ситуации способ воздействия на объект документ предмет человека способствующий...
32199. Особенности производства очной ставки с участием н/летних 30.5 KB
  Особенности производства очной ставки с участием н летних. Принимая решение о производстве очной ставки с участием несовершеннолетних особенно малолетних следователь прежде всего должен учитывать особенности их психики и влияние этих особенностей на ход и результаты очной ставки. К тому же несовершеннолетним особенно малолетним нередко присущи фантазия преувеличение иллюзии воображение подражание что служит причиной многих ошибок в показаниях Если же возникшее противоречие иным путем устранить не удалось перед следователем встает...