42083

Обработка базы данных с помощью Microsoft Office Excel

Лабораторная работа

Информатика, кибернетика и программирование

Приведенная ниже база данных служащих является выборочным пространством некоторого случайного эксперимента, в котором работник выбирается выборочным(случайным) способом. Будем считать, что один работник представляет один результат эксперимента и все возможные результаты равновероятны.

Русский

2013-10-27

1.15 MB

1 чел.

Министерство науки и образования Украины

Национальный технический университет Украины

«Киевский Политехнический Институт»

Факультет социологии и права

Лабораторная работа №2

по теории вероятности

на тему:

«Обработка базы данных с помощью

Microsoft Office Excel»

Выполнил

Студент 2-го курса

группы АМ-74

Балашов Дмитрий Валерьевич

Проверила

Бахтина Галина Петровна

Киев 2008

ЦЕЛЬ РАБОТЫ

При помощи компьютерной программы Microsoft Excel научится:

  •  Находить вероятность случайных событий;
  •  Находить условную вероятность событий;
  •  Делать выборку из базы данных при указанном условии;
  •  Строить дерево вероятности для указанной выборки;
  •  Определять независимые и несовместимые события.

ЗАДАНИЕ РАБОТЫ

1. Приведенная ниже база данных служащих является выборочным пространством некоторого случайного эксперимента, в котором работник выбирается выборочным(случайным) способом. Будем считать, что один работник представляет один результат эксперимента и все возможные результаты равновероятны.

1.1) найти вероятность того, что будет выбрана женщина;

1.2) найти вероятность того, что зарплата работника превышает $ 35000;

1.3) найти вероятность того, что работник имеет уровень подготовки В;

1.4) найти вероятность того, что зарплата превышает $ 35000 и работник имеет уровень подготовки В;

1.5) найти вероятность того, что зарплата превышает $ 35000 при условии, что работник имеет уровень подготовки В.

2. База данных служащих также выборочное пространство некоторого

случайного эксперимента. Рассмотрим два события: «большой опыт работы»( 6 лет и больше) и «служащий – женщина».

2.1) найти вероятность этих двух событий;

2.2) найти вероятность пересечения этих двух событий и дать интерпретацию этого пересечения;

2.3) построить дерево вероятности для этих двух событий, выбрав в качестве первой ветви «служащий-женщина»;

2.4) найти условную вероятность наличия большого опыта работы при условии, что служащий-женщина;

2.5) найти условную вероятность того, что служащий-женщина при наличии большого опыта работы;

2.6) найти условную вероятность того, что служащий-женщина не имеющая большого опыта работы;

2.7) являются ли эти два события независимыми? Откуда это следует?

2.8) являются ли эти два события несовместными? Откуда это следует?

3. Снова считаем вышеупомянутую базу данных выборочным пространством

3.1) являются ли события «Уровень подготовки А» и «Уровень подготовки В» независимыми? Откуда это следует?

3.2) являются ли события «Уровень подготовки А» и «Уровень подготовки В» несовместными? Откуда это следует?

БАЗА ДАННЫХ СЛУЖАЩИХ

Номер служащего

Заработная плата за год, долл.

Пол

Возраст, лет

Стаж роботы, лет

Уровень подготовки

1

32368

Ж

42

3

B

2

53174

Ч

54

10

B

3

52722

Ч

47

10

A

4

53423

Ч

47

1

B

5

50602

Ч

44

5

B

6

49033

Ч

42

10

A

7

24395

Ч

30

5

A

8

24395

Ж

52

6

A

9

43124

Ч

48

8

A

10

23978

Ж

58

4

A

11

53174

Ч

46

4

C

12

58515

Ч

36

8

C

13

56194

Ч

49

10

B

14

49037

Ж

55

10

B

15

44884

Ч

41

1

A

16

53429

Ж

52

5

B

17

46578

Ч

57

8

A

18

58968

Ж

61

10

B

19

53174

Ч

50

5

A

20

53627

Ч

47

10

B

21

49033

Ч

54

5

B

22

54981

Ч

47

7

A

23

62530

Ч

50

10

B

24

27525

Ж

38

3

A

25

24395

Ч

31

5

A

26

56884

Ч

47

10

A

27

52115

Ч

56

5

A

28

44183

Ж

38

5

B

29

24971

Ж

55

6

A

30

35423

Ж

47

4

A

31

41188

Ж

35

2

B

32

27525

Ж

35

3

A

33

35018

Ч

39

1

A

34

44183

Ч

41

2

A

35

35423

Ч

44

1

A

36

49033

Ч

53

8

A

37

40741

Ч

47

2

A

38

49033

Ч

42

10

A

39

56294

Ж

44

6

C

40

47180

Ж

45

5

C

41

46578

Ч

56

8

A

42

52722

Ч

38

8

C

43

51241

Ч

58

2

B

44

53627

Ч

52

8

A

45

53174

Ч

54

10

A

46

56294

Ч

49

10

B

47

49033

Ж

53

10

B

48

51241

Ч

56

1

C

49

35200

Ж

38

1

B

50

50174

Ж

42

5

A

51

24352

Ж

35

1

A

52

47180

Ж

40

3

A

53

49033

Ж

34

4

B

54

53174

Ж

35

1

A

55

53429

Ж

45

5

B

56

53627

Ч

54

10

A

57

26491

Ч

47

10

A

58

42961

Ж

45

7

B

59

53627

Ч

47

10

A

60

26491

Ж

46

7

A

61

42961

Ч

36

3

B

62

53174

Ч

45

5

A

63

36292

Ч

46

0

A

64

37292

Ч

47

1

A

65

41188

Ж

34

3

B

66

57242

Ж

45

7

C

67

53429

Ж

44

6

C

68

53174

Ч

50

10

B

69

44138

Ж

38

2

B

ТЕОРЕТИЧЕСКИЕ СВЕДЕНИЯ

Вероятность события – это отношение числа благоприятствующих этому событию исходов к общему числу всех равновозможных несовместимых элементарных исходов, образующих полную группу.

События обозначаются заглавными буквами латинского алфавита: A, В, С, ...

Пересечением называется такое событие, которое наступает при одновременном наступлении событий А и В.

Случайным событием (или просто событием) называется всякое явление, которое может произойти или не произойти при осуществлении определенной совокупности условий. Теория вероятностей имеет дело с такими событиями, которые имеют массовый характер. Это значит, что данная совокупность условий может быть воспроизведена неограниченное число раз. Каждое такое осуществление данной совокупности условий называют испытанием (или опытом). 

Пусть при n испытаниях событие A появилось m раз. Тогда отношение  называется частотой (относительной частотой) события A и обозначается как:  

Событие называется достоверным, если оно в данном опыте обязательно должно произойти; наоборот, событие называется невозможным, если оно в данном опыте не может произойти.

Два события A и В называются несовместными, если наступление события A исключает наступление события В. Отсюда следует, что если события A и В несовместны, то событие AB — невозможное.

Событие В называется независимым от события А, если появление события А не изменяет вероятности появления события В.

Условная вероятностьвероятность события В, вычесленная в предположении, что событие А уже наступило.

Дерево вероятности – наглядное описаниевероятности события.

ВЫПОЛНЕНИЕ РАБОТЫ

ЗАДАНИЕ 1

Для того, чтобы начать выполнение работы, нам необходимо открыть нашу базу данных в программе Microsoft Excel 2007. А также включить фильтр: Данные – Фильтр.

ЗАДАНИЕ 1.1

Фильтруем данные в столбце «Пол». Для этого нажимаем на стрелочку и из предложенного списка критерием выбираем «ж».

После проделывания данных операций мы получаем отфильтрованные данные и на экран выводится такая таблица.

Номер служащего

Заработная плата за год, долл.

Пол

Возраст, лет

Стаж роботы, лет

Уровень подготовки

1

32368

Ж

42

3

B

7

24395

Ж

52

6

A

10

23978

Ж

58

4

A

14

49033

Ж

55

10

B

16

53429

Ж

52

5

B

18

58968

Ж

61

10

B

24

27525

Ж

38

3

A

28

44183

Ж

38

5

B

29

24971

Ж

55

6

A

30

35423

Ж

47

4

A

31

41188

Ж

35

2

B

32

27525

Ж

35

3

A

39

56294

Ж

44

6

C

40

47180

Ж

45

5

C

47

49033

Ж

53

10

B

49

35200

Ж

38

1

B

50

50174

Ж

42

5

A

51

24352

Ж

35

1

A

52

47180

Ж

40

3

A

53

49033

Ж

34

4

B

54

53174

Ж

35

1

A

55

53429

Ж

45

5

B

58

42961

Ж

45

7

B

60

26491

Ж

46

7

A

65

41188

Ж

34

3

B

66

57242

Ж

45

7

C

67

53429

Ж

44

6

C

69

44138

Ж

38

2

B

В низу, в строке состояния отображается количество отфильтрованных данных и количество всех данных, которые фильтровались.

Теперь, когда у нас есть все необходимые данные, преступаем к вычислению вероятности. Для этого воспользуемся формулой, приведенной в теоретических сведеньях, и для получений процентного отношения умножаем на 100%.

Вероятность: (28/69)*100%=0,4057*100%=40,6%

ЗАДАНИЕ 1.2

Фильтруем данные в столбце «Заработная плата за год, долл.». Для этого нажимаем на стрелочку и из списка появившихся условий выбираем: Числовые фильтры → больше

В появившемся диалоговом окне в верхнее правое поле вводим минимальную сумму – 35000 и нажимаем ОК.

После проделывания данных операций мы получаем отфильтрованные данные и на экран выводится такая таблица.

Номер служащего

Заработная плата за год, долл.

Пол

Возраст, лет

Стаж роботы, лет

Уровень подготовки

2

53174

Ч

54

10

B

3

52722

Ч

47

10

A

4

53423

Ч

47

1

B

5

50602

Ч

44

5

B

6

49033

Ч

42

10

A

9

43124

Ч

48

8

A

11

53174

Ч

46

4

C

12

58515

Ч

36

8

C

13

56194

Ч

49

10

B

14

49037

Ж

55

10

B

15

44884

Ч

41

1

A

16

53429

Ж

52

5

B

17

46578

Ч

57

8

A

18

58968

Ж

61

10

B

19

53174

Ч

50

5

A

20

53627

Ч

47

10

B

21

49033

Ч

54

5

B

22

54981

Ч

47

7

A

23

62530

Ч

50

10

B

26

56884

Ч

47

10

A

27

52115

Ч

56

5

A

28

44183

Ж

38

5

B

30

35423

Ж

47

4

A

31

41188

Ж

35

2

B

33

35018

Ч

39

1

A

34

44183

Ч

41

2

A

35

35423

Ч

44

1

A

36

49033

Ч

53

8

A

37

40741

Ч

47

2

A

38

49033

Ч

42

10

A

39

56294

Ж

44

6

C

40

47180

Ж

45

5

C

41

46578

Ч

56

8

A

42

52722

Ч

38

8

C

43

51241

Ч

58

2

B

44

53627

Ч

52

8

A

45

53174

Ч

54

10

A

46

56294

Ч

49

10

B

47

49033

Ж

53

10

B

48

51241

Ч

56

1

C

49

35200

Ж

38

1

B

50

50174

Ж

42

5

A

52

47180

Ж

40

3

A

53

49033

Ж

34

4

B

54

53174

Ж

35

1

A

55

53429

Ж

45

5

B

56

53627

Ч

54

10

A

58

42961

Ж

45

7

B

59

53627

Ч

47

10

A

61

42961

Ч

36

3

B

62

53174

Ч

45

5

A

63

36292

Ч

46

0

A

64

37292

Ч

47

1

A

65

41188

Ж

34

3

B

66

57242

Ж

45

7

C

67

53429

Ж

44

6

C

68

53174

Ч

50

10

B

69

44138

Ж

38

2

B

Внизу, в строке состояния отображается количество отфильтрованных данных и количество всех данных, которые фильтровались.

Теперь, когда у нас есть все необходимые данные, преступаем к вычислению вероятности. Для этого воспользуемся формулой, приведенной в теоретических сведеньях, и для получений процентного отношения умножаем на 100%.

Вероятность: (58/69)*100%=0,8405*100%=84,1%

ЗАДАНИЕ 1.3

Фильтруем данные в столбце «Уровень подготовки». Для этого нажимаем на стрелочку и из списка появившихся критериев выбираем «В».

После проделывания данных операций мы получаем отфильтрованные данные и на экран выводится такая таблица.

Номер служащего

Заработная плата за год, долл.

Пол

Возраст, лет

Стаж роботы, лет

Уровень подготовки

1

32368

Ж

42

3

B

2

53174

Ч

54

10

B

4

53423

Ч

47

1

B

5

50602

Ч

44

5

B

13

56194

Ч

49

10

B

14

49036

Ж

55

10

B

16

53429

Ж

52

5

B

18

58968

Ж

61

10

B

20

53627

Ч

47

10

B

21

49033

Ч

54

5

B

23

62530

Ч

50

10

B

28

44183

Ж

38

5

B

31

41188

Ж

35

2

B

39

56294

Ч

49

10

B

38

49033

Ж

53

10

B

43

51240

Ч

58

2

B

49

35200

Ж

38

1

B

53

49033

Ж

34

4

B

55

53429

Ж

45

5

B

58

42961

Ж

45

7

B

61

42961

Ч

36

3

B

65

41188

Ж

34

3

B

68

53174

Ч

50

10

B

69

44138

Ж

38

2

B

ВНнизу, в строке состояния отображается количество отфильтрованных данных и количество всех данных, которые фильтровались.

Теперь, когда у нас есть все необходимые данные, преступаем к вычислению вероятности. Для этого воспользуемся формулой, приведенной в теоретических сведеньях, и для получений процентного отношения умножаем на 100%.

Вероятность: (24/69)*100%=0,3478*100%=34,8%

ЗАДАНИЕ 1.4

 Фильтруем данные последовательно в столбцах «Заработная плата за год, долл.»: Числовые фильтры → больше → в диалоговом окне пишем 35000 → ОК; и «Уровень подготовки»: выбираем условие «В». В результате фильтрации получаем такую таблицу:

Номер служащего

Заработная плата за год, долл.

Пол

Возраст, лет

Стаж роботы, лет

Уровень подготовки

2

53174

Ч

54

10

B

4

53423

Ч

47

1

B

5

50602

Ч

44

5

B

13

56194

Ч

49

10

B

14

49033

Ж

55

10

B

16

53429

Ж

52

5

B

18

58968

Ж

61

10

B

20

53627

Ч

47

10

B

21

49033

Ч

54

5

B

23

62530

Ч

50

10

B

28

44183

Ж

38

5

B

31

41188

Ж

35

2

B

43

51240

Ч

58

2

B

46

56294

Ч

49

10

B

47

49033

Ж

53

10

B

49

35200

Ж

38

1

B

53

49033

Ж

34

4

B

55

53429

Ж

45

5

B

58

42961

Ж

45

7

B

61

42961

Ч

36

3

B

65

41188

Ж

34

3

B

68

53174

Ч

50

10

B

69

44138

Ж

38

2

B

Внизу, в строке состояния отображается количество отфильтрованных данных и количество всех данных, которые фильтровались.

Для нахождения вероятности делим полученный результат (23) на количество работников получающих зарплату больше $35000 (58) и умножаем на 100%.

Вероятность: (23/58)*100%=0,3965*100%=39,7%

ЗАДАНИЕ 1.5

1.5) Выполняем действия аналогичные действиям в пункте (1.4). Но полученный результат (23) делим на количество работников с уровнем подготовки «В» (24) и умножаем на 100%.

Вероятность: (23/24)*100%=0,9583*100%=95,8%

ЗАДАНИЕ 2

ЗАДАНИЕ 2.1

 Фильтруем данные в столбце «Стаж работы, лет». Для этого нажимаем на стрелочку и из списка появившихся критериев выбираем: Числовые фильтры → больше или равно → в появившемся диалоговом окне пишем «6» → ОК.

В результате фильтрации получаем такую таблицу

Номер служащего

Заработная плата за год, долл.

Пол

Возраст, лет

Стаж роботы, лет

Уровень подготовки

2

53174

Ч

54

10

B

3

52722

Ч

47

10

A

6

49033

Ч

42

10

A

7

24395

Ж

52

6

A

9

43124

Ч

48

8

A

12

58515

Ч

36

8

C

13

56194

Ч

49

10

B

14

49033

Ж

55

10

B

17

46574

Ч

57

8

A

18

58968

Ж

61

10

B

20

53627

Ч

47

10

B

22

54981

Ч

47

7

A

23

62530

Ч

50

10

B

26

56884

Ч

47

10

A

29

24971

Ж

55

6

A

36

49033

Ч

53

8

A

41

46577

Ч

56

8

A

42

52722

Ч

38

8

C

44

53627

Ч

52

8

A

45

53174

Ч

54

10

A

46

56294

Ч

49

10

B

47

49033

Ч

42

10

A

56

53627

Ч

54

10

A

57

26491

Ч

47

10

A

58

42961

Ж

45

7

B

59

53627

Ч

47

10

A

60

26491

Ж

46

7

A

66

57242

Ж

45

7

C

67

53429

Ж

44

6

C

68

53174

Ч

50

10

B

Внизу, в строке состояния отображается количество отфильтрованных данных и количество всех данных, которые фильтровались.

Для нахождения вероятности делим полученный результат (32) на общее количество работников (69) и умножаем на 100%.

Вероятность: (32/69)*100%=0,4637*100%=46,4%

Вероятность того, что работник - женщина берем из задания (1.1), и она равна 40,6%.

ЗАДАНИЕ 2.2

Для того, чтобы найти вероятность пересечения обоих этих событий нам необходимо перемножить вероятности этих событий.

Вероятность: (0,4057*0,4637)*100%=0,1881*100%=18,8%

ЗАДАНИЕ 2.3

Строим дерево вероятности, которое выглядит следующим образом:

Дерево вероятности см. на следующей странице.

                    большой опыт работы       18,8%

работник – женщина         40,6%

   маленький опыт работы  21,8%

                 большой опыт работы  31,9%

работник-мужчина         59,4%

   маленький опыт работы  27,5%

ЗАДАНИЕ 2.4

 Фильтруем данные последовательно в столбцах «Пол»: выбираем условие «ж»; и «Стаж работы, лет»: Числовые фильтры → больше или равно → в диалоговом окне пишем 6 → ОК. В результате фильтрации получаем такую таблицу:

Номер служащего

Заработная плата за год, долл.

Пол

Возраст, лет

Стаж роботы, лет

Уровень подготовки

8

24395

Ж

52

6

A

14

49033

Ж

55

10

B

18

58968

Ж

61

10

B

29

24971

Ж

55

6

A

39

56294

Ж

44

6

C

47

49033

Ж

53

10

B

58

42961

Ж

45

7

B

60

26491

Ж

46

7

A

66

57242

Ж

45

7

C

67

53429

Ж

44

6

C

Для нахождения вероятности делим полученный результат (10) на количество всех работников-женщин (28) и умножаем на 100%.

Вероятность: (10/28)*100%=0,3571*100%=35,7%

ЗАДАНИЕ 2.5

Выполняем действия аналогичные действиям в пункте (2.4). Но полученный результат (10) делим на количество работников имеющих большой опыт работы (32) и умножаем на 100%.

Вероятность: (10/32)*100%=0,3125*100%=31,3%

ЗАДАНИЕ 2.6

Фильтруем данные последовательно в столбцах «Пол»: выбираем условие «ж»; и «Стаж работы, лет»: Числовые фильтры → меньше → в диалоговом окне пишем 6 →ОК.

В результате фильтрации получаем такую таблицу:

Номер служащего

Заработная плата за год, долл.

Пол

Возраст, лет

Стаж роботы, лет

Уровень подготовки

1

32368

Ж

42

3

B

10

23978

Ж

58

4

A

16

53429

Ж

52

5

B

24

27525

Ж

38

3

A

28

44183

Ж

38

5

B

30

35423

Ж

47

4

A

31

41188

Ж

35

2

B

32

27525

Ж

35

3

A

40

47180

Ж

45

5

C

49

35200

Ж

38

1

B

50

50174

Ж

42

5

A

51

24352

Ж

35

1

A

52

47180

Ж

40

3

A

53

49033

Ж

34

4

B

62

53174

Ж

35

1

A

67

53429

Ж

45

5

B

65

41188

Ж

34

3

B

69

44138

Ж

38

2

B

Внизу, в строке состояния отображается количество отфильтрованных данных и количество всех данных, которые фильтровались.

Для нахождения вероятности делим полученный результат (18) на общее количество работников не имеющих большого опыта работы (оно равняется

69 - 32 = 37)и умножаем на 100%.

Вероятность: (18/37)*100%=0,4864*100%=48,6%

ЗАДАНИЕ 2.7

Эти два события являются независимыми, так как не все работники, имеющие большой опыт работы – женщины, а также - не все женщины имеют большой опыт работы.

ЗАДАНИЕ 2.8

Эти события не являются несовместимыми, так как вероятность их пересечения равна 18.8%, то есть больше 0.

ЗАДАНИЕ 3

ЗАДАНИЕ 3.1

Представленные два события(«уровень подготовки А» и «уровень подготовки В») – независимые, так как в результате испытания может присутствовать только одно из них, а не оба сразу.

ЗАДАНИЕ 3.2

Эти события – несовместимые, так как, если приходит одно из этих событий, то появление в этом же испытании второго события является невозможным.

ВЫВОДЫ

После выполнения данной работы оказалось, что программа Microsoft Excel – очень удобный и быстрый способ обработки данных обширных и не очень баз данных. С помощью фильтрации (выборки) общей базы данных полученный результат можно использовать для нахождения вероятности случайных событий. Помимо этого  - научились строить дерево вероятностей случайных событий, а также определять независимые и несовместные события.


 

А также другие работы, которые могут Вас заинтересовать

764. Элементы структуры контроллинга 64.5 KB
  В сферу задач контроллинга входит постановка целей предприятия, сбор и обработка информации для принятия управленческих решений. Синтез элементов учета, анализа, контроля, планирования, реализация которых обеспечивает выработку альтернативных подходов при осуществлении оперативного и стратегического управления процессом достижения конечных целей.
765. Формування педагогічної культури батьків з питань дипломатичного спілкування з дітьми 53.5 KB
  Виявити найоптимальніші умови становлення батьківського авторитету для малюка. Довести вплив родини та устрою сімейного життя на формування у дітей поваги та любові до батьків. Удосконалити досвід партнерського спілкування батьків з дитиною.
766. История развития представлений о времени и расстоянии 51 KB
  Представления о пространстве. Эволюция базовых понятий пространства. Теория пространства. Представления о времени. История развития представлений о времени. Физическая теория времени.
767. Информационная безопасность 79 KB
  Основные угрозы информационной безопасности. Аппаратно-программные средства защиты информации. Системы шифрования данных, передаваемых по сетям. Средства управления криптографическими ключами.
768. Інструментальні засоби візуального програмування 32.5 KB
  нструментальні засоби візуального програмування. Оголошення та застосування масивів для вирішення поставленої задачі.
769. Місце, роль та потенціал розвитку Аргентини у міжнародному торгівельному просторі 1.51 MB
  Абсолютні показники розвитку зовнішньої торгівлі. Результуючі показники розвитку зовнішньої торгівлі. Аналіз структурних показників на підставі питомої ваги. Аналіз показників інтенсивності. Рівень інтеграції у глобальну економіку. Стан та перспективи зовнішньоторговельної взаємодії з Україною.
770. Складання кошторису та аналіз прибутку і витрат на виробництво 212 KB
  Складання кошторису витрат на виробництво продукції. Кошторис витрат на виробництво й реалізацію за квартал. Визначення капіталовкладень у розвиток виробництва. Підприємство як суб`єкт господарювання: ознаки, цілі, напрямки діяльності.
772. Измерение теплоемкости 791 KB
  Изменение положения тигля в ячейке. Различие в теплофизических и физических характеристиках образца и стандарта. Отличие средней температуры образца от измеряемой температуры. Значения параметров кинетических уравнений элементарных стадий.