19421

Дискретное представление информации: двоичные числа; двоичное кодирование текста в памяти компьютера. Информационный объем текста

Реферат

Информатика, кибернетика и программирование

Дискретное представление информации: двоичные числа; двоичное кодирование текста в памяти компьютера. Информационный объем текста. Вся информация которую обрабатывает компьютер должна быть представлена двоичным кодом с помощью двух цифр 0 и 1. Эти два символа принято н...

Русский

2013-07-12

59.63 KB

14 чел.

Дискретное представление информации: двоичные числа; двоичное кодирование текста в памяти компьютера. Информационный объем текста.

Вся информация, которую обрабатывает компьютер должна быть представлена двоичным кодом с помощью двух цифр 0 и 1. Эти два символа принято называть двоичными цифрами или битами. С помощью двух цифр 0 и 1 можно закодировать любое сообщение. Это явилось причиной того, что в компьютере обязательно должно быть организованно два важных процесса: кодирование и декодирование.

Кодирование – преобразование входной информации в форму, воспринимаемую компьютером, т.е. двоичный код.

Декодирование – преобразование данных из двоичного кода в форму, понятную человеку.

С точки зрения технической реализации использование двоичной системы счисления для кодирования информации оказалось намного более простым, чем применение других способов. Действительно, удобно кодировать информацию в виде последовательности нулей и единиц, если представить эти значения как два возможных устойчивых состояния электронного элемента:

0 – отсутствие электрического сигнала;

1 – наличие электрического сигнала.

Эти состояния легко различать. Недостаток двоичного кодирования – длинные коды. Но в технике легче иметь дело с большим количеством простых элементов, чем с небольшим числом сложных.

Вам приходится постоянно сталкиваться с устройством, которое может находится только в двух устойчивых состояниях: включено/выключено. Конечно же, это хорошо знакомый всем выключатель. А вот придумать выключатель, который мог бы устойчиво и быстро переключаться в любое из 10 состояний, оказалось невозможным. В результате после ряда неудачных попыток разработчики пришли к выводу о невозможности построения компьютера на основе десятичной системы счисления. И в основу представления чисел в компьютере была положена именно двоичная система счисления.

Способы кодирования и декодирования информации в компьютере, в первую очередь, зависит от вида информации, а именно, что должно кодироваться: числа, текст, графические изображения или звук.

Представление(кодирование) чисел

Для записи информации о количестве объектов используются числа. Числа записываются с помощью набора специальных символов.

Система счисления — способ записи чисел с помощью набора специальных знаков, называемых цифрами.

Системы счисления подразделяются на позиционные и непозиционные.

В позиционных системах счисления величина, обозначаемая цифрой в записи числа, зависит от её положения в числе (позиции).

В непозиционных системах счисления величина, которую обозначает цифра, не зависит от положения в числе.

Непозиционные системы счисления.

Каноническим примером фактически непозиционной системы счисления является римская, в которой в качестве цифр используются латинские буквы: I обозначает 1, V - 5, X - 10, L - 50, C - 100, D - 500, M -1000. Натуральные числа записываются при помощи повторения этих цифр. При этом, если большая цифра стоит перед меньшей, то они складываются (принцип сложения), если же меньшая — перед большей, то меньшая вычитается из большей (принцип вычитания). Последнее правило применяется только во избежание четырёхкратного повторения одной и той же цифры.

Например, II = 1 + 1 = 2, здесь символ I обозначает 1 независимо от места в числе.

Для правильной записи больших чисел римскими цифрами необходимо сначала записать число тысяч, затем сотен, затем десятков и, наконец, единиц.

Пример: число 1988. Одна тысяча M, девять сотен CM, восемьдесят LXXX, восемь VIII. Запишем их вместе: MCMLXXXVIII.

MCMXCVIII = 1000+(1000-100)+(100-10)+5+1+1+1 = 1998

Позиционные системы счисления.

В позиционных системах счисления величина, обозначаемая цифрой в записи числа, зависит от её положения в числе (позиции). Количество используемых цифр называется основанием системы счисления.

Самой первой такой системой, когда счетным "прибором" служили пальцы рук, была пятеричная.

Следующей после пятеричной возникла двенадцатеричная система счисления. Возникла она в древнем Шумере. Некоторые учёные полагают, что такая система возникала у них из подсчёта фаланг на руке большим пальцем. Широкое распространение получила двенадцатеричная система счисления в XIX веке.

Следующая позиционная система счисления была придумана еще в Древнем Вавилоне, причем вавилонская нумерация была шестидесятеричная, т.е. в ней использовалось шестьдесят цифр! В более позднее время использовалась арабами, а также древними и средневековыми астрономами. Шестидесятеричная система счисления, как считают исследователи, являет собой синтез уже вышеупомянутых пятеричной и двенадцатеричной систем.

В настоящее время наиболее распространены десятичная, двоичная, восьмеричная и шестнадцатеричная системы счисления. Двоичная, восьмеричная (в настоящее время вытесняется шестнадцатеричной) и шестнадцатеричная система часто используется в областях, связанных с цифровыми устройствами, программировании и вообще компьютерной документации. Современные компьютерные системы оперируют информацией представленной в цифровой форме. Числовые данные преобразуются в двоичную систему счисления.

Система счисления

Основание

Алфавит цифр

Десятичная

10

0, 1, 2, 3, 4, 5, 6, 7, 8, 9

Двоичная

2

0, 1

Восьмеричная

8

0, 1, 2, 3, 4, 5, 6, 7

Шестнадцатеричная

16

0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F

Десятичная система счисления — позиционная система счисления по основанию 10. Предполагается, что основание 10 связано с количеством пальцев рук у человека. Наиболее распространённая система счисления в мире. Для записи чисел используются символы 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, называемые арабскими цифрами.

Двоичная система счисления — позиционная система счисления с основанием 2. Используются цифры 0 и 1. Двоичная система используется в цифровых устройствах, поскольку является наиболее простой и удовлетворяет требованиям:

  1.  Чем меньше значений существует в системе, тем проще изготовить отдельные элементы.
  2.  Чем меньше количество состояний у элемента, тем выше помехоустойчивость и тем быстрее он может работать.
  3.  Простота создания таблиц сложения и умножения — основных действий над числами

Укажем соответствие десятичной, двоичной, восьмеричной и шестнадцатеричной систем счисления в таблице.

p=10

0

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

p=2

0

1

10

11

100

101

110

111

1000

1001

1010

1011

1100

1101

1110

1111

10000

p=8

0

1

2

3

4

5

6

7

10

11

12

13

14

15

16

17

20

p=16

0

1

2

3

4

5

6

7

8

9

A

B

C

D

E

F

10

При одновременной работе с несколькими системами счисления для их различения основание системы обычно указывается в виде нижнего индекса, который записывается в десятичной системе:

12310 — это число 123 в десятичной системе счисления;

11110112 — то же число, но в двоичной системе.

Двоичное число 1111011 можно расписать в виде: 11110112 = 1*26 + 1*25 + 1*24 + 1*23 + 0*22 + 1*21 + 1*20.

Двоичная система счисления обладает такими же свойствами, что и десятичная, только для представления чисел используются не 10 цифр, а всего две. Соответственно и разряд числа называют не десятичным, а двоичным.

Перевод из десятичной системы счисления в систему счисления с основанием p осуществляется последовательным делением десятичного числа и его десятичных частных на p, а затем выписыванием последнего частного и остатков в обратном порядке.

Переведем десятичное число 2010 в двоичную систем счисления (основание системы счисления p=2). В итоге получили 2010 = 101002.


Двоичное кодирование текстовой информации 

Начиная с 60-х годов, компьютеры все больше стали использовать для обработки текстовой информации и в настоящее время большая часть ПК в мире занято обработкой именно текстовой информации.

Традиционно для кодирования одного символа используется количество информации = 1 байту (1 байт = 8 битов).

Для кодирования одного символа требуется один байт информации.

Учитывая, что каждый бит принимает значение 1 или 0, получаем, что с помощью 1 байта можно закодировать 256 различных символов. (28 = 256)

Кодирование заключается в том, что каждому символу ставится в соответствие уникальный двоичный код от 00000000 до 11111111 (или десятичный код от 0 до 255).

Важно, что присвоение символу конкретного кода – это вопрос соглашения, которое фиксируется кодовой таблицей.

Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера (коды), называется таблицей кодировки.

Для разных типов ЭВМ используются различные кодировки. С распространением IBM PC международным стандартом стала таблица кодировки ASCII (American Standard Code for Information Interchange) – Американский стандартный код для информационного обмена.

Стандартной в этой таблице является только первая половина, т.е. символы с номерами от 0 (00000000) до 127 (0111111). Сюда входят буква латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы.

Остальные 128 кодов используются в разных вариантах. В русских кодировках размещаются символы русского алфавита.

В настоящее время существует 5 разных кодовых таблиц для русских букв (КОИ8, СР1251, СР866, Mac, ISO).

В настоящее время получил широкое распространение новый международный стандарт Unicode, который отводит на каждый символ два байта. С его помощью можно закодировать 65536 (216= 65536 ) различных символов.

Таблица стандартной части ASCII

Таблица расширенного кода ASCII (один из вариантов)

Сегодня очень многие люди для подготовки писем, документов, статей, книг и пр. используют компьютерные текстовые редакторы. Компьютерные редакторы, в основном, работают с алфавитом размером 256 символов.

В этом случае легко подсчитать объем информации в тексте. Если 1 символ алфавита несет 1 байт информации, то надо просто сосчитать количество символов; полученное число даст информационный объем текста в байтах.

Пусть небольшая книжка, сделанная с помощью компьютера, содержит 150 страниц; на каждой странице — 40 строк, в каждой строке — 60 символов. Значит страница содержит 40x60=2400 байт информации. Объем всей информации в книге: 2400 х 150 = 360 000 байт.

Обратите внимание! Цифры кодируются по стандарту ASCII в двух случаях – при вводе-выводе и когда они встречаются в тексте. Если цифры участвуют в вычислениях, то осуществляется их преобразование в другой двоичных код.

Возьмем число 57.

При использовании в тексте каждая цифра будет представлена своим кодом в соответствии с таблицей ASCII. В двоичной системе это – 00110101 00110111.

При использовании в вычислениях, код этого числа будет получен по правилам перевода в двоичную систему и получим – 00111001.


 

А также другие работы, которые могут Вас заинтересовать

30663. Сатира М.Е. Салтыкова-Щедрина. Художественная функция «эзопова языка» в произведениях писателя 15.47 KB
  Салтыкова-Щедрина по праву считается История одного города которую он начал писать в 1868 году а закончил в 1870 году. Жанр Истории одного города определить довольно трудно: автор написал его в форме летописи но изображённые здесь события кажутся абсолютно нереальными образы фантастичными а происходящее походит на какой то кошмарный бредовый сон.Главный герой Истории одного города народ обобщенный образ которого раскрывается из главы в главу все шире. Но и сами носители верховной власти города Глупова играют очень важную роль в...
30664. Своеобразие сатиры В.В. Маяковского в стихотворениях «О дряни», «Прозаседавшиеся» 13.67 KB
  Маяковского в стихотворениях О дряни Прозаседавшиеся В дореволюционный период творчества поэта основной целью его сатиры было беспощадно обличение существующего строя.Первая группа сатирических произведений поэта разоблачает и высмеивает мещанство О дряни Еще раз о дряни Ханжа Маруся отравилась и др.В сатирическом фельетоне а именно так исследователи определили жанр этого произведения О дряни Маяковский обличает мещанство.
30665. Своеобразие стиля Чехова-прозаика (на примере рассказов «Человек в футляре», «Крыжовник», «О любви») 14.02 KB
  Чехов стремится в своих рассказах проследить динамику человеческой души в разных ее проявлениях и во всей ее глубине. Но ведь обыденность и творит личность и Чехов стремится обратить внимание читателя на отдельные дни и часы маленького обывательского существования осмыслить их и помочь человеку жить осознанно. А в рассказе О любви устами главного героя Чехов скажет: Я понял что когда любишь то в своих рассуждениях об этой любви нужно исходить от высшего от более важного чем счастье или несчастье грех или добродетель или не...
30666. В чем смысл финала рассказа А.П.Чехова «Ионыч» 13.61 KB
  Чехов обращается к проблеме духовной деградации человека. К 3536 годам он уже превращается в Ионыча ожирел потерял совесть и стал похож не на человека а на языческого божка. В конце рассказа мы уже не видим прежнего молодого человека который мог бы прийти ночью на свидание на кладбище. Он променял живые мысли на сытое самодовольное существование он не смог сберечь в себе человека.
30667. СПОСОБЫ ВЫРАЖЕНИЯ АВТОРСКОЙ ПОЗИЦИИ 20.95 KB
  Заглавие вводит читателя в мир произведения выражает основную тему текста определяет его важнейшую сюжетную линию или указывает на его главный конфликт. Б Заглавие может называть главного героя произведения Евгений Онегин Обломов Анна Каренина Иванов В Заглавие текста может указывать на время и место действия Полтава А. Таким образом заглавие художественного произведения вопервых соотносит сам текст с его художественным миром: главными героями временем действия: Гусев А. Чехова Ионыч...
30668. Стихотворение Б.Л. Пастернака «Никого не будет в доме...». (Восприятие, истолкование, оценка) 12.34 KB
  В стихотворении Никого не будет в доме мы видим причудливое взаимодействие высокого и привычного обычной человеческой жизни и тайн природы. В стихотворении мы видим описание пограничного явления сумерек. Сквозной проем сквозь который мы видим ускользающий зимний день крыши и снег выглядит как проем в другой мир в который мы подсматриваем. Мы не видим кто идет но понимаем что это человек очень дорогой лирическому герою.
30669. Стихотворение Н.А. Некрасова «Элегия» («Пускай нам говорит изменчивая мода…»). Восприятие, истолкование, оценка. Особенности жанра 13.08 KB
  Творчество этого поэта не только внесло большие изменения в литературный процесс но и оказало большое влияние на общественную атмосферу эпохи. Этот поэт сделал предметом своего изображения те вещи которые до него считались непоэтическими: уличное воровство проституцию пьянство самоубийства семейные раздоры и так далее.Роль поэта и предназначения поэзии отдельная тема в творчестве Некрасова. Свое поэтическое кредо поэт изложил в стихотворении Элегия 1874.
30670. Судьба человека в контексте эпохи (по рассказам И.А. Бунина «Господин из Сан-Франциско» и «Чистый понедельник») 13.94 KB
  В этом отношении показательны рассказы Чистый понедельник и Господин из Сан-Франциско. Рассказ Господин из Сан-Франциско раскрывает кризис западноевропейской цивилизации постигший ее в начале 20 века.Герой рассказа некий господин из Сан-Франциско становится символом бездуховного буржуазного мира.
30671. Сюжет, композиция и проблематика рассказа М. Горького «Старуха Изергиль» 14.18 KB
  Повествование много повидавшей на своем веку Изергиль делится на три самостоятельные части: легенда о Ларре рассказ Изергиль о своей жизни легенда о Данко.Легенды о Ларре и Данко раскрывают две концепции жизни два представления о ней.Себялюбцу Ларре контрастно противопоставлен герой второй легенды Данко. Ларра ценил только себя и свою свободу Данко же решил добыть ее для всего племени.