19421

Дискретное представление информации: двоичные числа; двоичное кодирование текста в памяти компьютера. Информационный объем текста

Реферат

Информатика, кибернетика и программирование

Дискретное представление информации: двоичные числа; двоичное кодирование текста в памяти компьютера. Информационный объем текста. Вся информация которую обрабатывает компьютер должна быть представлена двоичным кодом с помощью двух цифр 0 и 1. Эти два символа принято н...

Русский

2013-07-12

59.63 KB

14 чел.

Дискретное представление информации: двоичные числа; двоичное кодирование текста в памяти компьютера. Информационный объем текста.

Вся информация, которую обрабатывает компьютер должна быть представлена двоичным кодом с помощью двух цифр 0 и 1. Эти два символа принято называть двоичными цифрами или битами. С помощью двух цифр 0 и 1 можно закодировать любое сообщение. Это явилось причиной того, что в компьютере обязательно должно быть организованно два важных процесса: кодирование и декодирование.

Кодирование – преобразование входной информации в форму, воспринимаемую компьютером, т.е. двоичный код.

Декодирование – преобразование данных из двоичного кода в форму, понятную человеку.

С точки зрения технической реализации использование двоичной системы счисления для кодирования информации оказалось намного более простым, чем применение других способов. Действительно, удобно кодировать информацию в виде последовательности нулей и единиц, если представить эти значения как два возможных устойчивых состояния электронного элемента:

0 – отсутствие электрического сигнала;

1 – наличие электрического сигнала.

Эти состояния легко различать. Недостаток двоичного кодирования – длинные коды. Но в технике легче иметь дело с большим количеством простых элементов, чем с небольшим числом сложных.

Вам приходится постоянно сталкиваться с устройством, которое может находится только в двух устойчивых состояниях: включено/выключено. Конечно же, это хорошо знакомый всем выключатель. А вот придумать выключатель, который мог бы устойчиво и быстро переключаться в любое из 10 состояний, оказалось невозможным. В результате после ряда неудачных попыток разработчики пришли к выводу о невозможности построения компьютера на основе десятичной системы счисления. И в основу представления чисел в компьютере была положена именно двоичная система счисления.

Способы кодирования и декодирования информации в компьютере, в первую очередь, зависит от вида информации, а именно, что должно кодироваться: числа, текст, графические изображения или звук.

Представление(кодирование) чисел

Для записи информации о количестве объектов используются числа. Числа записываются с помощью набора специальных символов.

Система счисления — способ записи чисел с помощью набора специальных знаков, называемых цифрами.

Системы счисления подразделяются на позиционные и непозиционные.

В позиционных системах счисления величина, обозначаемая цифрой в записи числа, зависит от её положения в числе (позиции).

В непозиционных системах счисления величина, которую обозначает цифра, не зависит от положения в числе.

Непозиционные системы счисления.

Каноническим примером фактически непозиционной системы счисления является римская, в которой в качестве цифр используются латинские буквы: I обозначает 1, V - 5, X - 10, L - 50, C - 100, D - 500, M -1000. Натуральные числа записываются при помощи повторения этих цифр. При этом, если большая цифра стоит перед меньшей, то они складываются (принцип сложения), если же меньшая — перед большей, то меньшая вычитается из большей (принцип вычитания). Последнее правило применяется только во избежание четырёхкратного повторения одной и той же цифры.

Например, II = 1 + 1 = 2, здесь символ I обозначает 1 независимо от места в числе.

Для правильной записи больших чисел римскими цифрами необходимо сначала записать число тысяч, затем сотен, затем десятков и, наконец, единиц.

Пример: число 1988. Одна тысяча M, девять сотен CM, восемьдесят LXXX, восемь VIII. Запишем их вместе: MCMLXXXVIII.

MCMXCVIII = 1000+(1000-100)+(100-10)+5+1+1+1 = 1998

Позиционные системы счисления.

В позиционных системах счисления величина, обозначаемая цифрой в записи числа, зависит от её положения в числе (позиции). Количество используемых цифр называется основанием системы счисления.

Самой первой такой системой, когда счетным "прибором" служили пальцы рук, была пятеричная.

Следующей после пятеричной возникла двенадцатеричная система счисления. Возникла она в древнем Шумере. Некоторые учёные полагают, что такая система возникала у них из подсчёта фаланг на руке большим пальцем. Широкое распространение получила двенадцатеричная система счисления в XIX веке.

Следующая позиционная система счисления была придумана еще в Древнем Вавилоне, причем вавилонская нумерация была шестидесятеричная, т.е. в ней использовалось шестьдесят цифр! В более позднее время использовалась арабами, а также древними и средневековыми астрономами. Шестидесятеричная система счисления, как считают исследователи, являет собой синтез уже вышеупомянутых пятеричной и двенадцатеричной систем.

В настоящее время наиболее распространены десятичная, двоичная, восьмеричная и шестнадцатеричная системы счисления. Двоичная, восьмеричная (в настоящее время вытесняется шестнадцатеричной) и шестнадцатеричная система часто используется в областях, связанных с цифровыми устройствами, программировании и вообще компьютерной документации. Современные компьютерные системы оперируют информацией представленной в цифровой форме. Числовые данные преобразуются в двоичную систему счисления.

Система счисления

Основание

Алфавит цифр

Десятичная

10

0, 1, 2, 3, 4, 5, 6, 7, 8, 9

Двоичная

2

0, 1

Восьмеричная

8

0, 1, 2, 3, 4, 5, 6, 7

Шестнадцатеричная

16

0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F

Десятичная система счисления — позиционная система счисления по основанию 10. Предполагается, что основание 10 связано с количеством пальцев рук у человека. Наиболее распространённая система счисления в мире. Для записи чисел используются символы 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, называемые арабскими цифрами.

Двоичная система счисления — позиционная система счисления с основанием 2. Используются цифры 0 и 1. Двоичная система используется в цифровых устройствах, поскольку является наиболее простой и удовлетворяет требованиям:

  1.  Чем меньше значений существует в системе, тем проще изготовить отдельные элементы.
  2.  Чем меньше количество состояний у элемента, тем выше помехоустойчивость и тем быстрее он может работать.
  3.  Простота создания таблиц сложения и умножения — основных действий над числами

Укажем соответствие десятичной, двоичной, восьмеричной и шестнадцатеричной систем счисления в таблице.

p=10

0

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

p=2

0

1

10

11

100

101

110

111

1000

1001

1010

1011

1100

1101

1110

1111

10000

p=8

0

1

2

3

4

5

6

7

10

11

12

13

14

15

16

17

20

p=16

0

1

2

3

4

5

6

7

8

9

A

B

C

D

E

F

10

При одновременной работе с несколькими системами счисления для их различения основание системы обычно указывается в виде нижнего индекса, который записывается в десятичной системе:

12310 — это число 123 в десятичной системе счисления;

11110112 — то же число, но в двоичной системе.

Двоичное число 1111011 можно расписать в виде: 11110112 = 1*26 + 1*25 + 1*24 + 1*23 + 0*22 + 1*21 + 1*20.

Двоичная система счисления обладает такими же свойствами, что и десятичная, только для представления чисел используются не 10 цифр, а всего две. Соответственно и разряд числа называют не десятичным, а двоичным.

Перевод из десятичной системы счисления в систему счисления с основанием p осуществляется последовательным делением десятичного числа и его десятичных частных на p, а затем выписыванием последнего частного и остатков в обратном порядке.

Переведем десятичное число 2010 в двоичную систем счисления (основание системы счисления p=2). В итоге получили 2010 = 101002.


Двоичное кодирование текстовой информации 

Начиная с 60-х годов, компьютеры все больше стали использовать для обработки текстовой информации и в настоящее время большая часть ПК в мире занято обработкой именно текстовой информации.

Традиционно для кодирования одного символа используется количество информации = 1 байту (1 байт = 8 битов).

Для кодирования одного символа требуется один байт информации.

Учитывая, что каждый бит принимает значение 1 или 0, получаем, что с помощью 1 байта можно закодировать 256 различных символов. (28 = 256)

Кодирование заключается в том, что каждому символу ставится в соответствие уникальный двоичный код от 00000000 до 11111111 (или десятичный код от 0 до 255).

Важно, что присвоение символу конкретного кода – это вопрос соглашения, которое фиксируется кодовой таблицей.

Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера (коды), называется таблицей кодировки.

Для разных типов ЭВМ используются различные кодировки. С распространением IBM PC международным стандартом стала таблица кодировки ASCII (American Standard Code for Information Interchange) – Американский стандартный код для информационного обмена.

Стандартной в этой таблице является только первая половина, т.е. символы с номерами от 0 (00000000) до 127 (0111111). Сюда входят буква латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы.

Остальные 128 кодов используются в разных вариантах. В русских кодировках размещаются символы русского алфавита.

В настоящее время существует 5 разных кодовых таблиц для русских букв (КОИ8, СР1251, СР866, Mac, ISO).

В настоящее время получил широкое распространение новый международный стандарт Unicode, который отводит на каждый символ два байта. С его помощью можно закодировать 65536 (216= 65536 ) различных символов.

Таблица стандартной части ASCII

Таблица расширенного кода ASCII (один из вариантов)

Сегодня очень многие люди для подготовки писем, документов, статей, книг и пр. используют компьютерные текстовые редакторы. Компьютерные редакторы, в основном, работают с алфавитом размером 256 символов.

В этом случае легко подсчитать объем информации в тексте. Если 1 символ алфавита несет 1 байт информации, то надо просто сосчитать количество символов; полученное число даст информационный объем текста в байтах.

Пусть небольшая книжка, сделанная с помощью компьютера, содержит 150 страниц; на каждой странице — 40 строк, в каждой строке — 60 символов. Значит страница содержит 40x60=2400 байт информации. Объем всей информации в книге: 2400 х 150 = 360 000 байт.

Обратите внимание! Цифры кодируются по стандарту ASCII в двух случаях – при вводе-выводе и когда они встречаются в тексте. Если цифры участвуют в вычислениях, то осуществляется их преобразование в другой двоичных код.

Возьмем число 57.

При использовании в тексте каждая цифра будет представлена своим кодом в соответствии с таблицей ASCII. В двоичной системе это – 00110101 00110111.

При использовании в вычислениях, код этого числа будет получен по правилам перевода в двоичную систему и получим – 00111001.


 

А также другие работы, которые могут Вас заинтересовать

49162. Применение нейросети для определения видовой принадлежности деревьев 364.5 KB
  Обучение нейросети. Применение нейросети для определения видовой принадлежности деревьев. Предметом исследования является применение нейросети для определения видовой принадлежности деревьев. В ней описываются все параметры используемые для обучения сети создается обучающая выборка и представлены результаты работы.
49163. Расчет защиты для линии электропередач 500 кВ 1.37 MB
  Расчет удельных параметров прямой последовательности Расчет параметров генератора: Расчет параметров линии: Удельное активное сопротивление прямой последовательности R1уд Ом км рассчитываем по формуле 2. Удельное индуктивное сопротивление прямой последовательности X1уд Ом км рассчитаем по формуле 2.2 Расчет удельных параметров нулевой последовательности линии Удельное активное сопротивление нулевой последовательности без учета троса Ом км рекомендуется рассчитывать по формуле 2.4 Удельное индуктивное сопротивление...
49164. Скоринговые системы в оценке кредитоспособности физического лица 1.04 MB
  Цель исследования обусловила постановку и решение следующих конкретных задач: рассмотреть сущность скоринговых систем; методологии построения скоринговых систем; рассмотреть сущность нейронных сетей; показать сходства биологической и искусственной нейронной сети; рассмотреть специфику искусственной нейронной сети; показать сущность персептрона; применить персептрон для оценки кредитоспособности заемщика; определить входные и выходные параметры сети; обучить персептрон; интерпретировать результаты работы персептрона.5...
49165. Проект печатной платы для устройства “Широкополосный антенный усилитель” 280.5 KB
  А ведь в большинстве случает можно обойтись штатной автомобильной антенной и правильно выбранным антенным усилителем Критерий выбора антенного усилителя максимальное качество приема сигналов всех возможных радиостанций в данной местности. При выборе антенного усилителя необходимо учитывать следующее: полоса пропускания усилителя должна полностью перекрывать весь радиовещательный диапазон 015. при меньшем усилении незначителен выигрыш в качестве приема удаленных или маломощных радиостанций а при большем возможна перегрузка самого...
49166. Философия. Исторические этапы развития философии 672 KB
  Назначение философии – поиск удела человека, обеспечение его бытия в причудливом мире, а в конечном счете в возвышении человека, в обеспечении его совершенствования. Общую структуру философского знания составляют четыре основных раздела: онтология(учение о бытие), гносеология(учение о познании), человек, общество.
49167. Характеристики цифровой системы передачи непрерывных сообщений и их расчет 1.31 MB
  Описание процесса преобразвания сигнала от источника сообщения до получателя. Рассмотрим процесс преобразования сигнала от источника до получателя. Непрерывный сигнал t предаётся в формирователь первичного сигнала для преобразования в первичный электрический сигнал bt. Количество уровней квантования L определяется исходя из ошибки квантования пикфактора сигнала и отношения сигнал шум.
49168. ПРОГНОЗИРОВАНИЕ КУРСА ЕВРО С ИСПОЛЬЗОВАНИЕМ НЕЙРОСЕТИ 520.5 KB
  Проектирование нейросети Анализ зависимостей курса евро Заключение Введение Начиная с 80х годов для решения экономических задач широкое распространение получили нейронные сети. В общем случае нейронные сети могут решать как задачи классификации разделения входных примеров на заданное число классов так и задачи аппроксимации предсказания непрерывных функций.
49169. АНАЛИЗ ФИНАНСОВОГО СОСТОЯНИЯ И РЕЗУЛЬТАТОВ ФИНАНСОВОЙ ДЕЯТЕЛЬНОСТИ ПРЕДПРИЯТИЯ 12.68 MB
  В связи с этим приобретает огромное значение оценка финансовых результатов деятельности и финансового состояния предприятия в настоящем прошлом и будущем. С помощью анализа финансового состояния предприятия и хозяйственной деятельности вырабатываются стратегия и тактика развития предприятия обосновываются планы и управленческие...
49170. Применение просвечивающего электронного микроскопа 895.5 KB
  Конструкция просвечивающего электронного микроскопа. Применение просвечивающего электронного микроскопа. Во-вторых существенное повышение до 1 Å и менее разрешающей способности электронных микроскопов что сделало их конкурентоспособными с автоионными микроскопами в получении прямых изображений кристаллической решетки. Сегодня трудно себе представить биологическую медицинскую физическую металлографическую химическую лаборатории без оптического микроскопа: исследуя капельки крови и срез ткани медики составляют заключение о состоянии...