19421

Дискретное представление информации: двоичные числа; двоичное кодирование текста в памяти компьютера. Информационный объем текста

Реферат

Информатика, кибернетика и программирование

Дискретное представление информации: двоичные числа; двоичное кодирование текста в памяти компьютера. Информационный объем текста. Вся информация которую обрабатывает компьютер должна быть представлена двоичным кодом с помощью двух цифр 0 и 1. Эти два символа принято н...

Русский

2013-07-12

59.63 KB

14 чел.

Дискретное представление информации: двоичные числа; двоичное кодирование текста в памяти компьютера. Информационный объем текста.

Вся информация, которую обрабатывает компьютер должна быть представлена двоичным кодом с помощью двух цифр 0 и 1. Эти два символа принято называть двоичными цифрами или битами. С помощью двух цифр 0 и 1 можно закодировать любое сообщение. Это явилось причиной того, что в компьютере обязательно должно быть организованно два важных процесса: кодирование и декодирование.

Кодирование – преобразование входной информации в форму, воспринимаемую компьютером, т.е. двоичный код.

Декодирование – преобразование данных из двоичного кода в форму, понятную человеку.

С точки зрения технической реализации использование двоичной системы счисления для кодирования информации оказалось намного более простым, чем применение других способов. Действительно, удобно кодировать информацию в виде последовательности нулей и единиц, если представить эти значения как два возможных устойчивых состояния электронного элемента:

0 – отсутствие электрического сигнала;

1 – наличие электрического сигнала.

Эти состояния легко различать. Недостаток двоичного кодирования – длинные коды. Но в технике легче иметь дело с большим количеством простых элементов, чем с небольшим числом сложных.

Вам приходится постоянно сталкиваться с устройством, которое может находится только в двух устойчивых состояниях: включено/выключено. Конечно же, это хорошо знакомый всем выключатель. А вот придумать выключатель, который мог бы устойчиво и быстро переключаться в любое из 10 состояний, оказалось невозможным. В результате после ряда неудачных попыток разработчики пришли к выводу о невозможности построения компьютера на основе десятичной системы счисления. И в основу представления чисел в компьютере была положена именно двоичная система счисления.

Способы кодирования и декодирования информации в компьютере, в первую очередь, зависит от вида информации, а именно, что должно кодироваться: числа, текст, графические изображения или звук.

Представление(кодирование) чисел

Для записи информации о количестве объектов используются числа. Числа записываются с помощью набора специальных символов.

Система счисления — способ записи чисел с помощью набора специальных знаков, называемых цифрами.

Системы счисления подразделяются на позиционные и непозиционные.

В позиционных системах счисления величина, обозначаемая цифрой в записи числа, зависит от её положения в числе (позиции).

В непозиционных системах счисления величина, которую обозначает цифра, не зависит от положения в числе.

Непозиционные системы счисления.

Каноническим примером фактически непозиционной системы счисления является римская, в которой в качестве цифр используются латинские буквы: I обозначает 1, V - 5, X - 10, L - 50, C - 100, D - 500, M -1000. Натуральные числа записываются при помощи повторения этих цифр. При этом, если большая цифра стоит перед меньшей, то они складываются (принцип сложения), если же меньшая — перед большей, то меньшая вычитается из большей (принцип вычитания). Последнее правило применяется только во избежание четырёхкратного повторения одной и той же цифры.

Например, II = 1 + 1 = 2, здесь символ I обозначает 1 независимо от места в числе.

Для правильной записи больших чисел римскими цифрами необходимо сначала записать число тысяч, затем сотен, затем десятков и, наконец, единиц.

Пример: число 1988. Одна тысяча M, девять сотен CM, восемьдесят LXXX, восемь VIII. Запишем их вместе: MCMLXXXVIII.

MCMXCVIII = 1000+(1000-100)+(100-10)+5+1+1+1 = 1998

Позиционные системы счисления.

В позиционных системах счисления величина, обозначаемая цифрой в записи числа, зависит от её положения в числе (позиции). Количество используемых цифр называется основанием системы счисления.

Самой первой такой системой, когда счетным "прибором" служили пальцы рук, была пятеричная.

Следующей после пятеричной возникла двенадцатеричная система счисления. Возникла она в древнем Шумере. Некоторые учёные полагают, что такая система возникала у них из подсчёта фаланг на руке большим пальцем. Широкое распространение получила двенадцатеричная система счисления в XIX веке.

Следующая позиционная система счисления была придумана еще в Древнем Вавилоне, причем вавилонская нумерация была шестидесятеричная, т.е. в ней использовалось шестьдесят цифр! В более позднее время использовалась арабами, а также древними и средневековыми астрономами. Шестидесятеричная система счисления, как считают исследователи, являет собой синтез уже вышеупомянутых пятеричной и двенадцатеричной систем.

В настоящее время наиболее распространены десятичная, двоичная, восьмеричная и шестнадцатеричная системы счисления. Двоичная, восьмеричная (в настоящее время вытесняется шестнадцатеричной) и шестнадцатеричная система часто используется в областях, связанных с цифровыми устройствами, программировании и вообще компьютерной документации. Современные компьютерные системы оперируют информацией представленной в цифровой форме. Числовые данные преобразуются в двоичную систему счисления.

Система счисления

Основание

Алфавит цифр

Десятичная

10

0, 1, 2, 3, 4, 5, 6, 7, 8, 9

Двоичная

2

0, 1

Восьмеричная

8

0, 1, 2, 3, 4, 5, 6, 7

Шестнадцатеричная

16

0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F

Десятичная система счисления — позиционная система счисления по основанию 10. Предполагается, что основание 10 связано с количеством пальцев рук у человека. Наиболее распространённая система счисления в мире. Для записи чисел используются символы 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, называемые арабскими цифрами.

Двоичная система счисления — позиционная система счисления с основанием 2. Используются цифры 0 и 1. Двоичная система используется в цифровых устройствах, поскольку является наиболее простой и удовлетворяет требованиям:

  1.  Чем меньше значений существует в системе, тем проще изготовить отдельные элементы.
  2.  Чем меньше количество состояний у элемента, тем выше помехоустойчивость и тем быстрее он может работать.
  3.  Простота создания таблиц сложения и умножения — основных действий над числами

Укажем соответствие десятичной, двоичной, восьмеричной и шестнадцатеричной систем счисления в таблице.

p=10

0

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

p=2

0

1

10

11

100

101

110

111

1000

1001

1010

1011

1100

1101

1110

1111

10000

p=8

0

1

2

3

4

5

6

7

10

11

12

13

14

15

16

17

20

p=16

0

1

2

3

4

5

6

7

8

9

A

B

C

D

E

F

10

При одновременной работе с несколькими системами счисления для их различения основание системы обычно указывается в виде нижнего индекса, который записывается в десятичной системе:

12310 — это число 123 в десятичной системе счисления;

11110112 — то же число, но в двоичной системе.

Двоичное число 1111011 можно расписать в виде: 11110112 = 1*26 + 1*25 + 1*24 + 1*23 + 0*22 + 1*21 + 1*20.

Двоичная система счисления обладает такими же свойствами, что и десятичная, только для представления чисел используются не 10 цифр, а всего две. Соответственно и разряд числа называют не десятичным, а двоичным.

Перевод из десятичной системы счисления в систему счисления с основанием p осуществляется последовательным делением десятичного числа и его десятичных частных на p, а затем выписыванием последнего частного и остатков в обратном порядке.

Переведем десятичное число 2010 в двоичную систем счисления (основание системы счисления p=2). В итоге получили 2010 = 101002.


Двоичное кодирование текстовой информации 

Начиная с 60-х годов, компьютеры все больше стали использовать для обработки текстовой информации и в настоящее время большая часть ПК в мире занято обработкой именно текстовой информации.

Традиционно для кодирования одного символа используется количество информации = 1 байту (1 байт = 8 битов).

Для кодирования одного символа требуется один байт информации.

Учитывая, что каждый бит принимает значение 1 или 0, получаем, что с помощью 1 байта можно закодировать 256 различных символов. (28 = 256)

Кодирование заключается в том, что каждому символу ставится в соответствие уникальный двоичный код от 00000000 до 11111111 (или десятичный код от 0 до 255).

Важно, что присвоение символу конкретного кода – это вопрос соглашения, которое фиксируется кодовой таблицей.

Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера (коды), называется таблицей кодировки.

Для разных типов ЭВМ используются различные кодировки. С распространением IBM PC международным стандартом стала таблица кодировки ASCII (American Standard Code for Information Interchange) – Американский стандартный код для информационного обмена.

Стандартной в этой таблице является только первая половина, т.е. символы с номерами от 0 (00000000) до 127 (0111111). Сюда входят буква латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы.

Остальные 128 кодов используются в разных вариантах. В русских кодировках размещаются символы русского алфавита.

В настоящее время существует 5 разных кодовых таблиц для русских букв (КОИ8, СР1251, СР866, Mac, ISO).

В настоящее время получил широкое распространение новый международный стандарт Unicode, который отводит на каждый символ два байта. С его помощью можно закодировать 65536 (216= 65536 ) различных символов.

Таблица стандартной части ASCII

Таблица расширенного кода ASCII (один из вариантов)

Сегодня очень многие люди для подготовки писем, документов, статей, книг и пр. используют компьютерные текстовые редакторы. Компьютерные редакторы, в основном, работают с алфавитом размером 256 символов.

В этом случае легко подсчитать объем информации в тексте. Если 1 символ алфавита несет 1 байт информации, то надо просто сосчитать количество символов; полученное число даст информационный объем текста в байтах.

Пусть небольшая книжка, сделанная с помощью компьютера, содержит 150 страниц; на каждой странице — 40 строк, в каждой строке — 60 символов. Значит страница содержит 40x60=2400 байт информации. Объем всей информации в книге: 2400 х 150 = 360 000 байт.

Обратите внимание! Цифры кодируются по стандарту ASCII в двух случаях – при вводе-выводе и когда они встречаются в тексте. Если цифры участвуют в вычислениях, то осуществляется их преобразование в другой двоичных код.

Возьмем число 57.

При использовании в тексте каждая цифра будет представлена своим кодом в соответствии с таблицей ASCII. В двоичной системе это – 00110101 00110111.

При использовании в вычислениях, код этого числа будет получен по правилам перевода в двоичную систему и получим – 00111001.


 

А также другие работы, которые могут Вас заинтересовать

42846. Разработка базы данных пациентов районной поликлиники 6.88 MB
  Описание таблиц и логической структуры базы данных. Схема данных. 29 Введение: Целью данной курсовой является создание базы данных для работников регистратуры поликлиники.
42847. Г. Маркузе и Франкфуртская социологическая школа 72.11 KB
  Среди центров и школ западной философии, которые на протяжении целых десятилетий сохраняли и до сих пор еще сохраняют заметное влияние на философию, социальную мысль всего мира, надо особо выделить так называемую франкфуртскую школу. Группа талантливых, а в политическом отношении радикально-критически настроенных философов, социологов, экономистов, историков, литераторов объединилась вокруг основанного в 1923 г. при Франкфуртском университете Института социальных исследований.
42848. Телескопічні системи. Розрахунок монокуляра 880.79 KB
  До таких призм можно віднести призми АкР90 Лемана ВкЛ0 Шмідта ВкР45 Систему двох призм : Аббе Ак0 Пехана Пк0 Порро Іго роду Систему трьох призм : Порро ІІго роду. Призма оптична деталь що має у своєму складі заломлюючі та відбиваючі поверхні які утворюють між собою двогранні кути Позначають призми двома великими літерами і числом яке вказує на кут відхилення осьового променя. Призми які є відбиваючими характеризуються коефіцієнтом: c = d D d довжина ходу осьового променя; D діаметр світлового пучка...
42849. Маркетингове дослідження компанії MTI 592.77 KB
  MTI українська компанія багатопрофільний ІТхолдинг один з найбільших гравців ринку інформаційних технологій України яка була заснована у 1991 році. Фактори макро і мікро середи в якому працює MTI. Компанія MTI є одним з найбільш великих в Україні постачальників комп'ютерної і офісної техніки.
42850. Розробка бізнес-плану діяльності підприємства 228.87 KB
  Організаційний план, планування показників по праці. Розраховані такі показники: середня тривалість щорічної відпустки, баланс робочого часу одного середньооблікового робітника, планова тривалість робочої зміни, корисний фонд робочого часу одного виробничого робітника на плановий рік, чисельність робітників на нормованих роботах та загальну чисельність працівників
42851. Розрахунок та оптиматизація характеристик системи електрозв’язку 117.29 KB
  1Перетворення аналогового сигналу в сигнал ІКМ5 2.3 Кодування сигналу та розробка коректую чого кодуза варіантом.4 Опис маніпуляції сигналу. В таблиці застосовані наступні позначення: Рс потужність сигналу Вт; Рс Рш.
42852. ДИЗАЙН: ОСНОВНІ ПОНЯТТЯ І СТИЛІ ІНТЕР'ЄРУ. КЛАСИЧНИЙ СТИЛЬ ДИЗАЙНУ В ІНТЕРЄРІ 55.75 KB
  Дизайн виник на початку 20 ст. як реакція на стихійне формування візуальних і функціональних властивостей предметного середовища. Дизайн розробляє зразки її раціональної побудови, відповідні складного функціонуванню сучасного суспільства. Іноді під дизайном розуміють лише одну з його областей - проектування естетичних властивостей промислових виробів. Дизайн, однак, вирішує більш широкі соціально-технічні проблеми - функціонування виробництва, споживання, існування людей в предметній середовищі.
42853. Організація перевезень вантажів у змішаному сполученні 281.5 KB
  Одним з головних факторів, визначаючим ефективність перевізного процесу та умов функціонування обслуговуючим автомобільним транспортом підприємств, є партіонність перевезень. На сьогоднішній день перевезення дрібнопартіонних вантажів займає важливу роль у транспортному процесі. Цей вид перевезень набув популярності серед доставки товарів широкого вжитку (продуктів харчування, промислових товарів та ін.) на короткі відстані (мережа торгових кіосків, магазинів, супермаркетів міста).
42854. ГОСУДАРСТВЕННЫЕ РАСХОДЫ И ИХ РОЛЬ В РЕАЛИЗАЦИИ ФУНКЦИЙ СЕКТОРА ГОСУДАРСТВЕННОГО УПРАВЛЕНИЯ 895.5 KB
  В любом государстве существуют и решаются проблемы, ради которых и существует государство. В гражданском, демократическом обществе предполагается, что государство призвано осуществлять функции, порученные ему его гражданами. Содержание общественных (государственных и муниципальных) расходов непосредственно связано с функциями федеральных