6039

Классификация и основные свойства единиц информации

Лекция

Информатика, кибернетика и программирование

Классификация и основные свойства единиц информации: Общие понятия и задачи проектирования информационного обеспечения. Имя, структура и значение единиц информации. Экономические показатели и документы. Операции над единицами информации. Классификац...

Русский

2012-12-27

39.48 KB

86 чел.

Классификация и основные свойства единиц информации:

Общие понятия и задачи проектирования информационного обеспечения.

Имя, структура и значение единиц информации. Экономические показатели и документы.

Операции над единицами информации.

Классификация и кодирование информации.

  1.  Общие понятия и задачи проектирования информационного обеспечения

Информационное обеспечение (ИО) представляет собой совокупность проектных решений по объемам, размещению, формам организации информации. Оно включает в себя совокупность показателей, справочных данных, классификаторов и кодификаторов информации, унифицированные системы документации, специально организованные для автоматического обслуживания, файлы информации на соответствующих носителях, а также персонал, обеспечивающий надежность хранения, своевременность и качество технологии обработки информации.

ИО предназначено для отображения информации, характеризующей состояние объекта  управления. ИО – основа для принятия управленческих решений. В теории ЭИС различают информационное обеспечение:

  1. внемашинное (удобное для восприятия человеком),
  2. внутримашинное (связано с хранением, поиском, обработкой информации).

Внемашинное  обеспечение:

  1. системы показателей данной предметной области,
  2. системы классификации и кодирования,
  3. унифицированная документация,
  4. потоки информации.

Внутримашинное обеспечение -  различные информационные файлы.

В процессе проектирования информационного обеспечения решаются следующие задачи:

  1. определяется состав показателей для решения экономических задач, их объемно-временные характеристики, информационные связи,
  2. выбираются системы кодирования информации,
  3. разрабатываются классификаторы, рассматривается возможность использования федеральных, отраслевых и прочих классификаторов,
  4. проектируются формы новых первичных документов, предназначенных для использования в АИС,
  5. проектируется размещение первичных данных на машинных носителях,
  6. проектируются формы вывода результатов обработки информации.

Проектирование ИО осуществляется в ходе составления технического и рабочего проектов и предусматривает:

  1. инструкции по подготовке документов к автоматизированной обработке и их кодирование;
  2. инструкции по обработке экономической информации на ЭВМ (ведение файлов БД, организация запросов, получение выходных данных, обмен информации с другими пользователями и пр.).
  3.  Имя, структура и значение единиц информации. Экономические показатели и документы.

Проектирование структурных единиц информации заключается в определении составных единиц информации, их логической структуры и способов перехода от одних единиц к другим, т.е. структуризация данных (условно-постоянных, входных, выходных).

Экономическая информация отражается через систему натуральных и стоимостных показателей. Выделяют простые (не поддаются дальнейшему расчленению) и составные единицы информации (СЕИ).

В структуре экономической информации различают: атрибут, показатель, информационное сообщение, информационный файл, информационный поток, информационная подсистема, информационная система.

Основные единицы информации - атрибут и составная единица информации.

Атрибут – информационная единица низшего уровня, отражает отдельные свойства объекта, состоит из сочетания цифр и/или букв, имеющих смысловое содержание, не подается дальнейшему делению. Т.е. атрибут (элемент данных, реквизит, поле) - неделимая информационная совокупность.

Материальные процессы имеют качественную и количественную характеристику. Соответственно, и атрибуты должны подразделяться на два класса: атрибуты - признаки и атрибуты - основания.

Атрибут-признак характеризует качественное свойство отражаемых сущностей (наименования предприятий, код, номер счета, дата и т.д.), служит для выполнения логических операций, составления группировок.

Атрибут-основание характеризует объект, процесс, явление с количественной стороны (сумма, расценки, количество и т.д.), над которым в процессе обработки выполняются арифметические действия.

Атрибут характеризуется именем и значением. Именем атрибута называется его условное обозначение в процессах обработки данных.

Значением атрибута называется величина, характеризующая некоторое свойство объекта, явления, процесса в конкретных обстоятельствах. Все допустимые значения атрибута образуют множество, называемое доменом этого атрибута (областью определения атрибута). Если в домене необходимо перечислить обозначения объектов из некоторого класса, то разрабатывается классификатор, содержащий условные обозначения (коды) отдельных объектов и классов, к которым эти объекты отнесены.

Атрибут с одним именем может иметь несколько различных значений. Например,

Наименование продукции: чугун, сталь.

Количество: 90, 120, 200.

Атрибуты объединяются в единицу информации более высокого уровня: сочетание одного атрибута-основания и всех, относящихся к нему атрибутов-признаков, однозначно характеризующих условия существования этого основания,  образуют показатель. 

Информационное сообщение: “ Ткань 450 м”.

Здесь количественный реквизит один -  450,

Реквизитов-признаков два -  ткань, м.

Документы, характеризующие экономическую деятельность, содержат, как правило, большое количество показателей. Каждый показатель имеет множество значений и рассчитывается по своему алгоритму.

Существуют документы, не содержащие атрибутов-оснований, например анкеты кадрового учета, сведения о структуре подразделений предприятия и т. д. Следовательно, не вся экономическая информация может быть представлена в форме показателей.

Одним из критериев качества создания базы данных может служить минимальная избыточность хранимой информации: каждое сообщение хранится в БД один раз. Использование аппарата экономических показателей позволяет создать структуру БД с минимальной избыточностью, если сначала декомпозировать все сведения, циркулирующие в АИС, на показатели, а потом объединить атрибуты родственных показателей по принципу: в один файл включается группа экономических показателей с одинаковым составом атрибутов-признаков.

Одна из причин выделения показателей в особую разновидность единиц информации заключается в том, что показатель является минимальной группой атрибутов, сохраняющей информативность (осмысленность) и поэтому достаточной для образования самостоятельного документа. Как единица информации показатель является составной единицей информации - пример СЕИ.

Вообще аппарат СЕИ предназначен для описания структуры экономических документов. Документом называется материальный носитель информации (обычно бланк бумаги), содержащий оформленные в установленном порядке сообщения, и имеющий юридическую силу. В экономических документах таблицы не имеют названий, названия всех элементов документа требуются при его машинной обработке.

Простейшими характеристиками СЕИ являются имя, структура и значение. Имя СЕИ - это ее условное обозначение в процессах обработки информации. Структурой СЕИ называется вхождение одних единиц информации в состав других единиц информации.

  1.  Операции над единицами информации

Свойства единиц информации

Название свойства

Атрибут

Составная   единица информацни

Операции над именем

Операции

над значением

Операции

над структурой

Переименование,   объявление   синонима

Перекодирование

Выборка, корректировка

Арифмети-

ческие

операции

-

Декомпозиция, композиция. нормализация, свертка

Проекция, соединение, добавлениеатрибутов

Добавление/ изъятие атрибутов

Ограничения

Принад-лежность домену

Функциональные зависимости

Отметим базовые операции обработки составных единиц информации:

Переименованием единицы информации называется присвоение ей нового имени, объявление синонима - это установление альтернативного равноценного имени для единицы информации.

Выборка - операция выделения подмножества значений заданной информации, которое удовлетворяет условиям выборки.

Корректировка означает выполнение одной из операций:

  1.  добавление нового значения,
  2.  исключение существующего значения,
  3.  замена некоторого значения на новое.

 Декомпозиция - операция преобразования исходной СЕИ в несколько СЕИ с различными структурами.  Декомпозиция может иметь множество вариантов.

 Композиция - операция преобразования нескольких СЕИ с различными структурами в одну СЕИ. Декомпозиция и композиция являются взаимообратными операциями.  

Нормализация - это операция перехода от СЕИ с произвольной структурой к СЕИ с двухуровневой структурой (прямоугольная таблица).

Свертка - операция преобразования СЕИ с двухуровневой структурой в документ с произвольной многоуровневой структурой, имеющий экономический смысл.

Совокупность показателей документа образует информационное сообщение (запись). Группа таких записей, объединенных по определенному признаку, представляет собой информационный файл – основную структурную единицу при автоматизированный обработке данных – ядро любой АИС.

Файл – это место, где фактически хранится информация, совокупность всех записей, включающих различные поля. Обычно в решении экономической задачи участвуют несколько файлов. Несколько файлов могут составлять БД. БД в целом также является единицей информации.

Информационные файлы, используемые при решении конкретной экономической задачи (например, “Расчет заработной платы”) образуют  информационный поток. При этом некоторые файлы могут использоваться в разных задачах, например, нормативно-справочные файлы.

Принадлежность информации к какой-либо функции управления – основание для организации более высокой структуры – информационной подсистемы (бух.учет, финансовая деятельность и пр.).

Структурная единица высшего уровня – информационная систем - относится к какому-либо экономическому объекту (предприятие, банк, отрасль, регион и т.д.).

Приведенные толкования отражают скорее прагматический смысл терминов, формулировку, более точную в теоретическом смысле, смотри в соответствующих предыдущих лекциях курса.

  1.  Классификация и кодирование информации

Классификация - распределение элементов множества на подмножества на основании признаков и зависимости внутри признаков (например, область - районы).

Кодирование - присвоение условного обозначения кода – знака или группы знаков - по определенным правилам, принятым в системе кодирования.

Кодированию в документах подлежат те признаки,  по которым выполняется группировка информации в ЭВМ.  Проектирование кодов – при составлении технического и рабочего проектирования.  

Если классификация объектов не требуется, производится их нумерация, и кодом каждого объекта служит его порядковый номер. Такая система кодирования называется порядковой.

Если все множество объектов классифицируется по одному признаку, то коды объектов целесообразно разделить на несколько частей (серий) по количеству значений этого признака и в пределах каждой серии использовать последовательные номера – серийная система кодирования.

Когда используется несколько классификационных признаков и их взаимная подчиненность соответствует выделению классов объектов, подклассов внутри каждого класса и т.д., удобно использовать разрядную (позиционную) систему кодирования.

Можно выделить систему кодирования с кодом повторения (№ склада в шифре продукции), комбинированную, шахматную.

В качестве примера рассмотрим различные системы кодирования значений атрибута Код студента. 

1).     Порядковый код студента - это его номер в списке всех студентов.

2).    Предположим, что необходимо различать студентов-дневников, студентов ИДО и заочников с использованием серийной системы кодирования. Для этого последовательные номера от 1 до 5999 будем использовать при кодировании дневников, номера от 6000 до 7999 - при кодировании студентов ИДО, от 8000 до 9999 - при кодировании заочников.

3).   Если в этих же условиях применить разрядный код, то первый знак кода будет принимать три значения (1 - дневное отделение, 2 – ИДО, 3 - заочное), а следующие 4 знака отводятся для нумерации студентов каждого отделения. В разрядном коде можно учесть больше признаков, например, первый знак - код отделения, второй - код факультета, третий - код курса, четвертый - код группы, пятый и шестой - порядковый номер студента в группе. Но увеличивая число различимых признаков в коде, мы вынуждены увеличивать и длину значения атрибута Код студента.

Классификационные группировки по младшим признакам кодируются в зависимости от кода более старшего признака.

Требования к кодам:

  1. учитывать весь диапазон значений,
  2. быть едиными внутри одного экономического объекта,
  3. иметь резерв свободных номеров,
  4. стабильность,
  5. длина кода должна быть минимальной.

Систематизация экономической информации вызывает необходимость применения самых разнообразных классификаторов: республиканских, отраслевых, локальных (данное предприятие).

Изначально выясняется, какие из универсальных классификаторов могут быть использованы, а затем, при необходимости, разрабатываются локальные.

Проектирование классификаторов:

  1. классификация информации,
  2. кодирование информации.

Коды :  цифры, буквы, буквенно – цифровые.

Классификатор, как минимум, содержит:

  1.  код,
  2.  наименование позиции.

Классификаторы используются при подготовке первичных документов к машинной обработке. Хранение классификаторов в ЭВМ позволяет автоматически формировать необходимую текстовую информацию в выходных сводках.


 

А также другие работы, которые могут Вас заинтересовать

8794. Мультимедийные службы. IP-телефония, Internet-вещание (-радио), конференции 125.5 KB
  Мультимедийные службы IP-телефония, Internet-вещание (-радио), конференции - далеко неполный перечень популярных мультимедийных сетевых служб и приложений. Первые опыты передачи голоса по сети Internet относятся к 1983 г. (Кембридж, Массачусетс...
8795. Ethernet/IEEE 802.3 128 KB
  Ethernet Ethernet/IEEE 802.3 (от лат. luminiferous ether - светоносный эфир)- самая популярная технология LAN с методом доступа CSMA/CD. Технология была создана в 70-х гг. доктором Робертом Меткалфом (RobertMetcalfe) как часть ...
8796. Технология ATM (Asynchronous Transfer Mode - асинхронный режим передачи) 199.5 KB
  ATM ТехнологияATM (Asynchronous Transfer Mode - асинхронный режим передачи)позиционируется как универсальный сетевой транспорт для локальных и глобальных компьютерных сетей (полумагистральная). Иногда для обозначение АТМ ис...
8797. Международные организации. Модель OSI 408.5 KB
  Международные организации. Модель OSI. Глобальность охвата и интернациональный характер развития компьютерных сетей делает роль международных организаций в вопросах стандартизации определяющей. При этом, в большинстве случаев, принимаемые стандарты ...
8798. История развития компьютерных сетей. Роль компьютерных сетей в современном мире 1.21 MB
  Эволюция компьютерных сетей началась в 50-х годах прошлого века. Развитие компьютерных сетей сопряжено с развитием вычислительной техники и телекоммуникаций. Компьютерные сети могут рассматриваться как средство передачи информации на большие расстоя...
8799. Назначение компьютерных сетей 18.79 KB
  Компьютерные сети - это системы компьютеров, объединенных каналами передачи данных, обеспечивающие эффективное предоставление различных информационно-вычислительных услуг пользователям посредством реализации удобного и надежного доступа к ресур...
8800. Классификация и принципы построения компьютерных сетей 23.35 KB
  По территориальной распространенности сети могут быть локальными, глобальными, и региональными: Локальная сеть (LAN - Local Area Network) (ЛКС) - сеть в пределах предприятия, учреждения, одной организации. К классу ЛКС относятся сети...
8801. Принципы построения компьютерных сетей 207.84 KB
  Топология сети - это классификационный признак сети, который определяет принцип соединения компьютеров (рабочих станций, машин) в единую сеть. Существует несколько топологий: линия, каждый с каждым (многосвязная), звезда, шина, кольцо (двойное...
8802. Основные компоненты компьютерной сети 16.62 KB
  Компьютерная сеть - это сложный комплекс взаимосвязанных и согласованно функционирующих программных и аппаратных компонентов. Изучение сети в целом предполагает знание принципов работы ее отдельных элементов: компьютеров коммуникационно...