Универсальность дискретного представления информации

Давайте подумаем об информации как о сигнале. Мы знаем, что сигнал рассматривается с позиции носителя информации по техническим средствам передачи. Какие виды информации различают в системах передачи информации?

Для передачи информации, или, правильнее сказать, данных, используется физический процесс, который может быть описан математической формулой и называется сигналом. Именно сигналы различают по способу их представления как аналоговые и дискретные.

В литературе постоянно ставят знак равенства между дискретными и цифровыми сигналами. Но их все-таки необходимо их различать.

Каковы различия между аналоговыми, дискретными и цифровыми сигналами?

Аналоговая информация характеризуется плавным изменением ее параметров. Основные параметры наиболее простых синусоидальных аналоговых сигналов могут непрерывно и плавно меняться.

Дискретная информация базируется на ряде фиксированных уровней представления заданных параметров, взятых в определенные промежутки времени. Если этих уровней много, можно говорить о цифровом представлении информации, то есть когда в определенные дискретные моменты они принимают конкретные дискретные значения. К счастью, аналоговую информацию легко преобразовать в цифровую. Это делают так называемые аналого-цифровое преобразователи (АЦП). Обратное преобразование обеспечивают цифроаналоговые преобразователи (ЦАП).

В качестве носителей аналоговой информации могут использоваться различные физические величины, принимающие различные значения на некотором интервале, например, электрический ток, радиоволна и т.д. При дискретизации, то есть при преобразовании непрерывных изображений и звука в набор дискретных значений в форме кодов, за основу берется какое-либо конкретное значение, а любые другие, отличающиеся от нормы, просто игнорируются.

Какие устройства можно отнести к аналоговым, а какие – к дискретным?

Аналоговыми устройствами являются:

· Телевизор - луч кинескопа непрерывно перемещается по экрану, чем сильнее луч, тем ярче светится точка, в которую он попадает; изменение свечения точек происходит плавно и непрерывно;

· Проигрыватель грампластинок – чем больше высота неровностей на звуковой дорожке, тем громче звучит звук;

· Телефон – чем громче мы говорим в трубку, тем выше сила тока, проходящего по проводам, тем громче звук, который слышит собеседник.

· К дискретным устройствам относятся:

· Монитор – яркость луча изменяется не плавно, а скачкообразно (дискретно). Луч либо есть, либо его нет. Если луч есть, то мы видим яркую точку (белую или цветную). Если луча нет, мы видим черную точку. Поэтому изображение на экране монитора получается более четким, чем на экране телевизора;

· Проигрыватель аудиокомпакт-дисков – звуковая дорожка представлена участками с разной отражающей способностью;

· Струйный принтер – изображение состоит из отдельных точек разного цвета.

Человек, благодаря своим органам чувств, привык иметь дело с аналоговой информацией, а в компьютере информация представлена в цифровом виде. Преобразование графической и звуковой информации из аналоговой формы в дискретную производится путем дискретизации, то есть разбиения непрерывного графического изображения или звукового сигнала на отдельные элементы.

Дискретизация – это преобразование непрерывных изображений и звука в набор дискретных значений в форме кодов.

При передаче дискретных данных по каналам связи применяются два основных типа физического кодирования – на основе синусоидального несущего сигнала и на основе последовательности прямоугольных импульсов.

Первый способ часто называется также модуляцией или аналоговой модуляцией, подчеркивая тот факт, что кодирование осуществляется за счет изменения параметров аналогового сигнала.

Второй способ обычно называют цифровым кодированием. Эти способы отличаются шириной спектра результирующего сигнала и сложностью аппаратуры, необходимой для их реализации.

В настоящее время все чаще данные, изначально имеющие аналоговую форму (речь, телевизионное изображение), передаются по каналам связи в дискретном виде, то есть в виде последовательности единиц и нулей. Процесс представления аналоговой информации в дискретной форме называется дискретной модуляцией. Аналоговая модуляция применяется для передачи дискретных данных по каналам с узкой полосой частот, типичным представителем которых является канал тональной частоты (телефонная сеть).

В простых вычислительных машинах, таких, как цифровые электромеханические или аналоговые, перенастройка на различные задачи осуществлялась с помощью изменения системы связей между элементами на специальной коммутационной панели. В современных универсальных компьютерах такие изменения производятся с помощью запоминания в специальном устройстве, накапливающем информацию, той или иной программы ее работы.

В отличие от аналоговых машин, оперирующих непрерывной информацией, современные компьютеры имеют дело с дискретной информацией, на входе и выходе которых в качестве такой информации могут выступать любые последовательности десятичных цифр, букв, знаков препинания и других символов. Внутри системы эта информация кодируется в виде последовательности сигналов, принимающих лишь два различных значения.

В то время как возможности аналоговых машин ограничены преобразованиями строго ограниченных типов сигналов, современные компьютеры обладают свойством универсальности, иными словами, компьютер может производить преобразования любых буквенно-цифровых данных благодаря программе, составленной для выполнения той или иной задачи. Эта способность компьютера достигается за счет универсальности его системы команд, то есть элементарных преобразований информации.

Свойство универсальности компьютера не ограничивается возможностью оперирования одной лишь буквенно-цифровой информацией. В данном виде может быть представлена (закодирована) любая дискретная информация, а также – с любой заданной степенью точности – произвольная непрерывная информация. Таким образом, компьютеры могут рассматриваться как универсальные преобразователи информации. Свойство универсальности современных компьютеров открывает возможность моделирования с их помощью любых других преобразователей информации, в том числе любых мыслительных процессов.

Технологии цифровой обработки акустических сигналов и изображений находят все более широкое применение в различных областях, в частности при идентификации пользователей или для построения многоуровневых систем защиты. Вместе с тем в перечне основных предъявляемым к соответствующим системам требований на первом месте стоит универсальность, быстрота и эффективность выполнения различных процедур обработки на основе использования стандартных недорогих технических средств, входящих в комплект традиционной офисной техники и компьютерной телефонии: ПК, сканера, принтера, звуковой платы, модема. Для реализации таких систем нужны подходы, позволяющие обрабатывать акустический сигнал и речь.

Практически 80% информации человек получает через зрение, что означает доминирование зрительных рецепторов в жизнедеятельности человека. Вся информация в аппарате мышления человека сохраняется в виде образов, причем в этом образе сконцентрирована информация, полученная всеми рецепторами человека. Можно сделать вывод, что информация в памяти человека хранится в виде графических объектов. Развивая гипотезу о том, что любая информация, получаемая человеком извне, проходит стадию преобразования в изображения с последующей их целенаправленной обработкой, можно вывести последовательность процедур, пригодную для реализации в автоматизированных системах обработки данных различного рода, в том числе и в речи:

1. Предобработка, когда независимо от вида полученной информации осуществляется ее преобразование к общему виду первичных описаний в виде двухмерных матриц данных, имеющих неотрицательные значения, которые можно рассматривать как изображения, образы;

2. Обработка предполагает, что на основе каких-либо общих принципов, методов и алгоритмов осуществляются преобразования полученных первичных данных для достижения поставленных целей (сжатие, «шум очистка», сравнение, распознавание и др.);

3. Получение новых знаний и принятие решений основываются на заключении из характера и вида полученной из внешнего мира информации, а также результатов ее обработки для выполнения конкретных действий в соответствии с общей стратегией поведения человека.

Практическая значимость этой гипотезы состоит в том, что интеллектуальные возможности человека по анализу и обработке визуальной информации, а также наработанный научный потенциал в области восстановления, распознавания и обработки изображений можно распространить сегодня на существующие технологии обработки информации иного рода, в том числе на акустические сигналы и речь.

Люди воспринимают пространство как «глубину», и изображения, формируемые мысленным взором, представляются им трехмерными. Однако в точных дисциплинах редко применяется обработка трехмерных изображений, что объясняется очевидными техническими трудностями работы с ними, а также недостаточным пониманием природы процесса восприятия изображений. В большинстве практических приложений исследователи имеют дело с квазитрехмерными изображениями, когда по двум известным параметрам, например, частоте и времени, строится некая двухмерная матрица, значения которой определяются значениями третьего известного параметра, например, мощностью и амплитудой рассчитанного мгновенного спектра.

Представление информации в двоичной системе счисления.

В двоичной системе счисления используются всего две цифры 0 и 1. Другими словами, двойка является основанием двоичной системы счисления. (Аналогично у десятичной системы основание 10.)

Чтобы научиться понимать числа в двоичной системе счисления, сначала рассмотрим, как формируются числа в привычной для нас десятичной системе счисления.

В десятичной системе счисления мы располагаем десятью знаками-цифрами (от 0 до 9). Когда счет достигает 9, то вводится новый разряд (десятки), а единицы обнуляются и счет начинается снова. После 19 разряд десятков увеличивается на 1, а единицы снова обнуляются. И так далее. Когда десятки доходят до 9, то потом появляется третий разряд – сотни.

Двоичная система счисления аналогична десятичной за исключением того, что в формировании числа участвуют всего лишь две знака-цифры: 0 и 1. Как только разряд достигает своего предела (т.е. единицы), появляется новый разряд, а старый обнуляется.

Перевод чисел из двоичной системы счисления в десятичную

Не трудно заметить, что в двоичной системе счисления длины чисел с увеличением значения растут быстрыми темпами. Как определить, что значит вот это: 10001001? Непривычный к такой форме записи чисел человеческий мозг обычно не может понять сколько это. Неплохо бы уметь переводить двоичные числа в десятичные.

В десятичной системе счисления любое число можно представить в форме суммы единиц, десяток, сотен и т.д. Например:

1476 = 1000 + 400 + 70 + 6

Можно пойти еще дальше и разложить так:

1476 = 1 * 103 + 4 * 102 + 7 * 101 + 6 * 100

Посмотрите на эту запись внимательно. Здесь цифры 1, 4, 7 и 6 - это набор цифр из которых состоит число 1476. Все эти цифры поочередно умножаются на десять возведенную в ту или иную степень. Десять – это основание десятичной системы счисления. Степень, в которую возводится десятка – это разряд цифры за минусом единицы.

Аналогично можно разложить и любое двоичное число. Только основание здесь будет 2:

10001001 = 1*27 + 0*26 + 0*25 + 0*24 + 1*23 + 0*22 + 0*21 + 1*20

Если посчитать сумму составляющих, то в итоге мы получим десятичное число, соответствующее 10001001:

1*27 + 0*26 + 0*25 + 0*24 + 1*23 + 0*22 + 0*21 + 1*20 = 128 + 0 + 0 + 0 + 8 + 0 + 0 + 1 = 137

Т.е. число 10001001 по основанию 2 равно числу 137 по основанию 10. Записать это можно так:

100010012 = 13710

Почему двоичная система счисления так распространена? Дело в том, что двоичная система счисления – это язык вычислительной техники. Каждая цифра должна быть как-то представлена на физическом носителе. Если это десятичная система, то придется создать такое устройство, которое может быть в десяти состояниях. Это сложно. Проще изготовить физический элемент, который может быть лишь в двух состояниях (например, есть ток или нет тока). Это одна из основных причин, почему двоичной системе счисления уделяется столько внимания.

Перевод десятичного числа в двоичное

Может потребоваться перевести десятичное число в двоичное. Один из способов – это деление на два и формирование двоичного числа из остатков. Например, нужно получить из числа 77 его двоичную запись:

77 / 2 = 38 (1 остаток)

38 / 2 = 19 (0 остаток)

19 / 2 = 9 (1 остаток)

9 / 2 = 4 (1 остаток)

4 / 2 = 2 (0 остаток)

2 / 2 = 1 (0 остаток)

1 / 2 = 0 (1 остаток)

Собираем остатки вместе, начиная с конца: 1001101. Это и есть число 77 в двоичном представлении. Проверим:

1001101 = 1*26 + 0*25 + 0*24 + 1*23 + 1*22 + 0*21 + 1*20 = 64 + 0 + 0 + 8 + 4 + 0 + 1 = 77

К достоинству двоичной системы счисления относится – простота совершаемых операций, возможность автоматической обработки информации с использованием двух состояний элементов ПК и операцию сдвиг

Кодирование – это операция преобразования знаков или групп знаков одной знаковой системы в знаки или группы знаков другой знаковой системы.

Декодирование – расшифровка кодированных знаков, преобразование кода символа в его изображение

Двоичное кодирование – кодирование информации в виде 0 и 1

Способы кодирования и декодирования информации в компьютере, в первую очередь, зависит от вида информации, а именно, что должно кодироваться:

· числа

· символьная информация (буквы, цифры, знаки)

· графические изображения

· звук

Двоичное кодирование чисел

Для записи информации о количестве объектов используются числа.

Числа записываются с использованием особых знаковых систем, которые называют системами счисления.

100 → 11001002

Система счисления – совокупность приемов и правил записи чисел с помощью определенного набора символов.

Все системы счисления делятся на две большие группы:

ПОЗИЦИОННЫЕ: Количественное значение каждой цифры числа зависит от того, в каком месте (позиции или разряде) записана та или иная цифра. (Например:0,7 70)

НЕПОЗИЦИОННЫЕ: Количественное значение цифры числа не зависит от того, в каком месте (позиции или разряде) записана та или иная цифра.(XIX)

Двоичное кодирование текста

Кодирование – присвоение каждому символу десятичного кода от 0 до 255 или соответствующего ему двоичного кода от 00000000 до 11111111

Присвоение символу определенного кода – это вопрос соглашения, которое фиксируется в кодовой таблице.

В качестве международного стандарта была принята кодовая таблица ASCII (American Standard Code for Information Interchange) :

· Коды с 0 по 32 (первые 33 кода) - коды операций (перевод строки, ввод пробела, т.е. соответствуют функциональным клавишам);

· Коды с 33 по 127 – интернациональные, соответствуют символам латинского алфавита, цифрам, знакам арифметических операций, знакам препинания;

· Коды с 128 по 255 – национальные, т.е. кодировка национального алфавита.

На 1 символ отводится 1 байт (8 бит), всего можно закодировать 28 = 256 символов

С 1997 года появился новый международный стандарт Unicode, который отводит для кодировки одного символа 2 байта (16 бит), и можно закодировать 65536 различных символов (Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, множество математических, музыкальных, химических и прочих символов)

В настоящий момент существует пять кодировок кириллицы: КОИ-8, CP1251, CP866, ISO, Mac. Для преобразования текстовых документов из одной кодировки в другую существуют программы, которые называются Конверторы.

Двоичное кодирование графики

Кодирование графической информации

Пространственная дискретизация – перевод графического изображения из аналоговой формы в цифровой компьютерный формат путем разбивания изображения на отдельные маленькие фрагменты (точки) где каждому элементу присваивается код цвета.

Пиксель – min участок изображения на экране, заданного цвета

Растровое изображение формируется из отдельных точек - пикселей, каждая из которых может иметь свой цвет. Двоичный код изображения, выводимого на экран храниться в видеопамяти. Кодирование рисунка растровой графики напоминает – мозаику из квадратов, имеющих определенный цвет

Качество кодирования изображения зависит от:

1) размера точки (чем меньше её размер, тем больше кол-во точек в изображении);

2) количества цветов (чем большее кол-во возможных состояний точки, тем качественнее изображение) Палитра цветов – совокупность используемого набора цвета

Качество растрового изображения зависит от:

1) разрешающей способности монитора – кол-во точек по вертикали и горизонтали.

2) используемой палитры цветов (16, 256, 65536 цветов)

3) глубины цвета – количество бит для кодирования цвета точки

Для хранения черно-белого изображения используется 1 бит.

Цветные изображения формируются в соответствии с двоичным кодом цвета, который хранится в видеопамяти. Цветные изображения имеют различную глубину цвета. Цветное изображение на экране формируется за счет смешивания трех базовых цветов – красного, зеленого и синего. Для получения богатой палитры базовым цветам могут быть заданы различные интенсивности.

Двоичное кодирование звука

В аналоговой форме звук представляет собой волну с непрерывно меняющейся амплитудой и частотой. На компьютере работать со звуковыми файлами начали с начала 90-х годов. В основе кодирования звука с использованием ПК лежит – процесс преобразования колебаний воздуха в колебания электрического тока и последующая дискретизация аналогового электрического сигнала. Кодирование и воспроизведение звуковой информации осуществляется с помощью специальных программ (редактор звукозаписи). Качество воспроизведения закодированного звука зависит от – частоты дискретизации и её разрешения (глубины кодирования звука - количество уровней)

Временная дискретизация – способ преобразования звука в цифровую форму путем разбивания звуковой волны на отдельные маленькие временные участки, где амплитуды этих участков квантуются (им присваивается определенное значение).

Это производится с помощью аналого-цифрового преобразователя, размещенного на звуковой плате. Таким образом, непрерывная зависимость амплитуды сигнала от времени заменяется дискретной последовательностью уровней громкости. Современные 16-битные звуковые карты кодируют 65536 различных уровней громкости или 16-битную глубину звука (каждому значению амплитуды звук. сигнала присваивается 16-битный код)

Качество кодирования звука зависит от:

1) глубины кодирования звука - количество уровней звука

2) частоты дискретизации – количество изменений уровня сигнала в единицу времени (как правило, за 1 сек).

N=2i

N – количество различных уровней сигнала

i – глубина кодирования звука

Информационный объем звуковой информации равен:

I = i * k* t

где i – глубина звука (бит)

K – частота вещания (качество звука) (Гц) (48 кГц – аудио CD)

t – время звучания (сек)

Представление видеоинформации

В последнее время компьютер все чаще используется для работы с видеоинформацией. Простейшей такой работой является просмотр кинофильмов и видеоклипов. Следует четко представлять, что обработка видеоинформации требует очень высокого быстродействия компьютерной системы.

Что представляет собой фильм с точки зрения информатики? Прежде всего, это сочетание звуковой и графической информации. Кроме того, для создания на экране эффекта движения используется дискретная по своей сути технология быстрой смены статических картинок. Исследования показали, что если за одну секунду сменяется более 10-12 кадров, то человеческий глаз воспринимает изменения на них как непрерывные.