Как высчитать информационный объем звукового файла. Урок "решение задач на кодирование звуковой информации". Тема: Кодирование звука
Урок посвящен разбору задания 9 ЕГЭ по информатике
9 тема — «Кодирование информации, объем и передача информации» — характеризуется, как задания базового уровня сложности, время выполнения – примерно 5 минут, максимальный балл — 1
Кодирование текстовой информации
Кодирование графической информации
Рассмотрим некоторые понятия и формулы, необходимые для решения ЕГЭ по информатике данной темы.
- Пиксель – это наименьший элемент растрового изображения, который имеет определенный цвет.
- Разрешение – это количество пикселей на дюйм размера изображения.
- Глубина цвета - это количество битов, необходимое для кодирования цвета пикселя.
- Если глубина кодирования составляет i битов на пиксель, код каждого пикселя выбирается из 2 i возможных вариантов, поэтому можно использовать не более 2 i различных цветов.
- N — количество цветов
- i — глубина цвета
- В цветовой модели RGB (красный (R), зеленый (G), синий (B)): R (0..255) G (0..255) B (0..255) -> получаем 2 8 вариантов на каждый из трех цветов.
- R G B: 24 бита = 3 байта — режим True Color (истинный цвет)
- I — объем памяти, требуемый для хранения изображения
- M — ширина изображения в пикселях
- N — высота изображения в пикселях
- i — глубина кодирования цвета или разрешение
- где N – количество пикселей (M * N) и i – глубина кодирования цвета (разрядность кодирования)
- Следует также помнить формулы преобразования:
Формула для нахождения количества цветов в используемой палитре:
Найдем формулу объема памяти для хранения растрового изображения :
Или можно формулу записать так:
I = N * i битов
* для указания объема выделенной памяти встречаются разные обозначения (V или I ).
1 Мбайт = 2 20 байт = 2 23 бит,
1 Кбайт = 2 10 байт = 2 13 бит
Кодирование звуковой информации
Познакомимся с понятиями и формулами, необходимыми для решения заданий 9 ЕГЭ по информатике.
Пример: при ƒ=8 кГц, глубине кодирования 16 бит на отсчёт и длительности звука 128 с . потребуется:
✍ Решение:
I = 8000*16*128 = 16384000 бит
I = 8000*16*128/8 = 2 3 * 1000 * 2 4 * 2 7 / 2 3 = 2 14 / 2 3 =2 11 =
= 2048000 байт
Определение скорости передачи информации
- Канал связи всегда имеет ограниченную пропускную способность (скорость передачи информации), которая зависит от свойств аппаратуры и самой линии связи(кабеля)
- I — объем информации
- v — пропускная способность канала связи (измеряется в битах в секунду или подобных единицах)
- t — время передачи
Объем переданной информации I вычисляется по формуле:
* Вместо обозначения скорости V
иногда используется q
* Вместо обозначения объема сообщения I
иногда используется Q
Скорость передачи данных определяется по формуле:
и измеряется в бит/с
Решение заданий 9 ЕГЭ по информатике
Тема: Кодирование изображений
9_1: ЕГЭ по информатике 2017 задание 9 ФИПИ вариант 1 (Крылов С.С., Чуркина Т.Е.):
Какой минимальный объем памяти (в Кбайт) нужно зарезервировать, чтобы можно было сохранить любое растровое изображение размером 160 х 160 пикселей при условии, что в изображении могут использоваться 256 различных цветов?
✍ Решение:
- Используем формулу нахождения объема:
- Подсчитаем каждый сомножитель в формуле, стараясь привести числа к степеням двойки:
- M x N:
Результат: 25
Детальный разбор задания 9 ЕГЭ по информатике предлагаем посмотреть в видео:
ЕГЭ по информатике задание 9.2 (источник: вариант 11, К. Поляков):
Рисунок размером 128 на 256 пикселей занимает в памяти 24 Кбайт (без учёта сжатия). количество цветов в палитре изображения.
✍ Решение:
- где M * N — общее количество пикселей. Найдем это значение, используя для удобства степени двойки:
Количество цветов = 2 i
i = I / (M*N)
Результат: 64
Смотрите видеоразбор задания:
Тема: Кодирование изображений:
ЕГЭ по информатике задание 9.3 (источник: 9.1 вариант 24, К. Поляков):
После преобразования растрового 256-цветного графического файла в 4-цветный формат его размер уменьшился на 18 Кбайт . Каков был размер исходного файла в Кбайтах?
✍ Решение:
- По формуле объема файла изображения имеем:
- i можно найти, зная количество цветов в палитре:
где N
— общее количество пикселей,
а i
количество цветов = 2 i
Результат: 24
Подробный разбор 9 задания ЕГЭ смотрите на видео:
Тема: Кодирование изображений:
ЕГЭ по информатике задание 9.4 (источник: 9.1 вариант 28, К. Поляков, С. Логинова):
Цветное изображение было оцифровано и сохранено в виде файла без использования сжатия данных. Размер полученного файла – 42 Мбайт 2 раза меньше и глубиной кодирования цвета увеличили в 4 раза больше по сравнению с первоначальными параметрами. Сжатие данных не производилось. Укажите размер файла в Мбайт , полученного при повторной оцифровке.
✍ Решение:
- По формуле объема файла изображения имеем:
- В такого рода задачах необходимо учесть, что уменьшение разрешения в 2 раза, подразумевает уменьшение в 2 раза пикселей отдельно по ширине и по высоте. Т.е. в целом N уменьшается в 4 раза !
- Составим систему уравнений на основе имеющихся сведений, в которой первое уравнение будет соответствовать данным до преобразования файла, а второе уравнение — после:
где N
а i
\[ I= \frac {N}{4} * 4* \frac {42}{N} \]
Результат: 42
Тема: Кодирование изображений:
ЕГЭ по информатике задание 9.5 (источник: 9.1 вариант 30, К. Поляков, С. Логинова):
Изображение было оцифровано и сохранено в виде растрового файла. Получившийся файл был передан в город А
по каналу связи за 72 секунды
. Затем то же изображение было оцифровано повторно с разрешением в 2
раза больше и глубиной кодирования цвета в 3
раза меньше, чем в первый раз. Сжатие данных не производилось. Полученный файл был передан в город Б
, пропускная способность канала связи с городом Б в 3
раза выше, чем канала связи с городом А.
Б
?
✍ Решение:
- По формуле скорости передачи файла имеем:
- По формуле объема файла изображения имеем:
- Для данной задачи, необходимо уточнить, что разрешение на самом деле имеет два сомножителя (пикселей по ширине * пикселей по высоте). Поэтому при увеличении разрешения в два раза, увеличатся оба числа, т.е. N увеличится в 4 раза вместо двух.
- Изменим формулу получения объема файла для города Б :
- Для города А и Б заменим значения объема в формуле для получения скорости:
- Подставим значение скорости из формулы для города А в формулу для города Б:
- Выразим t :
где I — объем файла, а t — время
где N
— общее количество пикселей или разрешение,
а i
— глубина цвета (количество бит, выделенное на 1 пиксель)
\[ I= \frac {2*N * i}{3} \]
\[ V= \frac {N*i}{72} \]
\[ 3*V= \frac{\frac {4*N*i}{3}}{t} \]
\[ t*3*V= \frac {4*N*i}{3} \]
\[ \frac {t*3*N*i}{72}= \frac {4*N*i}{3} \]
Результат: 32
Другой способ решения смотрите в видеоуроке:
Тема: Кодирование изображений:
ЕГЭ по информатике задание 9.6 (источник: вариант 33, К. Поляков):
Камера делает фотоснимки размером 1024 х 768
пикселей. На хранение одного кадра отводится 900 Кбайт
.
Найдите максимально возможное количество цветов
в палитре изображения.
✍ Решение:
- Количество цветов зависит от глубины кодирования цвета, которая измеряется в битах. Для хранения кадра, т.е. общего количества пикселей выделено 900 Кбайт. Переведем в биты:
\[ \frac {225 * 2^{15}}{3 * 2^{18}} = \frac {75}{8} \approx 9 \]
9 бит на 1 пиксель
Результат: 512
Смотрите подробное решение на видео:
Тема: Кодирование изображений:
9_8: Демоверсия ЕГЭ 2018 информатика:
Автоматическая фотокамера производит растровые изображения размером 640
×480
пикселей. При этом объём файла с изображением не может превышать 320
Кбайт, упаковка данных не производится.
Какое максимальное количество цветов
можно использовать в палитре?
✍ Решение:
- По формуле объема файла изображения имеем:
- Посмотрим, что из формулы нам уже дано:
где N i — глубина кодирования цвета (количество бит, выделенное на 1 пиксель)
количество цветов = 2 i
\[ i = \frac {I}{N} = \frac {320 * 2^{13}}{75 * 2^{12}} \approx 8,5 бит \]
Результат: 256
Подробное решение данного 9 задания из демоверсии ЕГЭ 2018 года смотрите на видео:
9_21: : ЕГЭ по информатике задание 9.21 (источник: К. Поляков, 9.1 вариант 58):
Для хранения в информационной системе документы сканируются с разрешением 300 ppi . Методы сжатия изображений не используются. Средний размер отсканированного документа составляет 5 Мбайт . В целях экономии было решено перейти на разрешение 150 ppi и цветовую систему, содержащую 16 цветов . Средний размер документа, отсканированного с изменёнными параметрами, составляет 512 Кбайт .
Определите количество цветов в палитре до оптимизации .
✍ Решение:
- По формуле объема файла изображения имеем:
- Так как по заданию имеем разрешение, выраженное в пикселях на дюйм, то фактически это означает:
- Формула количества цветов:
- Посмотрим, что из формулы нам уже дано до экономного варианта и при экономном варианте:
где N — общее количество пикселей или разрешение, а i — глубина кодирования цвета (количество бит, выделенное на 1 пиксель).
I = значение ppi 2 * N * i
количество цветов = 2 i
Результат: 1024
Тема: Кодирование звука
9_7: ЕГЭ по информатике 2017 задание 9 ФИПИ вариант 15 (Крылов С.С., Чуркина Т.Е.):
На студии при четырехканальной (квадро ) звукозаписи с 32 -битным разрешением за 30 секунд был записан звуковой файл. Сжатие данных не производилось. Известно, что размер файла оказался 7500 Кбайт.
С какой частотой дискретизации (в кГц) велась запись? В качестве ответа укажите только число, единицы измерения указывать не нужно.
✍ Решение:
- По формуле объема звукового файла получим:
- Из задания имеем:
I = β * t * ƒ * S
\[ ƒ = \frac {I}{S*B*t} = \frac {7500 * 2^{10} * 2^2 бит}{2^7 * 30}Гц = \frac { 750 * 2^6}{1000}КГц = 2^4 = 16 \]
2 4 = 16 КГц
Результат: 16
Для более детального разбора предлагаем посмотреть видео решения данного 9 задания ЕГЭ по информатике:
Тема: Кодирование звука:
ЕГЭ по информатике задание 9_9 (источник: 9.2 вариант 36, К. Поляков):
Музыкальный фрагмент был оцифрован и записан в виде файла без использования сжатия данных. Получившийся файл был передан в город А по каналу связи. Затем тот же музыкальный фрагмент был оцифрован повторно с разрешением в 2 3 раза меньше, чем в первый раз. Сжатие данных не производилось. Полученный файл был передан в город Б за 15 секунд; пропускная способность канала связи с городом Б в 4 раза выше, чем канала связи с городом А .
Сколько секунд длилась передача файла в город A ? В ответе запишите только целое число, единицу измерения писать не нужно.
✍ Решение:
- Для решения понадобится формула нахождения скорости передачи данных формулы:
- Вспомним также формулу объема звукового файла:
- Выпишем отдельно, все данные, касающиеся города Б (про А практически ничего не известно):
I = β * ƒ * t * s
где:
I
- объем
β
- глубина кодирования
ƒ
- частота дискретизации
t
- время
S
- кол-во каналов (если не указывается, то моно)
\[ t_А = \frac {15}{2} * 3 * 4 \]
90 секундРезультат: 90
Подробное решение смотрите на видео:
Тема: Кодирование звука:
ЕГЭ по информатике задание 9.10 (источник: 9.2 вариант 43, К. Поляков):
Музыкальный фрагмент был записан в формате стерео (двухканальная запись ), оцифрован и сохранён в виде файла без использования сжатия данных. Размер полученного файла – 30 Мбайт. Затем тот же музыкальный фрагмент был записан повторно в формате моно и оцифрован с разрешением в 2 раза выше и частотой дискретизации в 1,5 раза меньше, чем в первый раз. Сжатие данных не производилось.
Укажите размер файла в Мбайт , полученного при повторной записи. В ответе запишите только целое число, единицу измерения писать не нужно.
✍ Решение:
- Выпишем отдельно, все данные, касающиеся первого состояния файла, затем второго состояния — после преобразования:
I = β * ƒ * t * S
I
- объем
β
- глубина кодирования
ƒ
- частота дискретизации
t
- время
S
-количество каналов
Результат: 20
Смотрите видеоразбор данной задачи:
Тема: Кодирование звуковых файлов:
ЕГЭ по информатике задание 9_11 (источник: 9.2 вариант 72, К. Поляков):
Музыкальный фрагмент был оцифрован и записан в виде файла без использования сжатия данных. Получившийся файл был передан в город А по каналу связи за 100 секунд. Затем тот же музыкальный фрагмент был оцифрован повторно с разрешением в 3 раза выше и частотой дискретизации в 4 раз меньше , чем в первый раз. Сжатие данных не производилось. Полученный файл был передан в город Б за 15 секунд.
Во сколько раз скорость (пропускная способность канала) в город Б больше пропускной способности канала в город А ?
✍ Решение:
- Вспомним формулу объема звукового файла:
- Выпишем отдельно, все данные, касающиеся файла, переданного в город А , затем преобразованного файла, переданного в город Б :
I = β * ƒ * t * S
I
- объем
β
- глубина кодирования
ƒ
- частота дискретизации
t
- время
✎ 1 способ решения:
Ответ: 5
✎ 2 способ решения:
\[ \frac {V_Б}{V_А} = \frac {3/_4 * I}{15} * \frac {100}{I} = \frac {3/_4 * 100}{15} = \frac {15}{3} = 5 \]
(((3/4) * I) / 15) * (100 / I)= (3/4 * 100) / 15 = 15/3 = 5 S - количество каналов
Результат: 60
Смотрите подробное решение:
Тема: Кодирование звука:
9_19: Государственный выпускной экзамен ГВЭ 2018 (информатика ГВЭ ФИПИ, задание 7):
Производится двухканальная (стерео) цифровая звукозапись. Значение сигнала фиксируется 48 000 раз в секунду , для записи каждого значения используется 32 бит . Запись длится 5 минут , её результаты записываются в файл, сжатие данных не производится.
Какая из приведённых ниже величин наиболее близка к размеру полученного файла?
1) 14 Мбайт
2) 28 Мбайт
3) 55 Мбайт
4) 110 Мбайт
✍ Решение:
I = β * ƒ * t * S
Результат: 4
Подробное решение ГВЭ задания 7 2018 года смотрите на видео:
Тема: Кодирование звука:
9_20: Решение 9 задания ЕГЭ по информатике (диагностический вариант экзаменационной работы 2018 года, С.С. Крылов, Д.М. Ушаков):
Производится двухканальная (стерео) звукозапись с частотой дискретизации 4 кГц и 64-битным разрешением . Запись длится 1 минуту , ее результаты записываются в файл, сжатие данных не производится.
Определите приблизительно размер получившегося файла (в Мбайтах)
.
В качестве ответа укажите ближайшее к размеру файла целое число, кратное 2
.
✍ Решение:
- По формуле объема звукового файла имеем:
I = β * ƒ * t * S
Результат: 4
Видеоразбор задания:
С меняющейся амплитудой и частотой. Чем выше амплитуда сигнала, тем он громче воспринимается человеком. Чем больше частота сигнала, тем выше его тон.
Рисунок 1. Амплитуда колебаний звуковых волн
Частота звуковой волны определяется количеством колебаний в одну секунду. Данная величина измеряется в герцах (Гц, Hz).
Ухо человека воспринимает звуки в диапазоне от $20$ Гц до $20$ кГц, данный диапазон называют звуковым . Количество бит, которое при этом отводится на один звуковой сигнал, называют глубиной кодирования звука . В современных звуковых картах обеспечивается $16-$, $32-$ или $64-$битная глубина кодирования звука. В процессе кодирования звуковой информации непрерывный сигнал заменяется дискретным , то есть преобразуется в последовательность электрических импульсов, состоящих из двоичных нулей и единиц.
Частота дискретизации звука
Одной из важных характеристик процесса кодирования звука является частота дискретизации, которая представляет собой количество измерений уровня сигнала за $1$ секунду:
- одно измерение в одну секунду соответствует частоте $1$ гигагерц (ГГц);
- $1000$ измерений в одну секунду соответствует частоте $1$ килогерц (кГц) .
Определение 2
Частота дискретизации звука - это количество измерений громкости звука за одну секунду.
Количество измерений может находиться в диапазоне от $8$ кГц до $48$ кГц, причем первая величина соответствует частоте радиотрансляции, а вторая - качеству звучания музыкальных носителей.
Замечание 1
Чем выше частота и глубина дискретизации звука, тем более качественно будет звучать оцифрованный звук. Самое низкое качество оцифрованного звука, которое соответствует качеству телефонной связи, получается, когда частота дискретизации равна 8000 раз в секунду, глубина дискретизации $8$ битов, что соответствует записи одной звуковой дорожки (режим «моно»). Самое высокое качество оцифрованного звука, которое соответствует качеству аудио -CD, достигается, когда частота дискретизации равна $48000$ раз в секунду, глубина дискретизации $16$ битов, что соответствует записи двух звуковых дорожек (режим «стерео»).
Информационный объем звукового файла
Следует отметить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла .
Оценим информационный объём моноаудиофайла ($V$), это можно сделать, используя формулу:
$V = N \cdot f \cdot k$,
где $N$ - общая длительность звучания, выражаемая в секундах,
$f$ - частота дискретизации (Гц),
$k$ - глубина кодирования (бит).
Пример 1
Например, если длительность звучания равна $1$ минуте и имеем среднее качество звука, при котором частота дискретизации $24$ кГц, а глубина кодирования $16$ бит, то:
$V=60 \cdot 24000 \cdot 16 \ бит=23040000 \ бит=2880000 \ байт = 2812,5 \ Кбайт=2,75 \ Мбайт.$
При кодировании стереозвука процесс дискретизации производится отдельно и независимо для левого и правого каналов, что, соответственно, увеличивает объём звукового файла в два раза по сравнению с монозвуком.
Пример 2
Например, оценим информационный объём цифрового стереозвукового файла, у котрого длительность звучания равна $1$ секунде при среднем качестве звука ($16$ битов, $24000$ измерений в секунду). Для этого глубину кодирования умножим на количество измерений в $1$ секунду и умножить на $2$ (стереозвук):
$V=16 \ бит \cdot 24000 \cdot 2 = 768000 \ бит = 96000 \ байт = 93,75 \ Кбайт.$
Основные методы кодирования звуковой информации
Существуют различные методы кодирования звуковой информации двоичным кодом, среди которых выделяют два основных направления: метод FM и метод Wave-Table .
Метод FM (Frequency Modulation ) основан на том, что теоретически любой сложный звук можно разложить на последовательность простейших гармонических сигналов разных частот, каждый из которых будет представлять собой правильную синусоиду, а это значит, что его можно описать кодом. Процесс разложения звуковых сигналов в гармонические ряды и их представление в виде дискретных цифровых сигналов происходит в специальных устройствах, которые называют «аналогово-цифровые преобразователи» (АЦП).
Рисунок 2. Преобразование звукового сигнала в дискретный сигнал
На рисунке 2а изображен звуковой сигнал на входе АЦП, а на рисунке 2б изображен уже преобразованный дискретный сигнал на выходе АЦП.
Для обратного преобразования при воспроизведении звука, который представлен в виде числового кода, используют цифро-аналоговые преобразователи (ЦАП). Процесс преобразования звука изображен на рис. 3. Данный метод кодирования не даёт хорошего качества звучания, но обеспечивает компактный код.
Рисунок 3. Преобразование дискретного сигнала в звуковой сигнал
На рисунке 3а представлен дискретный сигнал, который мы имеем на входе ЦАП, а на рисунке 3б представлен звуковой сигнал на выходе ЦАП.
Таблично-волновой метод (Wave-Table ) основан на том, что в заранее подготовленных таблицах хранятся образцы звуков окружающего мира, музыкальных инструментов и т. д. Числовые коды выражают высоту тона, продолжительность и интенсивность звука и прочие параметры, характеризующие особенности звука. Поскольку в качестве образцов используются «реальные» звуки, качество звука, полученного в результате синтеза, получается очень высоким и приближается к качеству звучания реальных музыкальных инструментов.
Примеры форматов звуковых файлов
Звуковые файлы имеют несколько форматов. Наиболее популярные из них MIDI, WAV, МРЗ.
Формат MIDI (Musical Instrument Digital Interface) изначально был предназначен для управления музыкальными инструментами. В настоящее время используется в области электронных музыкальных инструментов и компьютерных модулей синтеза.
Формат аудиофайла WAV (waveform) представляет произвольный звук в виде цифрового представления исходного звукового колебания или звуковой волны. Все стандартные звуки Windows имеют расширение WAV.
Формат МРЗ (MPEG-1 Audio Layer 3) - один из цифровых форматов хранения звуковой информации. Он обеспечивает более высокое качество кодирования.
Основные понятия
Частота дискретизации(f) определяет количество отсчетов, запоминаемых за 1 секунду;
1 Гц (один герц) – это один отсчет в секунду,
а 8 кГц – это 8000 отсчетов в секунду
Глубина кодирования (b) – это количество бит, которое необходимо для кодирования 1 уровня громкости
Время звучания (t)
Объем памяти для хранения данных 1 канала (моно)
I=f·b·t
(для хранения информации о звуке длительностью t секунд, закодированном с частотой дискретизации f Гц и глубиной кодирования b бит требуется I бит памяти)При двухканальной записи (стерео) объем памяти, необходимый для хранения данных одного канала, умножается на 2
I=f·b·t·2
Кодирование звуковой информации
Основные теоретические положения
Временная дискретизация звука. Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть преобразован в цифровую дискретную форму с помощью временной дискретизации. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, для каждого такого участка устанавливается определенная величина интенсивности звука.
Таким образом, непрерывная зависимость громкости звука от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность "ступенек".
Частота дискретизации. Для записи аналогового звука и его преобразования в цифровую форму используется микрофон, подключенный к звуковой плате. Качество полученного цифрового звука зависит от количества измерений уровня громкости звука в единицу времени, т.е. частоты дискретизации. Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации), тем точнее "лесенка" цифрового звукового сигнала повторяет кривую аналогового сигнала.
Частота дискретизации звука - это количество измерений громкости звука за одну секунду, измеряется в герцах (Гц). Обозначим частоту дискретизации буквой f.
Частота дискретизации звука может лежать в диапазоне от 8000 до 48 000 измерений громкости звука за одну секунду. Для кодировки выбирают одну из трех частот: 44,1 КГц, 22,05 КГц, 11,025 КГц.
Глубина кодирования звука. Каждой "ступеньке" присваивается определенное значение уровня громкости звука. Уровни громкости звука можно рассматривать как набор возможных состояний N, для кодирования которых необходимо определенное количество информации b , которое называется глубиной кодирования звука
Глубина кодирования звука - это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука.
Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитать по формуле N = 2 b . Пусть глубина кодирования звука составляет 16 битов, тогда количество уровней громкости звука равно:
N = 2 b = 2 16 = 65 536.
В процессе кодирования каждому уровню громкости звука присваивается свой 16-битовый двоичный код, наименьшему уровню звука будет соответствовать код 0000000000000000, а наибольшему - 1111111111111111.
Качество оцифрованного звука. Чем больше частота и глубина дискретизации звука, тем более качественным будет звучание оцифрованного звука. Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи, получается при частоте дискретизации 8000 раз в секунду, глубине дискретизации 8 битов и записи одной звуковой дорожки (режим "моно"). Самое высокое качество оцифрованного звука, соответствующее качеству аудио-CD, достигается при частоте дискретизации 48 000 раз в секунду, глубине дискретизации 16 битов и записи двух звуковых дорожек (режим "стерео").
Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла.
Задачи для самостоятельной подготовки .
1. Рассчитайте объём монофонического аудиофайла длительностью 10 с при 16-битном кодировании и частоте дискретизации 44,1 к Гц. (861 Кбайт)
2. Производится двухканальная (стерео) звукозапись с частотой дискретизации 48 кГц и 24-битным разрешением. Запись длится 1 минуту, ее результаты записываются в файл, сжатие данных не производится. Какое из приведенных ниже чисел наиболее близко к размеру полученного файла, выраженному в мегабайтах?
1)0,3 2) 4 3) 16 4) 132
3. Производится одноканальная (моно) звукозапись с частотой дискретизации 11 кГц и глубиной кодирования 24 бита. Запись длится 7 минут, ее результаты записываются в файл, сжатие данных не производится. Какое из приведенных ниже чисел наиболее близко к размеру полученного файла, выраженному в мегабайтах?
1) 11 2) 13 3) 15 4) 22
4. Производится двухканальная (стерео) звукозапись с частотой дискретизации 11 кГц и глубиной кодирования 16 бит. Запись длится 6 минут, ее результаты записываются в файл, сжатие данных не производится. Какое из приведенных ниже чисел наиболее близко к размеру полученного файла, выраженному в мегабайтах?
1) 11 2) 12 3) 13 4) 15
Человеческое ухо воспринимает звук с частотой от 20 колебаний в секунду (низкий звук) до 20 000 колебаний в секунду (высокий звук).
Человек может воспринимать звук в огромном диапазоне интенсивностей, в котором максимальная интенсивность больше минимальной в 10 14 раз (в сто тысяч миллиардов раз). Для измерения громкости звука применяется специальная единица "децибел" (дбл) (табл. 5.1). Уменьшение или увеличение громкости звука на 10 дбл соответствует уменьшению или увеличению интенсивности звука в 10 раз.
Временная дискретизация звука. Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть преобразован в цифровую дискретную форму с помощью временной дискретизации. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, для каждого такого участка устанавливается определенная величина интенсивности звука.
Таким образом, непрерывная зависимость громкости звука от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность "ступенек" (рис. 1.2).
Рис. 1.2. Временная дискретизация звука |
Частота дискретизации. Для записи аналогового звука и г го преобразования в цифровую форму используется микрофон, подключенный к звуковой плате. Качество полученного цифрового звука зависит от количества измерений уровня громкости звука в единицу времени, т. е. частоты дискретизации . Чем большее количество измерений производится за I секунду (чем больше частота дискретизации), тем точнее "лесенка" цифрового звукового сигнала повторяет кривую диалогового сигнала.
Частота дискретизации звука - это количество измерений громкости звука за одну секунду.
Частота дискретизации звука может лежать в диапазоне от 8000 до 48 000 измерений громкости звука за одну секунду.
Глубина кодирования звука. Каждой "ступеньке" присваивается определенное значение уровня громкости звука. Уровни громкости звука можно рассматривать как набор возможных состояний N, для кодирования которых необходимо определенное количество информации I, которое называется глубиной кодирования звука.
Глубина кодирования звука - это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука.
Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитать по формуле N = 2 I . Пусть глубина кодирования звука составляет 16 битов, тогда количество уровней громкости звука равно:
N = 2 I = 2 16 = 65 536.
В процессе кодирования каждому уровню громкости звука присваивается свой 16-битовый двоичный код, наименьшему уровню звука будет соответствовать код 0000000000000000, а наибольшему - 1111111111111111.
Качество оцифрованного звука. Чем больше частота и глубина дискретизации звука, тем более качественным будет звучание оцифрованного звука. Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи, получается при частоте дискретизации 8000 раз в секунду, глубине дискретизации 8 битов и записи одной звуковой дорожки (режим "моно"). Самое высокое качество оцифрованного звука, соответствующее качеству аудио-CD, достигается при частоте дискретизации 48 000 раз в секунду, глубине дискретизации 16 битов и записи двух звуковых дорожек (режим "стерео").
Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла. Можно оценить информационный объем цифрового стереозвукового файла длительностью звучания 1 секунда при среднем качестве звука (16 битов, 24 000 измерений в секунду). Для этого глубину кодирования необходимо умножить на количество измерений в 1 секунду й умножить на 2 (стереозвук):
16 бит × 24 000 × 2 = 768 000 бит = 96 000 байт = 93,75 Кбайт.
Звуковые редакторы. Звуковые редакторы позволяют не только записывать и воспроизводить звук, но и редактировать его. Оцифрованный звук представляется в звуковых редакторах в наглядной форме, поэтому операции копирования, перемещения и удаления частей звуковой дорожки можно легко осуществлять с помощью мыши. Кроме того, можно накладывать звуковые дорожки друг на друга (микшировать звуки) и применять различные акустические эффекты (эхо, воспроизведение в обратном направлении и др.).
Звуковые редакторы позволяют изменять качество цифрового звука и объем звукового файла путем изменения частоты дискретизации и глубины кодирования. Оцифрованный звук можно сохранять без сжатия в звуковых файлах в универсальном формате WAV или в формате со сжатием МР3 .
При сохранении звука в форматах со сжатием отбрасываются "избыточные" для человеческого восприятия звуковые частоты с малой интенсивностью, совпадающие по времени со звуковыми частотами с большой интенсивностью. Применение такого формата позволяет сжимать звуковые файлы в десятки раз, однако приводит к необратимой потере информации (файлы не могут быть восстановлены в первоначальном виде).
Контрольные вопросы
1. Как частота дискретизации и глубина кодирования влияют на качество цифрового звука?
Задания для самостоятельного выполнения
1.22. Задание с выборочным ответом. Звуковая плата производит двоичное кодирование аналогового звукового сигнала.
Какое количество информации необходимо для кодирования каждого из 65 536 возможных уровней интенсивности сигнала?
1) 16 битов; 2) 256 битов; 3) 1 бит; 4) 8 битов.
1.23. Задание с развернутым ответом. Оценить информационный объем цифровых звуковых файлов длительностью 10 секунд при глубине кодирования и частоте дискретизации звукового сигнала, обеспечивающих минимальное и максимальное качество звука:
а) моно, 8 битов, 8000 измерений в секунду;
б) стерео, 16 битов, 48 000 измерений в секунду.
1.24. Задание с развернутым ответом. Определить длительность звукового файла, который уместится на дискете 3,5" (учтите, что для хранения данных на такой дискете выделяется 2847 секторов объемом 512 байтов каждый):
а) при низком качестве звука: моно, 8 битов, 8000 измерений в секунду;
б) при высоком качестве звука: стерео, 16 битов, 48 000 измерений в секунду.
Решение задач на кодирование звуковой информации
I. Размер цифрового файла
1. Определить размер (в байтах) цифрового аудиофайла, время звучания которого составляет 10 секунд при частоте дискретизации 22,05 кГц и разрешении 8 бит. Файл сжатию не подвержен. (, стр. 156, пример 1)
Решение:
Формула для расчета размера (в байтах) цифрового аудио-файла: A=D*T*I/8.
Для перевода в байты полученную величину надо разделить на 8 бит.
22,05 кГц =22,05 * 1000 Гц =22050 Гц
A=D*T*I/8 = 22050 х 10 х 8 / 8 = 220500 байт.
^ Ответ: размер файла 220500 байт.
2. Определить объем памяти для хранения цифрового аудиофайла, время звучания которого составляет две минуты при частоте дискретизации 44,1 кГц и разрешении 16 бит. (, стр. 157, №88)
Решение:
A=D*T*I/8. – объем памяти для хранения цифрового аудиофайла.
44100 (Гц) х 120 (с) х 16 (бит) /8 (бит) = 10584000 байт= 10335,9375 Кбайт= 10,094 Мбайт.
Ответ: ≈ 10 Мб
6. Две минуты записи цифрового аудиофайла занимают на диске 5,1 Мб. Частота дискретизации - 22050 Гц. Какова разрядность аудиоадаптера
Решение:
Формула для расчета разрядности: (объем памяти в байтах) : (время звучания в секундах): (частота дискретизации):
5, 1 Мбайт= 5347737,6 байт
5347737,6 байт: 120 сек: 22050 Гц= 2,02 байт =16 бит
^
Ответ: 16 бит
8.
Оцените информационный объем моноаудиофайла длительностью звучания 1 мин. если "глубина" кодирования и частота дискретизации звукового сигнала равны соответственно:
а) 16 бит и 8 кГц;
б) 16 бит и 24 кГц.
Решение:
а).
16 бит х 8 000 = 128000 бит = 16000 байт = 15,625 Кбайт/с
15,625 Кбайт/с х 60 с = 937,5 Кбайт
б).
1) Информационный объем звукового файла длительностью в 1 секунду равен:
16 бит х 24 000 = 384000 бит = 48000 байт = 46,875 Кбайт/с
2) Информационный объем звукового файла длительностью 1 минута равен:
46,875 Кбайт/с х 60 с =2812,5 Кбайт = 2,8 Мбайт
^ Ответ: а) 937,5 Кбайт; б) 2,8 Мбайт
9. Какой объем памяти требуется для хранения цифрового аудиофайла с записью звука высокого качества при условии, что время звучания составляет 3 минуты?
Решение:
Высокое качество звучания достигается при частоте дискретизации 44,1КГц и разрядности аудиоадаптера, равной 16.
Формула для расчета объема памяти: (время записи в секундах) x (разрядность звуковой платы в байтах) x (частота дискретизации):
180 с х 2 х 44100 Гц = 15876000 байт = 15,1 Мб
Ответ: 15,1 Мб
10. Цифровой аудиофайл содержит запись звука низкого качества (звук мрачный и приглушенный). Какова длительность звучания файла, если его объем составляет 650 Кб?
Решение:
Для мрачного и приглушенного звука характерны следующие параметры: частота дискретизации - 11, 025 КГц, разрядности аудиоадаптера - 8 бит (см. таблицу 1). Тогда T=A/D/I. Переведем объем в байты: 650 Кб = 665600 байт
Т=665600 байт/11025 Гц/1 байт ≈60.4 с
^ Ответ: длительность звучания равна 60,5 с
11. Оцените информационный объем высокачественного стереоаудиофайла длительностью звучания 1 минута, если "глубина" кодирования 16 бит, а частота дискретизации 48 кГц. (, стр. 74, пример 2.54)
Решение:
Информационный объем звукового файла длительностью в 1 секунду равен:
16 бит х 48 000 х 2 = 1 536 000 бит = 187,5 Кбайт (умножили на 2, так как стерео).
Информационный объем звукового файла длительностью 1 минута равен:
187,5 Кбайт/с х 60 с ≈ 11 Мбайт
Ответ: 11 Мб
12. Рассчитайте время звучания моноаудиофайла, если при 16-битном кодировании и частоте дискретизации 32 кГц его объем равен:
а) 700 Кбайт;
б) 6300 Кбайт
Решение:
а).
1) Информационный объем звукового файла длительностью в 1 секунду равен:
700 Кбайт: 62,5 Кбайт/с = 11,2 с
б).
1) Информационный объем звукового файла длительностью в 1 секунду равен:
16 бит х 32 000 = 512000 бит = 64000 байт = 62,5 Кбайт/с
2) Время звучания моноаудиофайла объемом 700 Кбайт равно:
6300 Кбайт: 62,5 Кбайт/с = 100,8 с = 1,68 мин
Ответ: а) 10 сек; б) 1,5 мин.
13. Вычислить, сколько байт информации занимает на компакт-диске одна секунда стереозаписи (частота 44032 Гц, 16 бит на значение). Сколько занимает одна минута? Какова максимальная емкость диска (считая максимальную длительность равной 80 минутам)?
Решение:
Формула для расчета объема памяти
A=D*T*I
:
(время записи в секундах) * (разрядность звуковой платы в байтах) * (частота дискретизации). 16 бит -2 байта.
1) 1с х 2 х 44032 Гц = 88064 байт (1 секунда стереозаписи на компакт-диске)
2) 60с х 2 х 44032 Гц = 5283840 байт (1 минута стереозаписи на компакт-диске)
3) 4800с х 2 х 44032 Гц = 422707200 байт=412800 Кбайт=403,125 Мбайт (80 минут)
Ответ: 88064 байт (1 секунда), 5283840 байт (1 минута), 403,125 Мбайт (80 минут)
^ II. Определение качества звука.
Для определения качества звука надо найти частоту дискретизации и воспользоваться таблицей №1
256 (2 8 ) уровней интенсивности сигнала - качество звучания радиотрансляции, использованием 65536 (2 16 ) уровней интенсивности сигнала - качество звучания аудио-CD. Самая качественная частота соответствует музыке, записанной на компакт-диске. Величина аналогового сигнала измеряется в этом случае 44 100 раз в секунду.
13. Определите качество звука (качество радиотрансляции, среднее качество, качество аудио-CD) если известно, что объем моноаудиофайла длительностью звучания в 10 сек. равен:
а) 940 Кбайт;
б) 157 Кбайт.
Решение:
а).
1) 940 Кбайт= 962560 байт = 7700480 бит
2) 7700480 бит: 10 сек = 770048 бит/с
3) 770048 бит/с: 16 бит = 48128 Гц –частота дискретизации – близка к самой высокой 44,1 КГц
^
Ответ: качество аудио-CD
б).
1) 157 Кбайт= 160768 байт = 1286144 бит
2) 1286144 бит: 10 сек = 128614,4 бит/с
3) 128614,4 бит/с: 16 бит = 8038,4 Гц
Ответ: качество радиотрансляции
Ответ: а) качество CD; б) качество радиотрансляции.