Как высчитать информационный объем звукового файла. Урок "решение задач на кодирование звуковой информации". Тема: Кодирование звука

Урок посвящен разбору задания 9 ЕГЭ по информатике

9 тема — «Кодирование информации, объем и передача информации» — характеризуется, как задания базового уровня сложности, время выполнения – примерно 5 минут, максимальный балл — 1

Кодирование текстовой информации

n — количество символов

i — количество бит на 1 символ (кодировка)

Кодирование графической информации

Рассмотрим некоторые понятия и формулы, необходимые для решения ЕГЭ по информатике данной темы.

Пиксель – это наименьший элемент растрового изображения, который имеет определенный цвет.
Разрешение – это количество пикселей на дюйм размера изображения.
Глубина цвета - это количество битов, необходимое для кодирования цвета пикселя.
Если глубина кодирования составляет i битов на пиксель, код каждого пикселя выбирается из 2 i возможных вариантов, поэтому можно использовать не более 2 i различных цветов.

Формула для нахождения количества цветов в используемой палитре:

N — количество цветов
i — глубина цвета
В цветовой модели RGB (красный (R), зеленый (G), синий (B)): R (0..255) G (0..255) B (0..255) -> получаем 2 8 вариантов на каждый из трех цветов.
R G B: 24 бита = 3 байта — режим True Color (истинный цвет)

Найдем формулу объема памяти для хранения растрового изображения :

I — объем памяти, требуемый для хранения изображения
M — ширина изображения в пикселях
N — высота изображения в пикселях
i — глубина кодирования цвета или разрешение

Или можно формулу записать так:

I = N * i битов

где N – количество пикселей (M * N) и i – глубина кодирования цвета (разрядность кодирования)

* для указания объема выделенной памяти встречаются разные обозначения (V или I ).

Следует также помнить формулы преобразования:

1 Мбайт = 2 20 байт = 2 23 бит,
1 Кбайт = 2 10 байт = 2 13 бит

Кодирование звуковой информации

Познакомимся с понятиями и формулами, необходимыми для решения заданий 9 ЕГЭ по информатике.

Пример: при ƒ=8 кГц, глубине кодирования 16 бит на отсчёт и длительности звука 128 с . потребуется:

✍ Решение:

I = 8000*16*128 = 16384000 бит
I = 8000*16*128/8 = 2 3 * 1000 * 2 4 * 2 7 / 2 3 = 2 14 / 2 3 =2 11 =
= 2048000 байт

Определение скорости передачи информации

Канал связи всегда имеет ограниченную пропускную способность (скорость передачи информации), которая зависит от свойств аппаратуры и самой линии связи(кабеля)

Объем переданной информации I вычисляется по формуле:

I — объем информации
v — пропускная способность канала связи (измеряется в битах в секунду или подобных единицах)
t — время передачи

* Вместо обозначения скорости V иногда используется q
* Вместо обозначения объема сообщения I иногда используется Q

Скорость передачи данных определяется по формуле:

и измеряется в бит/с

Решение заданий 9 ЕГЭ по информатике

Тема: Кодирование изображений

9_1: ЕГЭ по информатике 2017 задание 9 ФИПИ вариант 1 (Крылов С.С., Чуркина Т.Е.):

Какой минимальный объем памяти (в Кбайт) нужно зарезервировать, чтобы можно было сохранить любое растровое изображение размером 160 х 160 пикселей при условии, что в изображении могут использоваться 256 различных цветов?

✍ Решение:

Используем формулу нахождения объема:
Подсчитаем каждый сомножитель в формуле, стараясь привести числа к степеням двойки:
M x N:

160 * 160 = 20 * 2³ * 20 * 2³ = 400 * 2 6 = = 25 * 2 4 * 2 6

Нахождение глубины кодирования i :

256 = 2 8 т.е. 8 бит на пиксель (из формулы кол-во цветов = 2 i)

Находим объем:

I = 25 * 2 4 * 2 6 * 2 3 = 25 * 2 13 - всего бит на всё изображение

Переводим в Кбайты:

(25 * 2 13) / 2 13 = 25 Кбайт

Результат: 25

Детальный разбор задания 9 ЕГЭ по информатике предлагаем посмотреть в видео:

ЕГЭ по информатике задание 9.2 (источник: вариант 11, К. Поляков):

Рисунок размером 128 на 256 пикселей занимает в памяти 24 Кбайт (без учёта сжатия). количество цветов в палитре изображения.

✍ Решение:

где M * N — общее количество пикселей. Найдем это значение, используя для удобства степени двойки:

128 * 256 = 2 7 * 2 8 = 2 15

В вышеуказанной формуле i — это глубина цвета, от которой зависит количество цветов в палитре:

Количество цветов = 2 i

Найдем i из той же формулы:

i = I / (M*N)

Учтем, что 24 Кбайт необходимо перевести в биты . Получим:

2 3 * 3 * 2 10 * 2 3: i = (2 3 * 3 * 2 10 * 2 3) / 2 15 = = 3 * 2 16 / 2 15 = 6 бит

Теперь найдем количество цветов в палитре:

2 6 = 64 вариантов цветов в цветовой палитре

Результат: 64

Смотрите видеоразбор задания:

Тема: Кодирование изображений:

ЕГЭ по информатике задание 9.3 (источник: 9.1 вариант 24, К. Поляков):

После преобразования растрового 256-цветного графического файла в 4-цветный формат его размер уменьшился на 18 Кбайт . Каков был размер исходного файла в Кбайтах?

✍ Решение:

По формуле объема файла изображения имеем:

где N — общее количество пикселей,
а i

i можно найти, зная количество цветов в палитре:

количество цветов = 2 i

до преобразования: i = 8 (2 8 = 256) после преобразования: i = 2 (2 2 = 4)

Составим систему уравнений на основе имеющихся сведений, примем за x количество пикселей (разрешение):

I = x * 8 I - 18 = x * 2

Выразим x в первом уравнении:

x = I / 8

I (объем файла):

I - 18 = I / 4 4I - I = 72 3I = 72 I = 24

Результат: 24

Подробный разбор 9 задания ЕГЭ смотрите на видео:

Тема: Кодирование изображений:

ЕГЭ по информатике задание 9.4 (источник: 9.1 вариант 28, К. Поляков, С. Логинова):

Цветное изображение было оцифровано и сохранено в виде файла без использования сжатия данных. Размер полученного файла – 42 Мбайт 2 раза меньше и глубиной кодирования цвета увеличили в 4 раза больше по сравнению с первоначальными параметрами. Сжатие данных не производилось. Укажите размер файла в Мбайт , полученного при повторной оцифровке.

✍ Решение:

По формуле объема файла изображения имеем:

где N
а i

В такого рода задачах необходимо учесть, что уменьшение разрешения в 2 раза, подразумевает уменьшение в 2 раза пикселей отдельно по ширине и по высоте. Т.е. в целом N уменьшается в 4 раза !
Составим систему уравнений на основе имеющихся сведений, в которой первое уравнение будет соответствовать данным до преобразования файла, а второе уравнение — после:

42 = N * i I = N / 4 * 4i

Выразим i в первом уравнении:

i = 42 / N

Подставим во второе уравнение и найдем I (объем файла):

\[ I= \frac {N}{4} * 4* \frac {42}{N} \]

После сокращений получим:

I = 42

Результат: 42

Тема: Кодирование изображений:

ЕГЭ по информатике задание 9.5 (источник: 9.1 вариант 30, К. Поляков, С. Логинова):

Изображение было оцифровано и сохранено в виде растрового файла. Получившийся файл был передан в город А по каналу связи за 72 секунды . Затем то же изображение было оцифровано повторно с разрешением в 2 раза больше и глубиной кодирования цвета в 3 раза меньше, чем в первый раз. Сжатие данных не производилось. Полученный файл был передан в город Б , пропускная способность канала связи с городом Б в 3 раза выше, чем канала связи с городом А.
Б ?

✍ Решение:

По формуле скорости передачи файла имеем:

где I — объем файла, а t — время

По формуле объема файла изображения имеем:

где N — общее количество пикселей или разрешение,
а i — глубина цвета (количество бит, выделенное на 1 пиксель)

Для данной задачи, необходимо уточнить, что разрешение на самом деле имеет два сомножителя (пикселей по ширине * пикселей по высоте). Поэтому при увеличении разрешения в два раза, увеличатся оба числа, т.е. N увеличится в 4 раза вместо двух.
Изменим формулу получения объема файла для города Б :

\[ I= \frac {2*N * i}{3} \]

Для города А и Б заменим значения объема в формуле для получения скорости:

\[ V= \frac {N*i}{72} \]

\[ 3*V= \frac{\frac {4*N*i}{3}}{t} \]

\[ t*3*V= \frac {4*N*i}{3} \]

Подставим значение скорости из формулы для города А в формулу для города Б:

\[ \frac {t*3*N*i}{72}= \frac {4*N*i}{3} \]

Выразим t :

t = 4 * 72 / (3 * 3) = 32 секунды

Результат: 32

Другой способ решения смотрите в видеоуроке:

Тема: Кодирование изображений:

ЕГЭ по информатике задание 9.6 (источник: вариант 33, К. Поляков):

Камера делает фотоснимки размером 1024 х 768 пикселей. На хранение одного кадра отводится 900 Кбайт .
Найдите максимально возможное количество цветов в палитре изображения.

✍ Решение:

Количество цветов зависит от глубины кодирования цвета, которая измеряется в битах. Для хранения кадра, т.е. общего количества пикселей выделено 900 Кбайт. Переведем в биты:

900 Кбайт = 2 2 * 225 * 2 10 * 2 3 = 225 * 2 15

Посчитаем общее количество пикселей (из заданного размера):

1024 * 768 = 2 10 * 3 * 2 8

Определим объем памяти, необходимый для хранения не общего количества пикселей, а одного пикселя ([память для кадра]/[кол-во пикселей]):

\[ \frac {225 * 2^{15}}{3 * 2^{18}} = \frac {75}{8} \approx 9 \]

9 бит на 1 пиксель

9 бит — это i — глубина кодирования цвета. Количество цветов = 2 i :

2 9 = 512

Результат: 512

Смотрите подробное решение на видео:

Тема: Кодирование изображений:

9_8: Демоверсия ЕГЭ 2018 информатика:

Автоматическая фотокамера производит растровые изображения размером 640 ×480 пикселей. При этом объём файла с изображением не может превышать 320 Кбайт, упаковка данных не производится.
Какое максимальное количество цветов можно использовать в палитре?

✍ Решение:

По формуле объема файла изображения имеем:

где N i — глубина кодирования цвета (количество бит, выделенное на 1 пиксель)

Посмотрим, что из формулы нам уже дано:

I = 320 Кбайт, N = 640 * 420 = 307200 = 75 * 2 12 всего пикселей, i - ?

Количество цветов в изображении зависит от параметра i , который неизвестен. Вспомним формулу:

количество цветов = 2 i

Поскольку глубина цвета измеряется в битах, то необходимо объем перевести из Килобайт в биты:

320 Кбайт = 320 * 2 10 * 2 3 бит = 320 * 2 13 бит

Найдем i :

\[ i = \frac {I}{N} = \frac {320 * 2^{13}}{75 * 2^{12}} \approx 8,5 бит \]

Найдем количество цветов:

2 i = 2 8 = 256

Результат: 256

Подробное решение данного 9 задания из демоверсии ЕГЭ 2018 года смотрите на видео:

9_21: : ЕГЭ по информатике задание 9.21 (источник: К. Поляков, 9.1 вариант 58):

Для хранения в информационной системе документы сканируются с разрешением 300 ppi . Методы сжатия изображений не используются. Средний размер отсканированного документа составляет 5 Мбайт . В целях экономии было решено перейти на разрешение 150 ppi и цветовую систему, содержащую 16 цветов . Средний размер документа, отсканированного с изменёнными параметрами, составляет 512 Кбайт .

Определите количество цветов в палитре до оптимизации .

✍ Решение:

По формуле объема файла изображения имеем:

где N — общее количество пикселей или разрешение, а i — глубина кодирования цвета (количество бит, выделенное на 1 пиксель).

Так как по заданию имеем разрешение, выраженное в пикселях на дюйм, то фактически это означает:

I = значение ppi 2 * N * i

Формула количества цветов:

количество цветов = 2 i

Посмотрим, что из формулы нам уже дано до экономного варианта и при экономном варианте:

Неэкономный вариант: I = 5 Мбайт = 5 * 2 23 бит, N - ?, i - ? 300 ppi Экономный вариант: I = 512 Кбайт = 2 9 * 2 13 бит = 2 22 бит, N - ?, i = 4 бит (2 4 = 16) 150 ppi

Так как в экономном режиме нам известны все составляющие формулы, кроме разрешения (N), то найдем разрешение:

N = I / (i * 150*150 ppi) N = 2 22 / (4 * 22500)

Подставим все известные значения, включая найденное N, в формулу для неэкономного режима:

I = N * 300*300 ppi * i 5 * 2 23 = (2 22 * 300 * 300 * i) / (22500 * 4 );

Выразим i и вычислим его значение:

i = (5 * 2 23 * 22500 * 4) / (2 22 * 300 * 300) = 9000 / 900 = 10 бит

По формуле нахождения количества цветов в палитре имеем:

2 10 = 1024

Результат: 1024

Тема: Кодирование звука

9_7: ЕГЭ по информатике 2017 задание 9 ФИПИ вариант 15 (Крылов С.С., Чуркина Т.Е.):

На студии при четырехканальной (квадро ) звукозаписи с 32 -битным разрешением за 30 секунд был записан звуковой файл. Сжатие данных не производилось. Известно, что размер файла оказался 7500 Кбайт.

С какой частотой дискретизации (в кГц) велась запись? В качестве ответа укажите только число, единицы измерения указывать не нужно.

✍ Решение:

По формуле объема звукового файла получим:

I = β * t * ƒ * S

Из задания имеем:

I = 7500 Кбайт β = 32 бита t = 30 секунд S = 4 канала

ƒ — частота дискретизации — неизвестна, выразим ее из формулы:

\[ ƒ = \frac {I}{S*B*t} = \frac {7500 * 2^{10} * 2^2 бит}{2^7 * 30}Гц = \frac { 750 * 2^6}{1000}КГц = 2^4 = 16 \]

2 4 = 16 КГц

Результат: 16

Для более детального разбора предлагаем посмотреть видео решения данного 9 задания ЕГЭ по информатике:

Тема: Кодирование звука:

ЕГЭ по информатике задание 9_9 (источник: 9.2 вариант 36, К. Поляков):

Музыкальный фрагмент был оцифрован и записан в виде файла без использования сжатия данных. Получившийся файл был передан в город А по каналу связи. Затем тот же музыкальный фрагмент был оцифрован повторно с разрешением в 2 3 раза меньше, чем в первый раз. Сжатие данных не производилось. Полученный файл был передан в город Б за 15 секунд; пропускная способность канала связи с городом Б в 4 раза выше, чем канала связи с городом А .

Сколько секунд длилась передача файла в город A ? В ответе запишите только целое число, единицу измерения писать не нужно.

✍ Решение:

Для решения понадобится формула нахождения скорости передачи данных формулы:
Вспомним также формулу объема звукового файла:

I = β * ƒ * t * s

где:
I - объем
β - глубина кодирования
ƒ - частота дискретизации
t - время
S - кол-во каналов (если не указывается, то моно)

Выпишем отдельно, все данные, касающиеся города Б (про А практически ничего не известно):

город Б: β - в 2 раза выше ƒ - в 3 раза меньше t - 15 секунд, пропускная способность (скорость V ) - в 4 раза выше

Исходя из предыдущего пункта, для города А получаем обратные значения:

город А: β Б / 2 ƒ Б * 3 I Б / 2 V Б / 4 t Б / 2, t Б * 3, t Б * 4 - ?

Дадим объяснения полученным данным:

так как глубина кодирования (β ) для города Б выше в 2 раза, то для города А она будет ниже в 2 раза, соответственно, и t уменьшится в 2 раза:

t = t/2

так как частота дискретизации (ƒ) для города Б меньше в 3 раза, то для города А она будет выше в 3 раза; I и t изменяются пропорционально, значит, при увеличении частоты дискретизации увеличится не только объем, но и время:

t = t * 3

скорость (V ) (пропускная способность) для города Б выше в 4 раза, значит, для города А она будет ниже в 4 раза; раз скорость ниже, то время выше в 4 раза (t и V — обратно пропорциональная зависимость из формулы V = I/t ):

t = t * 4

Таким образом, с учетом всех показателей, время для города А меняется так:

\[ t_А = \frac {15}{2} * 3 * 4 \]

90 секунд

Результат: 90

Подробное решение смотрите на видео:

Тема: Кодирование звука:

ЕГЭ по информатике задание 9.10 (источник: 9.2 вариант 43, К. Поляков):

Музыкальный фрагмент был записан в формате стерео (двухканальная запись ), оцифрован и сохранён в виде файла без использования сжатия данных. Размер полученного файла – 30 Мбайт. Затем тот же музыкальный фрагмент был записан повторно в формате моно и оцифрован с разрешением в 2 раза выше и частотой дискретизации в 1,5 раза меньше, чем в первый раз. Сжатие данных не производилось.

Укажите размер файла в Мбайт , полученного при повторной записи. В ответе запишите только целое число, единицу измерения писать не нужно.

✍ Решение:

I = β * ƒ * t * S

I - объем
β - глубина кодирования
ƒ - частота дискретизации
t - время
S -количество каналов

Выпишем отдельно, все данные, касающиеся первого состояния файла, затем второго состояния — после преобразования:

1 состояние: S = 2 канала I = 30 Мбайт 2 состояние: S = 1 канал β = в 2 раза выше ƒ = в 1,5 раза ниже I = ?

Так как изначально было 2 канала связи (S ), а стал использоваться один канал связи, то файл уменьшился в 2 раза:

I = I / 2

Глубина кодирования (β ) увеличилась в 2 раза, то и объем (I ) увеличится в 2 раза (пропорциональная зависимость):

I = I * 2

Частота дискретизации (ƒ ) уменьшилась в 1,5 раза, значит, объем (I ) тоже уменьшится в 1,5 раза:

I = I / 1,5

Рассмотрим все изменения объема преобразованного файла:

I = 30 Мбайт / 2 * 2 / 1,5 = 20 Мбайт

Результат: 20

Смотрите видеоразбор данной задачи:

Тема: Кодирование звуковых файлов:

ЕГЭ по информатике задание 9_11 (источник: 9.2 вариант 72, К. Поляков):

Музыкальный фрагмент был оцифрован и записан в виде файла без использования сжатия данных. Получившийся файл был передан в город А по каналу связи за 100 секунд. Затем тот же музыкальный фрагмент был оцифрован повторно с разрешением в 3 раза выше и частотой дискретизации в 4 раз меньше , чем в первый раз. Сжатие данных не производилось. Полученный файл был передан в город Б за 15 секунд.

Во сколько раз скорость (пропускная способность канала) в город Б больше пропускной способности канала в город А ?

✍ Решение:

Вспомним формулу объема звукового файла:

I = β * ƒ * t * S

I - объем
β - глубина кодирования
ƒ - частота дискретизации
t - время

Выпишем отдельно, все данные, касающиеся файла, переданного в город А , затем преобразованного файла, переданного в город Б :

А: t = 100 c. Б: β = в 3 раза выше ƒ = в 4 раза ниже t = 15 c.

✎ 1 способ решения:

Скорость передачи данных (пропускная способность) зависит от времени передачи файла: чем больше время, тем ниже скорость. Т.е. во сколько раз увеличится время передачи, во столько раз уменьшится скорость и наоборот.

Из предыдущего пункта видим, что если мы вычислим, во сколько раз уменьшится или увеличится время передачи файла в город Б (по сравнению с городом А), то мы поймем, во сколько раз увеличится или уменьшится скорость передачи данных в город Б (обратная зависимость).

Соответственно, представим, что преобразованный файл передается в город А . Объем файла изменился в 3/4 раза (глубина кодирования (β) в 3 раза выше, частота дискретизации (ƒ) в 4 раза ниже). Объем и время изменяются пропорционально. Значит и время изменится в 3/4 раза:

t A для преобразов. = 100 секунд * 3 / 4 = 75 секунд

Т.е. преобразованный файл передавался бы в город А 75 секунд, а в город Б 15 секунд. Вычислим, во сколько раз снизилось время передачи:

75 / 15 = 5

Раз время передачи в город Б снизилось в 5 раз, соответственно, скорость увеличилась в 5 раз.

Ответ: 5

✎ 2 способ решения:

Выпишем отдельно все данные, касающиеся файла, переданного в город А : А: t А = 100 c. V А = I / 100

Поскольку увеличение или уменьшение во сколько-то раз разрешения и частоты дискретизации приводит к соответствующему увеличению или уменьшению объема файла (пропорциональная зависимость), то запишем известные данные для преобразованного файла, переданного в город Б :

Б: β = в 3 раза выше ƒ = в 4 раза ниже t = 15 c. I Б = (3 / 4) * I V Б = ((3 / 4) * I) / 15

Теперь найдем соотношение V Б к V А:

\[ \frac {V_Б}{V_А} = \frac {3/_4 * I}{15} * \frac {100}{I} = \frac {3/_4 * 100}{15} = \frac {15}{3} = 5 \]

(((3/4) * I) / 15) * (100 / I)= (3/4 * 100) / 15 = 15/3 = 5 S - количество каналов

Для простоты расчетов пока не будем брать во внимание количество каналов. Рассмотрим, какие данные у нас есть, и какие из них необходимо перевести в другие единицы измерения:

β = 32 бита ƒ = 32кГц = 32000Гц t = 2 мин = 120 с

Подставим данные в формулу; учтем, что результат необходимо получить в Мбайтах, соответственно, произведение будем делить на 2 23 (2 3 (байт) * 2 10 (Кбайт) * 2 10 (Мбайт)):

(32 * 32000 * 120) / 2 23 = =(2 5 * 2 7 * 250 * 120) / 2 23 = = (250*120) / 2 11 = = 30000 / 2 11 = = (2 4 * 1875) / 2 11 = = 1875 / 128 ~ 14,6

Полученный результат значения объема умножим на 4 с учетом количества каналов связи:

14,6 * 4 = 58,5

Ближайшее число, кратное 10 — это 60 .

Результат: 60

Смотрите подробное решение:

Тема: Кодирование звука:

9_19: Государственный выпускной экзамен ГВЭ 2018 (информатика ГВЭ ФИПИ, задание 7):

Производится двухканальная (стерео) цифровая звукозапись. Значение сигнала фиксируется 48 000 раз в секунду , для записи каждого значения используется 32 бит . Запись длится 5 минут , её результаты записываются в файл, сжатие данных не производится.

Какая из приведённых ниже величин наиболее близка к размеру полученного файла?

1) 14 Мбайт
2) 28 Мбайт
3) 55 Мбайт
4) 110 Мбайт

✍ Решение:

I = β * ƒ * t * S

Подставим в формулу имеющиеся значения:

I = 48000 * 32 * 300 * 2

Поскольку значения большие, необходимо числа 48000 и 300 выразить в степенях двойки:

48000 | 2 24000 | 2 12000 | 2 6000 | 2 = 375 * 2 7 3000 | 2 1500 | 2 750 | 2 375 | 2 - уже не делится 187,5 300 | 2 = 75 * 2 2 150 | 2 75 | 2 - уже не делится 37,5

Получим:

I = 375 * 75 * 2 15

В предложенных вариантах ответа видим, что результат везде в Мбайт. Значит, необходимо разделить полученный нами результат на 2 23 (2 3 * 2 10 * 2 10):

I = 375 * 75 * 2 15 / 2 23 = 28125 / 2 8

Найдем приближенное к числу 28125 значение в степени двойки:

2 10 = 1024 1024 * 2 2048 * 2 4096 * 2 8192 * 2 16384 * 2 32768

Получаем:

2 10 * 2 5 = 2 15 = 32768 2 10 * 2 4 = 2 14 = 16384

Число 28125 лежит между этими значениями, значит берем их:

2 15 / 2 8 = 2 7 = 128 2 14 / 2 8 = 2 6 = 64

Выбираем ответ, значение в котором находится между двумя этими числами: вариант 4 (110 Мбайт)

Результат: 4

Подробное решение ГВЭ задания 7 2018 года смотрите на видео:

Тема: Кодирование звука:

9_20: Решение 9 задания ЕГЭ по информатике (диагностический вариант экзаменационной работы 2018 года, С.С. Крылов, Д.М. Ушаков):

Производится двухканальная (стерео) звукозапись с частотой дискретизации 4 кГц и 64-битным разрешением . Запись длится 1 минуту , ее результаты записываются в файл, сжатие данных не производится.

Определите приблизительно размер получившегося файла (в Мбайтах) . В качестве ответа укажите ближайшее к размеру файла целое число, кратное 2 .

✍ Решение:

По формуле объема звукового файла имеем:

I = β * ƒ * t * S

I - объем β - глубина кодирования = 32 бита ƒ - частота дискретизации = 48000 Гц t - время = 5 мин = 300 с S - количество каналов = 2

Подставим в формулу имеющиеся значения. Для удобства будем использовать степени двойки:

ƒ = 4 кГЦ = 4 * 1000 Гц ~ 2 2 * 2 10 B = 64 бит = 2 6 / 2 23 Мбайт t = 1 мин = 60 c = 15 * 2 2 c S = 2

Подставим значения в формулу объема звукового файла:

I = 2 6 * 2 2 * 2 10 * 15 * 2 2 * 2 1 / 2 23 = 15/4 ~ 3,75

Ближайшее целое, кратное двум — это число 4

Результат: 4

Видеоразбор задания:

С меняющейся амплитудой и частотой. Чем выше амплитуда сигнала, тем он громче воспринимается человеком. Чем больше частота сигнала, тем выше его тон.

Рисунок 1. Амплитуда колебаний звуковых волн

Частота звуковой волны определяется количеством колебаний в одну секунду. Данная величина измеряется в герцах (Гц, Hz).

Ухо человека воспринимает звуки в диапазоне от $20$ Гц до $20$ кГц, данный диапазон называют звуковым . Количество бит, которое при этом отводится на один звуковой сигнал, называют глубиной кодирования звука . В современных звуковых картах обеспечивается $16-$, $32-$ или $64-$битная глубина кодирования звука. В процессе кодирования звуковой информации непрерывный сигнал заменяется дискретным , то есть преобразуется в последовательность электрических импульсов, состоящих из двоичных нулей и единиц.

Частота дискретизации звука

Одной из важных характеристик процесса кодирования звука является частота дискретизации, которая представляет собой количество измерений уровня сигнала за $1$ секунду:

одно измерение в одну секунду соответствует частоте $1$ гигагерц (ГГц);
$1000$ измерений в одну секунду соответствует частоте $1$ килогерц (кГц) .

Определение 2

Частота дискретизации звука - это количество измерений громкости звука за одну секунду.

Количество измерений может находиться в диапазоне от $8$ кГц до $48$ кГц, причем первая величина соответствует частоте радиотрансляции, а вторая - качеству звучания музыкальных носителей.

Замечание 1

Чем выше частота и глубина дискретизации звука, тем более качественно будет звучать оцифрованный звук. Самое низкое качество оцифрованного звука, которое соответствует качеству телефонной связи, получается, когда частота дискретизации равна 8000 раз в секунду, глубина дискретизации $8$ битов, что соответствует записи одной звуковой дорожки (режим «моно»). Самое высокое качество оцифрованного звука, которое соответствует качеству аудио -CD, достигается, когда частота дискретизации равна $48000$ раз в секунду, глубина дискретизации $16$ битов, что соответствует записи двух звуковых дорожек (режим «стерео»).

Информационный объем звукового файла

Следует отметить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла .

Оценим информационный объём моноаудиофайла ($V$), это можно сделать, используя формулу:

$V = N \cdot f \cdot k$,

где $N$ - общая длительность звучания, выражаемая в секундах,

$f$ - частота дискретизации (Гц),

$k$ - глубина кодирования (бит).

Пример 1

Например, если длительность звучания равна $1$ минуте и имеем среднее качество звука, при котором частота дискретизации $24$ кГц, а глубина кодирования $16$ бит, то:

$V=60 \cdot 24000 \cdot 16 \ бит=23040000 \ бит=2880000 \ байт = 2812,5 \ Кбайт=2,75 \ Мбайт.$

При кодировании стереозвука процесс дискретизации производится отдельно и независимо для левого и правого каналов, что, соответственно, увеличивает объём звукового файла в два раза по сравнению с монозвуком.

Пример 2

Например, оценим информационный объём цифрового стереозвукового файла, у котрого длительность звучания равна $1$ секунде при среднем качестве звука ($16$ битов, $24000$ измерений в секунду). Для этого глубину кодирования умножим на количество измерений в $1$ секунду и умножить на $2$ (стереозвук):

$V=16 \ бит \cdot 24000 \cdot 2 = 768000 \ бит = 96000 \ байт = 93,75 \ Кбайт.$

Основные методы кодирования звуковой информации

Существуют различные методы кодирования звуковой информации двоичным кодом, среди которых выделяют два основных направления: метод FM и метод Wave-Table .

Метод FM (Frequency Modulation ) основан на том, что теоретически любой сложный звук можно разложить на последовательность простейших гармонических сигналов разных частот, каждый из которых будет представлять собой правильную синусоиду, а это значит, что его можно описать кодом. Процесс разложения звуковых сигналов в гармонические ряды и их представление в виде дискретных цифровых сигналов происходит в специальных устройствах, которые называют «аналогово-цифровые преобразователи» (АЦП).

Рисунок 2. Преобразование звукового сигнала в дискретный сигнал

На рисунке 2а изображен звуковой сигнал на входе АЦП, а на рисунке 2б изображен уже преобразованный дискретный сигнал на выходе АЦП.

Для обратного преобразования при воспроизведении звука, который представлен в виде числового кода, используют цифро-аналоговые преобразователи (ЦАП). Процесс преобразования звука изображен на рис. 3. Данный метод кодирования не даёт хорошего качества звучания, но обеспечивает компактный код.

Рисунок 3. Преобразование дискретного сигнала в звуковой сигнал

На рисунке 3а представлен дискретный сигнал, который мы имеем на входе ЦАП, а на рисунке 3б представлен звуковой сигнал на выходе ЦАП.

Таблично-волновой метод (Wave-Table ) основан на том, что в заранее подготовленных таблицах хранятся образцы звуков окружающего мира, музыкальных инструментов и т. д. Числовые коды выражают высоту тона, продолжительность и интенсивность звука и прочие параметры, характеризующие особенности звука. Поскольку в качестве образцов используются «реальные» звуки, качество звука, полученного в результате синтеза, получается очень высоким и приближается к качеству звучания реальных музыкальных инструментов.

Примеры форматов звуковых файлов

Звуковые файлы имеют несколько форматов. Наиболее популярные из них MIDI, WAV, МРЗ.

Формат MIDI (Musical Instrument Digital Interface) изначально был предназначен для управления музыкальными инструментами. В настоящее время используется в области электронных музыкальных инструментов и компьютерных модулей синтеза.

Формат аудиофайла WAV (waveform) представляет произвольный звук в виде цифрового представления исходного звукового колебания или звуковой волны. Все стандартные звуки Windows имеют расширение WAV.

Формат МРЗ (MPEG-1 Audio Layer 3) - один из цифровых форматов хранения звуковой информации. Он обеспечивает более высокое качество кодирования.

Основные понятия

Частота дискретизации(f) определяет количество отсчетов, запоминаемых за 1 секунду;

1 Гц (один герц) – это один отсчет в секунду,

а 8 кГц – это 8000 отсчетов в секунду

Глубина кодирования (b) – это количество бит, которое необходимо для кодирования 1 уровня громкости

Время звучания (t)

Объем памяти для хранения данных 1 канала (моно)

I=f·b·t

(для хранения информации о звуке длительностью t секунд, закодированном с частотой дискретизации f Гц и глубиной кодирования b бит требуется I бит памяти)

При двухканальной записи (стерео) объем памяти, необходимый для хранения данных одного канала, умножается на 2

I=f·b·t·2

Единицы измерения I - биты, b -биты, f - Герцы, t – секунды Частота дискретизации 44,1 кГц, 22,05 кГц, 11,025 кГц

Кодирование звуковой информации

Основные теоретические положения

Временная дискретизация звука. Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть преобразован в цифровую дискретную форму с помощью временной дискретизации. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, для каждого такого участка устанавливается определенная величина интенсивности звука.

Таким образом, непрерывная зависимость громкости звука от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность "ступенек".

Частота дискретизации. Для записи аналогового звука и его преобразования в цифровую форму используется микрофон, подключенный к звуковой плате. Качество полученного цифрового звука зависит от количества измерений уровня громкости звука в единицу времени, т.е. частоты дискретизации. Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации), тем точнее "лесенка" цифрового звукового сигнала повторяет кривую аналогового сигнала.

Частота дискретизации звука - это количество измерений громкости звука за одну секунду, измеряется в герцах (Гц). Обозначим частоту дискретизации буквой f.

Частота дискретизации звука может лежать в диапазоне от 8000 до 48 000 измерений громкости звука за одну секунду. Для кодировки выбирают одну из трех частот: 44,1 КГц, 22,05 КГц, 11,025 КГц.

Глубина кодирования звука. Каждой "ступеньке" присваивается определенное значение уровня громкости звука. Уровни громкости звука можно рассматривать как набор возможных состояний N, для кодирования которых необходимо определенное количество информации b , которое называется глубиной кодирования звука

Глубина кодирования звука - это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука.

Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитать по формуле N = 2 b . Пусть глубина кодирования звука составляет 16 битов, тогда количество уровней громкости звука равно:

N = 2 b = 2 16 = 65 536.

В процессе кодирования каждому уровню громкости звука присваивается свой 16-битовый двоичный код, наименьшему уровню звука будет соответствовать код 0000000000000000, а наибольшему - 1111111111111111.

Качество оцифрованного звука. Чем больше частота и глубина дискретизации звука, тем более качественным будет звучание оцифрованного звука. Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи, получается при частоте дискретизации 8000 раз в секунду, глубине дискретизации 8 битов и записи одной звуковой дорожки (режим "моно"). Самое высокое качество оцифрованного звука, соответствующее качеству аудио-CD, достигается при частоте дискретизации 48 000 раз в секунду, глубине дискретизации 16 битов и записи двух звуковых дорожек (режим "стерео").

Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла.

Задачи для самостоятельной подготовки .

1. Рассчитайте объём монофонического аудиофайла длительностью 10 с при 16-битном кодировании и частоте дискретизации 44,1 к Гц. (861 Кбайт)

2. Производится двухканальная (стерео) звукозапись с частотой дискретизации 48 кГц и 24-битным разрешением. Запись длится 1 минуту, ее результаты записываются в файл, сжатие данных не производится. Какое из приведенных ниже чисел наиболее близко к размеру полученного файла, выраженному в мегабайтах?

1)0,3 2) 4 3) 16 4) 132

3. Производится одноканальная (моно) звукозапись с частотой дискретизации 11 кГц и глубиной кодирования 24 бита. Запись длится 7 минут, ее результаты записываются в файл, сжатие данных не производится. Какое из приведенных ниже чисел наиболее близко к размеру полученного файла, выраженному в мегабайтах?

1) 11 2) 13 3) 15 4) 22

4. Производится двухканальная (стерео) звукозапись с частотой дискретизации 11 кГц и глубиной кодирования 16 бит. Запись длится 6 минут, ее результаты записываются в файл, сжатие данных не производится. Какое из приведенных ниже чисел наиболее близко к размеру полученного файла, выраженному в мегабайтах?

1) 11 2) 12 3) 13 4) 15

Человеческое ухо воспринимает звук с частотой от 20 колебаний в секунду (низкий звук) до 20 000 колебаний в секунду (высокий звук).

Человек может воспринимать звук в огромном диапазоне интенсивностей, в котором максимальная интенсивность больше минимальной в 10 14 раз (в сто тысяч миллиардов раз). Для измерения громкости звука применяется специальная единица "децибел" (дбл) (табл. 5.1). Уменьшение или увеличение громкости звука на 10 дбл соответствует уменьшению или увеличению интенсивности звука в 10 раз.

Рис. 1.2. Временная дискретизация звука

Частота дискретизации. Для записи аналогового звука и г го преобразования в цифровую форму используется микрофон, подключенный к звуковой плате. Качество полученного цифрового звука зависит от количества измерений уровня громкости звука в единицу времени, т. е. частоты дискретизации . Чем большее количество измерений производится за I секунду (чем больше частота дискретизации), тем точнее "лесенка" цифрового звукового сигнала повторяет кривую диалогового сигнала.

Частота дискретизации звука - это количество измерений громкости звука за одну секунду.

Частота дискретизации звука может лежать в диапазоне от 8000 до 48 000 измерений громкости звука за одну секунду.

Глубина кодирования звука. Каждой "ступеньке" присваивается определенное значение уровня громкости звука. Уровни громкости звука можно рассматривать как набор возможных состояний N, для кодирования которых необходимо определенное количество информации I, которое называется глубиной кодирования звука.

Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитать по формуле N = 2 I . Пусть глубина кодирования звука составляет 16 битов, тогда количество уровней громкости звука равно:

N = 2 I = 2 16 = 65 536.

Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла. Можно оценить информационный объем цифрового стереозвукового файла длительностью звучания 1 секунда при среднем качестве звука (16 битов, 24 000 измерений в секунду). Для этого глубину кодирования необходимо умножить на количество измерений в 1 секунду й умножить на 2 (стереозвук):

16 бит × 24 000 × 2 = 768 000 бит = 96 000 байт = 93,75 Кбайт.

Звуковые редакторы. Звуковые редакторы позволяют не только записывать и воспроизводить звук, но и редактировать его. Оцифрованный звук представляется в звуковых редакторах в наглядной форме, поэтому операции копирования, перемещения и удаления частей звуковой дорожки можно легко осуществлять с помощью мыши. Кроме того, можно накладывать звуковые дорожки друг на друга (микшировать звуки) и применять различные акустические эффекты (эхо, воспроизведение в обратном направлении и др.).

Звуковые редакторы позволяют изменять качество цифрового звука и объем звукового файла путем изменения частоты дискретизации и глубины кодирования. Оцифрованный звук можно сохранять без сжатия в звуковых файлах в универсальном формате WAV или в формате со сжатием МР3 .

При сохранении звука в форматах со сжатием отбрасываются "избыточные" для человеческого восприятия звуковые частоты с малой интенсивностью, совпадающие по времени со звуковыми частотами с большой интенсивностью. Применение такого формата позволяет сжимать звуковые файлы в десятки раз, однако приводит к необратимой потере информации (файлы не могут быть восстановлены в первоначальном виде).

Контрольные вопросы

1. Как частота дискретизации и глубина кодирования влияют на качество цифрового звука?

Задания для самостоятельного выполнения

1.22. Задание с выборочным ответом. Звуковая плата производит двоичное кодирование аналогового звукового сигнала. Какое количество информации необходимо для кодирования каждого из 65 536 возможных уровней интенсивности сигнала?
1) 16 битов; 2) 256 битов; 3) 1 бит; 4) 8 битов.

1.23. Задание с развернутым ответом. Оценить информационный объем цифровых звуковых файлов длительностью 10 секунд при глубине кодирования и частоте дискретизации звукового сигнала, обеспечивающих минимальное и максимальное качество звука:
а) моно, 8 битов, 8000 измерений в секунду;
б) стерео, 16 битов, 48 000 измерений в секунду.

1.24. Задание с развернутым ответом. Определить длительность звукового файла, который уместится на дискете 3,5" (учтите, что для хранения данных на такой дискете выделяется 2847 секторов объемом 512 байтов каждый):
а) при низком качестве звука: моно, 8 битов, 8000 измерений в секунду;
б) при высоком качестве звука: стерео, 16 битов, 48 000 измерений в секунду.

Решение задач на кодирование звуковой информации

I. Размер цифрового файла

1. Определить размер (в байтах) цифрового аудиофайла, время звучания которого составляет 10 секунд при частоте дискретизации 22,05 кГц и разрешении 8 бит. Файл сжатию не подвержен. (, стр. 156, пример 1)

Решение:

Формула для расчета размера (в байтах) цифрового аудио-файла: A=D*T*I/8.

Для перевода в байты полученную величину надо разделить на 8 бит.

22,05 кГц =22,05 * 1000 Гц =22050 Гц

A=D*T*I/8 = 22050 х 10 х 8 / 8 = 220500 байт.

^ Ответ: размер файла 220500 байт.

2. Определить объем памяти для хранения цифрового аудиофайла, время звучания которого составляет две минуты при частоте дискретизации 44,1 кГц и разрешении 16 бит. (, стр. 157, №88)

Решение:

A=D*T*I/8. – объем памяти для хранения цифрового аудиофайла.

44100 (Гц) х 120 (с) х 16 (бит) /8 (бит) = 10584000 байт= 10335,9375 Кбайт= 10,094 Мбайт.

Ответ: ≈ 10 Мб

6. Две минуты записи цифрового аудиофайла занимают на диске 5,1 Мб. Частота дискретизации - 22050 Гц. Какова разрядность аудиоадаптера

Решение:

Формула для расчета разрядности: (объем памяти в байтах) : (время звучания в секундах): (частота дискретизации):

5, 1 Мбайт= 5347737,6 байт

5347737,6 байт: 120 сек: 22050 Гц= 2,02 байт =16 бит
^ Ответ: 16 бит

8. Оцените информационный объем моноаудиофайла длительностью звучания 1 мин. если "глубина" кодирования и частота дискретизации звукового сигнала равны соответственно:
а) 16 бит и 8 кГц;
б) 16 бит и 24 кГц.

Решение:

а).
16 бит х 8 000 = 128000 бит = 16000 байт = 15,625 Кбайт/с
15,625 Кбайт/с х 60 с = 937,5 Кбайт

б).
1) Информационный объем звукового файла длительностью в 1 секунду равен:
16 бит х 24 000 = 384000 бит = 48000 байт = 46,875 Кбайт/с
2) Информационный объем звукового файла длительностью 1 минута равен:
46,875 Кбайт/с х 60 с =2812,5 Кбайт = 2,8 Мбайт

^ Ответ: а) 937,5 Кбайт; б) 2,8 Мбайт

9. Какой объем памяти требуется для хранения цифрового аудиофайла с записью звука высокого качества при условии, что время звучания составляет 3 минуты?

Решение:

Высокое качество звучания достигается при частоте дискретизации 44,1КГц и разрядности аудиоадаптера, равной 16.
Формула для расчета объема памяти: (время записи в секундах) x (разрядность звуковой платы в байтах) x (частота дискретизации):
180 с х 2 х 44100 Гц = 15876000 байт = 15,1 Мб
Ответ: 15,1 Мб

10. Цифровой аудиофайл содержит запись звука низкого качества (звук мрачный и приглушенный). Какова длительность звучания файла, если его объем составляет 650 Кб?
Решение:

Для мрачного и приглушенного звука характерны следующие параметры: частота дискретизации - 11, 025 КГц, разрядности аудиоадаптера - 8 бит (см. таблицу 1). Тогда T=A/D/I. Переведем объем в байты: 650 Кб = 665600 байт

Т=665600 байт/11025 Гц/1 байт ≈60.4 с

^ Ответ: длительность звучания равна 60,5 с

11. Оцените информационный объем высокачественного стереоаудиофайла длительностью звучания 1 минута, если "глубина" кодирования 16 бит, а частота дискретизации 48 кГц. (, стр. 74, пример 2.54)

Решение:

Информационный объем звукового файла длительностью в 1 секунду равен:
16 бит х 48 000 х 2 = 1 536 000 бит = 187,5 Кбайт (умножили на 2, так как стерео).

Информационный объем звукового файла длительностью 1 минута равен:
187,5 Кбайт/с х 60 с ≈ 11 Мбайт

Ответ: 11 Мб

12. Рассчитайте время звучания моноаудиофайла, если при 16-битном кодировании и частоте дискретизации 32 кГц его объем равен:
а) 700 Кбайт;
б) 6300 Кбайт

Решение:

а).
1) Информационный объем звукового файла длительностью в 1 секунду равен:

700 Кбайт: 62,5 Кбайт/с = 11,2 с

б).
1) Информационный объем звукового файла длительностью в 1 секунду равен:
16 бит х 32 000 = 512000 бит = 64000 байт = 62,5 Кбайт/с
2) Время звучания моноаудиофайла объемом 700 Кбайт равно:
6300 Кбайт: 62,5 Кбайт/с = 100,8 с = 1,68 мин

Ответ: а) 10 сек; б) 1,5 мин.

13. Вычислить, сколько байт информации занимает на компакт-диске одна секунда стереозаписи (частота 44032 Гц, 16 бит на значение). Сколько занимает одна минута? Какова максимальная емкость диска (считая максимальную длительность равной 80 минутам)?

Решение:

Формула для расчета объема памяти A=D*T*I :
(время записи в секундах) * (разрядность звуковой платы в байтах) * (частота дискретизации). 16 бит -2 байта.
1) 1с х 2 х 44032 Гц = 88064 байт (1 секунда стереозаписи на компакт-диске)
2) 60с х 2 х 44032 Гц = 5283840 байт (1 минута стереозаписи на компакт-диске)
3) 4800с х 2 х 44032 Гц = 422707200 байт=412800 Кбайт=403,125 Мбайт (80 минут)

Ответ: 88064 байт (1 секунда), 5283840 байт (1 минута), 403,125 Мбайт (80 минут)

^ II. Определение качества звука.

Для определения качества звука надо найти частоту дискретизации и воспользоваться таблицей №1

256 (2 8 ) уровней интенсивности сигнала - качество звучания радиотрансляции, использованием 65536 (2 16 ) уровней интенсивности сигнала - качество звучания аудио-CD. Самая качественная частота соответствует музыке, записанной на компакт-диске. Величина аналогового сигнала измеряется в этом случае 44 100 раз в секунду.

13. Определите качество звука (качество радиотрансляции, среднее качество, качество аудио-CD) если известно, что объем моноаудиофайла длительностью звучания в 10 сек. равен:
а) 940 Кбайт;
б) 157 Кбайт.

Решение:
а).
1) 940 Кбайт= 962560 байт = 7700480 бит
2) 7700480 бит: 10 сек = 770048 бит/с
3) 770048 бит/с: 16 бит = 48128 Гц –частота дискретизации – близка к самой высокой 44,1 КГц
^ Ответ: качество аудио-CD
б).
1) 157 Кбайт= 160768 байт = 1286144 бит
2) 1286144 бит: 10 сек = 128614,4 бит/с
3) 128614,4 бит/с: 16 бит = 8038,4 Гц
Ответ: качество радиотрансляции
Ответ: а) качество CD; б) качество радиотрансляции.