назад оглавление вперед

 

ЗАПИСЬ

 

Записывать звук люди научились очень давно. Ещё древние египтяне придумали записывать мелодии с помощью рисунков, а древние греки – с помощью букв. В средние века появились ноты. Но вот воспроизводить записанный звук люди научились относительно недавно, а именно, когда физик Эдисон в 1877г. создал фонограф, прибор механической записи, который умел как записывать, так и воспроизводить. Звук записывался с помощью мембраны, улавливающей звуковые волны и передающие эти колебания резцу, который отпечатывал их на фольге. А воспроизводились эти отпечатки движущейся иглой. 

 

Усовершенствование фонографа породило граммофоны, патефоны и проигрыватели виниловых пластинок (приборы электро-механической записи).

Через 11 лет (1888г.) был изобретён принцип магнитной записи на стальную проволоку. Позже идею развили, придумав магнитную ленту и магнитофон. С тридцатых годов XX века повсеместно начали появляться бобинные магнитофоны, а с шестидесятых – кассетные.

Ещё через 16 лет (1904г.) была изобретена оптическая запись – принцип записи звука на киноплёнку. Звук в буквальном смысле научились фотографировать. Нанесение звука на киноплёнку параллельно с изображением стало началом звукового кино и, конечно же,  видеорекламы.

 

Кинопленка с цифровой и аналоговой записью звука

 

Механическая, электромеханическая, оптическая и магнитная запись – изначально были способами аналоговой записи – записи и воспроизведения звуковых колебаний в их естественном виде (волн).

Многие уверены, что лучшей записи звука, чем аналоговая, не существует. Тёплое аналоговое звучание магнитной ленты – эталон звучания лучших аудиозаписей за всё человечество. Все, от Элвиса Пресли и Битлз до самых современных музыкантов-электронщиков использовали и используют для создания своей музыки аналоговую запись на магнитную ленту или её эмуляцию.

Но аналоговая запись не является наиболее точным способом записи звука. Скорее самым красивым. Аналоговый звук приятен человеческому уху благодаря наличию «тёплых» гармоник, являющихся, по сути, искажениями звука. Самым точным на сегодня принципом записи звука является цифровая запись.

Отцом цифрового звука стал 25-летний Володя Котельников, создав в 1933г. знаменитую «теорему отчётов» (она же «теорема Котельникова» или «теорема Найквиста-Шеннона). Эта теорема стала началом создания принципа оцифровки звука – кодирования звукового сигнала в биты, то есть преобразования аналогового сигнала в цифровой. На создание знакомых нам компакт-дисков ушло всего лишь 49 лет. Стандарт CD, первый широко распространённый в мире цифровой носитель звука был принят только в 1982 году.

Полный перечень видов записи цифрового звука, применяющихся на сегодняшний день – это цифровая магнитная запись (формат: DAT-кассета), магнито-оптическая запись (формат miniDisc), лазерная запись (форматы CD, SACD), оптическая цифровая запись (dolby digital)

 

 

Развитие компьютеров и цифровых технологий открыло огромные возможности для обработки и записи звука.  Огромные аналоговые студии с бесчисленным количеством звукозаписывающей аппаратуры, пультов, многокилограммовых процессоров обработки звука сменяются на виртуальные студии, вмещающиеся в системный блок компьютера.

Чтобы обрабатывать звук на компьютере, его необходимо предварительно записать в цифровом виде – закодировать. Кодирование аналогового сигнала осуществляется с помощью аналого-цифрового преобразователя (АЦП).  Чтобы воспроизвести запись, нужно выполнить обратное преобразование звука из цифрового в аналоговое с помощью цифро-аналогового преобразователя (ЦАП). ЦАП и АЦП входят в состав звуковой карты компьютера и другого цифрового звукового оборудования. От качества ЦАП и АЦП во многом зависит как качество записи звука, так и воспроизведения.

 
 

ЦАПы и АЦП

 

Основные параметры цифрового звука это частота семплирования (Sample Rate) и битность (Bit Depth). От них напрямую зависит как качество оцифрованного звука, так и размер записанного файла.

 

Частота семплирования (дискретизации)

 

Аналоговая запись начинается нажатием кнопки «запись» и заканчивается нажатием кнопки «стоп». Цифровая же запись дискретна. Она состоит из множества фрагментов записи (семплов), которые следуют один за другим. Количество записанных семплов в секунду является частотой семплирования.  Она исчисляется в Герцах. Частота семплирования 44 100 Гц (стандарт для CD) говорит о том, что звуковой сигнал измерян 44 100 раз за секунду. Чем меньше частота семплирования, тем меньший частотный спектр записывается. Чем выше частота семплирования исходного материала, тем выше его качество и больше размер файла. Когда вы говорите по телефону, то слышите лишь небольшой диапазон средних частот. Это потому что частота семплирования телефонных переговоров всего 8 000 Гц. Чтобы передать диапазон частот, который слышит ухо среднестатистического человека и передаёт бытовая звуковая аппаратура – достаточно 40 000 Гц. Если разница в качестве звучания между частотой 32 и 44,1 кГц очевидна, то чем выше частота семплирования, тем разница в качестве между двумя разными частотами менее заметна или совсем не заметна на слух. Более высокая частота дискретизации более точно описывает звук, но вместе с тем описывает те частоты, которые человеческому уху уже не слышны, хотя изменения звука в неслышимом частотном диапазоне всё же могут влиять на слышимые частоты, поэтому студийная запись осуществляется при более высокой частоте дискретизации. Поскольку бытовая аппаратура в основном рассчитана на воспроизведение звука, частотой семплирования 44,1 кГц, то, когда запись готова, её перекодируют в общепринятый стандарт.

 

Запись с частотой семплирования 8 кГц

 

Если посмотреть на запись звука с невысокой частотой семплирования 8 кГц, вы заметите, что его волна имеет острые углы. Ведь чтобы сделать волну более плавной, понадобилась бы большая точность при её описании и большее количество семплов, как в следующем примере с частотой семплирования  44,1 кГц.

 

Запись с частотой семплирования 44.1 кГц

 

В телефонии частота семплирования звука – 8 кГц, в системах цифровой связи принята частота семплирования 32 кГц, в проигрывателях CD – 44,1 кГц., в телевещании – 48 кГц, в студийной записи – 96кГц и выше. При изготовлении звуковой рекламы нужно учитывать частоту семплирования принятую за стандарт там, где эта реклама будет выходить. Для радио это 44,1 кГц, для телевидения – 48 кГц, для телефонных автосекретарей – всего лишь 8 кГц.

Частота семплирования это исходный параметр, который устанавливается при записи. Если же изменить частоту семплирования уже записанного файла, качество исходного материала не улучшится при повышении частоты и ухудшится при её понижении. Это значит, что если вы вдруг понизите частоту семплирования, то качество звука ухудшится, а файл станет более лёгким. Но потом, позже, если вы снова увеличите частоту семплирования, то файл увеличится в размере, а вот качество – уже нет. Поэтому записывать и хранить записи стоит с наибольшей частотой семплирования. 

 

Битность (разрядность)

 

Вспомните видеоизображение плохого качества, в котором различимы лишь разноцветные квадраты.  Или мозаику, рисунок которой состоит из довольно крупных элементов. В таких изображениях довольно трудно увидеть мелкие или мельчайшие детали, такие, как волосок ресницы, или сеточка морщин, например. Принцип цифровой записи звука – такой же, как и у мозаики.  Битность – это разрешение семплов или количество битов памяти, которые выделяются для записи каждого семпла.  Чем выше разрешение -  тем детальнее и качественнее звучание. 

Если частота семплирования лимитирует частотный спектр, то битность лимитирует динамический диапазон сигнала. Небольшая битность записи оставит только громкие звуки (крупные детали мозайки), чем больше битность, тем более тихие звуки (нюансы, обертона – все мелкие детали мозаики) будут присутствовать на записи.

Большинство звуковых записей, от компакт дисков до mp3 файлов, и звуковых дорожек к видео имеют разрядность 16 битов памяти на один семпл. В студийной записи же чаще используются  24 или 32 бита. Поскольку бытовая аппаратура в основном НЕ рассчитана на воспроизведение 24 и 32-битного звука, то, когда запись готова, её перекодируют в «народные» 16 бит. 

Размер звукового файла зависит от частоты дискретизации и от разрядности звука. Так, при частоте дискретизации 44,1 кГц и разрядности звука 16 бит 1 минута звучания займёт 5,3 Мб, а при частоте дискретизации 11 кГц и разрядности 8 бит – всего лишь 660 кБ.

В настоящее время существует много алгоритмов сжатия, которые позволяют сократить объём звукового файла без снижения битности и частоты семплирования без потери качества (например, формат flac) или с минимальной потерей качества (например, mp3). 

 

Принципы сжатия

 

Алгоритмы сжатия без потерь качества – это, по сути, файловые архиваторы, настроенные на работу со звуковым потоком. При воспроизведении звук распаковывается из архива. Алгоритмы сжатия с потерями качества основаны, на отсечении некоторых несущественных элементов звука по принципу маскировки звука. Громкие звуки маскируют более тихие, поэтому более тихие звуки, звучащие вместе или рядом с громким, человеческое ухо не слышит, поэтому их можно убрать из записи. На слух разницу между форматами сжатия иногда затруднится определить даже аудиофил. Бытует мнение, что звук форматов, основанных на алгоритмах сжатия с потерей качества (mp3, ogg) – более плоский, тусклый, однообразный, а звук форматов, основанных на алгоритмах сжатия без потери качества (wav, flac, ape) более сочный и прозрачный. Но оба типа алгоритмов мирно сосуществуют. Одни, например – для радио, звучащего фоном через пластмассовые динамики компьютера, а другие – для прослушивания любимого музыкального альбома на качественной аппаратуре.

Алгоритмов сжатия аудиофайлов и аудиоформатов существует достаточно много, так как  для решения разных задач нужны звуковые файлы разного формата: для видео, для игр, для плееров, для компакт дисков, для музыки, для речи... Общее для всех форматов это: чем выше битрейт – тем выше качество звука и больше объём файла, чем ниже – тем качество звука ниже, а объём – меньше. 

 

Битрейт

 

Основной параметр, определяющий качество воспроизведения форматов сжатия – это битрейт (Bit rate).

Битрейт – это параметр, выражающий степень сжатия аудиопотока. Он измеряется в килобитах в секунду. Например, при битрейте 128 кБит/с тридцатисекундный аудиоролик ролик будет занимать 470 Кб. При битрейте ниже 128 кБит/с звучание будет откровенно плохим.  При битрейте 320 кБит/с не будут обрезаться высокие частоты – это битрейт, при котором потеря качества минимальна.

Переменный битрейт (vbr) – это когда значение битрейта в течении кодируемого фрагмента может меняться в зависимости от характера звучания. Усреднённый битрейт (cbr) это гибрид постоянного и переменного битрейта. Битрейт задаётся пользователем, но он немного варьируется в ходе кодирования в большую или меньшую сторону в зависимости от характера звучания.  

 

Пространственное звучание записи

 

В реальном мире мы слышим множество звуков, каждый из которых имеет свой собственный источник. Вы определяете далёкие звуки, как щебетание птиц и шум машин как некий однородный шум издалека, хотя каждая птица и машина – это отдельный источник звука. По звуку мы можем определить точное местонахождение всего того, что находится в непосредственной близости: хлопнувшая дверь сзади, поскрипывание стула под вами,  плач ребёнка слева за стеной. Для того, чтобы добиться реального звучания записанного звука, не важно цифровой это звук или аналоговый, необходимо так же дать ему пространство. И это достаточно быстро поняли производители звуковоспроизводящей аппаратуры. Ведь при одноканальном (моно) звучании пространство ограничено только понятиями близко (для более громких звуков) и далеко (для более тихих звуков). Поэтому было решено добавить один канал и получилось стерео.

С появлением стерео, мы получили более объёмную палитру звучания. Двух каналов достаточно, чтобы заставить звук исходить откуда угодно – слева, справа и даже спереди и сзади. Точнее говоря, с помощью использования приёмов стерео-панорамирования мы можем заставить слушателя поверить, что источник звука находится там, где его нет. Ведь реальных источника звука у стереосистемы всего два (по количеству пар динамиков). 

Стереозвук очень напоминает двухмерное видеоизображение. Экран плоский, но благодаря нашему воображению мы видим предметы в объёме. Совсем другое дело 3-D. Но вернёмся к звуку. Единственным способом сделать звучание более реальным, было увеличить количество реальных источников звука (то есть каналов). Так появились квадро звук, сферозвук, системы 5.1, 6.1 и так далее. Современная звуковоспроизводящая техника  сегодня способна погрузить вас в мир объёмного звука, неотличимого от реального. Но, не смотря на существование высокотехнологичной звуковой виртуальной реальности, до сих пор основное количество воспроизводящей аппаратуры и аудиозаписей в мире являются моно и стерео. И если завтра вы купите двадцатиканальную систему –  подумайте, сколько времени пройдёт, прежде чем выпустят диски с музыкой и фильмами, поддерживающий этот формат? 

И сегодня для многих  саундпродюсеров 5.1 – это целая проблема. А ведь вам, возможно, придётся размещать рекламные ролики в кинотеатрах, или на дивиди. И всё же на сегодняшний день основными форматами для звуковой рекламы являются моно (большинство телеканалов, а так же объявления в торговых центрах, общественном транспорте, на улице) и стерео (радио, интернет).

 

Моно

 

Стерео

 

5.1

 

При заказе или изготовлении аудиоролика нужно указывать формат, в котором его требуется предоставить для размещения. Формат указывается развёрнуто, следующим образом: расширение файла (wav, mp3 и т.д.) формат, (PCM, CCITT A-Law и т.д.) частота семплирования (Гц, кГц, Hz, kHz), битность или битрейт (bit, kbps),  пространственность (mono, stereo, 5.1 и т.д.)

Примеры возможных форматов:

для автоответчика: wav CCITT A-Law 8 kHz 8 bit mono

для радио: mp3 44.1 kHz 320 kbps stereo

для озвучивания видео: wav PCM 48 kHz 16 bit mono

 

Вопросы для самопроверки:

 

1. Перечислите виды аналоговой и цифровой записи звука

2. Почему точный цифровой звук многие предпочитают несовершенному аналоговому?

3. Какой параметр звука ограничивает битрейт, а какой – частота семплирования?

4. Послушайте файлы 01-02, с записью одного и того же ролика с разной частотой дискретизации: 8 кГц и 44,1 кГц. Опишите своими словами разницу в звучании этих файлов.

5. Послушайте файлы 03-04, с записью одного и того же ролика с разной разрядностью: 8 бит и 16 бит. Опишите разницу в звучании этих файлов.

6. Почему при студийной записи используется битрейт и частота семплирования выше, чем в итоге используют при тиражировании или в эфире?

7. Почему в телефонии используют низкую частоту семплирования звука?

8. В чем отличия алгоритмов сжатия с потерей качества и без потерь?

9. Послушайте файлы 05-06, с записью одного и того же ролика в формате mp3 с различным битрейтом: 128 кБит/с и 320 кБит/с. Чувствуется ли разница в качестве звучания этих файлов на ваших колонках? Какой вывод из этого можно сделать?

10. В каких случаях, по вашему мнению, или опыту, иногда приходится пользоваться низкими частотой дискретизации, разрядностью, битрейтом?

11. Почему моно и стерео записи до сих пор являются самыми распространёнными?

 

© 2007-2012 Евгений Солодовник, Solostudio

При использовании материалов этой статьи, пожалуйста, указывайте источник.

 

назад оглавление вперед