Сергей Курий Грандмастер

Как цифра сгубила копирайт? Часть 2. Сжатый звук

Мало того, что коварные компьютерщики позаимствовали у аудиокомпаний CD, так они еще и сделали им весьма сомнительный ответный «подарок» в виде формата mp3.

Мp3 (MPEG audio layer 3) изобрели в 1994 году ученые из немецкого института Fraunhofer. Но настоящая популярность этого формата началась после того, как 19-летний программист Джастин Франкель изобрел для mp3 специальную проигрывающую программу Winamp. Благодаря тому, что и Winamp, и кодировщики для mp3 были бесплатными, они с мгновенной скоростью распространились среди пользователей компьютеров безо всякой рекламной кампании по старому житейскому принципу «Понравилось — поделись с другом». Неподконтрольная популярность нового формата заставила сдаться даже монополистов из Microsoft, и сегодня mp3 проигрывает любой стандартный проигрыватель Windows.

Главная прелесть mp3-файлов, безусловно, связана с их малыми размерами. Так, на один компакт-диск вместо 74 мин. несжатого звучания можно записать более 11 часов mp3-фонограммы. Каким же образом происходит сжатие?
Дело обстоит так. При кодировке исходного аудиофайла (который представлен на CD-Audio в виде высококачественного и «тяжелого» формата wav) в mp3 отсекаются ненужные звуковые элементы — в основном те, которые не воспринимаются человеческим ухом. Сюда относятся и лишние сигналы близкой частоты, и те звуки, которые следуют за громким сигналом (когда чувствительность уха на мгновение ослабляется). Учитывается и то, что для нашего слуха особую ценность представляет достаточно узкий диапазон — 1−4 кГц (диапазон человеческой речи). Чем больше звуковых элементов «вырезано», тем легче получаемый файл.

Winamp - проигрыватель сжатых форматов (Скрин С. Курия) Конечно, за чрезмерную «легкость» приходится платить. Поэтому надо обращать внимание на качество mp3-файла. Оно определяется двумя показателями — битрейтом и частотой дискретизации.

Битрейт — это так называемая пропускная способность звукового потока. Он показывает, сколько объема памяти нужно для хранения 1 секунды звуковой информации. Однако битрейт характеризует только общую информационную величину потока. Частотный же диапазон звука характеризует другой показатель — частота дискретизации. Как мы уже писали выше, преобразуя аналоговый сигнал в цифровой, компьютер делает как бы замеры («выборки») частотных характеристик звука через определенные временные промежутки. Чем чаще делаются «выборки», тем более точной получится «цифровая» копия. Вот частота дискретизации и показывает, сколько делается замеров аналогового сигнала в секунду. В бытовой медиааппаратуре частота дискретизации обычно составляет 44,1 кГц (то есть 44 100 замеров в секунду), в студийной — 48 кГц.

Конечно для качества звука важны обе характеристики. Но во время создания музыкального mp3-файла над частотой дискретизации обычно мало экспериментируют (частота меньше 44, 1 кГц заметно сказывается даже на качестве речевых фонограмм). Остается варьировать битрейтом.

Для речевых фонограмм вполне приемлемым может быть и качество 56−64 кбит/с. А вот минимально приемлемым битрейтом для музыкальных файлов принято считать 128 кбит в секунду. Конечно, такой битрейт обеспечивает всего лишь сносное качество, но зато сам файл весит при этом очень мало. Например, 3 минуты звука в формате mp3 с битрейтом 128 кбит/с занимают около 2,8 Мб, в то время как на обычном аудиодиске — около 30 Мб. Максимально же возможный битрейт mp3-файла — 320 кбит/с — как доказывают тесты, для среднего слуха практически неотличим от аудиофайла на CD, при том, что и здесь он меньше оригинала в 5−6 раз. Не стоит забывать, что качество mp3 зависит не только от битрейта, но и от качества исходного файла, а также от кодировщика.

Требования к качеству звука зависят и от типа музыки — если нехитрая электронная поп-музыка неплохо слушается и в mp3, то звучание симфонического оркестра заставляет немало меломанов с тоской вспоминать виниловую пластинку. Решающее значение имеет и качество звуковоспроизводящей аппаратуры. Недостатки mp3, не заметные на обычных компьютерных колонках, становятся вполне ощутимыми на аппаратуре класса Hi-Fi.

Есть еще один интересный и эффективный метод сжатия звука — так называемый VBR (variable bit rate) — сжатие с переменным «плавающим» битрейтом. Это, когда каждый отдельный фрагмент кодируется с наиболее подходящим битрейтом. Например, один фрагмент файла с меньшими показателями — 112 кбит/с, другой — 128 кбит/с, третий — 192 кбит/с. В результате достигается удачное сочетание экономии и качества.

Mp3 — не единственный формат сжатия звука, хотя, безусловно, самый известный и распространенный. Тут можно вспомнить и ATRAC (метод сжатия, придуманный Sony для минидисков), и wma (созданный Microsoft как альтернатива mp3), и AAC, и ogg (дающие лучшее качество, чем mp3 при более низких битрейтах), и многие другие.

Емкость звуконосителей и пропускная способность Интернета растут, и если буквально пять лет назад стандартным битрейтом считался 128 кбит/с, то сейчас в Интернете господствует показатель от 192 кбит/с до 320 кбит/с.

Впрочем, уже сейчас форматы сжатия с потерями (описанные выше) вытесняются так называемыми Lossless-форматы (FLAC, APE, WV и др.), которые сегодня очень популярны у требовательных меломанов. Эти форматы, конечно, не столь «экономны», как mp3. Они ужимают исходный CD-файл лишь наполовину, но зато делают это без всяческих вырезок и потерь для звука. По сути дела, Lossless-форматы — это те же архиваторы (как и хорошо известные многим zip и rar), только для аудио. Поэтому после декомпрессии такого формата вы получите файл ПОЛНОСТЬЮ АНАЛОГИЧНЫЙ тому, что был на CD-Audio — то есть, в качественном и «тяжелом» формате wav. К тому же есть программы, играющие Lossless-форматы без предварительной декомпрессии.

Теперь вернемся к носителям. Основным носителем сжатых аудиоформатов стала flash-память. Флэш-память — это память полупроводниковая, где данные хранятся на интегральных микросхемах. Хранение данных энергонезависимо, очень скромное питание требуется только во время записи и воспроизведения. Перенос информации производится через USB-порт. Данные на таком носителе могут неизменно храниться от 20 до 100 лет.
Но главное достоинство флэш-памяти в том, что этот носитель не имеет движущихся механических частей, а следовательно менее подвержен износу, совершенно не боится толчков, пыли и электромагнитных полей. Если добавить к этому совсем уж миниатюрные размеры, то становится ясным, почему широкое применение «флэшки» получили, в первую очередь, в диктофонах, мобильных телефонах, цифровых фотоаппаратах и, конечно же, в плеерах.

Маленькая, но при этом емкая, флэш-память оказалась успешным и безжалостным конкурентом других «цифровых» носителей. В первую очередь, она начала выводить из обихода все менее удачливые ВРЕМЕННЫЕ накопители — будь то дискета или CD-RW. А с 2003 года «флэшки» в союзе с форматом mp3 начали активно вытеснять и CD-плееры, одержав на сегодняшний день убедительную победу.

Пишут, что первый mp3-плеер, поступивший в продажу, был изготовлен в 1998 г. корейской компанией SaeHan. Он имел память всего 32 Мб (т.е. мог вместить около восьми треков с битрейтом 128 кбит/с) и стоил 250 долларов.
Сейчас самым популярным mp3-плеером является iPod. Одни модели используют флэш-память и способны вместить до 16 Гб музыки. Другие имеют встроенный жесткий диск (подобный компьютерному) и их вместимость доходит до 160 Гб! Однако при этом они более чувствительны к ударам и могут легко повредится при падении.

Только относительная дороговизна и приверженность аудиорынка к оптическим дискам помешала флэш-памяти стать не только временными, но и постоянными хранителями информации.

Однако «флэшки» стремительно дешевеют, их емкость постоянно растет, и кто знает, не станут ли именно они основными «цифровыми» носителями будущего.

Обновлено 2.08.2015
Статья размещена на сайте 22.06.2011

Комментарии (4):

Чтобы оставить комментарий зарегистрируйтесь или войдите на сайт

Войти через социальные сети:

  • В общем статья хорошая, но есть пара уточнений.

    "MPEG audio player 3"

    MPEG Audio Layer-3

    "имеют встроенный жесткий диск (подобный тому, что находится в компьютерном винчестере)"

    По аналогии - "автомобиль находится в машине"
    жесткий диск = винчестер = хард = винт = НЖМД = HDD

    "на CD-Audio в виде высококачественного и «тяжелого» формата wav" + название

    У читателя может сложиться неправильное мнение, что WAV - это не цифра.

    Название

    Если честно, то не в тему. Старое название подходило лучше.

  • А разве копирайт погиб? И в России на флешки и прочие носители действует налог - 1% стоимости флешки идет в карман Никите Сергеевичу Михалкову и РАО. Доход - до 15 миллионов в год. А вы говорите "сгубила". Копирайт нас всех переживет!
    Да и болванок в продаже меньше не стало, и они востребованы. Регулярно покупаю. Да что там! В России и дискеты еще ходовой товар.
    Собственно, заголовок мне кажется не о том. Тут все про mp3.