Популярные скрипты
 

 Раздел: Учебники / Учебник по HTML

 

Глава 7

Звук

В данной главе вы ознакомитесь с основными принципами использования звука в компьютерах, необходимым программным и аппаратным обеспечением для воспроизведения звука. Узнаете, как настроить браузеры для приема и воспроизведения звука из сети Интернет.

Будут рассмотрены подключаемые программные модули к браузерам, а также отдельные приложения, позволяющие воспроизводить все типы звуковых файлов. Вы узнаете об особенностях встраивания в HTML-документ звуковых файлов и использовании подключаемых модулей.

Средства воспроизведения звука

Еще совсем недавно единственным способом извлечения звуков при помощи компьютера было использование встроенного динамика, традиционно существовавшим на всех моделях персональных компьютеров. Хотя главным предназначением этого динамика была выдача коротких по длительности, чаще всего однотонных звуков, находились программисты, создававшие утилиты для воспроизведения целых музыкальных фрагментов.

В наше время, когда термин "мультимедийный компьютер" стал привычным и уже не вызывает благоговейного трепета, большинство персональных компьютеров оснащаются звуковой картой и приводом для чтения компакт-дисков. Тем не менее, маленький динамик по-прежнему присутствует в каждом компьютере. За прошедшие годы компьютеры очень сильно изменились, в частности, отпала необходимость в некоторых устройствах и элементах конструкции. Так, например, современные компьютеры более не оснащаются кнопкой переключения режимов "Turbo", исчез замок для блокирования клавиатуры. Зато встроенный динамик все так же выполняет возложенные на него задачи.

Не будет преувеличением сказать, что функционирование компьютера начинается со звука. Многие компьютеры при загрузке издают звуковой сигнал, по характеру которого можно определить правильность прохождения тестирования. Опытные пользователи даже при выключенном мониторе на слух могут определить корректность процесса запуска компьютера. Более того, до сих пор ряд программ используют возможности встроенного динамика для информирования пользователя, например, о завершении очередной фазы какого-либо процесса. Смысл этих рассуждений сводится к тому, что звуковая информация играла и играет весьма значительную роль в работе с компьютером.

Для получения полноценного звука из компьютера нужна звуковая карта и колонки или наушники. За последние годы цена мультимедийных компонентов компьютера по отношению к общей цене значительно снизилась, что говорит о целесообразности их установки на компьютер. На сегодняшний день 8-битовые монофонические звуковые карты ушли в прошлое. Даже самые дешевые из них обеспечивают стереозвучание и работают в 16-битовом режиме. Установка звуковой карты вкупе с приводом чтения компакт-дисков превращает компьютер в музыкальный центр неплохого качества, а также обеспечивает возможность работы с мультимедийными программами. Вся информация, приводимая далее в этой главе, актуальна только для тех пользователей, компьютер которых оснащен звуковой картой.

Как компьютер работает со звуком

Существует два типа звуковых файлов, используемых в компьютерах: цифровые и музыкальные. Иногда выделяют еще один тип файлов — текстово-звуковые, в которых используется метод конвертирования текстового файла в звуки, близкие к человеческой речи, т. е. замена букв фонемами.

Музыкальные файлы похожи на нотные листы, — мелодия в них хранится последовательностью музыкальных нот, и, кроме того, в них имеется информация об используемых для воспроизведения музыкальных инструментах. При проигрывании такой музыки звуковой адаптер может не просто генерировать звуки разной высоты, но и выбирать из памяти фрагменты звучаний реальных музыкальных инструментов и синтезировать мелодию. Использование таких звуков ограничено возможностями синтезатора.

Большинство звуков, которых вы слышите из колонок компьютера, представляют собой оцифрованный звук. По своей сути оцифрованный звук довольно прост. Аналоговые по своей природе звуки, передаваемые по проводам в виде изменяющегося напряжения, преобразуются в цифровые данные, которые можно сохранять в компьютере в виде файлов. Такое преобразование выполняется при помощи аналого-цифрового преобразователя (АЦП). При воспроизведении выполняется обратное действие — преобразование из цифровой формы в аналоговую. Эта работа возлагается на звуковую карту компьютера. Пользователь может создать любое количество звуковых файлов, подключив к компьютеру микрофон или бытовой магнитофон и воспользовавшись стандартными программами записи звука.

На качество получаемого оцифрованного звука влияет несколько факторов Важнейшим фактором является частота дискретизации звука (sampling rate) или количество преобразований аналогового звука в цифровой (замеров), выполняемое за одну секунду. Чем больше частота дискретизации, тем выше качество звука и тем больше при воспроизведении он будет похож на оригинал. Обычно этот параметр лежит в диапазоне от 8 до 44,1 кГц. Увеличение частоты дискретизации приводит к пропорциональному росту размеров файла, поэтому здесь важен разумный компромисс.

Другим фактором является разрядность дискретизации (sample rate), определяющая точность замеров. Типичными значениями являются 16 бит, 8 бит и др.

Характеристикой звукового файла является также режим записи — моно или стерео. Выбор того или иного режима сразу же в два раза изменяет размер получаемого файла.

Нетрудно подсчитать, сколько места на диске будут занимать оцифрованные звуки. Так, одна секунда фонограммы качества аудио CD (44100 замеров в секунду, 16 бит на канал, два канала) дает 172 Кб данных. Заметим, что полученная величина близка к скорости передачи данных односкоростных CD-приводов, большинство которых уже умели проигрывать аудиодиски. Сегодня скорости этих устройств значительно возросли, поэтому, тем более, проблем воспроизведения музыки не должно возникать.

Выбор приведенных параметров оцифровки звука не случаен. Оказывается, что определить влияние факторов на качество звука довольно просто. Частота дискретизации определяет максимально возможную частоту воспроизведения звука. В соответствии с законом Найквиста, самая высокая частота воспроизведения равна половине частоты дискретизации. Так, при дискретизации 44,1 кГц звук можно воспроизводить с частотой 22,05 кГц. Такая частота с запасом перекрывает диапазон звуков, воспринимаемых большинством людей, и определяет практически идеальное качество. В то же время для передачи речи такой частоты, как правило, не требуется. Человеческая речь в основном укладывается в диапазон 3 кГц, поэтому в телефонных сетях оцифровка звука ведется на частоте 8 кГц.

Разрядность дискретизации определяет фактор, представляющий собой отношение сигнала к шуму. Любой метод хранения и последующего воспроизведения звука вносит некоторые случайные потери, которые проявляются в виде шумов. Для оцифрованного звука шум определяется точностью замеров. Чем точнее измерение, тем меньше потенциальная возможность внесения шума.

Еще одним фактором является наличие сжатия данных, целью которого является экономия места на диске и выигрыш во времени передачи файлов. Среди схем сжатия/хранения звуковых данных можно выделить схемы, обеспечивающие сжатие без потерь информации, а также схемы, позволяющие значительно (в 10 и более раз) уменьшить размеры файлов без заметного искажения звука. Подробное описание технологий хранения данных выходит за рамки этой книги, однако в конце главы все же будут даны некоторые практические рекомендации по работе с современными форматами звуковых данных, что вызвано необычайным ростом их популярности.

Модуль LiveAudio

Первые версии браузеров не имели встроенных средств для воспроизведения звука и, соответственно, на Web-страницах практически не встречалось звуковых файлов. Если же такие ссылки попадались, то сначала требовалось переписать файл на локальный диск, а затем воспользоваться внешней программой его воспроизведения. Технология подключаемых модулей изменила ситуацию. Теперь для браузеров имеется ряд подключаемых модулей, позволяющих воспроизводить звуковые файлы в различных форматах. Преимуществом использования подключаемых модулей по сравнению с внешними приложениями является возможность управления проигрыванием звуковых файлов прямо из окна браузера.

Браузер Netscape поставляется вместе с подключаемым модулем LiveAudio, который часто называют "официальным" аудиоплейером Netscape. Модуль LiveAudio может работать со стандартными форматами AIFF, AU, MIDI и WAV. Этот модуль снабжен понятной и удобной консолью с кнопками воспроизведения, паузы, остановки и регулятором громкости.

Модуль LiveAudio заменил вспомогательное приложение NAPlayer, сопровождавшего более ранние версии браузера Netscape Navigator. (Модуль LiveAudio начал поставляться с Netscape Navigator версии 3.0.)

Приложение NAPlayer работало с форматами Sun/NeXT (AU и SND) и Mac/SGI (AIF и AIFF). LiveAudio имеет более широкие возможности и поддерживает следующие типы звуковых форматов:

  • AIFF — формат звуковых файлов Mac/SGI


  • AU — формат звуковых файлов Sun/NeXT


  • MIDI— формат электронных музыкальных инструментов (Musical Instrument Digital Interface)


  • WAV — стандарт звуковых файлов операционной системы Windows

Формат AU когда-то был стандартным для Интернета. Формат AIFF — стандарт для платформы Macintosh, формат WAV — наиболее типичен в операционной системе Windows. Таким образом, этот подключаемый модуль может воспроизводить большинство стандартных оцифрованных звуковых файлов, а также работать с музыкальным форматом MIDI.

Управление модулем LiveAudio

Если на Web-странице, загружаемой браузером Netscape, встречается звуковой файл одного из перечисленных выше форматов, модуль LiveAudio выводит в окне браузера консоль управления. Вид консоли управления определяется параметрами, указанными в тэге включения звукового файла в страницу.

Модуль может работать как со встроенными (с помощью тега <EMBED>), так и отдельными звуковыми файлами (например, можно создать ссылку на звуковой файл). В последнем случае консоль управления выводится в пустом окне браузера, при этом сама консоль будет иметь стандартный вид.

Органы управления модулем понятны и просты в использовании. Кнопки такие же, как и у обычного аудиоплейера — останов, воспроизведение, пауза и регулятор громкости, имеется простое выпадающее меню (рис. 7.1).

Рис. 7.1. Консоль управления модуля LiveAudio

Щелчком мыши слева или справа от ручки регулятора громкости можно уменьшить или увеличить громкость воспроизведения. Линейка "светодиодов" внизу показывает текущий уровень звука. Темно-зеленые "светодиоды" индицируют диапазон 0—40%, светло-зеленые — диапазон 40—100%.

Если на консоли щелкнуть правой кнопкой мыши, будет выведено выпадающее меню. Его пункты дублируют кнопки управления, а также обеспечивают возможность сохранения звукового файла на локальном диске (Save As...) и содержат сведения об изготовителе модуля (пункт меню About).

Примечание

Пункт меню сохранения файла (Save As...) есть только в последней версии модуля LiveAudio (версия 1.1). В предыдущей версии этот пункт отсутствовал, зато отображалась информация о текущей громкости звука (например, появлялась надпись Current Volume: 60.0%).

Встраивание звуковых файлов в Web-страницу

Для использования звуковых файлов на Web-странице можно применить любой из двух вариантов: встраивать файл с помощью тега <EMBED>, либо создать ссылку на звуковой файл. В любом случае фонограмму можно будет прослушать при просмотре страницы в браузере Netscape при помощи подключаемого модуля LiveAudio. Первый вариант дает большую гибкость в компоновке страницы. Как будет описано ниже, тег <EMBED> обладает значительным количеством параметров, задавая которые можно контролировать аспекты работы модуля LiveAudio. Однако у этих возможностей есть и оборотная сторона. Если страница, рассчитанная на использование модуля LiveAudio, будет просматриваться другим браузером, который, вероятнее всего, будет иметь свои средства для воспроизведения звука, то все уникальные для модуля настройки не будут работать. Использование же ссылки на файл является стандартным способом, применяемым для любых типов файлов.

В примере 7.1 приведен HTML-документ, в котором имеются встроенные файлы, а также есть ссылка на звуковой файл.

Пример 7.1. Пример документа, использующего звуковые фрагменты

<HTML>

<HEAD>

<TITLE>Пример использования звуковых файлов</TITLE>

</HEAD>

<BODY>

Встраивание звукового файла

с <U>полным</U> набором органов управления консоли

<P>

<EMBED SRC="example1.wav" HEIGHT=60 WIDTH=144 AUTOSTART=TRUE>

<P>

Встраивание звукового файла

с <U>ограниченным</U> набором органов управления консоли

<P>

<EMBED SRC="example2.wav" HEIGHT=15 WIDTH=144 CONTROLS=SMALLCONSOLE>

<P>

<A HREF="example.mid">Это ссылка на звуковой файл</А>

</BODY>

</HTML>

В документе, приведенном в примере 7.1, используются два встроенных звуковых файла (example1.wav и example2.wav), а также есть ссылка на звуковой файл example.mid. При просмотре этого документа в браузере Netscape для каждого из встроенных файлов будет отображена консоль управления модуля LiveAudio (рис. 7.2).

Для файла example1.wav консоль управления будет иметь полный набор кнопок управления (этот режим используется по умолчанию), причем воспроизведение начнется автоматически при загрузке документа (AUTOSTART= TRUE) . Окно консоли управления будет иметь размеры 144 на 60 пикселов.

Для звукового файла example2.wav консоль управления будет иметь более компактные размеры (144 на 15 пикселов) и урезанный набор органов управления, что определено инструкцией CONTROLS=SMALLCONSOLE. Воспроизведение этого файла начнется только в случае, если пользователь нажмет соответствующую кнопку.

Примечание

Размеры консоли органов управления модуля LiveAudio имеют постоянные значения и не могут изменяться (например, при полном наборе органов управления — 144 на 60 пикселов). Значения размеров окна, отводимых под встраиваемый элемент параметрами HEIGHT и WIDTH, не должны быть меньше требуемых. Если же этими параметрами заданы размеры больше требуемых, то справа и снизу от консоли управления будет оставлено соответствующее свободное место.

Рис. 7.2. Отображение документа со встроенными звуковыми файлами в браузере Netscape

На третий звуковой файл, используемый в документе (example.mid), дана стандартная ссылка. Реализация этой ссылки откроет новое окно браузера Netscape с полной консолью управления и автоматически запустит файл на воспроизведение (рис. 7.1).

В табл. 7.1 перечислены параметры тега <EMBED> и их значения, использующиеся совместно с модулем LiveAudio. Все параметры необязательные, за исключением SRC, WIDTH и HEIGHT, применяющихся при встраивании в HTML-документ большинства объектов.

Таблица 7.1. Параметры тега <EMBED>

Параметр

Описание

SRC="filename"

Указывает имя воспроизводимого файла (форматы AU, AIFF, AIF, WAV, MIDI и MID). Обязательный параметр

WIDTH=n

Определяет ширину консоли в пикселах. Обязательный параметр

HEIGHT=m

Определяет высоту консоли в пикселах. Обязательный параметр

AUTOSTART=
TRUE | FALSE

Если имеет значение TRUE, воспроизведение начинается автоматически. По умолчанию — значение FALSE

AUTOLOAD=
TRUE | FALSE

Если имеет значение FALSE, файл не загружается автоматически. По умолчанию — значение TRUE

STARTTIME="mm:ss"

Воспроизведение начинается с указанного в минутах и секундах момента от начала файла. По умолчанию — 00:00

ENDTIME="mm:ss"

Воспроизведение оканчивается с указанного в минутах и секундах момента от начала файла. По умолчанию — это конец файла

VOLUME=percentage

Громкость воспроизведения, указанная в процентах от максимальной. По умолчанию — последнее установленное значение

ALIGN="value"

Выравнивает консоль управления по отношению к тексту страницы. Может иметь значения CENTER, BASELINE, TOP, LEFT, RIGHT. По умолчанию — BASELINE

CONTROLS=" value"

Задает набор органов управления консоли. Может иметь следующие значения (они объяснены далее в этой таблице): CONSOLE, SMALLCONSOLE, PLAYBUTTON, PAUSEBUTTON, STOPBUTTON и VOLUMELEVER. По умолчанию — CONSOLE

CONSOLE

Полный набор органов управления

SMALLCONSOLE

Компактное представление консоли. Полный набор органов управления, кроме кнопки паузы

PLAYBUTTON

Только кнопка воспроизведения

PAUSEBUTTON

Только кнопка паузы

STOPBUTTON

Только кнопка остановки. При этом файл выгружается

VOLUMELEVER

Только регулятор громкости

CONSOLE="name"

Комбинация органов управления, позволяющая включить в страницу несколько клипов. Например, можно указать CONSOLE="MySetup" в двух тэгах <EMBED> одной страницы; при этом в обоих случаях вид консоли будет одинаковым

Примечание

Если для клипа задать параметры CONTROLS="VOLUMELEVER" и CONSOLE= "_MASTERVOLUME", то изменение громкости звучания данного клипа будет отражаться на громкости всех остальных клипов, т. е. изменять громкость работы звуковой карты.

Отображение документа, рассчитанного на определенный браузер, с помощью другого браузера может нарушить весь замысел автора. Посмотрим, как пример 7.2, будет выглядеть в браузере Microsoft Internet Explorer (рис. 7.3). Здесь для проигрывания встроенных звуковых файлов используется вспомогательное приложение Microsoft ActiveMovie, работающее как компонент браузера. Естественно, что это приложение не распознает большинства специфических параметров тега <EMBED>, рассчитанных на использование модуля LiveAudio браузера Netscape. В итоге, хотя оказывается вполне возможным прослушать все имеющиеся на странице звуковые файлы, внешний вид документа оставляет желать лучшего.

Рис. 7.3. Отображение документа со встроенными звуковыми файлами в браузере Microsoft Internet Explorer

Возможна и обратная ситуация. Документ, подготовленный с учетом требований браузера Internet Explorer, может неудачно отображаться браузером Netscape.

Заметим, что приложение ActiveMovie предоставляет больше возможностей по управлению прослушиванием (рис. 7.4). Так, например, можно задать режим повторения фонограммы заранее заданное или бесконечное число раз. Есть возможность одновременного исполнения (с наложением звука) нескольких файлов встроенных на страницу, даже если они имеют одинаковый тип. Например, можно заставить играть два файла типа WAV одновременно, соорудив из браузера своего рода микшерский пульт. Этой возможности лишен модуль LiveAudio, в котором запуск одной фонограммы автоматически останавливает воспроизведение файла такого же типа. Исключением является возможность одновременного воспроизведения файла с оцифрованной музыкой и файла типа MIDI, что возможно всегда.

Рис. 7.4. Консоль управления приложения ActiveMovie с полным набором кнопок

Если вам потребуется сконфигурировать программу-сервер для работы со звуковыми файлами, то нужно сначала задать соответствующие MIME-типы. В табл. 7.2 перечислены MIME-типы и соответствующие им типы файлов, с которыми работает модуль LiveAudio.

Таблица 7.2. MIME-типы и соответствующие им файлы

MIME-тип

Расширение

audio/basic

AU

audio/x-aiff

AIF, AIFF

audio/aiff

AIF, AIFF

audio/x-wav

WAV

audio/wav

WAV

audio/x-midi

MID, MIDI

audio/midi

MID, MIDI

Другие звуковые модули

Кроме модуля LiveAudio, поставляемого с браузером Netscape, имеется довольно много других звуковых модулей, часть которых работает со своим, уникальным форматом хранения звука. Приведем краткую характеристику некоторых из них.

В ряде случаев нет необходимости сохранять оцифрованный звук с параметрами, обеспечивающими качество звучания аудио CD. Напомним, что такое качество обеспечивается при частоте дискретизации 44,1 кГц, разрядностью 16 бит, стерео. Нетрудно подсчитать, что минута звучания потребует хранения около 10 Мб данных (44100x2 байтах2х60 = 10584000 байт). Записи такого качества сохраняют все оттенки звука, в частности, дают возможность воспроизведения всех высоких частот, слышимых человеческих ухом. Однако, для многих применений, например для передачи речевых сообщений, такое качество излишне. Для звуковых данных такого рода можно понизить объем хранимой информации, уменьшив характеристики оцифровки звука. Минимально возможными параметрами для хранения звука в стандартном формате WAV являются частота оцифровки 8 кГц, разрядность данных 8 бит, моно.

Примечание

Речь идет о хранении в подформате PCM, (Pulse Code Modulation, импульсно-кодовая модуляция), использующегося в большинстве случаев применения формата WAV. Этот подформат не предусматривает возможностей сжатия данных.

При таких параметрах минута звучания уже потребует всего лишь около 0,5 Мб (8000x1x60 = 480000 байт). Выигрыш в 20 раз. Тем не менее, даже для такого звукового сообщения необходим поток 64 Кбит/с, что не дает возможности передавать данные по большинству модемов в реальном времени.

Для решения этой задачи рядом компаний были разработаны модули, которые могут сохранять и воспроизводить звуковые сообщения со значительной степенью сжатия. Для речевых сообщений важнейшим фактором является разборчивость речи, которая сохраняется даже при сильном сжатии.

К таким модулям относятся TrueSpeech, ToolVox, EchoSpeech и др.

Модуль TrueSpeech компании DSP Group хранит звуки в своем собственном формате, сжимая данные до 60 Кб на одну минуту звучания (передача таких данных требует 8 Кбит/с). Поскольку в состав операционной системы Windows входит кодер/декодер для данного формата, то конвертировать оцифрованный звук в него можно при помощи стандартного приложения Фонограф (Sound Recorder). Более подробную информацию можно получить на сайте компании DSP Group: http://www.dspg.com/.

Модуль ToolVox компании Voxware обеспечивает еще большую степень сжатия (до 53:1). После конвертирования речевого файла в формат VOX скорость потока данных сокращается до 2,4 Кбит/с. Для кодирования/декодирования данных используется кодировщик RT24, лицензию на использование которого получила компания Netscape. Появился также более новый кодер RT29, сокращающий поток данных до 2,9 Кбит/с. Компания Voxware ведет разработки программ для конвертирования текста в звуковые файлы и программ распознавания речи. Информацию о программном обеспечении, разрабатываемом компанией Voxware, можно получить на сайте: http://www.voxware.com/.

Модуль EchoSpeech выполняет сжатие речи на частоте дискретизации 11025 Гц. Степень сжатия достигает значения 18.5:1, что уменьшает поток данных до 9,6 Кбит/с. Для создания файлов формата EchoSpeech нужно воспользоваться специальной программой -кодером Speech Coder. Программное обеспечение работы с файлами этого формата имеется по адресу http://www.echospeech.com/.

Примечание

Не стоит обольщаться, узнав о возможностях сжатия звука перечисленными выше программами. Запись любого музыкального произведения, сохраненного в этих форматах, будет звучать как со старой, заезженной пластинки.

Существуют модули и для воспроизведения музыки в формате MIDI. Одним из наиболее известных среди них является модуль Crescendo компании LiveUpdate. При помощи браузера, оснащенного таким модулем, можно создавать Web-страницы с фоновыми музыкальными клипами и специальными звуковыми эффектами.

Модуль запускается автоматически и работает без контрольной панели на экране. Модуль выпускается для систем Windows 95/NT и Macintosh и может быть скопирован со страницы http://www.Iiveupdate.com/midi.html.

Усовершенствованная версия модуля, Crescendo Plus, имеет панель управления и поддерживает работу в реальном режиме времени, т. е. чтобы начать прослушивание, вам не надо ждать окончания загрузки звукового файла. Эту версию также можно найти на сайте компании LiveUpdate.

Рис. 7.5. Web-страница, содержащая MIDI-файлы знаменитых рок-групп

Формат электронных музыкальных инструментов MIDI вовсе не потерял своей популярности в связи с бурным развитием новых форматов хранения оцифрованного звука. До сих пор на Web-страницах встречается довольно много ссылок на файлы этого формата. Например, на сервере, посвященном трехсотлетию Санкт-Петербурга (1703—2003), можно услышать гимн города, хранящегося в формате MIDI. Кстати, этот сервер обещает быть очень интересным, его концепция, структура и наполнение определяются специальным наблюдательным советом, председателем которого является писатель Даниил Гранин. Содержание сервера (http://www.300.spb.ru) планируется обновлять вплоть до 2003 года.

Встречаются целые сайты, посвященные музыкальным произведениям в формате MIDI (например, http://www.midi.ru). Множество страниц в Интернете посвящено дискографии различных музыкальных групп (например, http://rem.ifmo.ru/midi/, страничка этого сайта показана на рис. 7.5).

Технология RealAudio

С развитием возможностей Интернета актуальной стала задача проведения различных аудио- и видеоконференций, передачи вещания радиостанций в реальном времени. Технология RealAudio стала первой, предоставившей возможность передачи звуковых файлов в режиме реального времени. На сегодняшний день эта технология получила в Интернете широкое распространение, модуль RealAudio, несомненно, является самым популярным в Интернете приложением для вывода звуковых файлов. С сайта компании, разработавшей этот модуль, было скопировано несколько миллионов экземпляров плейера. В начале 1999 г. промелькнуло сообщение, что число зарегистрированных пользователей этой программы достигло 50 Мбиллионов.

Разработка технологии RealAudio была выполнена компанией Progressive Networks (сейчас она называется RealNetworks). Компания в сети Интернет имеет свой сайт, популярность которого за последние годы необычайно увеличилась. Адрес сайта http://www.real.com.

Примечание

До недавнего времени сайт компании-разработчика технологии RealAudio имел адрес www.realaudio.com. Сейчас обращение по такому адресу приведет к странице www.real.com.

RealAudio состоит из трех функционально связанных программ. Программа-кодировщик (RealProducer Pro) конвертирует готовые звуковые файлы или живой звук в файлы формата RealAudio. Программа-сервер (RealServer) передает эти файлы по сети. И, наконец, программа-плейер (RealPlayer G2) проигрывает файлы по мере их поступления на компьютер пользователя. Все три компонента доступны на сайте: http://www.real.com (рис. 7.6). Сайт содержит много полезной технической информации и звуковых примеров.

Рис. 7.6. Сайт компании RealNetworks, посвященный технологии RealAudio

Для прослушивания звуковых клипов достаточно иметь только программу-плейер RealPlayer. В случае если вы также планируете создавать свои собственные звуковые файлы и размещать их на сервере, необходимо иметь программу-кодировщик и программу-сервер.

Примечание

Ранние версии программы-плейера назывались RealAudio Player. Сегодня последняя версия программы называется RealPlayer G2. Эта программа является свободно распространяемой. Существует также коммерческая версия, имеющая название RealPlayer Plus G2. Коммерческая версия обладает несколько большими возможностями по сравнению с бесплатным вариантом. Различия в возможностях описаны в справочном файле, поставляемом вместе с программой.

Исходными данными для кодирования в формат RealAudio являются готовые звуковые файлы, либо "живой" звук. Программа-кодировщик может создавать файлы, оптимизированные для модемов с различными скоростями. Типичными вариантами являются скорости 14,4 и 28,8 Кбит/с. В результате кодирования получается файл, размеры которого намного меньше размера исходного файла. Например, одноминутный файл формата WAV (частота 22 кГц, разрядность данных 16 бит, моно) занимает 2,6 Мб; кодированный файл формата RealAudio для скорости 14,4 составляет всего 60 Кб, а для скорости 28,8 — в два раза больше. Таким образом, достигается сжатие — 40:1 и 20:1 соответственно. Файл для скорости 14,4 по качеству сравним с АМ-вещанием и очень хорош для речи, а файл для скорости 28,8 звучит как монофоническая FM-передача и подходит практически для любой музыки.

Процедура сжатия выполняет отбрасывание некоторой звуковой информации. Приходится пожертвовать качеством, чтобы получить выигрыш в скорости передачи. Это проявляется при прослушивании некоторой потерей глубины звучания.

В Интернете информация может передаваться двумя способами. Одним вариантом является протокол TCP, лежащий в основе WWW, который подразумевает безошибочную передачу данных. Любая возникающая при передаче ошибка тут же исправляется повторной передачей. С другой стороны, существует протокол UDP, который подразумевает скоростную передачу с некоторыми потерями в точности. Наличие ошибок недопустимо, когда мы имеем дело с текстом или программным кодом, где важен каждый бит. Некоторые ошибки и неточности передачи звука воспринимаются нашим ухом как небольшой шум или статические разряды в процессе обычного радиоприема. При передаче звука более важна непрерывность передачи, здесь главное — не потерять целые блоки данных и поддерживать передачу в режиме реального времени. Поэтому сервер RealAudio использует протокол UDP. Возможен случайный пропуск того или другого звукового байта, зато звук передается непрерывно и в режиме реального времени.

Примечание

На самом деле в противоречии с названием технологии RealAudio передача радиопрограмм идет не совсем в реальном времени. Вещание различных серверов RealAudio обычно идет с некоторой задержкой, измеряемой минутами. С коллегой автора этих строк однажды приключилось следующее. Он зашел в комнату, где работало несколько компьютеров, на одном из которых шло вещание программы RealAudio. Связь была достаточно хорошая, что обеспечивало безупречную передачу звуковой программы. Поэтому определить на слух, идет ли настоящая радиопередача, пойманная из эфира радиоприемником, или же это программа RealAudio, не представлялось возможным. В некий момент в передаче прозвучали привычные сигналы точного времени. Как оказалось впоследствии, коллега, нисколько не сомневаясь в их правильности, автоматически взглянул на часы и, несколько удивившись их спешке, поставил точное время. В этот же день он чуть было не опоздал на поезд, так как программа RealAudio шла с почти десятиминутным запозданием.

Сервер RealAudio является двухканальной системой: протокол UDP используется для передачи данных, а протокол TCP — для согласования с системой пользователя скорости передачи и трансляции команд.

Программа-плейер RealPlayer Plus G2

Программа воспроизведения клипов формата RealAudio выпускается для систем Windows, Macintosh и UNIX. Программа для Windows называется RealPlayer G2 и является свободно распространяемой. Коммерческая версия имеет название RealPlayer Plus G2. Установка любого варианта программы на компьютер не составляет труда. Программа поставляется в виде самораспаковывающегося файла, запустив который и, следуя дальнейшим указаниям, можно осуществить установку. В состав устанавливаемого пакета входит как самостоятельная программа-плейер, так и подключаемые модули для браузеров. После завершения установки браузеры Netscape и Internet Explorer получат возможность воспроизводить клипы формата RealAudio.

Как самостоятельная программа RealPlayer Plus G2 (рис. 7.7) является полнофункциональным приложением, позволяющим воспроизводить звуковые файлы от любого источника, включая локальный диск или удаленный сервер. Эта программа является одним из представителей растущего числа приложений, способных напрямую, без участия браузера, общаться с Интернетом. Программа-плейер RealPlayer Plus G2 как отдельная программа может служить вспомогательным приложением браузера или самостоятельно воспроизводить звуковые файлы.

Если в Web-страницу включается ссылка на файл формата RealAudio, то при щелчке мышью на ней браузер запустит программу-плейер как вспомогательное приложение. Это приложение работает как отдельная задача и после окончания прослушивания требует ручного закрытия.

Если же файл встроен непосредственно в страницу с помощью тега <EMBED>, браузер автоматически отобразит на экране консоль управления подключаемого модуля.

Органы управления плейера очень просты. Панель управления содержит типичный набор кнопок: Воспроизведение, Пауза, Останов, Запись (доступна только для коммерческой версии) и индикатор текущего момента проигрывания с бегунком. Имеется также кнопка включения эквалайзера (только для коммерческой версии) и кнопка переключения внешнего вида плейера (полный/компактный). Может выводиться информация о проигрываемом клипе, время воспроизведения и длительность клипа. Имеется движковый регулятор громкости. Конкретный внешний вид плейера в значительной степени зависит от установок, выбранных пользователем в пункте меню View. Заметим, что внешний вид, а также набор пунктов меню сильно изменились по сравнению с более ранними версиями программы, поэтому их детальное описание представляется излишним.

Рис. 7.7. Программа-плейер RealPlayer Plus G2

Если звуковой файл встраивается в страницу, то набор органов управления определяется автором страницы и зависит от значений параметров соответствующего тега <EMBED>. Правила записи параметров рассматриваются ниже.

Встраивание в страницу звуковых файлов формата RealAudio

Звуковые файлы, используемые технологией RealAudio, должны иметь расширение RA. Кроме того, принято использовать метафайлы с расширением RAM, которые представляют собой обычные текстовые файлы, каждая строчка которых содержит полный URL-адрес файла RA. Например:

pnm://audio.real.com/example.ra

Такому файлу логично присвоить имя example.ram. Строчка pnm:// означает, что данные находятся на сервере RealAudio. Если на Web-страницах необходимо расположить ссылку на файл формата RealAudio, то обычно ссылаются на метафайл RAM, а не на сам файл RA, хотя это и не запрещено. Для чего так сделано? Метафайлы могут содержать целый список адресов файлов RA, которые будут воспроизводиться последовательно. Кроме того, в метафайлах могут располагаться сведения о моменте времени начала воспроизведения файлов, если требуется проигрывать их с определенного места.

Для этого следует указать точку начала воспроизведения после адреса файла, отделив символом $:

pnm://audio.real.com/example.ra$1:20

Полностью формат указания момента начала воспроизведения записывается следующим образом:

$dd:hh:mm:ss. t

где dd — дни, hh — часы, mm — минуты, ss — секунды и t — десятые доли секунды.

Если вы хотите, чтобы при просмотре страницы использовался плейер как вспомогательное приложение, то достаточно лишь применить стандартную ссылку, например:

<А HREF=example.ram>Ссылка на метафайл</А>

Другим вариантом является встраивание с помощью тега <EMBED>, например:

<EMBED SRC=example.rpm WIDTH=500 HEIGHT=100>

Обратите внимание, что при встраивании файлов для активизации подключаемого модуля, а не самостоятельного приложения, необходимо ссылаться на метафайл с расширением RPM, а не RAM. Никаких иных отличий, кроме расширения, правила записи метафайлов не имеют.

Параметры WIDTH и HEIGHT указывают размеры окна для органов управления подключаемого модуля. Как и параметр SRC, они являются обязательными.

Примечание

Выбор значений размеров окна полностью определяется автором страницы. Подключаемый модуль построен таким образом, что его органы управления автоматически масштабируются по указанным размерам и, таким образом, всегда полностью занимают отводимое окно. В этом отличие, например, от модуля LiveAudio, описанного выше.

Вот как выглядит обобщенный синтаксис тега <EMBED>, если он используется для встраивания файлов RealAudio:

<EMBED SRC=source_URL WIDTH=width_value HEIGHT=height_value

[CONTROLS=option] [AUTOSTART=True] [CONSOLE=value] [NOLABELS=True]>

Параметры CONTROLS, AUTOSTART, NOLABELS и CONSOLE являются специфическими для RealAudio и могут отсутствовать.

Параметр CONTROLS определяет набор органов управления модуля плейера RealAudio. В табл. 7.3 описаны возможные значения этого параметра.

Таблица 7.3. Значения параметра CONTROLS

Значение

Описание

CONTROLS=All

Окно плейера содержит все органы управления, включая Control Panel, InfoVolumePanel и StatusBar. (Это значение используется по умолчанию)

CONTROLS=Control Panel

Окно плейера содержит кнопки воспроизведения, паузы, остановки, индикатор текущего положения и изображение регулятора громкости. (Аналог окна самостоятельного плейера, если не отмечена ни одна из опций меню View)

CONTROLS=InfoVolumePanel

Окно плейера содержит строки для вывода информации о файле и движковый регулятор громкости. (Аналог окна самостоятельного плейера, если отмечена опция Clip Info меню View)

CONTROLS=InfoPanel

Окно плейера содержит строки для вывода информации о файле

CONTROLS=StatusBar

Окно плейера содержит строку состояния, указатели времени воспроизведения и длительности клипа. (Аналог окна самостоятельного плейера, если отмечена опция Status Bar меню View)

CONTROLS=PlayButton

Окно плейера содержит только кнопки воспроизведения и паузы

CONTROLS=StopButton

Окно плейера содержит только кнопку остановки

CONTROLS=VolumeSlider Окно плейера содержит только движковый регулятор громкости

CONTROLS=PositionSlider

Окно плейера содержит только индикатор текущего положения

CONTROLS=PositionField

Встраивает в строку состояния время воспроизведения и длительность клипа

CONTROLS=StatusField

Встраивает в строку состояния текстовые сообщения

Если параметру AUTOSTART присвоено значение TRUE, проигрывание файла начинается автоматически. Несколько файлов не могут звучать одновременно. Поэтому, если более одного тега <EMBED> имеют AUTOSTART=TRUE, только последний из них будет запущен автоматически. Порядок загрузки файлов зависит от программы-сервера и кэш-памяти браузера Netscape.

Параметр CONSOLE позволяет создать несколько окон с различным набором органов управления, осуществляющими управление одним и тем же клипом. Изначально каждое окно связано со своим клипом; если же применить параметр CONSOLE, то предоставится возможность управлять одним клипом из различных окон. Например, запустить клип из одного окна, а остановить, пользуясь кнопками другого окна. Появляется возможность создания произвольного набора кнопок для отдельного клипа, расположенных также произвольным образом. Для реализации этого свойства следует указать одно и то же имя клипа в каждом из тегов <EMBED>, а также присвоить одинаковые значения параметру CONSOLE:

<EMBED SRC="sample.rpra" WIDTH=30 HEIGHT=33 CONTROLS="PlayButton" CONSOLE="Clip1">

<EMBED SRC="sample.rpm" WIDTH=300 HEIGHT=33 CONTROLS="PositionSlider" CONSOLE="Clip1">

Еще один пример на эту тему:

Пример 7.2. Пример документа со встроенными файлами RealAudio

<HTML>

<HEAD>

<TITLE>Пример встраивания файлов формата RealAudio</TITLE>

</HEAD>

<BODY>

Различные варианты встраивания клипов формата RealAudio

<H3>Кнопки воспроизведения/паузы, кнопка остановки<BR> и индикатор текущего положения</H3>

<EMBED SRC=sample1.rpm WIDTH=50 HEIGHT=30 CONTROLS=PlayButton CONSOLE=clip1>

<EMBED SRC=sample1.rpm WIDTH=50 HEIGHT=30 CONTROLS=StopButton CONSOLE=clip1>

<EMBED SRC=sample1.rpm WIDTH=350 HEIGHT=30 CONTROLS=PositionSlider CONSOLE=clip1>

<H3>Только панель управления</H3>

<EMBED SRC=sample2.rpm WIDTH=300 HEIGHT=35 CONTROLS=ControlPanel>

<H3>Полный набор органов управления</H3>

<EMBED SRC=sample3.rpm WIDTH=500 HEIGHT=100 CONTROLS=All>

<P>

<A HREF=sample3.ram>Ссылка, при выборе которой будет запущена самостоятельная программа-плейер</А>

</BODY>

</HTML>

В примере 7.2 в HTML-документ встроено три клипа RealAudio и имеется ссылка на еще один файл. Отображение этого документа в браузере приведено на рис. 7.8. Первый из файлов sample1.rpm встраивается трижды с различным набором органов управления. Поскольку во всех этих тэгах <EMBED> есть строчка CONSOLE=clip1, то кнопки управления будут относиться к одному и тому же клипу. Например, запустив клип кнопкой воспроизведения, можно его остановить, нажав кнопку в другом окне (расположенном от него справа). По существу, все три окна, с точки зрения их функционирования, будут являться единой консолью управления для этого клипа. Естественно, что эти окна могли быть разбросаны по странице в произвольном порядке. При встраивании клипов RealAudio вид консоли управления определяется автором страницы.

Рис. 7.8. Различные варианты встраивания клипов RealAudio

Следующие два клипа иллюстрируют возможности встраивания консоли управления с различным набором кнопок.

Файл sample1.rpm имеет следующее содержание:

file://smack.ra

Остальные метафайлы имеют аналогичное содержание. Здесь для примера показано, что данные для плейера могут поступать не только от соответствующего сервера в реальном времени, а и представлять собой обычные файлы формата RA, расположенные локально.

Продолжим рассмотрение значений параметров тега <EMBED>. Если параметру CONSOLE одного из тегов <EMBED> присвоить значение "master", то при запуске любого другого клипа на странице им можно управлять при помощи кнопок этого "главного" окна. Это удобно использовать, если вы, например, хотите, чтобы в странице было размещено несколько клипов с ограниченным набором органов управления, но при запуске любого из них иметь полный набор кнопок. Пример использования данного свойства приведен ниже.

Пример 7.3. Пример документа с мастер-консолью

<HTML>

<HEAD>

<TITLE>The Prodigy</TITLE>

</HEAD>

<BODY>

<H3>Встраивание нескольких клипов, управляемых одной консолью</H3>

<TABLE BORDER=1 CELLSPACING=0 CELLPADDING=3 ALIGN=left>

<TR><TH COLSPAN=3>Альбом "The fat of the land"</TH></TR>

<TR><TD><EMBED SRC=sample1.rpm WIDTH=50 HEIGHT=30 CONTROLS=PlayButton></TD>

<TD>Smack my bitch up</TD><TD>5:42</TD></TR>

<TR><TD><EMBED SRC=sample2.rpm WIDTH=50 HEIGHT=30 CONTROLS=PlayButton></TD>

<TD>Breathe</TD><TD>5:34</TD></TR>

<TR><TD><EMBED SRC=sample3.rpm WIDTH=50 HEIGHT=30 CONTROLS=PlayButton></TD>

<TD>Diesel power</TD><TD>4:17</TD></TR>

<TR><TD><EMBED SRC=sample4.rpm WIDTH=50 HEIGHT=30 CONTROLS=PlayButton></TD>

<TD>Funky shit</TD><TD>5:15</TD></TR>

<TR><TD><EMBED SRC=sample5.rpm WIDTH=50 HEIGHT=30 CONTROLS=PlayButton></TD>

<TD>Serial thrilla</TD><TD>5:10</TD></TR>

<TR><TD><EMBED SRC=sample6.rpm WIDTH=50 HEIGHT=30 CONTROLS=PlayButton></TD>

<TD>Mindf iels</TD><TD>5:39</TD></TR>

<TR><TD><EMBED SRC=sample7.rpm WIDTH=50 HEIGHT=30 CONTROLS=PlayButton></TD>

<TD>Narayan</TD><TD>9:04</TD></TR>

<TR><TD><EMBED SRC=sample8.rpm WIDTH=50 HEIGHT=30 CONTROLS=PlayButton></TD> <TD>Firestarter</TD><TD>4:40</TD></TR>

<TR><TD><EMBED SRC=sample9.rpm WIDTH=50 HEIGHT=30 CONTROLS=PlayButton></TD>

<TD>Climbatize</TD><TD>6:36</TD></TR>

<TR><TD><EMBED SRC=sample10.rpm WIDTH=50 HEIGHT=30 CONTROLS=PlayButton></TD>

<TD>Fuel my fire</TD><TD>4 :18</TD></TR>

</TABLE>

<EMBED SRC=empty.rpm WIDTH=300 HEIGHT=100 CONTROLS=All CONSOLE="_master">

<CENTER><IMG SRC=newlogo.gif></CENTER>

</BODY>

</HTML>

В приведенном примере встроено десять клипов, объединенных для удобства в таблицу. Каждый из встроенных клипов имеет минимальный набор кнопок управления: воспроизведения и паузы, что определяется параметром controls=PlayButton. Справа от таблицы (рис. 7.9) располагается еще одна консоль управления с полным набором кнопок, для которой указано значение console="_master". Заметим, что для этого окна также имеется отдельный встроенный файл (empty.rpm), содержимое которого никогда не используется. Единственное, что необходимо, это обеспечить существование непустого файла с таким именем.

Рис. 7.9. Несколько встроенных клипов, управляемых из одного окна

Запуск на воспроизведение любого из десяти встроенных клипов приводит к активизации мастер-консоли. В этом окне будут отображаться все параметры запущенного клипа, а также будут работать все кнопки управления.

Последним параметром тега <EMBED> является NOLABELS. Если ему присвоено значение TRUE, то вывод информации о клипе (название, автор и копирайт) будет запрещен.

Для тех пользователей, браузеры которых не поддерживают тег <EMBED>, включите после этого тега контейнер <NOEMBED> с альтернативным содержанием:

<NOEMBED>Что-то для браузеров, не поддерживающих подключаемые модули</NOEMBED>

К примеру, можно такой строке дать ссылку для запуска самостоятельной программы-плейера:

<EMBED SRC="sample.rpm" WIDTH=300 HEIGHT=100>

<NOEMBED><A SRC="sample.ram">Сейчас запустится программа RealPlayer</A>

</NOEMBED>

Примечание

Несмотря на то, что все примеры встраивания файлов формата RealAudio приведены для браузера Netscape, они будут точно также работать и в браузере Internet Explorer. Это заслуга компании-разработчика плейера.

Если вам потребуется сконфигурировать программу-сервер для работы со звуковыми файлами формата RealAudio, то нужно задать соответствующие MIME-типы. В табл. 7.4 перечислены MIME-типы и соответствующие им расширения файлов.

Таблица 7.4. MIME-типы для RealAudio

MIME-тип

Расширение

audio/x-pn-realaudio

RA, RAM

audio/x-pn-realaudio/plugin RPM

Ресурсы RealAudio в Интернете

Основным сайтом для получения разнообразной информации, связанной с технологией RealAudio, является официальный сайт разработчика этой технологии http://www.real.com.

Информацию о передачах в формате RealAudio можно получить по адресу http://www.timecast.com. В недавнем прошлом это был отдельный сервер,

однако, сейчас обращение по указанному адресу перебрасывается на страничку http://www.real.com/realguide/index.html.

Появилось достаточное количество серверов RealAudio на русском языке. Их число постоянно растет, найти их адреса можно, воспользовавшись любой поисковой системой, например, по ключевому слову RealAudio. Укажем лишь некоторые из наиболее интересных адресов.

Большой список серверов RealAudio, работающих на русском языке, можно найти по адресу http://www.guzei.com/radio/.

Весьма обширная коллекция файлов в формате RealAudio располагается по адресу http://www.rus.org/mtrros/real/ (рис. 7.10).

Рис. 7.10. Постоянно растущая коллекция песен на русском языке в формате RealAudio

Не обошел вниманием возможности использования технологии RealAudio и известный российский Web-мастер Артемий Лебедев. В своем музыкальном разделе он расположил гимны всех республик бывшего СССР в этом формате для четырех разных скоростей соединений (рис. 7.11).

Рис. 7.11. Музыкальный раздел с гимнами всех республик бывшего СССР

Рис. 7.12. Страница радиостанции "Европа Плюс"

Естественно, что возможности Интернета стали осваивать и ведущие российские радиостанции. Радиостанция "Маяк" является одной из старейших и наиболее известных в России. Пожалуй, нет в нашей стране ни одного человека, который бы ни разу не слышал ее позывных. Станция начала вещание 1 августа 1964 г. и с успехом продолжает его и сегодня. Начато вещание и в сети Интернет в формате RealAudio (http://www.radiomayak.ru/real/live.ram).

Одной из наиболее популярных радиостанций, появившихся в последние годы, является станция "Европа Плюс". Она уже отметила свое 8-летие (основана в 1991 г.) и на сегодняшний день занимает второе место среди коммерческих радиостанций России. На рис. 7.12 показана страничка Санкт-Петербургского отделения радиостанции (http://www.europaplus.spb.ru). Как видно из рисунка, в планах компании осуществление вещания в формате RealAudio.

Звуковые файлы формата MP3

Как уже отмечалось в начале главы, хранение звуковых данных в оцифрованной форме с высоким качеством требует довольно больших затрат дисковой памяти. Попытки сократить объем файлов, используя стандартные архиваторы, обычно не приводят к значительному выигрышу из-за специфичности звуковых данных. Тем не менее, добиться довольно значительного уровня сжатия видео- и аудиоинформации удается при использовании специфических методов, основанных на анализе структуры данных и последующем сжатии с некоторыми потерями.

Реальная возможность обработки изображений и звука, сравнимых по качеству с существовавшими аналоговыми примерами, появилась только в конце 80-х годов.

В 1988 году Международной организацией стандартов ISO (International Standards Organization) был сформирован комитет MPEG (Moving Pictures Expert Group, группа экспертов в области движущихся изображений), основной задачей которого являлась разработка стандартов кодирования подвижных изображений, звука и их комбинации. За десять лет своего существования комитет выработал ряд стандартов по данному вопросу. В результате, обобщив обширные исследования в этой области, был рекомендован определенный набор методов сжатия аудио- и видеоданных. Был определен ряд специфических форматов для хранения данных, отличающихся по качеству результатов и скорости передачи данных.

В настоящее время существует три стандарта хранения видеоданных: MPEG-1, MPEG-2 и MPEG-4. В рамках форматов MPEG-1 и MPEG-2 существуют также форматы хранения звуковой информации, которые носят название Layer-1, Layer-2 и Layer-З. Эти три звуковых формата определены для MPEG-1 и незначительными расширениями используются в MPEG-2. Все три формата похожи друг на друга, но используют различные уровни компромисса между сжатием и сложностью. Уровень Layer-1 — наиболее простой, не требует значительных затрат на сжатие, но и дает небольшую степень сжатия. Уровень Layer-3 — наиболее трудоемкий и предлагает самое лучшее сжатие. В последнее время огромную популярность завоевал формат Layer-З, который часто называют просто MP3. Такое название связано с типичным расширением MP3 для звуковых файлов, хранящихся в этом формате. Это сокращение укоренилось, стало общепринятым, в частности, дало название ряду сайтов, посвященных этой технологии (www.mp3.com, mp3.box.sk, mp3soft.da.ru и др.).

Основная идея, на которой основаны все методики сжатия аудиосигнала с потерями, — пренебрежение тонкими деталями звучания оригинала, лежащими вне пределов возможностей человеческого слуха. Здесь можно выделить несколько моментов.

Уровень шума. Звуковое сжатие базируется на простом факте. Если человек находится рядом с громко воющей сиреной, то вряд ли он услышит разговор стоящих неподалеку людей. Причем это происходит не оттого, что человек обращает больше внимание на громкий звук, а в большей степени оттого, что человеческое ухо фактически теряет звуки, лежащие в том же диапазоне часто, что и значительно более громкий звук. Этот эффект носит название маскирующего, он изменяется с различием в громкости и частоте звука.

Одним из основных способов сжатия звука является уменьшение числа бит, используемых для хранения данных при дискретизации звука. Уменьшение числа бит эквивалентно добавления шума к звуку. Сжатие MPEG использует маскирующий эффект, имея в виду, что человек все равно не услышит появляющийся в результате уменьшения числа бит шум.

Вторым моментом является деление полосы звуковых частот на подполосы. Каждая из выбранных подполос далее обрабатывается отдельно. Программа кодирования выделяет самые громкие звуки в каждой подпол осе и использует эту информацию для определения приемлемого уровня шума для этой подполосы. Лучшие программы кодирования учитывают также влияние соседних полос. Очень громкий звук в одной подпол осе может повлиять на маскирующий эффект и на близлежащие полосы.

Еще одним моментом кодирования является использование психоакустической модели, опирающейся на особенности человеческого восприятия звука. Сжатие с использованием этой модели основано на удалении заведомо не слышимых частот с более тщательным сохранением звуков, хорошо различаемых человеческим ухом. К сожалению, здесь не может быть точных математических формул. Восприятие звука человеком — сложный, до конца не исследованный процесс, поэтому выбор методов сжатия выполняется на основе анализа прослушивания и сравнения по-разному сжатых звуков группами экспертов. Зато здесь имеются практически неограниченные возможности в сфере улучшения психоакустических моделей.

Большинство существующих алгоритмов для кодировки человеческого голоса основано на высокой степени предсказуемости такого сигнала — универсальные алгоритмы сжатия MPEG с переменным успехом пытаются применить этот прием. Еще одним приемом сжатия является использование так называемого совмещенного стерео. Известно, что слуховой аппарат человека может определить направление лишь средних частот — высокие и низкие звучат как бы отдельно от источника. Значит, эти фоновые частоты можно кодировать в моно сигнал.

Кроме всего этого для сжатия используется различие в сложности потоков в каналах. Например, если в правом канале какое-то время полная тишина, это "зарезервированное" место используется для повышения качества левого канала или туда впихиваются необходимые биты, не влезшие в поток чуть раньше.

На последней стадии сжатия используется алгоритм сжатия Хаффмана, используемый во многих стандартных программах сжатия. Этот процесс позволяет улучшить степень сжатия для относительно однородных сигналов, которые плохо сжимаются с помощью описанных выше приемов.

На основе описанных идей строятся алгоритмы сжатия, позволяющие достичь степени компрессии 10:1 и выше практически без потери в качестве звучания. При кодировании задают требуемый уровень компрессии, а алгоритмы сжатия добиваются требуемого уровня сжатия за счет качества. Для данного применения требуемый уровень сжатия обычно указывают в виде величины потока данных (bit rate), измеряемого в Кбит/с.

Примечание

Термин "bit rate" обозначает количество битов передаваемой информации в секунду. На русский язык этот термин переводится по-разному в различных источниках. В последнее время часто вместо формального перевода употребляют новое для русского языка слово "битрейт". Вариантами перевода также являются следующие: "ширина потока данных", "сложность потока битов", "скорость потока", "битовая частота". Иногда для звуковых файлов этот же параметр называют степенью сжатия файла. Например, говорят, что файл сжат до 128 Кбит/с. Дело в том, что величина битрейта напрямую связана с размером звукового файла в расчете на одну секунду звучания (уменьшение размера файла в определенное количество раз обеспечивает снижение битрейта в такое же количество раз).

Воспроизведение файлов формата MP3

Для проигрывания файлов MP3 существует довольно большое количество программ-плейеров, число которых измеряется десятками. Большой список таких программ можно найти на сайте http://www.dailymp3.com. Однако среди перечисленных программ есть всего несколько, пользующихся огромной популярностью и занимающих практически весь рынок программ. Безусловным лидером является программа Winamp, обсуждение которой будет дано ниже. Дальнейшему росту популярности программы Winamp будет способствовать ее включение в дистрибутив пакета Netscape Communicator версии 4.7.

Программы воспроизведения отличаются друг от друга как интерфейсом, так и такими важными параметрами, как качество проигрывания и скорость декодирования. По скорости декодирования самым быстрым плейером был и остается на сегодняшний день K-Jofol, краткие характеристики которого также будут приведены ниже.

Вопрос качества воспроизведения не так прост, как может показаться. Несмотря на то, что стандарт MP3 однозначно определяет, какие именно данные содержатся в MP3-файле, это не значит, что их декодирование обязательно должно быть однозначным. Причин неоднозначности несколько. Во-первых, независимо от сути алгоритма декодирования, оно может проводиться с разной точностью. По данному признаку декодеры разделяют на 32-битовые и 64-битовые. Существует также 110-битовый декодер NAD.

Во-вторых, как и в случае с цифровыми данными, записанными на CD, содержащаяся в файлах информация является лишь приближением к исходному сигналу. И как для более адекватного воспроизведения аудио CD с компенсацией дефектов, вызванных записью на CD, в высококлассной аппаратуре применяются различные методы обработки звука, так и в случае файлов MP3 в принципе можно значительно улучшить звучание, если знать, какие из вносимых сжатием в MP3 искажений более заметны и какие поддаются коррекции.

По качеству звука лидером считается программа NAD, возрождающаяся ныне под названием NADDY (http://ae.dmusic.com).

Установка программы Winamp

Программа-плейер Winamp (Windows Audio Mpeg Player) предназначена для воспроизведения звуковых файлов в различных форматах (MP3, WAV, MIDI и др.) и может устанавливаться в среде Windows 95/98/NT. Для качественного воспроизведения файлов MP3 минимальным требованием является компьютер на базе процессора 486 последних моделей. Рекомендуется использовать Pentium и выше. Программа разработана компанией Nullsoft (http://www.nullsoft.com), для получения сведений о новейших разработках можно обратиться к официальному сайту http://www.winamp.com. Совсем недавно появился сайт http://www.winamp.ru, на котором будет дублироваться информация официального сайта на русском языке.

Инсталляция программы на компьютер в среде Windows очень проста. Инсталляционный файл программы представляет собой исполняемый файл (ЕХЕ-файл) размером порядка 500 Кб (для популярной в свое время версии 2.05).

Примечание

Последующие версии имеют незначительно отличающийся размер инсталляционного файла. Правда, начиная с версии 2.24, компания-разработчик стала предлагать программу в двух вариантах— базовом и полном. Базовый комплект в отличие от полного не имеет некоторых возможностей, которые на самом деле не нужны для обычного прослушивания звуковых файлов, поэтому вполне годится для типичного применения программы. Размер базового комплекта версии 2.5с составляет примерно 600 Кб, а полного комплекта той же версии — 1,8 Мб.

Запустите этот файл на исполнение, и вы увидите окно, как на рис. 7.13.

Выберите имя каталога, в который необходимо установить программу и нажмите кнопку Install. Появится окно (рис. 7.14), в котором предлагается обновить список ссылок на ресурсы программы Winamp в сети Интернет. Если ваш компьютер подключен к Интернету, нажмите кнопку Да, в противном случае нажимайте Нет.

Рис. 7.13. Окно инсталлятора программы Winamp

Рис. 7.14. Окно запроса обновления динамических ссылок

После этих действий программа автоматически запустится в режиме воспроизведения демонстрационного файла формата MP3 (demo.mp3). На этом установка будет завершена.

Заметим, что на настоящий момент существует довольно много версий программы. Новые версии программы Winamp в отдельные моменты появлялись чуть ли не каждую неделю (табл. 7.5, в этой таблице приведен далеко не исчерпывающий список версий). Это, с одной стороны, свидетельствует о том, что разработчики программы активно работают над ее модернизацией. С другой стороны, скоропалительный выпуск новых версий не позволяет тщательно отлаживать программу. В итоге выпуск новой версии таит в себе и новые ошибки, исправляемые в последующих версиях. В частности, для версии 2.09 авторам пришлось буквально через два дня выпустить файл-заплатку (patch), которая исправляет допущенные ошибки и изменяет номер версии на 2.091. Разные версии программы имеют и определенные возможности и особенности, зачастую не описываемые разработчиками. Основные возможности различных версий можно всегда посмотреть на сайте компании-разработчика, а также в справочном текстовом файле, появляющемся в каталоге при установке программы. Пользователю обычно не интересно изучать нюансы версий программы, однако полезно знать основные особенности и рекомендации по использованию, так как с программами различных версий приходится сталкиваться в различных архивах и на CD-дисках с музыкальными файлами. Активные пользователи по возможности стремятся устанавливать последнюю версию, считая, что она, по крайней мере, не хуже, что для данной программы не всегда справедливо.

Отметим лишь важнейшие и наиболее интересные особенности версий. Версия 1.92 ознаменовала рождение нового поколения программы Winamp, включив в себя новый декодер Nitrane 1.0, обеспечивающий поддержку технологий ММХ и 3DNow! Декодер Nitrane использовался во многих последующих версиях программы, однако в версии 2.20 был заменен на другой декодер, лицензированный немецким институтом Fraunhofer IIS (о вкладе этой организации в развитие технологий кодирования звука см. ниже в этой главе). Этот декодер использовался в версиях 2.20-2.22. Естественно, что при выходе этих версий говорилось, что программа оснащена новым декодером, улучшившим качество звука. При этом лишь кое-где мельком упоминалось, что этот декодер работает лишь с форматом звука Layer-З, а форматы Layer-1 и Layer-2 корректно не воспроизводит. Незнание этой особенности программы оказалось очень неприятным. Дело в том, что в настоящее время большинство звуковых файлов MPEG записываются в формате Layer-З, однако встречаются и старые записи Layer-1 и Layer-2. Причем довольно часто в фонотеках все файлы независимо от формата имеют расширение MP3. Отличить формат файла по расширению становится невозможно. Это можно сделать лишь посмотрев информацию самого музыкального файла (View file info). Что же происходит в итоге. Установив новую версию программы в определенный момент обнаруживаешь, что некоторые звуковые файлы, прекрасно воспроизводившиеся предыдущими версиями программы, перестали корректно воспроизводиться новой версией по непонятным причинам. Такая ситуация весьма неприятна для пользователя и весьма подрывает авторитет компании-разработчика. Данный декодер использовался лишь в трех версиях программы, и в версии 2.23 разработчики вновь вернулись к декодеру Nitrane обновленной версии 1.60. Возвращение декодера Nitrane сопровождалось рекламными характеристиками об уменьшении загрузки процессора при декодировании файлов, появилась даже фраза "Nitrane жив!". Все эти изменения обросли легендами и мифами, в которых правда соседствует с вымыслом. Так возврат к декодеру Nitrane был обыгран следующим образом. Было сказано, что автор программы Winamp Дж. Френкель разбил свой автомобиль Audi и после случившегося потерял всякое доверие к немецкой инженерии, что и послужило поводом для возврата к собственному декодеру Nitrane. Косвенным доказательством реальности случившегося может служить фотография разбитого автомобиля, файл с которой можно найти на просторах Интернета. В других источниках указывалось, что в течение некоторого времени происходила судебная тяжба между компанией Nullsoft и неким истцом, в продолжение которой компании Nullsoft было запрещено использовать собственный декодер. По окончании тяжбы все встало на свои места. Как все происходило на самом деле, обычному пользователю совершенно не интересно. Эти подробности приведены лишь для того, чтобы показать разнообразие возможных мотивов изменения характеристик программ и их неожиданное влияние на потребительские качества.

Отметим еще некоторые возможности различных версий. Возможность локализации программы Winamp была заложена довольно давно, однако лишь летом 1999 г. появился модуль русификации (Language Pack). Файл для русификации имеет имя Russian.Ing и существует в трех вариантах — для версии 2.10, группы версий 2.2х и версии 2.5х.

Программа Winamp распространялась по принципу shareware, подразумевающему двухнедельный оценочный период и последующую регистрацию программы с небольшой оплатой (см. рис. 7.13). К чести разработчиков программы следует заметить, что не было сделано никаких ограничений к использованию программы после прохождения двухнедельного срока после ее установки. Более того, начиная с версии 2.50, программа стала полностью бесплатной (freeware).

Таблица 7.5. Версии программы Winamp

№ п/п

Номер версии

Дата появления

1

0.2а

21.04.97

2

0.92

01.05.97

3

1.00

07.06.97

4

1.20

31.07.97

5

1.40

03.09.97

6

1.50

19.09.97

7

1.66

14.01.98

8

1.80

18.03.98

9

1.90

31.03.98

10

1.91

20.05.98

11

1.92

27.06.98

12

2.0

08.09.98

13

2.01

25.09.98

14

2.02

29.09.98

15

2.03

08.10.98

16

2.04

25.10.98

17

2.05

15.11.98

18

2.06

31.12.98

19

2.09

11.01.99

20

2.091

13.01.99

21

2.10

24.03.99

22

2.20

03.05.99

23 2.21 12.05.99
24 2.22 26.05.99
25 2.23 08.06.99
26 2.24 13.07.99

27

2.5

25.08.99

28

2.5с

27.08.99

29

2.5е

04.10.99

Довольно популярной долгое время была версия 2.05, которая работает весьма устойчиво. Начиная с версии 2.06, программа Winamp была переписана на Visual C++. По утверждению авторов программа должна была стать меньше по размерам и работать надежнее.

Управление программой Winamp

Работа с программой проигрывания звуковых файлов Winamp не вызывает затруднений. Вы выделяете необходимые звуковые файлы и кидаете их (drag-and-drop) в любое место окна программы Winamp. Файлы попадают в список проигрываемых файлов и будут воспроизводиться по очереди. Это наиболее простой способ использования программы.

Внешний вид программы с графическим эквалайзером (Winamp Equalizer) и списком проигрываемых файлов (Winamp Playlist) показан на рис. 7.15. Заметим, что на рисунке показано одновременно три окна: самой программы, эквалайзера и списка файлов. Эти окна могут быть разбросаны по экрану, а могут быть составлены в произвольном порядке друг над другом и перемещаться как единое целое.

Рис. 7.15. Окна программы Winamp

Окошко самой программы имеет следующие кнопки управления (нижний ряд кнопок): переход к предыдущему звуковому файлу из списка (Previous Track), воспроизведение (Play), пауза (Pause), останов (Stop), переход к следующему звуковому файлу из списка (Next Track), выбор нового файла или файлов (Eject (open file (s))). В этом же ряду имеются две кнопки-переключателя: Shuffle и Repeat, а также кнопка About. Если включена кнопка Shuffle, то воспроизведение файлов из списка будет выполняться в случайном порядке, в противном случае они будут проигрываться подряд. Включение кнопки Repeat обеспечивает бесконечный цикл воспроизведения.

Выше ряда кнопок управления располагается ползунок, перемещающийся по мере исполнения произведения. Перемещая ползунок, можно обеспечить воспроизведение файла с любого места.

Еще выше располагаются ползунки управления громкостью звука и балансом. Тут же расположены кнопки включения/выключения окон эквалайзера (EQ) и списка файлов (PL).

В окне программы Winamp отображается также информация о воспроизводимом в текущий момент файле. Указывается битрейт файла (например, 128 Кбит/с), частота оцифровки (например, 44 кГц), режим воспроизведения (моно или стерео).

Двойным щелчком по строчке с информацией о текущей фонограмме можно вызвать редактор идентификационных параметров звукового файла (рис. 7.16). В окошках редактора можно увидеть данные, хранящиеся в файле, и при необходимости их отредактировать. Заметим, что программа Winamp даже в нерусифицированном виде ограниченно поддерживает русские буквы.

Рис. 7.16. Окно редактора параметров звукового файла программы Winamp

Подключаемые модули программы Winamp

Возможности программы Winamp можно существенно расширить при помощи технологии подключаемых модулей (plug-ins). Подключаемые модули представляют собой дополнительные, специально разработанные программы, которые присоединяются к Winamp и работают совместно с ней. Это может быть программа, которая выводит (под музыку) на экран монитора какую-нибудь графическую информацию (модули визуализации), программа, добавляющая звуковые эффекты (модули DSP — Digital Sound Processing, цифровая обработка звука), или модули общего назначения (General Purpose plug-ins) — например, добавляют кнопки управления проигрывателем в панель задач. Существуют специальные модули для открытия нестандартных типов файлов, например VQF-файлов, а также модули для вывода звука через нестандартные устройства (например, при переводе звука из формата MP3 в формат WAV).

Примечание

Начиная с версии 2.09 в файл с дистрибутивом программы Winamp более не включаются подключаемые модули (plugins) для визуализации и обработки звука (vis/dsp). Теперь их необходимо скачивать и устанавливать отдельно. Разумеется, все ранее установленные модули сохраняются, если новая версия программы устанавливается поверх предыдущей.

Установка модулей не представляет сложностей. В простейшем варианте подключаемые модули представляют собой небольшие dll-файлы, начало имени которых отражает их назначение (vis — модуль визуализации, dsp — модуль обработки звука, gen — модуль общего назначения, in/out для ввода/вывода). Как правило, модули хранятся в упакованном виде. Необходимо распаковать архив в каталог \Winamp\Plugins\.

Затем запустите Winamp и настройте модуль. Для этого откройте окно Preferences (<Ctrl>+<P>), выберите соответствующий модуль и выполните его настройки.

Подключаемые модули программы Winamp можно найти на различных сайтах сети Интернет. В частности, около сотни разнообразных модулей имеется на официальном сайте http://www.winamp.com.

Одним из наиболее интересных модулей визуализации является модуль Cthugha, реализующий огромное количество светомузыкальных эффектов (рис. 7.17).

Рис. 7.17. Окно модуля визуализации Cthugha

Информацию о модуле Cthugha можно получить на следующих сайтах: http://www.afn.org/~cthugha http://islands.zesoi.fer.hr/~kpisacic/cthugha http://www.geocities.com/SiliconValley/Lab/6531

Изменение внешнего вида программы Winamp

В программе Winamp для изменения внешнего вида любого окошка можно воспользоваться технологией установки так называемых Scin'ов. Изображения главного окна проигрывателя, всех кнопок, регуляторов, букв хранятся в отдельных графических BMP-файлах, которые легко редактируются. Это позволяет изменять внешний вид программы по своему усмотрению. Набор таких файлов называется Scin'ом. Слово skin в переводе с английского языка означает кожа, шкура, кожура. Для данного применения этого термина пока не найдено удачного перевода, верно отражающего смысл. Часто употребляется без перевода, например, говорят "установить новый скин". Встречаются термины "сменить шкуру", "установить обшивку". Как бы это ни называли, речь идет об изменении внешнего вида окошек программы Winamp, которое никак не влияет ни на расположение элементов окон, ни на функциональные возможности программы.

Рис. 7.18. Сайт www.winamp.com, целиком посвященный программе Winamp

Технология использования Skin'ов, как это ни удивительно, получила очень широкое распространение. В сети Интернет можно найти огромное количество разнообразных Scin'ов для Winamp, даже найти целые коллекции, в которых они разбиты по отдельным рубрикам. Достаточно зайти на специальный сайт (рис. 7.18), посвященный программе Winamp (http://www.winamp.com), и скачать оттуда любой из имеющихся Scin'ов, число которых перевалило за тысячу на начало 1999 г. и за три тысячи еще через полгода.

Установить новый Skin довольно просто. Сделайте подкаталог в каталоге \Winamp\Skins\ с именем, соответствующим названию Skin'a. Разархивируйте туда содержимое архива со Scin'ом. Отдельный Skin представляет собой набор примерно десяти файлов с расширением BMP и как минимум одного текстового файла. Некоторые Scin'ы имеют встроенные подключаемые модули (файлы *.DLL), которые нужно скопировать в каталог \Winamp\Plugins\.

После совершения этих операций нажмите в главном окне проигрывателя Alt-S. Появится Skin Browser, где можно опробовать новый Skin.

На рис. 7.19 показаны примеры Scin'ов, изменяющих внешний вид основного окна программы Winamp.

Рис. 7.19. Различные варианты отображения основного окна программы Winamp

Скрытые возможности программы Winamp

Многие программисты закладывают в свои программные продукты некоторые недокументируемые возможности. Иногда это требуется для отладочных, проверочных и других технологических целей. В ряде случаев авторы программ закладывают в них различные шутки ("приколы", как говорят программисты), не влияющие на возможности программ. К последним относятся и несколько скрытых возможностей программы Winamp версии 2.хх.

Откройте окно About Winamp, выберите вкладку Winamp (рис. 7.20). На рисунке вы увидите стилизованное изображение любителя музыки в наушниках, перемещающееся по экрану. Однако, если, находясь на этой вкладке, вы выполните двойной щелчок мышью на слове Copyright, одновременно удерживая клавиши <Ctrl>+<Alt>+<Shift>, то увидите фотографию главного программиста фирмы Nullsoft Джастина Френкеля (Justin Frankel).



Рис. 7.20. Вкладка Shareware окна About Winamp программы Winamp

  1. Откройте окно About Winamp, выберите вкладку Shareware (рис. 7.21). Вы увидите информацию об использовании вами программы, в частности, количество запусков программы, число исполненных произведений и общее число минут воспроизведения. Это полезная статистическая информация. Попробуйте сделать двойной щелчок мышью на строчке Usage statistics. Появится строчка, извещающая о том, сколько дней на сегодня прожил автор программы.


  2. Выберите стандартный внешний вид (skin) программы Winamp. На клавиатуре медленно наберите слово nullsoft, нажимая клавишу <Ecs> после каждой буквы. Вместо названия окна программы Winamp появится строчка текста, которая, в частности, озвучена в демонстрационном файле demo.mp3. Перевод текста оставляем читателю.

Рис. 7.21. Программа Winamp накапливает статистику своего использования

Декодирование файлов формата MP3

Для декодирования звуковых файлов формата MP3 и их сохранения, например, в формате WAV можно воспользоваться специальными программами-декодерами. Однако многие программы-проигрыватели файлов MP3 обладают возможностью такого преобразования. В частности, таким свойством обладает программа Winamp.

Для того чтобы преобразовать звуковой файл MP3 в формат WAV необходимо сделать следующее.

  • В меню Options/Preferences выберите вкладку Audio I/O.


  • В окне Output Plug-Ins выберите строчку Nullsoft Disk Writer Plug-In... (рис. 7.22).


  • Нажмите кнопку Configure и выберите имя каталога, в котором будут сохраняться создаваемые файлы.


  • Запустите режим воспроизведения. Вместо воспроизведения звука будут создаваться файлы формата WAV.

Рис. 7.22. Вкладка Audio I/O окна Winamp/Preferences

Предупреждение

Программа Winamp сохраняет сделанные вами настройки. Если в следующий раз вы захотите прослушать фонограмму вместо преобразования файла, то нужно не забыть вернуться к исходным установкам. Процесс преобразования внешне выглядит точно так же, как и воспроизведения. Даже модули визуализации в процессе преобразования будут работать, однако звука не будет слышно.

Где найти файлы MP3?

В последнее время хранение музыкальных записей в формате MP3 получило очень широкое распространение. В сети Интернет уже существует довольно большое количество сайтов, посвященных коллекциям фонограмм в этом формате, причем их число постоянно растет. Найти сайты не представляет труда, воспользовавшись любой поисковой системой. Для этого достаточно для поиска ввести ключевое слово "MP3". Заметим, что таким же образом можно найти и коллекции в других форматах, описанных ниже (например, VQF). Что же касается нового формата хранения звука МР4, то о нем пока ничего не слышно, поэтому поиск по ключу "МР4" приведет к чему угодно, но не к музыкальным сайтам. Приведем адреса лишь некоторых наиболее интересных сайтов.

На рис. 7.23 показана одна из страничек сети Интернет, посвященная музыке (http://www.omen.orc.ru/fl8.htm).

Рис. 7.23. Одна из многочисленных русскоязычных страничек, посвященных музыкальным ресурсам в сети Интернет

Рис. 7.24. Официальный сайт фонда В. Высоцкого

Множество сайтов на русском языке посвящено авторской песне, в частности, отдельным исполнителям. Например, можно найти страничку, целиком посвященную В. Высоцкому (рис. 7.24). Адрес сайта http://kulichki.rambler.ru/masha/vysotsky.

Приведем список некоторых наиболее известных русскоязычных сайтов с музыкальными коллекциями:

http://www.garret.ru/mp3/

http://www.user.cityline.ru/~taxerppp/taxerppp.htm

http://ksp.edison.ru/sound/

http://audio.bard-cafe.komkon.org/

http://bards.net.ru/kfti/

http://soft.hardware.ru/ap/

Создание звуковых файлов MP3

Оказывается, что создать звуковые файлы формата MP3 может практически каждый в домашних условиях. Для этого необходимо иметь источник аудиоданных (обычно это аудио CD) и пару программ.

Создание файла выполняется в два почти независимых этапа. На первом этапе следует получить файл формата WAV (стандартного звукового файла Microsoft Windows), а на втором этапе выполнить его кодирование в формат MP3. Эти этапы можно проделать непосредственно друг за другом, но можно и разделить промежутком времени. Что они в себя включают?

Входным источником для большинства программ-кодировщиков служат WAV-файлы. Некоторые из кодировщиков (для UNIX и OS Macintosh) поддерживают и другие входные форматы. Информация же на CD содержится в специфическом "звуковом" формате в соответствии со стандартом ISO-9680 для записи аудио CD. Перед кодировкой необходимо вычленить такой WAV-файл, что и является первым этапом. Для считывания музыки с аудио CD можно, конечно, прогнать звук через звуковую карту и, воспользовавшись каким-либо звуковым редактором, сохранить данные в виде WAV-файла. Однако это наихудший путь для вычленения звука. Кроме музыки будет сохранен весь набор шумов, который только может породить звуковая карта. Использование звуковой карты оправдано только для тех случаев, когда нет возможности взять музыку непосредственно с CD, например, при записи с радио, магнитофона и т. д. Для считывания музыки с CD пользуются специальными программами, способными перевести данные из аудиоформата в WAV-файл без использования звуковой карты. Такие программы носят название "рипперы" (rippers). В переводе на русский язык для их обозначения используются также термины "нарезальщик", "сдиратель", "грабилка" и др. В последнее время таких программ появилось довольно много, причем cреди них есть условно-бесплатные и вовсе бесплатные. Их обилие определяется в основном тем, что каждая программа поддерживает определенный набор моделей CD, с которым можно ознакомиться в описании программы.

Заметим, что далеко не все приводы компакт-дисков поддерживают операцию чтения аудиодорожек (Reading raw audio stream). Для выбора программы-риппера, просмотрите таблицу, приведенную в приложении 3, и определите главное: поддерживает ли вообще ваша модель CD-ROM такое считывание, и если да, то каким из нарезальщиков рекомендуется пользоваться.

Программы вычленения файлов с аудио CD

Одной из наиболее популярных программ-рипперов является WinDAC (Windows Digital Audio Copy). Эта программа поддерживает большое количество приводов CD-ROM, в частности все модели с интерфейсом SCSI. По адресу http://www.windac.de/ можно получить полную версию программы.

Второе место по популярности занимает программа AudioGrabber. Эта программа не умеет работать с драйверами SCSI, однако прекрасно работает с устройствами интерфейса IDE. Информацию о программе можно получить по адресам http://www.audiograbber.com-us.net, http://audiograbber.da.ru/.

Менее популярной является программа CDCopy, работающая в Windows (http://www.cdcopy.sk/). Среди программ, работающих в среде DOS, следует упомянуть CDDA (CD Digital Audio) и CD2WAV.

Информацию о работе с этими программами можно получить на сайтах http://www.mp3.com, http://www.multimania.com. Из русскоязычных сайтов можно рекомендовать обратиться к страничке http://members.xoom.com/kandid/.

Программы кодирования

Остановимся теперь на программах-кодировщиках. Эти программы на входе принимают WAV-файл и выполняют его кодирование в формат MP3. Часть программ позволяет работать из командной строки, что дает возможность выполнять их запуск непосредственно из программ-рипперов после считывания очередного трека. Такой возможностью, например, обладает программа-риппер WinDAC, которая имеет механизм написания и запуска скриптов. Некоторые из программ-кодировщиков могут принимать поток данных, поступающих от программы-риппера, и кодировать его без создания промежуточных WAV-файлов. Появились также программы, представляющие собой объединение кодировщика вместе с риппером (к числу таких можно отнести программу CDex).

Несмотря на большое разнообразие программ-кодировщиков, многие из них используют одни и те же библиотеки, т. е. в сущности, являются программами-оболочками, предоставляющие удобный интерфейс к кодировщикам, работающим из командной строки, или установленным в системе кодерам.

Программы такого рода (их называют front-end-программами) передают введенные параметры непосредственно кодировщику и ожидают завершения процесса кодирования. Сами кодировщики называют двигателями кодирования.

Разнообразных двигателей кодирования, в отличие от программ, не так уж и много. Прежде всего, нужно выделить кодировщики, разработанные немецким институтом Fraunhofer IIS (Institut Integrierte Schaltungen), варианты которых используются в программах MP3 Producer, MP3 Compressor, 13enc, mp3enc, AudioActive. Институт Fraunhofer IIS (рис. 7.25), в стенах которого выполнены основополагающие разработки систем сжатия звука, является признанным лидером среди научно-исследовательских лабораторий в области мультимедийных приложений (http://www.iis.fhg.de).

Одной из первых программ-кодировщиков является 13enc, 16-битовая программа, работающая в среде DOS. Другая программа mp3enc — дальнейшее развитие 13enc для 32-битовых систем, все также работающая из командной строки, выполняет кодирование значительно быстрее, однако проявляет себя хуже в плане сохранения высоких частот.

Рис. 7.25. Страница института Fraunhofer IIS, известного своими разработками в области сжатия аудиоданных

Программа MP3 Producer (рис. 7.26) считается лучшим кодировщиком (по мнению авторов сайта www.mp3bench.com). При установке этой программы в систему Windows становится доступен кодер MP3, который может затем использоваться из любой программы работы со звуком. Например, можно воспользоваться стандартной программой Фонограф (Sound Recorder) и сохранять файлы в формате MP3. Список установленных в системе кодеров можно увидеть, выбрав нужный пункт в панели управления (Control panel /Multimedia/Audio compression).

Примечание

Последние версии MP3 Producer устанавливают в систему Windows только декодер файлов MP3, а код кодера интегрирован с самой программой.

Рис. 7.26. Окно программы-кодировщика MP3 Producer

Программа MP3 Compressor является оболочкой-интерфейсом к тому же кодеру, на котором основан и MP3 Producer. Интерфейс программы позволяет несколько иначе строить задачи кодирования и следить за их процессом. Это приложение предоставляет некоторые дополнительные возможности, не допускаемые в MP3 Producer. В частности, поддерживает работу в режиме LQ (режим, противоположный HQ — High Quality). При включенной опции LQ (Low Quality) кодировщик производит над каждым фрагментом некоторое фиксированное количество итераций, затрачивая на кодировку фрагмента определенное количество времени. Если же активизировать HQ, кодировщик будет продолжать итерационный процесс до тех пор, пока не перестанет улучшаться результат. Повышение качества в этом случае требует дополнительных временных затрат на кодировку, при этом размер выходного файла не меняется. Время кодирования при изменении режима HQ/LQ может изменяться в 2—3 раза.

Другим несомненным достоинством программы является возможность задания большого количества файлов для кодировки и запуска программы из командной строки.

Примечание

Последние версии программы MP3 Producer (начиная с версии 2.1) также предоставляют возможность отключения режима HQ, а также имеют опцию пакетной обработки файлов (Batch Processor). Кроме того, теперь предоставляется возможность задания битрейта вплоть до 256 Кбит/с для высококачественных записей (ранние версии имели ограничение — до 128 Кбит/с).

Другой известный производитель коммерческих кодеров MP3, компания Xing Tech (Xing Technology Corporation, адрес сайта корпорации http:// www.xingtech.com), специализируется на выпуске низкокачественных кодеров. Среди этой группы кодеров можно назвать XingMP3 Encoder, Mplifier, AudioCatalyst и др. Характерной особенностью кодировщиков от Xing Tech является высокая скорость работы (программа XingMP3 Encoder выполняет кодирование в 6—8 раз быстрее, чем MP3 Producer). Такая скорость достигается за счет безжалостного вырезания частот свыше 16 кГц, которые еще слышны человеку. В итоге, когда речь заходит о высоком качестве, кодировщики Xing Tech использованы быть не могут.

Примечание

Программа AudioCatalyst представляет собой объединение программы-риппера (на базе AudioGrabber) и кодировщика от Xing Tech.

У кодировщиков данной группы (от Xing Tech) есть и некоторые интересные свойства. В последней версии кодировщика AudioCatalyst 1.5 реализована довольно интересная техника переменного битрейта (VBR, Variable Bit Rate). В результате кодер способен для того же суммарного объема в определенных ситуациях давать MP3-файлы даже более высокого качества, чем кодеры от Fraunhofer IIS, так как для сложно кодируемых участков становится возможным использование повышенных битрейтов, а для легко кодируемых, соответственно, — пониженных. Несомненным достоинством техники VBR-кодирования является то, что она базируется на внутренних возможностях формата MP3, не добавляя по сути ничего нового — просто эти возможности в полной мере не были использованы ранее. Соответственно, полученные MP3-файлы можно проиграть на любом MP3-плейере. Проблемы могут возникнуть иногда только при определении длительности звучания композиции, но на качество и полноценность воспроизведения это не влияет. Полностью технология переменного битрейта поддерживается программой Winamp, начиная с версии 2.09.

Все остальные известные кодеры, авторство которых не принадлежит ни Fraunhofer IIS, ни Xing Tech, основаны на общедоступных исходных текстах кодера (ISO source), равномерно кодирующего разные частотные диапазоны, что приводит к наивысшему качеству кодирования на высоких битрейтах и вполне приличному на 128 Кбит/с. Но этот код достаточно медленный, поэтому существует единственный известный кодер, в котором он не подвергся обширным изменениям в целях оптимизации — mpegEnc. Эта программа считается эталоном качества для высших битрейтов. Из кодировщиков этой группы достойны также упоминания BladeEnc, Cdex и SoundLimit.

Выбор кодировщика в конечном итоге определяется требованиями к качеству и времени кодирования. Для большинства любителей музыки среднего качества вполне достаточно возможностей кодировщика AudioCatalyst 1.5. Он обеспечивает наивысшую скорость кодирования и при этом дает вполне удовлетворительное качество звучания. Для обеспечения высшего качества придется прибегнуть к большим битрейтам и воспользоваться кодировщиками типа BladeEnc или mpegEnc. Из кодировщиков от Fraunhofer IIS, кроме популярных программ MP3 Producer и MP3 Compressor, рекомендуется опробовать их последнюю разработку — программу AudioActive.

Информацию о программном обеспечении для работы со звуковыми файлами можно получить на сайтах:

http://www.dailymp3.com

http://www.direct-mp3.com

http://www.mp3.com

http://www.mp3now.com

http://www.mp3bench.com

http://www.mp3archive.com

http://www.mp3-2000.com

http://www.mp3place.com

http://www.hugemp3.com

http://www.mp3place.net

Выбор параметров кодирования

Значительное количество встречающихся в сети Интернет файлов MP3 имеют частоту оцифровки 44,1 кГц, битрейт 128 Кбит/с и режим стерео. Считается, что такие параметры звуковых файлов обеспечивают качество, сопоставимое с аудио CD. На эти параметры и следует ориентироваться при подготовке звуковых файлов для дальнейшего прослушивания на аппаратуре среднего класса.

Примечание

На самом деле звучание файлов MP3 становится невозможно отличить от аудио CD только на битрейтах 256 Кбит/с и выше, что подтверждено профессиональными прослушивателями, нанятыми в свое время институтом Fraunhofer IIS. Однако использование битрейта 128 Кбит/с вместо 256 Кбит/с позволяет в два раза уменьшить размер файлов, что играет значительную роль при передаче по сети. При этом искажения сигнала можно ощутить только на высококлассной аппаратуре и то не на всякой фонограмме. Учитывая эти особенности принято считать, что 128 Кбит/с обеспечивает качество аудио CD.

При кодировании можно поступиться качеством и выиграть в размере получаемых файлов (в зависимости от предназначения звуковых файлов). Для выбора параметров кодирования можно рекомендовать обратиться к табл. 7.6, по которой в зависимости от требуемого качества звука можно выбрать нужные параметры кодирования (важнейшим параметром для кодировщика является значение битрейта).

Таблица 7.6. Приблизительные характеристики качества звука для различных режимов

Качество звука Частотный  диапазон, кГц Режим Битрейт, Кбит/с Степень сжатия

Телефонная линия

2,5

моно

8

96:1

Лучше, чем LW-радио

4,5

моно

16

48:1

Лучше, чем АМ-радио

7,5

моно

32

24:1

FM-радио

11

стерео

56-64

26-24:1

Почти CD-качество

15

стерео

96

16:1

CD-качество

15

стерео

112-128

14-12:1

Заметим, что процесс кодирования достаточно длителен. Так, например, кодирование 4 минут музыки на Pentium-200 ММХ программой MP3 Producer в режиме HQ с битрейтом 128 Кбит/с занимает примерно 12 минут процессорного времени в отсутствие других задач.

Переносные плейеры звуковых файлов МР3

Прочитав о возможностях хранения звука в формате MP3, у проницательного читателя должен появиться вопрос, не пора ли начать выпускать переносные устройства проигрывания (наподобие популярных уже на протяжении двух десятилетий аудиоплейеров). Спешим вас обрадовать, такие устройства уже существуют! Одни устройства предназначены для прослушивания файлов "на улице", другие же — для установки в автомобиле. Их можно разделить по принципу хранения данных — флэш-память, жесткие диски PC-card type I и II, а также способу расшифровки файлов — специальный процессор, предназначенный только для этих целей, или любой достаточно мощный RISC-процессор с низким энергопотреблением.

Одним из первых переносных плейеров является MPMan, точной копией которого является плейер MPStation (http://www.mpstation.com) фирмы DigitalCast. Компания Z Company (которой, кстати, принадлежит сайт www.mp3.com) уже начала продажу в США плейеров MPMan (http://www.mpman.com), которые производятся корейской фирмой Saehan Information Systems.

Плейер MPMan имеет размер с пачку сигарет (91x70x16,5 мм), весит всего 65 г (без батареек), не содержит движущихся частей и выпускается в двух вариантах. Модель с 32 Мб флэш-памяти может вместить до 30 минут записи, а модель с 64 Мб, соответственно, — один час. Питание осуществляется от двух аккумуляторных батарей напряжением 1,2 В, емкости которых хватает на 9 часов звучания. Плейер может устанавливаться в специальное устройство (Docking Station), оборудованное зарядным устройством и подключаться к компьютеру через стандартный параллельный порт.

Один из крупнейших производителей аппаратуры для персональных компьютеров — компания Diamond Multimedia Systems выпустила свой портативный цифровой музыкальный плейер Rio PMP300 — первое устройство от крупной фирмы, способное воспроизводить записи, загруженные из Интернета. Плейер также имеет небольшие размеры (89x63x16 мм), весит всего 70 г. Данная модель имеет флэш-память емкостью 32 Мб с возможностью увеличения. Может подключаться к компьютеру через параллельный порт. Время заполнения флэш-карты не превышает 6 мин. Емкости батареек хватает на 12 часов непрерывного прослушивания.

Вице-президент компании Diamond Multimedia Systems по корпоративному маркетингу Кен Вирт (Ken Wirt) считает, что этот продукт станет очень популярным. Компания планирует в ближайшее время довести объем производства до 10 тыс. штук в неделю. Это устройство размером меньше плейера Walkman обещает произвести переворот в музыкальной индустрии и приблизить эру цифрового распространения записей, предоставив больше возможностей независимым музыкальным группам.

Видимо в ближайшее время произойдет резкий рост количества компаний, производящих подобную технику. В частности, компания Samsung объявила о завершении разработки своего плейера с названием "Yepp", выпускаемого в трех вариантах (от простого к сложному). Отличительными характеристиками этого плейера является наличие встроенного радиоприемника FM-диапазона с цифровой настройкой, а также возможность записи голоса, т. е. это устройство может использоваться в качестве диктофона. Для записи файлов формата MP3 предлагается отдельное устройство. Сведения о этих разработках можно получить на специальном сайте http://www.yepp.co.kr.

Еще один переносной плейер — Clikman. Помимо основных функций в это устройство встроили органайзер для записи телефонов, расписания и т. д. Управление устройством осуществляется как при помощи встроенной цифровой клавиатуры, так и голосовыми командами. Для хранения всех данных используются диски Clik! от накопителей ZIP-Iomega емкостью 40 Мб. Все перечисленные возможности потребовали усложнения устройства, в результате его размеры и вес несколько превышают соответствующие параметры аналогичных устройств (вес составляет почти 200 г). Ознакомиться с новинкой более подробно можно непосредственно на сайте компании-производителя: Varo Vision Co (http://www.varovision.com/subl/clik.html).

Однако, технологии использования формата MP3, по крайней мере, для крупной музыкальной индустрии свойственен один существенный недостаток, а именно, отсутствие средств защиты от копирования. Каждый желающий может распространять в Интернете любую преобразованную в этот формат песню: чтобы из одной копии сделать миллион, достаточно нажать на несколько клавиш. Это не нравится Американской ассоциации индустрии звукозаписи (RIAA — Recording Industry Association of America), представляющей около 90% этого бизнеса (http://www.riaa.com). Старший исполнительный вице-президент и генеральный юрисконсульт RIAA Кэри Шерман (Сагу Sherman) считает, что, бесплатно распространяя пиратские записи, новое устройство способно полностью разрушить индустрию.

Сейчас большая часть музыкальных записей MP3 в Интернете — это пиратские копии. RIAA называет эту разработку шагом не вперед, а назад.

Согласно заявлению ее представителей, Ассоциация видит очень мало легальных применений MP3 по сравнению с множеством вариантов пиратского использования. Компания также рассматривает возможность запрета импорта устройств типа MPMan в США.

Встроить в плейер технологию флэш-памяти легко могли и другие компании, не менее смышленые, чем Diamond. Но они ожидали появления технологии защиты содержимого. С выпуском плейера Rio ситуация изменилась. Почему Sony должна ждать, если Diamond уже делает деньги? Эти слова Кэри Шермана оказались пророческими. Боясь отстать, Sony продемонстрировала на выставке Comdex прототипы подобных изделий. Это вызовет эффект домино, вы не успеете оглянуться, как артисты останутся абсолютно беззащитными. Опасения такого рода не беспочвенны. Интернет способен коренным образом изменить соотношение сил в музыкальной индустрии, что уже произошло в информационной технологии в целом.

Споры о нарушении авторских прав при использовании цифровых плейеров дошли до суда. В результате эти электронные устройства признаны американским судом не относящимися к записывающим устройствам и потому не нарушающими авторские права. Суд Лос-Анджелеса в октябре 1998 г. разрешил производство и продажу устройства Rio и отказал истцу — Американской ассоциации индустрии звукозаписи в требовании к производителю прибора, фирме Diamond Multimedia, отчислять им проценты с продаж за "копирование музыкального материала". По оценке Роберта Кона, президента интернетовского сайта GoodNoise, предлагающего посетителям тысячи музыкальных записей, это решение суда "является большой победой молодых исполнителей, которые получают альтернативный способ распространения своих произведений".

Влияние подобных устройств еще только осознается шоу-бизнесом. Они могут буквально перевернуть все аспекты работы музыкальной промышленности, включая практику распространения и лицензирования копий. Например, группы начнут конкурировать в реальном времени, выпуская не диск за диском, а песенку за песенкой, публикуя особо удачные концертные исполнения, и т. д.

Легко представить себе, например, как трансформируется существующая в российских городах инфраструктура распространения популярной музыки среди подростков. Киоски с кассетами превратятся в пункты записи звуковых файлов со своими каналами доступа к Интернету и прокси-серверами. Успех у публики (а не у диск-жокеев радиостанций) станет доступен непосредственному измерению. Опубликовать свою запись через сеть Интернет сможет буквально любой, что правда может привести к засилию низкопробной продукции.

Потоковое воспроизведение

Технология сжатия звуковых файлов MP3 постепенно проникает во все сферы использования звука. С развитием каналов передачи данных и возможностей сжатия эта технология вышла на уровень потоковой передачи данных в реальном времени, где до сих пор безраздельно господствовала технология RealAudio. Компания Nullsoft (http://www.nullsoft.com/), создатель знаменитого плейера Winamp теперь, кроме продвижения самого плейера, активно занимается развитием и пропагандой технологии ShoutCast, предназначенной для потоковой передачи аудиоданных в формате MP3. Единственное, что нужно обычному пользователю для того, чтобы послушать сетевую MP3-станцию, или открыть собственную, это сам плейер Winamp. По адресу http://www.shoutcast.com/ можно найти адреса более чем 300 серверов, вещающих в формате MP3, и список десяти лучших из них.

Звуковые файлы формата VQF

Популярность и широкое распространение технологий MP3 вызвали бурный рост числа разработок в области сжатия звука. Стали появляться новые стандарты и форматы хранения звука, которые в будущем, возможно, придут на смену существующим. В последующих разделах кратко остановимся на современных достижениях в этой области.

Наряду с широко известным на сегодняшний день форматом MP3 сравнительно недавно появился формат VQF, имеющий более высокую степень сжатия и качество воспроизведения.

Формат VQF основывается на технологии TwinVQ (Transform-domain Weighted Interleave Vector Quantization — векторное квантование с трансформными доменами и взвешенным чередованием), разработанной в Японии в лаборатории NTT Human Interface Laboratories (http://www.hil.ntt.co.jp/top /index_e.html). Патент на использование этого формата принадлежит фирме NTT, однако основное программное обеспечение для работы с этим форматом предлагает фирма Yamaha. Компания Yamaha предлагает, пожалуй, лучшее программное обеспечение для создания и воспроизведения файлов формата VQF под маркой SoundVQ (http://www.yamaha.co.jp/english/xg/SoundVQ/). При установке плейера одновременно инсталлируются подключаемые модули для воспроизведения файлов VQF в браузеры Netscape и Internet Explorer.

Существует также и программное обеспечение от компании разработчика технологии TwinVQ (http://music.jpn.net/software-e.html).

Этот формат по использованию идей сжатия весьма похож на MP3. Приведем их сравнительные характеристики.

VQF-файлы примерно на 30—35% меньше, чем MP3, при одинаковом качестве звука. Потоку 128 Кбит/с у файлов MP3 соответствует поток 80 Кбит/с у файлов VQF. У этих достоинств есть и обратная сторона. При декодировании загрузка процессора также примерно на 30% выше, чем при декодировании MP3. Это определяет повышенные требования к компьютеру, на котором планируется проигрывать такие файлы. Для качественного воспроизведения минимальным требованием является процессор Pentium-90, рекомендуется Pentium-200 MMX. Для кодирования минимальным требованием является компьютер с процессором Pentium-66. Высокая степень сжатия требует значительных временных затрат на кодирование файлов в формате VQF. Так кодирование 4 минут музыки на Pentium-200 MMX занимает примерно 20 минут процессорного времени. Это значительно больше, чем при кодировании файлов MP3.

Тесты показывают превосходство VQF по всем параметрам на нижних частотах и гораздо меньшее искажение формы сигнала с большим динамическим диапазоном (реальная музыка). Однако по завалу верхних частот звукового спектра VQF на 2—3 дБ уступает MP3 на частотах выше 15 кГц. Это впрочем, легко компенсируется настройкой эквалайзера плейера, что объективно ставит VQF на ступень выше по качеству звука по сравнению с MP3, но субъективное восприятие различных композиций формата VQF дало старт затяжной полемике между приверженцами хорошо проверенного старого (MP3) и новинок (формата VQF и формата ААС, о котором пойдет речь далее). Узкопрофессиональные споры не мешают сделать широкой интернетовской общественности выбор в пользу нового формата. Наиболее распространенное мнение сейчас можно сформулировать примерно так: "Если и есть какие-то различия, то нужно быть профессиональным музыкантом, чтобы их заметить".

На текущий момент в сети Интернет можно найти довольно много музыкальных произведений в формате VQF, однако их количество и степень популярности значительно уступают MP3. Также значительно меньше существует программ-плейеров и кодеров.

Для проигрывания файлов можно рекомендовать программу K-Jofol. Появились также подключаемые модули для Winamp, проигрывающие файлы VQF (этот модуль использует декодер компании Yamaha).

Программа K-Jofol версии 0.51 занимает 1,4 Мб (как раз одна дискетка). Позволяет воспроизводить файлы форматов VQF, ААС, MP3 и др. Дает возможность декодировать файлы в формат WAV. На сегодняшний день считается самым быстрым плейером, использующим свои собственные декодеры для всех форматов.

Программе характерен оригинальный дизайн. Уже при инсталляции можно заметить (рис. 7.27), что авторы попытались уйти от традиционных прямоугольных окон, придав им вычурные формы (рис. 7.28, 7.29). На первых порах немного непривычно, однако довольно быстро удается приспособиться. Возможности и методы работы с программой во многом аналогичны другим плейерам.

Рис. 7.27. Окно инсталлятора программы K-Jofol

Рис. 7.28. Основное окно программы K-Jofol

Рис. 7.29. Список проигрываемых файлов программы K-Jofol

Информацию о формате VQF можно получить с официального сайта http://www.vqf.com. О программе K-Jofol можно узнать на сайте http://www.kjofol.org. Найти иную информацию в Интернете, а также файлы в этом формате, можно с помощью любой поисковой системы, указав для поиска слово "vqf. О быстром росте популярности этого формата свидетельствует следующий факт. Если в сентябре 1998 г. запрос по слову "vqf поисковой системе AltaVista давал всего 20 ссылок, то в начале 1999 г. по такому запросу выдавалось уже несколько тысяч ссылок.

Примечание

Популярность формата VQF пока значительно уступает MP3. Рынок программного обеспечения работы с такими звуковыми файлами еще не вполне устоялся. Частенько появляются сообщения о весьма неустойчивой работе многих программ-проигрывателей этого формата. Это относится и к подключаемым модулям программы Winamp (попадаются просто неработоспособные версии), так и программе K-Jofol. Если у вас воспроизведение файлов такого формата идет с явными искажениями (даже на достаточно мощной машине), попробуйте прежде всего обновить версию программы-проигрывателя или используйте другую программу. Только во вторую очередь следует грешить на сам звуковой файл.

Звуковые файлы формата ААС

Формат ААС (Advanced Audio Coding) представляет еще один из числа появившихся сравнительно форматов кодирования звуковой информации, в котором осуществляется сжатие с потерями. На сегодняшний момент ААС представляет собой лучшую систему сжатия высококачественного звука. Это последний из стандартов MPEG-2. Перевести ААС можно как "Продвинутое Аудио Кодирование", название, которое появилось из-за исключительно высокого качества звучания и очень сильной системы сжатия.

На данный момент различают четыре разновидности формата ААС:

  • HomeboyAAC
  • AT&T a2bAAC
  • Liquifier Pro AAC
  • Astrid/Quartex AAC

По всем объективным параметрам последние две модификации ААС превосходят как MP3, так и VQF.

Все четыре разновидности несовместимы между собой и используют свои собственные программы кодирования и воспроизведения.

Далее мы кратко их охарактеризуем.

HomeboyAAC

Это первая версия ААС, кодер для которой стал общедоступен. Ее можно охарактеризовать одним словом — отвратительно. Крайне корявые и медленные кодеры в сочетании с отчетливо слышимыми искажениями сыграли свою роль в отталкивании широких масс от этого формата. Единственными его плюсами является достижение качества MP3 128 Кбит/с на более низких битрейтах и наличие приятного и быстрого плейера BitAAC. Сейчас этот формат уже практически не используется и даже ссылки на программное обеспечение для него почти исчезли со страниц Интернета. Следует иметь в виду, что большинство программ, распространяемых через Интернет под видом кодеров ААС, являются кодерами именно этого формата. Во времена появления и развития этой ветви ААС уже существовал формат VQF.

AT&T a2bAAC

Известная компания AT&T не могла остаться в стороне от технологий новых систем сжатия аудиоданных. При фирме было создано специальное подразделение, занимающееся созданием программ и раскруткой нового формата, который получил название a2b. Строго говоря, этот формат практически полностью следует тем же самым принципам компрессии, что и предыдущий. Однако фирмой были предприняты значительные усилия по повышению качества звучания (в результате чего снизилась степень сжатия) и внесению новых элементов в формат. Составной частью формата a2b стала возможность включения изображения исполнителя и текста песни внутрь аудиофайла. Также была разработана технология получения самовоспроизводящихся песен (исходную композицию можно преобразовать в .ехе-файл, включающий в себя все необходимые для воспроизведения, что увеличивало файл всего примерно на 170 Кб). Для файлов этого формата существует удобный и бесплатный плейер с поддержкой многих дополнительных возможностей. Однако, несмотря на мощнейшую рекламную компанию и на очевидные достоинства формата, он не нашел широкого применения по одной простой причине — отсутствию общедоступного кодера! Мало того, эта уважаемая фирма пыталась запатентовать и запретить к использованию все составные части формата. К счастью, это у нее не вышло, — патент был получен только на собственные нововведения. Сейчас уже рекламный пыл немного угас и со своего сайта компания предлагает приобрести уже готовые файлы или бесплатно скачать несколько композиций.

Формат по степени сжатия превосходит MP3, но на 15—20% уступает VQF, РАС, Astrid/Quartex ААС и Liquifier Pro AAC.

Качество звучания a2b 96 Кбит/с сравнимо с качеством MP3 128 Кбит/с и VQF 96 Кбит/с, но уступает Liquifier Pro AAC 96, Astrid/Quartex AAC 96 и РАС 96.

Дополнительную информацию можно получить в Интернете по адресу http://www.a2bmusic.com/.

Liquifier Pro AAC

Естественно компания AT&T не могла остаться одинокой на рынке борьбы за первенство в области высококачественной компрессии звука. Через некоторое время фирма Liquid Audio нанесла если не сокрушительный, то очень опасный удар по честолюбивым замыслам остальных. Предложенная ей версия формата ААС наиболее четко следовала всем техническим тонкостям и в результате появилась лучшая на сегодняшний день система сжатия звука. Она по степени сжатия и качеству звучания превосходит все существующие в данный момент форматы. И хотя превосходство по сжатию над VQF и Astrid/Quartex AAC незначительное — минимальный битрейт, заслуживающий внимания, все те же 96 Кбит/с, звук превосходит все ожидания!

К сожалению, политика компании Liquid Audio на данный момент слабо отличается от политики AT&T — есть отличный плейер, но нет общедоступного кодера (существовала демо-версия, но она работала только в он-лайне и через несколько дней неожиданно самоуничтожалась, а все закодированные ей файлы становились неработоспособными).

Подводя итоги, заметим, что этот формат по всем параметрам превосходит все остальные и объективно является лучшим. Среди самых последних новостей отметим появление звуковых файлов в этом формате (они имеют расширение LQT), причем для их воспроизведения можно воспользоваться плейером компании Liquid Audio или же установить plugin для программы Winamp (in_lqt.dll), который на самом деле пользуется все тем же, несколько "исправленным" плейером, перенаправляя звук в программу Winamp.

Дополнительную информацию можно получить в Интернете по адресу http://www.liquidaudio.com/.

Astrid/Quartex AAC

В октябре 1998 г. в "спор гигантов" вступило частное лицо. Никому не известный и скромный программист создал, на основе изданных фирмой NTT в мае исходников МР4, свою собственную систему компрессии! Им было предложено протестировать кодер, для чего он был выложен в Интернете по адресу http://www.geocities.com/ResearchTriangle/Facility/2141/.

Уже через несколько дней после выхода новой версии популярного плейера K-Jofol, для которого автор формата Astrid/Quartex AAC написал декодирующий модуль, появились восторженные отклики. Кодер, обладающий непритязательным интерфейсом командной строки, по сжатию и качеству звучания превосходил кодировщики от AT&T ААС и YAMAHA VQF. При этом качество звука практически не уступало хваленому Liquifier Pro AAC. Почти одновременно появились графические интерфейсы (front-end) для нового кодировщика и масса хвалебных отзывов в разных источниках. При всех видимых недостатках сегодняшней версии 0.2 (поддержка только WAV 44 кГц/16 бит РСМ и степени сжатия только 64, 96 и 128 Кбит/с), она уже широко применяется (есть целые ftp-сайты с музыкой в этом формате) и все с нетерпением ждут новых версий.

По степени сжатия и качеству звучания формат превосходит все остальные, кроме Liquifier Pro AAC, и является объективно лучшим среди тех, что имеют общедоступные кодеры и доступные для распространения в Интернете звуковые файлы. По сравнению с MP3 обеспечивается аналогичное качество при потоке на 30% меньше. Качество Astrid AAC 96 Кбит/с много лучше качества VQF/96 Кбит/с. Возможно также потоковое воспроизведение.

Звуковые файлы формата РАС

Несколько особняком от остальных систем кодирования стоит формат РАС (Perceptive Audio Coding). Впервые эта аббревиатура появилась в стенах лаборатории Bell Labs/Lucent Technologies (кстати, там же впервые появилось сокращение ААС) в самом конце 1997 года. Через некоторое время стали появляться очень интересные сообщения от других фирм-разработчиков, которые не могли не заинтриговать интересующегося человека.

Так было заявлено о следующих возможностях:

  • достижении качества MP3 128 Кбит/с в формате РАС с битрейтом 64 Кбит/с;


  • поддержка потокового воспроизведения через Интернет;


  • прямое преобразование из Audio-CD в РАС без промежуточных огромных WAV-файлов на диске;


  • кодирование в реальном времени на Pentium-166 (даже не ММХ);


  • защита от свободного распространения РАС-файлов по Интернету и на CD-R;


  • широкие возможности упорядочения готовых РАС-файлов (плей-листы, каталоги, описания и т. д.).

В середине лета 1998 г. известная фирма Celestial Technologies выпустила первую и до сих пор единственную программу для кодирования и воспроизведения звука в формате РАС — "Audio Library 1.0". Хотя программа бесплатно работает только 15 дней и позволяет в одном каталоге хранить не более 5-ти композиций, уже можно сделать кое-какие выводы. Первое, что бросается в глаза, это отсутствие, как таковых, файлов в формате РАС. Во время своей работы программа создает базу данных, состоящую из 8 файлов с расширением TPS, в отдельном каталоге, причем для воспроизведения необходимы минимум 7 из них (GREGLANG.TPS можно выкинуть) Увеличение количества композиций не меняет количества файлов — при добавлении новой песни в базу просто увеличивается размер файла SONGDATA.TPS.

И во всем остальном программа удивляет. Хотя пока на битрейте 64 Кбит/с звук уступает MP3 128 Кбит/с, качество звучания РАС 128 Кбит/с поражает воображение. При этом кодер обеспечивает обещанную скорость кодирования.

Большего сказать о данном формате пока не представляется возможным. Нужно подождать новых версий кодеров.

Новую информацию можно получить по адресу http://www.celestialtech.com/.

Новый формат хранения звука МР4

Работа над новыми стандартами в области хранения звука не стоит на месте. И вот, наконец, в ноябре 1998 г. все заинтересованные стороны пришли к согласию об окончательной спецификации нового формата сжатия звука МР4. Как и ожидалось, в основе нового формата лежат VQF и ААС.

Появление нового стандарта, однако, не предполагает быстрого появления программ, работающих в этом формате. По самым оптимистичным прогнозам первые кодеры и плейеры появятся к началу-середине лета 1999г., а более или менее продвинутые, с оптимизацией скоростей кодирования и воспроизведения, программы следует ожидать не ранее 2000-го года. Следовательно, в ближайшее время всем придется пользоваться уже существующими форматами.

Первые разработки по новому формату были представлены в январе 1999 г. компанией Global Music Outlet. Пока рано делать какие-либо выводы о возможностях и перспективах этого формата. Вполне может случиться, что формат с таким названием останется лишь в виде спецификации, а в реальной жизни будут появляться и использоваться другие форматы, предложенные отдельными компаниями.

Вызывает некоторое удивление само название формата — МР4 из-за возможной путаницы с MPEG-4, форматом аудио- и видеокомпрессии, принятым Международной организацией по стандартизации в качестве открытого стандарта распространения мультимедийной информации. Между обеими технологиями нет ничего общего.

Новости о развитии ситуации можно узнать на сайте http://mp4.globalmusic.com/. Компания Global Music Outlet обещала, что одной из первых записей в новом формате будут произведения группы Public Enemy, которые будут опубликованы на ее Web-сайте (http://www.public-enemy.com/).

Компания также рассчитывает соблазнить "китов" музыкальной индустрии возможностью формата МР4 записывать звуковые файлы с защитой от нелицензионного копирования.

Формат WMA

Компания Microsoft, естественно, не могла обойти вниманием быстро развивающиеся технологии сжатия звуковых данных. Была разработана собственная технология кодирования звука, быстро получившая распространение. Формат соответствующих файлов получил название WMA (изначально он был назван ASF). Быстрому внедрению формата должна способствовать маркетинговая политика компании Microsoft, которая включила поддержку нового формата в свой проигрыватель (Media Player), который можно свободно получить с сайта компании. Также в свободном доступе кодировщик файлов формата WMA.

Поддержка воспроизведения файлов WMA включена в программу Winamp с версии 2.20. Эту же программу можно использовать и в качестве кодировщика.

Вверх страницы

← к предыдущей главе     к следующей главе →

К оглавлению

 Раздел: Учебники / Учебник по HTML


 
Популярные статьи