Формат аудиосжатия WMA (ASF)
Перед тем, как приступить к рассмотрению этого формата хотелось бы разрешить некоторую путаницу, которая возникла вокруг его названия. Некоторые авторы в своих статьях называют этот формат форматом аудиосжатия WMA (Windows Media Audio), а некоторые - форматом аудио- (видео-) сжатия ASF (Advansed Streaming Format). Так вот, ASF ни коем образом не является форматом сжатия аудио- или видеоинформации, а те, кто так пишет либо заблуждаются, либо просто не удосужились вникнуть в некоторые тонкости перевода технической документации. Как следует из названия, ASF - это продвинутый формат передачи информационного потока и вполне годится для пересылки как аудио- и видеоданных, так и вообще любой информации. При этом ASF не сжимает данные, этим занимаются отдельные кодеки, например, WMT x.x для аудиофайлов и Windows Media MPEG-4 (а теперь и Windows Media Video v7) для видео. ASF обеспечивает непрерывность получения потока данных, столь необходимую любому сетевому мультимедиа формату. Для достижения этой цели формат использует наряду с уже известными и проверенными решениями, такими как разбивка передаваемой информации на фреймы, буферизация для обеспечения одновременного получения и обработки данных, проверка контрольной суммы фреймов для коррекции ошибок, и некоторые технологические новинки являющиеся секретом фирмы Microsoft (хотя что еще помимо вышеперечисленного можно изобрести, ума не приложу).
На практике сочетание ASF + мультимедиа кодек является примерным аналогом широко распространенной в Unix - системах парой tar + gzip. Gzip - это архиватор, а tar - это менеджер - "сборщик", собирающий все сжатые файлы и каталоги в один файл архива. Здесь ситуация весьма схожа. Кодек - это своего мультимедиа архиватор, а формат ASF - менеджер пересылки, отвечающий за передачу данных.
Нас интересует, собственно, только звуковая часть кодеков, которые используются вместе с ASF. Именно та часть, которую Microsoft устав от неразберихи связанной с ASF и, наконец - то, решив стандартизировать свои мультимедиа форматы, требует называть WMA (существует еще и WMV - Windows Media Video - стандарт, который все еще продолжают называть ASF, тем более, что Media Player прекрасно его понимает и с таким расширением).
Несмотря на то, что WMA как стандарт появился совсем недавно, чуть ли не последним из всех конкурентов MP3, история этого формата, вернее его кодека, последняя версия которого теперь называется Windows Media Audio Codec v7, началась гораздо раньше.
Компания Voxware известная своими разработками в области мультимедиа, непоседливостью и большим интересом ко всему новому и передовому в мае 1998 года примкнула к проекту TwinVQ, разработанному творческой группой Human Interface Laboratory, являющейся подразделением компании NTT, с целью развития и усовершенствования этого формата, который но тот момент был еще очень сырым и не оптимизированным. Содружество это увенчалось успехом - стандарт VQF был доработан и приобрел тот вид в котором мы его видим и сейчас.
Ну, а компания Voxware, убедившись, что и без нее дела идут неплохо, решительно пустилась в самостоятельное плавание. Используя собственные новаторские идеи, а так же некоторые фрагменты технологии TwinVQ, приобретя на эту разработку определенные права, Voxware создала собственный формат, который реально воплотился в кодеке под простым названием Voxware Audio CODEC v4.0. Когда были выпущены первые три версии - это науке не известно, ну а этот кодек прославился сразу по нескольким номинациям.
Во-первых, в этом кодеке было впервые достигнуто качество МР3 128 kbs на bitrate всего 64 kbs!
Во-вторых, на этот формат обратили внимание сразу несколько крупных телефонных компаний, так как сжатая этим кодеком голосовая информация обладала, даже при bitrate всего 64 kbs очень высокой четкостью. Профессиональными тестерами было установлено, что при bitrate 64 kbs слоговая разборчивость голоса достигала 90%, в то время, как у других форматов аудиосжатия подобный показатель наблюдается при bitrate в 2-2.5 раза больше, т.е. при bitrate 128 kbs и 160 kbs соответственно. Новый формат Voxware, как оказалось идеально адаптирован именно для сжатия оцифрованного человеческого голоса.
На некоторых высокоскоростных цифровых телефонных сетях США и Канады была апробирована система сжатия голосовой информации имеющая в своей основе аппаратную реализацию разработок Voxware. Данная система позволяла вести по одной линии четыре отдельных разговора одновременно без каких-либо искажений. Как известно цифровой сигнал, в отличие от аналогово, невозможно исказить, его можно только потерять.
И, наконец, поддержка этого кодека была включена компанией Microsoft среди прочих аудиоформатов в бесплатный Media Player. Что бы убедиться в этом, достаточно посмотреть список поддерживаемых форматов - там есть строчка "Voxware Audio CODEC". Если учесть тот факт, что Microsoft до сих пор так и не удосужилась поддержать VQF и все разновидности AAC, то такая поддержка дорогого стоит.
Но помимо этих неоспоримых достоинств кодек обладает так же кучей недостатков, представляя собой недоделанный, сырой продукт. Собственно после выпуска работающей версии кодека пыл Voxware несколько поугас, ведь эта область уже более или менее отработана, а на свете столько всего нового, неоткрытого. В общем, выпуска следующей версии кодека пользователи ждали бы долго, если бы не произошло одно событие...
А это событие заключается в том, что в один прекрасный день руководство фирмы Microsoft (раньше сказал бы Бил Гейтс, но теперь он уже не президент этой компании, а скорее руководитель в тени) вдруг осознало, что множество компаний в мире производит программные кодеки для сжатия звуковой информации. При этом компания Microsoft, которая бьется за звание крупнейшего мирового монополиста еще ничего не сделала в этой области, продолжая использовать в качестве основного звукового формата своих операционных систем несжатую аудиоинформацию в виде WAV файлов. Правда, регулярно выходят новые версии Media Player, в котором постоянно увеличивается список поддерживаемых форматов, но нет ни одного кодека, на котором было бы написано "Сделано компанией Microsoft". Надо что-то срочно делать, но что, если своих разработок нет?
И Microsoft поступила, как она поступала уже не раз, в точности в соответствии своему главному принципу "Зачем изобретать велосипед, если его уже изобрел кто-то другой? Его надо купить!".
Да, своей популярностью операционная система Windows во многом обязана именно тем компонентам, которые были в свое время удачно куплены Microsoft и впоследствии доработаны и разрекламированы.
Достаточно привести всего несколько примеров. В феврале 1995 года компания Microsoft, что называется буквально "на корню" закупила маленькую британскую компанию RenderMorphics и на основе ее революционных разработок в области трехмерной графики под общим названием RealityLabs создала один из своих главнейших программных продуктов, на долгие годы определивший популярность операционной среды Windows 9x в среде геймеров (и не только). Речь идет о DirectX - комплекте программ и библиотек, который является ни много, ни мало, как одним из китов, на котором покоится популярность серии Windows 9x.
Другой опорный кит был куплен Microsoft у творческой группы National Center for Supercomputing Applications или вкратце NCSA. Речь идет о некогда знаменитом интернет браузере Mosaic или вернее NCSA Mosaic. Уже немногие помнят те далекие времена, когда на рынке веббраузеров были всего два представителя Netscape и Mosaic. В ходе маркетинговых баталий Mosaic проиграл битву, но уникальные разработки не пропали, а были куплены Microsoft и после тщательной переработки превращены в продукт, который теперь знают все - Microsoft Internet Explorer. Начиная с 1996 года этот браузер не только бесплатен, но и весьма навязчиво предлагается всем пользователям Windows 9х, являясь неотъемлемой частью этой операционной системы. Это факт послужил причиной вполне законной обиды компании Netscape. Понятно, что конкурировать с бесплатным продуктом невероятно сложно, но дело уже было сделано и никакими судами и дроблениями Microsoft на отдельные компании случившегося уже не поправишь. Стоит отметить, что MSIE честно пишет в пункте about, что он основан на технологиях NCSA Mosaic.
Итак, есть два кита, две поры, но, как известно, такая конструкция неустойчива. И Microsoft решила прикупить третью опору в образе перспективного кодека Voxware Audio CODEC v4.0. Разработка была полностью скуплена и программисты компании приступили к дальнейшей доработке и сопряжению ее с другими частями операционной системы Windows.
К чести Microsoft, стоит отметить, что эта компания не сразу кинулась в погоню за конкурентами заполучив новинку, а предварительно хорошо поработала над этим в общем-то сыроватым кодеком доведя его до ума и лишь потом выпустила в широкие массы. Этот кодек хоть и вышел позднее других, зато обладал гораздо более высокими характеристиками и главное он бесплатен! Похоже Microsoft изобрела наиболее эффективный способ уничтожения конкурентов - делать собственные продукты бесплатными, но с поддержкой только Windows и MSIE.
Новорожденный формат без потуг на оригинальность был назван WMA - Windows Media Audio. Этот формат позиционируется своими создателями как преемник целой плеяде устаревающих аудиоформатов, начиная с Real Audio и заканчивая MPEG Layer III.
Но, похоже, что WMA может сменить не только устаревающие форматы, но и относительно новые. Вот несколько фактов.
Низкобитрейтная версия WMA по качеству ощутимо превосходит Real Audio. Соотношение размер/качество для WMA в 2-3 раза выше, чем аналогичный параметр у RA. Более того, WMA превосходит по качеству относительно новый формат QDesign AIFF! Так, при максимальном для QDesign AIFF bitrate 48 kbs, аудиофайлы WMA имеют гораздо меньше искажений и потерь. Кроме того, формат WMA бесплатен, а QDesign AIFF стоит порядка 20 долларов. Так что, думаю, судьба сетевого радио на ближайшие несколько лет предопределена.
WMA с bitrate 64 kbs лучше MP3 128 kbs или по крайне мере обладает тем же качеством. Кодек позволяет легко перекодировать из MP3 в WMA с любым bitrate. Вот в качестве примера небольшая песня группы "Крематорий" "30 лет", сжатая MP3 кодеком в bitrate 112 kbs (к сожалению больше не нашлось) и она же перекодированная в WMA с bitrate 64 kbs.
30 лет.mp3 112 kbs - 705 Кб
30 лет.wma 64 kbs - 412 Кб
Если кто-то найдет какие-либо отличия напишите мне, так как я вовсе не претендую на какой-то исключительный слух, являясь рядовым меломаном, но по моему звучит одинаково. Кстати, обратите внимание на размер, композиция уменьшилась ощутимо, не правда ли? Что же касается сравнения с наиболее качественными конкурентами МР3, то на основании прослушивания и тестов можно сделать вывод о схожести звучания WMA с Liquid Pro AAC и VQF. Так начиная с bitrate 96 kbs и выше, WMA и LQT звучат примерно одинаково, но на более низких bitrate лидирует WMA.
Вообще количество поддерживаемых bitrate в кодеке WMA - это нечто! Поддерживаются bitrate от 6 kbs до 96.1 kbs на канал. Помимо этого, кодек содержит своего рода конструктор для пользователей, в котором можно собрать собственный bitrate - произвольно задать количество kbs, задать частоту выборки (по умолчанию 44 КГц) в диапазоне от 22 КГц до 48 КГц и даже изменить алгоритм сжатия (по умолчанию Windows Media Encoder v. х.х).
Отдельного упоминания заслуживает скорость кодирования. Ее можно охарактеризовать одним словом - быстро. Чуть медленнее РАС, но гораздо быстрее VQF, AAC, не говоря уже об QDesign AIFF.
Последние версии кодеков WMA и WMV реализованы в очередном бесплатном программном продукте от Microsoft Windows Media Encoder v. 7, который вышел совсем недавно - в августе 2000 года.
Windows Media Encoder v.7 позволяет кодировать и аудио- и видеофайлы. При кодировании видеоинформации ее аудио и видео части сжимаются разными кодеками, отсюда, что вполне логично, вытекает уникальная особенность Windows Media Encoder, которая заключается в возможности записи саундтрека видеофильма в звуковой файл WMA. Поддерживаются форматы WMV, AVI, MPEG-1 и MPEG-2.
Работа с Windows Media Encoder v.7 оформлена, как это теперь модно, в виде визардов (wizard - волшебник, помощник, интерфейс, позволяющий легко, шаг за шагом выполнять некоторые наиболее часто повторяющиеся действия, облегчая работу пользователям без опыта работы с данной программой).
Вот пример рядового, обычного кодирования с помощью визарда от Windows Media Encoder v.7.
Шаг 1. Визард предлагает создать новую сессию либо открыть уже существующую. Причем создавать сессию можно либо под надзором визарда - первый пункт, либо самостоятельно - соответственно второй. Выберем первый пункт.
Шаг 2. Первый пункт в этом меню, касается получения исходного файла из сети, что для нас с нашими плохими телефонными линиями не актуально, второй пункт посвящен получению исходной информации с какого-либо устройства - микрофон, видеокамера или прямо с экрана (для видеофайлов). А вот третий пункт именно то что нам надо - конвертация аудио- или видеофайлов в Windows Media формат. Его и выбираем.
Шаг 3. Выбираем файл, который будем конвертировать. И нажимаем далее.
Шаг 4. В этом меню предлагают выбрать качество кодирования аудио- и видеофайлов из уже готовых пресетов - заранее сделанных установок. Если вы хотите создать собственный пресет или, как его здесь называют, профиль, то нажимайте на кнопку "Create and Menage Profiles...".
Шаг 5. В этом меню создаются или редактируются профили. Нажав кнопку "New..." можно создать свой собственный профиль, обозвать его как угодно, выбрать bitrate, кодек, частоту выборки, количество каналов (стерео, моно). Соответственно кнопка "Edit" позволяет изменить любые настройки. После создания и выбора нового профиля переходим в следующее меню.
Шаг 6. В этом меню вводится информация об авторе и названии песни, комментарии и рейтинг.
После подтверждения попадаем на финальный этап - кодирование.
Шаг 7. Финальный. Без комментариев...
Звуковые файлы сжатые Windows Media Encoder с bitrate 64 kbs обладают очень небольшим размером, а сам процесс происходит очень быстро. Так, при кодировании песни группы Nirvana "Smells Like а Teen Spirit" (которую я выбрал в качестве примера не только по той причине, что это одна из моих любимых песен, но еще и потому, что ее продолжительность составляет ровно пять минут), было затрачено всего 1 минута 12 секунд на процессоре Intel Celeron 333. При этом размер аудиокомпозиции составил 2,6 Мб, для сравнения, размер этой же композиции в формате МР3 128kbs составляет 5,8 Мб.
Формат WMA один из немногих, кто поддерживает нормальную перемотку, то есть переход на любое место композиции происходит мгновенно, ничем не отличаясь от аналогичного перехода для МР3.
В общем, преимущества очевидны...
Из недостатков можно назвать: заполнение пауз в аудиокомпозициях посторонними шумами и одноплатформенность WMA - только для пользователей Windows. Можно так же посетовать и на то, что качество WMA 96 kbs несколько ниже MP3 256 kbs, но это уже из разряда "Ну вы и зажрались, сударь!".
Взять кодеки WMA можно по следующим адресам:
www.microsoft.com/windows/windowsmedia/tools/odproducer.asp - один из наиболее ранних версий кодека, сейчас, после выхода Windows Media Encoder v. 7 представляет несколько антикварный интерес.
http://fileforum.efront.com/download.php3?fid=966493674 - Windows Media Encoder v. 7 о котором собственно и шла речь, самый совершенный кодек WMA на текущий момент.
Проиграть WMA можно любым не очень старым Media Player, который входит в состав Direct Show, но лучше всего использовать Media Player версии 7. Эта программа совершенно не похожа на предшественниц и обладает рядом очень полезных особенностей. В частности, в Media Player 7 есть встроенная система true-bass, существенно улучшающая звучание низких частот и придающая композиции глубину, есть многополосный графический эквалайзер, плагины визуализации и даже скины, позволяющие совершенно изменить облик программы, чего в предыдущих версиях отродясь не было. Программа совершенно бесплатна и ее можно загрузить по адресу www.microsoft.com/windows/mediaplayer/download/.
И напоследок несколько слов о перспективах WMA. Аналитики довольно известной компании International Data Corp., которая занимается в основном прогнозами состояния рынка компьютерных технологий, позволили себе высказать мнение о том, что WMA на данный момент является единственной серьезной альтернативой сверхпопулярному MP3. Кроме того, зная феноменальную способность Microsoft к навязыванию собственных стандартов окружающему миру, думаю, за судьбу этого формата можно не беспокоиться. Кстати о навязывании стандартов, появились уже первые жертвы - компания Liquid Audio, известная своей разработкой Liquid Pro AAC, заключила сделку с Microsoft. Теперь во все программные продукты Liquid будет включаться поддержка WMA, а огромная аудиотека в формате LQT будет продублирована в WMA. "Это позволит исполнителям донести свою музыку до миллионов пользователей плееров Microsoft, база распространения которых огромна" - считает шеф Liquid Audio Джери Кирби (Gerry Kearby). Нельзя не порадоваться оптимизму шефа компании, но на практике подобное соглашение означает смерть формата LQT, так как WMA, не хуже и при этом кодеки от Microsoft бесплатны, а Liquid Pro AAC стоит денег.
В общем WMA вскоре придет на смену МР3, тем более что уже появились первые аппаратные плееры с поддержкой этого формата. Правда подобный переход светит только пользователям операционной системы Windows, поклонникам других платформ, например Linux, придется искать альтернативы WMA. И похоже что такая альтернатива появилась - встречайте...