VideoDATA  

Формат Digital Betacam. Специфика формата, основные характеристики

Создание нового формата видеозаписи связано с разработками магнитных лент, лентопротяжных механизмов и способов обработки сигналов. Магнитные ленты толщиной 14 мкм с металлопорошковым покрытием уже обеспечивают довольно хорошее соотношение между стоимостью и качественными показателями. Разработка высокоточных механизмов транспортирования ленты позволяет добиться уменьшения ширины дорожек записи, но надо учитывать, что при этом обостряются проблемы выпадений и взаимозаменяемости записей, столь важные для практической реализации. Поэтому новое решение может быть найдено, прежде всего, по другому направлению, связанному с цифровой обработкой сигналов, сокращением избыточности ТВ-сигнала, а также способами их практической реализации с помощью интегральной полупроводниковой технологии.

Однако переход на новый формат не должен привести к значительным затратам и замене архивов ТВ-программ. В настоящее время в мире используется очень большое число аппаратов Betacam и Betacam SP и накоплено огромное количество записанных в этих форматах телевизионных программ. Поэтому возможность их воспроизведения на аппаратах нового формата является большим достоинством. В первую очередь это обеспечит сохранность существующих и продолжающих расти библиотек и архивов программ. Кроме того, это гарантирует использование видеокамер Betacam SP для съемок в течение их естественного срока службы. Этими соображениями, составляющими сущность эволюции системы Betacam, руководствовалась фирма Sony при разработке нового формата компонентной цифровой видеозаписи для телевизионного вещания под названием Digital Betacam.

Параметр Значение
Видео
Частота дискретизации, МГц Y 13,5
R-Y/B-Y 6,75
Числ отсчетов в строке Y 720
R-Y/B-Y 360
Число строк в поле (625/50) 304
(525/60) 256
Записываемые строки (625/50) 7-310, 320-623
(525/60) 10-265, 273-3
Квантование, бит/отсчет 10
Компрессия 2:1
Звук
Частота дискретизации, кГц 48
Квантование, бит/отсчет 20
Число каналов 4

Параметры кодирования входных сигналов формата Digital Betacam

Параметр Значение
Ширина ленты, мм 12,65
Рабочий стол Металлопорошковый (1550 Э)
Размеры кассет, мм: S 156 х 96 х 25
M -
L 245 х 145 х 25
XL -
Минимальная длина волны, мкм 525/60 0,69
625/50 0,59
Диаметр барабана головок, мм 81,4
Частота вращения барабана, оборотов/с 525/60 89,91
625/50 75
Число строчек/поле 6
Длина строчки, мм -
Ширина строчек, мкм 24
Шаг строчек, мкм 52 (пар)
Азимут -15,269; +15,231
Скорость транспортирования ленты, мм/с 96,7 режим Digital Betacam
101 режим Betacam
Продольные дорожки Дорожки временного кода, управления, монтажного звука
Толщина ленты, мкм 14
Время записи на кассеты, мин.: S 40
M -
L 124
XL -

Общие параметры формата Digital Betacam

 

Видеофонограмма

Видеофонограмма формата цифровой компонентной видеозаписи Digital Betacam для стандарта разложения 625/50 показана на рисунке 44. Каждое телевизионное поле записывается на шести наклонных дорожках (рисунок 45). Соседние дорожки записываются с азимутальным разворотом рабочих зазоров видеоголовок приблизительно на 15о. На рисунке 44 показана также структура дорожек формата Betacam SP. Продольные дорожки сигналов временного кода и управления идентичны в двух форматах, монтажная звуковая дорожка в формате Digital Betacam совпадает с дорожкой второго звукового канала в Betacam SP. В формате Digital Betacam записывается четыре цифровых канала звука, причем звуковые секторы расположены в середине наклонных дорожек, что обеспечивает лучшую защиту звуковых данных от возможных дефектов, связанных с краевыми повреждениями ленты и неполным совмещением траектории головок воспроизведения со строчками записи из-за растяжения ленты. Формат допускает также увеличение в будущем числа записываемых звуковых каналов.

Видеофонограмма Digital Betacam и Betacam SP для стандарта разложения 625/50

Видеофонограмма Digital Betacam и Betacam SP для стандарта разложения 625/50

Дорожки, записываемые двумя противоположно расположенными на барабане головками (A и C), содержат также блоки пилот-сигналов. Они используются для обеспечения точного совмещения траектории головок со строчками записи при воспроизведении и монтаже в режиме вставки. В цифровой видеозаписи не нужны такие широкие дорожки, как в аналоговой, но более плотная упаковка строчек требует либо усложнения и повышения точности работы лентопротяжного механизма, либо применения систем автотрекинга. Фирма Sony пошла по пути разработки новой системы трекинга с пилот-сигналом, что позволило снизить стоимость и упростить обслуживание механизма. Низкочастотный пилот-сигнал Fl записывается на частоте приблизительно 400 кГц, а высокочастотный Fh - на частоте приблизительно 4 МГц. При монтаже в режиме вставки блоки пилот-сигналов не стираются и образуют опорные точки для работы системы трекинга. Благодаря этому не накапливаются ошибки рассовмещения при вставках в одном и том же месте. При обычном воспроизведении (без монтажа) используется только низкочастотный пилот-сигнал, необходимый для обеспечения быстрого входа в синхронизм системы регулирования.

Структура видеофонограммы одного поля

Структура видеофонограммы одного поля

 

Лента, головки, барабан

В аппаратах Digital Betacam используется лента с металлопорошковым покрытием, подобная той, которая применяется в Betacam SP. Однако параметры ленты согласованы с спектральными характеристиками канального кода. Принятые меры по улучшению воздушной смазки и скольжения ленты уменьшили потери в области верхних частот в сравнении с Betacam SP и обеспечили большее число воспроизведений цифровой записи и большее число повторных записей на ленте. Это один из факторов, способствующих уменьшению расходов на эксплуатацию Digital Betacam в сравнении с аналоговыми аппаратами.

При линейной скорости транспортирования ленты, равной 96,7 мм/с, (это даже меньше, чем в Betacam SP), время записи достигает 124 минут (табл. 8), что более чем достаточно для большинства приложений. Такое время обеспечено, конечно, благодаря сокращению скорости записываемого потока. Этого результата удалось добиться при сравнительно невысокой частоте вращения барабана (75 Гц, что в два раза меньше, чем в формате D-1) и всего четырех записывающих головках. Преимущества такого решения - малые габариты и сниженный акустический шум, что очень важно для использования видеомагнитофона в составе видеокамеры.

Помимо четырех головок записи (REC A, REC B, REC C, REC D), на барабане Digital Betacam (рис.46) находятся также четыре головки опережающего воспроизведения с динамическим трекингом (ADV), четыре головки сквозного воспроизведения (CONFI) и две головки стирания (ERASE), то есть всего четырнадцать головок (число головок должно было бы достичь двадцати шести, если бы не использовалась компрессия и требуемый цифровой поток записывался бы не двумя, а сразу четырьмя головками).

Для обеспечения необходимой скорости "головка-лента" при угле охвата около 180o был выбран диаметр барабана 81,4 мм (в Betacam SP - 74,5 мм). Вращающейся является средняя часть барабана, верхняя и нижняя части - неподвижны. Такая конструкция позволила добиться более равномерного скольжения ленты и высокой стабильности снимаемого с ленты сигнала.

Барабан видеоголовки Digital Betacam

Барабан видеоголовки Digital Betacam

То, что число головок на барабане в Digital Betacam сравнительно невелико, позволило создать аппарат, совместимый в режиме воспроизведения с записями на кассетах Betacam SP. На барабане видеоголовок совместимых аппаратов (рис.46) установлены четыре дополнительных головки с динамическим трекингом (C-A, Y-A, C-B, Y-B) и с полностью независимыми электронными схемами воспроизведения яркостного сигнала (Y) и сжатых цветоразностных сигналов (C). Это сделано для того, чтобы не ухудшать качества ни аналогового, ни цифрового воспроизведения. После автоматического определения типа вставленной кассеты в совместимом аппарате Digital Betacam происходит установка необходимых параметров систем регулирования: частоты вращения барабана, ведущего вала и натяжения ленты. Так как диаметры барабанов в аппаратах Digital Betacam и Betacam SP несколько отличаются (81,4 мм и 74,49 мм соответственно), то воспроизводимые видео и звуковые сигналы аналоговой записи подвергаются сжатию во времени. Компенсирующее расширение видеосигнала осуществляется в корректоре временных искажений, частотно-модулированные колебания звуковых каналов претерпевают временную трансформацию (расширение во времени) в специально разработанном экспандере.

Экспертиза показала, что качество воспроизведения ТВ-программ в формате Betacam SP на совместимом аппарате Digital Betacam субъективно не хуже, чем при использовании обычного аналогового видеомагнитофона Betacam SP.

Принципы кодирования

Параметры кодирования в системе записи Digital Betacam (табл. 7) соответствуют Рекомендации 601. В канале видеосигнала используется 10-разрядное квантование при частоте дискретизации яркостной составляющей - 13,5 МГц, а цветоразностных - 6,75 МГц. В четырех звуковых каналах при частоте дискретизации 48 кГц квантование выполняется при 20 битах на отсчет.

В канале видеосигнала используется компрессия. Кодирование с целью сокращения избыточности телевизионного сигнала и уменьшения скорости цифрового потока построено по схеме с дискретным косинусным преобразованием. При этом последовательно выполняются следующие три операции: собственно дискретное косинусное преобразование (ДКП), квантование, кодирование словами переменной длины (энтропийное кодирование).

Применение дискретного косинусного преобразования к массиву (блоку) отсчетов изображения является средством декорреляции и приводит к концентрации энергии в области постоянной составляющей и низкочастотных компонентов изображения. Размеры блока выбираются на основе компромисса между степенью декорреляции, сложностью практической реализации и заметностью артефактов при возникновении неисправленных ошибок. В Digital Betacam блок образован прямоугольной матрицей из восьми элементов по горизонтали и четырех по вертикали. Квантование позволяет еще больше сократить объем данных путем деления коэффициентов дискретного косинусного преобразования на числа, установленные на основе модели зрительного восприятия (известно, что зрительное восприятие менее чувствительно к искажениям квантования высокочастотных компонентов изображения). В результате квантования (в системе видеокомпрессии) сокращается число уровней квантования для высокочастотных компонентов видеосигнала, что и является способом уменьшения потока данных. Блок квантованных коэффициентов сканируется в определенном порядке, начиная с постоянной составляющей. Полученные последовательности подвергаются энтропийному кодированию, то есть кодируются словами переменной длины, причем эта длина определяется распределением вероятности, основанным на оценках большого числа типичных изображений. Частовстречающиеся последовательности кодируются словами малой длины, длинные кодовые слова соответствуют редко встречающимся последовательностям. Энтропийное кодирование также уменьшает объем данных, необходимых для описания изображения.

Коэффициент компрессии, равный 2:1, является сравнительно небольшим (общая скорость цифрового потока записываемых данных для стандарта 625/50 равна 125,6 Мбит/с). Производится лишь минимальное сокращение избыточности, которое, тем не менее, обеспечивает формату ряд важных преимуществ: большее время записи, лучшую взаимозаменяемость записей, меньшие эксплуатационные расходы. Сокращается только пространственная избыточность ТВ-сигнала, обусловленная сильными (для типичных изображений) корреляционными связями в пределах телевизионного поля. Это исключает появление заметных артефактов при записи динамичных изображений, упрощает осуществление замедленного и ускоренного воспроизведений, снимает ограничения на выбор монтажных точек.

Применение компрессии на базе косинусного преобразования и кодирования с переменной длиной слова вступает в некоторое противоречие со структурой видеофонограммы и требованием постоянства скорости записываемого потока данных. Блок косинусного преобразования, взятый с участка изображения с маломеняющейся яркостью, может быть передан с помощью сравнительно небольшого количества данных, описывающих постоянную составляющую яркости и несколько низкочастотных коэффициентов косинусного преобразования. А для описания блока, содержащего мелкие детали, потребуется большее количество данных, включающих высокочастотные коэффициенты. Поэтому необходимо управлять потоком данных так, чтобы поддерживать его скорость на некотором фиксированном среднем уровне. Например, надо добиваться, чтобы кадр телевизионного изображения всегда был записан на шести строчках видеофонограммы в виде пакетов данных фиксированного объема независимо от наличия или отсутствия мелких и высоко-частотных деталей. Управление скоростью потока данных достигается в процессе квантования. Если, например, кадр телевизионного изображения содержит большое количество мелких деталей и его не удается представить в виде пакета данных заданного объема, квантование делается более грубым (число уровней квантования должно быть уменьшено для большинства высокочастотных компонентов). Более грубое квантование сопряжено с появлением артефактов компрессии, но, с другой стороны, эти артефакты менее заметны на таком изображении благодаря свойствам зрения. Для кадров с малым количеством мелких деталей число значимых высокочастотных компонентов в блоках косинусного преобразования сокращается, но число уровней квантования для оставшихся низкочастотных компонентов делается большим и кадр упаковывается в блок данных того же фиксированного объема.

Важным является выбор размера блока входных данных системы видеокомпрессии, который будет упакован в пакет фиксированного объема (в описании формата Digital Betacam такой блок назван энтропийным). Энтропийный блок должен быть большим для достижения высокой эффективности кодирования и снижения заметности артефактов компрессии. Но для обеспечения работы видеомагнитофона в специальных режимах (например, для просмотра при ускоренном воспроизведении) длина энтропийного блока должна быть малой. В качестве компромисса выбрана величина энтропийного блока, равная 20 блокам дискретного косинусного преобразования, в каждом из которых по 32 отсчета яркостного или цветоразностных компонентов изображения.

В результате компрессии энтропийный блок должен быть сжат до двух синхроблоков (рис.47), содержащих по 162 байта записываемых видеоданных. Это достигается следующим образом: на вход системы компрессии подается 20 блоков косинусного преобразования, причем в квантователе сначала используется задаваемая по умолчанию исходная таблица квантования, определяющая интервал квантования для каждой пространственной частоты в блоке косинусного преобразования. Затем находится длина упакованного блока на выходе системы компрессии (после энтропийного кодирования). Если длина упакованного блока превышает заданную длину полезной нагрузки двух синхроблоков, то есть 324 байта, то в таблицу квантования вносится поправка, увеличивающая интервалы квантования косинусных коэффициентов, и снова находится длина упакованного блока на выходе системы компрессии. Процесс обычно завершается за 6-7 этапов.

Структура синхроблока

Структура синхроблока

В системе кодирования, обнаруживающего и исправляющего ошибки в канале записи-воспроизведения, используется код Рида-Соломона и для внешнего и для внутреннего кодов. Принцип обнаружения и исправления ошибок в магнитофонах формата Digital Betacam такой же, как и аппаратах формата D-1, но параметры системы обладают более высокой степенью защиты от ошибок. К 162 байтам видеоданных и 2 байтам слова-опознавания добавляются 14 проверочных байтов внутреннего кода. Это позволяет исправлять в каждом слове внутреннего кода до семи ошибок. Внутренний код может обнаружить в кодовом слове до четырнадцати ошибок, которые затем могут быть исправлены с помощью внешнего кодирования. Кодовое слово внешнего кода длиной 126 байтов включает в себя 12 байтов проверочных данных, что позволяет исправлять до двенадцати ошибочных строк матрицы при использовании информации об ошибках, обнаруженных с помощью внутреннего кода. Матрица кода-произведения объемом 22680 байтов (126 синхроблоков), составляющая одну двенадцатую часть телевизионного поля, дополняется преамбулой и постамбулой и записывается в одном видеосекторе программной дорожки (рис. 48).

Даже при мощном кодировании возможны случаи, когда длинные пакетные ошибки, возникшие, например, из-за выпадений или отказа головки, не могут быть исправлены. Поэтому в магнитофоне формата Digital Betacam используется перемешивание данных. Блоки размером 8 на 4 пиксела, сформированные для выполнения дискретного косинусного преобразования, перераспределяются в пределах телевизионного поля. Используется также маскирование обнаруженных, но не исправленных ошибок. Уменьшение скорости цифрового потока в принципе сужает возможности маскирования ошибочных отсчетов в изображении. Однако сравнительно небольшая степень сокращения пространственной избыточности в сочетании с соответствующим распределением данных между головками позволяет осуществлять эффективную пространственную и временную интерполяции даже в случае отказа одной головки.

Система кодирования формата Digital Betacam

Система кодирования формата Digital Betacam

При обработке звуковых и видеоданных используется общее внутреннее кодирование , но внешнее кодирование в звуковом канале является более мощным. Это обусловлено тем, что возможности маскирования ошибок в сигнале звука более ограничены, чем в видеосигнале. К 9 байтам звуковых данных добавляется 9 проверочных байтов внешнего кода, что позволяет исправлять до девяти ошибочных строк матрицы, то есть до половины общего количества записываемых на ленту данных. В каждом канале звука на шести строчках одного телевизионного поля записываются две матрицы кода-произведения объемом в 18 синхроблоков, то есть в одном звуковом секторе программной дорожки находится 6 синхроблоков. При обработке звуковых данных также используется перемешивание. Звуковые данные каждого канала накапливаются в буферной памяти, объем которой равен двум вертикальным столбцам матрицы кода-произведения, и затем перемешиваются на интервале времени, определяемом размерами этой памяти. После внешнего кодирования звуковые данные еще раз перемешиваются на интервале одного телевизионного поля (на этот раз перемешиваются синхроблоки).

В качестве канального кода в магнитофонах формата Digital Betacam использован усовершенствованный код, до тех пор не применявшийся в промышленных аппаратах из-за сложности технической реализации, - это скремблированный код без возвращения к нулю (БВНМ) в сочетании с парциальным кодированием класса IV. При воспроизведении используется процедура декодирования Витерби. Спектральная характеристика кода имеет явно выраженный полосовой характер и хорошо соответствует частотной характеристике канала магнитной записи-воспроизведения. Такой код обеспечивает повышение отношения сигнал/шум и лучшее подавление азимутальных помех от соседних дорожек благодаря очень низкому уровню низкочастотных компонентов.

Теория методов кодирования, примененных в аппаратах Digital Betacam, давно и хорошо разработана. Однако их практическое воплощение в реальном масштабе времени (при частотах порядка 100 МГц) стало возможным лишь с использованием субмикронной полупроводниковой технологии. Это дало возможность разместить на одной плате, встроенной в корпус лентопротяжного механизма, все устройства обработки сигнала в каналах записи и воспроизведения. Найденные решения в области обработки сигналов и сокращения избыточности в сочетании с достижениями полупроводниковой технологии позволили фирме Sony создать не только студийный видеомагнитофон Digital Betacam с размерами и энергопотреблением, близкими таким же параметрам аналоговых аппаратов Betacam SP, но и цифровую компонентную видеокамеру, что, несомненно, ускорило продвижение к полностью цифровому производству телевизионных программ.

На главную