Статьи

Статьи / Технология сжатия данных в системах видеонаблюдения высокого и мегапиксельного разрешения

Технология сжатия данных в системах видеонаблюдения высокого и мегапиксельного разрешения

Введение

С началом перехода индустрии безопасности от использования VHS-кассет к использованию жестких дисков для хранения видеоматериалов вопрос о сжатии и хранении видеоданных приобрел первостепенную важность для проектировщиков систем видеонаблюдения. Так как в отрасли на смену аналоговым камерам и цифровым видеорегистраторам (DVR) приходят IP-камеры и сетевые видеорегистраторы (NVR), проблема сжатия и хранения видеоданных снова выходит на передний план. При подключении аналоговых камер к цифровому видеорегистратору сжатие видеоматериалов выполняется регистратором на центральном пункте. В то же время IP-камера самостоятельно выполняет сжатие, а затем передает сжатые видеоданные на сетевой видеорегистратор. При централизованном сжатии на цифровых видеорегистраторах для всех камер в системе видеонаблюдения обычно должна была использоваться одинаковая технология сжатия. С другой стороны, IP-камеры позволяют строить гибридные системы с использованием различных технологий сжатия в одной системе. В результате, для конечных пользователей, системных интеграторов и проектировщиков систем критически важно иметь четкое представление о доступных технологиях сжатия. Зная, в каких случаях следует применять каждую технологию, можно получить оптимальные результаты при проектировании систем.

На рынке представлен широкий спектр технологий сжатия, но четкие стандарты отсутствуют. В то же время различные поставщики могут по-разному реализовывать конкретную технологию. Часто инсталляторы думают только о размерах файлов, дисковом пространстве, и о том, сколько дней будет храниться видео при выбранной конфигурации, игнорируя тот факт, что формат сжатия видеоданных также может влиять на конфигурацию системы видеонаблюдения. Например, технология сжатия видеоданных влияет на выбор аппаратного обеспечения для клиентских рабочих станций, возможность использования тех или иных систем передачи данных, а также оперативность, успешность и эффективность расследований.

Технологии покадрового и межкадрового сжатия

В настоящее время в системах видеонаблюдения используются две обширные группы технологий сжатия: покадровое и межкадровое. Каждая группа технологий включает в себя различные форматы и имеет свои недостатки. Понимание этих различий позволит проектировщику системы выбрать необходимую технологию сжатия, наилучшим образом соответствующую требованиям проекта и целевой производительности.

Покадровое сжатие

Технологии покадрового или внутрикадрового сжатия позволяют сжимать видеоданные посредством применения алгоритма сжатия к каждому кадру, отснятому камерой. Конечным результатом является серия отдельно сжатых изображений.

Сжатие видеоданных с использованием технологии покадрового сжатия имеет ряд преимуществ по сравнению с более сложными технологиями межкадрового сжатия, которые мы обсудим позже. Во-первых, полученный в результате покадрового сжатия видеоматериал является серией отдельно сжатых кадров, не требующих информации о других кадрах, — их можно быстрее сжимать и передавать с камеры, с меньшей задержкой. Во-вторых, так как каждый кадр является доступен независимо и не формируется из нескольких кадров, доступ к видеозаписи можно получить более оперативно. Быстрый доступ повышает эффективность расследований и может повысить криминалистическую значимость видеозаписи. В ситуациях, требующих обеспечения максимального уровня безопасности, предоставление всей видеозаписи как последовательности независимых кадров позволяет исключить сомнения в целостности видеоматериала как убедительного доказательства на основании наличия неполных кадров, созданных в процессе сжатия.
Более подробное описание двух основных технологий покадрового сжатия, используемых в системах видеонаблюдения, представлено далее в разделах JPEG и JPEG2000.

Рис 1. Покадровое сжатие

JPEG

Формат JPEG чаще всего используется для сжатия фотографий в цифровых камерах и в Интернете. Название JPEG является аббревиатурой названия комитета Joint Photographic Experts Group, представившего данный формат в 1992 г. Сжатие данных изображения в формате JPEG основано на алгоритме, называемым дискретным косинусным преобразованием, и осуществляется блоками пикселей размером обычно 8x8 с целью уменьшения размера файла. Это блоковое преобразование обычно приводит к появлению блочных артефактов, подобных показанным на рисунке 2. Эти блочные артефакты иногда могут скрывать детали изображения при сильном сжатии в формате JPEG.

Рис 2. Пример изображения с артефактами сжатия в формате JPEG

JPEG2000

Представленный в 2000 году стандарт JPEG2000 получил широкое распространение в самых различных отраслях. Например, формат JPEG2000 используется в цифровой кинематографии, диагностическом медицинском сканировании, архивировании документов, а также для съемки и передачи изображений со спутников и в других целях.
Формат JPEG2000 предназначен для того, чтобы сохранять как можно больше деталей изображения и доказательств при значительном уменьшении размера файла. Являясь технологией вейвлет-преобразования, формат JPEG2000 позволяет достичь большей степени сжатия с меньшим количеством артефактов на изображении. Сжатые в формате JPEG2000 изображения меньше на 30% по размеру файлов и полосе пропускания по сравнению с изображениями в обычном формате JPEG аналогичного качества. Кроме того, этот формат обладает дополнительными преимуществами для эффективной потоковой передачи и отправки данных.

Два дополнительных преимущества формата JPEG2000 — это возможности передачи широкого динамического диапазона и масштабирования до более высокого разрешения. Динамический диапазон является важным аспектом при видеонаблюдении, так как многие камеры должны вести запись, как в светлых, так и в темных зонах, освещение в которых резко меняется в зависимости от времени дня и года. Способность передачи динамического диапазона выражается в битах. Большинство технологий сжатия обеспечивают передачу 8 бит динамического диапазона, что означает возможность описания 256 различных уровней интенсивности освещения в пределах изображения. Матрицы, используемые в камерах видеонаблюдения, зачастую способны зарегистрировать более 256 уровней интенсивности освещения и передать даже больше данных, чем видит человеческий глаз. Формат JPEG2000 был разработан для сохранения регистрируемых матрицами дополнительных данных в сжатом видеоматериале. Второй ключевой особенностью формата JPEG2000 является использование прогрессивного сжатия, позволяющего эффективно передавать и отображать изображения с очень высоким разрешением. Сведения о преимуществах формата JPEG2000 и о том, как компания Avigilon совместила этот формат с технологией High Definition Stream Management (HDSM) для достижения еще более впечатляющих результатов, представлены в разделе «Влияние сжатия на потоковую сетевую передачу данных».

Межкадровое сжатие

Технологии межкадрового сжатия основаны на сжатии данных в пределах одного кадра и анализе изменений между кадрами. В результате формируется видеопоток со сжатием нескольких кадров, вместо серии отдельных кадров. Обычно при межкадровом сжатии хранятся только инкрементные изменения между кадрами, а целые кадры сохраняются только периодически. Хотя эта технология позволяет эффективнее использовать полосу пропускания, ее применение может привести к потере данных вследствие отсутствия целых кадров. Алгоритмы межкадрового кодирования также часто называют временным кодированием (кодированием во временной области), так как они основаны на распределении данных во времени. Более подробное описание двух основных технологий межкадрового сжатия, используемых в системах видеонаблюдения, представлено далее в разделах «MPEG-4» и «H.264».

Рис 3. Межкадровое сжатие

MPEG-4

Формат MPEG-4 — это общий термин, обозначающий множество различных технологий, определенных организацией Moving Picture Experts Group. В большинстве систем видеонаблюдения применяется вариант формата MPEG-4 Part 2, представленный в 1999 г. Однако существует много других технологий сжатия MPEG-4 мало похожих друг на друга. Для уменьшения размера файла цифрового изображения при сжатии в формате MPEG-4 используется та же базовая технология, что в формате JPEG, но в видеозаписи кодируются кадры различных типов как группы изображений (GOP), а не независимые изображения.
GOP обычно состоит из кадров трех различных типов: I, P и B. Ключевые кадры (I-кадры) — это кодированные полные изображения, аналогичные изображениям в формате JPEG или JPEG2000. Промежуточные кадры (P-кадры) кодируются с учетом предыдущего изображения, которое может быть другим P-кадром или предыдущим I-кадром. Двунаправленные кадры (B-кадры) располагаются между I-кадрами и P-кадрами и содержат информацию об изменениях, вычисленных между предыдущими и последующими кадрами.
Обычно формат MPEG-4 ограничен разрешением VGA и не применяется для камер видеонаблюдения с более высоким разрешением. Аналогично формату JPEG в большинство реализаций формата MPEG-4 в системах видеонаблюдения ограничивает динамический диапазон 8-ю битами. Это приводит к потере данных, если камера может регистрировать более широкий динамический диапазон.

H.264

Формат H.264 — это новейшая технология сжатия, используемая в индустрии безопасности. Формат сжатия H.264 фактически является вариантом стандарта MPEG-4 и обычно называется MPEG-4 Part 10 Advanced Video Coding (AVC). В нем для кодирования видеоизображения используются те же базовые концепции I-, P- и B-кадров, но применяются более передовые алгоритмы. Одним из таких алгоритмов является компенсация движения с помощью векторов движения для сжатия видеоданных до меньшего размера. Сжатие в формате H.264 позволяет вставлять в GOP кадры между I-кадрами для описания относительного движения объектов из опорного кадра, благодаря чему для представления видеоизображения требуется еще меньше данных.
Другой особенностью формата H.264, отсутствующей в стандарте MPEG-4, является возможность применения фильтров блочных артефактов. Такие фильтры могут сглаживать артефакты, возникающие при сильном сжатии. Это позволяет проектировать системы с более высокой степенью сжатия, одновременно сохраняя более высокую детализацию изображений.

Объем потока данных, частота кадров, освещение и активность при межкадровом сжатии

Алгоритмы межкадрового сжатия анализируют изменения видеоизображения и создают поток сжатых данных переменного объема. Изменение объема потока сжатых данных зависит от используемого способа сжатия: с использованием постоянного потока данных (CBR) или переменного потока данных (VBR). Если в системе используется постоянный поток данных, степень сжатия увеличивается в при увеличении активности на изображении. В результате может увеличиться количество артефактов сжатия и снизиться качество изображения. При использовании переменного потока данных объем потока сжатых данных может изменяться для поддержания неизменного качества изображения.

Непостоянство потока сжатых данных ставит перед проектировщиками систем важные задачи. Сети и серверы должны быть рассчитаны на максимальную полосу пропускания. Это позволяет гарантировать, что даже при повышенной активности сеть не будет перегружена. СХД также следует выбирать с особой тщательностью, чтобы при любых обстоятельствах гарантировать хранение видеоматериалов в течение требуемого времени. С другой стороны, технологии покадрового сжатия обеспечивают предсказуемый (постоянный) поток сжатых данных, что позволяет упростить конфигурацию систем.
Частота кадров также оказывает значительное влияние на уровень активности, передаваемый видеозаписью при применении технологии сжатия. Например, камера, регистрирующая 30 кадров/с, может передавать один I-кадр каждые две секунды и формировать остальные 58 кадров на основе изменений изображения. При такой частоте кадров количество изменений между отдельными кадрами может быть очень незначительным, что позволяет существенно сэкономить полосу пропускания, сохраняя только изменения изображения для этих кадров. Однако при уменьшении частоты кадров количество изменений между кадрами может значительно возрасти. При частоте 10 кадров/с между кадрами может быть настолько много инкрементных изменений, что технология межкадрового сжатия будет иметь минимум или вообще не будет иметь преимуществ перед технологией покадрового сжатия.

Освещение в зоне съемки также влияет на способность алгоритмов межкадрового сжатия эффективно сжимать видеоизображение. Зачастую при слабом освещении зоны съемки шумы на изображении могут интерпретироваться алгоритмом сжатия как изменения изображения и вызывать увеличение потока данных. Однако при реализации технологии сжатия производитель камеры может оптимизировать алгоритм обнаружения движения для предотвращения интерпретации шумов при слабом освещении как изменений изображения.

Влияние сжатия на потоковую сетевую передачу данных

Вследствие повышенного разрешения IP-камеры высокого и мегапиксельного разрешения создают собственные уникальные проблемы хранения данных, обеспечения полосы пропускания и эффективного управления видеонаблюдением. Эти задачи можно решить, правильно выбрав технологию сжатия и разрешение камер. В этом разделе мы сравним форматы JPEG2000 и H.264, наиболее распространенные технологии покадрового и межкадрового сжатия, и оценим их сильные и слабые стороны при потоковой передаче в сети.

JPEG2000 и технология High Definition Stream Management

При использовании в системах видеонаблюдения с высоким и мультимегапиксельным разрешением технология JPEG2000 позволяет эффективно и прогрессивно сжимать видеоданные, а также использовать дополнительные функции передачи сжатого видеоматериала и управления им. Для реализации этих ключевых функций компания Avigilon разработала технологию High Definition Stream Management (HDSM), используемую в ПО управления сетевым видеонаблюдением (NVMS) Avigilon Control Center.
Прогрессивное сжатие в формате JPEG2000 преобразует изображение в пакеты, что позволяет передавать и распаковывать часть изображения, без необходимости передачи остальных фрагментов изображения. Это можно представить в виде куба, изображенного на рисунках 4 и 5. Технология HDSM использует эту особенность для передачи и распаковки исключительно фрагментов видеоизображения, которые интересуют пользователя, в то время как все изображение хранится на сервере. Если требуется обзорное изображение с низким разрешением, отправляется только передний слой куба, как показано на рисунке 4. Если требуется более детализированное изображение, отправляются дополнительные слои детализации. Если пользователь увеличивает определенную область для просмотра всех деталей изображения, например номерного знака (см. рисунок 5), технология HDSM отправляет несколько слоев данной области для просмотра.

Рис 4. Детализация при потоковой передаче в формате JPEG 2000

Рис 5. Детализация при потоковой передаче в формате JPEG 2000 с высоким разрешением

Так как технология HDSM обеспечивает динамический доступ к видеоматериалу по слоям с различной детализацией, эта технология также позволяет адаптировать объем передаваемого видеопотока к разрешению используемого монитора. В результате резко сокращается необходимая полоса пропускания между сервером и клиентом по сравнению с другими технологиями сжатия. Например, девять 5-Мпикс камер создают 45 мегапикселей видеоданных, которые предаются с камеры на сервер. Поэтому при просмотре клиентом видеопотока на стандартном мониторе 1080p с общим разрешением 2 мегапикселя, клиенту отправляются только 2 мегапикселя видеоинформации. Это позволяет технологии HDSM в 23 раза сократить необходимую полосу пропускания между сервером и клиентом, одновременно сохранив функции цифрового масштабирования и панорамирования оригинального изображения с полным разрешением. Помимо уменьшения необходимой полосы пропускания для клиента технология HDSM также значительно снижает вычислительную нагрузку на удаленный клиент. Например, клиент получит и распакует 2 мегапикселя данных вместо 45 мегапикселей.

Рис 6. Преимущества технологии HDSM при использовании нескольких камер высокого разрешения стандарта JPEG2000

H.264

Потоковая передача видео, сжатого в формате H.264, возможна только с разрешением сжатого оригинала, и разрешение невозможно прогрессивно адаптировать после сжатия. Это означает, что если видео передается посредством подключения с низкой полосой пропускания, отсутствует возможность динамически адаптировать разрешение как при использовании технологии JPEG2000. Вместо динамической адаптации, камера стандарта H.264 сжимает несколько потоков видео с различными разрешениями и отправляет клиенту поток с минимальным разрешением для мониторинга в реальном времени при низкой полосе пропускания, в то время как видеоизображение с альтернативным разрешением записывается на сетевой видеорегистратор. Эти дополнительные потоки увеличивают поток данных от камеры, но обычно их объем значительно меньше, чем поток с полным разрешением, записываемый на сервер.

Следует помнить о двух недостатках использования технологии многопотоковой передачи H.264 для управления полосой пропускания. Во-первых, когда удаленный клиент получает поток только с минимальным разрешением, изображение на нем можно просматривать в целом, но нельзя увеличить для просмотра деталей. Другой недостаток проявляется при просмотре видеозаписей. Так как серверы управления видеонаблюдением обычно записывают видеопоток с повышенным разрешением, получаемый с камер, недоступен поток с пониженным разрешением для просмотра посредством соединений с низкой полосой пропускания. Если полоса пропускания ограничена, при отсутствии потока с низким разрешением поток с высоким разрешением приходится передавать с пониженной частотой кадров.

Для преодоления этих недостатков технология HDSM от Avigilon предлагает уникальный способ обработки нескольких потоков видеоданных, сжатых в формате H.264. Когда активирована функция многопотоковой передачи для видео в формате H.264, технология HDSM позволяет адаптивно управлять потоками с полным разрешением и низким разрешением, передаваемыми на сетевой видеорегистратор и на клиент для просмотра. Поток с низким разрешением используется для обзорного просмотра, когда не требуется детализация, что позволяет одновременно эффективно просматривать большое количество видеопотоков, сжатых в формате H.264. При увеличении изображения одного потока для детализации поток автоматически передается с полным разрешением, в то время как остальные потоки передаются с низким разрешением в качестве обзорной версии изображения. Это позволяет просматривать детали изображения из одного видеопотока, поддерживая низкий общий объем потоковых данных. Например, при использовании девяти 2-Мпикс камер стандарта H.264 и включенной функции многопотоковой передачи пользователи могут эффективно создавать 9 x 2 мегапикселей данных для потоков с полным разрешением и 9 x 0,3 мегапикселя данных для потоков с низким разрешением. При просмотре на клиенте общий объем данных в 21 мегапиксель сокращается до 4,4 мегапикселя, если поток просматривается в деталях, а восемь потоков просматриваются с низким разрешением.

Рис 7. Преимущества технологии HDSM при использовании нескольких камер высокого разрешения стандарта H.264

В технологии HDSM от Avigilon также реализованы уникальные алгоритмы для сведения к минимуму нагрузки на клиентский компьютер при распаковке видео в формате H.264. HDSM использует передовой вычислительный блок, которым оснащены видеокарты NVIDIA (когда он имеется), для распаковки видео в формате H.264 без использования ресурсов центрального процессора. Эта функция значительно повышает эффективность распаковки и позволяет одновременно выполнять распаковку нескольких потоков видео высокого разрешения с частотой 30 кадров/с без использования ресурсов центрального процессора. Технология HDSM также динамически адаптирует разрешение и алгоритмы распаковки видео в формате H.264 для снижения нагрузки на клиентский компьютер. Кроме того, доступно четырехступенчатое управление качеством отображения, позволяющее вручную оптимизировать просмотр на клиенте. Можно выбрать распаковку видео с низким разрешением и повышенной частотой кадров или распаковку с полным разрешением и пониженной частотой кадров.

Выбор технологии сжатия

Выбор соответствующей камеры для каждой точки системы критически важен для успешного проектировании системы видеонаблюдения. Прежде всего следует учитывать разрешение. Доступны онлайновые инструменты, в том числе калькуляторы разрешения на цели, которые помогают выбрать наиболее подходящую камеру. После определения разрешения важно выбрать технологию сжатия, соответствующую применению. Разрешение, частота кадров, уровень активности и задачи расследований — все эти факторы влияют на выбор технологии сжатия. Если целью конечного пользователя является охват обширной зоны при помощи камеры с разрешением более 2 мегапикселей, тогда технология покадрового сжатия, например JPEG2000, может оказаться единственно правильным выбором. Чем выше разрешение, тем больше преимуществ дают технологии JPEG2000 и HDSM. Для зон на объектах, где требуются IP-камеры с высоким и мультимегапиксельным разрешением, требуется применение технологии сжатия JPEG2000 для эффективного управления данными высокого разрешения. Для меньшего разрешения, а также небольших зон с умеренной активностью и высокой частотой кадров технология межкадрового сжатия, например H.264, позволит свести к минимуму требования к полосе пропускания сети и емкости СХД.





Бренды:

Avigilon

Наверх