Изобретение относится к области обработки сигналов изображения и может быть использовано при обработке и архивации больших массивов видеоданных. Например, при создании больших архивов графических баз данных, при реализации процедуры быстрого просмотра, в том числе, энциклопедий на CD-ROM, а также при просмотре и обработке больших объемов поступающей единовременно и в высоком темпе информации.
Известно техническое решение по патенту США N 5157488, H 04 N 7/13, 1994 u. "Способ адаптивного квантования в последовательном JPEG-режиме", заключающийся в том, что при адаптивном квантовании при передаче сжатых видеоданных передают блоки данных, которые представляют составляющие изображения, формируют таблицу квантования для каждой составляющей изображения. Для части таблиц квантования составляющих изображения определяют общий коэффициент пересчета и передают сигналы измерения последовательных блоков видеоданных путем передачи общего коэффициента пересчета как следующей составляющей вместе с составляющими изображения и, таким образом, выполняют адаптивное квантование видеоданных.
Недостатком описанного способа адаптивного квантования видеоданных является наличие границ групп данных в восстановленном изображении при коэффициенте сжатия > 10.
Известен способ сжатия видеосигнала в цифровой форме в телевизионных каналах (патент Российской Федерации N 2017347 H O 4 N 7/13, 1994 г), заключающийся в том, что в передаваемом видеоканале задерживают на время передачи 1 элемент изображения, вычитают из прямого видеосигнала задержанный видеосигнал в каждом пятом элементе изображения в полном коде кодированный сигнал является опорным сигналом, формируют сигнал межэлементной разности одновременно с формированием опорного сигнала и сигнала межэлементной разности, формируют сигнал межстрочной разности путем задержки прямого видеосигнала на время одной строчки и вычитают из прямого сигнала межэлементной разности в сокращенном коде в каждом пятом элементе, формируют сигнал мелких деталей изображения путем суммирования сигналов межстрочной и межэлементной разностей, сигнал мелких деталей передают поочередно с опорным сигналом в полном коде, суммируют в нечетных строках опорные сигналы с сигналами межэлементной разности, а в четных строках суммируют опорные сигналы нечетных строк с сигналами межстрочной разности, восстановленные опорные сигналы суммируют в четных строках с сигналами межэлементной разности.
Однако сжатие изображения по указанному методу с хорошим качеством достигается только для простых изображений и требует больших аппаратных затрат, кроме того, не сохраняется топологическая структура исходного изображения.
Изобретение решает задачу создания эффективного способа сжатия изображения на основе классического метода адаптивного квантования векторов с сохранением топологии исходного изображения.
Наиболее близким аналогом заявленного технологического решения является устройство кодирования и декодирования с использованием векторного квантования по патенту США N 5010401 H O 4 N 7/13, 1991 г.
Преобразование сигнала изображения по указанному патенту производится следующим образом. Сигнал разбивается на блоки по к отсчетов в каждом (к - целое положительное), формируются блоки межкадровой разности, которые кодируются и запоминаются, формируют библиотеку эталонов путем адаптации сжатию конкретных блоков изображения, код блока изображения определяет адрес блока в библиотеке эталонов, при восстановлении считывают этот блок в буферную память с последующим формированием восстановленного изображения.
Классический метод адаптивного квантования векторов базируется на предварительном построении кодовых таблиц (кодовых библиотек эталонов) на основе процесса обучения (адаптации) сжатию конкретных блоков изображения.
При этом используемые библиотеки не сохраняют топологию кодируемых данных, что приводит к большим ошибкам при кодировании в условиях воздействия помех. Предлагаемый способ сжатия изображения сохраняет указанную топологию благодаря оптимизации процесса обучения и протекания следующим образом.
Исходное изображение разбивается на блоки пикселов определенного размера, каждый из которых интерпретируется как вектор в n-мерном пространстве. Методом адаптивной кластеризации разделяют данное пространство на m кластеров таким образом, чтобы плотности расположения кластеров соответствовала плотность распределения вероятности векторов в указанном векторном пространстве.
Перед началом адаптивной кластеризации назначают центры указанных m кластеров и некоторым упорядоченным образом размещаются в этом векторном пространстве.
Осуществляют выборки обучающих данных (n-мерных векторов), т.е. всех блоков пикселов кодируемого изображения. На основании анализа указанных выборок производится адаптация положения этих центров к статистическим свойствам кодируемых данных. При этом для каждого из векторов определяется отклонение от центров упомянутых кластеров по критерию минимума эвклидова расстояния. Для каждого из кластеров новое положение центра вычисляется как среднее по всем попавшимся в кластер векторам.
В результате выполнения процедуры обучения блоки в кодовой таблице оказываются упорядоченными по всем визуальным характеристикам. Поэтому при выполнении операции кодирования (замене блоков изображения номерами из кодовой библиотеке) общий вид изображения, т.е. его топология сохраняется.
В процессе кодирования путем определения наименьшего эвклидова расстояния между текущим вектором и эталонным каждому кодируемому блоку пикселов ставится в соответствии "ближайший к нему" эталонный вектор из таблицы кодирования.
По передачи по каналу связи или архивации сжатое изображение может быть декодировано. При этом значение каждого пиксела декодируемого изображения является адресом входа в таблицу декодирования, в которой хранятся соответствующие значения эталонных векторов, номер эталонного вектора заменяется при декодировании блоком 4х4 пиксела. Другой важной отличительной особенностью предлагаемого способа является то, что в соответствии с выбором опорных точек изображения значения опорных точек пересчитывается в значения эталонных векторов. В соответствии с выбранными опорными точками осуществляется декомпрессия на экран именно выбранного участка изображения, т.е. реализуется прямой доступ к любому фрагменту изображения. Это позволяет значительно сократить время на считывание изображения и вывод его на экран.
Поскольку сжатое изображение внешне похоже на исходное, это позволяет осуществлять при работе с видеоданными некоторые предварительные операции, в частности, может быть произведена предварительная привязка изображения к заранее известному эталону. При этом значительно сокращается время процедуры привязки.
Таким образом, предлагаемый метод имеет следующие отличительные особенности. При подготовке кодовых библиотек блоки в них оказываются упорядоченными по своим визуальным характеристикам, поэтому малые погрешности в выборе блоков в процессе кодирования или передачи не приводят к существенным потерям в качестве восстановленного изображения, обеспечивая таким образом повышенную помехозащищенность метода. Кроме того, вследствие упорядоченности блоков в библиотеке после сжатия сохраняется топологическая структура исходного изображения. То есть, массив сжатого изображения при интерпретации кодов блоков, как значений яркости, выглядит внешне похожим на исходное изображение (естественно, что при этом теряется пространственное разрешение исходного изображения пропорционально используемому коэффициенту компрессии). Указанная особенность позволяет получить дополнительные преимущества при практическом применении рассматриваемого метода сжатия изображений:
1. Прямой доступ к сжатым изображениям.
В этом случае для обеспечения более оперативного предварительного анализа изображения пользователь может просматривать сжатое изображение непосредственно без декомпрессии, производить предварительный анализ изображения. После выбора требуемого участка осуществляется декомпрессия на экран (или в память) именно данного участка изображения. То есть реализуется прямой доступ к любому фрагменту изображения. Это позволяет значительно сократить время на считывание изображения из памяти компьютера (так как считывается сжатое во много раз, а не полное изображение), сэкономить время вывода изображения на экран (так как при просмотре выводится сжатое изображение меньшее по объему, чем исходное).
2. Обработка сжатого изображения.
Поскольку сжатое изображение внешне похоже на исходное, это позволяет осуществлять при работе с видеоданными некоторые предварительные операции. В частности, может быть произведена предварительная автоматическая привязка изображения по опорным ориентирам (заранее заданным фрагментам изображения). При этом значительное сокращается время выполнения процедуры привязки (пропорционально коэффициенту компрессии), в то время как ее точность снижается менее значительно (пропорционально корню квадратному из этой величины). В результате совмещения изображения с эталоном и выделения реперных (опорных) точек требуемый фрагмент изображения может быть декомпрессирован для более внимательного просмотра и более точной привязки, если это необходимо.
Работа со сжатыми изображениями может найти свое основное применение в военных приложениях при создании больших архивных графических баз данных (при реализации процедуры быстрого просмотра), при просмотре и обработке больших объемов поступающей единовременно и в высоком темпе видеоинформации, например, аэрокосмической.
Изобретение относится к области цифровой обработки сигналов изображения и может быть использовано при передаче видеоданных по узкополосным каналам связи и реализации быстрого просмотра больших архивных баз данных. Способ использует метод адаптивного квантования векторов. Сохранение топологии сжатию изображения достигается тем, что для каждого из векторов определяется минимальное эвклидово расстояние по отношению к эталонному. Декомпрессия осуществляется в соотношении с выбранными опорными точками изображения.
US, патент 5010401, кл | |||
Очаг для массовой варки пищи, выпечки хлеба и кипячения воды | 1921 |
|
SU4A1 |
Даты
1998-03-20—Публикация
1996-06-18—Подача