Изобретение относится к области вычислительной техники и может быть использовано в цифровых телевизионных и фотосистемах, глобальных систем позиционирования и наблюдения.
Упрощенная математическая модель изображения представляет собой двумерный дискретный сигнал
Оценивание истинных значений пикселей изображений в той или иной степени необходимо в большинстве задач цифровой обработки изображений. Особенно данная проблема актуальна при автоматической обработке изображений, полученных в светочувствительных матрицах в цифровых фото- и видеокамерах, и системах машинного зрения. Методы восстановления двумерных сигналов находят свое применение в задачах обработки архивных документов в виде изображений, имеющих различные искажения (например: царапины, пятна, пыль, не нужные надписи, линии сгиба). В видеосигналах встречаются статические изображения, которые мешают просмотру, закрывая часть полезной информации от зрителя. К таким изображениям относятся различные логотипы каналов, дата и время или субтитры, которые были наложены на видеосигнал с дальнейшим кодированием. Также отдельным классом областей, мешающим просмотру видео, являются искаженные блоки при работе видеокодека, появление которых объясняется ненадежностью среды передачи данных от кодера к декодеру. В настоящее время существуют различные методы цифровой обработки, направленные на решение задач восстановления частично утерянных участков изображения, но для их эффективного использования необходимы значительные объемы априорной информации о полезном изображении. Значительные ограничения на объем априорной информации, что имеет место на практике, существенно усложняют как выбор эффективного метода обработки, так и его значений оптимальных параметров.
Упрощенно способы реконструкции значений пикселей изображений можно разделить на следующие группы:
1) Способы на основе решения дифференциальных уравнений.
2) Способы на основе ортогональных преобразований.
3) Способы на основе синтеза текстур.
4) Способы на основе нейронной сети.
Анализ существующих способов обработки показывает, что область их использования, в условиях ограниченного объема информации о составляющих обрабатываемого процесса крайне ограничена. Использование способов реконструкции значений пикселей изображений на основе решения дифференциальных уравнений в частных производных приводит к размытию резких перепадов яркостей и контуров и требует априорную информацию для выбора параметров способов и минимизации функционала. Неспособность восстанавливать текстуру изображений и изогнутые контуры ограничивает область использования данных способов, которые в основном применимы при удалении царапин и небольших дефектов на структуре изображений. Для использования способов на основе ортогональных преобразований требуется априорная информация для выбора порогового значения, ортогонального базиса и размера блоков спектрального представления. Так же следует отметить, что данные способы приводят к размытию текстуры и структуры при восстановлении больших областей с потерянными пикселями, а большое количество итераций приводит к значительным вычислительным затратам. Применение способов на основе синтеза текстур требует априорной информации о размере и формы области восстановления и геометрических свойствах изображения для выбора параметров способов.
Известно цифровое сглаживающее устройство с предварительным обнаружением и устранением аномальных измерений [Патент № 2010325, МПК G 06 F 15/353, опубл. 06.02.1991]. Данное устройство содержит первый сумматор, счетчик отсчетов, первый и второй дешифраторы, первый и второй элемент И, элемент ИЛИ, триггер, блок задания коэффициента деления, первый регистр и второй сумматор, второй регистр, третий дешифратор, счетчик аномальных измерений, блок выделения модуля, схема сравнения, третий элемент и генератор тактовых импульсов.
Недостатками известного устройства являются:
- процедура обнаружения не эффективна в случае обработки групповых аномальных значений;
- необходимо априорное знание допустимого значения строба
Известен способ восстановления изображений на основе решения дифференциальных уравнений в частных производных [Bertalmio M., Sapiro G., Caselles V., Ballester C. Image inpainting // Computer Graphics Proceedings, K. Akeley, Ed. ACM Press / ACM SIGGRAPH / Addison Wesley Longman, 2000. - P. 417-424.]. Данный способ позволяет соединять контуры постоянной яркости изображений поперек области восстановления с помощью решения дифференциальных уравнений в частных производных, минимизируя выбранный функционал. Направление линий задается с помощью граничных условий на краю области восстановления, которые определяются с помощью выражения:
Дифференциальное уравнение в частных производных имеет решение при условии:
Данное выражение определяет направление продолжение линий с помощью сглаживающего оператора
где
Граничные условия для восстановления изображения состоят в том, чтобы соответствовать интенсивности значений яркости изображения на границе области восстановления, а также направлению линий контуров.
Недостатками известного способа и устройства, его реализующего являются:
- сглаживание резких яркостных переходов изображений, что значительно ухудшает визуальное качество восстановленного изображения.
Известен нелинейный способ на основе адаптивного разряженного представления сигналов через нелинейные принципы приближения [Guleryuz O.G. Nonlinear approximation based image recovery using adaptive sparse reconstructions and iterated denoising //Part I: theory IEEE transactions on image processing, 2006. - V.15. - No. 3.]. Адаптивно определяется набор индексов спектральных коэффициентов, который предсказывает отсутствующую область изображения. Ортогональное преобразование для изображения запишется в виде:
где
При этом можно записать, что G=[
При этом
Тогда условие (2) запишется в виде:
Решение определяется итерационно и имеет вид:
где
В качестве нулевой итерации используется заполнение области
Недостатками известного способа и устройства, его реализующего, являются:
- априорная информация для выбора параметров способа, например, количество уровней, на которые разбивается область с потерянными пикселями, фактор перекрытия уровней разложения, размер блоков спектрального представления и пороговый уровень для определения значимых коэффициентов;
- восстановление значений пикселей происходит равнозначно для всех сторон области восстановления, что иногда приводит к тому, что структура изображения с контурами и перепадами яркости восстанавливается некорректно в центре области;
- использование данного способа приводит к размытию текстуры и структуры при восстановлении больших областей с потерянными пикселями, а количество итераций может достигать порядка 500, что приводит к значительным вычислительным затратам.
Известен способ восстановления изображений на основе заполнения похожими областями и устройство его реализующее (Image region filling by exemplar-based inpainting) [Патент USA № 11/095,138, №10/453,404]. Устройство содержит: блок хранения изображения, блок хранения пикселей, блок создания словаря, блок хранения словаря, блок обработки, блок вычисления приоритета, блок поиска подобия, блок заполнения изображения.
На первом шаге вычисляется приоритет
где
Вначале предполагается, что значение данных доверия
Вычисление приоритета с помощью выражения (3) позволяет придать больший вес пикселям, находящимся на перепадах яркости (границах), таким образом, восстанавливая их в первую очередь. Учет данных доверия
На втором шаге находится блок
Значения пикселей из найденного блока копируются в области
Недостатками известного устройства являются:
- видимость границ на восстановленном изображении между найденными похожими блоками;
- неправильное восстановление при отсутствии похожего блока;
- зависимость эффективности восстановления от выбора размера блока.
Известно устройство обработки двумерных сигналов при реконструкции изображений [Патент № 2440614, МПК G 06 F 17/17, опубл. 20.01.2012]. Устройство содержит блок хранения изображения, блок хранения пикселей, блок создания словаря, блок хранения словаря, блок поиска подобия, блок обработки, блок вычисления приоритета, блок определения адаптивной формы, блок усреднения пикселей, блок заполнения изображения.
Рассматриваемое устройство предполагает:
1) записываются значения входного изображения
2) определяется значение коэффициента доверия
3) вычисляется значение приоритета
4) определяется пиксель
5) для пикселя
6) вычисляется евклидова метрика для всех доступных значений пикселей изображения
7) количество блоков подобия
где:
8) значения пикселей в области
9) коэффициент доверия
Недостатками известного устройства являются:
- неправильное восстановление при отсутствии похожего блока;
- зависимость эффективности восстановления от структуры изображения.
Наиболее близким к изобретению является устройство для восстановления изображений с поиском похожих блоков на основе нейронной сети [Патент № 2730215 МПК G06F 17/17, опубл. 2020.08.20]. Рассматриваемое устройство - прототип предполагает:
1) записываются значения входного изображения
2) определяется значение коэффициента доверия
3) вычисляется значение приоритета
4) определяется пиксель
5) для пикселя
6) вычисляется евклидова метрика для всех доступных значений пикселей изображения
7) количество блоков подобия
где:
8) значения пикселей в области
9) коэффициент доверия
Устройство для восстановления изображений с поиском похожих блоков на основе нейронной сети содержит блок хранения изображения, блок хранения пикселей, блок создания словаря, блок хранения словаря, блок обработки, блок вычисления приоритета, блок определения адаптивной формы, блок поиска подобия, блок оценки пикселей с помощью нейронной сети, блок заполнения изображения.
Недостатками известного устройства-прототипа являются:
- неправильное восстановление при отсутствии похожего блока;
- зависимость эффективности восстановления от структуры изображения;
- уменьшение эффективности восстановления для изображений с сложной текстурой, которые не описываются обычным градиентом на основе меж пиксельной разности;
- не возможность одновременной обработки всех цветовых каналов изображений с сохранением межканальной корреляции.
Причины, препятствующие достижению требуемого технического результата, заключаются в следующем:
- отсутствие похожего блока приводит к не правильному восстановлению;
- при вычислении градиента не учитывается направление и форма анизотропной области;
- при восстановлении цветного изображения все цветовые каналы обрабатываются не зависимо.
Техническим результатом является уменьшение погрешности восстановления цветных изображений за счет использования представления изображения в пространстве гиперкомплексных чисел, анизотропного градиента и нейронной сети.
Достигается технический результат за счет того, что устройство восстановления изображений в пространстве кватернионов с использованием анизотропного градиента и нейронной сети содержит блок хранения изображения в пространстве RGB, блок преобразования изображения в пространство кватернионов, блок хранения изображения в пространстве кватернионов, блок хранения пикселей, блок создания словаря, блок хранения словаря, блок поиска подобия, блок обработки, блок вычисления анизотропного градиента, блок вычисления приоритета, блок определения адаптивной формы, блок поиска подобия, блок оценки пикселей с помощью нейронной сети, блок заполнения изображения, блок преобразования изображения в пространство RGB
На Фиг. 1 представлена упрощенная математическая модель изображения.
На Фиг. 2 представлен выбор направления при расчете градиента.
На Фиг. 3 изображено построение ортогональных векторов.
На Фиг. 4 представлен адаптивный выбор формы области для поиска подобия.
На Фиг. 5 представлен поиск похожих блоков.
На Фиг. 6 представлена структура нейронной сети.
На Фиг. 7 представлен оригинальный блок
На Фиг. 8 представлена схема обучения нейронной сети.
На Фиг. 9 представлена блок-схема устройства восстановления изображений в пространстве кватернионов с использованием анизотропного градиента и нейронной сети.
Устройство восстановления изображений в пространстве кватернионов с использованием анизотропного градиента и нейронной сети содержит блок хранения изображения в пространстве RGB
Устройство реализуют следующий алгоритм.
На первом этапе компоненты цветного изображения преобразются в пространство кватернионов Q. Цветные изображения типа RGB хранят три цвета в каждом пикселе (красный, зеленый и синий). Для задач сегментации изображение обычно преобразуется в оттенки серого, что приводит к потере важной информации о цвете, насыщенности и другой важной информации, связанной с цветом. Компоненты цветного изображения могут быть представлены как кватернион Q. Обычно он описывается с помощью формы, где основная алгебраическая форма для кватерниона q ∈
Q = q0 + q1i + q2j+ q3k,
где q0, q1, q2, q3 ∈
На втором этапе для каждого пикселя границы
Предлагается новый подход к вычислению анизотропного градиента, который заключается в том, что для каждого из 8 направлений внутри адаптивной области (фиг. 2) вычисляется меж пиксельная разность:
для направления 1 -
для направления 2 -
для направления 3 -
для направления 4 -
для направления 5 -
для направления 6 -
для направления 7 -
для направления 8 -
где
Для получения результирующего анизотропного градиента все частные направленные градиенты усредняются.
На третьем шаге вычисляется значение приоритета
где:
Вначале предполагается, что значение коэффициента доверия
Вычисление приоритета позволяет придавать больший вес пикселям, которые находятся на перепадах яркости (границах), таким образом, восстанавливая их в первую очередь. Учет коэффициента доверия
Далее, для пикселя
Для формирования адаптивных областей двумерного сигнала для пикселя
Например, сумма числа инверсий для направления 5 равна:
где
Количество сочетаний, для которых вычисляется сумма инверсий, составляет:
Первая альтернатива (убывающий сигнал) принимается, если
Правило для принятия второй альтернативы (возрастающий сигнал) имеет вид
где α - значение ошибки первого рода.
Гипотеза о стационарности сигнала принимается, если
По полученным границам интервалов для каждого из восьми секторов, образованных направлениями 1-2, 2-3, 3-4, 5-6, 7-8, 8-1 происходит формирование областей квазистационарности. Для этого используется линейная интерполяция границ смежных интервалов уравнением прямой проходящей через две точки:
где
Значения пикселей, попавшие между всеми направлениями и интерполирующими прямыми, проходящими через границы интервалов квазистационарности, объединяются в одну область
Для пикселя границы смежного с пикселем
Определяется пиксель
На пятом шаге, находятся блоки
при этом
Количество блоков подобия
где:
Значения пикселей в области
Коэффициент доверия
На следующем шаге изображение преобразуется из пространства кватерниона Q в пространство RGB.
В данном устройстве используется нейронная сеть прямого распространения сигнала для формирования наиболее похожего блока, обученная с помощью алгоритма обратного распространения ошибки (фиг. 6). В качестве функции активации, используется сигмоидальная нелинейная функция (sigmoidal nonlinearity), а именно функция гиперболического тангенса:
где
На этапе обучения нейронной сети на вход подавались заранее подготовленные данные: на изображении выделялся блок со случайными координатами, размером
Далее процедура повторялась на тридцати пяти изображениях и было получено сто тысяч блоков, они использовались как обучающая последовательность для данной сети.
Данная сеть содержит три слоя: первый слой содержит двадцать нейронов, второй слой содержит так же двадцать нейронов, третий слой содержит десять нейронов. В сети создано десять входов, на пять из них подавались только центральные пиксели в найденных блоках, а на пять других входов подавались MSE этих блоков (фиг. 8). В качестве выхода использовались центральные пиксели оригинальных блоков.
Устройство восстановления изображений в пространстве кватернионов с использованием анизотропного градиента и нейронной сети работает следующим образом.
На вход блока хранения изображения в пространстве RGB 1 поступает изображение с потерянными пикселями. Далее изображение переводится в пространство кватернионов в блоке преобразования изображения в пространство кватернионов 2 и сохраняется в блоке хранения изображения в пространстве кватернионов 3. Доступные пиксели сохраняются в блоке хранения пикселей 4, далее они поступают на вход блока создания словаря 5. Результат формирования словаря сохраняется в блоке хранения словаря 6, полученные двумерные матрицы используются далее для восстановления изображения. Матрицы создаются путем формирования квадратных блоков размером 9*9 пикселей из исходного изображения путем смещения блока по всем доступным пикселям изображения. В блоке обработки 7 происходит формирование граничных пикселей вокруг области с потерянными пикселями из блока хранения изображения в пространстве кватернионов 3. Информация о граничных пикселях поступает на вход блока вычисления приоритета 8, в котором вычисляется приоритет для всех граничных пикселей, который состоит из двух множителей: коэффициент доверия и коэффициент градиента; градиент вычисляется в блоке вычисления анизотропного градиента 10. В блоке вычисления приоритета 8 осуществляется ранжировка приоритета и определение граничного пикселя с максимальным значением приоритета. В блоке определения адаптивной формы 9 вокруг пикселя с максимальным значением приоритета формируется адаптивная область близких по яркости пикселей с помощью способа инверсий. Адаптивная область поступает на вход блока поиска подобия 11, в котором осуществляется вычисление евклидовой метрики со всеми двумерными матрицам, которые хранятся в блоке хранения словаря 6. В блоке поиска подобия 11 так же определяется количество похожих блоков, для которых евклидова метрика не превосходит порогового значения. Данные блоки поступают на вход блока оценки пикселей с помощью нейронной сети 12, в котором происходит формирование усредненной оценки с помощью предварительно обученной нейронной сети. Полученная оценка поступает в блок заполнения изображения 13, который копирует значения пикселей смежных к пикселю с максимальным приоритетом из усредненной оценки в блок хранения изображения в пространстве кватернионов 3 на соответственные координаты. Далее процесс вычисления приоритета с поиском похожих блоков и последующей заменой повторяется до тех пор, пока не будут восстановлены все значения в блоке хранения изображения в пространстве кватернионов 3. Восстановленное изображение переводится из пространства кватернионов в пространство RGB в блоке преобразования изображения в пространство RGB 14.
название | год | авторы | номер документа |
---|---|---|---|
Устройство для восстановления карты глубины с поиском похожих блоков на основе нейронной сети | 2019 |
|
RU2716311C1 |
Устройство сжатия изображений на основе метода реконструкции пикселей | 2020 |
|
RU2750416C1 |
УСТРОЙСТВО ДЛЯ ВОССТАНОВЛЕНИЯ ИЗОБРАЖЕНИЙ | 2011 |
|
RU2450342C1 |
УСТРОЙСТВО ВОССТАНОВЛЕНИЯ ДВУМЕРНЫХ СИГНАЛОВ НА ОСНОВЕ РЕКОНСТРУКЦИИ ИСКАЖЕННЫХ ПИКСЕЛЕЙ ИЗОБРАЖЕНИЙ | 2014 |
|
RU2582554C1 |
УСТРОЙСТВО ОБРАБОТКИ ДВУМЕРНЫХ СИГНАЛОВ ПРИ РЕКОНСТРУКЦИИ ИЗОБРАЖЕНИЙ | 2010 |
|
RU2440614C1 |
УСТРОЙСТВО ВОССТАНОВЛЕНИЯ ИСКАЖЕННЫХ ЗНАЧЕНИЙ ПИКСЕЛЕЙ ИЗОБРАЖЕНИЙ | 2014 |
|
RU2580456C1 |
Устройство восстановления папиллярных узоров оптечатка пальца | 2019 |
|
RU2718426C1 |
Устройство для реконструкции изображений на основе хэш-функций | 2017 |
|
RU2661534C1 |
Устройство для удаления логотипов и субтитров с видеопоследовательностей | 2017 |
|
RU2669470C1 |
УСТРОЙСТВО РЕДАКТИРОВАНИЯ ВИДЕОПОСЛЕДОВАТЕЛЬНОСТЕЙ | 2014 |
|
RU2572377C1 |
Изобретение относится к вычислительной технике. Технический результат заключается в уменьшении погрешности восстановления цветных изображений за счет использования представления изображения в пространстве гиперкомплексных чисел, анизотропного градиента и нейронной сети. Устройство восстановления изображений в пространстве кватернионов с использованием анизотропного градиента и нейронной сети включает блок хранения изображения в пространстве RGB, блок преобразования изображения в пространство кватернионов, блок хранения изображения в пространстве кватернионов, блок хранения пикселей, блок создания словаря, блок хранения словаря, блок поиска подобия, блок обработки, блок вычисления анизотропного градиента, блок вычисления приоритета, блок определения адаптивной формы, блок поиска подобия, блок оценки пикселей с помощью нейронной сети, блок заполнения изображения, блок преобразования изображения в пространство RGB. 9 ил.
Устройство восстановления изображений в пространстве кватернионов с использованием анизотропного градиента и нейронной сети, включающее блок хранения изображения в пространстве кватернионов, второй выход которого подключен к входу блока хранения пикселей, выход которого подключен к входу блока создания словаря, выход которого подключен к входу блока хранения словаря, выход которого подключен ко второму входу блока поиска подобия; третий выход блока хранения изображения в пространстве кватернионов подключен к входу блока обработки, выход которого подключен к первому входу блока вычисления приоритета, выход которого подключен к входу блока определения адаптивной формы, первый выход которого подключен к первому входу блока поиска подобия, выход которого подключен к входу блока оценки пикселей с помощью нейронной сети, выход которого подключен к входу блока заполнения изображения, выход которого подключен ко второму входу блока хранения изображения в пространстве кватернионов, отличающееся тем, что устройство дополнительно содержит блок хранения изображения в пространстве RGB, вход которого является информационным входом устройства, выход которого подключен к входу блока преобразования изображения в пространство кватернионов, выход которого подключен к первому входу блока хранения изображения в пространстве кватернионов, первый выход которого подключен к входу блока преобразования изображения в пространство RGB, выход которого является информационным выходом устройства; второй выход блока определения адаптивной формы подключен к входу блока вычисления анизотропного градиента, выход которого подключен ко второму входу блока вычисления приоритета; причем блок хранения изображения в пространстве RGB принимает изображение с потерянными пикселями; блок обработки формирует граничные пиксели вокруг области с потерянными пикселями из блока хранения изображения в пространстве кватернионов; блок вычисления приоритета вычисляет приоритет для всех граничных пикселей, который состоит из двух множителей: коэффициент доверия и коэффициент градиента, а также осуществляет ранжировку приоритета и определение граничного пикселя с максимальным значением приоритета; блок определения адаптивной формы формирует вокруг пикселя с максимальным значением приоритета адаптивную область близких по яркости пикселей с помощью способа инверсий; блок поиска подобия осуществляет вычисление евклидовой метрики со всеми двумерными матрицам, которые хранятся в блоке хранения словаря, а также определяет количество похожих блоков, для которых евклидова метрика не превосходит порогового значения; блок оценки пикселей с помощью нейронной сети формирует усредненную оценку с помощью предварительно обученной нейронной сети; блок заполнения изображения копирует значения пикселей, смежных к пикселю с максимальным приоритетом, из усредненной оценки в блок хранения изображения в пространстве кватернионов на соответственные координаты; блок преобразования изображения в пространство RGB переводит восстановленное изображение из пространства кватернионов в пространство RGB.
V | |||
VORONIN et al | |||
"The quaternion-based anisotropic gradient for the color images", опубл | |||
Насос | 1917 |
|
SU13A1 |
УСТРОЙСТВО ОБРАБОТКИ ДВУМЕРНЫХ СИГНАЛОВ ПРИ РЕКОНСТРУКЦИИ ИЗОБРАЖЕНИЙ | 2010 |
|
RU2440614C1 |
Способ защиты переносных электрических установок от опасностей, связанных с заземлением одной из фаз | 1924 |
|
SU2014A1 |
Устройство для реконструкции изображений на основе хэш-функций | 2017 |
|
RU2661534C1 |
RU |
Авторы
Даты
2021-09-08—Публикация
2020-11-09—Подача