Изобретение относится к области цифровой обработки изображений и может быть использовано в системах мониторинга и сопровождения объектов различного происхождения с периодической пространственной структурой, в том числе, с искусственно нанесенной; в устройствах обнаружения движущихся мигающих источников света, в устройствах автоматического считывания графической информации, в код-ридерах и др.
К обобщенной области использования изобретения относится такая сфера компьютерного зрения, как обнаружение и локализации фрагментов изображения со специфическими визуальными свойствами. В качестве отличительной особенности объекта предлагаемого изобретения зафиксирована высокая пространственная частота колебаний интенсивности (яркости). Такая особенность характеризует многие искусственные объекты человеческой деятельности: предупреждающие разметки на автотрассах, привлекающие внимание билборды, наконец, двумерные графические коды (штрих-коды, DataMatrix, QR-коды), маркирующие изделия различного назначения. Последние являются примером не столько средств привлечения внимания, сколько удобного способа записи и передачи информации. Роль такого способа доставки информации до заинтересованных потребителей будет только возрастать. Например, полезная или чрезвычайно важная информация в виде чередующихся геометрических фигур может быть записана на специальных щитах или стенах зданий и т.д. После автоматического считывания эта информация, например, городская информация, может озвучиваться для индивидуального или группового потребления, либо подразумевать определенную реакцию беспилотных экипажей в том или ином месте.
Известен способ обнаружения выделяющихся (заметных, колоритных) объектов [Международный Пат. WO 2008/154314, опубл. 06.06.2007], в котором для обнаружения заметных объектов на изображении используется набор локальных, региональных и глобальных особенностей, включающих в себя многомасштабный контраст, гистограмму и пространственное распределение цвета.
Недостаток данного способа заключается в вычислительной сложности процедуры анализа особенностей изображения.
Известен способ сепарации объектов переднего плана и фона [Патент США US 8,593,542 B2, опубл. 25.12.2008], в котором используются два изображения одной и той же сцены. Первое изображение регистрируется с фокусировкой на объектах переднего плана и высоким разрешением, второе изображение захватывается с фокусировкой на заднем плане при низком разрешении. При обработке оба изображения приводятся к одинаковому разрешению либо путем субдискретизации изображения с хорошим разрешением, либо путем повышения степени дискретизации изображения с плохим разрешением. Дальнейшая математическая обработка пары таких изображений позволяет разделить передний план и фон сцены (авансцену).
Недостатком данного способа является необходимость регистрации двух изображений, а также необходимость присутствия интересующего объекта именно на переднем плане сцены, при этом осцилляция интенсивности не является основополагающим признаком выделяемого объекта.
Наиболее близким к заявляемому способу является выбранный в качестве прототипа способ локализации объектов изображений [L. Fang and C. Xie, "1-D Barcode Localization in Complex Background," 2010 International Conference on Computational Intelligence and Software Engineering, Wuhan, China, 2010, pp. 1-3, doi: 10.1109/CISE.2010.5677072], в качестве отличительных особенностей которых выбрана чередующаяся последовательность полос.
Изобретение относится к теории и практике распознавания образов. Для локализации череды полос в способе предложено использовать оператор Собеля, который позволяет вычислить модуль градиента и определить его направление в каждом пикселе изображения. К каждому пикселю (x, y) применяются четыре оператора Собеля, представляющие направления 0°, 45°, 90° и 135°, и максимальное из четырех значений используется в качестве градиента пикселя (x, y). Затем градиентное изображение преобразовывается в бинарное.
Недостаток данного способа заключается в том, что его применение в общем случае, особенно в случае широких (в масштабах обрабатываемого изображения) полос и промежутков между ними, не приводит к отчетливому выделению нужной области. Это связано с тем, что градиент функции по своему физическому смыслу указывает направление максимального возрастания/убывания функции и количественно характеризует крутизну функции в каждой точке (на разных участках). Поэтому градиент не совсем походит для обнаружения сильно осциллирующих двумерных функций, которыми являются фрагменты изображений в нашем случае.
Технический результат, на достижение которого направлено заявляемое изобретение, состоит в обеспечении простого и надежного выделения фрагментов изображений, характеризующихся высокочастотными колебаниями интенсивности.
Для достижения указанного технического результата предлагается способ обнаружения фрагментов изображений, специфические визуальные свойства которых характеризуются высокочастотными колебаниями интенсивности, основанный на преобразовании исходного изображения в бинарное, при этом в качестве количественного индикатора осцилляций интенсивности на различных участках бинарного изображения используется двумерная функция, определяющая суммарное количество скачков интенсивности “черный-белый” и “белый-черный” вдоль декартовых осей координат в окрестности каждого пиксела бинарного изображения, последовательно нормализованная в градациях серого цвета на однобайтовый диапазон интенсивностей от 0 до 255 и трансформированная в бинарное изображение, белые области на черном фоне которого покрывают места расположений фрагментов с пространственными высокочастотными колебаниями интенсивности.
Краткое описание чертежей
Сопроводительные чертежи иллюстрируют принцип нахождения функции осцилляций, количественно характеризующей уровень осцилляций интенсивности в окрестности каждого пиксела изображения, и результаты обнаружения осциллирующих фрагментов изображений (примеры применения изобретения). На чертежах:
фиг.1 - пример вычисления функции осцилляций: (a) модель фрагмента бинарного изображения в окне размером 7 х 7 с центральным пикселем (x, y), (б) индикатор ix(x, y) скачков интенсивности вдоль оси 0х в каждом пикселе того же окна, (в) индикатор iу(x, y) скачков интенсивности вдоль оси 0y в каждом пикселе того же окна;
фиг.2 - обнаружение фрагментов с высокочастотными колебаниями интенсивности: (а) исходное бинарное изображение, (б) двумерная функция осцилляций исходного изображения в оттенках серого, (в) бинаризованная функция осцилляций;
фиг.3 - обнаружение осциллирующх фрагментов изображений: (а) исходное изображение в оттенках серого, (b) бинаризованное исходное изображение, (c) функция осцилляций бинарного изображения, (d) бинарный образ функции осцилляций;
фиг. 4 – обнаружение QR-кодов: (а) исходное изображение, (б) функция осцилляций (негатив), (в) бинаризованная функция осцилляций (негатив).
Предлагаемый способ обнаружения фрагментов изображений с высокочастотными колебаниями интенсивности включает в себя выполнение следующих действий.
1. Трансформация исходного изображения в бинарное. Поскольку здесь не стоит задача акцентирования внимания на мелких деталях изображений, то выбор падает на пороговые методы бинаризации. В пороговых методах пикселы изображения подразделяются на фоновые и объектные по отношению к некоторому порогу интенсивности. Порог может быть глобальным, вычисляемым по различным характеристикам изображений (средняя интенсивность, гистограмма интенсивностей и т.д.) [Otsu N. A Threshold Selection Method from Gray-Level Histograms. IEEE Trans. Sys. Man. Cyber. 1979; 9(1); 62-66.], или локальным, в каждом пикселе величина которого определяется по интенсивности пикселей окружения [Koleda P, Hrčková M. Global and Local Thresholding Techniques for Sawdust Analysis. Acta Facultatis Technicae 2018;XXIII(1); 33-42.].
2. Вычисление двумерной функции осцилляций v (x, y) бинарного изображения, определяющей суммарное количество скачков интенсивности в окрестности каждого пиксела (x, y). За окрестность каждого пиксела принимается квадратное окно размером k x k с центром в текущем пикселе (x, y). Причем допустима оценка v(x, y) в двух нормах: v(x, y) = max(px, py) или v(x, y) = (px + py)/2. Для быстрого вычисления двух функций px(x, y) и pу(x, y) могут быть использованы интегралы предварительно сформированных изображений ix(x, y) и iу(x, y). Каждый пиксел этих изображений занимает 1 бит информации, т.е. может принимать значение 0 или 1 в зависимости от того, наблюдается ли относительный скачок интенсивности у соседей справа или слева, тогда ix(x, y)=1, иначе ix(x, y)=0; либо относительный скачок интенсивности у соседей сверху или снизу, тогда iy(x, y)=1, иначе iy(x, y)=0.
На фиг. 1 представлен пример определения функции осцилляций v(x, y) в окне размером k x k = 7x 7 для бинарного изображения с вертикальными полосками. Анализ представленного изображения на рисунка позволяет подсчитать количество скачков интенсивности: px(x, y)=46 и py(x, y)=2 на битовых плоскостях ix(x, y) и iу(x, y) и определить величину функции осцилляций в пикселе (x, y): v(x, y) = max(px, py)=46.
3. Нормализация двумерной функции осцилляций на однобайтовый масштаб 0-255, где 0 – соответствует минимуму функции, а 256 – ее максимуму.
4. Пороговая бинаризация нормализованной двумерной функции осцилляций. Поскольку функция осцилляций имеет максимумы в области наличия колебаний интенсивности, то в итоге бинаризации эти области отобразятся белыми сплошными белыми пятнами определенной формы на черном фоне, покрывающими области осцилляций интенсивности.
Предлагаемый к регистрации способ был испытан на базе 100 изображений с разрешениями 320×240, 640×480, 1280×1024, содержащих фрагменты с осциллирующей интенсивностью, и показал близкое к 100% обнаружение таких фрагментов и выделение их областей расположения.
На фиг. 2 представлен пример выделения фрагментов изображений с рассматриваемыми визуальными свойствами сплошными белыми областями. При этом можно отметить, что от сплошных одноцветных фигур на исходном изображении после обработки остаются лишь их контуры.
На фиг. 3 представлен пример надежного выделения участков колебаний интенсивности (в представленном случае фронтальных звеньев забора) из сложного фона изображения неравномерно освещенной лесной поляны с забором.
На фиг. 4 показан пример обнаружения и выделения QR-кодов, нанесенных на разные грани куба.
Таким образом, предлагаемый способ компьютерного обнаружения объектов позволяет за счет вычисления функции, определяющей количество осцилляций интенсивности в окрестностях каждого пиксела, с высоким уровнем надежности выделить область расположения фрагментов с высокочастотной осцилляцией интенсивности.
Предлагаемый способ компьютерного обнаружения объектов легко реализуем при использовании стандартных алгоритмов обработки изображений.
Проведенный заявителем анализ уровня техники, включающий поиск по патентным и научно-техническим источникам информации и выявление источников, содержащих сведения об аналогах изобретения, позволил установить, что заявитель не обнаружил аналогов, характеризующихся признаками, тождественными (идентичными) всем существенным признакам заявляемого изобретения.
название | год | авторы | номер документа |
---|---|---|---|
УСТРОЙСТВО ОБРАБОТКИ ВИДЕОИНФОРМАЦИИ СИСТЕМЫ ОХРАННОЙ СИГНАЛИЗАЦИИ | 2009 |
|
RU2484531C2 |
СПОСОБ И СИСТЕМА ОПРЕДЕЛЕНИЯ ПРИГОДНОСТИ ИЗОБРАЖЕНИЯ ДОКУМЕНТА ДЛЯ ОПТИЧЕСКОГО РАСПОЗНАВАНИЯ СИМВОЛОВ И ДРУГИХ ОПЕРАЦИЙ ПО ОБРАБОТКЕ ИЗОБРАЖЕНИЙ | 2016 |
|
RU2608239C1 |
СПОСОБ И СИСТЕМА ЭФФЕКТИВНОЙ ПОДГОТОВКИ СОДЕРЖАЩИХ ТЕКСТ ИЗОБРАЖЕНИЙ К ОПТИЧЕСКОМУ РАСПОЗНАВАНИЮ СИМВОЛОВ | 2016 |
|
RU2636097C1 |
АВТОМАТИЗИРОВАННЫЕ СПОСОБЫ И СИСТЕМЫ ВЫЯВЛЕНИЯ НА ИЗОБРАЖЕНИЯХ, СОДЕРЖАЩИХ ДОКУМЕНТЫ, ФРАГМЕНТОВ ИЗОБРАЖЕНИЙ ДЛЯ ОБЛЕГЧЕНИЯ ИЗВЛЕЧЕНИЯ ИНФОРМАЦИИ ИЗ ВЫЯВЛЕННЫХ СОДЕРЖАЩИХ ДОКУМЕНТЫ ФРАГМЕНТОВ ИЗОБРАЖЕНИЙ | 2016 |
|
RU2647670C1 |
СПОСОБ И УСТРОЙСТВО ОБНАРУЖЕНИЯ ДЕФЕКТОВ НА ПОВЕРХНОСТИ ШИН | 2016 |
|
RU2657648C1 |
МЕТОД РАСПОЗНАВАНИЯ ТРЕЩИН В РАЗВЕРТЫВАЕМОМ ИЗОБРАЖЕНИИ КОЛОНКОВОЙ ТРУБЫ БУРОВОГО КЕРНА | 2023 |
|
RU2815488C1 |
Система сопровождения подвижных объектов на видео | 2022 |
|
RU2807953C1 |
СПОСОБ СЕГМЕНТАЦИИ ЦИФРОВОГО ИЗОБРАЖЕНИЯ (ВАРИАНТЫ) | 2013 |
|
RU2555238C1 |
Способ бинаризации изображений символов на банкноте на основе гистограммы длины границ | 2019 |
|
RU2718571C1 |
СПОСОБ ДИАГНОСТИКИ МЕЛАНОМЫ КОЖИ | 2021 |
|
RU2780367C1 |
Изобретение относится к областям цифровой обработки изображений и компьютерного зрения. Технический результат заключается в обеспечении простого и точного выделения фрагментов изображения. Способ обнаружения фрагментов изображений, специфические визуальные свойства которых характеризуются высокочастотными колебаниями интенсивности, основанный на преобразовании исходного изображения в бинарное, при этом в качестве количественного индикатора осцилляций интенсивности на различных участках бинарного изображения используется двумерная функция, определяющая суммарное количество скачков интенсивности “черный-белый” и “белый-черный” вдоль декартовых осей координат в окрестности каждого пиксела бинарного изображения, последовательно нормализованная в градациях серого цвета на однобайтовый диапазон интенсивностей от 0 до 255 и трансформированная в бинарное изображение, белые области на черном фоне которого покрывают места расположений фрагментов с пространственными высокочастотными колебаниями интенсивности. 4 ил.
Способ обнаружения фрагментов изображений, специфические визуальные свойства которых характеризуются высокочастотными колебаниями интенсивности, основанный на преобразовании исходного изображения в бинарное, отличающийся тем, что в качестве количественного индикатора осцилляций интенсивности на различных участках бинарного изображения используется двумерная функция, определяющая суммарное количество скачков интенсивности “черный-белый” и “белый-черный” вдоль декартовых осей координат в окрестности каждого пиксела бинарного изображения, последовательно нормализованная в градациях серого цвета на однобайтовый диапазон интенсивностей от 0 до 255 и трансформированная в бинарное изображение, белые области на черном фоне которого покрывают места расположений фрагментов с пространственными высокочастотными колебаниями интенсивности.
CN 107622280 A, 13.01.2018 | |||
CN 104715476 A, 17.06.2015 | |||
CN 110188763 A, 30.08.2019 | |||
CN 103729848 A, 16.04.2014 | |||
L.FANG et al | |||
Печь для непрерывного получения сернистого натрия | 1921 |
|
SU1A1 |
СПОСОБ СЕГМЕНТАЦИИ ИЗОБРАЖЕНИЙ | 2011 |
|
RU2489752C2 |
СПОСОБ И УСТРОЙСТВО ИДЕНТИФИКАЦИИ ЧАСТЕЙ ФРАГМЕНТИРОВАННОГО МАТЕРИАЛА В ПРЕДЕЛАХ ИЗОБРАЖЕНИЯ | 2016 |
|
RU2694021C1 |
Авторы
Даты
2024-10-31—Публикация
2023-10-24—Подача