Способ распознавания изображений Российский патент 2025 года по МПК G06T7/60 G06V10/22 

Описание патента на изобретение RU2839560C1

Изобретение относится к способам распознавания изображений и может быть использовано в технических средствах распознавания объектов, изображенных на кадрах фото и видеоизображений.

Известен «Способ распознавания радиосигналов» (Патент РФ №2356064, МПК G01S 7/00, опубл.: 20.05.2009, Бюл. №14). В известном способе предварительно задают эталонные радиосигналы (PC). Затем для каждого эталонного PC формируют его матрицу распределения энергии (РЭ). С этой целью эталонные PC дискретизируют, квантуют и затем выполняют операцию фреймового вейвлет-преобразования (ФВП) путем фильтрации их квантованных отсчетов посредством фильтров, полосы пропускания которых каждый раз увеличивают в два раза с возрастанием порядкового номера фильтра. После этого, полученные с выхода каждого из фильтров вейвлет-коэффициенты (ВК) нормируют, ранжируют и исключают малозначимые ВК. В качестве малозначимых выбирают совокупность ВК, начиная от наименьшего, суммарная энергия которых составляет 10-30% от суммарной энергии всей совокупности ВК на выходе каждого из фильтров соответственно. Затем из оставшихся ВК формируют матрицу РЭ, причем строками матрицы РЭ каждого эталонного PC являются ВК, полученные на выходе фильтров. А из матриц РЭ эталонных PC формируют их векторы признаков путем построчной конкатенации всех ВК сформированных матриц РЭ. После этого принимают распознаваемый PC, из квантованных отсчетов которого формируют матрицу РЭ и вектор признаков аналогично, как и для эталонных PC. Идентифицируют принятый PC путем вычитания по модулю его вектора признаков из векторов признаков каждого из эталонных PC. Распознаваемый PC считают инцидентным эталонному PC, разница векторов признаков с которым минимальна.

Недостатком известного способа является то, что он ориентирован на работу с сигналами, имеющими малое число отсчетов, поскольку векторы признаков в известном способе формируют путем построчной конкатенации значений их матриц РЭ, и поэтому они имеют очень большое число элементов, т.е. высокую размерность. А уменьшение размерности векторов признаков, формируемых в соответствии с известным способом путем их усреднения, ведет к снижению достоверности распознавания.

Известен «Способ распознавания радиосигналов» (Патент РФ №2430417, МПК G06K 9/00, опубл.: 27.09.2011, Бюл. №27). В известном способе предварительно задают эталонные PC и формируют для каждого эталонного PC матрицу РЭ, для чего его дискретизируют, квантуют и затем выполняют операцию ФВП последовательности его квантованных отчетов с помощью фильтров, полосы пропускания которых кратны числу два в степени К, где К - целое число. Затем из ВК эталонного PC формируют вектор признаков. Причем для каждого временного отсчета PC из числа соответствующих ему ВК на выходах фильтров выделяют максимальный, на который нормируют остальные ВК, соответствующие данному временному отсчету PC, а в качестве элементов векторов признаков выбирают средние значения мощности ВК, полученные на выходе каждого из фильтров. После чего принимают распознаваемый PC и формируют его вектор признаков аналогично, как для эталонного PC. Затем принятый PC идентифицируют путем последовательного вычитания по модулю элементов его вектора признаков из элементов векторов признаков каждого из эталонных PC. Распознаваемый PC считают инцидентным эталонному PC, разница векторов признаков с которым минимальна.

Недостатком известного способа является то, что в нем в качестве элементов векторов признаков выбирают средние значения мощности ВК, полученные на выходе каждого из фильтров, что ведет к снижению достоверности распознавания.

Известен «Способ распознавания радиосигналов» (Патент РФ №2423735, МПК G06K 9/00, опубл.: 10.07.2011, Бюл. №19). В известном способе предварительно задают эталонные PC, формируют для каждого эталонного PC матрицу РЭ, для чего его дискретизируют, квантуют и выполняют операцию ФВП последовательности его квантованных отчетов с помощью фильтров, полосы пропускания которых кратны числу два в степени K, где K - целое число. После этого ВК ФВП нормируют относительно его максимального значения. Затем ВК эталонного PC, полученные в каждой полосе частот, ранжируют и формируют вектор признаков эталонного PC. Причем в качестве элементов векторов признаков выбирают средние значения мощности ВК, полученные на выходе каждого из фильтров. После чего принимают распознаваемый PC и формируют его вектор признаков аналогично, как и для эталонного PC. Идентифицируют принятый PC путем последовательного вычитания по модулю элементов его вектора признаков из векторов признаков каждого из эталонных PC. Распознаваемый PC считают инцидентным эталонному PC, разница векторов признаков с которым минимальна.

Недостатком известного способа является то, что в нем в качестве элементов векторов признаков выбирают средние значения мощности ВК, полученные на выходе каждого из фильтров, что ведет к снижению достоверности распознавания.

Известен «Способ распознавания радиосигналов» (Патент РФ №2533651, МПК G06K 9/00, опубл.: 20.11.2014 Бюл. №32). В известном способе предварительно задают эталонные PC равной длительности, которые дискретизируют и квантуют, затем выполняют операцию ФВП для последовательности квантованных отчетов каждого эталонного PC и формируют для каждого из них вектор признаков из ВК полученных матриц РЭ, затем принимают распознаваемый PC и формируют его вектор признаков аналогично, как и для эталонного PC, после чего идентифицируют распознаваемый PC путем вычитания по модулю его вектора признаков из вектора признаков каждого из эталонных PC, распознаваемый PC считают инцидентным эталонному PC, разница векторов признаков с которым минимальна. При том, что вектора признаков строят путем построчной конкатенации ВК полученных матриц РЭ, причем ВК в векторах признаков нормируют и ранжируют, а распознаваемый PC предварительно разбивают на фрагменты, длительность каждого из которых совпадает с длительностью эталонных PC, и вычисляют фрагмент средних значений распознаваемого PC, из которого затем формируют вектор признаков для распознаваемого PC.

Недостатком способа-прототипа является то, что он ориентирован на работу с сигналами, имеющими малое число отсчетов, поскольку векторы признаков формируются путем построчной конкатенации значений их матриц РЭ, и поэтому они имеют очень большое число элементов, т.е. высокую размерность. А уменьшение размерности векторов признаков, формируемых в соответствии с известным способом, путем их усреднения, ведет к снижению достоверности распознавания.

Наиболее близким по технической сущности к заявленному способу является «Способ распознавания сигналов» (Патент РФ №2809021, МПК G06F 18/00 (2023.01), G06T 7/60 (2006.01), опубл.: 06.12.2023 Бюл. №34).

В способе-прототипе предварительно задают эталонные сигналы равной длительности, формируют для каждого из них вектор признаков, затем принимают распознаваемый сигнал и формируют его вектор признаков аналогично, как и для эталонного сигнала, после чего идентифицируют распознаваемый сигнал путем сравнения его вектора признаков с векторами признаков каждого из эталонных сигналов, а решение принимают по результатам вычисления разности значений параметров распознаваемого сигнала и эталонных сигналов, распознаваемый сигнал считают инцидентным эталонному сигналу, когда модуль разницы параметров векторов признаков с которым будет минимальным, отличающийся тем, что в качестве эталонных и распознаваемых сигналов используют сигнал, состоящий из элементов, последовательно считываемых из кадра видеоизображения, а вектор признаков формируют из значений гистограмм распределения частости проявления яркости по градациям уровней, в соответствии с разрядностью битов, которые считают параметрами векторов признаков, после чего вычисленную разность значений параметров распознаваемого сигнала и эталонных сигналов усредняют в соответствии с разрядностью вектора признаков

Недостатком способа-прототипа является относительно низкая контрастность признаков распознавания изображений, определяемая величиной разности векторов признаков, характеризующих различные классы распознаваемых изображений.

Задачей изобретения является разработка способа, который позволял бы повысить контрастность формируемых векторов признаков изображений, без увеличения их разрядности.

Техническим результатом является повышение достоверности распознавания объектов, представленных на изображениях.

Технический результат достигается тем, что в способе распознавания изображений предварительно задают эталонные кадры изображений равного размера, формируют для каждого из них вектор признаков, состоящий из значений гистограмм распределения частости проявления яркости по градациям уровней, в соответствии с разрядностью битов, затем для распознаваемого изображения формируют его вектор признаков аналогично, как и для эталонного сигнала, после чего идентифицируют распознаваемое изображение путем сравнения его вектора признаков с векторами признаков каждого из эталонных изображений, а решение принимают по результатам вычисления разности векторов признаков, причем разность векторов усредняют в соответствии с разрядностью вектора признаков, распознаваемое изображение считают инцидентным эталонному изображению, модуль разницы векторов признаков с которым будет минимальным, при этом предварительно из каждой гистограммы распределения, путем ее последовательной корреляции с вейвлетами Хаара, имеющими различные параметры масштаба, формируют трехмерную матрицу амплитудных коэффициентов с координатами сдвига и масштаба, а в качестве элементов векторов признаков выбирают амплитудные коэффициенты трехмерной матрицы, усредненные по координате масштаба.

Таким образом, технический результат достигается за счет использования в качестве элементов векторов признаков, усредненных по координате масштаба амплитудных коэффициентов трехмерной матрицы, полученной путем последовательной корреляции значений гистограмм распределения частости проявления яркости по градациям уровней изображений с вейвлетами Хаара, имеющими различные параметры масштаба.

Заявленный способ поясняется чертежами, на которых показаны:

фиг. 1 - кадр изображения с первым распознаваемым объектом, используемый для формирования первого эталонного изображения;

фиг. 2 - кадр со вторым распознаваемым объектом, используемый для формирования второго эталонного изображения;

фиг. 3 - сформированный вектор признаков для первого эталонного изображения в соответствии со способом-прототипом (гистограмма распределения частости проявления яркости по градациям уровней, в соответствии с разрядностью битов - далее гистограмма);

фиг. 4 - сформированный вектор признаков для второго эталонного изображения в соответствии со способом-прототипом (гистограмма);

фиг. 5 - кадр изображения с распознаваемым объектом;

фиг. 6 - сформированный вектор признаков распознаваемого изображения в соответствии со способом-прототипом (гистограмма);

фиг. 7 - трехмерная матрица амплитудных коэффициентов кадра изображения с первым распознаваемым объектом;

фиг. 8 - вектор признаков изображения с первым распознаваемым объектом, сформированный из амплитудных коэффициентов трехмерной матрицы, усредненных по координате масштаба m;

фиг. 9 - трехмерная матрица амплитудных коэффициентов кадра изображения со вторым распознаваемым объектом;

фиг. 10 - вектор признаков изображения со вторым распознаваемым объектом, сформированный из амплитудных коэффициентов трехмерной матрицы, усредненных по координате масштаба m;

фиг.11 - трехмерная матрица амплитудных коэффициентов кадра распознаваемого изображения;

фиг. 12 - вектор признаков распознаваемого изображения, сформированный из амплитудных коэффициентов трехмерной матрицы, усредненных по координате масштаба m.

Все кадры изображения представлены в одинаковом формате, а все векторы признаков представлены в одинаковом масштабе.

Реализация заявленного способа объясняется следующим образом.

П.1 Задают эталонные изображения одинакового размера. В качестве эталонных изображений выбирают изображения, на которых изображены объекты, подлежащие распознаванию.

В качестве примера, на фиг.1 и фиг.2 показаны кадры видеоизображений, являющиеся эталонными для распознавания изображенных на них объектов. Размеры кадра определяются стандартами изображений, разрешение которых представляется количеством пикселей. Для представленных примеров использованы кадры размером 1280 × 720 пикселей в режиме градации серого. В этом случае каждый пиксель изображения будет содержать значение яркости в диапазоне от 0 (черный) до 255 (белый), на кодирование которой требуется 8 бит.

П.2 Формируют для каждого из эталонных изображений вектор значений гистограмм распределения частости проявления яркости по градациям уровней, в соответствии с разрядностью битов.

В качестве примера, на фиг.3 и фиг.4 показаны гистограммы для первого и второго изображений. Указанные гистограммы выступают в качестве векторов признаков эталонных изображений.

На фиг.3 показан вектор признаков, соответствующий объекту, изображенному на фиг.1, а на фиг.4 показан вектор признаков, соответствующий объекту, изображенному на фиг.2. Для 8 битового потока размерность вектор признаков будет равна 256 значениям.

Порядок формирования гистограмм известен, см. «Способ распознавания сигналов» (Патент РФ №2809021, МПК G06F 18/00 (2023.01), G06T 7/60 (2006.01), опубл.: 06.12.2023, Бюл. №34).

П.3 Из каждой гистограммы распределения, путем ее последовательной корреляции с вейвлетами Хаара, имеющими различные параметры масштаба, формируют трехмерную матрицу амплитудных коэффициентов с координатами сдвига к и масштаба т.

Реализация указанной процедуры известна, см. (Патент РФ №2716697, МПК G06F 17/00 (2006.01), H04L 12/54 (2013.01), опубл.: 16.03.2020. Бюл. №8).

В качестве примера на фиг.7 и фиг.9 показаны трехмерные матрицы амплитудных коэффициентов с координатами сдвига к и масштаба т, первого и второго изображений.

П.4 Для каждого из эталонных изображений формируют векторы признаков, элементами которых выбирают амплитудные коэффициенты трехмерной матрицы, усредненные по координате масштаба т.

В качестве примера на фиг.8 и фиг.10 показаны векторы признаков для первого и второго изображений.

П. 5 Принимают распознаваемое изображение и формируют его вектор признаков аналогично, как и для эталонного сигнала.

В качестве примера на фиг.5 показан кадр распознаваемого изображения. На фиг.6 показана его гистограмма. На фиг.11 показана его трехмерная матрица амплитудных коэффициентов. На фиг.12 показан его вектор признаков.

П.6 Идентифицируют распознаваемое изображение путем сравнения его вектора признаков с векторами признаков каждого из эталонных сигналов. При этом решение принимают по результатам вычисления разности векторов признаков распознаваемого изображения и эталонного изображения.

П.7 Вычисленную разность значений усредняют в соответствии с разрядностью вектора признаков. Распознаваемое изображение считают инцидентным эталонному изображению, модуль разницы векторов признаков с которым будет минимальным.

Для представленного примера усредненное значение модуля разницы векторов признаков распознаваемого изображения и первого эталонного изображения равно U02cp=4,95.

А разность с вектором признаков второго изображения составила U12ср=5,29.

В соответствии с заявляемым способом, кадр видеоизображения распознаваемого сигнала будет отнесен к первому эталонному кадру видеоизображения. Причем на кадре запечатлен лишь фрагмент распознаваемого объекта.

Поскольку задачей изобретения является разработка способа, который позволил бы повысить контрастность формируемых векторов признаков изображений без увеличения их разрядности, то рассчитаем соответствующие усредненные значения модуля разницы векторов признаков в соответствии со способом-прототипом:

Указанная разность с вектором признаков первого эталонного изображения равна R02cp=4,5. А разность с вектором признаков второго сигнала составила R12cp=4,77.

Так как контрастность определяет абсолютные различия векторов признаков, принадлежащих различным классам, см (Мальцев, В. В. Анализ дискретных преобразований в интересах формирования контрастных признаков распознавания / В. В. Мальцев, И. В. Сисигин, К. О. Колесников // Путь в науку. Радиотехнические системы: Материалы конференции, Ярославль, 27 апреля 2018 года / Отв. ред. Л.Н. Казаков; Ярославский гос. университет им. П.Г. Демидова. - Ярославль: Ярославский государственный университет им. П.Г. Демидова, 2018. - С.132-142.), то для рассматриваемой ситуации контрастность будет определяться значением модуля разности векторов признаков между первым и вторым эталонными изображениями.

В соответствии с заявляемым способом указанная разность составила ΔU=5,27. А расчет указанной разности в соответствии со способом-прототипом составил ΔR=5,00.

Таким образом, для представленного примера повышение контрастности формируемых векторов признаков изображений без увеличения их разрядности, составило 5,1%, что указывает на решение задачи изобретения. Результаты подтверждены по результатам обработки 200 изображений. Средняя величина повышения контрастности составила 4,3%.

Для подтверждения заявляемого технического результата - повышение достоверности распознавания объектов, представленных на изображениях, было проведено 200 экспериментов, в ходе которых распознаванию подвергались кадры видеоизображения, на которых были запечатлены различные части объекта (автомобиля) от 100% до 2% его общей площади. Установлено, что заявляемый способ устойчиво осуществляет распознавание, если на кадре видеоизображения запечатлено не менее 5-7% объекта при неизменной освещенности местности. Достоверность способа-прототипа для тех же условий, составила 7-8%).

Зависимость достоверности распознавания от контрастности признаков рассмотрена в (Дворников, С. В. Автоматизация процедур обнаружения нефтяных разливов на водной поверхности /С.В. Дворников, С.С. Дворников, Д.В. Васильева // Информация и космос.- 2024. - №1. - С.126-132. - EDN GMFJFC.).

Таким образом, благодаря новой совокупности существенных признаков в заявленном способе обеспечивается достижение заявляемого технического результата: повышение достоверности распознавания объектов, представленных на изображениях.

Похожие патенты RU2839560C1

название год авторы номер документа
Способ распознавания сигналов 2023
  • Дворников Сергей Сергеевич
  • Дворников Сергей Викторович
  • Обрезков Павел Сергеевич
  • Гудков Михаил Александрович
  • Дворников Александр Сергеевич
  • Васильева Дина Владимировна
RU2809021C1
Способ распознавания сигналов 2024
  • Дворников Александр Сергеевич
  • Погорелов Андрей Анатольевич
  • Москалец Геннадий Николаевич
  • Дворников Сергей Викторович
RU2831931C1
СПОСОБ РАСПОЗНАВАНИЯ РАДИОСИГНАЛОВ 2013
  • Букерева Анна Павловна
  • Дворников Сергей Викторович
  • Дворников Александр Сергеевич
  • Устинов Андрей Александрович
RU2533651C2
СПОСОБ РАСПОЗНАВАНИЯ РАДИОСИГНАЛОВ 2011
  • Волков Дмитрий Игоревич
  • Дворников Сергей Викторович
  • Дворников Александр Сергеевич
  • Кожевников Дмитрий Анатольевич
  • Кудрявцев Александр Михайлович
  • Устинов Андрей Александрович
  • Чихонадских Александр Павлович
RU2466455C1
СПОСОБ РАСПОЗНАВАНИЯ РАДИОСИГНАЛОВ 2014
  • Дворников Александр Сергеевич
  • Дворников Сергей Викторович
RU2551903C1
СПОСОБ РАСПОЗНАВАНИЯ РАДИОСИГНАЛОВ 2007
  • Дворников Сергей Викторович
  • Дворников Александр Сергеевич
  • Желнин Сергей Русланович
  • Оков Игорь Николаевич
  • Сауков Александр Михайлович
  • Симонов Алексей Николаевич
  • Яхеев Андрей Фаридович
RU2356064C2
СПОСОБ РАСПОЗНАВАНИЯ РАДИОСИГНАЛОВ 2010
  • Агиевич Сергей Николаевич
  • Балунин Евгений Иванович
  • Дворников Сергей Викторович
  • Дворников Сергей Сергеевич
  • Сухаруков Георгий Александрович
  • Осадчий Александр Иванович
  • Устинов Андрей Александрович
  • Яхеев Андрей Фаридович
RU2423735C1
СПОСОБ РАСПОЗНАВАНИЯ РАДИОСИГНАЛОВ 2010
  • Устинов Андрей Александрович
  • Дворников Сергей Викторович
  • Дворников Сергей Сергеевич
  • Коноплев Максим Александрович
  • Сухаруков Георгий Александрович
  • Осадчий Александр Иванович
RU2430417C1
СПОСОБ РАСПОЗНАВАНИЯ РАДИОСИГНАЛОВ 2010
  • Дворников Сергей Викторович
  • Дворников Сергей Сергеевич
  • Коноплев Максим Александрович
  • Немченко Александр Сергеевич
  • Рощин Александр Алексанрович
  • Сухаруков Георгий Александрович
  • Устинов Андрей Александрович
RU2430416C1
СПОСОБ РАСПОЗНАВАНИЯ РАДИОСИГНАЛОВ 2004
  • Аладинский В.А.
  • Дворников С.В.
  • Сауков А.М.
  • Симонов А.Н.
RU2261476C1

Иллюстрации к изобретению RU 2 839 560 C1

Реферат патента 2025 года Способ распознавания изображений

Изобретение относится к распознаванию изображений. Технический результат заключается в повышении достоверности распознавания объектов, представленных на изображениях. На этапах способа: формируют для каждого изображения вектор признаков, состоящий из значений гистограмм распределения частости проявления яркости по градациям уровней, в соответствии с разрядностью битов; принимают решение по результатам вычисления разности векторов признаков распознаваемого изображения и каждого из эталонных изображений; при этом предварительно из каждой гистограммы распределения, путем ее последовательной корреляции с вейвлетами Хаара, имеющими различные параметры масштаба, формируют трехмерную матрицу амплитудных коэффициентов с координатами сдвига и масштаба, а в качестве элементов векторов признаков выбирают амплитудные коэффициенты трехмерной матрицы, усредненные по координате масштаба. 12 ил.

Формула изобретения RU 2 839 560 C1

Способ распознавания изображений, заключающийся в том, что предварительно задают эталонные кадры изображений равного размера, формируют для каждого из них вектор признаков, состоящий из значений гистограмм распределения частости проявления яркости по градациям уровней, в соответствии с разрядностью битов, затем для распознаваемого изображения формируют его вектор признаков аналогично, как и для эталонного сигнала, после чего идентифицируют распознаваемое изображение путем сравнения его вектора признаков с векторами признаков каждого из эталонных изображений, а решение принимают по результатам вычисления разности векторов признаков, причем разность векторов усредняют в соответствии с разрядностью вектора признаков, распознаваемое изображение считают инцидентным эталонному изображению, модуль разницы векторов признаков с которым будет минимальным, отличающийся тем, что предварительно из каждой гистограммы распределения, путем ее последовательной корреляции с вейвлетами Хаара, имеющими различные параметры масштаба, формируют трехмерную матрицу амплитудных коэффициентов с координатами сдвига и масштаба, а в качестве элементов векторов признаков выбирают амплитудные коэффициенты трехмерной матрицы, усредненные по координате масштаба.

Документы, цитированные в отчете о поиске Патент 2025 года RU2839560C1

CN 103473551 A, 25.12.2013
Способ распознавания сигналов 2023
  • Дворников Сергей Сергеевич
  • Дворников Сергей Викторович
  • Обрезков Павел Сергеевич
  • Гудков Михаил Александрович
  • Дворников Александр Сергеевич
  • Васильева Дина Владимировна
RU2809021C1
Автомобиль-сани, движущиеся на полозьях посредством устанавливающихся по высоте колес с шинами 1924
  • Ф.А. Клейн
SU2017A1
Токарный резец 1924
  • Г. Клопшток
SU2016A1
JP 2001022926 A, 26.01.2001
Способ регенерирования сульфо-кислот, употребленных при гидролизе жиров 1924
  • Петров Г.С.
SU2021A1
CN 108154102 A, 12.06.2018.

RU 2 839 560 C1

Авторы

Васильева Дина Владимировна

Дворников Сергей Сергеевич

Погорелов Андрей Анатольевич

Лапин Степан Павлович

Дворников Сергей Викторович

Даты

2025-05-06Публикация

2024-07-02Подача