ОБЛАСТЬ ТЕХНИКИ
Заявленное изобретение относится к области вычислительных технологий, а именно к средствам обработки изображения.
ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ
Анализ изображений для многоклассовой сегментации является одной из задач, надо которыми в настоящее время работает множество исследователей. Принято считать, что одной из самых простых методик для этого является многоуровневый выбор порога на основе гистограммы. Использование одномерной гистограммы приводит к утрате контекстной информации, поэтому в последнее время разрабатываются способы с применением двумерных гистограмм, однако предложенные на данный момент способы являются либо вычислительно сложными, либо обеспечивают невысокую точность определения границ.
Проблемы обработки изображений также находят решения в следующих патентных публикациях, например, способ контентно-адаптивного энтропийного кодирования данных о режимах и опорных типах для видео следующего поколения (см. RU2612600C2, опубл. 09.03.2017). Предложен компьютерный способ видео кодирования. Способ содержит этап, на котором загружают данные разбиений, данные «горизонтальный/вертикальный», указывающие, является ли разбиение горизонтальным или вертикальными разбиением, данные режимов и данных опорных типов по меньшей мере для части видеокадра. Далее определяют первую оценочную стоимость бита при энтропийном кодировании, содержащую стоимость бита при энтропийном кодировании для совместного кодирования данных разбиений и данных режимов и стоимость бита при энтропийном кодировании для кодирования данных «горизонтальный/вертикальный».
Из уровня техники известен документ, раскрывающий устройство, способ обработки изображений, способ и устройство обучения (см. RU2773420C1, опубл. 03.06.2022). Способ включает получение подлежащего обработке изображения, выполнение извлечения признаков на подлежащем обработке изображении с использованием слоя извлечения признаков, содержащегося в сверточной нейронной сети, для получения первой карты признаков, сжатие первой карты признаков с использованием слоя сжатия признаков для получения второй карты признаков и отправку второй карты признаков принимающему узлу. Этот способ имеет низкую производительность.
КРАТКОЕ ИЗЛОЖЕНИЕ ИЗОБРЕТЕНИЯ
Данное изобретение направлено на решение технической проблемы, связанной созданием способа многоуровневой обработки изображений повышенной производительности.
Техническим результатом изобретения является повышение производительности и точности обработки изображений.
Технический результат достигается посредством способа многоуровневой обработки изображений изображений на основе энтропийной пороговой обработки, содержащий этапы, на которых вычисляют значения энтропии вдоль строки и определяют пороги с использованием двумерной гистограммы изображения на основе нормальной локальной дисперсии, при этом для выбора оптимального значения порога оценивают пригодность и используют оптимизатор оптимального порога, для этого инициализируют количество потоков, количество соседей , максимальное количество итераций и границ, далее назначают случайную позицию для потока и оценивают её пригодность, генерируют соседей и выбирают лучших из них, далее генерируют позицию потока на основе либо лучших соседей, либо случайного потока, либо лучшего потока и проверяют границы, далее обновляют позицию потока, и если сгенерированная позиция потока лучше, чем предыдущая, оценивают противоположный поток и оценивают границы, обновляют позицию потока, если позиция противоположного потока лучше, чем предыдущая, проверяют, достигнуто ли максимальное количество итераций, и если достигнуто, завершают процесс, если нет, то снова повторяют генерацию соседей и последующие этапы.
В частном случае реализации каждый поток в алгоритм направления встречного потока обновляет свое решение в пространстве поиска на основе своего случайного соседа или некоторого случайного потока.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
Сущность изобретения поясняется чертежами, на которых:
Фиг.1 – блок-схема предлагаемой методики;
Фиг.2 – гистограмма в 2D для одного порога;
Фиг.3 – гистограмма в 2D для двух порогов;
Фиг.4 – иллюстрация двумерных гистограмм: (а) образец изображения, (b) метод Оцу, (c) метод Капура, (d) предложенный способ;
Фиг.5 – блок-схема предлагаемого оптимизатора;
Фиг.6 – сравнение изображений, полученных разными способами.
Эти чертежи не охватывают и, кроме того, не ограничивают весь объем вариантов реализации данного технического решения, а представляют собой только иллюстративный материал частного случая его реализации.
ВАРИАНТ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ
Заявленный способ многоуровневой обработки изображений включает новую методологию, использующую новую практическую функцию пригодности на основе решающей энтропии класса строк (PDRCE) для многоуровневой пороговой обработки. Значения PDRCE вычисляются с использованием построенной двумерной гистограммы на основе нормальной локальной дисперсии.
Многоуровневая обработка изображений включает пороговый выбора на основе PDRCE для многоклассовой сегментации изображений. На Фиг. 1 представлена блок-схема PDRCE. Значения PDRCE рассчитываются вдоль строки с использованием двумерной гистограммы изображения. Нормальная локальная дисперсия используется для построения двумерной гистограммы. Необходимо отметить, что значения функции пригодности связаны с выбором порога. Поэтому оптимизатор используется для получения оптимального порога.
На Фиг. 2 показано построение двумерной гистограммы, рекомендуемой для двухуровневого порога. При этом (S, T) представляет собой порог. Гистограмма разделена на четыре квадранта. Следует отметить, что квадранты один и два содержат направленные ребра. На Фиг. 2 1-й квадрант содержит информацию фона, или заднего плана (С1), тогда как 2-й квадрант несет информацию переднего плана (C2). C1 и C2 представляют два разных класса.
Распределение вероятностей (С1) выражается следующим образом:
Распределение вероятностей (C2) выражается следующим образом :
L представляет собой уровень интенсивности изображения, значения интенсивности отдельного пикселя находятся в пределах (0, L-1). Предложенный способ позволяет учитывать разницу между интенсивностями пикселей в отличие от большинства методов, в которых учитывается средняя интенсивность пикселей в сегменте.
Двумерная гистограмма многоуровневого выбора порога построена с использованием заявленного способа и представлена на Фиг. 3. Здесь представлены 2 пороговых значения, T1 и T2, поэтому гистограмма разделена на 6 отдельных областей. Примечательно, что сама первая строка содержит необходимую информацию. Следует отметить, что первая строка также сохраняет информацию о ребрах. Кроме того, процесс способствует сокращению количества вычислений, так как необходимо вычислять оптимальные S только однажды. Однако оптимальные T1 и T2 рассчитываются дважды с использованием двух разных функций пригодности, исследованных для этих пороговых значений.
При этом изображение разделено на k классов. В общем случае для разных классов распределения вероятностей С1, С2, . . . , Ck выражаются как:
Значения функции PDRCE вычисляются следующим образом:
Здесь α – это настраиваемый параметр.
Итоговое значение функции пригодности PDRCE вычисляется следующим образом:
Максимальное итоговое значение позволяет получить оптимальную функцию пригодности:
На Фиг. 4 показаны представления гистограммы по методу Оцу, Капура и заявленному способу. Образец изображения, показанный на Фиг. 4(а), взят из набора данных сегментации Беркли (BSDS500). Его двумерная гистограмма, использующая метод Оцу, выглядит следующим образом: показано на Фиг. 4(б). 2D-гистограмма с использованием метода Капура и заявленный способ показаны на Фиг. 4 (c-d). Из Фиг. 4(b–c) видно, что диагонали используются для вычисления значений энтропии. Эти значения максимизированы, чтобы получить оптимальные пороги, в случае Оцу и схемы Капура. Тем не менее, при двумерном представлении порядок вычислительной сложности равен количеству оттенков серого. Таким образом, многоуровневые методы пороговой обработки, основанные на двумерных гистограммах, требуют больше вычислительного времени. Вычислительное время в известных из уровня техники увеличивается с увеличением числа К. Однако в предложенном изобретении вычислительная сложность значительно снижается. Необходимо упомянуть, что предложенная техника использовала другой принцип построения с использованием нормированной локальной дисперсии, в отличие от существующих технологий. Видно, что первая строка используется только для расчета значения энтропии, которое изображено на Фиг. 4(г). В этом случае временная сложность снижается. Чем больше количество пороговых уровней, тем больше выигрыш во временной сложности.
Предлагаемая практическая решающая энтропия класса строк имеет более преимущества, чем традиционная энтропия Шеннона, использовавшаяся ранее. Преимущества предложенной функции PDRCE:
i) всегда неотрицательная функция,
ii) для конкретного p значение энтропии постоянно больше по сравнению с энтропией Шеннона,
iii) является более практичной.
Эффективность предложенного способа определяется применением энтропийной базисной функции f(x) = x exp(1 − xα), где α – это настраиваемый параметр, подбор которого позволяет принять решение о пригодности проверяемого варианта с повышенной точностью.
Также в применяемом способе учтено, что каждый поток в FDA обновляет свое решение в пространстве поиска на основе его случайного соседа или некоторого случайного потока. Это может направить поток к локальному оптимуму, который может оказаться ловушкой. Этого можно избежать введением оппозиционного обучения (OBL), при котором выполняется также оценка потока в противоположном направлении или, иными словами, противоположного потока.
Результаты применения заявленного способа указаны ниже. Принцип OFDA показан в блок-схеме на Фиг. 5. Следует отметить, что результаты сообщаются после 51 запуска каждого из методов. В этой реализации в каждом прогоне учитывается 40 итераций. В этом эксперименте используются 300 изображений из набора данных сегментации Беркли (BSDS500).
Размер используемых изображений 256×256. Эти изображения переводятся в шкалу серого перед экспериментом. Код был реализован с помощью MATLAB на процессоре Corei7 8 ГБ. На Фиг. 6 (а) показан образец изображения. Выходные данные (сегментированная версия) окрашены в псевдоцвета с использованием MATLAB для эффективной демонстрации. Их также называют пороговыми изображениями. Предлагаемый способ сравнивается с пятью различными современными энтропийными методами на основе двумерных гистограмм. На Фиг. 6 показано, что пороговые значения очень близки к изображениям сегментации человека с K = 6 и α = 5. Видно, что результаты с K = 3 и 4 демонстрируют перекрытие различных классов. Можно отметить, что значительно улучшена многоклассовая сегментация при K = 6. Предложенная функция пригодности (PDRCE) более эффективна, поскольку захватывает эффективно локальные переходы. Предлагаемая нормальная локальная дисперсия на основе PDRCE для выбора многоуровневого порога с использованием OFDA, которая позволяет построить двумерную гистограмму, делает алгоритм более точным в применении к многоклассовой сегментации изображений, поскольку эффективно сохраняет полезную контекстную информацию.
название | год | авторы | номер документа |
---|---|---|---|
СПОСОБ И СИСТЕМА ДЛЯ ПРЕОБРАЗОВАНИЯ СТЕРЕОКОНТЕНТА | 2009 |
|
RU2423018C2 |
ОПТИМИЗАЦИЯ СТРУКТУРЫ И ИСПОЛЬЗОВАНИЕ КОДОВЫХ КНИГ ДЛЯ АНАЛИЗА ДОКУМЕНТОВ | 2021 |
|
RU2787138C1 |
СПОСОБ ВЫРАВНИВАНИЯ РЕШЕТКИ УЗЛОВ В СООТВЕТСТВИИ С ХАРАКТЕРНЫМИ ЧЕРТАМИ В ЦИФРОВОМ ИЗОБРАЖЕНИИ | 2001 |
|
RU2282242C2 |
Способ автоматической сегментации флюорограмм грудной клетки больных пневмонией | 2016 |
|
RU2629629C1 |
СПОСОБ РАСПОЗНАВАНИЯ КОНТЕНТА СЖАТЫХ НЕПОДВИЖНЫХ ГРАФИЧЕСКИХ СООБЩЕНИЙ В ФОРМАТЕ JPEG | 2018 |
|
RU2680358C1 |
ЭНТРОПИЙНОЕ КОДИРОВАНИЕ РАЗНОСТЕЙ ВЕКТОРОВ ДВИЖЕНИЯ | 2018 |
|
RU2758981C2 |
МЕТОД ОПРЕДЕЛЕНИЯ ЗОНЫ ДВИЖЕНИЯ И САМОСТОЯТЕЛЬНОГО ОБЪЕЗДА ПРЕПЯТСТВИЙ ДЛЯ БЕСПИЛОТНОГО ТРАНСПОРТНОГО ОБОРУДОВАНИЯ В ПОДЗЕМНЫХ ЗАМКНУТЫХ ПРОСТРАНСТВАХ | 2022 |
|
RU2803671C1 |
ЭНТРОПИЙНОЕ КОДИРОВАНИЕ РАЗНОСТЕЙ ВЕКТОРОВ ДВИЖЕНИЯ | 2022 |
|
RU2820857C2 |
СПОСОБ УПРАВЛЕНИЯ РАЗМЕРОМ ВЫХОДНОГО ФАЙЛА JPEG СЖАТИЯ ИЗОБРАЖЕНИЯ | 2015 |
|
RU2607624C1 |
ЭНТРОПИЙНОЕ КОДИРОВАНИЕ РАЗНОСТЕЙ ВЕКТОРОВ ДВИЖЕНИЯ | 2012 |
|
RU2615681C2 |
Изобретение относится к области вычислительных технологий, а именно к средствам обработки изображения. Техническим результатом является повышение производительности и точности обработки изображений. Способ содержит этапы, на которых вычисляют значения энтропии вдоль строки и определяют пороги с использованием двумерной гистограммы изображения на основе нормальной локальной дисперсии, при этом для выбора оптимального значения порога оценивают пригодность и используют оптимизатор оптимального порога, для этого инициализируют количество потоков, количество соседей, максимальное количество итераций и границ, далее назначают случайную позицию для потока и оценивают её пригодность, генерируют соседей и выбирают лучших из них, далее генерируют позицию потока на основе либо лучших соседей, либо случайного потока, либо лучшего потока и проверяют границы, далее обновляют позицию потока, и если сгенерированная позиция потока лучше, чем предыдущая, оценивают противоположный поток и оценивают границы, обновляют позицию потока, если позиция противоположного потока лучше, чем предыдущая, проверяют, достигнуто ли максимальное количество итераций, и если достигнуто, завершают процесс, если нет, то снова повторяют генерацию соседей и последующие этапы. 1 з.п. ф-лы, 6 ил.
1. Способ многоуровневой обработки изображений на основе энтропийной пороговой обработки, содержащий этапы, на которых вычисляют значения энтропии вдоль строки и определяют пороги с использованием двумерной гистограммы изображения на основе нормальной локальной дисперсии, при этом для выбора оптимального значения порога оценивают пригодность посредством функции пригодности и используют оптимизатор оптимального порога, для этого инициализируют количество потоков, количество соседей, максимальное количество итераций и границ, далее назначают случайную позицию для потока и оценивают её пригодность, генерируют соседей и выбирают лучших из них, далее генерируют позицию потока на основе либо лучших соседей, либо случайного потока, либо лучшего потока и проверяют границы, далее обновляют позицию потока, и если сгенерированная позиция потока лучше, чем предыдущая, оценивают противоположный поток и оценивают границы, обновляют позицию потока, если позиция противоположного потока лучше, чем предыдущая, проверяют, достигнуто ли максимальное количество итераций, и если достигнуто, завершают процесс, если нет, то снова повторяют генерацию соседей и последующие этапы.
2. Способ многоуровневой обработки изображений по п.1, отличающийся тем, что каждый поток в алгоритме направления встречного потока обновляет свое решение в пространстве поиска на основе своего случайного соседа или случайного потока.
HOJAT KARAMI: "Flow Direction Algorithm (FDA): A Novel Optimization Approach for Solving Optimization Problems", 2021, Найдено в: "https://www.sciencedirect.com/science/article/pii/S0360835221001285" | |||
СПОСОБ ИНТЕЛЛЕКТУАЛЬНОЙ ОБРАБОТКИ МАССИВА НЕОДНОРОДНЫХ ИЗОБРАЖЕНИЙ | 2021 |
|
RU2767281C1 |
СПОСОБ И СИСТЕМА ОПРЕДЕЛЕНИЯ ПРИГОДНОСТИ ИЗОБРАЖЕНИЯ ДОКУМЕНТА ДЛЯ ОПТИЧЕСКОГО РАСПОЗНАВАНИЯ СИМВОЛОВ И ДРУГИХ ОПЕРАЦИЙ ПО ОБРАБОТКЕ ИЗОБРАЖЕНИЙ | 2016 |
|
RU2608239C1 |
Приспособление для суммирования отрезков прямых линий | 1923 |
|
SU2010A1 |
CN 111797720 A. |
Авторы
Даты
2024-10-04—Публикация
2023-03-31—Подача