Заявленное техническое решение относится к области проверки подлинности изображений документов различных видов.
Из уровня техники известны различные способы детектирования и локализации фальсифицированной области в JPEG-изображениях (см. например, 1. S. Ye, Q. Sun and Е. Chang, "Detecting Digital Image Forgeries by Measuring Inconsistencies of Blocking Artifact, "2007 IEEE International Conference on Multimedia and Expo, 2007, pp. 12-15, doi: 10.1109/ICME.2007.4284574 [1], T. Bianchi, A. De Rosa and A. Piva, "Improved DCT coefficient analysis for forgery localization in JPEG images, "2011 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2011, pp.2444-2447, doi: 10.1109/ICASSP.2011.5946978 [2], Weihai Li, Yuan Yuan, Nenghai Yu, Passive detection of doctored JPEG image via block artifact grid extraction, Signal Processing, Volume 89, Issue 9, 2009, Pages 1821-1829, ISSN 0165-1684, https://doi.org/10.1016/j.sigpro.2009.03.025 [3]).
Однако, в работе [1] по изображению вычисляется мера blocking artifact measure (ВАМ). В данной работе для каждого блока 8 на 8 вычисляется доля несогласованных частот. Такой подход позволяет регистрировать несогласованные блоки даже при высоком качестве JPEG-сжатия истинного изображения. Кроме того, в работе [1] использовался другой метод оценивания матрицы квантования, метод, предложенный в настоящей заявке дает возможность надежно оценивать матрицу квантования не опасаясь влияния фальсифицированных областей.
В работе [2] предполагается, что исходные области будут подвергаться двойному сжатию, в то время как поддельные будут иметь только одно сжатие. Для поиска поддельных областей строиться статистическая модель, позволяющая оценивать вероятность, что область подвергалась двойному сжатию. В настоящей заявке предполагается, что фальсифицированное изображение сохранялось в формате без потерь, но также метод работает в случае сохранения фальсифицированного изображения в формате JPEG с высоким качеством. В отличие от работы [2], в заявленном способе каждый блок 8 на 8 определяется поддельным независимо, что позволяет выявлять даже небольшие области фальсификаций, на что, обычно, не способны статистические методы.
В работе [3] исследуются артефакты блоков JPEG-сжатия. Так как дискретное косинусное преобразование проходит отдельно в каждом блоке 8 на 8, границы между такими блоками заметны. Вставленная область будет иметь по предположению несогласованную сетку. Предлагаемый в настоящей заявке способ использует математическую модель DCT-коэффициентов, что позволяет с высокой вероятностью определять фальсифицированные участи не зависимо от того, что на них изображено и применим при высоком качестве сжатия истинного изображения, когда артефакты блоков слабо заметны.
Задачей заявленного изобретения является устранение недостатков известного уровня техники. Технический результат заключается в обеспечении способа детектирования и локализации фальсифицированной области в JPEG-изображениях, который позволяет выявлять с высокой вероятностью, точностью и надежностью даже небольшие области фальсификаций, независимо от того, что на них изображено и применим при высоком качестве сжатия истинного изображения, когда артефакты блоков слабо заметны, а также обеспечивает возможность надежно оценивать матрицу квантования, не опасаясь влияния фальсифицированных областей,
Поставленная задача решается, а заявленный технический результат достигается посредством заявленного способа детектирования и локализации фальсифицированной области в JPEG-изображениях.
Заявленный способ применим в том случае, когда дано изображение и необходимо определить, производились ли манипуляции меняющие содержимое (контент) изображения (операции копирования-вставки или сращивания) и локализировать фальсифицированные области. Например, обнаружить фальсификации на изображении документа и, тем самым, опровергнуть подлинность данных документа.
Заявленный способ детектирования и локализации фальсифицированной области в JPEG-изображениях заключается в следующем:
Рассматривается изображение в цветовом пространстве RGB. Предполагается, что истинное изображение было подвержено JPEG-сжатию, после чего, при помощи программного обеспечения, были выполнены фальсификации и измененное изображение было сохранено в формате без потерь.
Обнаружение фальсифицированной области основано на поиске несоответствий в структуре DCT-коэффициентов JPEG-изображения. Если изображение подвергалось JPEG-сжатию, то его DCT-коэффициенты при фиксированной частоте (вычисленные при том же положении сетки 8 на 8 пикселей, при котором производилось JPEG-сжатие) будут распределены возле значений кратных шагу квантования q, (числу стоящему в соответствующей частоте матрицы квантования при которой производилось JPEG-сжатие).
d∈[kq-1, kq+1], k∈Z
С большой вероятностью DCT-коэффициенты в фальсифицированной области не будут удовлетворять этому свойству. Так, например, при копировании-вставке при несовпадении внутренней сетки JPEG-сжатия вставленной области с внешней сеткой, DCT-коэффициенты вставленной области не будут иметь нетривиальных периодов, несмотря на то, что эта область сжималась с тем же качеством, что и истинное изображение. Вероятность несовпадения внешней сетки и внутренней 63/64. Иллюстрация истинного изображения подвергавшегося JPEG-сжатию с показателем качества 90 представлена на фиг. 1, на фиг. 2 - иллюстрация этого изображения с фальсификацией копирования-вставки, которая выполнена в программе paint.net с последующим сохранением в формате PNG (без потерь).
Вычисление DCT-коэффициентов изображения
Для последующих шагов алгоритма необходимо вычислить DCT-коэффициенты изображения с сохранением информации о положении соответствующих коэффициентам блоков 8 на 8 пикселей. Это достигается следующими действиями.
1. Дополнение сторон изображения до кратности 8 черными пикселями.
2. Трансформация цветового пространства из RGB в YCbCr.
3. Разбиение канала яркости в цветовом пространстве YCbCr (Y) на блоки 8 на 8 пикселей.
4. Применение дискретного косинусного преобразования для каждого блока 8 на 8 пикселей.
5. Отбрасывание из рассмотрения блоков, в которых присутствуют пиксели с насыщенными значениями (0 или 255) в любом канале RGB и блоков, в которых яркость (Y) в YCbCr в момент перехода из RBG в YCbCr выходила за границы диапазона [0, 1]. Такие пиксели назовем насыщенными.
Пункт 5 необходим, так как DCT-коэффициенты в таких блоках могут вести себя непредсказуемым образом и не принадлежать диапазону [kq-1, kq+1], где k ∈ Z, q - шаг квантования.
Оценка матрицы квантования
По вычисленным DCT-коэффициентам оценивается матрица квантования. Чтобы избежать влияния фальсифицированной области на оценку матрицы, изображение разбивается на несколько блоков. Далее для каждой из 64 частот в каждом блоке оценивается шаг квантования. Он состоит в следующих действиях.
1. Вычисление факторной гистограммы h. h(x) - количество DCT - коэффициентов, которые делятся на х без остатка.
2. Нормализация h на общее количество DCT-коэффициентов.
3. Оценка шага квантования, как , для некоторого порога Т1.
Если конец оценивания.
4. В случае нахождение у=max{x | h(x)≥Т2] (для некоторого Т2). Если у<4 конец оценивания.
5. Построение модифицированной факторной гистограммы -количество DCT-коэффициентов, которые делятся на х без остатка и не принадлежат множеству М={ky±1, k∈Z}.
6. Нормализация на общее количество DCT-коэффициентов не принадлежащих множеству М.
7. Вычисление для некоторого порога Т3. Если шаг квантования оценивается как иначе как . В пунктах 4-7 производится попытка устранить излишний шум в гистограмме DCT-коэффициентов и произвести оценку заново. Если получается найти достаточно большой период (>3) он принимается как истинный.
Для каждой частоты берется мода шага квантования по всем блокам, где оценка шага не равна 1.
Где - оценка шага квантования по всему изображению для i-ой частоты,
- оценка шага квантования для -ой частоты -го блока не равная 1, М0 - оператор взятия моды.
Если , то шаг квантования для i-ой частоты полагается равным 1 и не участвует при поиске несоответствий в пункте 2.4, так как множество диапазонов в этом случае заполняет почти всю числовую ось. В случае, когда истинный шаг квантования равен 1, несмотря на то, что мода берется по неединичным значениям, полученная оценка будет меньше пяти в силу фундаментального распределения DCT-коэффициентов и не будет участвовать в дальнейшем.
Это позволяет оценивать матрицу квантования устойчиво к фальсифицированным областям, даже если они занимают больше половины изображения.
Поиск положения сетки JPEG-сжатия
В случае, если оцененная матрица квантования состоит из большого количества единиц (малое количество частот с найденными нетривиальными периодами в гистограмме DCT-коэффициентов), можно предположить, что либо истинное изображение было сжато с высоким показателем качества, либо, что разбиение изображения на блоки 8 на 8 пикселей (сетка сжатия), которое мы выбрали, не совпадает с разбиением, которое применялось при JPEG-сжатии.
Чтобы исключить второй вариант, применяется алгоритм поиска положения сетки JPEG-сжатия. Берется область некоторого размера на изображении. Она выбирается так, чтобы гистограммы DCT-коэффициентов из этой области были достаточно содержательны. Для этого исключаются слабо текстурированные области и области в которых много насыщенных пикселей. Для положения сетки JPEG-сжатия существует 64 варианта. Для каждого из возможных положений делается оценка матрицы квантования, как описано ранее, но только для взятой области, а не всего изображения. Принимается первое положение, в оцененной матрице которого достаточное количество нетривиальных значений.
Стоит отметить, что искать положение сетки JPEG-сжатия таким алгоритмом изначально (до выполнения вышеуказанных пунктов) не резонно с точки зрения вычислительных затрат. С большой вероятностью положение сетки совпадает с наивным разбиением указанном ранее.
Поиск несоответствий DCT-коэффициентов матрице квантования
Строиться два вспомогательных изображения I1 и I2 из значений следующим образом. Каждому блоку 8 на 8 из разбиения при выбранном положении сетки JPEG-сжатия сопоставляется пиксель с теми же координатами в изображении I1 и пиксель в изображении I2. Размеры I1 и I2 будут совпадать. В каждый пиксель I1 записывается количество частот, при которых соответствующий этому пикселю-блоку DCT-коэффициент не принадлежит ни одному диапазону из множества - шаг квантования из оцененной матрицы квантования, соответствующий частоте.
Вводится множество М2 таких частот, что хотя бы один блок при этой частоте имел DCT-коэффициент не принадлежит ни одному диапазону из множества - шаг квантования из оцененной матрицы квантования, соответствующий частоте. Другими словами каждая частота из М2 дала вклад хотя бы в один пиксель I1. В каждый пиксель I2 записывается количество частот из множества М2, при которых соответствующий этому пикселю-блоку DCT-коэффициент имеет абсолютное значение больше единицы. Формируется вспомогательное изображение значений I3 с теми же размерами, что у I1 и I2, по следующей формуле:
где t подбирается экспериментально.
Таким образом получается изображение из значений в диапазоне [0, 1]. Значение в каждом пикселе можно интерпретировать как долю частот, при которых соответствующий блок является несогласованным, в смысле DCT-коэффициентов, среди тех частот при которых есть несогласованные, (множество М2).
Контрастированные изображения I1, I2, I3 представлены на фиг. 3, фиг. 4, фиг. 5 соответственно.
Локализация фальсифицированных областей
По изображению I3 формируется вспомогательное изображение I4, на котором дополнительно применяются морфологическое открытие и размытие для устранения паразитных элементов, возникающих вследствие случайных отклонений DCT-коэффициентов. По изображению I4 вычисляется максимум - оценка вероятности наличия манипуляций. По изображению I4 строится изображение I5 с размерами исходного изображения. Значение пикселей внутри каждого блока 8 на 8 изображения I5 равно значению пикселя изображения I4 соответствующего этому блоку.
Оценка вероятности наличия манипуляций и изображение I5 - результат работы алгоритма. Для данного примера (фиг. 2) оценка вероятности наличия манипуляций равна 0.68302. Контрастированные изображения I4, I5 представлены на фиг. 6 и фиг. 7 соответственно.
Таким образом, вышеизложенный метод детектирования и локализации фальсифицированной области в JPEG-изображениях позволяет выявлять некоторые случаи фальсификации данных на изображении без привязки к его содержимому и обладает потенциальной возможностью применения для проверки подлинности изображений документов различных видов.
Изобретение относится к области информационных технологий, а именно к проверке подлинности изображений документов различных видов. Технический результат заключается в повышении точности определения фальсифицированной области на изображении. Способ детектирования и локализации фальсифицированной области в JPEG-изображениях заключается в том, что рассматривают изображение в цветовом пространстве RGB, которое было подвержено JPEG-сжатию, после чего, при помощи программного обеспечения, были выполнены фальсификации и измененное изображение было сохранено в формате без потерь, при этом обнаружение фальсифицированной области основано на поиске несоответствий в структуре DCT-коэффициентов JPEG-изображения, для этого вычисляют DCT-коэффициенты изображения с сохранением информации о положении соответствующих коэффициентам блоков 8 на 8 пикселей, производят оценку матрицы квантования по вычисленным DCT-коэффициентам, при этом изображение разбивается на несколько блоков, далее для каждой из 64 частот в каждом блоке оценивается шаг квантования, производят поиск положения сетки JPEG-сжатия, производят поиск несоответствий DCT-коэффициентов матрице квантования, производят локализацию фальсифицированных областей. 7 ил.
Способ детектирования и локализации фальсифицированной области в JPEG-изображениях, заключающийся в том, что рассматривают изображение в цветовом пространстве RGB, которое было подвержено JPEG-сжатию, после чего, при помощи программного обеспечения, были выполнены фальсификации и измененное изображение было сохранено в формате без потерь, отличающийся тем, что обнаружение фальсифицированной области основано на поиске несоответствий в структуре DCT-коэффициентов JPEG-изображения, для этого:
- вычисляют DCT-коэффициенты изображения с сохранением информации о положении соответствующих коэффициентам блоков 8 на 8 пикселей:
дополняют стороны изображения до кратности 8 черными пикселями;
трансформируют цветовое пространство из RGB в YCbCr;
производят разбиение канала яркости в цветовом пространстве YCbCr (Y) на блоки 8 на 8 пикселей;
применяют дискретное косинусное преобразование для каждого блока 8 на 8 пикселей;
отбрасывают из рассмотрения блоки, в которых присутствуют пиксели с насыщенными значениями (0 или 255) в любом канале RGB и блоки, в которых яркость (Y) в YCbCr в момент перехода из RBG в YCbCr выходила за границы диапазона [0, 1];
- производят оценку матрицы квантования по вычисленным DCT-коэффициентам, при этом изображение разбивается на несколько блоков, далее для каждой из 64 частот в каждом блоке оценивается шаг квантования:
производят вычисление факторной гистограммы h, h(x) - количество DCT-коэффициентов, которые делятся на х без остатка;
производят нормализацию h на общее количество DCT-коэффициентов;
производят оценку шага квантования как для некоторого порога Т1, если конец оценивания;
в случае нахождение у=max{х|h(x)≥Т2}, для некоторого порога Т2, если у<4 конец оценивания;
производят построение модифицированной факторной гистограммы - количество DCT-коэффициентов, которые делятся на х без остатка и не принадлежат множеству М={ky±1, k∈Z};
производят нормализацию на общее количество DCT-коэффициентов, не принадлежащих множеству М;
производят вычисление для некоторого порога Т3, если , шаг квантования оценивается как иначе как
далее для каждой частоты берется мода шага квантования по всем блокам, где оценка шага не равна 1;
- производят поиск положения сетки JPEG-сжатия:
- производят поиск несоответствий DCT-коэффициентов матрице квантования;
- производят локализацию фальсифицированных областей.
US 20180130241 A1, 10.05.2018 | |||
CN 111598881 A, 28.08.2020 | |||
US 10810725 B1, 20.10.2020 | |||
СПОСОБ ВЫЯВЛЕНИЯ ИСКАЖЕНИЙ, ВЫЗВАННЫХ ЭФФЕКТОМ ГИББСА, ПРИ JPEG-КОДИРОВАНИИ | 2008 |
|
RU2365994C1 |
СПОСОБ УДАЛЕНИЯ ИСКАЖЕНИЙ НА ЦИФРОВЫХ ИЗОБРАЖЕНИЯХ | 2008 |
|
RU2402070C2 |
Авторы
Даты
2023-01-17—Публикация
2022-05-25—Подача