Область техники, к которой относится изобретение
Настоящее изобретение относится в общем к кодированию и декодированию изображения/видео. В частности, но не исключительно, область техники настоящего изобретения относится к кодированию/декодированию изображения, значения пикселей которого относятся к расширенному динамическому диапазону.
Уровень техники
Настоящий раздел предназначен для ознакомления читателя с различными аспектами области техники, которые могут относиться к различным аспектам изобретения, описанным и/или заявленным ниже. Предполагается, что это описание будет полезно в плане обеспечения читателя справочной информацией, способствующей лучшему пониманию различных аспектов настоящего изобретения. Соответственно, следует понимать, что данные утверждения следует рассматривать в этом смысле, а не как признание уровня техники.
В нижеследующем описании цветное изображение содержит несколько массивов выборок (пиксельных значений) в определенном формате изображения/видео, в котором указана вся информация, относящаяся к пиксельным значениям изображения (или видео) и вся информация, которая может быть использована дисплеем и/или любым другим устройством, например, для отображения и/или декодирования изображения (или видео). Цветное изображение содержит по меньшей мере один компонент в виде первого массива выборок, обычно компонент яркости (или яркость), и по меньшей мере один другой компонент, в виде по меньшей мере одного другого массива выборок. Или, равным образом, та же информация может быть представлена набором массивов цветных выборок (цветовых компонентов), таких как традиционное трихроматическое представление RGB.
Значение пикселя представлено вектором C значений, где c - число компонентов. Каждый элемент вектора представлено некоторым количеством битов, которое определяет максимальный динамический диапазон значений пикселов.
Изображения со стандартным динамическим диапазоном (SDR изображения) - это цветные изображения, значения яркости которых представлены с ограниченной динамикой, обычно измеряемой в степенях числа 2 или единицами диафрагмы. Изображения SDR имеют динамику около 10 единиц диафрагмы, т.е. соотношение в 1000 между самым ярким пикселем и самым темным пикселем в линейной области, и кодируются ограниченным числом битов (чаще всего 8 или 10 в HDTV (телевизионных системах высокой четкости) и в UHDTV (телевизионных системах ультравысокой четкости) в нелинейной области, например путем использования OEFT (оптико-электронной передаточной функции) BT.709 ITU-R (Рек. ITU-R BT.709-5, апрель 2002 г.) или OETF BT.2020 ITU-R (Рек. ITU-R BT.2020-1, июнь 2014 г.) для уменьшения динамики. Это ограниченное нелинейное представление не обеспечивает возможность правильного воспроизведения небольших изменений сигнала, в частности в темном и светлом диапазонах яркости. В изображениях с расширенным динамическим диапазоном (изображениях HDR) динамика сигнала намного выше (до 20 единиц диафрагмы, соотношение в один миллион между самыми яркими пикселами и самыми темными пикселами), и необходимо новое нелинейное представление для сохранения высокой точности сигнала на всем его диапазоне. В изображениях HDR исходная информация обычно представлена в формате числа с плавающей запятой (либо 32 бит, либо 16 бит для каждого компонента, а именно в формате плавающей или полуплавающей запятой), причем самым популярным форматом является формат с полуплавающий запятой openEXR (16 бит на каждый компонент RGB, т.е. 48 бит на каждый пиксель) или в виде целых чисел с длинным представлением, обычно по меньшей мере 16 бит.
Цветовая палитра представляет собой определенный полный набор цветов. Наиболее распространенное использование относится к набору цветов, который может быть точно представлен в определенных условиях, например в определенном цветовом пространстве или посредством определенного устройства вывода.
Цветовой объем определяется цветовым пространством и динамическим диапазоном значений, представленных в вышеупомянутом цветовом пространстве.
Например, цветовая палитра определяется цветовым пространством RGB для UHDTV по Рекомендации BT.2020 ITU-R. Более ранний стандарт, Рекомендация BT.709 ITU-R, определяет меньшую цветовую палитру для HDTV. Для SDR динамический диапазон официально определяется до 100 нит (кандел на квадратный метр) для того цветового объема, в котором была закодирована информация, однако некоторые технологии отображения могут отображать более яркие пиксели.
Изображения с расширенным динамическим диапазоном (изображения HDR) - это цветные изображения, значения яркости которых представлены динамикой HDR, значение которой выше, чем динамика изображения SDR.
Динамика HDR пока еще не определена стандартом, но можно ожидать значение динамического диапазона до нескольких тысяч нит. Например, цветовой объем HDR определяется цветовым пространством RGB по BT.2020, и значения из вышеупомянутого цветового пространства принадлежат динамическому диапазону от 0 до 4000 нит. Другой пример цветового объема HDR, определенного цветовым пространством RGB согласно BT.2020, и значения, представленные в упомянутом цветовом пространстве, относятся к динамическому диапазону от 0 до 1000 нит.
Цветокоррекция изображения (или видео) - это процесс изменения/улучшения цветов изображения (или видео). Обычно цветокоррекция изображения включает в себя изменение цветового объема (цветового пространства и/или динамического диапазона) или изменение цветовой палитры относительно данного изображения. Таким образом, две версии одного изображения с различной цветокоррекцией - это версии данного изображения, значения которого представлены в различных цветовых объемах (или цветовых палитрах), или такие версии изображения, в которых по меньшей мере один из цветов изменен/улучшен в соответствии с различными значениями шкалы цветности. Это может осуществляться при взаимодействии с пользователем.
Например, в кинематографическом производстве изображение и видео снимают при помощи трихроматических камер в виде значений цветов RGB, состоящих из 3 компонентов (красный, зеленый и синий). Значения цветов RGB зависят от трихроматических характеристик (базовых цветов) датчика. Тогда получают первую версию цветокоррекции снятого изображения для получения кинематографической обработки (с использованием конкретной кинематографической шкалы). Обычно значения первой версии цветокоррекции снятого изображения представлены в соответствии со стандартным форматом YUV, таким как BT.2020, который определяет значения параметров для UHDTV.
Затем оператор цветокоррекции, обычно совместно с главным оператором, производят регулировку цветовых значений первой версии цветокоррекции снятого изображения путем тонкой настройки/корректировки некоторых значений цветов для внесения художественного замысла.
Проблема, требующая решения, состоит в распространении сжатого изображения HDR (или видео), вместе с тем одновременно распространяя связанное изображение SDR (или видео), представляющее цветокорректированную версию упомянутого изображения (или видео) HDR.
Простейшее решение состоит в одновременной передаче изображения (или видео) SDR и HDR по инфраструктуре распространения, но недостаток состоит в по существу удвоенной необходимой полосе пропускания по сравнению с ранее созданной инфраструктурой распространения, выполненной с возможностью осуществления широковещательной передачи изображения (или видео) SDR, такой как основной 10-битный профиль HEVC («High Efficiency Video Coding», SERIES H: AUDIOVISUAL AND MULTIMEDIA SYSTEMS, Рекомендация ITU-T H.265, Сектор стандартизации телекоммуникаций при ITU, апрель 2013 г.).
Использование ранее созданной инфраструктуры требуется для ускорения начала распространения изображений (или видео) HDR. Также должна быть минимизирована скорость передачи данных, в то же время обеспечивая хорошее качество как SDR, так и HDR версии изображения (или видео).
Кроме того, должна быть обеспечена обратная совместимость, т.е. изображение (или видео) SDR должно быть просматриваемым для пользователей, оснащенных ранее созданными декодером и дисплеем, т.е., в частности, общая воспринимаемая яркость (т.е. темные сцены против ярких) и воспринимаемые цвета (например, сохранение оттенков и т.д.) должны сохраниться.
Другое простое решение состоит в уменьшении динамического диапазона изображения (или видео) HDR посредством подходящей нелинейной функции, как правило, в ограниченное число бит (скажем, 10 бит), и непосредственном сжатии основным 10-битным профилем HEVC. Такая нелинейная функция (кривая) уже существует, например так называемая PQ EOTF, предложенная Dolby в SMPTE (SMPTE Standard: High Dynamic Range Electro-Optical Transfer Function of Mastering Reference Displays, SMPTE ST 2084:2014).
Недостаток этого решения состоит в отсутствии обратной совместимости, т.е. полученная сжатая версия изображения (видео) не имеет достаточного визуального качества, чтобы считаться просматриваемой как изображение (или видео) SDR, и характеристики сжатия в некоторой степени плохие.
Настоящее изобретение было создано, имея в виду вышеприведенное.
Раскрытие изобретения
Ниже представлена упрощенная краткая характеристика изобретения для обеспечения базового понимания некоторых аспектов изобретения. Эта краткая характеристика не является подробным обзором изобретения. Она не предназначена для определения ключевых или наиболее важных элементов изобретения. Нижеследующая краткая характеристика лишь представляет некоторые аспекты изобретения в простой форме в качестве вводной части к более подробному описанию, представленному ниже.
Данное изобретение ставит целью устранение по меньшей мере одного из недостатков уровня техники посредством способа кодирования цветного изображения, имеющего цветовые компоненты, отличающегося тем, что он содержит этапы, на которых:
- получают компонент яркости путем применения нелинейной функции, которая зависит от значения модуляции, полученного из яркости цветного изображения, к яркости цветного изображения таким образом, что динамика упомянутого компонента яркости снижается по сравнению с динамикой яркости цветного изображения;
- получают два компонента цветности путем:
- получают по меньшей мере одного промежуточного цветового компонента путем масштабирования каждого цветового компонента посредством коэффициента, который зависит от компонента яркости; и
- получения упомянутых двух компонентов цветности из по меньшей мере одного упомянутого промежуточного цветового компонента; и
- кодируют упомянутую яркость и два компонента цветности.
Способ позволяет получить цветное изображение SDR из цветного изображения, подлежащего кодированию, путем объединения декодированных компонентов яркости и цветности. Это цветное изображение SDR должно отображаться ранее созданным дисплеем SDR. Иными словами, такое цветное изображение SDR может быть просмотрено конечным пользователем на его ранее созданном дисплее SDR. Таким образом, способ обеспечивает обратную совместимость с любым ранее созданным дисплеем SDR.
В соответствии с вариантом выполнения, получение двух упомянутых компонентов цветности из упомянутого по меньшей мере одного промежуточного компонента цветности, содержит этапы, на которых:
- получают три промежуточных компонента путем взятия квадратного корня каждого промежуточного компонента цветности; и
- выполняют линейное объединение трех промежуточных компонентов.
Функция квадратного корня используется для аппроксимации OEFT (оптико-электронной передаточной функции), необходимой на стороне кодирования. Такая аппроксимация приводит к однозначным обратимым формулам и к декодеру низкой сложности, частично из-за того, что EOTF (электронно-оптическая передаточная функция), которая должна применяться на стороне декодирования для декодирования полной динамики входящего изображения, является в таком случае квадратной функцией.
Также изображение SDR демонстрирует в некоторой степени корректные цвета, поскольку квадратный корень является хорошей аппроксимацией стандартной функции OETF SDR, определяемой Рекомендацией ITU-R BT.709/BT.2020, используемой в HD/UHD телевидении, которая в основном имеет степень 0,45.
В соответствии с другим своим аспектом настоящее изобретение относится к способу декодирования цветного изображения из битового потока. Способ содержит этапы, на которых:
- получают первый компонент путем применения нелинейной функции к компоненту яркости, полученному из битового потока, таким образом, что динамика упомянутого первого компонента повышается по сравнению с динамикой компонента яркости;
- получают по меньше мере один цветовой компонент из упомянутого первого компонента, двух компонентов цветности, полученных из битового потока, и коэффициента, который зависит от компонента яркости; и
- формируют декодированное изображение путем объединения упомянутого по меньшей мере одного цветового компонента.
В соответствии с другими его аспектами изобретение относится к устройствам, содержащим процессор, выполненный с возможностью реализации вышеописанных способов, к компьютерному программному продукту, содержащему программные кодовые инструкции для выполнения этапов вышеописанных способов, когда эта программа выполняется на компьютере, к считываемому процессором носителю, на котором сохранены инструкции, предписывающие процессору выполнять по меньшей мере этапы вышеописанных способов, и к постоянному машиночитаемому носителю, содержащему инструкции в виде программного кода для выполнения этапов вышеописанных способов, когда упомянутая программа выполняется на вычислительном устройстве.
Конкретный характер изобретения, а также другие задачи, преимущества, признаки и применения изобретения станут очевидными из нижеприведенного описания вариантов выполнения, рассматриваемого вместе с сопровождающими чертежами.
Краткое описание чертежей
На чертежах проиллюстрирован вариант выполнения настоящего изобретения. На них показано:
На Фиг. 1 схематично представлена схема этапов способа кодирования цветного изображения в соответствии с вариантом выполнения изобретения;
На Фиг. 2 схематично представлена схема подэтапов этапа 170 в соответствии с вариантом выполнения изобретения;
На Фиг. 3 схематично представлена схема подэтапов этапа 170 в соответствии с вариантом выполнения изобретения;
На Фиг. 4 схематично представлена схема этапов способа декодирования цветного изображения из по меньшей мере одного битового потока в соответствии с вариантом выполнения изобретения;
На Фиг. 4a схематично представлена схема подэтапов этапа 230 в соответствии с вариантом выполнения изобретения;
На Фиг. 4b схематично представлена схема подэтапов этапа 230 в соответствии с вариантом выполнения изобретения;
На Фиг. 5 схематично представлена схема подэтапов этапа 231 в соответствии с вариантом выполнения изобретения;
На Фиг. 6 показан пример архитектуры устройства в соответствии с вариантом выполнения изобретения; и
На Фиг. 7 показаны два удаленных устройства, осуществляющие связь по сети связи в соответствии с вариантом выполнения изобретения.
Аналогичные или одинаковые элементы обозначены одинаковыми ссылочными позициями.
Осуществление изобретения
Настоящее изобретение будет более полно описано ниже с обращением к сопровождающим чертежам, на которых показаны варианты выполнения изобретения. Однако настоящее изобретение может быть реализовано во множестве альтернативных форм и его не следует истолковывать как ограниченное вариантами выполнения, представленными в настоящем документе. Соответственно, при том, что изобретение допускает различные модификации и альтернативные формы, конкретные варианты его выполнения показаны в качестве примера на чертежах и будут подробно описаны в настоящем документе. Однако следует понимать, что не подразумевается ограничение изобретения конкретными раскрытыми формами, но напротив, изобретение должно охватывать все модификации, эквиваленты и альтернативы в рамках сущности и объема изобретения, определяемых формулой изобретения.
Терминология, используемая в настоящем документе, предназначена только для описания конкретных вариантов выполнения и не предназначена для ограничения изобретения. В контексте настоящего документа подразумевается, что формы единственного числа включают в себя также и формы множественного числа, если контекст явным образом не указывает на иное. Кроме того, следует понимать, что понятия «содержит», «содержащий», «включает в себя» и/или «включающий в себя» при использовании в настоящем описании указывают на наличие перечисленных признаков, единиц, этапов, операций, элементов и/или компонентов, но не исключают наличия или добавления одного или более других признаков, единиц, этапов, операций, элементов, компонентов и/или их групп. Кроме того, когда элемент называется «реагирующим» или «соединенным» с другим элементом, он может быть непосредственно реагирующим на другой элемент или соединенным с ним, или могут присутствовать промежуточные элементы. Напротив, когда элемент называется «непосредственно реагирующим» или «непосредственно соединенным» с другим элементом, промежуточные элементы отсутствуют. В контексте настоящего документа понятие «и/или» включает в себя любые и все сочетания одного или более связанных перечисленных элементов и может быть сокращено до «/».
Следует понимать, что хотя понятия первый, второй и т.п. могут использоваться в настоящем документе для описания различных элементов, эти элементы не должны ограничиваться этими понятиями. Эти понятия используются только для того, чтобы отличить один элемент от другого. Например, первый элемент может быть назван вторым элементом, и, аналогичным образом, второй элемент может быть назван первым элементом без выхода за рамки замысла изобретения.
Хотя некоторые из схем включают в себя стрелки на линиях связи для указания главного направления связи, следует понимать, что связь может осуществляться и в направлении, противоположном указанному стрелками.
Некоторые варианты выполнения описаны с обращением к блок-схемам и блок-схемам операций, в которых каждый блок представляет элемент схемы, модуль или часть кода, которые содержат одну или более исполняемых инструкций для реализации указанной(ых) логической(их) функции(й). Также следует отметить, что в других вариантах реализации функция(ии), указанная(ые) в блоках, могут иметь место в порядке, отличном от указанного. Например, два последовательно показанных блока могут на самом деле выполняться по существу одновременно, или блоки могут иногда выполняться в обратном порядке, в зависимости от используемых функциональных возможностей.
Упоминание в настоящем документе «одного варианта выполнения» или «варианта выполнения» означает, что конкретный признак, структура или характеристика, описанные в связи с вариантом выполнения, могут быть включены по меньшей мере в один вариант реализации изобретения. Употребление словосочетания «в одном варианте выполнения» или «согласно варианту выполнения» в различных частях описания не обязательно всегда относится к одному и тому же варианту выполнения, а отдельные или альтернативные варианты выполнения не обязательно являются взаимоисключающими по отношению к другим вариантам выполнения.
Ссылочные позиции, используемые в формуле изобретения, приведены только в качестве иллюстрации и не должны оказывать ограничивающее влияние на объем формулы изобретения.
Не будучи описанными в явном виде, настоящие варианты выполнения и варианты могут применяться в любом сочетании или подсочетании.
В варианте выполнения коэффициент зависит от значения Ba модуляции. Значение модуляции (или фоновой подсветки) обычно ассоциировано с изображением HDR и представляет яркость изображения HDR. В данном случае понятие (модуляции) фоновой подсветки используется по аналогии с телевизорами, выполненными из цветной панели, такой как, например, панель LCD, и устройства задней подсветки, такого как, например, массив LED. Заднее устройство, обычно формирующее белый свет, используется для освещения цветной панели для обеспечения большей яркости для телевизора. Вследствие этого, яркость телевизора является произведением яркости задней подсветки и яркости цветной панели. Эта задняя подсветка часто называется «модуляцией» или «фоновой подсветкой», а ее интенсивность в некоторой степени представляет яркость общей сцены.
Изобретение описано в отношении кодирования/декодирования цветного изображения, но распространяется на кодирование/декодирование последовательности изображений (видео), поскольку каждое цветное изображение в последовательности последовательно кодируется/декодируется, как описано ниже.
Ниже цветное изображение I рассматривается как имеющее три цветовых компонента Ec (c=1, 2 или 3), в которых представлены значения пикселей цветного изображения I.
Настоящее изобретение не ограничено каким-либо цветовым пространством, в котором представлены три цветовых компонента Ec, но распространяется на любое цветовое пространство, такое как RGB, CIELUV, XYZ, CIELab и т.п.
На Фиг. 1 схематично представлена схема этапов способа кодирования цветного изображения I в соответствии с вариантом выполнения изобретения.
Главным образом, способ определяет (и кодирует) компонент L яркости и два компонента C1 и C2 цветности из трех цветовых компонентов Ec цветного изображения I, подлежащего кодированию. Компоненты яркости и цветности образуют цветное изображение SDR, значения пикселей которого представлены в цветовом пространстве (L, C1, C2). Упомянутое цветное изображение SDR является просматриваемым на ранее созданном дисплее SDR display, т.е. обладает достаточным визуальным качеством для того, чтобы просматривать его на ранее созданном дисплее SDR.
На этапе 110 модуль IC получает компонент Y, который представляет яркость цветного изображения I, путем линейного объединения трех компонентов Ec:
где A1 - первая строка матрицы A 3×3, которая определяет преобразование цветового пространства из цветового пространства (E1, E2, E3) в цветовое пространство (Y, C1, C2).
На этапе 130 модуль FM получает компонент L яркости путем применения нелинейной функции f к компоненту Y:
(1)
где Ba - значение модуляции, полученное из компонента Y модулем BaM (этап 120).
Применение нелинейной функции f к компоненту Y уменьшает его динамический диапазон. Другими словами, динамика компонента L яркости снижается по сравнению с динамикой компонента Y.
В общем случае, динамический диапазон компонента Y уменьшается таким образом, чтобы значения яркости компонента L были представлены с использованием 10 битов.
В соответствии с вариантом выполнения, компонент Y делится на значение Ba модуляции перед применением нелинейной функции f:
(2)
В соответствии с вариантом выполнения, нелинейная функция f является функцией кривой гамма-распределения:
где Y1 равно либо Y, либо Y/Ba в соответствии с вариантами выполнения по уравнениям (1) или (2), B является постоянным значением, γ является параметром (действительной величиной строго меньше 1).
В соответствии с вариантом выполнения, нелинейная функция f является функцией S-образной логистической кривой (S-Log):
где a, b и c - параметры (действительные значения) кривой SLog, определяемые таким образом, что f(0) и f(1) являются неизменными, а производная кривой SLog является постоянной в 1, если она продолжается кривой гамма-распределения менее 1. Таким образом, a, b и c зависят от параметра γ. Характерные значения показаны в таблице 1.
Таблица 1
В предпочтительном варианте выполнения значение γ, близкое к 1/2,5, является эффективным с точки зрения характеристик сжатия HDR, а также хорошей пригодности к просмотру полученных значений яркости SDR. Таким образом, данные 3 параметра могут с достижением преимущества принимать следующие значения: a=0,44955114, b=0,12123691, c=0,94855684.
В соответствии с вариантом выполнения, нелинейная функция f является либо функцией коррекции кривой гамма-распределения, либо функцией коррекции S-образной логистической кривой (Slog) в соответствии со значениями пикселей компонента Y.
Применение коррекции кривой гамма-распределения к компоненту Y осветляет темные области, но не достаточно затемняет светлые области, чтобы избежать «выжигания» пикселей ярких областей.
Кроме того, согласно варианту выполнения, модуль FM применяет либо коррекцию кривой гамма-распределения, либо коррекцию Slog в соответствии со значениями пикселей компонента Y. Информационные данные Inf могут указывать на то, применяется ли коррекция кривой гамма-распределения или коррекция Slog.
Например, когда значение пикселя в компоненте Y ниже пороговой величины (равной 1), применяется коррекция кривой гамма-распределения, а иначе применяется коррекция SLog.
В соответствии с вариантом выполнения этапа 120, значение Ba модуляции является средним, медианным, минимальным или максимальным значением для значений пикселей компонента Y. Эти операции могут выполняться в линейной области яркости HDR Ylin или в нелинейной области, такой как ln(Y) или Yγ при γ<1.
В соответствии с вариантом выполнения, когда способ используется для кодирования нескольких цветных изображений, относящихся к последовательности изображений, значение Ba модуляции определяется для каждого цветного изображения, группы изображений (GOP) или для части цветного изображения, такой как, не ограничиваясь, серия последовательных макроблоков или блок передачи, определенные в HEVC.
В соответствии с вариантом выполнения, значение Ba и/или параметры нелинейной функции f (такие как a, b, c или γ) и/или информационные данные Inf хранятся в локальной или удаленной памяти и/или добавляются в битовый поток BF, как проиллюстрировано на Фиг. 1.
На этапе 140 получают по меньшей мере один цветовой компонент Eс (c=1, 2, 3) из цветного изображения I. Цветовой компонент Ec может быть получен непосредственно из локальной или удаленной памяти или путем применения цветового преобразования к цветному изображению I.
На этапе 150 получают промежуточный цветовой компонент E'c (c=1, 2 или 3) путем масштабирования каждого цветового компонента Ec посредством коэффициента r(L), который зависит от компонента L яркости:
где является коэффициентом (действительным значением), определяемым модулем RM (этап 160), который зависит от значения пикселя i компонента L, является значением пикселя i промежуточного цветового компонента E'c, и является значением пикселя i цветового компонента Ec.
Масштабирование посредством коэффициента означает умножение на упомянутый коэффициент или деление на величину, обратную упомянутому коэффициенту.
Масштабирование каждого цветового компонента Ec посредством коэффициента r(L), который зависит от компонента L яркости, сохраняет тон цветов цветного изображения I.
В соответствии с вариантом выполнения этапа 160, коэффициент r(L) является отношением компонента L яркости к компоненту Y:
причем Y(i) является значением пикселя i компонента Y. Фактически значение Y(i) пикселя компонента Y явным образом зависит от значения L(i) пикселя компонента L яркости таким образом, что отношение может быть записано только как функция L(i).
Данный вариант выполнения является предпочтительным, поскольку масштабирование каждого цветового компонента Ec посредством коэффициента r(L), который дополнительно зависит от компонента Y, сохраняет тон цветов цветного изображения I и таким образом повышает визуальное качество декодированного цветного изображения.
Более точно, в колориметрии и теории цветов красочность, цветность и насыщенность относятся к воспринимаемой интенсивности конкретного цвета. Красочность является уровнем разности между цветом и серым цветом. Цветность является красочностью относительно яркости другого цвета, который выглядит белым при аналогичных условиях просмотра. Насыщенность является красочностью цвета относительно его собственной яркости.
Обладающий высокой красочностью стимул является ярким и интенсивным, в то время как менее красочный стимул кажется более приглушенным, более близким к серому цвету. При полном отсутствии красочности цвет является «нейтральным» серым (изображение с отсутствующей красочностью в любом из его цветов называется изображением в оттенках серого). Любой цвет может быть описан с точки зрения его красочности (или цветности или насыщенности), светлости (или яркости) и тона.
Определение тона и насыщенности цвета зависит от цветового пространства, используемого для представления упомянутого цвета.
Например, при использовании цветового пространства CIELUV насыщенность определяется как отношение между цветностью и яркостью .
Тогда тон определяется как
В соответствии с другим примером, когда используется цветовое пространство CIELAB, насыщенность определяется как отношение цветности к яркости:
Тогда тон определяется как
Эти уравнения являются разумным средством прогнозирования насыщенности и тона, которые согласуются с восприятием насыщенности человеком, и показывают, что регулирование яркости в цветовом пространстве CIELAB (или CIELUV) при сохранении угла a*/b* (или u*/v*) неизменным влияет на тон и таким образом на восприятие одного и того же цвета. На этапе 150 масштабирование цветовых компонентов Ec посредством одинакового коэффициента сохраняет данный угол, и таким образом - тон.
Теперь будем считать, что цветное изображение I представлено в цветовом пространстве CIELUV, а изображение I2, которое сформировано путем объединения компонента L яркости, динамический диапазон которого уменьшен по сравнению с динамическим диапазоном яркости цветного изображения I (этап 130), и двух компонентов U (=C1) и V (=C2) цветности цветового пространства CIELUV. Таким образом цвета цветного изображения I2 по-другому воспринимаются человеком, поскольку насыщенность и тон цветов изменились. Способ (этап 150) определяет компоненты C1 и C2 цветности изображения I2 таким образом, чтобы тон цветов изображения I2 наилучшим образом соответствовал тону цветов цветного изображения I.
В соответствии с вариантом выполнения этапа 160, коэффициент r(L) определяется:
Этот последний вариант выполнения является предпочтительным, поскольку он исключает уменьшение коэффициента до нуля для очень темных пикселей, т.е. позволяет инвертировать соотношение вне зависимости от значения пикселей.
На этапе 170 получают два компонента C1, C2 цветности из упомянутого по меньшей мере одного промежуточного цветового компонента E'c.
В соответствии с вариантом выполнения этапа 170, проиллюстрированным на Фиг. 2, по меньшей мере один промежуточный компонент Dc (c=1, 2 или 3) получают путем применения (этап 171) OETF к каждому промежуточному цветовому компоненту (E'c):
Например, OETF определяется рекомендацией BT.709 или BT.2020 ITU-R и устанавливается следующим образом:
.
Этот вариант выполнения допускает уменьшение динамического диапазона в соответствии с конкретной OETF, но приводит к сложному процессу декодирования, как подробно описано ниже.
В соответствии с вариантом данного варианта выполнения, проиллюстрированным на Фиг. 3, OETF аппроксимируется квадратным корнем, т.е. по меньшей мере один промежуточный компонент Dc (c=1, 2 или 3) получают путем взятия квадратного корня (этап 171) из каждого промежуточного цветового компонента (Eʹc):
Данный вариант выполнения является предпочтительным, поскольку он обеспечивает хорошую аппроксимацию OETF, определяемой рекомендацией BT.709 или BT.2020 ITU-R и приводит к декодеру низкой сложности.
В соответствии с другим вариантом данного варианта выполнения OETF аппроксимируется кубическим корнем, т.е. по меньшей мере один промежуточный компонент Dc (c=1, 2 или 3) получают путем взятия кубического корня (этап 171) каждого промежуточного цветового компонента (Eʹc):
,
Данный вариант выполнения является предпочтительным, поскольку он обеспечивает хорошую аппроксимацию OETF, определенной рекомендацией BT.709 или BT.2020 ITU-R, но он приводит к несколько более сложному декодеру, чем декодер, получаемый при аппроксимации OETF квадратным корнем.
На этапе 172 модуль LC1 получает два компонента C1 и C2 цветности путем линейного объединения трех промежуточных компонентов Dc:
где A2 и A3 являются второй и третьей строками матрицы A 3×3.
На этапе 180 по Фиг. 1 кодер ENC кодирует компонент L яркости и два компонента C1 и C2 цветности.
В соответствии с вариантом выполнения кодированный компонент L и компоненты C1, C2 яркости сохраняются в локальной или удаленной памяти и/или добавляются в битовый поток F.
Фиг. 4 схематично показывает схему этапов способа декодирования цветного изображения из по меньшей мере битового потока в соответствии с вариантом выполнения изобретения.
На этапе 210 декодер DEC получает компонент L яркости и два компонента C1, C2 цветности путем по меньшей мере частичного декодирования битового потока F.
На этапе 220 модуль IFM получает первый компонент Y путем применения нелинейной функции f-1 к компоненту L яркости таким образом, что динамика первого компонента Y повышается по сравнению с динамикой компонента L яркости:
(3)
Нелинейная функция f-1 является обратной по отношению к нелинейной функции f (этап 130).
Таким образом, варианты выполнения функции f-1 определяются в соответствии с вариантами выполнения функции f.
В соответствии с вариантом выполнения, значение Ba и/или параметры нелинейной функции f-1 (такие как a, b, c или γ) и/или информационные данные Inf получают из локальной или удаленной памяти (например, справочной таблицы) и/или из битового потока BF, как проиллюстрировано на Фиг. 4.
В соответствии с вариантом выполнения компонент L яркости умножают на значение Ba модуляции после применения нелинейной функции f-1:
(4)
В соответствии с вариантом выполнения нелинейная функция f-1 является обратной функции кривой гамма-распределения.
Компонент Y тогда определяется:
где Y1 равно Y или Y/Ba в соответствии с вариантами выполнения уравнений (3) или (4), B является постоянным значением, γ является параметром (действительным значением строго меньше 1).
В соответствии с вариантом выполнения нелинейная функция f-1 является обратной по отношению к функции S-Log. Компонент Y1 тогда определяется:
В соответствии с вариантом выполнения нелинейная функция f является обратной по отношению либо к коррекции кривой гамма-распределения, либо к коррекции SLog в соответствии со значениями пикселей компонента Y. На это указывают информационные данные Inf.
На этапе 230 модуль ILC получает по меньшей мере один цветовой компонент Ec из первого компонента Y, двух компонентов C1, C2 цветности, и из коэффициента r(L), который зависит от компонента L яркости. Затем получают декодированное цветовое изображение путем объединения упомянутого по меньшей мере одного цветового компонента Ec.
Коэффициент r(L) может быть получен либо из локальной, либо из удаленной памяти (такой как справочная таблица) или из битового потока BF или F.
Когда общая OETF применяется к каждому промежуточному цветовому компоненту E'c (этап 171 по Фиг. 2), промежуточные компоненты Dc относятся к компоненту Y, двум компонентам C1, C2 цветности и коэффициенту r(L):
(5a)
и
(5b)
где EOTF (электронно-оптическая передаточная функция) является обратной по отношению к OETF, применяемой на этапе 171.
Уравнение (5b) дает:
(6)
где , являются постоянными, зависящими от матрицы A, и Li являются линейными функциями, также зависящими от матрицы A. Тогда уравнение (5a) принимает вид:
(7)
и тогда
(8)
Уравнение (8) является имплицитным уравнением только по отношению к D1. В зависимости от выражения EOTF, уравнение (8) может быть решено более или менее просто. Когда оно решено, получен D1, D2, D3 выводятся из D1 посредством уравнения (6). Тогда промежуточные цветовые компоненты E'c получают путем применения EOTF к трем полученным промежуточным компонента Dc, т.е. E'c=EOTF(Dc).
В этом общем случае, т.е. когда общая OETF (не обладающая каким-либо конкретным свойством) применяется к каждому промежуточному цветовому компоненту E'c, не существует аналитического решения для уравнения (8). Например, когда OETF представляет собой OETF по BT.709/2020 ITU-R, уравнение (8) может быть численно решено путем использования так называемого способа Ньютона или любого другого численного способа нахождения корня регулярной функции. Однако это приводит к декодерам высокой сложности.
В этом общем случае, в соответствии с первым вариантом выполнения этапа 230, проиллюстрированным на Фиг. 4a, на этапе 231 модуль ILEC получает три промежуточных цветовых компонента Eʹc из первого компонента Y, двух компонентов C1, C2 цветности и коэффициента r(L), как пояснено выше. На этапе 232 три цветовых компонента Ec получают путем масштабирования каждого промежуточного цветового компонента E'c посредством коэффициента r(L):
где является коэффициентом, обеспечиваемым этапом 160, который зависит от значения пикселя i компонента L (выход этапа 210), является значением пикселя i промежуточного цветового компонента E'c, и является значением пикселя i цветового компонента Ec.
Фактически данный порядок - этап 231 перед этапом 232 - является обратным по отношению к порядку следования за этапом 150 этапа 170 способа кодирования.
В соответствии с вариантом данного варианта выполнения OEFT является функцией квадратного корня, а EOTF в таком случае является квадратной функцией.
В соответствии с другим вариантом данного первого варианта выполнения OEFT является функцией кубического корня, а EOTF в таком случае является кубической функцией.
Когда на этапе 171 используется OETF, выполняется условие перестановки, а именно
OETF(x*y)= OETF(x) * OETF(y),
компонент Y и цветовые компоненты Ec соотносятся посредством:
(9)
где Fc являются компонентами, равными OETF(Ec), и
таким образом, что условие перестановки дает
(10)
Уравнение (10) дает
где являются постоянными, зависящими от матрицы A, а Li являются линейными функциями, также зависящими от матрицы A.
Тогда уравнение (9) принимает вид
(11)
и тогда
(12)
Когда OETF соответствует условиям перестановки, в соответствии со вторым вариантом выполнения этапа 230, проиллюстрированным на Фиг. 4b, на этапе 232 получают два промежуточных компонента C'1 и C'2 путем масштабирования двух компонентов C1 и C2 цветности посредством коэффициента OEFT(r(L(i))), причем OETF является функцией, используемой на этапе 171 по Фиг. 2:
где является коэффициентом, обеспечиваемым этапом 160, который зависит от значения пикселя i компонента L (выход этапа 210), , соответственно являются значениями пикселя i компонента C'1 и C'2, , соответственно, являются значениями пикселя i компонента C1 и C2.
На этапе 231 модуль ILEC получает три цветовых компонента Ec из первого компонента Y и два промежуточных компонента C'1, C'2 цветности, как пояснено выше.
В соответствии с вариантом второго варианта выполнения OEFT является функцией квадратного корня, и тогда EOTF является квадратной функцией. Затем на этапе 232 по Фиг. 4b получают два промежуточных компонента C'1 и C'2 путем масштабирования двух компонентов C1 и C2 цветности посредством коэффициента
Уравнение (9) принимает вид:
(11)
и
таким образом, что перестановка дает
(12)
Уравнение (11) принимает вид:
(13) и
(14)
Уравнение (14) является уравнением второго порядка, которое может быть аналитически решено. Это аналитическое решение приводит к конкретному варианту выполнения этапа 231, проиллюстрированному на Фиг. 5. Этот вариант выполнения является предпочтительным, поскольку он допускает аналитическое выражение EOTF (обратной OETF) и, таким образом, - декодированных компонентов изображения. Кроме того, тогда EOTF является квадратной функцией, которая представляет собой процесс низкой сложности на стороне декодирования.
На этапе 2310 модуль SM получает второй компонент S путем объединения двух промежуточных компонентов C'1, C'2 цветности и первого компонента Y:
где и являются значениями параметров, и означает возведенный в квадрат компонент (c=1 or 2).
На этапе 2311 модуль LC2 obtains получает три компонента Fc решения путем линейного объединения промежуточного компонента C'1, C'2 цветности и второго компонента S:
где C является матрицей 3×3, определяемой как обратная по отношению к матрице A.
На этапе 2312 получают три цветовых компонента Ec путем возведения в квадрат каждого из промежуточных цветовых компонентов (Dc):
Матрица A определяет преобразование изображения I, подлежащего кодированию, из цветового пространства (E1, E2, E3), в котором представлены значения пикселей изображения, подлежащего кодированию, в цветовое пространство (Y, C1, C2).
Такая матрица зависит от палитры цветового изображения, подлежащего кодированию.
Например, если изображение, подлежащее кодированию, представлено в палитре BT709, определяемой Рек. 709 ITU-R, матрица A определяется как:
а матрица C определяется как:
В соответствии с вариантом этого второго варианта выполнения, OEFT является функцией кубического корня, и тогда EOTF является кубической функцией. Тогда на этапе 232 по Фиг. 4b два промежуточных компонента C'1 и C'2 могут быть получены путем масштабирования двух компонентов C1 и C2 цветности посредством коэффициента:
Тогда EOTF является кубической функцией, приводя таким образом к уравнению (14) по F1, которое является более сложным уравнением третьего порядка, которое может быть аналитически решено так называемым способом Кардано.
Также существуют очень сложные аналитические решения для уравнения четвертого порядка (способ Феррари), но уже для уравнений порядка, большего или равного пяти, таких решений не существует, как установлено теоремой Абеля-Руффини.
Декодер DEC выполнен с возможностью декодирования данных, которые закодированы кодером ENC.
Кодер ENC (и декодер DEC) не ограничен конкретным кодером (декодером), но когда необходим энтропийный кодер (декодер), предпочтительным является такой энтропийный кодер, как кодер Хаффмана, арифметический кодер или кодер, адаптивный к контексту, такой как Cabac, используемый в H264/AVC или HEVC.
Кодер ENC (и декодер DEC) не ограничен конкретным кодером, который может быть, например, ранее разработанным кодером кадров/видео с потерями, таким как JPEG, JPEG2000, MPEG2, H264/AVC или HEVC.
На Фиг. 1-5 модули являются функциональными блоками, которые могут быть или не быть соотносимы с различимыми физическими блоками. Например, эти модули или некоторые из них могут быть объединены в уникальном компоненте или схеме, или могут быть задействованы в функциональных возможностях программного обеспечения. Напротив, некоторые модули могут потенциально быть составлены из отдельных физических объектов. Устройства, совместимые с данным изобретением, реализуются с использованием либо исключительно аппаратного обеспечения, например с использованием специализированного аппаратного обеспечения, такого как ASIC или FPGA или VLSI, что означает, соответственно, «специализированную интегральную схему», «программированную пользователем вентильную матрицу», «сверхбольшую интегральную схему», или нескольких интегрированных электронных компонентов, встроенных в устройство, или сочетания аппаратных и программных компонентов.
Фиг. 6 представляет примерную архитектуру устройства 60, которое может быть выполнено с возможностью осуществления способа, описанного в отношении Фиг. 1-5.
Устройство 60 содержит следующие элементы, соединенные шиной 61 адреса и данных:
- микропроцессор 62 (или CPU), который является, например, DSP (или цифровым сигнальным процессором);
- ROM (или постоянное запоминающее устройство) 63;
- RAM (или оперативное запоминающее устройство) 64;
- интерфейс -5 I/O для передачи и/или приема данных из приложения; и
- батарею -6
В соответствии с вариантом, батарея 66 является внешней по отношению к устройству. Каждый из этих элементов по Фиг. 6 хорошо известен специалистам данной области техники и не будет дополнительно описан. В каждом из упомянутых запоминающих устройств слово «регистр», используемое в данном описании, может соответствовать области малой вместимости (несколько битов) или очень большой области (например, целой программе или большому объему принятых или декодированных данных). ROM -3 содержит по меньшей мере программу и параметры. Алгоритм способов в соответствии с данным изобретением сохранен в ROM 63. При включении CPU 62 загружает программу в RAM и выполняет соответствующие инструкции.
RAM 64 содержит в регистре программу, выполняемую CPU 62 и загруженную после включения устройства 60, введенные данные в регистре, промежуточные данные в различных состояниях в соответствии со способом в регистре, и другие переменные, используемые для выполнения способа, в регистре.
Варианты реализации, описанные в настоящем документе, могут быть реализованы, например, в способе или процессе, в устройстве, в программе, в потоке данных или в сигнале. Даже если оно описано только в контексте одной формы реализации (например, описано только в виде способа или устройства), реализация описанных признаков может быть также осуществлена в других формах (например, в виде программы). Устройство может быть реализовано, например, в надлежащем аппаратном обеспечении, программном обеспечении и микропрограммном обеспечении. Способы могут быть реализованы, например, в устройстве, таком как, например, процессор, что относится к устройствам обработки данных в общем, включая, например, компьютер, микропроцессор, интегральную схему или программируемое логическое устройство. Процессоры также включают в себя устройства связи, такие как, например, компьютеры, сотовые телефоны, портативные/карманные персональные компьютеры ("PDA") и другие устройства, которые способствуют обмену информацией между конечными пользователями.
В соответствии с конкретным вариантом выполнения кодирования или кодера, цветное изображение I получают из источника. Например, источник относится к набору, содержащему:
- локальную память (63 или -4), например видеопамять или RAM (или оперативное запоминающее устройство), флэш-память, ROM (или постоянное запоминающее устройство), жесткий диск;
- интерфейс запоминающих устройств, например интерфейс с накопителем данных, RAM, флэш-памятью, ROM, оптическим диском или магнитным накопителем;
- интерфейс (65) связи, например интерфейс проводной линии (например, шинный интерфейс, интерфейс глобальной сети, интерфейс локальной сети) или беспроводной интерфейс (такой как интерфейс IEEE 802.11 или интерфейс Bluetooth®); и
- схему съемки изображения (например, датчик, такой как, например, CCD (или прибор с зарядовой связью) или CMOS (комплементарная структура металл-оксид-полупроводник)).
В соответствии с различными вариантами выполнения декодирования или декодера декодированное изображение или цветовой компонент Ec отправляют в устройство-получатель; более конкретно, устройство-получатель относится к набору, содержащему:
- локальную память (63 или 64), например видеопамять или RAM (или оперативное запоминающее устройство), флэш-память, ROM (или постоянное запоминающее устройство), жесткий диск;
- интерфейс запоминающих устройств, например интерфейс с накопителем данных, RAM, флэш-памятью, ROM, оптическим диском или магнитным накопителем;
- интерфейс (65) связи, например интерфейс проводной линии (например, шинный интерфейс, интерфейс глобальной сети, интерфейс локальной сети) или беспроводной интерфейс (такой как интерфейс IEEE 802.11 или интерфейс Bluetooth®); и
- дисплей.
В соответствии с различными вариантами выполнения кодирования или кодера, получателю отправляют битовый поток BF и/или F. В качестве примера, один из битовых потоков F и BF или оба битовых потока F и BF сохраняют в локальной или удаленной памяти, например в видеопамяти (64) или RAM (64), на жестком диске (63). В одном варианте один или оба битовых потока отправляют в интерфейс запоминающих устройств, например в интерфейс с накопителем данных, флэш-памятью, ROM, оптическим диском или магнитным накопителем, и/или передают через интерфейс (65) связи, например интерфейс линии связи между точками, шины передачи данных, линии связи точки со множеством точек или сети широковещательной передачи.
В соответствии с различными вариантами выполнения декодирования или декодера битовый поток BF и/или F получают из источника. В качестве примера, битовый поток считывают из локальной памяти, например из видеопамяти (64), RAM (64), ROM (63), флэш-памяти (63) или с жесткого диска (63). В одном варианте битовый поток принимают из интерфейса запоминающих устройств, например интерфейса с накопителем данных, RAM, ROM, флэш-памятью, оптическим диском или магнитным накопителем, и/или принимают из интерфейса (65) связи, например интерфейса линии связи между точками, шины передачи данных, линии связи точки со множеством точек или сети широковещательной передачи.
В соответствии с различными вариантами выполнения устройство 60, выполненное с возможностью реализации способа кодирования, описанного в отношении Фиг. 1-3, относится к набору, содержащему:
- мобильное устройство;
- устройство связи;
- игровое устройство;
- планшет (или планшетный компьютер);
- ноутбук;
- фотокамеру;
- видеокамеру;
- микросхему кодирования;
- сервер фотоизображений; и
- сервер видео (например, сервер широковещательной передачи данных, сервер передачи видео по запросу или сервер сети Интернет).
В соответствии с различными вариантами выполнения устройство 60, выполненное с возможностью реализации способа, описанного в отношении Фиг. 4, 4a, 4b и 5, относится к набору, содержащему:
- мобильное устройство;
- устройство связи;
- игровое устройство;
- абонентскую приставку;
- телевизор;
- планшет (или планшетный компьютер);
- ноутбук;
- дисплей и
- микросхему декодирования.
В соответствии с вариантом выполнения, проиллюстрированным на Фиг. 7, в контексте передачи между двумя удаленными устройствами A и B по сети NET связи, устройство A содержит средства, которые выполнены с возможностью реализации способа кодирования изображения, описанного в отношении Фиг. 1-3, а устройство B содержит средства, которые выполнены с возможностью реализации способа декодирования, описанного в отношении Фиг. 4, 4a, 4b и 5.
В соответствии с вариантом изобретения, сеть является сетью широковещательной передачи, выполненной с возможностью широковещательной передачи фотоизображений или видеоизображений от устройства A к декодирующим устройствам, включая устройство B.
Варианты реализации различных процессов и признаков, описанных в настоящем документе, могут быть реализованы в разнообразных устройствах или приложениях. Примеры таких устройств включают в себя кодер, декодер, постпроцессор, обрабатывающий выходные данные декодера, препроцессор, обеспечивающий входные данные для кодера, видеокодер, видеодекодер, видеокодек, сервер сети Интернет, абонентскую приставку, ноутбук, персональный компьютер, сотовый телефон, PDA и любое другое устройство для обработки изображения или видео, или другие устройства связи. Следует понимать, что устройство может быть мобильным и даже установленным на подвижном транспортном средстве.
Кроме того, способы могут быть реализованы посредством инструкций, выполняемых процессором, и такие инструкции (и/или значения данных, формируемые вариантом реализации) могут быть сохранены на машиночитаемом носителе. Машиночитаемый носитель может иметь форму машиночитаемого программного продукта, реализованного на одном или более машиночитаемых носителях, на которых реализован машиночитаемый программный код, выполняемый компьютером. Машиночитаемый носитель в контексте настоящего документа считается постоянным машиночитаемым носителем, которому присуща возможность сохранения информации на нем, а также присуща возможность обеспечения извлечения информации из него. Машиночитаемый носитель может быть, в качестве примера, но не ограничения, электронным, магнитным, оптическим, электромагнитным, инфракрасным, или полупроводниковой системой или устройством, или любым надлежащим сочетанием вышеупомянутого. Следует понимать, что нижеуказанное, обеспечивая более конкретные примеры машиночитаемых носителей, к которым могут быть применены принципы настоящего изобретения, является лишь иллюстративным, но не исчерпывающим перечнем, что будет с легкостью понятно специалисту в данной области техники: переносная компьютерная дискета; жесткий диск; постоянное запоминающее устройство (ROM); стираемое программируемое постоянное запоминающее устройство (EPROM или флэш-память); переносное постоянное запоминающее устройство на компакт-диске (CD-ROM); оптическое запоминающее устройство; магнитное запоминающее устройство; или любое надлежащее сочетание вышеперечисленного.
Инструкции могут образовывать программное приложение, материально реализованное на считываемом процессором носителе.
Инструкции могут быть, например, в аппаратном обеспечении, микропрограммном обеспечении, программном обеспечении или их сочетании. Инструкции могут находиться, например, в операционной системе. в отдельном приложении или сочетании их обоих. Таким образом, процессор может быть охарактеризован, например, и как устройство, выполненное с возможностью выполнения процесса, и как устройство, которое включает в себя считываемый процессором носитель (такой как запоминающее устройство), имеющий инструкции для выполнения процесса. Кроме того, в дополнение к инструкциям или вместо них, считываемый процессором носитель может сохранять значения данных, формируемые вариантом реализации.
Как будет очевидно специалисту в данной области техники, варианты реализации могут формировать множество сигналов, имеющих формат для передачи информации, которая может быть, например, сохранена или передана. Информация может включать в себя, например, инструкции для выполнения способа, или данные, формируемые одним из описанных вариантов реализации. Например, a сигнал может иметь формат для передачи в качестве данных правил для записи или считывания синтаксиса в соответствии с описанным вариантом выполнения, или для передачи в качестве данных фактических значений синтаксиса, записанных описанным вариантом выполнения. Такой сигнал может иметь формат, например, в виде волны электромагнитного излучения (например, с использованием радиочастотного участка спектра) или в виде сигнала основной полосы частот. Форматирование может включать в себя, например, кодирование потока данных и модуляцию несущей кодированным потоком данных. Информация, передаваемая сигналом, может быть, например, информацией в аналоговой или цифровой форме. Сигнал может передаваться по различным проводным или беспроводным соединениям, которые известны. Сигнал может сохраняться на считываемом процессором носителе.
Было описано несколько вариантов реализации. Тем не менее, следует понимать, что могут быть выполнены различные изменения. Например, элементы различных вариантов реализации могут быть объединены, дополнены, изменены или удалены для формирования других вариантов реализации. Кроме того, специалисту в данной области техники будет понятно, что различные структуры и процессы могут быть заменены описанными, и полученные варианты реализации будут выполнять по меньшей мере по существу те же функции по меньшей мере по существу тем же образом, для достижения по меньшей мере по существу тех же результатов, что и в описанных вариантах реализации. Соответственно, эти и другие варианты реализации.
Изобретение относится к вычислительной технике. Технический результат – обеспечение обратной совместимости изображений с SDR. Способ кодирования цветного изображения, имеющего цветовые компоненты (Ec), содержит этапы: получения компоненты яркости (L) на основе: значения модуляции (Ba) из яркости (Y) цветного изображения; масштабированной яркости, полученной путем деления яркости (Y) цветного изображения на значение (Ba) модуляции; компоненты (L) яркости путем применения нелинейной функции к масштабированной яркости так, что динамика компонента (L) яркости снижается по сравнению с динамикой масштабированной яркости; получения двух компонент (C1, C2) цветности, на основе: коэффициента (r(L(i)), который зависит от значения пикселя (i) компонента (L(i)) яркости и значения (Y(i)) яркости, имеющего то же местоположение пикселя (i) в цветном изображении; промежуточного цветового компонента (E'c) путем умножения каждого цветового компонента (Ec) на коэффициент (r(L(i)); и двух компонентов цветности (C1, C2), полученных из упомянутого промежуточного цветового компонента (E'c); и кодирование яркости (L) и двух компонент цветности (C1, C2). 8 н. и 15 з.п. ф-лы, 9 ил., 1 табл.
1. Способ кодирования цветного изображения, имеющего цветовые компоненты (Ec), отличающийся тем, что содержит этапы, на которых:
получают (130) компонент (L) яркости, что содержит:
получение (120) значения (Ba) модуляции из яркости (Y) цветного изображения;
получение масштабированной яркости путем деления яркости (Y) цветного изображения на упомянутое значение (Ba) модуляции;
получение компонента (L) яркости путем применения нелинейной функции к упомянутой масштабированной яркости таким образом, что динамика упомянутого компонента (L) яркости снижается по сравнению с динамикой упомянутой масштабированной яркости;
получают два компонента (C1, C2) цветности, что содержит:
получение коэффициента (r(L(i))), который зависит от значения пикселя (i) упомянутого компонента (L(i)) яркости и значения (Y(i)) яркости имеющего то же местоположение пикселя (i) в цветном изображении;
получение (150) по меньшей мере одного промежуточного цветового компонента (E'c) путем умножения каждого цветового компонента (Ec) на упомянутый коэффициент (r(L(i))); и
получение (170) упомянутых двух компонентов (C1, C2) цветности из упомянутого по меньшей мере одного промежуточного цветового компонента (E'c); и
кодируют (180) упомянутую яркость (L) и два компонента (C1, C2) цветности.
2. Способ по п. 1, в котором нелинейная функция представляет собой либо кривую гамма-распределения, либо S-образную логистическую (SLog) кривую в соответствии со значениями пикселей для упомянутой масштабированной яркости (Y).
3. Способ по п. 2, причем способ дополнительно содержит этап, на котором формируют информационные данные (Inf), которые указывают на то, является ли нелинейная функция функцией коррекции упомянутого гамма-распределения или функцией коррекции упомянутой SLog.
4. Способ по одному из пп. 1-3, причем способ дополнительно содержит этап, на котором сохраняют в локальной или удаленной памяти и/или добавляют в битовый поток по меньшей мере одно из следующих значений:
значение модуляции(Ba);
параметры нелинейной функции;
информационные данные (Inf).
5. Способ по одному из пп. 1-4, в котором коэффициент (r(L(i))) является отношением значения (L(i)) пикселя (i) упомянутого компонента яркости к значению (Y(i)) яркости, имеющего то же местоположение пикселя (i) в цветном изображении.
6. Способ по одному из пп. 1-4, в котором коэффициент r(L(i))) определяется выражением:
где L(i) является значением пикселя (i) упомянутого компонента яркости, и Y(i) является значением яркости имеющего то же местоположение пикселя (i) в цветном изображении.
7. Способ по одному из пп. 1-6, в котором получение (170) упомянутых двух компонентов (C1, C2) цветности из упомянутого по меньшей мере одного промежуточного цветового компонента (E'c) содержит этапы, на которых:
получают (171) три промежуточных компонента (Dc) путем применения оптико-электронной передаточной функции (OETF) к каждому промежуточному цветовому компоненту (E'c); и
осуществляют (172) линейное объединение трех промежуточных компонентов (Dc).
8. Способ по п. 7, в котором OETF представляет собой квадратный корень.
9. Способ по п. 7, в котором OETF представляет собой кубический корень.
10. Способ декодирования цветного изображения из битового потока, отличающийся тем, что он содержит этапы, на которых:
получают (220) первый компонент (Y), что содержит:
получение (210) компонента (L) яркости из битового потока;
получение итогового компонента путем применения нелинейной функции к упомянутому компоненту (L) яркости таким образом, что динамика упомянутого итогового компонента повышается по сравнению с динамикой компонента (L) яркости;
получение значения (Ba) модуляции из яркости цветного изображения, подлежащего декодированию;
получение первого компонента (Y) путем умножения упомянутого итогового компонента на упомянутое значение модуляции;
получают (210) два компонента (C1, C2) цветности из битового потока;
получают коэффициент (r(L(i))), который зависит от значения (L(i)) пикселя (i) упомянутого компонента (L) яркости;
получают (230) по меньшей мере один цветовой компонент (Ec) из упомянутого первого компонента (Y), упомянутых двух компонентов (C1, C2) цветности и упомянутого коэффициента (r(L(i))); и
формируют декодированное изображение путем объединения упомянутого по меньшей мере одного цветового компонента (Ec).
11. Способ по п. 10, в котором получение (230) по меньшей мере одного цветового компонента (Ec) содержит этапы, на которых:
получают (231) три промежуточных цветовых компонента (E'c) из упомянутого первого компонента (Y) и двух компонентов (C1, C2) цветности; и
получают (232) упомянутый по меньшей мере один цветовой компонент (Ec) путем деления каждого промежуточного цветового компонента (E'c) на упомянутый коэффициент (r(L(i))).
12. Способ по п. 10, в котором получение (230) по меньшей мере одного цветового компонента (Ec) содержит этапы, на которых:
получают (232) два промежуточных компонента (C'1, C'2) цветности путем деления каждого компонента (C1, C2) цветности в соответствии с коэффициентом (r(L(i))); и
получают (231) упомянутый по меньшей мере один цветовой компонент (Ec) из упомянутого первого компонента (Y) и упомянутых двух промежуточных компонентов (C'1, C'2) цветности.
13. Способ по п. 12, в котором получение (230) по меньшей мере одного цветового компонента (Ec) содержит этапы, на которых:
получают (232) два промежуточных компонента (C'1, C'2) цветности путем деления каждого компонента (C1, C2) цветности на значение, равное квадратному корню коэффициента (r(L(i))); и
получение (231) упомянутого по меньшей мере одного цветового компонента (Ec) содержит этапы, на которых:
получают (2310) второй компонент (S) путем объединения двух промежуточных компонентов (C'1, C'2) цветности и первого компонента (Y);
получают (2311) по меньшей мере один промежуточный цветовой компонент (Dc) путем линейного объединения промежуточного компонента (C'1, C'2) цветности и упомянутого второго компонента (S); и
получают (2312) упомянутые три цветовых компонента (Ec) путем возведения в квадрат каждого промежуточного цветового компонента (Dc).
14. Способ по одному из пп. 10-13, в котором нелинейная функция представляет собой обратную функцию либо кривой гамма-распределения, либо кривой SLog в соответствии со значениями пикселей для упомянутой масштабированной яркости (Y).
15. Способ по одному из пп. 10-14, причем способ дополнительно содержит этап, на котором получают по меньшей мере одно из следующих значений из локальной или удаленной памяти и/или из битового потока:
значение модуляции(Ba);
параметры нелинейной функции;
информационные данные (Inf), которые указывают на то, является ли нелинейная функция функцией коррекции гамма-распределения или функцией коррекции SLog.
16. Способ по одному из пп. 10-15, в котором коэффициент (r(L(i))) является отношением значения (L(i)) пикселя (i) упомянутого компонента яркости к значению (Y(i)) яркости имеющего то же местоположение пикселя (i) в упомянутом первом компоненте (Y).
17. Способ по одному из пп. 10-15, в котором коэффициент (r(L(i))) получают либо из локальной или удаленной памяти, либо из битового потока.
18. Устройство для кодирования цветного изображения, имеющего цветовые компоненты (Ec), отличающееся тем, что оно содержит процессор, выполненный с возможностью:
получения значения (Ba) модуляции из яркости (Y) цветного изображения;
получения масштабированной яркости (Y) путем деления яркости (Y) цветного изображения на упомянутое значение (Ba) модуляции;
получения компонента (L) яркости путем применения нелинейной функции к упомянутой масштабированной яркости (Y) таким образом, что динамика упомянутого компонента (L) яркости снижается по сравнению с динамикой упомянутой масштабированной яркости (Y);
получения двух компонентов (C1, C2) цветности, содержащего:
получение коэффициента (r(L(i))), который зависит от значения пикселя (i) упомянутого компонента (L(i)) яркости и значения (Y(i)) яркости для имеющего то же местоположение пикселя (i) в цветном изображении;
получение по меньшей мере одного промежуточного цветового компонента (E'c) путем умножения каждого цветового компонента (Ec) на упомянутый коэффициент (r(L)); и
получение упомянутых двух компонентов (C1, C2) цветности из упомянутого по меньшей мере одного промежуточного цветового компонента (E'c); и
кодирования упомянутой яркости (L) и двух компонентов (C1, C2) цветности.
19. Устройство для декодирования цветного изображения из битового потока, отличающееся тем, что оно содержит процессор, выполненный с возможностью:
получения первого компонента (Y), содержащего:
получение компонента (L) яркости из битового потока;
получение итогового компонента путем применения нелинейной функции к упомянутому компоненту (L) яркости таким образом, что динамика упомянутого итогового компонента повышается по сравнению с динамикой компонента (L) яркости;
получение значения (Ba) модуляции из яркости (Y) цветного изображения, подлежащего декодированию;
получение первого компонента (Y) путем умножения упомянутого итогового компонента на упомянутое значение модуляции;
получение двух компонентов (C1, C2) цветности из битового потока;
получение коэффициента (r(L(i))), который зависит от значения (L(i)) пикселя (i) упомянутого компонента (L) яркости;
получение по меньшей мере одного цветового компонента (Ec) из упомянутого первого компонента (Y), упомянутых двух компонентов (C1, C2) цветности и упомянутого коэффициента;
причем декодированное изображение формируется путем объединения упомянутого по меньшей мере одного цветового компонента (Ec).
20. Считываемый процессором носитель, на котором сохранены инструкции, предписывающие процессору выполнять по меньшей мере этапы способа кодирования по п. 1.
21. Считываемый процессором носитель, на котором сохранены инструкции, предписывающие процессору выполнять по меньшей мере этапы способа декодирования по п. 10.
22. Постоянный запоминающий носитель, содержащий инструкции из программного кода для выполнения этапов способа по одному из пп. 1-9, когда упомянутая программа выполняется на вычислительном устройстве.
23. Постоянный запоминающий носитель, содержащий инструкции из программного кода для выполнения этапов способа по одному из пп. 10-17, когда упомянутая программа выполняется на вычислительном устройстве.
JI WON LEE et al., Local Tone Mapping using K-means Algorithm and Automatic Gamma Setting, IEEE International Conference on Consumer Electronics (ICCE), 2011, с | |||
Ветряный двигатель | 1923 |
|
SU807A1 |
Размещено по адресу: https://ieeexplore.ieee.org/document/5722876 | |||
HYUK-JU KWON et al., Compensation of de-saturation effect in HDR imaging using a real scene adaptation model, Journal of Visual Communication and Image Representation, Volume 24, Issue 6, 2013, c | |||
Шеститрубный элемент пароперегревателя для котлов с жаровыми и прогарными трубами | 1918 |
|
SU678A1 |
Размещено по адресу: https://www.sciencedirect.com/science/article/pii/S104732031200051X?via%3Dihub | |||
TE-HSUN WANG et al., Photography Enhancement Based on the Fusion of Tone and Color Mappings in Adaptive Local Region, IEEE Transactions on Image Processing, vol | |||
Способ изготовления электрических сопротивлений посредством осаждения слоя проводника на поверхности изолятора | 1921 |
|
SU19A1 |
Способ гальванического снятия позолоты с серебряных изделий без заметного изменения их формы | 1923 |
|
SU12A1 |
КОЛОСНИКОВАЯ РЕШЕТКА | 1923 |
|
SU3089A1 |
Размещено по адресу: https://ieeexplore.ieee.org/document/5482181 | |||
US 8483479 B2, 09.07.2013 | |||
Способ приготовления лака | 1924 |
|
SU2011A1 |
МНОГОУРОВНЕВОЕ СЖАТИЕ ВИДЕОИЗОБРАЖЕНИЯ С РАСШИРЕННЫМ ДИНАМИЧЕСКИМ ДИАПАЗОНОМ, ВИЗУАЛЬНЫМ ДИНАМИЧЕСКИМ ДИАПАЗОНОМ И ШИРОКОЙ ЦВЕТОВОЙ ГАММОЙ | 2010 |
|
RU2504011C2 |
Авторы
Даты
2019-11-01—Публикация
2016-01-25—Подача