ПРЕОБРАЗОВАНИЕ ТОНОВОЙ КРИВОЙ ДЛЯ ИЗОБРАЖЕНИЙ С РАСШИРЕННЫМ ДИНАМИЧЕСКИМ ДИАПАЗОНОМ Российский патент 2020 года по МПК G06T5/00 

Описание патента на изобретение RU2713869C1

ПЕРЕКРЕСТНАЯ ССЫЛКА НА РОДСТВЕННЫЕ ЗАЯВКИ

[0001] Настоящая заявка испрашивает приоритет согласно предварительной заявке на патент США № 62/459,141 и Европейской патентной заявке № 17156284.6, обе поданы 15 февраля 2017 года, и предварительной заявке на патент США № 62/465,298, поданной 1 марта 2017 года, каждая из которых включена в настоящую заявку посредством ссылки.

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

[0002] Настоящее изобретение в целом относится к изображениям. В частности, вариант осуществления настоящего изобретения относится к определению параметров для тоновой кривой для преобразования изображений и видеосигналов с расширенным динамическим диапазоном (HDR) из первого динамического диапазона во второй динамический диапазон.

УРОВЕНЬ ТЕХНИКИ

[0003] Используемый в настоящем документе термин "динамический диапазон (DR)" может относиться к способности зрительной системы человека (HVS) воспринимать диапазон интенсивности (например, освещенности, яркости) в изображении, например, от самого темно-серого (чернота) до самого ярко-белого (блики). В этом смысле DR относится к интенсивности "относительно сцены". DR также может относиться к способности устройства отображения в достаточной мере или приблизительно воспроизводить диапазон интенсивности конкретной ширины. В этом смысле DR относится к интенсивности "относительно отображения". Если конкретный смысл явно не определен как имеющий конкретное значение в любом месте в этом описании, следует сделать вывод, что термин может быть использован в любом смысле, например, взаимозаменяемым образом.

[0004] Используемый в настоящем документе термин "расширенный динамический диапазон (HDR)" относится к ширине DR, которая охватывает приблизительно 14-15 порядков величины зрительной системы человека (HVS). На практике DR, в котором человек может одновременно воспринимать пространственную ширину в диапазоне интенсивности, может быть несколько сокращен относительно HDR. Используемые в настоящем документе термины "улучшенный динамический диапазон (EDR)" или "визуальный динамический диапазон (VDR)" могут индивидуально или взаимозаменяемым образом относиться к DR, который может восприниматься в сцене или изображении зрительной системой человека (HVS), которая включает в себя движения глаз, допуская некоторые изменения световой адаптации в пределах сцены или изображения.

[0005] На практике изображения содержат один или несколько цветовых компонентов (например, яркость Y и цветность Cb и Cr), причем каждый цветовой компонент представлен точностью n бит на пиксель (например, n=8). С использованием линейного кодирования яркости изображения, в которых n ≤ 8 (например, цветные 24-битные изображения JPEG), считают изображениями стандартного динамического диапазона, в то время как изображения, в которых n > 8, можно считать изображениями с расширенным динамическим диапазоном. Изображения EDR и HDR также могут быть сохранены и распространены с использованием форматов с плавающей запятой с высокой точностью (например, 16 битов), таких как файловый формат OpenEXR, разработанный компанией Industrial Light and Magic.

[0006] Используемый в настоящем документе термин "метаданные" относится к любой вспомогательной информации, которая передается как часть закодированного битового потока и помогает декодеру воспроизвести декодированное изображение. Такие метаданные могут включать в себя, но без ограничения, цветовое пространство или информацию о гамме, параметры эталонного дисплея и вспомогательные параметры сигнала, такие как описанные в настоящем документе.

[0007] Большинство потребительских настольных дисплеев в настоящее время поддерживают яркость 200-300 кд/м2 или нитов. Большая часть потребительских HDTV имеет диапазон от 300 до 500 нитов, и новые модели достигают 1000 нитов (кд/м2). Таким образом, такие традиционные дисплеи являются типичными представителями узкого динамического диапазона (LDR), также называемого стандартным динамическим диапазоном (SDR), относительно HDR или EDR. Поскольку доступность HDR-контента растет вследствие усовершенствований оборудования захвата изображений (например, камер) и HDR-дисплеев (например, профессиональный эталонный монитор PRM-4200 от компании Dolby Laboratories), HDR-контент может быть отсортирован по цвету и отображен на HDR-дисплеях, которые поддерживают более широкие динамические диапазоны (например, от 1000 до 5000 нитов или больше). В целом, но без ограничения, способы настоящего раскрытия относятся к любому динамическому диапазону, более широкому, чем SDR.

[0008] Создание контента с расширенным динамическим диапазоном (HDR) теперь становится широко распространенным, поскольку эта технология предлагает более реалистические и естественные изображения, чем более ранние форматы. Однако многие системы отображения, в том числе сотни миллионов потребительских телевизоров, не способны воспроизводить HDR-изображения. Кроме того, вследствие широкого диапазона HDR-дисплеев (например, от 1000 до 5000 нитов или больше) HDR-контент, оптимизированный на одном HDR-дисплее, может быть не подходящим для прямого воспроизведения на другом HDR-дисплее. Один подход, используемый для обслуживания всего рынка, состоит в создании нескольких версий нового видеоконтента; например, одна из них использует HDR-изображения, и другая использует SDR-изображения (стандартный динамический диапазон). Однако это требует, чтобы авторы контента создавали свой видеоконтент в нескольких форматах, и может потребовать, чтобы потребители знали, какой формат следует купить для их конкретного дисплея. Потенциально более хороший подход может состоять в создании одной версии контента (в HDR) и использовании системы преобразования данных изображения (например, как часть функциональности цифрового приемника), чтобы автоматически преобразовывать с понижением (или с повышением} входной HDR-контент в подходящий выходной SDR- или HDR-контент. Чтобы улучшить существующие схемы отображения, как оценивают авторы настоящего изобретения, разработаны улучшенные методики для определения тоновой кривой для преобразования HDR-изображений для отображения.

[0009] Подходы, описанные в этом разделе, представляют собой подходы, которые могут быть выполнены, но не обязательно подходы, которые были ранее предложены или выполнены. Таким образом, если не указано обратное, не следует предполагать, что любой из подходов, описанных в этом разделе, расценивается как предшествующий уровень техники, лишь на основании их включения в этот раздел. Аналогичным образом, не следует предполагать, что проблемы, идентифицированные относительно одного или более подходов, были признаны на предшествующем уровне техники на основе этого раздела, если не указано обратное.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[00010] Вариант осуществления настоящего изобретения проиллюстрирован в качестве примера, а не для ограничения, на фигурах прилагаемых чертежей, на которых одинаковые номера для ссылок относятся к сходным элементам.

[00011] Фиг. 1 изображает иллюстративный процесс для конвейера поставки видео;

[00012] Фиг. 2 изображает иллюстративную функцию преобразования для преобразования изображений из первого динамического диапазона во второй динамический диапазон с использованием трех опорных точек в соответствии с предшествующим уровнем техники;

[00013] Фиг. 3 изображает иллюстративную функцию преобразования для преобразования изображений из первого динамического диапазона во второй динамический диапазон в соответствии с вариантом осуществления настоящего изобретения;

[00014] Фиг. 4А и фиг. 4B изображают иллюстративные процессы для определения функции преобразования тонов в соответствии с вариантами осуществления настоящего изобретения;

[00015] Фиг. 5 изображает две иллюстративные функции преобразования, определенные в соответствии с вариантами осуществления настоящего изобретения; и

[00016] Фиг. 6А и фиг. 6B изображают иллюстративные графики, показывающие, как значения входных полутонов преобразовываются в значения выходных полутонов, чтобы определить опорную точку полутонов функции преобразования тоновой кривой, в соответствии с вариантами осуществления настоящего изобретения.

ОПИСАНИЕ ИЛЛЮСТРАТИВНЫХ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ

[00017] В настоящем документе описаны способы определения тоновой кривой для преобразования отображения изображений с расширенным динамическим диапазоном (HDR). В последующем описании в целях разъяснения изложен целый ряд конкретных подробностей для обеспечения полного понимания настоящего изобретения. Однако будет очевидно, что настоящее изобретение может быть осуществлено на практике без этих конкретных подробностей. В других случаях известные структуры и устройства не описываются во всех подробностях, чтобы избежать излишнего затруднения или усложнения понимания настоящего изобретения.

Обзор

[00018] Иллюстративные варианты осуществления, описанные в настоящем документе, относятся к способам определения тоновой кривой для преобразования отображения изображений с расширенным динамическим диапазоном (HDR). В одном варианте осуществления в видеосистеме для входного изображения процессор принимает первые информационные данные, содержащие уровень входной точки черного (x1, SMin), уровень входных полутонов (x2, SMid) и уровень входной точки белого (x3, SMax) в первом динамическом диапазоне. Процессор также выполняет доступ ко вторым информационным данным для выходного изображения во втором динамическом диапазоне, содержащим первый уровень выходной точки черного (TminPQ) и первый уровень выходной точки белого (TmaxPQ) во втором динамическом диапазоне. Процессор определяет значение выходных полутонов во втором динамическом диапазоне на основе первых и вторых информационных данных. Процессор вычисляет вторую выходную точку черного и вторую выходную точку белого во втором динамическом диапазоне на основе вторых информационных данных и выходного значения полутонов (mid-tones, средних тонов). Затем он вычисляет задний наклон (tail slope, угол наклона в задней (хвостовой, нижней) области), передний наклон (head slope, угол наклона в передней (головной, верхней) области) и наклон полутонов (mid-tones slope, угол наклона в области полутонов) на основе первых информационных данных, вторых информационных данных и значения выходных полутонов. Процессор определяет передаточную функцию для преобразования пиксельных значений входного изображения в первом динамическом диапазоне в соответствующие пиксельные значения выходного изображения во втором динамическом диапазоне, причем передаточная функция содержит два сегмента, причем первый сегмент определен на основе заднего наклона, наклона полутонов, уровня входной точки черного, уровня входных полутонов, второй выходной точки черного и значения выходных полутонов, и второй сегмент определен на основе наклона полутонов, переднего наклона, уровня входных полутонов, уровня входной точки белого, значения выходных полутонов и второй выходной точки белого. Процессор преобразовывает входное изображение в выходное изображение с использованием определенной передаточной функции.

[00019] В варианте осуществления процессор вычисляет вторую выходную точку черного и вторую выходную точку белого на основе первых информационных данных, вторых информационных данных и выходного значения полутонов.

[00020] В варианте осуществления процессор вычисляет задний наклон на основе уровня входной точки черного, уровня входных полутонов, второй выходной точки черного и значения выходных полутонов.

[00021] В варианте осуществления процессор вычисляет передний наклон на основе уровня входной точки белого, уровня входных полутонов, второй выходной точки белого и значения выходных полутонов.

[00022] В варианте осуществления процессор вычисляет наклон полутонов на основе первых информационных данных, второй выходной точки черного, второй выходной точки белого и значения выходных полутонов.

Преобразование динамического диапазона

Видеокодирование HDR-сигналов

[00023] Фиг. 1 изображает иллюстративный процесс традиционного конвейера (100) поставки видео, показывающий различные стадии от видеосъемки до отображения видеоконтента. Последовательность видеокадров (102) снимается или формируется с использованием блока (105) формирования изображения. Видеокадры (102) могут быть отсняты в цифровом формате (например, цифровым фотоаппаратом) или сформированы компьютером (например, с использованием компьютерной анимации), чтобы обеспечить видеоданные (107). В качестве альтернативы видеокадры (102) могут быть отсняты на пленку пленочной фотокамерой. Съемка на пленке преобразовывается в цифровой формат, чтобы обеспечить видеоданные (107). На производственной стадии (110) видеоданные (107) редактируются, чтобы обеспечить поток (112) произведенного видео.

[0024] Данные потока (112) произведенного видео затем обеспечиваются процессору в блоке (115) для постпроизводственного редактирования. Блок (115) постпроизводственного редактирования может включать в себя корректировку или модификацию цветов или яркости в конкретных областях изображения для улучшения качества изображения или достижения конкретного зрительного восприятия изображения в соответствии с творческим замыслом создателя видео. Это иногда называют "цветоустановкой" или "цветокоррекцией". Другое редактирование (например, выбор и упорядочивание сцен, обрезка изображения, добавление компьютерных визуальных спецэффектов и т.д.) может быть выполнено в блоке (115), что приводит к окончательной версии (117) производства для распространения. Во время постпроизводственного редактирования (115), видеоизображения просматривают на эталонном дисплее (125).

[0025] После постпроизводства (115) видеоданные (117) готового производства могут быть доставлены в блок (120) кодирования для дальнейшей доставки декодерам и устройствам воспроизведения, таким как телевизоры, телеприставки, кинотеатры и т.п. В некоторых вариантах осуществления блок (120) кодирования может включать в себя аудио- и видеокодеры, характеризуемые такими форматами, как ATSC, DVB, DVD, Blu-ray и другими форматами доставки, для формирования кодированного битового потока (122). В приемнике кодированный битовый поток (122) декодируется с помощью блока (130) декодирования для формирования декодированного сигнала (132), представляющего идентичный сигнал или близкую аппроксимацию сигнала (117). Приемник может быть присоединен к целевому дисплею (140), который может иметь совершенно другие характеристики, чем эталонный дисплей (125). В этом случае блок (135) управления отображением может использоваться для преобразования динамического диапазона декодированного сигнала (132) с учетом характеристик целевого дисплея (140) посредством формирования преобразованного для дисплея сигнала (137).

Преобразование изображений с использованием сигмоидального преобразования

[0026] В патенте США 8,593,480, "Способ и устройство для преобразования данных изображения" ("Method and apparatus for image data transformation"), авторы A. Ballestad и A. Kostin, которое будет упоминаться в как патент '480, который полностью включен в настоящий документ по ссылке, авторы изобретения предложили преобразование изображений с использованием параметрической сигмоидальной функции, которая может быть уникально определена с использованием трех опорных точек и свободного параметра полутонов. Пример такой функции изображен на фиг. 2.

[0027] Как изображено на фиг. 2, функция (220) преобразования определена тремя опорными точками (205, 210, 215): точка черного (x1, y1), точка полутонов (x2, y2) и точка белого (x3, y3). Это преобразование имеет следующие свойства.

- Значения от x1 до x3 представляют диапазон возможных значений, описывающих пиксели, которые составляют входное изображение. Эти значения могут представлять собой уровни яркости для конкретного основного цвета (R, G или B) или могут представлять собой уровни общей яркости пикселя, например, компонент Y в представлении YCbCr). Обычно эти значения соответствуют наиболее темному (точка черного) и наиболее яркому (точка белого) уровням, поддерживаемым дисплеем, используемым для создания контента ("эталонный дисплей" (125)); однако в некоторых вариантах осуществления, когда характеристики эталонного дисплея неизвестны, эти значения могут представлять минимальное и максимальное значения во входном изображении (например, в R, G или B, яркости и т.п.), которые могут быть либо приняты через метаданные изображения, либо вычислены в приемнике.

- Значения от y1 до y3 представляют диапазон возможных значений, описывающих пиксели, которые составляют выходное изображение (снова либо яркость основного цвета, либо уровни общей яркости). Обычно эти значения соответствуют наиболее темному (точка черного) и наиболее яркому (точка белого) уровням, поддерживаемым намеченным выходным дисплеем ("целевым дисплеем" (140)).

- Любой входной пиксель со значением x1 всегда преобразовывается в выходной пиксель со значением y1, и любой входной пиксель со значением x3 всегда преобразовывается в выходной пиксель со значением y3.

- Значения x2 и y2 представляют конкретное преобразование из ввода в вывод, которые используются в качестве опорной точки для некоторого элемента изображения "среднего уровня" (или уровня полутонов). Значительная широта разрешается при конкретном выборе x2 и y2, и патент '480 представляет много альтернатив для того, как эти параметры могут быть выбраны.

[0028] Когда эти три опорных точки были выбраны, передаточная функция (220) может быть описана как

где C1, C1, и C3 являются константами, x обозначает входное значение для цветового канала или яркость, y обозначает соответствующее выходное значение, и n является свободным параметром, который может использоваться для корректировки контрастности полутона.

[0029] Как описано в патенте '480, значения C1, C1, и C3 могут быть определены посредством решения

[0030] Тоновая кривая уравнения (1) была успешно применена ко многим приложениям преобразования отображения; однако, как отметили авторы изобретения, она также имеет несколько потенциальных ограничений, в том числе:

- Трудно определить параметры тоновой кривой таким образом, чтобы имелось непосредственное преобразование в конкретном диапазоне целевого дисплея.

- Трудно определить параметры (например, показатель степени n) для управления контрастностью.

- Малые изменения средней опорной точки (x2, y2) могут привести к неожиданному поведению.

- Не позволяет линейное преобразование ниже опорной точки (205) черного и/или выше опорной точки (215) белого.

[0031] Фиг. 3 изображает пример новой кривой преобразования тонов в соответствии с вариантом осуществления. Как изображено на фиг. 3, кривая (320) преобразования тонов содержит до четырех сегментов:

- Факультативный линейный сегмент L1 для значений меньше (x1, y1) (x1 также может быть отрицательным),

- Сплайн S1 от (x1, y1) до (x2, y2)

- Сплайн S2 от (x2, y2) до (x3, y3)

- Факультативный линейный сегмент L2 для значений больше (x3, y3) (x1 также может быть больше 1),

[0032] В варианте осуществления, без ограничения, сегменты S1 и S2 определены с использованием полинома Эрмита третьего порядка (кубического).

[0033] Как будет обсуждаться позже, преобразования, использующие линейные сегменты L1 и L2, могут быть особенно полезны, когда вычисляется инверсия тоновой кривой, например, во время обратного тонового преобразования, например, когда нужно сформировать изображение с расширенным динамическим диапазоном из изображения со стандартным динамическим диапазоном.

[0034] Как и в уравнении (1), кривой (320) управляют три опорных точки (305, 310, 315): точка черного (x1, y1), точка полутонов (x2, y2) и точка белого (x3, y3). Кроме того, каждый из сплайновых сегментов может быть дополнительно ограничен двумя наклонами в каждой оконечной точке; таким образом, всей кривой управляют три опорных точки и три наклона: задний наклон в (x1, y1), наклон полутонов в (x2, y2) и передний наклон в (x3, y3).

[0035] В качестве примера рассмотрим сплайн, определенный между точками (x1, y1) и (x2, y2) с наклоном s1 в (x1, y1) и наклоном s2 в (x2, y2), тогда для входного значения x передаточная функция для этого кубического сплайна Эрмита может быть определена как:

y=((2T3-3T2+1)*y1+(T3-2T2+T)*(x2-x1)*s1+(-2T3+3T2)*y2+

(T3-T2)*(x2-x1)*s2), (3a)

где

T=(x-x1)/(x2-x1). (3b)

[0036] В варианте осуществления, чтобы гарантировать отсутствие как чрезмерных, так и недостаточных наклонов (то есть, гарантировать, что кривая является монотонной), следующее правило также может быть применено к наклонам s1 и s2:

где α обозначает константу (например, α=3).

[0037] Для заданного сплайна Эрмита из уравнения (3) в варианте осуществления, без ограничения, для ввода видео, например, закодированного с использованием блока перцептивного квантования (PQ) (например, в соответствии с документом SMPTE ST 2084:2014, "High Dynamic Range EOTF of Mastering Reference Displays") полная кривая может быть определена на основе следующих параметров:

- SMin=x1; обозначает минимальную яркость исходного контента. Если не задан, SMin может быть установлен равным значению, представляющему типичную "черноту" (например, SMin=0,0151).

- SMax=x3; обозначает максимальную яркость исходного контента. Если не задан, SMax может быть установлен равным большому значению, представляющему "блики" (например, SMax=0,9026)

- SMid=x2; обозначает среднее значение (например, арифметическое, медианное, геометрическое) яркости исходного контента. В некоторых вариантах осуществления оно может просто обозначить "важный" признак яркости во входном изображении. В некотором другом варианте осуществления оно также может обозначить среднее значение или медиану выбранной области (например, лица). SMid может быть определен вручную или автоматически, и его значение может быть смещено на основе предпочтений, чтобы сохранить некоторое зрительное восприятие в бликах или тенях. Если не задан, SMid может быть установлен равным типичному среднему значению (например, SMid=0,36, представляющий тон кожи).

[0038] Эти данные могут быть приняты с использованием метаданных изображения или исходных метаданных, они могут быть вычислены блоком управления отображением (например, 135), или они могут быть основаны на известных предположениях об окружающей среде эталонного дисплея. Кроме того, предполагается, что известны следующие данные для целевого дисплея (например, приняты посредством считывания расширенных данных идентификации дисплея (EDID):

- TminPQ=минимальная яркость целевого дисплея.

- TmaxPQ=максимальная яркость целевого дисплея.

причем используемый в этом документе термин "PQ" обозначает, что эти значения (обычно заданные в нитах) преобразованы в значения PQ в соответствии с документом SMPTE ST 2084.

[0039] Чтобы полностью определить кривую преобразования, должны быть вычислены следующие точки и параметры:

TMin=y1;

TMax=y3;

TMid=y2;

slopeMin=наклон в (x1, y1);

slopeMid=наклон в (x2, y2); и

slopeMax=наклон в (x3, y3).

[0040] Фиг. 4А изображает иллюстративный процесс для определения опорных точек и наклонов кривой преобразования тонов в соответствии с вариантом осуществления. Для заданных входных параметров (405) SMin, SMid, SMax, TminPQ и TmaxPQ этап 412 вычисляет y2 (TMid). Например, в одном варианте осуществления опорная точка полутонов (SMid, TMid) может быть выбрана на линии преобразования 1 к 1, то есть, выполнено требование TMid=SMid при условии, что TMid находится в пределах граничных точек TminPQ и TmaxPQ и предопределенного буфера. Для значений TMid, близких к TminPQ и TmaxPQ, TMid может быть выбран на фиксированном расстоянии (например, между TMinPQ+c и TmaxPQ-d, где c и d - фиксированные значения), или на расстоянии, вычисленном как процент от этих значений. Например, можно потребовать, чтобы TMid никогда не был меньше TminPQ+a*TminPQ или больше TmaxPQ-b*TMaxPQ, где a и b - константы в диапазоне [0, 1], представляющие процентные значения (например, a=b=5%=0,05).

[0041] Для заданного TMid этап 425 вычисляет остальные неизвестные параметры (например, y1, y2 и три наклона). Наконец, этап 430 вычисляет два сплайновых сегмента и два линейных сегмента.

[0042] В другом варианте осуществления вычисление TMid может быть дополнительно усовершенствовано посредством попытки обеспечить сохранность первоначальных отношений между входной "задней контрастностью" (то есть, контрастностью между чернотой (SMin) и полутонами (SMid)) и входной "передней контрастностью" (то есть, контрастностью между полутонами (SMid) и бликами (SMax)). Пример такого процесса в соответствии с вариантом осуществления изображен на фиг. 4B, а также описан на псевдокоде в таблице 1. Цель этого процесса:

- Определить опорную точку выходных полутонов (SMid, TMid) как по возможности максимально близкую к диагональному преобразованию (1 к 1). Таким образом, в идеале TMid должен быть по возможности максимально близок к SMid, чтобы обеспечить сохранность входных полутонов;

- Если преобразование 1 к 1 невозможно, то определить TMid таким образом, что выходные значения диапазонов "задней контрастности" и "передней контрастности" находятся в предопределенных пределах соответствующих входных диапазонов. В настоящем документе входная "передняя контрастность" основана на функции (SMax-SMid), и входная "задняя контрастность" основана на функции (SMid-SMin).

- Для заданной средней опорной точки (x2, y2), или (SMid, TMid), определить три наклона таким образом, что вся тоновая кривая может быть характеризована.

Таблица 1: Иллюстративный процесс для определения параметров тоновой кривой

1) Найти динамический диапазон целевого дисплея
TDR=TmaxPQ-TminPQ;
2) Найти, где в целевом динамическом диапазоне расположены исходная середина (SMid), исходная передняя контрастность (диапазон от SMid до SMax) и исходная задняя контрастность (диапазон от SMin до SMid);
midLoc=(SMid-TminPQ)/TDR;
headroom=(SMax-SMid)/TDR;
tailroom=(SMid-SMin)/TDR;
3) Установить величину сохранности контрастности (например, сколько из входного динамического диапазона в "блики - передняя контрастность" и "тени - задняя контрастность" должно быть сохранено) (например, 50% для обоих)
preservationHead=0,5;
preservationTail=0,5;
4) Вычислить смещения offsetHead и offsetTail для SMid на основе midLoc и величины сохранности контрастности. Значение offsetHead пытается снизить TMid, в то время как offsetTail пытается увеличить TMid, чтобы обеспечить сохранность контрастности максимально близко к преобразованию 1 к 1 между SMid и TMid.
offsetScalar=-0,5 * (cos(pi*min(1,max(0,(midLoc-0,5)/0,5))) - 1);
offsetHead=max(0, headroom*preservationHead+midLoc - 1) * TDR * offsetScalar;
offsetScalar=-0,5 * (cos(pi*min(1,max(0,1-midLoc*2))) - 1);
offsetTail=max(0, tailroom*preservationTail - midLoc) * TDR * offsetScalar;
5) Установить TMid (y2) равным SMid и добавить смещения offsetHead и offsetTail
TMid=SMid-offsetHead+offsetTail;
6) Скорректировать точки TMin (y1) и TMax (y3) на основе TMid
TMax=min(TMid+SMax-SMid,TmaxPQ);
TMin=max(TMid-SMid+SMin,TminPQ);
7) Вычислить максимальные задний и передний наклоны на основе правила выхода за пределы (см. уравнение (4)) для обеспечения сохранности монотонности
maxMinSlope=3*(TMid-TMin)/(SMid-SMin);
maxMaxSlope=3*(TMax-TMid)/(SMax-SMid);
8) Вычислите наклоны. Обычно contrastFactor=1; однако его значение может быть скорректировано, чтобы дополнительно изменить контрастность выходного сигнала на основе пользовательских настроек (например, с использованием элемента управления "контрастность" на телевизоре)
slopeMin=min([maxMinSlope,(( TMid - TMin)/(SMid - SMin))^2]);
slopeMax=min([maxMaxSlope,1,((TMax - TMid)/(SMax - SMid))^4]);
slopeMid=min([maxMinSlope,maxMaxSlope,contrastFactor*(1-SMid+TMid)]);

[0043] На этапе 4 выше, чтобы вычислить параметры смещения offsetHead и offsetTail, члены умножаются на член, обозначенный как offsetScalar, который в варианте осуществления может быть выражен как

(5)

Цель этой функции состоит в том, чтобы обеспечить плавный переход между максимальными возможными смещениями (например, headroom*preservationHead или tailroom*preservationTail) и соответствующими передним или задним наклонами. Функция s() в уравнении (5) может представлять собой любую подходящую линейную или нелинейную функцию от |2*midLoc-1|. Например, в другом варианте осуществления:

.

[0044] На этапе 8 выше наклон slopeMid вычисляется как близкий к диагонали для преобразования 1 к 1. Напротив, slopeMax вычисляется, чтобы сохранить блики пропорциональными по отношению к headslopeh (например, h=4); это наклон между (x2, y2) и (x3, y3), в то время как slopeMin вычисляется, чтобы сохранить черноту пропорциональной по отношению к tailslopet (например, t=2), это наклон между (x1, y1) и (x2, y2). Показатели степени h и t определяют, как быстро блики или серые участки должны быть "разбиты". Типичные значения для h и t включают в себя 1, 2 или 4. В варианте осуществления h=t.

[0045] Для заданных трех опорных точек и трех наклонов четыре сегмента могут быть формированы следующим образом:

если (SMin < x ≤ SMid) // Кривая S1

y=((2T3-3T2+1)*TMin+(T3-2T2+T)*(SMid-SMin)*slopeMin+

(-2T3+3T2)*TMid+(T3-T2)*(SMid-SMin)*slopeMid), (7a)

где

T=(x-SMin)/(SMid-SMin). (7b)

если (SMid < x < SMax) // Кривая S2

y=((2T3-3T2+1)*TMid+(T3-2T2+T)*(SMax-SMid)*slopeMid+

(-2T3+3T2)*TMax+(T3-T2)*(SMax-SMid)*slopeMax), (7c)

где

T=(x-SMid)/(SMax-SMid). (7d)

если (x ≤ SMin) // Сегмент L1

y=TMin+(x-SMin)*slopeMin (7e)

если (x ≥ SMax) // Сегмент L2

y=TMax+(x-SMax)*slopeMax (7f)

[0046] Вновь согласно фиг. 4B, для заданных входных параметров (405) (например, SMin, SMid, SMax, TminPQ и TmaxPQ) этап (410) вычисляет первое целевое значение полутонов и ассоциированные целевые значения headroom и tailroom на основе входных параметров (например, см. этап 2 в таблице 1). Для заданных процентных значений сохранности передней и задней контрастностей (например, приблизительно 50%), первого целевого значения полутонов и ассоциированных целевых значений headroom и tailroom этап (415) вычисляет переднее и заднее смещения (например, см. этап 4 в таблице 1). Этап (420) применяет переднее и заднее смещения к входному значению SMid, чтобы вычислить целевое значение TMid (например, см. этап 5 в таблице 1). Затем этап (425) вычисляет TMax и TMin на основе входных параметров и TMid (например, см. этап 6 в таблице 1). Этап (425) также вычисляет два оконечных наклона и серединный наклон для двух сплайнов (например, см. этап 8 в таблице 1), пытаясь обеспечить сохранность монотонности. Для заданных входных параметров TMid, TMin, TMax и трех наклонов можно затем применить уравнение (7), чтобы на этапе (430) вычислить кривую преобразования тонов.

[0047] Фиг. 5 изображает два разных примера предложенной тоновой кривой, преобразующей PQ-кодированные данные из первого динамического диапазона во второй, более узкий, динамический диапазон. Следует отметить, что та же самая кривая также может использоваться для обратного преобразования, например, для перевода данных из более узкого динамического диапазона обратно в первоначальный расширенный динамический диапазон. В варианте осуществления обратное преобразование может быть вычислено следующим образом:

- Вывести кривую преобразования тонов, например, выраженную как y=f (x), как описано ранее.

- Сформировать прямую поисковую таблицу, преобразующую входные значения xi в выходные значения yi с использованием yi=f(xi).

- Сформировать обратную поисковую таблицу, преобразующую входные значения y'k в узком динамическом диапазоне, чтобы выдать значения x'k в более широком динамическом диапазоне, с использованием значений из прямой поисковой таблицы (LUT) (то есть, если y'k=yi, то x'k=xi)

- Сформировать дополнительные значения обратной поисковой таблицы посредством интерполяции по существующим значениям. Например, если yi < y'k < yi+1, то соответствующее выходное значение x'k может быть сформировано посредством интерполяции между xi и xi+1.

[0048] Фиг. 6А изображает иллюстративный график, показывающий, как значения входных полутонов (SMid) преобразовываются в значения выходных полутонов (TMid), чтобы определить (например, с использованием этапов 1-4 в таблице 1) опорную точку полутонов функции преобразования тоновой кривой в соответствии с вариантом осуществления. Для заданных SMin=0,01, SMax=0,92 и TminPQ=0,1 график 605 изображает, как SMid преобразовывается в TMid, когда TmaxPQ=0,5, и график 610 изображает, как SMid преобразовывается в TMid, когда TmaxPQ=0,7.

[0049] На фиг. 6А можно наблюдать, что в малом диапазоне значений SMid функция 605 не является монотонной, что может привести к неожиданным результатам, например, во время постепенных появлений или исчезновений изображения. Чтобы решить эту проблему, на этапе 4 из таблицы 1 следующий псевдокод может использоваться вместо прежнего, чтобы вычислить переднее и заднее смещения:

cutoff=a;// например, a=0,5.

offsetHead=min(max(0, (midLoc - cutoff))*TDR, max(0,headroom*preservationHead+midLoc - 1) * TDR);

offsetTail=min(max(0, (cutoff - midLoc))*TDR,

max(0, tailroom*preservationTail - midLoc) * TDR);

где cutoff является переменной, которая задает приоритет поддержке бликов против теней, определяя процент целевого динамического диапазона, до которого будут подрезаны переднее и заднее смещения. Например, значение cutoff=0,5 задает равные приоритеты бликам и теням, тогда как значение cutoff=0,7 задает более высокий приоритет бликам, чем теням.

[0050] Этот подход не только более простой в вычислительном отношении, поскольку он не требует вычисления ни косинусов, ни квадратных корней, но также, как изображено на фиг. 6B, он обеспечивает сохранность монотонности. Для заданных SMin=0,01, SMax=0,92 и TminPQ=0,1 на фиг. 6B график 615 изображает, как SMid преобразовывается в TMid, когда TmaxPQ=0,5, и график 620 изображает, как SMid преобразовывается в TMid, когда TmaxPQ=0,7.

[0051] По сравнению с уравнением (1), предложенная тоновая кривая проявляет несколько преимуществ, в том числе:

- С использованием параметра slopeMid можно определить преобразование 1 к 1 между значениями SMid и TMid в конкретном диапазоне целевого дисплея, чтобы обеспечить сохранность контрастности;

- Контрастностью изображений можно явно управлять через slopeMid и переменную contrastFactor (см., таблицу 1, этап 8). Например, в варианте осуществления значение contrastFactor может располагаться, без ограничения, между 0,5 и 2,0, и значением по умолчанию contrastFactor=1;

- Посредством разбиения всей кривой на два сплайна больше нет неожиданного поведения около опорной точки полутонов (x2, y2);

- С использованием SlopeMin и SlopMax можно предопределить поведение кривой преобразования перед опорной точкой черного и после опорной точки белого;

- Эта кривая может преобразовывать отрицательные входные значения (например, x < 0). Такое условие может возникнуть из-за шума или других системных условий (например, пространственная фильтрация). Обычно отрицательные значения обрезаются до 0; однако такое обрезание может привести к увеличению шума и уменьшению общего качества. Посредством возможность преобразовывать отрицательные входные значения такие основанные на обрезании артефакты могут быть сокращены или устранены.

- Кривая преобразования тонов может быть легко инвертирована простым переключением преобразования x в y на преобразование y в x;

- Не требуется использовать какие-либо не целочисленные экспоненциальные функции или функции степени, таким образом, вычисления являются более быстрыми и более эффективными, поскольку никакие не целочисленные показатели степени никогда не используются.

[0052] Относительно последней точки, с вычислительной точки зрения определение параметров функции в уравнении (2) для нетривиального значения контрастности (например, n ≠ 1 и/или когда n не является целым числом) требует использования шести функций степени (например, для y=pow(x,n), y=xn). Напротив, вычисления в таблице 1 никогда не требуют каких-либо не целочисленных функций степени (вычисление степеней 2 или 4 требует простого умножения). В целом, по сравнению с уравнением (1), уравнение (7) требует немного больше операций умножения/деления и сложения/вычитания на каждый входной отсчет, но не требует никаких функций степени. В некоторых вариантах осуществления уравнение (7) может быть реализовано с использованием поиска по таблице. Что еще более важно, пользовательские исследования, выполненные авторами изобретения, указывают, что пользователи предпочитают общее качество картины из изображений, сформированных с использованием новой функции (320) преобразования тонов.

Иллюстративная реализация компьютерной системы

[0053] Варианты осуществления настоящего изобретения могут быть реализованы с помощью компьютерной системы, систем, конфигурируемых в электронной схеме и компонентах, устройства в интегральной схеме (ИС; IC), такого как микроконтроллер, программируемой пользователем вентильной матрицы (ППВМ; FPGA) или другого конфигурируемого или программируемого логического устройства (ПЛУ; PLD), дискретного процессора или процессора цифровой обработки сигналов (ПЦОС; DSP), специализированной ИС (ASIC) и/или устройства, которое включает в себя одну или более таких систем, устройств или компонентов. Компьютер и/или ИС могут выполнять, управлять или исполнять инструкции, относящиеся к преобразованию изображений для изображений с расширенным динамическим диапазоном, таких как описанные в настоящем документе. Компьютер и/или ИС могут вычислять любой из множества параметров или значений, которые относятся к процессам преобразования изображений, описанным в настоящем документе. Варианты осуществления изображения и видео могут быть реализованы в аппаратных средствах, программном обеспечении, микропрограммном обеспечении и в различных их комбинациях.

[0054] Некоторые реализации изобретения содержат компьютерные процессоры, которые исполняют программные инструкции, которые побуждают эти процессоры выполнять способ изобретения. Например, один или более процессоров в дисплее, кодере, телевизионной приставке, транскодере и т.п. могут реализовать способы, относящиеся к преобразованиям изображений для HDR-изображений, как описано выше, посредством исполнения программных инструкций в памяти программ, доступной для процессоров. Изобретение также может быть обеспечено в форме программного продукта. Программный продукт может содержать любой носитель долговременного хранения, который несет набор компьютерно-читаемых сигналов, содержащих инструкции, которые при их исполнении процессором побуждают процессор исполнять способ изобретения. Программные продукты в соответствии с изобретением могут иметь любую из большого разнообразия форм. Программный продукт может содержать, например, физический носитель, такой как магнитные носители данных, например дискеты, жесткие диски; оптические носители данных, например, CD-ROM, DVD; электронные носители данных, например ПЗУ (постоянные запоминающие устройства), флэш-память и т.п. Компьютерно-читаемые сигналы в программном продукте опционально могут быть сжаты или зашифрованы.

[0055] Когда компонент (например, программный модуль, процессор, сборка, устройство, схема и т.д.) упоминается выше, если не указано обратное, упоминание этого компонента (в том числе упоминание "средства") должно интерпретироваться как включающее в себя в качестве эквивалентов этого компонента любой компонент, который выполняет функцию описанного компонента (например, который является функциональным эквивалентном), в том числе компоненты, которые не являются структурными эквивалентами для раскрытой структуры, которая выполняет функцию в продемонстрированных иллюстративных вариантах осуществления изобретения.

Эквиваленты, расширения, альтернативные варианты и прочее

[0056] Таким образом, описаны иллюстративные варианты осуществления, которые относятся к эффективному преобразованию изображений HDR-видео в SDR-видео. В предшествующем описании варианты осуществления настоящего изобретения были описаны со ссылкой на целый ряд конкретных подробностей, которые могут меняться от реализации к реализации. Таким образом, единственным и исключительным показателем того, что представляет собой изобретение, и того, что является изобретением по мнению заявителей, является формула изобретения, которая вытекает из этой заявки, в конкретной форме, в которой представлена данная формула изобретения, включая любые последующие исправления. Любые определения, явно изложенные в настоящем документе для терминов, содержащихся в формуле изобретения, должны обуславливать значения таких терминов в контексте формулы изобретения. Следовательно, ограничение, элемент, свойство, признак, преимущество или атрибут, которые явно не изложены в пункте формулы изобретения, ни в коем случае не должны ограничивать объем такого пункта формулы изобретения. Описание и чертежи должны, соответственно, расцениваться в иллюстративном, а не в ограничительном смысле.

[0057] Различные аспекты настоящего изобретения могут быть очевидны на основе следующих перечисленных иллюстративных вариантов осуществления (EEE):

EEE 1. Способ преобразования изображения из первого динамического диапазона во второй динамический диапазон с использованием процессора, способ содержит:

доступ к первым информационным данным для входного изображения в первом динамическом диапазоне, содержащим уровень входной точки черного (x1, SMin), уровень входных полутонов (x2, SMid) и уровень входной точки белого (x3, SMax) в первом динамическом диапазоне;

доступ ко вторым информационным данным для выходного изображения во втором динамическом диапазоне, содержащим первый уровень выходной точки черного (TminPQ) и первый уровень выходной точки белого (TmaxPQ) во втором динамическом диапазоне;

определение значения выходных полутонов во втором динамическом диапазоне на основе первых информационных данных и вторых информационных данных;

вычисление второй выходной точки черного и второй выходной точки белого во втором динамическом диапазоне на основе вторых информационных данных и значения выходных полутонов;

вычисление заднего наклона, переднего наклона и наклона полутонов на основе первых информационных данных, вторых информационных данных и значения выходных полутонов;

определение передаточной функции для отображения пиксельных значений входного изображения в первом динамическом диапазоне в соответствующие пиксельные значения выходного изображения во втором динамическом диапазоне, причем передаточная функция содержит два сегмента, причем первый сегмент определен на основе заднего наклона, наклона полутонов, входной точки черного, уровня входных полутонов, второй выходной точки черного и значения выходных полутонов, и второй сегмент определен на основе наклона полутонов, переднего наклона, уровня входных полутонов, входной точки белого, уровня выходных полутонов и второй выходной точки белого; и

преобразование входного изображения в выходное изображение с использованием определенной передаточной функции.

EEE 2. Способ согласно EEE 1, в котором первый динамический диапазон содержит расширенный динамический диапазон, и второй динамический диапазон содержит стандартный динамический диапазон.

EEE 3. Способ согласно EEE 1 или EEE 2, в котором передаточная функция дополнительно содержит первый линейный сегмент для входных значений, которые меньше входной точки черного в первом динамическом диапазоне, причем линейный сегмент имеет наклон, равный заднему наклону.

EEE 4. Способ согласно EEE 3, в котором передаточная функция для первого линейного сегмента содержит

y=TMin+(x-SMin)*slopeMin,

где x обозначает входное пиксельное значение, y обозначает выходное пиксельное значение, slopeMin обозначает задний наклон, TMin обозначает вторую выходную точку черного во втором динамическом диапазоне, и SMin обозначает входную точку черного в первом динамическом диапазоне.

EEE 5. Способ согласно любому из EEE 1-4, в котором передаточная функция дополнительно содержит второй линейный сегмент для входных значений, которые больше входной точки белого в первом динамическом диапазоне, причем линейный сегмент имеет наклон, равный переднему наклону.

EEE 6. Способ согласно EEE 5, в котором передаточная функция для второго линейного сегмента содержит

y=TMax+(x-SMax)*slopeMax,

где x обозначает входное пиксельное значение, y обозначает выходное пиксельное значение, slopeMax обозначает передний наклон, TMax обозначает вторую выходную точку белого во втором динамическом диапазоне, и SMax обозначает входную точку белого в первом динамическом диапазоне.

EEE 7. Способ согласно любому из EEE 1-6, в котором первый сегмент и/или второй сегмент определены на основе сплайнового полинома Эрмита третьего порядка.

EEE 8. Способ согласно EEE 7, в котором определение первого сегмента содержит вычисление

y=((2T3-3T2+1)*TMin+(T3-2T2+T)*(SMid-SMin)*slopeMin+

(-2T3+3T2)*TMid+(T3-T2)*(SMid-SMin)*slopeMid),

где T=(x-SMin)/(SMid-SMin), x обозначает входное пиксельное значение, y обозначает выходное пиксельное значение, slopeMin обозначает задний наклон, slopeMid обозначает наклон полутонов, TMin и TMid обозначают вторую выходную точку черного и уровень выходных полутонов, и SMin и SMid обозначают входную точку черного и уровень входных полутонов в первом динамическом диапазоне.

EEE 9. Способ согласно EEE 7 или EEE 8, в котором определение второго сегмента содержит вычисление

y=((2T3-3T2+1)*TMid+(T3-2T2+T)*(SMax-SMid)*slopeMid+

(-2T3+3T2)*TMax+(T3-T2)*(SMax-SMid)*slopeMax), (5c)

где T=(x-SMid)/(SMax-SMid), x обозначает входное пиксельное значение, y обозначает выходное пиксельное значение, slopeMax обозначает передний наклон, slopeMid обозначает наклон полутонов, TMid и TMax обозначают уровень выходных полутонов и вторую выходную точку белого во втором динамическом диапазоне, и SMid и SMax обозначают уровень входных полутонов и входную точку белого в первом динамическом диапазоне.

EEE 10. Способ согласно любому из EEE 1-9, в котором вычисление значения выходных полутонов содержит вычисление:

если SMid < TminPQ+a*TMinPQ

то TMid=TMinPQ+a*TMinPQ;

иначе если SMid > TmaxPQ-b*TmaxPQ

то TMid=TmaxPQ-b*TmaxPQ;

иначе TMid=SMid;

где TMid обозначает значение выходных полутонов, a и b являются значениями процентилей в диапазоне [0, 1], SMid обозначает уровень входных полутонов, и TminPQ и TmaxPQ содержат значения во вторых информационных данных.

EEE 11. Способ согласно любому из EEE 1-9, в котором вычисление значения выходных полутонов дополнительно содержит:

определение предварительного значения выходных полутонов во втором динамическом диапазоне и первого и второго граничных значений для предварительного значения выходных полутонов на основе первых информационных данных и первой выходной точки черного;

вычисление переднего смещения (head offset, смещения передней области) и заднего смещения (tail offset, смещения задней области) во втором динамическом диапазоне на основе предварительного значения выходных полутонов, первого и второго граничных значений и одного или более входных значений обеспечения сохранности контрастности; и

вычисление значения выходных полутонов во втором динамическом диапазоне на основе уровня входных полутонов в первом динамическом диапазоне и переднего и заднего смещений.

EEE 12. Способ согласно EEE 11, в котором определение предварительного значения выходных полутонов и первого и второго граничных значений для первого значения выходных полутонов содержит вычисление

midLoc=(SMid-TminPQ)/TDR;

headroom=(SMax-SMid)/TDR;

tailroom=(SMid-SMin)/TDR;

где

TDR=TmaxPQ-TminPQ,

midLoc обозначает предварительное значение выходных полутонов, tailroom и headroom обозначают первое и второе граничные значения для первого значения выходных полутонов, SMin, SMid и SMax обозначают первые информационные данные, и TminPQ обозначает первый уровень выходной точки черного.

EEE 13. Способ согласно EEE 11 или EEE 12, в котором по меньшей мере одно значение обеспечения сохранности контрастности составляет приблизительно 50%.

EEE 14. Способ согласно любому из EEE 11-13, в котором вычисление значения выходных полутонов (TMid) содержит вычисление

TMid=SMid-offsetHead+offsetTail,

где SMid обозначает уровень входных полутонов в первом динамическом диапазоне, и offsetHead и offsetTail обозначают переднее и заднее смещения.

EEE 15. Способ согласно EEE 14, в котором вычисление второй выходной точки белого и второй выходной точки черного во втором динамическом диапазоне содержит вычисление

TMax=min(TMid+SMax-SMid,TmaxPQ),

TMin=max(TMid-SMid+SMin,TminPQ,

где TMin обозначает вторую выходную точку черного, TMax обозначает вторую выходную точку белого, SMin и SMax обозначают входную точку черного и входную точку белого в первом динамическом диапазоне, и TminPQ и TmaxPQ обозначают первую выходную точку черного и первую выходную точку белого во втором динамическом диапазоне.

EEE 16. Способ согласно EEE 10 или EEE 15, дополнительно содержащий вычисление максимального значения заднего наклона (maxMinSlope) и/или максимального значения переднего наклона (maxMaxSlope) как

maxMinSlope=3* (TMid-TMin)/(SMid-SMin),

maxMaxSlope=3* (TMax-TMid)/(SMax-SMid).

EEE 17. Способ согласно EEE 16, в котором вычисление заднего наклона (slopeMin), наклона полутонов (slopeMid) и переднего наклона (slopeMax) дополнительно содержит вычисление

slopeMin=min([maxMinSlope,(( TMid - TMin)/(SMid - SMin))2]);

slopeMax=min([maxMaxSlope,1,((TMax - TMid)/(SMax - SMid))4]);

slopeMid=min([maxMinSlope,maxMaxSlope,contrastFactor*(1-SMid+TMid)]);

где contrastFactor обозначает параметр контрастности.

EEE 18. Способ по любому из EEE 1-17, дополнительно содержащий определение обратной поисковой таблицы для преобразования изображения из второго динамического диапазона обратно в первый динамический диапазон, способ содержит:

определение прямой поисковой таблицы, преобразовывающей множество значений x(i) в первом динамическом диапазоне в значения y(i) во втором динамическом диапазоне на основе определенной передаточной функции; и

формирование обратной поисковой таблицы, преобразовывающей множество значений y'(k) во втором динамическом диапазоне в соответствующие значения x'(k) в первом динамическом диапазоне, устанавливая:

если y'(k)=y(i), то x'(k)=x(i)

иначе

если y(i) < y'(k) < y(i+1), то соответствующее выходное значение x'(k) формируется посредством интерполяции значения между x(i) и x(i+1).

EEE 19. Устройство, содержащее процессор и сконфигурированное для выполнения любого из способов, изложенных в EEE 1-18.

EEE 20. Некратковременный компьютерно-читаемый запоминающий носитель, содержащий сохраненную на нем компьютерно-исполняемую инструкцию для исполнения способа согласно любому из EEE 1-18 с помощью одного или более процессоров.

Похожие патенты RU2713869C1

название год авторы номер документа
УПРАВЛЕНИЕ ОТОБРАЖЕНИЕМ ВИДЕОИЗОБРАЖЕНИЯ С РАСШИРЕННЫМ ДИНАМИЧЕСКИМ ДИАПАЗОНОМ 2016
  • Аткинс Робин
RU2659485C1
СПОСОБ УПРАВЛЕНИЯ ОТОБРАЖЕНИЕМ ИЗОБРАЖЕНИЙ, УСТРОЙСТВО ДЛЯ УПРАВЛЕНИЯ ОТОБРАЖЕНИЕМ ИЗОБРАЖЕНИЙ И ПОСТОЯННЫЙ МАШИНОЧИТАЕМЫЙ НОСИТЕЛЬ ДАННЫХ 2017
  • Аткинс Робин
RU2755873C2
УСТРОЙСТВО И СПОСОБ ДЛЯ ПРЕОБРАЗОВАНИЯ ДИНАМИЧЕСКОГО ДИАПАЗОНА ИЗОБРАЖЕНИЙ 2012
  • Книббелер, Чарльз, Леонардус, Корнелиус, Мария
  • Ван Дер Влетен, Ренатус, Йозефус
  • Де Хан, Вибе
RU2761120C2
ВЫЧИСЛЕНИЕ ДИНАМИЧЕСКИХ МЕТАДАННЫХ ДЛЯ РЕДАКТИРОВАНИЯ HDR КОНТЕНТА 2021
  • Аткинс, Робин
RU2813229C1
УПРАВЛЕНИЕ ОТОБРАЖЕНИЕМ ВИДЕО С РАСШИРЕННЫМ ДИНАМИЧЕСКИМ ДИАПАЗОНОМ 2014
  • Аткинс Робин
  • Кункель Тимо
  • Байер Таддеус
  • Чэнь Тао
RU2647636C2
УСТРОЙСТВО И СПОСОБ ДЛЯ ПРЕОБРАЗОВАНИЯ ДИНАМИЧЕСКОГО ДИАПАЗОНА ИЗОБРАЖЕНИЙ 2012
  • Книббелер Чарльз Леонардус Корнелиус Мария
  • Ван Дер Влетен Ренатус Йозефус
  • Де Хан Вибе
RU2643485C2
УСТРОЙСТВА И СПОСОБЫ ДЛЯ КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ ИЗОБРАЖЕНИЙ С HDR НА ОСНОВАНИИ ОБЛАСТЕЙ ЯРКОСТИ 2013
  • Мертенс Марк Йозеф Виллем
RU2643663C2
ПРОСТОЕ, НО ГИБКОЕ КОДИРОВАНИЕ ДИНАМИЧЕСКОГО ДИАПАЗОНА 2016
  • Стессен Ерун Хуберт Христоффел Якобус
RU2720446C2
ОПТИМИЗАЦИЯ ИЗОБРАЖЕНИЙ С РАСШИРЕННЫМ ДИНАМИЧЕСКИМ ДИАПАЗОНОМ ДЛЯ ОПРЕДЕЛЕННЫХ ДИСПЛЕЕВ 2015
  • Ван Морик, Йоханнес Герардус Рийк
  • Мертенс, Марк Йозеф Виллем
  • Нейланд, Рутгер
RU2687267C2
УСТРОЙСТВО ПЕРЕДАЧИ, СПОСОБ ПЕРЕДАЧИ, УСТРОЙСТВО ПРИЕМА И СПОСОБ ПРИЕМА 2014
  • Цукагоси Икуо
RU2657473C2

Иллюстрации к изобретению RU 2 713 869 C1

Реферат патента 2020 года ПРЕОБРАЗОВАНИЕ ТОНОВОЙ КРИВОЙ ДЛЯ ИЗОБРАЖЕНИЙ С РАСШИРЕННЫМ ДИНАМИЧЕСКИМ ДИАПАЗОНОМ

Изобретение относится к вычислительной технике. Технический результат заключается в повышении точности определения тоновой кривой для преобразования HDR-изображений для отображения. Преобразование изображения из первого динамического диапазона во второй динамический диапазон основано на функции, которая включает в себя два сплайновых полинома, определенных с использованием трех опорных точек и трех наклонов. Первая опорная точка определена с использованием уровней точки черного из ввода и целевого вывода, вторая опорная точка определена с использованием уровней точки белого из ввода и целевого вывода, и третья опорная точка определена с использованием данных информации о полутонах для ввода и целевого вывода. Уровень полутонов целевого вывода вычисляется адаптивно на основе идеального преобразования 1 к 1 и посредством обеспечения сохранности входной контрастности и в тенях, и в бликах. 3 н. и 16 з.п. ф-лы, 1 табл., 8 ил.

Формула изобретения RU 2 713 869 C1

1. Способ преобразования изображения из первого динамического диапазона во второй динамический диапазон с использованием процессора, причем способ содержит этапы, на которых:

осуществляют доступ к первым информационным данным для входного изображения в первом динамическом диапазоне, первые информационные данные содержат уровень входной точки черного (x1, SMin), уровень входных полутонов (x2, SMid) и уровень входной точки белого (x3, SMax) в первом динамическом диапазоне;

осуществляют доступ ко вторым информационным данным для выходного изображения во втором динамическом диапазоне, вторые информационные данные содержат первый уровень выходной точки черного (TminPQ) и первый уровень выходной точки белого (TmaxPQ) во втором динамическом диапазоне;

определяют значение выходных полутонов во втором динамическом диапазоне на основе первых информационных данных и вторых информационных данных;

вычисляют вторую выходную точку черного и вторую выходную точку белого во втором динамическом диапазоне на основе вторых информационных данных и значения выходных полутонов;

вычисляют задний наклон, передний наклон и наклон полутонов на основе первых информационных данных, вторых информационных данных и значения выходных полутонов;

определяют передаточную функцию для преобразования пиксельных значений входного изображения в первом динамическом диапазоне в соответствующие пиксельные значения выходного изображения во втором динамическом диапазоне, причем передаточная функция содержит два сегмента, причем первый сегмент определен на основе заднего наклона, наклона полутонов, уровня входной точки черного, уровня входных полутонов, второй выходной точки черного и значения выходных полутонов, и второй сегмент определен на основе наклона полутонов, переднего наклона, уровня входных полутонов, уровня входной точки белого, значения выходных полутонов и второй выходной точки белого; и

преобразовывают входное изображение в выходное изображение с использованием упомянутой определенной передаточной функции.

2. Способ по п. 1, в котором вычисление второй выходной точки черного и второй выходной точки белого во втором динамическом диапазоне дополнительно основано на первых информационных данных.

3. Способ по п. 1 или 2, в котором:

вычисление заднего наклона основано на уровне входной точки черного, уровне входных полутонов, второй выходной точке черного и значении выходных полутонов;

вычисление переднего наклона основано на уровне входной точки белого, уровне входных полутонов, второй выходной точке белого и значении выходных полутонов; и

вычисление наклона полутонов основано на первых информационных данных, второй выходной точке черного, второй выходной точке белого и значении выходных полутонов.

4. Способ по любому из пп. 1-3, в котором первый динамический диапазон содержит расширенный динамический диапазон, и второй динамический диапазон содержит стандартный динамический диапазон.

5. Способ по любому из пп. 1-4, в котором передаточная функция дополнительно содержит первый линейный сегмент для входных значений, которые меньше уровня входной точки черного в первом динамическом диапазоне, причем упомянутый линейный сегмент имеет наклон, равный заднему наклону, причем опционально передаточная функция для первого линейного сегмента содержит

y=TMin+(x-SMin)*slopeMin,

где x обозначает входное пиксельное значение, y обозначает выходное пиксельное значение, slopeMin обозначает задний наклон, TMin обозначает вторую выходную точку черного во втором динамическом диапазоне, и SMin обозначает уровень входной точки черного в первом динамическом диапазоне.

6. Способ по любому из пп. 1-5, в котором передаточная функция дополнительно содержит второй линейный сегмент для входных значений, которые больше уровня входной точки белого в первом динамическом диапазоне, причем упомянутый линейный сегмент имеет наклон, равный переднему наклону, причем опционально передаточная функция для второго линейного сегмента содержит

y=TMax+(x-SMax)*slopeMax,

где x обозначает входное пиксельное значение, y обозначает выходное пиксельное значение, slopeMax обозначает передний наклон, TMax обозначает вторую выходную точку белого во втором динамическом диапазоне, и SMax обозначает уровень входной точки белого в первом динамическом диапазоне.

7. Способ по любому из пп. 1-6, в котором первый сегмент и/или второй сегмент определены на основе сплайнового полинома Эрмита третьего порядка.

8. Способ по п. 7, в котором определение первого сегмента содержит вычисление

y=((2T3-3T2+1)*TMin+(T3-2T2+T)*(SMid-SMin)*slopeMin+

(-2T3+3T2)*TMid+(T3-T2)*(SMid-SMin)*slopeMid),

где T=(x-SMin)/(SMid-SMin), x обозначает входное пиксельное значение, y обозначает выходное пиксельное значение, slopeMin обозначает задний наклон, slopeMid обозначает наклон полутонов, TMin и TMid обозначают вторую выходную точку черного и значение выходных полутонов, и SMin и SMid обозначают уровень входной точки черного и уровень входных полутонов в первом динамическом диапазоне.

9. Способ по п. 7 или 8, в котором определение второго сегмента содержит вычисление

y=((2T3-3T2+1)*TMid+(T3-2T2+T)*(SMax-SMid)*slopeMid+

(-2T3+3T2)*TMax+(T3-T2)*(SMax-SMid)*slopeMax), (5c),

где T=(x-SMid)/(SMax-SMid), x обозначает входное пиксельное значение, y обозначает выходное пиксельное значение, slopeMax обозначает передний наклон, slopeMid обозначает наклон полутонов, TMid и TMax обозначают значение выходных полутонов и вторую выходную точку белого во втором динамическом диапазоне, и SMid и SMax обозначают уровень входных полутонов и уровень входной точки белого в первом динамическом диапазоне.

10. Способ по любому из пп. 1-9, в котором вычисление значения выходных полутонов содержит вычисление:

если Smid < TminPQ+a*TMinPQ,

то TMid=TMinPQ+a*TMinPQ;

иначе если SMid > TmaxPQ-b*TmaxPQ

то TMid=TmaxPQ-b*TmaxPQ;

иначе TMid=SMid;

где TMid обозначает значение выходных полутонов, a и b являются значениями процентилей в диапазоне [0, 1], SMid обозначает уровень входных полутонов, и TminPQ и TmaxPQ содержат значения во вторых информационных данных.

11. Способ по любому из пп. 1-10, в котором вычисление значения выходных полутонов дополнительно содержит этапы, на которых:

определяют предварительное значение выходных полутонов во втором динамическом диапазоне и первое, и второе граничные значения для предварительного значения выходных полутонов на основе первых информационных данных и первой выходной точки черного;

вычисляют переднее смещение и заднее смещение во втором динамическом диапазоне на основе предварительного значения выходных полутонов, первого и второго граничных значений и одного или более входных значений обеспечения сохранности контрастности; и

вычисляют значение выходных полутонов во втором динамическом диапазоне на основе уровня входных полутонов в первом динамическом диапазоне и переднего, и заднего смещений.

12. Способ по п. 11, в котором определение предварительного значения выходных полутонов и первого, и второго граничных значений для первого значения выходных полутонов содержит вычисление

midLoc=(SMid-TminPQ)/TDR;

headroom=(SMax-SMid)/TDR;

tailroom=(SMid-SMin)/TDR;

где

TDR=TmaxPQ-TminPQ,

midLoc обозначает предварительное значение выходных полутонов, tailroom и headroom обозначают первое и второе граничные значения для первого значения выходных полутонов, SMin, SMid и SMax обозначают первые информационные данные, и TminPQ обозначает первый уровень выходной точки черного.

13. Способ по п. 11 или 12, в котором по меньшей мере одно значение обеспечения сохранности контрастности составляет приблизительно 50%.

14. Способ по любому из пп. 11-13, в котором вычисление значения выходных полутонов (TMid) содержит вычисление

TMid=SMid-offsetHead+offsetTail,

где SMid обозначает уровень входных полутонов в первом динамическом диапазоне, и offsetHead и offsetTail обозначают переднее и заднее смещения.

15. Способ по п. 14, в котором вычисление второй выходной точки белого и второй выходной точки черного во втором динамическом диапазоне содержит вычисление

TMax=min(TMid+SMax-SMid,TmaxPQ),

TMin=max(TMid-SMid+SMin,TminPQ,

где TMin обозначает вторую выходную точку черного, TMax обозначает вторую выходную точку белого, SMin и SMax обозначают уровень входной точки черного и уровень входной точки белого в первом динамическом диапазоне, и TminPQ и TmaxPQ обозначают первую выходную точку черного и первую выходную точку белого во втором динамическом диапазоне.

16. Способ по п. 10 или 15, дополнительно содержащий вычисление максимального значения заднего наклона (maxMinSlope) и/или максимального значения переднего наклона (maxMaxSlope) как

maxMinSlope=3* (TMid-TMin)/(SMid-SMin),

maxMaxSlope=3* (TMax-TMid)/(SMax-SMid),

причем опционально:

вычисление заднего наклона (slopeMin), наклона полутонов (slopeMid) и переднего наклона (slopeMax) дополнительно содержит вычисление

slopeMin=min([maxMinSlope,(( TMid - TMin)/(SMid - SMin))2]);

slopeMax=min([maxMaxSlope,1,((TMax - TMid)/(SMax - SMid))4]);

slopeMid=min([maxMinSlope,maxMaxSlope,contrastFactor*(1-SMid+TMid)]);

где contrastFactor обозначает параметр контрастности.

17. Способ по любому из пп. 1-16, дополнительно содержащий определение обратной поисковой таблицы для преобразования изображения из второго динамического диапазона обратно в первый динамический диапазон, причем способ содержит этапы, на которых:

определяют прямую поисковую таблицу, преобразовывающую множество значений x(i) в первом динамическом диапазоне в значения y(i) во втором динамическом диапазоне на основе упомянутой определенной передаточной функции; и

формируют обратную поисковую таблицу, преобразовывающую множество значений y'(k) во втором динамическом диапазоне в соответствующие значения x'(k) в первом динамическом диапазоне, устанавливая:

если y'(k)=y(i), то x'(k)=x(i)

иначе

если y(i) < y'(k) < y(i+1), то соответствующее выходное значение x'(k) формируется посредством интерполяции значения между x(i) и x(i+1).

18. Устройство, содержащее процессор и сконфигурированное для выполнения любого из способов, изложенных в пп. 1-17.

19. Некратковременный компьютерно-читаемый запоминающий носитель, содержащий сохраненную на нем компьютерно-исполняемую инструкцию для исполнения способа в соответствии с любым из пп. 1-17 с помощью одного или более процессоров.

Документы, цитированные в отчете о поиске Патент 2020 года RU2713869C1

Многоступенчатая активно-реактивная турбина 1924
  • Ф. Лезель
SU2013A1
Способ приготовления мыла 1923
  • Петров Г.С.
  • Таланцев З.М.
SU2004A1
Многоступенчатая активно-реактивная турбина 1924
  • Ф. Лезель
SU2013A1
Устройство для закрепления лыж на раме мотоциклов и велосипедов взамен переднего колеса 1924
  • Шапошников Н.П.
SU2015A1
КОДИРОВАНИЕ, ДЕКОДИРОВАНИЕ И ПРЕДСТАВЛЕНИЕ ИЗОБРАЖЕНИЙ С РАСШИРЕННЫМ ДИНАМИЧЕСКИМ ДИАПАЗОНОМ 2012
  • Цзя Веньхуэй
  • Нинан Аджит
  • Тэн Аркадий
  • Вард Грегори Джон
  • Ван Гавен
RU2589857C2

RU 2 713 869 C1

Авторы

Питларц, Жаклин Энн

Аткинс, Робин

Даты

2020-02-07Публикация

2018-02-12Подача