МЕТАДАННЫЕ ТИПА ВИДЕОСОДЕРЖИМОГО ДЛЯ РАСШИРЕННОГО ДИНАМИЧЕСКОГО ДИАПАЗОНА Российский патент 2024 года по МПК H04N19/46 

Описание патента на изобретение RU2818525C2

ПЕРЕКРЕСТНАЯ ССЫЛКА НА РОДСТВЕННЫЕ ЗАЯВКИ

[1] Данная заявка заявляет приоритет предварительной заявки на патент США №62/868,070, поданной 28 июня 2019 г., и заявки на европейский патент №19183269.0, поданной 28 июня 2019 г., каждая из которых включена в настоящий документ посредством ссылки во всей полноте.

ОБЛАСТЬ ТЕХНИКИ

[2] Настоящее изобретение в целом относится к изображениям. Более конкретно, вариант осуществления настоящего изобретения относится к метаданным типа видеосодержимого.

ПРЕДПОСЫЛКИ ИЗОБРЕТЕНИЯ

[3] В настоящем документе термин «динамический диапазон» может относиться к способности зрительной системы человека воспринимать диапазон интенсивности (например, освещенности, яркости) в изображении, например от самых темных черных (тени) до самых светлых белых (наиболее ярких) участков изображения. В этом смысле динамический диапазон соответствует «относящейся к сцене» интенсивности. Динамический диапазон может также относиться к способности дисплейного устройства в достаточной мере или приблизительно воспроизводить диапазон интенсивности конкретной ширины. В этом смысле динамический диапазон соответствует «относящейся к отображению» интенсивности. За исключением случаев, когда точно задано, что конкретный смысл имеет конкретное значение в любом месте в описании в данном документе, следует подразумевать, что термин может быть использован в любом смысле, например взаимозаменяемо.

[4] В данном документе термин «расширенный динамический диапазон» (high dynamic range, HDR) относится к ширине динамического диапазона, которая охватывает приблизительно 14 15 порядков величины зрительной системы человека. На практике динамический диапазон, в котором человек может одновременно воспринимать пространственную ширину в диапазоне интенсивности, может быть немного сокращен относительно HDR. В настоящем документе термины «увеличенный динамический диапазон» (enhanced dynamic range, EDR) или «визуальный динамический диапазон» (visual dynamic range, VDR) могут по отдельности или взаимозаменяемо относиться к динамическому диапазону, который одновременно воспринимается зрительной системой человека. В настоящем документе EDR может относиться к динамическому диапазону, который охватывает от пяти до шести порядков величины. Таким образом, хотя возможна несколько более узкая ширина в отношении относящегося к настоящей сцене HDR, тем не менее EDR представляет ширину широкого динамического диапазона и может также называться HDR.

[5] На практике изображения содержат один или более цветовых компонентов (например, яркость Y и цветность Cb и Cr), при этом каждый цветовой компонент представлен с точностью до n бит на пиксель (например, n=8). При использовании линейного яркостного кодирования изображения, в которых n<8 (например, цветные 24-битные изображения JPEG) рассматриваются как изображения стандартного динамического диапазона, тогда как изображения, в которых n>8, могут быть рассмотрены как изображения увеличенного динамического диапазона. EDR- и HDR-изображения также могут быть сохранены и распределены с использованием высокоточных (например, 16-битных) форматов с плавающей запятой, таких как формат файла OpenEXR, разработанный компанией «Industrial Light and Magic».

[6] Большая часть потребительских настольных дисплеев поддерживает яркость от 200 до 300 кд/м, или нитов. Большая часть потребительских HDTV имеет диапазон от 300 до 1000 кд/м. Таким образом, такие традиционные дисплеи являются типичными представителями низкого динамического диапазона (low dynamic range, LDR), также называемого стандартным динамическим диапазоном (standard dynamic range, SDR), относительно HDR или EDR. Поскольку доступность EDR-содержимого растет вследствие развития как оборудования захвата (например, камер), так и EDR-дисплеев (например, профессионального контрольного монитора PRM-4200 от компании «Dolby Laboratories))), EDR-содержимое может быть отсортировано по цвету и отображено на EDR-дисплеях, которые поддерживают более широкие динамические диапазоны (например, от 1000 нитов до 5000 нитов или более).

[7] В настоящем документе термин «метаданные» относится к любой вспомогательной информации, которая передается как часть кодированного битового потока и помогает декодеру представлять декодированное изображение. Такие метаданные могут включать, но без ограничения, информацию о цветовом пространстве или гамме, параметры исходного дисплея и параметры вспомогательного сигнала, например описанные в настоящем документе.

[8] В настоящем документе термин «управление дисплеем» включает, но без ограничения, обработку (например, отображение тона и гаммы), применяемую для отображения входного видеосигнала первого динамического диапазона (например, одна тысяча нитов) на дисплей второго динамического диапазона (например, пятьсот нитов).

[9] Подходы, описанные в данном разделе, являются подходами, которые могут быть выполнены, но необязательно подходами, которые были ранее предложены или выполнены. Следовательно, если не указано иное, не следует предполагать, что любой из подходов, описанных в данном разделе, расценивается как известный уровень техники только лишь вследствие их включения в данный раздел. Аналогично на основе данного раздела не следует полагать, что недостатки, определенные относительно одного или более подходов, были учтены в известном уровне техники, если не указано иное.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

[10] Аппарат и способы согласно настоящему изобретению предоставляют решения проблемы сохранения творческого замысла видео в декодере или целевом дисплее. Согласно варианту осуществления настоящего изобретения битовый поток видео включает метаданные, которые передают в декодер или целевой дисплей тип видеосодержимого, находящегося в битовом потоке. Эти метаданные могут включать многочисленные поля, которые обозначают характеристики видеосодержимого, такие как тип содержимого и подтип содержимого, которые обусловливают применение целевым дисплеем соответствующего режима дисплея со связанными настройками дисплея. Целевой дисплей может применять дополнительные регулировки к отдельным настройкам дисплея на основании полей в метаданных, которые определяют, например, желаемую белую точку, использовать или не использовать видео в эталонном режиме, желаемую резкость, желаемое шумоподавление, желаемое шумоподавление MPEG, желаемое преобразование частоты кадров, желаемый средний уровень яркости изображения и желаемый цвет. Ряд полей в метаданных добавляют с определенной иерархией. Иерархия полей обусловливает дополнительное уточнение настроек дисплея, которые уже были отрегулированы полем, относящимся к более высокому уровню иерархии. Например, тип содержимого может обусловливать базовую регулировку конкретных настроек дисплея на первом уровне иерархии. При выборе более конкретного подтипа содержимого на втором уровне иерархии часть настроек дисплея дополнительно регулируются в соответствии с особенностями выбранного подтипа содержимого. На третьем уровне иерархии поля обусловливают индивидуальные регулировки конкретных настроек дисплея. Эти метаданные предназначены для обеспечения не требующей усилий маркировки создателями создаваемого ими содержимого. В зависимости от прилагаемого усилия создатели содержимого могут применять базовые регулировки, просто выбирая соответствующий тип содержимого и необязательно подтип содержимого. Вместе с тем, они также могут применять дополнительные регулировки на индивидуальном уровне, которые влияют непосредственно на конкретные настройки дисплея на целевом дисплее.

[11] Метаданные позволяют иметь несколько точек, в которых метаданные могут быть добавлены к видеосодержимому. Для идентификации того, определены ли метаданные исходным создателем содержимого, метаданные содержат флаг эталонного режима, который может быть установлен в значение ИСТИНА или ЛОЖЬ. Флаг эталонного режима устанавливают в значение ИСТИНА, если метаданные добавил исходный создатель содержимого, тем самым указывая, что применение метаданных на целевом дисплее сохраняет творческий замысел. Флаг устанавливают в значение ЛОЖЬ, если метаданные добавил кто-то другой, а не исходный создатель содержимого.

[12] Согласно первому аспекту настоящего изобретения представлен способ генерирования битового потока цифрового видео из видеосодержимого, при этом способ включает: обеспечение доступа к множеству видеокадров видеосодержимого; генерирование метаданных со сведениями о содержимом для видеосодержимого; и генерирование битового потока видео на основании видеосодержимого и метаданных со сведениями о содержимом, при этом метаданные со сведениями о содержимом включают: одно или более полей категории, указывающих категорию видеосодержимого битового потока цифрового видео, при этом одно или более полей категории обусловливают выбор целевым дисплеем настроек дисплея для отображения видеосодержимого в режиме дисплея, соответствующем категории видеосодержимого, и флаг эталонного режима, указывающий на то, следует ли применять одно или более полей категории для обусловливания выбора целевым дисплеем настроек дисплея для отображения видеосодержимого в эталонном режиме, причем эталонный режим представляет собой режим дисплея, имеющий определенные настройки дисплея, при этом способ включает установку одного или более полей категории в метаданных со сведениями о содержимом согласно категории видеосодержимого и установку флага эталонного режима в метаданных со сведениями о содержимом для указания того, указывают или нет одно или более полей категории эталонный режим, при этом, когда метаданные со сведениями о содержимом генерируются создателем видеосодержимого, флаг эталонного режима устанавливают в первое логическое значение, указывающее, что одно или более полей категории следует использовать в эталонном режиме и в режиме, не являющемся эталонным, и когда метаданные со сведениями о содержимом генерируются третьей стороной, флаг эталонного режима устанавливают во второе логическое значение, указывающее, что одно или более полей категории следует игнорировать в эталонном режиме и использовать в режиме, не являющемся эталонным.

В предпочтительном варианте настоящего изобретения одно или более полей категории в метаданных со сведениями о содержимом содержат по меньшей мере одно из типа видеосодержимого и подтипа видеосодержимого.

В другом предпочтительном варианте настоящего изобретения установка одного или более полей категории в метаданных со сведениями о содержимом включает: прием метаданных спецификации Tech 3293 метаданных ядра Европейского вещательного союза и применение отображения из принятых метаданных спецификации Tech 3293 метаданных ядра Европейского вещательного союза в одно или более полей категории.

В другом предпочтительном варианте настоящего изобретения метаданные со сведениями о содержимом дополнительно включают: одно или более полей регулировки, указывающих желаемые регулировки настроек дисплея для видеосодержимого целевого дисплея при отображении видеосодержимого на целевом дисплее, при этом одно или более полей регулировки обусловливают регулировку целевым дисплеем по меньшей мере части выбранных настроек дисплея для отображения видеосодержимого в режиме дисплея, тем самым уточняя применяемый режим дисплея регулируемыми настройками дисплея.

В другом предпочтительном варианте настоящего изобретения одно или более полей регулировки в метаданных со сведениями о содержимом указывают по меньшей мере одно из следующего: желаемую белую точку видеосодержимого, желаемую резкость видеосодержимого, желаемое шумоподавление видеосодержимого, желаемое шумоподавление MPEG видеосодержимого, желаемое преобразование частоты кадров видеосодержимого, средний уровень яркости изображения видеосодержимого и желаемый цвет видеосодержимого.

В другом предпочтительном варианте настоящего изобретения одно или более полей регулировки устанавливают в метаданных со сведениями о содержимом посредством операций, включающих: прием метаданных спецификации Tech 3293 метаданных ядра Европейского вещательного союза и применение отображения из принятых метаданных спецификации Tech 3293 метаданных ядра Европейского вещательного союза в одно или более полей регулировки

Согласно второму аспекту настоящего изобретения представлен способ воспроизведения видеосодержимого на целевом дисплее в эталонном режиме, причем эталонный режим представляет собой режим дисплея, имеющий определенные настройки дисплея, этот способ включает: прием битового потока цифрового видео, содержащего видеосодержимое и метаданные со сведениями о содержимом, при этом эти метаданные со сведениями о содержимом включают: одно или более полей категории, указывающих категорию видеосодержимого битового потока цифрового видео, и флаг эталонного режима, указывающий на то, следует ли применять одно или более полей категории для обусловливания выбора целевым дисплеем настроек дисплея для отображения видеосодержимого в эталонном режиме, декодирование видеосодержимого на декодере, извлечение флага эталонного режима из метаданных со сведениями о содержимом, если флаг эталонного режима устанавливают в первое логическое значение, указывающее, что метаданные со сведениями о содержимом генерируются создателем видеосодержимого: применение одного или более полей категории метаданных со сведениями о содержимом для определения категории видеосодержимого, определение режима дисплея, который соответствует определенной категории видеосодержимого, применение настроек дисплея определенного режима дисплея к целевому дисплею и отображение видеосодержимого; если флаг эталонного режима устанавливают во второе логическое значение, указывающее, что метаданные со сведениями о содержимом генерируются третьей стороной: отображение видеосодержимого без применения метаданных со сведениями о содержимом, которые включают одно или более полей категории.

В предпочтительном варианте настоящего изобретения одно или более полей категории в метаданных со сведениями о содержимом содержат по меньшей мере одно из типа видеосодержимого и подтипа видеосодержимого.

В другом предпочтительном варианте настоящего изобретения метаданные со сведениями о содержимом дополнительно включают: одно или более полей регулировки, указывающих желаемые регулировки настроек дисплея для видеосодержимого целевого дисплея при отображении видеосодержимого на целевом дисплее, при этом одно или более полей регулировки обусловливают регулировку целевым дисплеем по меньшей мере части выбранных настроек дисплея для отображения видеосодержимого в режиме дисплея, тем самым уточняя применяемый режим дисплея регулируемыми настройками дисплея.

В другом предпочтительном варианте настоящего изобретения одно или более полей регулировки в метаданных со сведениями о содержимом указывают по меньшей мере одно из следующего: желаемую белую точку видеосодержимого, желаемую резкость видеосодержимого, желаемое шумоподавление видеосодержимого, желаемое шумоподавление MPEG видеосодержимого, желаемое преобразование частоты кадров видеосодержимого, средний уровень яркости изображения видеосодержимого и желаемый цвет видеосодержимого.

Согласно третьему аспекту настоящего изобретения представлен машиночитаемый носитель, содержащий команды, которые при исполнении процессором выполняют способ по первому аспекту настоящего изобретения.

ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВ

[13] На фиг. 1 изображен пример процесса последовательности для доставки видео, показывающий различные этапы от захвата видео до отображения видеосодержимого.

[14] На фиг. 2 изображен пример использования раскрытого флага метаданных в виде таблицы.

[15] На фиг. 3 изображен пример использования флага эталонного режима (RM) L11 в виде блок-схемы.

[16] На фиг. 4A-AD изображен пример деталей раскрытых метаданных в виде таблицы.

[17] На фиг. 5 изображен пример деталей типа содержимого в раскрытых метаданных в виде таблицы.

[18] На фиг. 6 изображен пример типичных настроек режима изображения в раскрытых метаданных в виде таблицы.

[19] На фиг. 7 изображен пример деталей подтипа содержимого в раскрытых метаданных в виде таблицы.

[20] На фиг. 8 изображен пример деталей желаемой белой точки в раскрытых метаданных в виде таблицы.

[21] На фиг. 9 изображен пример деталей желаемой резкости в раскрытых метаданных в виде таблицы.

[22] На фиг. 10 изображен пример деталей желаемого шумоподавления в раскрытых метаданных в виде таблицы.

[23] На фиг. 11 изображен пример деталей желаемого шумоподавления MPEG в раскрытых метаданных в виде таблицы.

[24] На фиг. 12 изображен пример деталей преобразования частоты кадров в раскрытых метаданных в виде таблицы.

[25] На фиг. 13 изображен пример деталей среднего уровня яркости изображения в раскрытых метаданных в виде таблицы.

[26] На фиг. 14 изображен пример деталей желаемого цвета в раскрытых метаданных в виде таблицы.

[27] На фиг. 15 изображен пример отображения сервера воспроизведения вещания в виде таблицы.

ОПРЕДЕЛЕНИЯ

[28] Во всем настоящем описании «эталонный режим» (RM) определяется как состояние воспроизведения целевого дисплея, где целевой дисплей представляет видеосодержимое в полном соответствии с исходным творческим замыслом. Это состояние воспроизведения может быть достигнуто настройкой целевого дисплея в определенном режиме дисплея со связанными настройками дисплея. Настройки дисплея определенного режима дисплея могут быть дополнительно отрегулированы для сохранения исходного творческого замысла.

[29] Преобразование частоты кадров обозначает преобразование между разными частотами видеокадров (например, из 60 кадров в секунду в 120 кадров в секунду и т.п.). Преобразование частоты кадров представляет собой дублирование потенциально включающее оценку движения и компенсацию движения или уменьшение кадров для отображения содержимого на видеоустройстве с другой частотой кадров.

[30] Перцепционное квантование (Perceptual Quantization, PQ) является эффективным способом кодирования изображений с расширенным динамическим диапазоном (HDR). Каждая последовательная пара кодовых значений отличается чуть менее чем на воспринимаемый шаг во всем динамическом диапазоне, обеспечивая очень эффективное использование кодовых значений. Примеры использования кодирования и декодирования с помощь PQ могут быть найдены в отчете ITU-R ВТ. 2390, «High dynamic range television for production and international programme exchange (Телевидение с расширенным динамическим диапазоном для производства и международного обмена программами)», ITU, 2016 г. Альтернативы использования PQ включают использование параметров сигнала традиционного формата «гамма» и гибридного формата логарифм-гамма (HLG).

ПОДРОБНОЕ ОПИСАНИЕ

[31] В настоящем документе описаны метаданные типа видеосодержимого для расширенного динамического диапазона (HDR). В следующем описании в целях пояснения изложены многочисленные конкретные подробности для обеспечения полного понимания настоящего изобретения. Однако будет понятно, что заявляемый в данном случае предмет изобретения может быть реализован на практике без этих конкретных подробностей. В других примерах широко известные структуры и устройства не описаны в мельчайших подробностях, чтобы избежать излишнего усложнения, запутывания, затруднения понимания настоящего изобретения.

[32] На фиг. 1 изображен пример процесса последовательности 100 для доставки видео, показывающий различные этапы от захвата видео до отображения видеосодержимого. Последовательность видеокадров 102 захватывают или генерируют с использованием блока 105 генерирования изображений. Видеокадры 102 могут быть захвачены цифровым способом (например, посредством цифровой видеокамеры) или сгенерированы компьютером (например, с использованием компьютерной анимации) для предоставления видеоданных 107. Альтернативно видеокадры 102 могут быть захвачены на пленке кинокамерой, в этом случае пленку переводят в цифровой формат для предоставления видеоданных 107. На этапе ПО производства видеоданные 107 редактируют для предоставления потока 112 видеопроизводства.

[33] Видеоданные потока 112 видеопроизводства затем предоставляют на процессор в блоке 115 постпроизводства для редактирования в постпроизводстве. Блок 115 редактирования в постпроизводстве может включать регулирование или модификацию цветов или яркости в конкретных областях изображения для повышения качества изображения или получения определенного визуального вида для изображения в соответствии с творческим замыслом создателя видео. Это иногда называют «цветоустановкой» или «цветокоррекцией». В блоке 115 постпроизводства может быть выполнено и другое редактирование (например, выбор сцен и определение последовательностей, обрезка изображений, добавление сгенерированных на компьютере визуальных специальных эффектов и т.п.) для получения окончательной версии 117 производства для дистрибуции. Во время редактирования в постпроизводстве блока 115 постпроизводства видеоизображения просматривают на эталонном дисплее 125.

[34] После постпроизводства в блоке 115 постпроизводства видеоданные окончательной версии 117 могут быть доставлены в кодер 120 для доставки ниже по потоку в устройства декодирования и воспроизведения, такие как телевизоры, приставки, кинотеатры и т.п.В некоторых вариантах осуществления кодер 120 может содержать кодеры звука и видео, такие как определены ATSC, DVB, DVD, Blu-Ray и другими форматами доставки, чтобы генерировать кодированный битовый поток 122. В приемнике кодированный битовый поток 122 декодируют посредством декодера 130, чтобы генерировать декодированный сигнал 132, представляющий идентичные видеоданные или близкую аппроксимацию видеоданных, которые соответствуют окончательной версии 117. Приемник может быть подключен к целевому дисплею 151, который может обладать полностью отличающимися от эталонного дисплея 125 характеристиками. В этом случае блок 135 управления дисплеем может быть использован для отображения динамического диапазона декодированного сигнала 132 в характеристики целевого дисплея 151 посредством генерирования сигнала 137, отображаемого на дисплей. Целевой дисплей 151 может представлять собой эталонный монитор, компьютерный монитор или дисплей, телевизор (TV), устанавливаемый на голове дисплей, виртуальный ретинальный дисплей и т.п.

[35] Dolby Vision™ представляет собой полный комплекс, позволяющий создавать и распространять содержимое, созданное с помощью расширенного динамического диапазона и широкой цветовой гаммы. Управление дисплеем Dolby Vision соответствует возможностям данного телевизора благодаря использованию ряда алгоритмов для отображения сигнала на любой пользовательский телевизор Dolby Vision. Это создает для зрителя оптимальное и плавное восприятие видео.

[36] Полный комплекс, позволяющий создавать и распространять содержимое с расширенным динамическим диапазоном и широкой цветовой гаммой, такой как Dolby Vision, наряду с видеоданными включает и метаданные. Например, в Dolby Vision существуют разные уровни метаданных, которые имеют названия от уровня 1 (L1) до уровня 10 (L10). Примеры описания таких метаданных описаны в публикации WIPO WO 2019/050972 «Топе-curve optimization method and associated video» под именем R. Atkins et al., которая полностью включена в настоящий документ посредством ссылки. Битовый поток цифрового видео и способы генерирования битового потока цифрового видео и воспроизведения видеосодержимого согласно настоящему изобретению предоставляют решения задачи сохранения творческого замысла в декодере или целевом дисплее, а также предоставляют решение для идентификации категории видеосодержимого в декодере или целевом дисплее для регулирования настроек дисплея согласно идентифицированной категории видеосодержимого.

[37] Новый набор метаданных представлен в комплексе для создания и распространения видео с расширенным динамическим диапазоном и широкой цветовой гаммой, таком как Dolby Vision, именуемый, без ограничения, в настоящем документе как уровень 11 (L11), посредством которого задают намерение создателей содержимого в отношении характеристик воспроизведения видеосодержимого на декодере или целевом дисплее. Метаданные L11 позволяют передавать творческий замысел создателя содержимого в декодер или целевой дисплей. Эти метаданные со сведениями о содержимом указывают лучший способ представления содержимого целевым дисплеем. Метаданные L11 включают множество полей для обеспечения не требующей усилий маркировки создателем создаваемого им содержимого.

[38] Следует понимать, что битовый поток цифрового видео и способы генерирования битового потока цифрового видео и воспроизведения видеосодержимого согласно настоящему изобретению являются в целом применимыми для комплексов для создания и распространения видео с расширенным динамическим диапазоном и широкой цветовой гаммой, а термин «L11» используется в настоящем документе исключительно для наглядности и не предназначен для ограничения раскрытых в настоящем документе битового потока цифрового видео и способов генерирования битового потока цифрового видео и воспроизведения видеосодержимого.

[39] Целевые дисплеи, такие как телевизоры, имеют разные режимы дисплея, но выбор режима дисплея зависит от пользователя. Например, когда пользователь смотрит художественный фильм, он/она может изменить режим дисплея в телевизоре. Однако большинство пользователей недостаточно опытны или не считают, что стоит тратить время на изменение режима дисплея каждый раз, когда они просматривают различные типы содержимого. Выбор определенного режима дисплея обусловливает применение целевым дисплеем настроек дисплея, которые связаны с выбранным режимом дисплея.

[40] Настоящее изобретение предусматривает аппарат и способ автоматической идентификации категории видеосодержимого, в результате чего целевой дисплей может производить умное определение режима дисплея, который должен быть включен. Настоящее изобретение предусматривает аппарат и способ добавления в видеосодержимое сведений путем введения метаданных L11. Кроме того, настоящее изобретение позволяет определять наилучший способ представления видеосодержимого на целевом дисплее, так что целевому дисплею нет необходимости угадывать категорию видеосодержимого, так же как и пользователю нет необходимости угадывать категорию видеосодержимого. Более того, заявляемый в данном случае предмет изобретения позволяет пользователю и целевому дисплею не выполнять никаких действий во время воспроизведения видеосодержимого. Целевой дисплей просто выполняет то, что ему указывают сделать метаданные L11.

[41] В настоящее время целевые дисплеи выполняют обработку видеосодержимого на основании предположений, однако это не очень точный процесс. Имея метаданные со сведениями о содержимом, целевой дисплей уведомляется о правильной обработке видеосодержимого. Это гарантирует, что процесс принятия решения в целевом дисплее является информированным и что каждый раз достигается правильный результат. Например, целевой дисплей получает информацию из метаданных L11 о том, что содержимое относится к спорту, поэтому целевой дисплей во время воспроизведения переключается в режим дисплея, который соответствует спортивному содержимому, так, что связанные настройки дисплея режима дисплея устанавливаются соответственно.

[42] Согласно варианту осуществления настоящего изобретения битовый поток видео включает метаданные, которые сообщают на целевой дисплей категорию видеосодержимого, находящегося в битовом потоке. Эти метаданные могут включать многочисленные поля, которые указывают на характеристики видеосодержимого, такие как тип содержимого и подтип содержимого. Кроме того, выбранная категория видеосодержимого может быть уточнена прямым указанием регулировок конкретных настроек дисплея, таких как желаемая белая точка, использовать или нет видео в эталонном режиме, желаемая резкость, желаемое шумоподавление, желаемое шумоподавление MPEG, желаемое преобразование частоты кадров (FRC), желаемый средний уровень яркости изображения (APL) и желаемый цвет. Ряд полей в метаданных L11 добавлен с определенной иерархией.

[43] Метаданные L11 предназначены для обеспечения не требующей усилий маркировки создателями создаваемого ими содержимого: 1) Самый простой способ для создателя содержимого - это ничего не делать, что вызывает поведение по умолчанию; 2) Второй самый простой способ для создателя содержимого это сообщить на целевой декодер или целевой дисплей категорию содержимого, к которой относится видео, например художественный фильм, игра или спорт. В зависимости от этой информации метаданных целевой дисплей, такой как телевизор, выполняет высокоуровневое определение режима дисплея, например телевизор переключается в режим художественного фильма, игры или спорта. Телевизор осуществляет поиск надлежащих детальных настроек дисплея режима дисплея, которые соответствуют этим категориям соответственно; 3) Наконец, метаданные L11 позволяют создателю содержимого дополнительно указывать детали настроек дисплея на целевом дисплее, которые приводят к уточнению выбранного режима дисплея. Например, создатель содержимого может задать подтип содержимого, например, в случае спортивного содержимого, указать, является ли данный вид спорта зимним видом спорта или водным видом спорта. Более того, создатель содержимого может задать, например, что видеосодержимое будет лучше смотреться на целевом дисплее с преобразованием частоты кадров, выставленным в высокое значение. Метаданные L11 являются иерархическими, что позволяет при недостатке информации устанавливать тип содержимого или подтип содержимого в значение по умолчанию. Кроме того, метаданные L11 позволяют заменять эти значения по умолчанию метаданными от случая к случаю.

[44] Метаданные L11 могут быть заданы не только создателями содержимого, они также могут быть заданы на уровне приложения. Например, если интеллектуальный проигрыватель Blu-Ray выполняет воспроизведение с потокового сервиса видеофильмов, такого как Netflix® (Netflix® является зарегистрированным торговым знаком компании «Netflix Inc.»), интеллектуальный проигрыватель Blu-Ray может установить метаданные под настройки для фильмов или сериалов; если интеллектуальный проигрыватель Blu-Ray выполняет воспроизведение из игры, он может маркировать содержимое как игру; если он выполняет воспроизведение из телевизионной приставки, он может устанавливать его на спорт или любое другое содержимое. Таким образом, метаданные L11 позволяют задавать тип видеосодержимого другим субъектам, помимо исходного создателя содержимого. В этом смысле для сохранения творческого замысла важно не просто предоставить метаданные со сведениями о содержимом, но также предоставить указание того, как эти метаданные были созданы, например создателем содержимого или посредниками.

[45] Метаданные L11 позволяют иметь несколько точек, в которых метаданные L11 могут быть добавлены в видеосодержимое. В варианте осуществления для указания источника метаданных L11 метаданные L11 содержат флаг эталонного режима (который также называется флагом эталонного режима L11 или для краткости флагом L11 RM), который может быть установлен в значения ИСТИНА или ЛОЖЬ. Исходный создатель содержимого может добавлять метаданные L11 с конкретной целью, например, создатель содержимого создал игру и хочет, чтобы игра воспроизводилась так, чтобы игра выглядела более синей и выглядела очень четко на целевом дисплее. Создатель содержимого затем может установить флаг L11 RM в значение ИСТИНА, тем самым подразумевая, что даже если целевой дисплей находится в режиме самого высокого качества, ему следует применить метаданные со сведениями о содержимом для сохранения творческого замысла.

[46] С другой стороны, если содержимое относится, например, к игре, и метаданные L11 были добавлены на последующих стадиях третьей стороной, например при автоматической обработке изображения, флаг L11 RM будет установлен в значение ЛОЖЬ, подразумевая, что если целевой дисплей находится в режиме самого высокого качества, ему не следует применять метаданные L11, поскольку метаданные L11 были добавлены кем-то другим, а не создателем содержимого, поэтому целевой дисплей не будет сохранят замысел исходного создателя содержимого. Установка флага L11 RM в значение ЛОЖЬ указывает на то, что замысел создателя содержимого был изменен. Применение флага L11 RM таким образом обеспечивает неизменность метаданных, в то время как их использование может быть модифицировано в зависимости от состояния флага. Например, если видеосодержимое воспроизводится в эталонном режиме, в котором для сохранения первоначального замысла создателя выполняется большой объем обработка и является важным самое высокое качество, то во время воспроизведения флаг L11 RM используется для того, чтобы сообщать на целевой дисплей, следует или не следует в эталонном режиме использовать метаданные со сведениями о содержимом: i) метаданные со сведениями о содержимом следует использовать в эталонном режиме, если метаданные были созданы исходным создателем содержимого (состояние флага установлено в значение ИСТИНА); ii) метаданные со сведениями о содержимом не следует использовать в эталонном режиме, если метаданные были созданы на последующих стадиях кем-то другим, а не исходным создателем содержимого (состояние флага установлено в значение ЛОЖЬ). Это является одним из ключевых аспектов настоящего изобретения. Это придает важность тому, должен или нет целевой дисплей принимать во внимание метаданные со сведениями о содержимом, если зритель намерен просматривать видеосодержимое в эталонном режиме.

[47] Использование флага L11 RM дополнительно изображено на фиг. 2 в виде таблицы 200. В этой приведенной в качестве примера таблице «использование метаданных в эталонном режиме» (210) относится к состоянию целевого дисплея во время воспроизведения. Эта таблица далее иллюстрирует сценарии, описанные в предыдущем абзаце: 1) В первой строке таблицы (220) метаданные отсутствуют, поэтому метаданные не могут быть использованы в эталонном режиме или в режиме, не являющемся эталонным (230); 2) Во второй строке (240) метаданные L11 имеются, однако флаг L11 RM имеет значение ЛОЖЬ, таким образом, для сохранения творческого замысла целевой дисплей получает команду не использовать метаданные L11 в эталонном режиме. Целевой дисплей все еще может использовать метаданные L11 во время обработки, когда он находится в режиме, не являющемся эталонным; 3) В третьей строке (260) метаданные L11 имеются и флаг L11 RM имеет значение ИСТИНА, поэтому целевой дисплей получает команду, что он может использовать метаданные L11 в эталонном режиме и во всех других режимах, не являющихся эталонными.

[48] На фиг. 3 изображен пример использования флага L11 RM в виде блок-схемы 300. Декодер или целевой дисплей сначала проверяет, имеются (310) ли метаданные L11 в видеосодержимом. Если ответ отрицательный, декодер или целевой дисплей больше ничего не должны делать (320). Если ответ положительный, то декодер или целевой дисплей проверяет (330), имеет флаг L11 RM значение ИСТИНА или ЛОЖЬ. Если флаг имеет значение ЛОЖЬ и пользователю важно сохранение творческого замысла, то метаданные L11 не следует (340) использовать в эталонном режиме. Если флаг имеет значение ЛОЖЬ и пользователю не важно сохранение творческого замысла, то метаданные L11 можно (360) использовать в режиме, не являющемся эталонным, целевого дисплея. Если флаг L11 RM имеет значение ИСТИНА, декодер или целевой дисплей может (350) использовать метаданные как в эталонном режиме, так и в режиме, не являющемся эталонным.

[49] Следующие фигуры с их соответствующими таблицами иллюстрируют примеры вариантов осуществления полей метаданных L11 и примеры значений, используемых для заполнения этих полей.

[50] На фиг. 4А^ГО изображен пример деталей метаданных L11 в виде таблицы. На фиг. 4А в таблице 400А представлены метаданные L11, имеющие тип (410) содержимого и подтип (412) содержимого. На фиг. 4 В в таблице 400 В представлены биты для белой точки (420), для флага (422) RM и для будущего использования (424). На фиг. 4С в таблице 400С представлены биты для резкости (430), шумоподавления (432), шумоподавления (434) MPEG и преобразования (436) частоты кадров. На фиг. 4D в таблице 400D представлены биты для яркости (440), для цвета (442) и для будущего использования (444).

[51] На фиг. 5 изображен пример дополнительных деталей типа содержимого в виде таблицы. Таблица 500 описывает разновидности типов (510) содержимого в метаданных L11. Метаданные L11 используют небольшую полезную нагрузку, например 4 бита, которые обновляются для каждой сцены. Зарезервированные значения (550) предназначены для будущих типов содержимого и по умолчанию будут иметь значение «О» для устройств воспроизведения, у которых отсутствует определение этого поля метаданных, для сохранения неизменности текущего стандартного пользовательского восприятия.

[52] На фиг. 6 изображен пример типичных категорий L11, каждая из которых соответствует конкретному режиму дисплея, содержащему ряд настроек дисплея, в виде таблицы. Таблица 600 заполняется на этапе настройки перцепционного квантователя (PQ) при сотрудничестве владельца комплекса для создания и распространения содержимого, такого как Dolby, с изготовителем комплектного оборудования (OEM) целевых дисплеев, а также необязательно создателем содержимого.

[53] На фиг. 7 изображен пример деталей подтипа содержимого L11 в виде таблицы. Метаданные L11 используют дополнительные 4 бита, которые обновляются для каждой сцены. Подтип (720) содержимого модифицирует поведение по умолчанию относительно типа (510) содержимого путем дополнительного уточнения типа содержимого, что заставляет целевой дисплей регулировать конкретные настройки дисплея, связанные с выбранным подтипом содержимого. Это позволяет изготовителю комплектного оборудования дополнительно производить тонкую настройку алгоритмов постобработки для обеспечения возможности дифференциации. Создатель содержимого может просто заполнить таблицу значением «0», если захочет.

[54] На фиг. 8 изображен пример деталей желаемой белой точки метаданных L11 в виде таблицы. В таблице 800 определяется представляемая белая точка изображения. Белая точка может быть или обойдена посредством системного уровня подключаемого аудио-модуля (API) или может быть применена в рамках управления дисплеем (DM) Dolby, в случае чего целевой дисплей будет откалиброван до собственной температуры. Установка «0» для значения по умолчанию будет использовать белую точку по умолчанию для типа содержимого. Желаемая белая точка (810) фильтруется в целевом дисплее во время воспроизведения для предотвращения внезапных изменений.

[55] На фиг. 9 изображен пример деталей желаемой резкости в метаданных L11 в виде таблицы. В таблице 900 определяется алгоритм усиления деталей / резкости на целевом дисплее. Установка «0» для значения по умолчанию будет использовать настройку по умолчанию для этого типа содержимого. «ВЫКЛ.» соответствует отсутствию добавленной резкости. При необходимости размер изображений изменяют с использованием билинейной интерполяции. «ВЫСОКАЯ» соответствует максимальному усилению резкости. Настройка между «ВЫКЛ.» и «ВЫСОКАЯ» управляет силой резкости. При применении этой таблицы переход между настройками резкости должен быть плавным. Желаемая резкость (910) фильтруется на целевом дисплее во время воспроизведения для предотвращения внезапных изменений.

[56] На фиг. 10 изображен пример деталей желаемого шумоподавления в метаданных L11 в виде таблицы. В таблице 1000 определяется алгоритм шумоподавления для случайного шума. Установка «0» для значения по умолчанию будет использовать настройку по умолчанию для типа содержимого. «ВЫКЛ.» соответствует отсутствию шумоподавления. «ВЫСОКОЕ» соответствует максимальному шумоподавлению. Настройка между «ВЫКЛ.» и «ВЫСОКОЕ» управляет силой шумоподавления. При применении этой таблицы переход между разными настройками должен быть плавным. Желаемое шумоподавление (1010) фильтруется на целевом дисплее во время воспроизведения для предотвращения внезапных изменений.

[57] На фиг. 11 изображен пример деталей желаемого шумоподавления MPEG в метаданных L11 в виде таблицы. В таблице 1100 определяется алгоритм шумоподавления для шума сжатия. Установка «0» для значения по умолчанию будет использовать настройку по умолчанию для типа содержимого. «ВЫКЛ.» соответствует отсутствию шумоподавления. «ВЫСОКОЕ» соответствует максимальному шумоподавлению. Настройка между «ВЫКЛ.» и «ВЫСОКОЕ» управляет силой шумоподавления. При применении этой таблицы переход между разными настройками должен быть плавным. Желаемое шумоподавление (1110) MPEG фильтруется на целевом дисплее во время воспроизведения для предотвращения внезапных изменений.

[58] На фиг. 12 изображен пример деталей преобразования частоты кадров (FRC) в метаданных L11 в виде таблицы. В таблице 1200 определяется алгоритм преобразования частоты кадров. Установка «0» для значения по умолчанию будет использовать настройку по умолчанию FRC для типа содержимого. «ВЫКЛ.» соответствует отсутствию преобразования частоты кадров. Кадры будут дублироваться только при необходимости. «ВЫСОКОЕ» соответствует максимальному преобразованию частоты кадров. Кадры будут плавно интерполироваться до максимальной частоты обновления целевого дисплея. Настройка между «ВЫКЛ.» и «ВЫСОКОЕ» управляет силой FRC. Кадры будут интерполированы на дробную величину между исходной точкой и средней точкой. При применении этой таблицы переход между разными настройками FRC должен быть плавным (то есть без черных кадров). Как следствие, полный обход FRC не может быть вызван L11, так как обычно это приводит к появлению черных кадров. Существуют механизмы для запроса FRC, такие как автоматический режим низкой задержки (ALLM) в HDMI 2.1. Желаемое преобразование (1210) частоты кадров фильтруется на целевом дисплее во время воспроизведения для предотвращения внезапных изменений.

[59] На фиг. 13 изображен пример деталей среднего уровня яркости изображения (APL) для метаданных L11 в виде таблицы. В таблице 1300 определяется средний уровень яркости изображения. Установка «0» для значения по умолчанию будет использовать настройку по умолчанию для типа содержимого. «НИЗКАЯ» соответствует немного более темной яркости. «СРЕДНЯЯ» соответствует средней яркости. «ВЫСОКАЯ» соответствует максимальной яркости. При применении этой таблицы переход между разными настройками должен быть плавным. Желаемый средний уровень (1310) яркости изображения фильтруется на целевом дисплее во время воспроизведения для предотвращения внезапных изменений.

[60] На фиг. 14 изображен пример деталей желаемого цвета в метаданных L11 в виде таблицы. В таблице 1400 определяется насыщенность цвета. Установка «0» для значения по умолчанию будет использовать настройку по умолчанию для типа содержимого. «НИЗКАЯ» соответствует немного более низкой насыщенности. «СРЕДНЯЯ» соответствует средней насыщенности. «ВЫСОКАЯ» соответствует максимальной насыщенности. При применении этой таблицы переход между разными настройками должен быть плавным. Желаемая насыщенность (1410) цвета фильтруется на целевом дисплее во время воспроизведения для предотвращения внезапных изменений.

[61] Теперь дополнительно описываются настройки по умолчанию в метаданных L11. К примеру, когда целевой дисплей находится в интеллектуальном режиме, таком как Dolby Smart Mode, видеосодержимое без метаданных L11 может по умолчанию соответствовать значению «ПО УМОЛЧАНИЮ» (например, на фиг. 5 тип содержимого =0). «Все остальное» (например, на фиг. 5 тип содержимого =6) может рассматриваться как «средняя лучшая настройка» для всего содержимого (например, спорт, драма, сериалы, рекламные ролики, игры и художественные фильмы). Во время постпроизводства (115) студия может проверять качество выпускаемого продукта в разных режимах дисплея (например, живой, кинотеатр / художественный фильм и т.д.). Если студия устанавливает свой воспроизводящий дисплей (125) в режим «домашний кинотеатр» для просмотра своего содержимого, это не обязательно может обеспечивать тот же зрительский опыт, что и у того, кто использует интеллектуальный режим с L11, установленными в «кинотеатр». То же самое верно для режимов игры, спорта и стандартного режима. Это может происходить из-за того, что два дисплея могут отличаться в том, как они определяют свою белую точку или другие параметры калибровки.

[62] Теперь описывается генерирование метаданных L11. К примеру, если L11 не задан в содержимом, устройства для создания изображений могут заполнять поля, чтобы конфигурировать целевое дисплейное устройство в желаемый режим. Кроме того, если L11 не заданы в содержимом, поля для конфигурирования целевого дисплейного устройства могут быть заполнены на уровне приложения (арр). Например, в варианте осуществления игровые приложения для PS4/Xbox настроены на игру, приложения для проигрывателя Blu-Ray и Netflix настроены на кинотеатр или спортивное приложение NBC настроено на спорт. Более того, авторский инструментарий также может заполнять поля для конфигурирования целевого дисплейного устройства. В этом случае авторский инструментарий разрешает и активирует раскрывающееся меню для типа содержимого. Голливудские студии всегда настроены на кинотеатр. Вещательные компании настроены на «Все остальное», если они явным образом не охватывают спорт или кинотеатр.

[63] Один пример отображения сервера воспроизведения вещания предоставлен на фиг. 15 в виде таблицы. В таблице 1500 изображено генерирование метаданных L11 из спецификации Tech 3293 (1410) метаданных ядра (EBUCore) Европейского вещательного союза (EBU), путем отображения метаданных L11 из спецификации Tech 3293 метаданных ядра EBU (смотри Tech 3293, «EBU Core metadata set (EBUCore)», спецификация v1.9, MIM-AI, EBU, январь 2019 г.).

[64] Теперь описывается реализация воспроизведения L11 на целевом дисплее. К примеру, пользователь выбирает на целевом дисплее интеллектуальный режим, такой как Dolby Smart Mode™, который также может быть заводским по умолчанию. При изменении типа содержимого целевой дисплей продолжает оставаться в интеллектуальном режиме. Изменения метаданных происходят плавно, то есть отсутствует мерцание содержимого изображений. Пользователь может в любое время переключиться в унаследованные режимы изображений.

[65] Следующие описания дополнительных вариантов осуществления будут сосредоточены на различиях между ними и ранее описанным вариантом осуществления. Следовательно, признаки, которые являются общими для обоих вариантов осуществления, будут опущены в следующем описании, и поэтому предполагается, что признаки ранее описанного варианта осуществления реализованы или по меньшей мере могут быть реализованы в дополнительном варианте осуществления, если его следующее описание не требует иного.

[66] В другом варианте осуществления настоящего изобретения флаг RM применяется в большем количестве ситуаций, а не только во время воспроизведения. Например, если метаданные не представляют творческий замысел, аппарат и способы согласно этому варианту осуществления позволяют кому-либо на последующих стадиях (кодеру, распространителю, устройству воспроизведения) после создателя модифицировать, создавать и/или переписывать метаданные. Однако, если метаданные представляют творческий замысел, метаданные не разрешается модифицировать на последующих стадиях.

[67] В альтернативном варианте осуществления настоящего изобретения включают больше информации о том, кто заполнил метаданные. Аппарат и способы согласно этому варианту осуществления позволяют использовать большее количество битов для поля флага RM. К примеру, информация, такая как стадия создания и распространения содержимого, а также название компании, которая заполнила метаданные L11, может храниться во флаге RM. Эта информация может быть прикреплена к содержимому и метаданным. Эта информация может быть использована для понимания того, как интерпретировать и применять метаданные. Некоторые примеры представляют собой: i) применение или неприменения метаданных в устройстве воспроизведения в зависимости от идентификации того, кто заполнил метаданные, и приоритетов воспроизведения; ii) разрешение или отсутствие разрешения для различных участников распространения, включая, например, Dolby и его партнеров, дополнительно модифицировать, улучшать или переписывать метаданные на различных стадиях создания и распространения содержимого в зависимости от того, кто их заполнял; iii) раскрытие или отсутствие раскрытия некоторых метаданных в зависимости от того, кто их заполнял, и от того, где потенциально раскрываются метаданные (например, раскрытие типа содержимого в визуальном графическом пользовательском интерфейсе (GUI) потребителя).

[68] В еще одном альтернативном варианте осуществления настоящего изобретения в формат содержимого, который концептуально подобен цепочке блоков, участники последующих стадий могут прикреплять дополнительные и/или альтернативные наборы или записи метаданных L11. В этом случае крайне важно знать, кто заполнил каждый набор или запись. Например, сервис по предоставлению содержимого может иметь свой предпочтительный вид, определенный одним непротиворечивым набором метаданных L11 для всего своего содержимого, тогда как другой набор метаданных L11 будет поддерживаться для каждой части содержимого, как определено исходным создателем содержимого. Это позволит получать различный потребительский опыт в зависимости от того, какой набор метаданных L11 используется. Расширенный флаг RM для каждого набора метаданных L11 будет передавать информацию о решении относительно того, какой набор метаданных L11 использовать.

[69] Был описан ряд вариантов осуществления настоящего изобретения. Однако будет понятно, что различные модификации могут быть осуществлены без отступления от объема настоящего изобретения. Соответственно, другие варианты осуществления изобретения находятся в пределах объема представленной далее формулы изобретения.

[70] Изложенные выше примеры представлены для специалистов в данной области в качестве полного раскрытия и описания того, как создавать и использовать варианты осуществления настоящего изобретения, и не предназначены для ограничения объема того, что автор/авторы изобретения рассматривают в качестве своего изобретения.

[71] Предполагается, что модификации вышеописанных вариантов осуществления методов и систем, раскрытых в настоящем документе, являющихся очевидными для специалистов в данной области, находятся в пределах объема следующей формулы изобретения. Все патенты и публикации, упомянутые в описании, указывают на уровни квалификации специалистов в той области, к которой относится настоящее изобретение. Все ссылки, процитированные в данном описании, ссылкой включены в настоящее описание в той же степени, как если бы каждая из ссылок была включена в данное описание отдельно в своей полноте.

[72] Необходимо понимать, что настоящее изобретение не ограничивается конкретными способами или системами, которые, разумеется, могут различаться. Также необходимо понимать, что используемая в настоящем документе терминология не служит цели описания только конкретных вариантов осуществления и не предназначена для ограничения. Как используются в данном описании и в прилагаемой формуле изобретения, формы существительного единственного числа включают объекты, на которые производится ссылка, и во множественном числе, если содержание явно не предписывает иного. Термин «несколько» включает два или более объекта, на которые производится ссылка, если содержание в явном виде не предписывает иного. Если не определено иное, все технические и научные термины, используемые в настоящем документе, имеют тот же смысл, что и обычно понимаемый специалистами в области, к которой относится настоящее изобретение.

[73] Способы и системы, описанные в настоящем изобретении, могут быть реализованы как аппаратное обеспечение, программное обеспечение, встроенное программное обеспечение или их комбинация. Признаки, описанные как блоки, модули или компоненты, могут быть реализованы вместе или по отдельности с использованием комбинации аппаратного обеспечения, программного обеспечения и встроенного программного обеспечения. Программная часть способов настоящего изобретения может включать машиночитаемый носитель, который содержит команды (например, исполняемую программу), которые при исполнении по меньшей мере частично выполняют описанные способы. Машиночитаемый носитель может включать, например, оперативное запоминающее устройство (RAM) и/или постоянное запоминающее устройство (ROM). Команды могут исполняться процессором (например, процессором обработки цифровых сигналов (DSP), интегрированной микросхемой специального назначения (ASIC), логической матрицей с эксплуатационным программированием (FPGA)).

[74] Различные аспекты настоящего изобретения можно понять из следующих пронумерованных примерных вариантов осуществления (ППВО):

ППВО 1. Способ генерирования битового потока цифрового видео с метаданными, в котором метаданные включают флаг, указывающий на сохранение творческого замысла, этот способ включает:

установку одного или более дополнительных полей в метаданных для указания типа содержимого битового потока цифрового видео, и

установку флага в метаданных для указания того, необходимо или нет использовать одно или более дополнительных полей, когда битовый поток цифрового видео декодируют в эталонном режиме, в котором битовый поток цифрового видео необходимо проигрывать и/или отображать согласно исходному творческому замыслу.

ППВО 2. Способ по ППВО 1, в котором одно или более дополнительных полей в метаданных содержат по меньшей мере одно из следующего: тип видеосодержимого, подтип видеосодержимого, желаемую белую точку видеосодержимого, желаемую резкость видеосодержимого, желаемое шумоподавление видеосодержимого, желаемое шумоподавление MPEG видеосодержимого, желаемое преобразование частоты кадров видеосодержимого, средний уровень яркости изображения видеосодержимого и желаемый цвет видеосодержимого.

ППВО 3. Способ по ППВО 2, в котором, если метаданные генерируются создателем видеосодержимого, флаг устанавливают в первое логическое значение, а если метаданные генерируются третьей стороной, то флаг устанавливают во второе логическое значение.

ППВО 4. Способ по ППВО 2, в мотором метаданные генерируются создателем видеосодержимого, автоматическим устройством обработки изображений или на уровне приложения.

ППВО 5. Способ по любому из ППВО 1^4, в котором метаданные генерируются создателем видеосодержимого, автоматическим устройством обработки изображений или на уровне приложения.

ППВО 6. Способ по любому из ППВО 15, в котором, если метаданные генерируются создателем видеосодержимого, флаг устанавливают в первое логическое значение, а если метаданные генерируются третьей стороной, то флаг устанавливают во второе логическое значение.

ППВО 7. Способ по любому из ППВО 1-6, в котором для генерирования метаданных используют отображение из других метаданных.

ППВО 8. Способ по ППВО 7, в котором другие метаданные представляют собой спецификацию Tech 3293 метаданных ядра Европейского вещательного союза.

ППВО 9. Способ воспроизведения видеосодержимого с метаданными, в котором метаданные включают флаг, указывающий на сохранение творческого замысла, этот способ включает:

прием видеосодержимого на декодере, и

подачу на декодер, на основании состояния флага, команд о том, необходимо или нет использовать одно или более дополнительных полей, когда видеосодержимое декодируют в эталонном режиме, в котором битовый поток цифрового видео необходимо проигрывать и/или отображать согласно исходному творческому замыслу.

ППВО 10. Способ по ППВО 9, в котором, если флаг установлен в первое логическое значение, то на декодер подают команду использовать метаданные для определения типа видеосодержимого в эталонном режиме и в режиме, не являющемся эталонным.

ППВО 11. Способ по ППВО 9, в котором если флаг установлен во второе логическое значение, то на декодер подают команду игнорировать метаданные в эталонном режиме и использовать метаданные в режиме, не являющемся эталонным.

ППВО 12. Способ по любому из ППВО 9 11, в котором метаданные содержат по меньшей мере одно из следующего: тип видеосодержимого, подтип видеосодержимого, желаемую белую точку видеосодержимого, желаемую резкость видеосодержимого, желаемое шумоподавление видеосодержимого, желаемое шумоподавление MPEG видеосодержимого, желаемое преобразование частоты кадров видеосодержимого, средний уровень яркости изображения видеосодержимого и желаемый цвет видеосодержимого.

ППВО 13. Битовый поток цифрового видео, содержащий:

видеосодержимое и

метаданные, включающие флаг, указывающий на творческий замысел, причем метаданные имеют одно или более дополнительных полей для указания типа содержимого битового потока цифрового видео,

при этом

флага в метаданных указывает на то, необходимо или нет использовать одно или более дополнительных полей, когда битовый поток цифрового видео декодируют в эталонном режиме, в котором битовый поток цифрового видео необходимо проигрывать и/или отображать согласно исходному творческому замыслу.

ППВО 14. Битовый поток цифрового видео по ППВО 13, в котором одно или более дополнительных полей в метаданных содержат по меньшей мере одно из следующего: тип видеосодержимого, подтип видеосодержимого, желаемую белую точку видеосодержимого, желаемую резкость видеосодержимого, желаемое шумоподавление видеосодержимого, желаемое шумоподавление MPEG видеосодержимого, желаемое преобразование частоты кадров видеосодержимого, средний уровень яркости изображения видеосодержимого и желаемый цвет видеосодержимого.

ППВО 15. Способ указания использования или отсутствия использования метаданных в битовом потоке видео, включающий:

предоставление битового потока цифрового видео по ППВО 13 или ППВО 14;

установку флага в первое логическое значение, если метаданные генерируются создателем видеосодержимого, и во второе логическое значение, если метаданные генерируются третьей стороной.

ППВО 16. Способ воспроизведения битового потока видео с расширенным динамическим диапазоном, включающий:

предоставление битового потока цифрового видео по ППВО 13 или ППВО 14 и

подачу на видеодекодер команд использовать метаданные для определения типа видеосодержимого в эталонном режиме и в режиме, не являющемся эталонным, если флаг установлен в первое логическое значение.

ППВО 17. Способ воспроизведения битового потока видео с расширенным динамическим диапазоном, включающий:

предоставление битового потока цифрового видео по ППВО 13 или ППВО 14 и

подачу на видеодекодер команд игнорировать метаданные в эталонном режиме и использовать метаданные в режиме, не являющемся эталонным, если флаг установлен во второе логическое значение.

ППВО 18. Машиночитаемый носитель, содержащий команды, которые при исполнении выполняют этапы способов согласно любому из ППВО 1-12 или ППВО 15-17.

Похожие патенты RU2818525C2

название год авторы номер документа
ПРЕДСКАЗАТЕЛЬ B-СПЛАЙНА ТЕНЗОРНОГО ПРОИЗВЕДЕНИЯ 2020
  • Су, Гань-Мин
  • Каду, Харшад
  • Сун, Цин
  • Гадгил, Нерадж Дж.
RU2794137C1
СИСТЕМА И СПОСОБЫ ДЛЯ ФОРМИРОВАНИЯ СЦЕНОВЫХ СТАБИЛИЗИРОВАННЫХ МЕТАДАННЫХ 2014
  • Аткинс Робин
  • Йеунг Рэймонд
  • Цюй Шэн
RU2627048C1
ЛИНЕЙНЫЙ КОДЕР ДЛЯ ОБРАБОТКИ ИЗОБРАЖЕНИЙ/ВИДЕО 2019
  • Гадгил, Нерадж Дж.
  • Су, Гань-Мин
RU2740034C1
ДВУСТОРОННЯЯ МЕДИЙНАЯ АНАЛИТИКА 2019
  • Бай, Яньнин
  • Джеррард, Марк Уильям
  • Хань, Ричард
  • Уолтерс, Мартин
RU2768224C1
КОМПЕНСАЦИЯ РАЗМЕРА ТРЕХМЕРНОГО ЭКРАНА 2010
  • Брюльс Вильгельмус Хендрикус Альфонсус
  • Клейн Гунневик Рейнир Бернардус Мария
  • Ван Дальфсен Аге Йохем
  • Ньютон Филип Стивен
RU2559735C2
ТРАНСПОРТИРОВКА HDR МЕТАДАННЫХ 2014
  • Де Хан Вибе
  • Книббелер Чарльз Леонардус Корнелиус Мария
RU2654049C2
СПОСОБЫ И УСТРОЙСТВА ДЛЯ КОДИРОВАНИЯ HDR-ИЗОБРАЖЕНИЙ И СПОСОБЫ И УСТРОЙСТВА ДЛЯ ИСПОЛЬЗОВАНИЯ ТАКИХ КОДИРОВАННЫХ ИЗОБРАЖЕНИЙ 2015
  • Ван Дер Влетен Ренатус Йозефус
  • Мертенс Марк Йозеф Виллем
RU2667034C2
СПОСОБЫ И УСТРОЙСТВА ДЛЯ КОДИРОВАНИЯ HDR-ИЗОБРАЖЕНИЙ И СПОСОБЫ И УСТРОЙСТВА ДЛЯ ИСПОЛЬЗОВАНИЯ ТАКИХ КОДИРОВАННЫХ ИЗОБРАЖЕНИЙ 2015
  • Ван Дер Влетен Ренатус Йозефус
  • Мертенс Марк Йозеф Виллем
RU2688249C2
ПРЕОБРАЗОВАНИЕ ИЗОБРАЖЕНИЯ В КОДИРОВАНИИ ВИДЕО С ИСПОЛЬЗОВАНИЕМ ОПТИМИЗАЦИИ ЗАВИСИМОСТИ ИСКАЖЕНИЯ ОТ СКОРОСТИ ПЕРЕДАЧИ 2019
  • Инь, Пэн
  • Пу, Фанцзюнь
  • Лу, Таожань
  • Чэнь, Тао
  • Гусак, Уолтер Дж.
  • Маккарти, Шон Томас
RU2741586C1
СПОСОБ И УСТРОЙСТВО ДЛЯ ПРЕОБРАЗОВАНИЯ ДАННЫХ ИЗОБРАЖЕНИЯ 2012
  • Баллестад Андерс
  • Костин Андрей
  • Вард Грегори Джон
RU2554860C2

Иллюстрации к изобретению RU 2 818 525 C2

Реферат патента 2024 года МЕТАДАННЫЕ ТИПА ВИДЕОСОДЕРЖИМОГО ДЛЯ РАСШИРЕННОГО ДИНАМИЧЕСКОГО ДИАПАЗОНА

Группа изобретений относится к воспроизведению видео на целевом дисплее. Технический результат заключается в обеспечении автоматического определения режима дисплея, который соответствует определенной категории видеосодержимого. Осуществляют прием битового потока цифрового видео, содержащего метаданные, включающие одно или более полей категории, указывающих категорию видеосодержимого битового потока цифрового видео, и флаг эталонного режима, указывающий на то, обусловливают ли одно или более полей категории выбор целевым дисплеем настроек дисплея для отображения видеосодержимого в эталонном режиме. Если флаг указывает на выбор целевым дисплеем настроек дисплея для отображения видеосодержимого в эталонном режиме, то определяют режим дисплея, который соответствует определенной категории видеосодержимого, применяют настройки дисплея определенного режима дисплея к целевому дисплею и отображают видеосодержимое. 3 н. и 8 з.п. ф-лы, 15 ил.

Формула изобретения RU 2 818 525 C2

1. Способ генерирования битового потока цифрового видео из видеосодержимого, при этом способ включает:

обеспечение доступа к множеству видеокадров видеосодержимого;

генерирование метаданных со сведениями о содержимом для видеосодержимого; и

генерирование битового потока видео на основании видеосодержимого и метаданных со сведениями о содержимом, при этом

эти метаданные со сведениями о содержимом включают:

одно или более полей категории, указывающих категорию видеосодержимого битового потока цифрового видео, при этом одно или более полей категории обусловливают выбор целевым дисплеем настроек дисплея для отображения видеосодержимого в режиме дисплея, соответствующем категории видеосодержимого, и

флаг эталонного режима, указывающий на то, следует ли применять одно или более полей категории для обусловливания выбора целевым дисплеем настроек дисплея для отображения видеосодержимого в эталонном режиме, причем эталонный режим представляет собой режим дисплея, имеющий определенные настройки дисплея, при этом способ включает:

установку одного или более полей категории в метаданных со сведениями о содержимом согласно категории видеосодержимого и

установку флага эталонного режима в метаданных со сведениями о содержимом для указания того, указывают или нет одно или более полей категории эталонный режим,

при этом, когда метаданные со сведениями о содержимом генерируются создателем видеосодержимого, флаг эталонного режима устанавливают в первое логическое значение, указывающее, что одно или более полей категории следует использовать в эталонном режиме и в режиме, не являющемся эталонным, и когда метаданные со сведениями о содержимом генерируются третьей стороной, флаг эталонного режима устанавливают во второе логическое значение, указывающее, что одно или более полей категории следует игнорировать в эталонном режиме и использовать в режиме, не являющемся эталонным.

2. Способ по п. 1, отличающийся тем, что одно или более полей категории в метаданных со сведениями о содержимом содержат по меньшей мере одно из типа видеосодержимого и подтипа видеосодержимого.

3. Способ по п. 1, отличающийся тем, что установка одного или более полей категории в метаданных со сведениями о содержимом включает:

прием метаданных спецификации Tech 3293 метаданных ядра Европейского вещательного союза и

применение отображения из принятых метаданных спецификации Tech 3293 метаданных ядра Европейского вещательного союза в одно или более полей категории.

4. Способ по любому из пп. 1-3, отличающийся тем, что метаданные со сведениями о содержимом дополнительно включают:

одно или более полей регулировки, указывающих желаемые регулировки настроек дисплея для видеосодержимого целевого дисплея при отображении видеосодержимого на целевом дисплее,

при этом одно или более полей регулировки обусловливают регулировку целевым дисплеем по меньшей мере части выбранных настроек дисплея для отображения видеосодержимого в режиме дисплея, тем самым уточняя применяемый режим дисплея регулируемыми настройками дисплея.

5. Способ по п. 4, отличающийся тем, что одно или более полей регулировки в метаданных со сведениями о содержимом указывают по меньшей мере одно из следующего: желаемую белую точку видеосодержимого, желаемую резкость видеосодержимого, желаемое шумоподавление видеосодержимого, желаемое шумоподавление MPEG видеосодержимого, желаемое преобразование частоты кадров видеосодержимого, средний уровень яркости изображения видеосодержимого и желаемый цвет видеосодержимого.

6. Способ по п. 4, отличающийся тем, что одно или более полей регулировки устанавливают в метаданных со сведениями о содержимом посредством операций, включающих:

прием метаданных спецификации Tech 3293 метаданных ядра Европейского вещательного союза и

применение отображения из принятых метаданных спецификации Tech 3293 метаданных ядра Европейского вещательного союза в одно или более полей регулировки.

7. Способ воспроизведения видеосодержимого на целевом дисплее в эталонном режиме, причем эталонный режим представляет собой режим дисплея, имеющий определенные настройки дисплея, этот способ включает:

прием битового потока цифрового видео, содержащего видеосодержимое и метаданные со сведениями о содержимом, при этом эти метаданные со сведениями о содержимом включают:

одно или более полей категории, указывающих категорию видеосодержимого битового потока цифрового видео, и

флаг эталонного режима, указывающий на то, следует ли применять одно или более полей категории для обусловливания выбора целевым дисплеем настроек дисплея для отображения видеосодержимого в эталонном режиме,

декодирование видеосодержимого на декодере,

извлечение флага эталонного режима из метаданных со сведениями о содержимом,

если флаг эталонного режима устанавливают в первое логическое значение, указывающее, что метаданные со сведениями о содержимом генерируются создателем видеосодержимого:

применение одного или более полей категории метаданных со сведениями о содержимом для определения категории видеосодержимого,

определение режима дисплея, который соответствует определенной категории видеосодержимого,

применение настроек дисплея определенного режима дисплея к целевому дисплею и

отображение видеосодержимого;

если флаг эталонного режима устанавливают во второе логическое значение, указывающее, что метаданные со сведениями о содержимом генерируются третьей стороной:

отображение видеосодержимого без применения метаданных со сведениями о содержимом, которые включают одно или более полей категории.

8. Способ по п. 7, отличающийся тем, что одно или более полей категории в метаданных со сведениями о содержимом содержат по меньшей мере одно из типа видеосодержимого и подтипа видеосодержимого.

9. Способ по п. 7 или 8, отличающийся тем, что метаданные со сведениями о содержимом дополнительно включают:

одно или более полей регулировки, указывающих желаемые регулировки настроек дисплея для видеосодержимого целевого дисплея при отображении видеосодержимого на целевом дисплее,

при этом одно или более полей регулировки обусловливают регулировку целевым дисплеем по меньшей мере части выбранных настроек дисплея для отображения видеосодержимого в режиме дисплея, тем самым уточняя применяемый режим дисплея регулируемыми настройками дисплея.

10. Способ по п. 9, отличающийся тем, что одно или более полей регулировки в метаданных со сведениями о содержимом указывают по меньшей мере одно из следующего: желаемую белую точку видеосодержимого, желаемую резкость видеосодержимого, желаемое шумоподавление видеосодержимого, желаемое шумоподавление MPEG видеосодержимого, желаемое преобразование частоты кадров видеосодержимого, средний уровень яркости изображения видеосодержимого и желаемый цвет видеосодержимого.

11. Машиночитаемый носитель, содержащий команды, которые при исполнении процессором выполняют способ по любому из пп. 1-6.

Документы, цитированные в отчете о поиске Патент 2024 года RU2818525C2

US 20110080522 A1, 07.04.2011
US 20170006351 A1, 05.01.2017
US 20090064267 A1, 05.03.2009
WO 2011103258 A2, 25.08.2011
US 20180376194 A1, 27.12.2018
US 20170201794 A1, 13.07.2017
СПОСОБЫ, СИСТЕМЫ И НОСИТЕЛИ ДЛЯ ПРЕДОСТАВЛЕНИЯ ВИДЕОСОДЕРЖИМОГО, ПРИГОДНОГО ТОЛЬКО ДЛЯ ЗВУКОВОГО ВОСПРОИЗВЕДЕНИЯ 2016
  • Льюис, Джастин
  • Дэвис, Раксандра, Джорджиана
RU2686658C1

RU 2 818 525 C2

Авторы

Аткинс, Робин

Клиттмарк, Пер Йонас А.

Даты

2024-05-02Публикация

2020-06-26Подача