СПОСОБ И ОБОРУДОВАНИЕ КОДИРОВАНИЯ ИЗОБРАЖЕНИЙ/ВИДЕО Российский патент 2023 года по МПК H04N19/174 H04N19/70 H04N19/132 H04N19/103 

Описание патента на изобретение RU2800595C1

Уровень техники

Область техники, к которой относится изобретение

[1] Настоящее раскрытие относится к способу и оборудованию для кодирования изображения/видео.

Описание предшествующего уровня техники

[2] В последнее время, спрос на высококачественное изображение/видео высокого разрешения, к примеру, 4K, 8K либо изображения/видео еще более сверхвысокой четкости (UHD), растет в различных областях техники. По мере того, как разрешение или качество изображений/видео становится более высоким, относительно больший объем информации или число битов передается, чем для традиционных данных изображений/видео. Следовательно, если данные изображений/видео передаются через такую среду, как существующая проводная/беспроводная широкополосная линия, либо сохраняются на унаследованном носителе хранения данных, затраты на передачу и хранение серьезно увеличиваются.

[3] Кроме того, растет интерес и спрос в отношении контента виртуальной реальности (VR) и искусственной реальности (AR) и иммерсивного мультимедиа, к примеру, голограммы; а также растет широковещательная передача изображений/видео, демонстрирующих характеристики изображений/видео, отличающиеся от характеристик фактического изображения/видео, к примеру, игровых изображений/видео.

[4] Следовательно, требуется высокоэффективная технология сжатия изображений/видео для того, чтобы эффективно сжимать и передавать, сохранять или воспроизводить высококачественные изображения/видео высокого разрешения, демонстрирующие различные характеристики, как описано выше.

Сущность изобретения

Технические задачи

[5] Техническая задача настоящего раскрытия заключается в том, чтобы предоставлять способ и оборудование для повышения эффективности кодирования изображения/видео.

[6] Другая техническая задача настоящего раскрытия заключается в том, чтобы предоставлять способ и оборудование для эффективной передачи в служебных сигналах информации относительно среза в плитке.

[7] Еще одна другая техническая задача настоящего раскрытия заключается в том, чтобы предоставлять способ и оборудование для уменьшения объема передаваемой служебной информации при доставке (или передаче) информации относительно среза в плитке.

[8] Еще одна другая техническая задача настоящего раскрытия заключается в том, чтобы предоставлять способ и оборудование для эффективной доставки (или передачи) информации, связанной с числом и высотой срезов в плитке.

[9] Еще одна другая техническая задача настоящего раскрытия заключается в том, чтобы предоставлять способ и оборудование для эффективной передачи в служебных сигналах информации, связанной с высотами соответствующих срезов, когда два или более срезов имеют идентичную высоту в плитке.

Техническое решение

[10] Согласно варианту осуществления настоящего раскрытия, в данном документе предусмотрен способ декодирования видео, осуществляемый посредством оборудования декодирования видео. Способ может включать в себя этапы синтаксического анализа информации по числу, связанной с числом срезов, каждый из которых имеет высоту, явно передаваемую в служебных сигналах в плитке текущего кадра, из потока битов, извлечения числа срезов в плитке на основе информации по числу и информации высоты, формирования прогнозных выборок посредством выполнения по меньшей мере одного из внутреннего прогнозирования или взаимного прогнозирования для текущего блока текущего кадра на основе срезов в плитке и формирования восстановленных выборок на основе прогнозных выборок, при этом информация высоты может включать в себя число синтаксических элементов, идентичное значению информации по числу, при этом на основе значения информации по числу, равного n, высоты нулевого среза - (n-1)-ого среза в плитке могут извлекаться на основе синтаксических элементов, при этом высота n-ого среза в плитке может извлекаться на основе высоты (n-1)-ого среза, и при этом высота последнего среза в плитке может извлекаться на основе оставшейся высоты после вычитания высот других срезов в плитке из высоты плитки.

[11] Согласно другому варианту осуществления настоящего раскрытия, в данном документе предусмотрен способ кодирования видео, осуществляемый посредством оборудования кодирования. Способ может включать в себя этапы извлечения срезов в плитке текущего кадра, формирования связанной с прогнозированием информации и прогнозных выборок посредством выполнения по меньшей мере одного из внутреннего прогнозирования или взаимного прогнозирования на основе извлеченных срезов, формирования остаточной информации на основе прогнозных выборок, формирования информации по числу, связанной с числом срезов, каждый из которых имеет высоту, явно передаваемую в служебных сигналах в плитке, и информации высоты, связанной с высотами срезов, каждый из которых имеет высоту, явно передаваемую в служебных сигналах на основе извлеченных срезов, и кодирования информации изображений, включающей в себя связанную с прогнозированием информацию, остаточную информацию, информацию по числу и информацию высоты, при этом на основе значения информации по числу, равного n, информация высоты может указывать высоты нулевого среза - (n-1)-ого среза в плитке, при этом высота n-ого среза в плитке может извлекаться на основе высоты (n-1)-ого среза, и при этом высота последнего среза в плитке может извлекаться на основе оставшейся высоты после вычитания высот других срезов в плитке из высоты плитки.

[12] Согласно еще одному другому варианту осуществления настоящего раскрытия, в данном документе предусмотрен компьютерно-читаемый цифровой носитель записи, имеющий сохраненную информацию, которая инструктирует осуществление способа декодирования видео посредством оборудования декодирования видео. Способ декодирования видео может включать в себя этапы синтаксического анализа информации по числу, связанной с числом срезов, каждый из которых имеет высоту, явно передаваемую в служебных сигналах в плитке текущего кадра, из информации изображений, синтаксического анализа информации высоты, связанной с высотами срезов, каждый из которых имеет высоту, явно передаваемую в служебных сигналах, из информации изображений на основе информации по числу, извлечения числа срезов в плитке на основе информации по числу и информации высоты, формирования прогнозных выборок посредством выполнения по меньшей мере одного из внутреннего прогнозирования или взаимного прогнозирования для текущего блока текущего кадра на основе срезов в плитке и формирования восстановленных выборок на основе прогнозных выборок, при этом информация высоты может включать в себя число синтаксических элементов, идентичное значению информации по числу, при этом на основе значения информации по числу, равного n, высоты нулевого среза - (n-1)-ого среза в плитке могут извлекаться на основе синтаксических элементов, при этом высота n-ого среза в плитке может извлекаться на основе высоты (n-1)-ого среза, и при этом высота последнего среза в плитке может извлекаться на основе оставшейся высоты после вычитания высот других срезов в плитке из высоты плитки.

Преимущества раскрытия

[13] Согласно варианту осуществления настоящего раскрытия, общая эффективность сжатия изображения/видео может повышаться.

[14] Согласно варианту осуществления настоящего раскрытия, информация относительно среза в плитке может эффективно передаваться в служебных сигналах.

[15] Согласно варианту осуществления настоящего раскрытия, объем передаваемой служебной информации может уменьшаться при доставке (или передаче) информации относительно среза в плитке.

[16] Согласно варианту осуществления настоящего раскрытия, информация, связанная с числом и высотой срезов в плитке, может эффективно передаваться в служебных сигналах.

[17] Согласно варианту осуществления настоящего раскрытия, когда два или более срезов имеют идентичную высоту в плитке, передача служебных сигналов срезов, имеющих идентичную высоту, может пропускаться.

Краткое описание чертежей

[18] Фиг. 1 схематично иллюстрирует пример системы кодирования видео/изображений, к которой являются применимыми варианты осуществления настоящего документа.

[19] Фиг. 2 является схемой, принципиально иллюстрирующей конфигурацию оборудования кодирования видео/изображений, к которому являются применимыми варианты осуществления настоящего документа.

[20] Фиг. 3 является схемой, принципиально иллюстрирующей конфигурацию оборудования декодирования видео/изображений, к которому являются применимыми варианты осуществления настоящего документа.

[21] Фиг. 4 показывает пример способа кодирования видео/изображений на основе внутреннего прогнозирования.

[22] Фиг. 5 показывает пример способа декодирования видео/изображений на основе внутреннего прогнозирования.

[23] Фиг. 6 показывает пример способа кодирования видео/изображений на основе взаимного прогнозирования.

[24] Фиг. 7 показывает пример способа декодирования видео/изображений на основе взаимного прогнозирования.

[25] Фиг. 8 и фиг. 9, соответственно, показывают общие примеры способа кодирования видео/изображений и связанного компонента согласно варианту осуществления настоящего раскрытия.

[26] Фиг. 10 и фиг. 11, соответственно, показывают общие примеры способа декодирования видео/изображений и связанного компонента согласно варианту осуществления настоящего раскрытия.

[27] Фиг. 12 показывает пример системы потоковой передачи контента, к которой может применяться вариант осуществления настоящего раскрытия.

Подробное описание вариантов осуществления

[28] Раскрытие настоящего документа может модифицироваться в различных формах, и его конкретные варианты осуществления описываются и иллюстрируются на чертежах. Термины, используемые в настоящем документе, используются для того, чтобы просто описывать конкретные варианты осуществления, но не имеют намерение ограничивать раскрытый способ в настоящем документе. Выражение единственного числа включает в себя выражение "по меньшей мере, один" до тех пор, пока они четко трактуются по-разному. Такие термины, как "включать в себя" и "иметь", предназначены для того, чтобы указывать то, что существуют признаки, числа, этапы, операции, элементы, компоненты либо комбинации вышеозначенного, используемые в документе, и в силу этого следует понимать, что не исключается возможность наличия или добавления одного или более других признаков, чисел, этапов, операций, элементов, компонентов либо комбинаций вышеозначенного.

[29] Настоящий документ относится к кодированию видео/изображений. Например, способ/вариант осуществления, раскрытый в настоящем документе, может применяться к способу, раскрытому в стандарте универсального кодирования видео (VVC). Помимо этого, способ/вариант осуществления, раскрытый в настоящем документе, может применяться к способу, раскрытому в стандарте фундаментального кодирования видео (EVC), стандарте AOMedia Video 1 (AV1), стандарте второго поколения кодирования аудио/видео (AVS2) или стандарте кодирования видео/изображений следующего поколения (например, H.267, H.268 и т.д.).

[30] Различные варианты осуществления, связанные с кодированием видео/изображений, представляются в настоящем документе, и варианты осуществления могут комбинироваться между собой, если не указано иное.

[31] Помимо этого, каждая конфигурация чертежей, описанных в настоящем документе, представляет собой независимую иллюстрацию для пояснения функций в качестве признаков, которые отличаются друг от друга, и не означает то, что каждая конфигурация реализуется посредством взаимно различных аппаратных средств или различного программного обеспечения. Например, две или более конфигураций могут комбинироваться, чтобы формировать одну конфигурацию, и одна конфигурация также может разделяться на несколько конфигураций. Без отступления от сущности раскрытого способа настоящего документа, варианты осуществления, в которых конфигурации комбинируются и/или разделяются, включаются в объем раскрытия настоящего документа.

[32] В настоящем документе, термин "/" и "," должен интерпретироваться как указывающий "и/или". Например, выражение "A/B" может означать "A и/или B". Дополнительно, "A, B" может означать "A и/или B". Дополнительно, "A/B/C" может означать "по меньшей мере, одно из A, B и/или C". Кроме того, "A/B/C" может означать "по меньшей мере, одно из A, B и/или C".

[33] Дополнительно, в документе, термин "или" должен интерпретироваться как указывающий "и/или". Например, выражение "A или B" может содержать 1) только A, 2) только B и/или 3) как A, так и B. Другими словами, термин "или" в настоящем документе должен интерпретироваться как указывающий "дополнительно или альтернативно".

[34] Дополнительно, круглые скобки, используемые в настоящем документе, могут означать "например". В частности, в случае если "прогнозирование (внутреннее прогнозирование)" выражается, может указываться то, что "внутреннее прогнозирование" предлагается в качестве примера "прогнозирования". Другими словами, термин "прогнозирование" в настоящем документе не ограничен "внутренним прогнозированием", и "внутреннее прогнозирование" предлагается в качестве примера "прогнозирования". Дополнительно, даже в случае, если "прогнозирование (т.е. внутреннее прогнозирование)" выражается, может указываться то, что "внутреннее прогнозирование" предлагается в качестве примера "прогнозирования".

[35] В настоящем документе, технические признаки, отдельно поясненные на одном чертеже, могут реализовываться отдельно либо реализовываться одновременно.

[36] Далее подробно описываются примерные варианты осуществления настоящего документа со ссылкой на прилагаемые чертежи. Помимо этого, аналогичные ссылки с номерами используются для того, чтобы указывать аналогичные элементы на всех чертежах, и идентичные описания аналогичных элементов могут опускаться.

[37] Фиг. 1 иллюстрирует пример системы кодирования видео/изображений, к которой могут применяться варианты осуществления настоящего документа.

[38] Ссылаясь на фиг. 1, система кодирования видео/изображений может включать в себя первое устройство (исходное устройство) и второе устройство (приемное устройство). Исходное устройство может передавать кодированную информацию или данные видео/изображений в приемное устройство через цифровой носитель хранения данных или сеть в форме файла или потоковой передачи.

[39] Исходное устройство может включать в себя видеоисточник, оборудование кодирования и передатчик. Приемное устройство может включать в себя приемник, оборудование декодирования и модуль рендеринга. Оборудование кодирования может называться "оборудованием кодирования видео/изображений", и оборудование декодирования может называться "оборудованием декодирования видео/изображений". Передатчик может включаться в оборудование кодирования. Приемник может включаться в оборудование декодирования. Модуль рендеринга может включать в себя дисплей, и дисплей может быть сконфигурирован как отдельное устройство или внешний компонент.

[40] Видеоисточник может получать видео/изображение посредством процесса захвата, синтезирования или формирования видео/изображения. Видеоисточник может включать в себя устройство захвата видео/изображений и/или устройство формирования видео/изображений. Устройство захвата видео/изображений может включать в себя, например, одну или более камер, архивы видео/изображений, включающие в себя ранее захваченные видео/изображения, и т.п. Устройство формирования видео/изображений может включать в себя, например, компьютеры, планшетные компьютеры и смартфоны и может (электронно) формировать видео/изображения. Например, виртуальное видео/изображение может формироваться через компьютер и т.п. В этом случае, процесс захвата видео/изображений может заменяться посредством процесса формирования связанных данных.

[41] Оборудование кодирования может кодировать входное видео/изображение. Оборудование кодирования может выполнять последовательность процедур, таких как прогнозирование, преобразование и квантование, для эффективности сжатия и кодирования. Кодированные данные (кодированная информация видео/изображений) могут выводиться в форме потока битов.

[42] Передатчик может передавать информацию или данные кодированных изображений/изображений, выводимую в форме потока битов, в приемник приемного устройства через цифровой носитель хранения данных или сеть в форме файла или потоковой передачи. Цифровой носитель хранения данных может включать в себя различные носители хранения данных, такие как USB, SD, CD, DVD, Blu-Ray, HDD, SSD и т.п. Передатчик может включать в себя элемент для формирования мультимедийного файла через предварительно определенный формат файлов и может включать в себя элемент для передачи через широковещательную передачу/сеть связи. Приемник может принимать/извлекать поток битов и передавать принимаемый поток битов в оборудование декодирования.

[43] Оборудование декодирования может декодировать видео/изображение посредством выполнения последовательности процедур, таких как деквантование, обратное преобразование и прогнозирование, соответствующих работе оборудования кодирования.

[44] Модуль рендеринга может подготавливать посредством рендеринга декодированное видео/изображение. Подготовленное посредством рендеринга видео/изображение может отображаться через дисплей.

[45] В настоящем документе, видео может означать последовательность изображений во времени. Кадр, в общем, означает единицу, представляющую одно изображение в конкретном временном кинокадре, и срез/плитка означает единицу, составляющую часть кадра с точки зрения кодирования. Срез/плитка может включать в себя одну или более единиц дерева кодирования (CTU). Один кадр может состоять из одного или более срезов/плиток. Один кадр может состоять из одной или более групп плиток. Одна группа плиток может включать в себя одну или более плиток. Кирпич может представлять прямоугольную область CTU-строк в плитке в кадре. Плитка может сегментироваться на несколько кирпичей, каждый из которых состоит из одной или более CTU-строк в плитке. Плитка, которая не сегментируется на несколько кирпичей, также может называться "кирпичом". Кирпичное сканирование представляет собой конкретное последовательное упорядочение CTU, сегментирующих кадр, при котором CTU упорядочиваются последовательно в растровом CTU-сканировании в кирпиче, кирпичи внутри плитки упорядочиваются последовательно в растровом сканировании кирпичей плитки, и плитки в кадре упорядочиваются последовательно в растровом сканировании плиток кадра. Плитка представляет собой прямоугольную область CTU в конкретном столбце плиток и конкретной строке плиток в кадре. Столбец плиток представляет собой прямоугольную область CTU, имеющих высоту, равную высоте кадра, и ширину, указываемую посредством синтаксических элементов в наборе параметров кадра. Строка плиток представляет собой прямоугольную область CTU, имеющих высоту, указываемую посредством синтаксических элементов в наборе параметров кадра, и ширину, равную ширине кадра. Сканирование плиток представляет собой конкретное последовательное упорядочение CTU, сегментирующих кадр, при котором CTU упорядочиваются последовательно при растровом сканировании CTU в плитке, тогда как плитки в кадре упорядочиваются последовательно при растровом сканировании плиток кадра. Срез включает в себя собой целое число кирпичей кадра, которые могут содержаться исключительно в одной NAL-единице. Срез может состоять либо из определенного числа полных плиток, либо только из жесткой последовательности полных кирпичей одной плитки. В настоящем документе, группа плиток и срез могут использоваться взаимозаменяемо. Например, в настоящем документе, группа плиток/заголовок группы плиток может называться "срезом/заголовком среза".

[46] Пиксел или пел может означать наименьшую единицу, составляющую один кадр (или изображение). Кроме того, "выборка" может использоваться в качестве термина, соответствующего пикселу. Выборка, в общем, может представлять пиксел или значение пиксела и может представлять только пиксел/пиксельное значение компонента сигналов яркости либо только пиксел/пиксельное значение компонента сигналов цветности.

[47] Единица может представлять базовую единицу обработки изображений. Единица может включать в себя по меньшей мере одно из конкретной области кадра и информации, связанной с областью. Одна единица может включать в себя один блок сигналов яркости и два блока сигналов цветности (например, Cb, Cr). Единица может использоваться взаимозаменяемо с такими терминами, как блок или зона в некоторых случаях. В общем случае, блок MxN может включать в себя выборки (или массивы выборок) либо набор (или массив) коэффициентов преобразования из M столбцов и N строк. Альтернативно, выборка может означать пиксельное значение в пространственной области и когда такое пиксельное значение преобразуется в частотную область, это может означать коэффициент преобразования в частотной области.

[48] Единица может взаимозаменяемо использоваться с таким термином, как блок или зона, в некоторых случаях. Обычно, блок MxN может представлять выборки, состоящие из M столбцов и N строк или группы коэффициентов преобразования. Выборка, в общем, может представлять пиксел или значение пиксела и также может представлять только пиксел/пиксельное значение компонента сигнала яркости, а также представлять только пиксел/пиксельное значение компонента сигнала цветности. Выборка может использоваться в качестве термина, соответствующего пикселу или пелу, конфигурирующему один кадр (или изображение).

[49] Фиг. 2 является схемой, принципиально иллюстрирующей конфигурацию оборудования кодирования видео/изображений, к которому могут применяться варианты осуществления настоящего документа. В дальнейшем в этом документе, то, что называется "оборудованием кодирования видео", может включать в себя оборудование кодирования изображений.

[50] Ссылаясь на фиг. 2, оборудование 200 кодирования может включать в себя и конфигурироваться с помощью модуля 210 сегментации изображений, модуля 220 прогнозирования, остаточного процессора 230, энтропийного кодера 240, сумматора 250, фильтра 260 и запоминающего устройства 270. Модуль 220 прогнозирования может включать в себя модуль 221 взаимного прогнозирования и модуль 222 внутреннего прогнозирования. Остаточный процессор 230 может включать в себя преобразователь 232, квантователь 233, деквантователь 234 и обратный преобразователь 235. Остаточный процессор 230 дополнительно может включать в себя вычитатель 231. Сумматор 250 может называться "модулем восстановления" или "формирователем восстановленных блоков". Модуль 210 сегментации изображений, модуль 220 прогнозирования, остаточный процессор 230, энтропийный кодер 240, сумматор 250 и фильтр 260, которые описываются выше, могут конфигурироваться посредством одного или более аппаратных компонентов (например, наборов микросхем или процессоров кодера) согласно варианту осуществления. Помимо этого, запоминающее устройство 270 может включать в себя буфер декодированных кадров (DPB) и также может конфигурироваться посредством цифрового носителя хранения данных. Аппаратный компонент дополнительно может включать в себя запоминающее устройство 270 в качестве внутреннего/внешнего компонента.

[51] Модуль 210 сегментации изображений может разбивать входное изображение (или кадр, кинокадр), вводимое в оборудование 200 кодирования, на одну или более единиц обработки. В качестве примера, единица обработки может называться "единицей кодирования (CU)". В этом случае, единица кодирования может рекурсивно разбиваться согласно структуре в виде дерева квадрантов, двоичного дерева и троичного дерева (QTBTTT) из единицы дерева кодирования (CTU) или наибольшей единицы кодирования (LCU). Например, одна единица кодирования может разбиваться на множество единиц кодирования большей глубины на основе структуры в виде дерева квадрантов, структуры в виде двоичного дерева и/или структуры в виде троичного дерева. В этом случае, например, сначала применяется структура в виде дерева квадрантов, и впоследствии может применяться структура в виде двоичного дерева и/или структура в виде троичного дерева. Альтернативно, также сначала может применяться структура в виде двоичного дерева. Процедура кодирования согласно настоящему документу может выполняться на основе конечной единицы кодирования, которая более не разбивается. В этом случае, на основе эффективности кодирования согласно характеристикам изображений и т.п., максимальная единица кодирования может непосредственно использоваться в качестве конечной единицы кодирования, или при необходимости, единица кодирования может рекурсивно разбиваться на единицы кодирования большей глубины, так что единица кодирования, имеющая оптимальный размер, может использоваться в качестве конечной единицы кодирования. Здесь, процедура кодирования может включать в себя такую процедуру, как прогнозирование, преобразование и восстановление, которая описывается ниже. В качестве другого примера, единица обработки дополнительно может включать в себя единицу прогнозирования (PU) или единицу преобразования (TU). В этом случае, каждая из единицы прогнозирования и единицы преобразования может разбиваться или сегментироваться из вышеуказанной конечной единицы кодирования. Единица прогнозирования может представлять собой единицу выборочного прогнозирования, и единица преобразования может представлять собой единицу для логического вывода коэффициента преобразования и/или единицу для логического вывода остаточного сигнала из коэффициента преобразования.

[52] Оборудование 200 кодирования может вычитать прогнозный сигнал (прогнозированный блок, массив прогнозных выборок), выводимый из модуля 221 взаимного прогнозирования или модуля 222 внутреннего прогнозирования, из сигнала входного изображения (исходного блока, массива исходных выборок), чтобы формировать остаточный сигнал (остаточный блок, массив остаточных выборок), и сформированный остаточный сигнал передается в преобразователь 232. В этом случае, как проиллюстрировано, модуль для вычитания прогнозного сигнала (блока прогнозирования, массива прогнозных выборок) из сигнала входного изображения (исходного блока, массива исходных выборок) в кодере 200 может называться "вычитателем 231". Модуль 220 прогнозирования может выполнять прогнозирование для целевого блока обработки (в дальнейшем в этом документе, называемого "текущим блоком"), и формировать прогнозированный блок, включающий в себя прогнозные выборки для текущего блока. Модуль 220 прогнозирования может определять то, применяется внутреннее прогнозирование или взаимное прогнозирование, в единицах текущего блока или CU. Модуль 220 прогнозирования может формировать различные виды информации относительно прогнозирования, такие как информация режима прогнозирования, и передавать сформированную информацию в энтропийный кодер 240, как описано ниже в описании каждого режима прогнозирования. Информация относительно прогнозирования может кодироваться посредством энтропийного кодера 240 и выводиться в форме потока битов.

[53] Модуль 222 внутреннего прогнозирования может прогнозировать текущий блок со ссылкой на выборки в пределах текущего кадра. Выборки, на которые ссылаются, могут быть расположены как граничащие с текущим блоком либо также могут быть расположены на большом расстоянии от текущего блока согласно режиму прогнозирования. Режимы прогнозирования при внутреннем прогнозировании могут включать в себя множество ненаправленных режимов и множество направленных режимов. Ненаправленный режим может включать в себя, например, DC-режим или планарный режим. Направленный режим может включать в себя, например, 33 режима направленного прогнозирования или 65 режимов направленного прогнозирования согласно точной степени направления прогнозирования. Тем не менее, это является иллюстративным, и режимы направленного прогнозирования, которые больше или меньше вышеуказанного числа, могут использоваться согласно настройке. Модуль 222 внутреннего прогнозирования также может определять режим прогнозирования, применяемый к текущему блоку, посредством использования режима прогнозирования, применяемого к соседнему блоку.

[54] Модуль 221 взаимного прогнозирования может логически выводить прогнозированный блок относительно текущего блока на основе опорного блока (массива опорных выборок), указываемого посредством вектора движения для опорного кадра. В это время, чтобы снижать объем информации движения, передаваемой в режиме взаимного прогнозирования, информация движения может прогнозироваться в единицах блоков, субблоков или выборок на основе корреляции информации движения между соседним блоком и текущим блоком. Информация движения может включать в себя вектор движения и индекс опорного кадра. Информация движения дополнительно может включать в себя информацию направления взаимного прогнозирования (L0-прогнозирование, L1-прогнозирование, бипрогнозирование и т.п.). В случае взаимного прогнозирования, соседний блок может включать в себя пространственный соседний блок, существующий в текущем кадре, и временной соседний блок, существующий в опорном кадре. Опорный кадр, включающий в себя опорный блок, и опорный кадр, включающий в себя временной соседний блок, могут быть идентичными друг другу или отличающимися друг от друга. Временной соседний блок может упоминаться под таким названием, как "совместно размещенный опорный блок", "совместно размещенная CU (colCU)" и т.п., и опорный кадр, включающий в себя временной соседний блок, также может называться "совместно размещенным кадром (colPic)". Например, модуль 221 взаимного прогнозирования может конфигурировать список возможных вариантов информации движения на основе соседних блоков и формировать информацию, указывающую то, какой возможный вариант используется для того, чтобы извлекать вектор движения и/или индекс опорного кадра текущего блока. Взаимное прогнозирование может выполняться на основе различных режимов прогнозирования, и, например, в случае режима пропуска и режима объединения, модуль 221 взаимного прогнозирования может использовать информацию движения соседнего блока в качестве информации движения текущего блока. В случае режима пропуска, остаточный сигнал может не передаваться, в отличие от режима объединения. Режим прогнозирования векторов движения (MVP) может указывать вектор движения текущего блока посредством использования вектора движения соседнего блока в качестве предиктора вектора движения и передачи в служебных сигналах разности векторов движения.

[55] Модуль 220 прогнозирования может формировать прогнозный сигнал на основе различных способов прогнозирования, которые описываются ниже. Например, модуль 220 прогнозирования может применять внутреннее прогнозирование или взаимное прогнозирование для прогнозирования одного блока и может одновременно применять внутреннее прогнозирование и взаимное прогнозирование. Это может называться "комбинированным взаимным и внутренним прогнозированием (CIIP)". Помимо этого, модуль прогнозирования может быть основан на режиме прогнозирования на основе внутриблочного копирования (IBC) либо основан на палитровом режиме для прогнозирования блока. Режим IBC-прогнозирования или палитровый режим может использоваться для кодирования изображений/видео для такого контента, как игры и т.п., например, для кодирования экранного контента (SCC). IBC по существу выполняет прогнозирование в текущем кадре, но может выполняться аналогично взаимному прогнозированию в том, что опорный блок извлекается в текущем кадре. Таким образом, IBC может использовать по меньшей мере одну из технологий взаимного прогнозирования, описанных в настоящем документе. Палитровый режим может рассматриваться как пример внутреннего кодирования или внутреннего прогнозирования. Когда палитровый режим применяется, выборочное значение в кадре может передаваться в служебных сигналах на основе информации относительно таблицы палитр и индекса палитры.

[56] Прогнозный сигнал, сформированный посредством модуля прогнозирования (включающего в себя модуль 221 взаимного прогнозирования и/или модуль 222 внутреннего прогнозирования), может использоваться для того, чтобы формировать восстановленный сигнал, либо может использоваться для того, чтобы формировать остаточный сигнал.

[57] Преобразователь 232 может формировать коэффициенты преобразования посредством применения технологии преобразования к остаточному сигналу. Например, технология преобразования может включать в себя по меньшей мере одно из дискретного косинусного преобразования (DCT), дискретного синусного преобразования (DST), преобразования на основе графа (GBT) или условно нелинейного преобразования (CNT). Здесь, GBT означает преобразование, полученное из графа при выражении информации взаимосвязи между пикселами на графе. CNT означает преобразование, полученное на основе прогнозного сигнала, сформированного с использованием всех ранее восстановленных пикселов. Кроме того, процесс преобразования может применяться к блоку пикселов, имеющих размер, идентичный размеру квадрата, или может применяться к блоку переменного размера, который не представляет собой квадрат.

[58] Квантователь 233 квантует коэффициенты преобразования и передает их в энтропийный кодер 240, и энтропийный кодер 240 кодирует квантованный сигнал (информацию относительно квантованных коэффициентов преобразования) и выводит кодированный сигнал в качестве потока битов. Информация относительно квантованных коэффициентов преобразования может называться "остаточной информацией". Квантователь 233 может перекомпоновывать квантованные коэффициенты преобразования в блочной форме в одномерную векторную форму на основе порядка сканирования коэффициентов и может формировать информацию относительно коэффициентов преобразования на основе квантованных коэффициентов преобразования в одномерной векторной форме.

[59] Энтропийный кодер 240 может выполнять различные способы кодирования, такие как, например, кодирование экспоненциальным кодом Голомба, контекстно-адаптивное кодирование переменной длины (CAVLC) и контекстно-адаптивное двоичное арифметическое кодирование (CABAC). Энтропийный кодер 240 может кодировать информацию, необходимую для восстановления видео/изображений (например, значения синтаксических элементов и т.д.) отличную от квантованных коэффициентов преобразования, вместе или отдельно. Кодированная информация (например, кодированная информация видео/изображений) может передаваться или сохраняться в единицах слоя абстрагирования от сети (NAL) в форме потока битов. Информация видео/изображений дополнительно может включать в себя информацию относительно различных наборов параметров, таких как набор параметров адаптации (APS), набор параметров кадра (PPS), набор параметров последовательности (SPS) или набор параметров видео (VPS). Кроме того, информация видео/изображений дополнительно может включать в себя общую информацию ограничений. В настоящем документе, информация и/или синтаксические элементы, передаваемые/передаваемые в служебных сигналах из оборудования кодирования в оборудование декодирования, могут включаться в информацию видео/изображений. Информация видео/изображений может кодироваться через процедуру кодирования, описанную выше, и включаться в поток битов. Поток битов может передаваться через сеть или может сохраняться на цифровом носителе хранения данных. Здесь, сеть может включать в себя широковещательную сеть и/или сеть связи, и цифровой носитель хранения данных может включать в себя различные носители хранения данных, такие как USB, SD, CD, DVD, Blu-Ray, HDD и SSD. Передающий модуль (не показан) и/или модуль хранения (не показан) для передачи или сохранения сигнала, выводимого из энтропийного кодера 240, могут быть сконфигурированы как внутренние/внешние элементы оборудования 200 кодирования, либо передающий модуль может включаться в энтропийный кодер 240.

[60] Квантованные коэффициенты преобразования, выводимые из квантователя 233, могут использоваться для того, чтобы формировать прогнозный сигнал. Например, остаточный сигнал (остаточный блок или остаточные выборки) может восстанавливаться посредством применения деквантования и обратного преобразования к квантованным коэффициентам преобразования через деквантователь 234 и модуль 235 обратного преобразования. Сумматор 250 может суммировать восстановленный остаточный сигнал с прогнозным сигналом, выводимым из модуля 221 взаимного прогнозирования или модуля 222 внутреннего прогнозирования, чтобы формировать восстановленный сигнал (восстановленный кадр, восстановленный блок, массив восстановленных выборок). Когда отсутствует остаток для целевого блока обработки, к примеру, когда режим пропуска применяется, прогнозированный блок может использоваться в качестве восстановленного блока. Сумматор 250 может называться "модулем восстановления" или "формирователем блоков восстановления". Сформированный восстановленный сигнал может использоваться для внутреннего прогнозирования следующего целевого блока для обработки в текущем кадре или может использоваться для взаимного прогнозирования следующего кадра после фильтрации, как описано ниже.

[61] Между тем, преобразование сигнала яркости с масштабированием сигнала цветности (LMCS) может применяться в ходе процесса кодирования и/или восстановления кадров.

[62] Фильтр 260 может повышать субъективное/объективное качество изображений посредством применения фильтрации к восстановленному сигналу. Например, фильтр 260 может формировать модифицированный восстановленный кадр посредством применения различных способов фильтрации к восстановленному кадру и сохранять модифицированный восстановленный кадр в запоминающем устройстве 270, а именно, в DPB запоминающего устройства 270. Различные способы фильтрации могут включать в себя, например, фильтрацию для удаления блочности, дискретизированное адаптивное смещение, адаптивный контурный фильтр, билатеральный фильтр и т.п. Фильтр 260 может формировать различные виды информации, связанной с фильтрацией, и передавать сформированную информацию в энтропийный кодер 240, как описано ниже в описании каждого способа фильтрации. Информация, связанная с фильтрацией, может кодироваться посредством энтропийного кодера 240 и выводиться в форме потока битов.

[63] Модифицированный восстановленный кадр, передаваемый в запоминающее устройство 270, может использоваться в качестве опорного кадра в модуле 221 взаимного прогнозирования. Когда взаимное прогнозирование применяется посредством оборудования кодирования, рассогласование прогнозирования между оборудованием 200 кодирования и оборудованием декодирования может исключаться, и эффективность кодирования может повышаться.

[64] DPB запоминающего устройства 270 может сохранять модифицированный восстановленный кадр для использования в качестве опорного кадра в модуле 221 взаимного прогнозирования. Запоминающее устройство 270 может сохранять информацию движения блока, из которой информация движения в текущем кадре извлекается (или кодируется), и/или информацию движения уже восстановленных блоков в кадре. Сохраненная информация движения может передаваться в модуль 221 взаимного прогнозирования для использования в качестве информации движения пространственного соседнего блока или информации движения временного соседнего блока. Запоминающее устройство 270 может сохранять восстановленные выборки восстановленных блоков в текущем кадре и может передавать восстановленные выборки в модуль 222 внутреннего прогнозирования.

[65] Фиг. 3 является схемой для схематичного пояснения конфигурации оборудования декодирования видео/изображений, к которому могут применяться варианты осуществления настоящего документа.

[66] Ссылаясь на фиг. 3, оборудование 300 декодирования может включать в себя и конфигурироваться с помощью энтропийного декодера 310, остаточного процессора 320, модуля 330 прогнозирования, сумматора 340, фильтра 350 и запоминающего устройства 360. Модуль 330 прогнозирования может включать в себя модуль 331 взаимного прогнозирования и модуль 332 внутреннего прогнозирования. Остаточный процессор 320 может включать в себя деквантователь 321 и обратный преобразователь 322. Энтропийный декодер 310, остаточный процессор 320, модуль 330 прогнозирования, сумматор 340 и фильтр 350, которые описываются выше, могут конфигурироваться посредством одного или более аппаратных компонентов (например, наборов микросхем или процессоров декодера) согласно варианту осуществления. Дополнительно, запоминающее устройство 360 может включать в себя буфер декодированных кадров (DPB) и может конфигурироваться посредством цифрового носителя хранения данных. Аппаратный компонент дополнительно может включать в себя запоминающее устройство 360 в качестве внутреннего/внешнего компонента.

[67] Когда поток битов, включающий в себя информацию видео/изображений, вводится, оборудование 300 декодирования может восстанавливать изображение в ответ на процесс, в котором информация видео/изображений обрабатывается в оборудовании кодирования, проиллюстрированном на фиг. 2. Например, оборудование 300 декодирования может извлекать единицы/блоки на основе связанной с разбиением на блоки информации, полученной из потока битов. Оборудование 300 декодирования может выполнять декодирование с использованием единицы обработки, применяемой для оборудования кодирования. Следовательно, единица обработки для декодирования, например, может представлять собой единицу кодирования, и единица кодирования может разбиваться согласно структуре в виде дерева квадрантов, структуре в виде двоичного дерева и/или структуре в виде троичного дерева из единицы дерева кодирования или максимальной единицы кодирования. Одна или более единиц преобразования могут извлекаться из единицы кодирования. Помимо этого, восстановленный сигнал изображения, декодированный и выводимый посредством оборудования 300 декодирования, может воспроизводиться посредством оборудования воспроизведения.

[68] Оборудование 300 декодирования может принимать сигнал, выводимый из оборудования кодирования по фиг. 2 в форме потока битов, и принимаемый сигнал может декодироваться через энтропийный декодер 310. Например, энтропийный декодер 310 может синтаксически анализировать поток битов, чтобы извлекать информацию (например, информацию видео/изображений), необходимую для восстановления изображений (или восстановления кадров). Информация видео/изображений дополнительно может включать в себя информацию относительно различных наборов параметров, таких как набор параметров адаптации (APS), набор параметров кадра (PPS), набор параметров последовательности (SPS) или набор параметров видео (VPS). Помимо этого, информация видео/изображений дополнительно может включать в себя общую информацию ограничений. Оборудование декодирования дополнительно может декодировать кадр на основе информации относительно набора параметров и/или общей информации ограничений. Передаваемая в служебных сигналах/принимаемая информация и/или синтаксические элементы, описанные далее в настоящем документе, могут декодироваться, могут декодировать процедуру декодирования и получаться из потока битов. Например, энтропийный декодер 310 декодирует информацию в потоке битов на основе способа кодирования, такого как кодирование экспоненциальным кодом Голомба, контекстно-адаптивное кодирование переменной длины (CAVLC) или контекстно-адаптивное арифметическое кодирование (CABAC), и выходных синтаксических элементов, требуемых для восстановления изображений и квантованных значений коэффициентов преобразования для остатка. Более конкретно, способ энтропийного CABAC-декодирования может принимать элемент разрешения, соответствующий каждому синтаксическому элементу в потоке битов, определять контекстную модель посредством использования информации целевого синтаксического элемента декодирования, информации декодирования целевого блока декодирования или информации символа/элемента разрешения, декодированного на предыдущей стадии, и выполнять арифметическое декодирование для элемента разрешения посредством прогнозирования вероятности появления элемента разрешения согласно определенной контекстной модели и формировать символ, соответствующий значению каждого синтаксического элемента. В этом случае, способ энтропийного CABAC-декодирования может обновлять контекстную модель посредством использования информации декодированного символа/элемента разрешения для контекстной модели следующего символа/элемента разрешения после определения контекстной модели. Информация, связанная с прогнозированием, из информации, декодированной посредством энтропийного декодера 310, может предоставляться в модуль прогнозирования (модуль 332 взаимного прогнозирования и модуль 331 внутреннего прогнозирования), и остаточные значения, для которых энтропийное декодирование выполнено в энтропийном декодере 310, т.е. квантованные коэффициенты преобразования и связанная информация параметров, могут вводиться в остаточный процессор 320.

[69] Остаточный процессор 320 может извлекать остаточный сигнал (остаточный блок, остаточные выборки или массив остаточных выборок). Кроме того, информация относительно фильтрации из информации, декодированной посредством энтропийного декодера 310, может предоставляться в фильтр 350. Между тем, приемный модуль (не показан) для приема сигнала, выводимого из оборудования кодирования, может быть дополнительно сконфигурирован в качестве внутреннего/внешнего элемента оборудования 300 декодирования, либо приемный модуль может представлять собой компонент энтропийного декодера 310. Между тем, оборудование декодирования согласно настоящему документу может называться "оборудованием декодирования видео/изображений/кадров", и оборудование декодирования может разделяться на информационный декодер (декодер информации видео/изображений/кадров) и выборочный декодер (декодер выборок видео/изображений/кадров). Информационный декодер может включать в себя энтропийный декодер 310, и выборочный декодер может включать в себя по меньшей мере одно из деквантователя 321, обратного преобразователя 322, сумматора 340, фильтра 350, запоминающего устройства 360, модуля 332 взаимного прогнозирования и модуля 331 внутреннего прогнозирования.

[70] Деквантователь 321 может деквантовать квантованные коэффициенты преобразования, с тем чтобы выводить коэффициенты преобразования. Деквантователь 321 может перекомпоновывать квантованные коэффициенты преобразования в двумерной блочной форме. В этом случае, перекомпоновка может выполняться на основе порядка сканирования коэффициентов, выполняемого посредством оборудования кодирования. Деквантователь 321 может выполнять деквантование для квантованных коэффициентов преобразования с использованием параметра квантования (например, информации размера шага квантования) и получать коэффициенты преобразования.

[71] Обратный преобразователь 322 обратно преобразует коэффициенты преобразования, чтобы получать остаточный сигнал (остаточный блок, массив остаточных выборок).

[72] В настоящем документе по меньшей мере одно из квантования/деквантования и/или преобразования/обратного преобразования может опускаться. Когда квантование/деквантование опускается, квантованный коэффициент преобразования может называться "коэффициентом преобразования". Когда преобразование/обратное преобразование опускается, коэффициенты преобразования могут называться "коэффициентом" или "остаточным коэффициентом" либо по-прежнему могут называться "коэффициентом преобразования" для единообразности выражения.

[73] В настоящем документе, квантованный коэффициент преобразования и коэффициент преобразования могут называться "коэффициентом преобразования" и "масштабированным коэффициентом преобразования", соответственно. В этом случае, остаточная информация может включать в себя информацию относительно коэффициента(ов) преобразования, и информация относительно коэффициента(ов) преобразования может передаваться в служебных сигналах через синтаксис остаточного кодирования. Коэффициенты преобразования могут извлекаться на основе остаточной информации (или информации относительно коэффициента(ов) преобразования), и масштабированные коэффициенты преобразования могут извлекаться через обратное преобразование (масштабирование) для коэффициентов преобразования. Остаточные выборки могут извлекаться на основе обратного преобразования (преобразования) масштабированных коэффициентов преобразования. Это также может применяться/выражаться в других частях настоящего документа.

[74] Модуль 330 прогнозирования может выполнять прогнозирование текущего блока и формировать прогнозированный блок, включающий в себя прогнозные выборки текущего блока. Модуль прогнозирования может определять то, применяется внутреннее прогнозирование, или применяется взаимное прогнозирование к текущему блоку, на основе информации относительно прогнозирования, выводимой из энтропийного декодера 310, и определять конкретный режим внутреннего/взаимного прогнозирования.

[75] Модуль 330 прогнозирования может формировать прогнозный сигнал на основе различных способов прогнозирования, которые описываются ниже. Например, модуль прогнозирования может применять внутреннее прогнозирование или взаимное прогнозирование для прогнозирования одного блока и может одновременно применять внутреннее прогнозирование и взаимное прогнозирование. Это может называться "комбинированным взаимным и внутренним прогнозированием (CIIP)". Помимо этого, модуль прогнозирования может быть основан на режиме прогнозирования на основе внутриблочного копирования (IBC) либо основан на палитровом режиме для прогнозирования блока. Режим IBC-прогнозирования или палитровый режим может использоваться для кодирования изображений/видео для такого контента, как игры и т.п., например, для кодирования экранного контента (SCC). IBC по существу может выполнять прогнозирование в текущем кадре, но может выполняться аналогично взаимному прогнозированию в том, что опорный блок извлекается в текущем кадре. Таким образом, IBC может использовать по меньшей мере одну из технологий взаимного прогнозирования, описанных в настоящем документе. Палитровый режим может рассматриваться как пример внутреннего кодирования или внутреннего прогнозирования. Когда палитровый режим применяется, информация относительно таблицы палитр и индекса палитры может включаться в информацию видео/изображений и передаваться в служебных сигналах.

[76] Модуль 331 внутреннего прогнозирования может прогнозировать текущий блок посредством ссылки на выборки в текущем кадре. Выборки для ссылки могут быть расположены в окружении текущего блока или могут быть расположены с разнесением относительно текущего блока согласно режиму прогнозирования. При внутреннем прогнозировании, режимы прогнозирования могут включать в себя множество ненаправленных режимов и множество направленных режимов. Модуль 331 внутреннего прогнозирования может определять режим прогнозирования, который должен применяться к текущему блоку, посредством использования режима прогнозирования, применяемого к соседнему блоку.

[77] Модуль 332 взаимного прогнозирования может извлекать прогнозированный блок для текущего блока на основе опорного блока (массива опорных выборок), указываемого посредством вектора движения для опорного кадра. В этом случае, чтобы уменьшать объем информации движения, передаваемой в режиме взаимного прогнозирования, информация движения может прогнозироваться в единицах блоков, субблоков или выборок на основе корреляции информации движения между соседним блоком и текущим блоком. Информация движения может включать в себя вектор движения и индекс опорного кадра. Информация движения дополнительно может включать в себя информацию относительно направления взаимного прогнозирования (L0-прогнозирование, L1-прогнозирование, бипрогнозирование и т.п.). В случае взаимного прогнозирования, соседний блок может включать в себя пространственный соседний блок, существующий в текущем кадре, и временной соседний блок, существующий в опорном кадре. Например, модуль 332 взаимного прогнозирования может конструировать список возможных вариантов информации движения на основе соседних блоков и извлекать вектор движения текущего блока и/или индекс опорного кадра на основе принимаемой информации выбора возможных вариантов. Взаимное прогнозирование может выполняться на основе различных режимов прогнозирования, и информация относительно прогнозирования может включать в себя информацию, указывающую режим взаимного прогнозирования для текущего блока.

[78] Сумматор 340 может формировать восстановленный сигнал (восстановленный кадр, восстановленный блок или массив восстановленных выборок) посредством суммирования полученного остаточного сигнала с прогнозным сигналом (прогнозированным блоком или массивом прогнозированных выборок), выводимым из модуля прогнозирования (включающего в себя модуль 332 взаимного прогнозирования и/или модуль 331 внутреннего прогнозирования). Если отсутствует остаток для целевого блока для обработки, к примеру, в случае, когда режим пропуска применяется, прогнозированный блок может использоваться в качестве восстановленного блока.

[79] Сумматор 340 может называться "модулем восстановления" или "формирователем восстановленных блоков". Сформированный восстановленный сигнал может использоваться для внутреннего прогнозирования следующего блока, который должен обрабатываться в текущем кадре, и, как описано ниже, также может выводиться посредством фильтрации либо также может использоваться для взаимного прогнозирования следующего кадра.

[80] Между тем, преобразование сигнала яркости с масштабированием сигнала цветности (LMCS) также может применяться в процессе декодирования кадров.

[81] Фильтр 350 может повышать субъективное/объективное качество изображений посредством применения фильтрации к восстановленному сигналу. Например, фильтр 350 может формировать модифицированный восстановленный кадр посредством применения различных способов фильтрации к восстановленному кадру и сохранять модифицированный восстановленный кадр в запоминающем устройстве 360, а именно, в DPB запоминающего устройства 360. Различные способы фильтрации могут включать в себя, например, фильтрацию для удаления блочности, дискретизированное адаптивное смещение, адаптивный контурный фильтр, билатеральный фильтр и т.п.

[82] (Модифицированный) восстановленный кадр, сохраненный в DPB запоминающего устройства 360, может использоваться в качестве опорного кадра в модуле 332 взаимного прогнозирования. Запоминающее устройство 360 может сохранять информацию движения блока, из которой информация движения в текущем кадре извлекается (или декодируется), и/или информацию движения уже восстановленных блоков в кадре. Сохраненная информация движения может передаваться в модуль 332 взаимного прогнозирования, так что она используется в качестве информации движения пространственного соседнего блока или информации движения временного соседнего блока. Запоминающее устройство 360 может сохранять восстановленные выборки восстановленных блоков в текущем кадре и передавать восстановленные выборки в модуль 331 внутреннего прогнозирования.

[83] В настоящем документе, варианты осуществления, описанные в фильтре 260, модуле 221 взаимного прогнозирования и модуле 222 внутреннего прогнозирования оборудования 200 кодирования, могут применяться одинаково или соответствовать фильтру 350, модулю 332 взаимного прогнозирования и модулю 331 внутреннего прогнозирования.

[84] Между тем, способ кодирования видео/изображений согласно настоящему документу может осуществляться на основе следующей структуры сегментации. В частности, вышеописанные процедуры прогнозирования, остаточной обработки ((обратного) преобразование и (де)-квантования), кодирования синтаксических элементов и фильтрации могут выполняться на основе CTU и CU (и/или TU и PU), извлекаемых на основе структуры сегментации. Процедура сегментации на блоки может выполняться посредством модуля 210 сегментации изображений вышеописанного оборудования кодирования, и связанная с сегментацией информация может обрабатываться (посредством кодирования) посредством энтропийного кодера 240 и может передаваться в оборудование декодирования в форме потока битов. Энтропийный декодер 310 оборудования декодирования может извлекать структуру сегментации на блоки текущего кадра на основе связанной с сегментацией информации, полученной из потока битов, и на основе этого, может выполнять последовательность процедур (например, прогнозирование, остаточную обработку, восстановление блоков/кадров, внутриконтурную фильтрацию и т.п.) для декодирования изображений. CU-размер и TU-размер могут быть равными друг другу, или множество TU может присутствовать в CU-области. Между тем, CU-размер, в общем, может представлять размер блока кодирования (CB) компонентных (выборок) сигналов яркости. TU-размер, в общем, может представлять размер блока преобразования (TB) компонентных (выборок) сигналов яркости. CB- или TB-размер компонентных (выборок) сигналов цветности может извлекаться на основе CB- или TB-размера компонентных (выборок) сигналов яркости в соответствии с соотношением компонентов согласно цветовому формату (формату сигналов цветности, например, 4:4:4, 4:2:2, 4:2:0 и т.п.) кадра/изображения. TU-размер может извлекаться на основе maxTbSize. Например, если CU-размер больше maxTbSize, множество TU (TB) maxTbSize могут извлекаться из CU, и преобразование/обратное преобразование может выполняться в единице TU (TB). Дополнительно, например, в случае если внутреннее прогнозирование применяется, режим/тип внутреннего прогнозирования может извлекаться в единице CU (или CB), и процедуры извлечения соседних опорных выборок и формирования прогнозных выборок могут выполняться в единице TU (или TB). В этом случае, одна или множество TU (или TB) могут присутствовать в одной CU-(или CB-)области, и, в этом случае, множество TU или (TB) могут совместно использовать идентичный режим/тип внутреннего прогнозирования.

[85] Дополнительно, при кодировании видео/изображений согласно настоящему документу, модуль обработки изображений может иметь иерархическую структуру. Один кадр может сегментироваться на одну или более плиток, кирпичей, срезов и/или групп плиток. Один срез может включать в себя один или более кирпичей. Кирпич может включать в себя одну или более CTU-строк в плитке. Срез может включать в себя целое число кирпичей кадра. Одна группа плиток может включать в себя одну или более плиток. Одна плитка может включать в себя одну или более CTU. CTU может сегментироваться на одну или более CU. Плитка представляет прямоугольную область CTU в конкретном столбце плиток и конкретной строке плиток в кадре. Группа плиток может включать в себя целое число плиток согласно растровому сканированию плиток в кадре. Заголовок среза может переносить информацию, которая может применяться к соответствующему срезу (блокам в срезе). В случае если оборудование кодирования/декодирования имеет многоядерный процессор, процессы кодирования/декодирования для плиток, срезов, кирпичей и/или групп плиток могут обрабатываться параллельно. В настоящем документе, срез или группа плиток могут использоваться заменяемо. Таким образом, заголовок группы плиток может называться "заголовком среза". Здесь, срез может иметь одни из типов срезов, включающих в себя внутренний (I) срез, прогнозирующий (P) срез и бипрогнозирующий (B) срез. При прогнозировании блоков в I-срезе, взаимное прогнозирование может не использоваться, и только внутреннее прогнозирование может использоваться. Конечно, даже в этом случае, передача служебных сигналов может выполняться посредством кодирования исходного выборочного значения без прогнозирования. Относительно блоков в P-срезе, внутреннее прогнозирование или взаимное прогнозирование может использоваться, и в случае использования взаимного прогнозирования, только унипрогнозирование может использоваться. Между тем, относительно блоков в B-срезе, внутреннее прогнозирование или взаимное прогнозирование может использоваться, и в случае использования взаимного прогнозирования, вплоть до бипрогнозирования может максимально использоваться.

[86] Оборудование кодирования может определять плитку/группу плиток, кирпич, срез и размеры максимальной и минимальной единицы кодирования с учетом эффективности кодирования или параллельной обработки либо согласно характеристикам (например, разрешению) видеоизображения, и информация для них или информация, допускающая их логический вывод, может включаться в поток битов.

[87] Оборудование декодирования может получать информацию, представляющую плитку/группу плиток, кирпич и срез текущего кадра, а также то, сегментирована или нет CTU в плитке на множество единиц кодирования. Посредством задания возможности получения (передачи) этой информации только при конкретном условии, эффективность может повышаться.

[88] Между тем, как описано выше, один кадр может включать в себя множество срезов, и один срез может включать в себя заголовок среза и данные срезов. В этом случае, один заголовок кадра дополнительно может добавляться во множество срезов (заголовок среза и набор данных срезов) в одном кадре. Заголовок кадра (синтаксис заголовков кадра) может включать в себя информацию/параметры, обычно применимую к кадру. Заголовок среза (синтаксис заголовков срезов) может включать в себя информацию/параметры, которая может применяться обобщенно к срезу. Набор параметров адаптации (APS) или набор параметров кадра (PPS) могут включать в себя информацию/параметры, которая может применяться обобщенно к одному или более срезов или кадров. Набор параметров последовательности (SPS) может включать в себя информацию/параметры, которая может применяться обобщенно к одной или более последовательностей. Набор параметров видео (VPS) может включать в себя информацию/параметры, которая может применяться обобщенно к нескольким слоям. Набор параметров декодирования (DPS) может включать в себя информацию/параметры, которая может применяться обобщенно к полному видео. DPS может включать в себя информацию/параметры, связанную с конкатенацией кодированной видеопоследовательности (CVS).

[89] Высокоуровневый синтаксис (HLS) в настоящем раскрытии включает в себя по меньшей мере одно из APS-синтаксиса, PPS-синтаксиса, SPS-синтаксиса, VPS-синтаксиса, DPS-синтаксиса и синтаксиса заголовков срезов.

[90] Дополнительно, например, информация относительно сегментации и конфигурации и т.д., плитки/группы плиток/кирпича/среза может быть сконфигурирована в оборудовании кодирования на основе высокоуровневого синтаксиса и затем может доставляться (или передаваться) в оборудование декодирования в формате потока битов.

[91] Кадр может сегментироваться на одну или более строк плиток и на один или более столбцов плиток. Плитка представляет собой последовательность CTU, покрывающих прямоугольную область кадра. Плитка может сегментироваться на один или более кирпичей, и каждый кирпич может быть сконфигурирован из нескольких CTU-строк. Плитка, которая не сегментируется на множество кирпичей, также может называться "кирпичом". Тем не менее, кирпич, представляющий собой поднабор плитки, не называется "плиткой". Срез может включать в себя несколько плиток или несколько кирпичей плитки.

[92] Процедура кодирования видео/изображений, которая основана на внутреннем прогнозировании, в общем, может включать в себя, например, следующее.

[93] Фиг. 4 показывает пример способа кодирования видео/изображений на основе внутреннего прогнозирования.

[94] Ссылаясь на фиг. 4, S400 может выполняться посредством модуля 222 внутреннего прогнозирования оборудования кодирования, и S410-S430 могут выполняться посредством остаточного процессора 230 оборудования кодирования. Более конкретно, S410 может выполняться посредством вычитателя 231 оборудования кодирования, S420 может выполняться посредством преобразователя 232 и квантователя 233 оборудования кодирования, и S430 может выполняться посредством деквантователя 234 и обратного преобразователя 235 оборудования кодирования. На S400, информация прогнозирования может извлекаться посредством модуля 222 внутреннего прогнозирования и может кодироваться посредством энтропийного кодера 240. Остаточная информация может извлекаться через S410 и S420, и остаточная информация затем может кодироваться посредством энтропийного кодера 240. Остаточная информация представляет собой информацию, связанную с остаточными выборками. Остаточная информация может включать в себя информацию, связанную с квантованными коэффициентами преобразования для остаточных выборок. Как описано выше, остаточные выборки могут извлекаться в качестве коэффициентов преобразования через преобразователь 232 оборудования кодирования, и коэффициенты преобразования могут извлекаться в качестве квантованных коэффициентов преобразования через квантователь 233. Информация, связанная с квантованными коэффициентами преобразования, может кодироваться посредством энтропийного кодера 240 через процедуру остаточного кодирования.

[95] Оборудование кодирования выполняет внутреннее прогнозирование для текущего блока (S400). Оборудование кодирования извлекает режим внутреннего прогнозирования для текущего блока и может извлекать соседние опорные выборки текущего блока, и после этого оборудование кодирования формирует прогнозные выборки в текущем блоке на основе режима внутреннего прогнозирования и соседних опорных выборок. В данном документе, процедуры определения режима внутреннего прогнозирования, извлечения соседних опорных выборок и формирования прогнозных выборок могут выполняться одновременно, либо любая из вышеуказанных процедур может выполняться перед другой процедурой(ами). Например, модуль 222 внутреннего прогнозирования оборудования кодирования может включать в себя модуль определения режима/типа прогнозирования, модуль извлечения опорных выборок и модуль извлечения прогнозных выборок. Модуль определения режима/типа прогнозирования может определять режим/тип внутреннего прогнозирования для текущего блока, модуль извлечения опорных выборок может извлекать соседние опорные выборки текущего блока, и модуль извлечения прогнозных выборок может извлекать прогнозные выборки текущего блока. Между тем, когда процедура фильтрации прогнозных выборок, которая описывается далее, выполняется, модуль 222 внутреннего прогнозирования дополнительно может включать в себя фильтр прогнозных выборок. Оборудование кодирования может определять режим, который применяется к текущему блоку, из множества режимов внутреннего прогнозирования. Оборудование кодирования может сравнивать функции затрат на искажение в зависимости от скорости передачи (RD) для режимов внутреннего прогнозирования и определять оптимальный режим внутреннего прогнозирования для текущего блока.

[96] Между тем, оборудование кодирования может выполнять процедуру фильтрации прогнозных выборок. Фильтрация прогнозных выборок также может называться "постфильтрацией". Из прогнозных выборок, часть или все прогнозные выборки могут фильтроваться посредством процедуры фильтрации прогнозных выборок. В некоторых случаях, процедура фильтрации прогнозных выборок может пропускаться.

[97] Оборудование кодирования извлекает остаточные выборки для текущего блока на основе прогнозных выборок (S410). Оборудование кодирования выполняет сравнение на основе фазы прогнозных выборок из исходных выборок текущего блока, и после этого оборудование кодирования может извлекать остаточные выборки.

[98] Оборудование кодирования может извлекать квантованные коэффициенты преобразования посредством преобразования/квантования остаточных выборок (S420). После этого, оборудование кодирования может извлекать (модифицированные) остаточные выборки посредством выполнения обработки деквантования/обратного преобразования еще раз для квантованных коэффициентов преобразования (S430). Как описано выше, причина выполнения деквантования/обратного преобразования еще раз после выполнения преобразования/квантования состоит в том, чтобы извлекать идентичные остаточные выборки в качестве остаточных выборок, которые извлекаются в оборудовании декодирования.

[99] Оборудование кодирования может формировать восстановленный блок, включающий в себя восстановленные выборки для текущего блока, на основе прогнозных выборок и (модифицированных) остаточных выборок (S440). Восстановленный кадр для текущего кадра может формироваться на основе восстановленного блока.

[100] Как описано выше, оборудование кодирования может кодировать информацию изображений, включающую в себя информацию прогнозирования, связанную с внутренним прогнозированием (например, информацию режима прогнозирования, указывающую режим прогнозирования), и остаточную информацию, связанную с внутренними/остаточными выборками, и после этого выводить кодированную информацию изображений в формате потока битов. Остаточная информация может включать в себя синтаксис остаточного кодирования. Оборудование кодирования может извлекать квантованные коэффициенты преобразования посредством преобразования/квантования остаточных выборок. Остаточная информация может включать в себя информацию относительно квантованных коэффициентов преобразования.

[101] Процедура декодирования видео/изображений, которая основана на внутреннем прогнозировании, в общем, может включать в себя, например, следующее.

[102] Фиг. 5 показывает пример способа декодирования видео/изображений на основе внутреннего прогнозирования.

[103] Оборудование декодирования может выполнять операции, которые соответствуют операциям, выполняемым посредством оборудования кодирования.

[104] Ссылаясь на фиг. 5, S500-S510 могут выполняться посредством модуля 331 внутреннего прогнозирования оборудования декодирования, и информация прогнозирования по S500 и остаточная информация по S530 могут получаться из потока битов посредством энтропийного декодера 310 оборудования декодирования. Остаточный процессор 320 оборудования декодирования может извлекать остаточные выборки для текущего блока на основе остаточной информации. Более конкретно, деквантователь 321 остаточного процессора 320 может извлекать коэффициенты преобразования посредством выполнения деквантования, на основе квантованных коэффициентов преобразования, которые извлекаются на основе остаточной информации. Так же, обратный преобразователь 322 остаточного процессора может извлекать остаточные выборки для текущего блока посредством выполнения обратного преобразования для коэффициентов преобразования. S540 может выполняться посредством сумматора 340 или модуля восстановления оборудования декодирования.

[105] Более конкретно, оборудование декодирования может извлекать режим внутреннего прогнозирования для текущего блока на основе принимаемой информации прогнозирования (S500). Оборудование декодирования может извлекать соседние опорные выборки текущего блока (S510). Оборудование декодирования может формировать прогнозные выборки в текущем блоке посредством выполнения внутреннего прогнозирования на основе режима внутреннего прогнозирования и соседних опорных выборок (S520). В этом случае, оборудование декодирования может выполнять процедуру фильтрации прогнозных выборок. Фильтрация прогнозных выборок может называться "постфильтрацией". Из прогнозных выборок, часть или все прогнозные выборки могут фильтроваться посредством процедуры фильтрации прогнозных выборок. В некоторых случаях, процедура фильтрации прогнозных выборок может пропускаться.

[106] Оборудование декодирования формирует остаточные выборки для текущего блока на основе принимаемой остаточной информации (S530). Оборудование декодирования может формировать восстановленные выборки для текущего блока на основе прогнозных выборок и остаточных выборок и может извлекать восстановленный блок, включающий в себя восстановленные выборки (S540). Восстановленный кадр для текущего кадра может формироваться на основе восстановленного блока.

[107] В данном документе, модуль 331 внутреннего прогнозирования оборудования декодирования может включать в себя модуль определения режима/типа прогнозирования, модуль извлечения опорных выборок и модуль извлечения прогнозных выборок. Модуль определения режима/типа прогнозирования может определять режим внутреннего прогнозирования для текущего блока на основе информации режима прогнозирования, которая получается посредством энтропийного декодера 310 оборудования декодирования, модуль извлечения опорных выборок может извлекать соседние опорные выборки текущего блока, и модуль извлечения прогнозных выборок может извлекать прогнозные выборки текущего блока. Между тем, когда вышеописанная процедура фильтрации прогнозных выборок выполняется, модуль 331 внутреннего прогнозирования дополнительно может включать в себя фильтр прогнозных выборок.

[108] Информация прогнозирования может включать в себя информацию режима внутреннего прогнозирования и/или информацию типа внутреннего прогнозирования. Информация режима внутреннего прогнозирования, например, может включать в себя информацию флага (например, intra_luma_mpm_flag), указывающую то, применяется или нет наиболее вероятный режим (MPM) к текущему блоку, либо то, применяется или нет оставшийся режим к текущему блоку. Так же, когда MPM применяется к текущему блоку, информация режима прогнозирования дополнительно может включать в себя информацию индекса (например, intra_luma_mpm_idx), указывающую один из возможных вариантов режимов внутреннего прогнозирования (возможных MPM-вариантов). Возможные варианты режимов внутреннего прогнозирования (возможные MPM-варианты) могут конфигурироваться из списка возможных MPM-вариантов или MPM-списка. Дополнительно, когда MPM не применяется к текущему блоку, информация режима внутреннего прогнозирования дополнительно может включать в себя информацию оставшихся режимов (например, intra_luma_mpm_remainder), указывающую один из оставшихся режимов внутреннего прогнозирования, за исключением возможных вариантов режимов внутреннего прогнозирования (возможных MPM-вариантов). Оборудование декодирования может определять режим внутреннего прогнозирования текущего блока на основе информации режима внутреннего прогнозирования. Для вышеописанного MIP, может быть сконфигурирован отдельный MPM-список.

[109] Дополнительно, информация типа внутреннего прогнозирования может реализовываться в различных форматах. Например, информация типа внутреннего прогнозирования может включать в себя информацию индекса типа внутреннего прогнозирования, указывающую один из типов внутреннего прогнозирования. В качестве другого примера, информация типа внутреннего прогнозирования может включать в себя по меньшей мере одно из информации опорной выборочной линии (например, intra_luma_ref_idx), указывающей то, применяется или нет MRL к текущему блоку, и то, какая n-ая опорная выборочная линия применяется, когда MRL применяется к текущему блоку, информации ISP-флага (например, intra_subpartitions_mode_flag), указывающей то, применяется или нет ISP к текущему блоку, информации ISP-типа (например, intra_subpartitions_split_flag), указывающей тип разбиения (или сегментации) субсегментов, когда ISP применяется к текущему блоку, информации флага, указывающей то, применяется или нет PDCP, или информации флага, указывающей то, применяется или нет LIP. Кроме того, информация типа внутреннего прогнозирования может включать в себя MIP-флаг, указывающий то, применяется или нет MIP к текущему блоку.

[110] Информация режима внутреннего прогнозирования и/или информация типа внутреннего прогнозирования могут кодироваться/декодироваться посредством использования способа кодирования, который описывается в настоящем описании изобретения. Например, информация режима внутреннего прогнозирования и/или информация типа внутреннего прогнозирования могут кодироваться/декодироваться посредством использования энтропийного кодирования (например, CABAC, CAVLC) на основе усеченного двоичного кода (Райса).

[111] Между тем, процедура кодирования видео/изображений, которая основана на взаимном прогнозировании, в общем, может включать в себя, например, следующее.

[112] Фиг. 6 показывает пример способа кодирования видео/изображений на основе взаимного прогнозирования.

[113] Ссылаясь на фиг. 6, оборудование кодирования выполняет взаимное прогнозирование для текущего блока (S600). Оборудование кодирования может извлекать режим взаимного прогнозирования и информацию движения текущего блока и формировать прогнозные выборки текущего блока. В данном документе, процедуры определения режима взаимного прогнозирования, извлечения информации движения и формирования прогнозных выборок могут выполняться одновременно, либо любая из вышеуказанных процедур может выполняться перед другой процедурой(ами). Например, модуль взаимного прогнозирования оборудования кодирования может включать в себя модуль определения режима прогнозирования, модуль извлечения информации движения и модуль извлечения прогнозных выборок. Модуль определения режима прогнозирования может определять режим прогнозирования для текущего блока, модуль извлечения информации движения может извлекать информацию движения текущего блока, и модуль извлечения прогнозных выборок может извлекать прогнозные выборки текущего блока. Например, модуль взаимного прогнозирования оборудования кодирования может выполнять поиск блока, который является аналогичным текущему блоку в пределах предварительно определенной области (области поиска) опорных кадров, через оценку движения, и после этого модуль взаимного прогнозирования оборудования кодирования может извлекать опорный блок, имеющий минимальную разность относительно текущего блока либо имеющий разность относительно текущего блока, которая равна или ниже предварительно определенного опорного стандарта. На основе такой разности, индекс опорного кадра, указывающий опорный кадр, в котором расположен опорный блок, может извлекаться, и вектор движения может извлекаться на основе разности позиций между опорным блоком и текущим блоком. Оборудование кодирования может определять режим, который применяется к текущему блоку, из различных режимов прогнозирования. Оборудование кодирования может сравнивать функции затрат на искажение в зависимости от скорости передачи (RD) для различных режимов прогнозирования и определять оптимальный режим прогнозирования для текущего блока.

[114] Например, когда режим пропуска или режим объединения применяется к текущему блоку, оборудование кодирования конфигурирует список возможных вариантов объединения, и из опорных блоков, которые указываются посредством возможных вариантов объединения, включенных в список возможных вариантов объединения, опорный блок, имеющий минимальную разность относительно текущего блока либо имеющий разность относительно текущего блока, которая равна или ниже предварительно определенного опорного стандарта, может извлекаться. В этом случае, возможный вариант объединения, который ассоциирован с извлеченным опорным блоком, может выбираться, и информация индекса объединения, указывающая выбранный возможный вариант объединения, может формироваться и затем передаваться в служебных сигналах в оборудование декодирования. Информация движения текущего блока может извлекаться посредством использования информации движения выбранного возможного варианта объединения.

[115] В качестве другого примера, когда (A)MVP-режим применяется к текущему блоку, оборудование кодирования конфигурирует список возможных (A)MVP-вариантов, и вектор движения выбранного возможного варианта предиктора вектора движения (MVP), который выбирается из возможных MVP-вариантов, которые включаются в список возможных (A)MVP-вариантов, может использоваться в качестве MVP текущего блока. В этом случае, например, вектор движения, указывающий опорный блок, который извлекается посредством вышеописанной оценки движения, может использоваться в качестве вектора движения текущего блока, и из возможных MVP-вариантов, возможный MVP-вариант, имеющий вектор движения, который имеет наименьшую разность относительно вектора движения текущего блока, может представлять собой выбранный возможный MVP-вариант. Разность векторов движения (MVD), которая представляет собой разность, которая получается посредством вычитания MVP из вектора движения текущего блока, может извлекаться. В этом случае, информация, связанная с MVD, может передаваться в служебных сигналах в оборудование декодирования. Дополнительно, когда (A)MVP-режим применяется, значение индекса опорного кадра может быть сконфигурировано из информации индекса опорного кадра и может отдельно передаваться в служебных сигналах в оборудование декодирования.

[116] Оборудование кодирования может извлекать остаточные выборки на основе прогнозных выборок (S610). Оборудование кодирования может извлекать остаточные выборки посредством сравнения прогнозных выборок с исходными выборками текущего блока.

[117] Оборудование кодирования кодирует информацию изображений, включающую в себя информацию прогнозирования и остаточную информацию (S620). Оборудование кодирования может выводить кодированную информацию изображений в формате потока битов. Информация прогнозирования может представлять собой информацию, связанную с процедурой прогнозирования, которая может включать в себя информацию режима прогнозирования (например, флаг пропуска, флаг объединения или индекс режима и т.д.) и информацию, связанную с информацией движения. Информация, связанная с информацией движения, может включать в себя информацию выбора возможных вариантов (например, индекс объединения, MVP-флаг или MVP-индекс), которая представляет собой информацию для извлечения вектора движения. Дополнительно, информация, связанная с информацией движения, может включать в себя вышеописанную информацию относительно MVD и/или информацию индекса опорного кадра. Дополнительно, информация, связанная с информацией движения, может включать в себя информацию, указывающую то, применяется либо нет L0-прогнозирование, L1-прогнозирование или бипрогнозирование. Остаточная информация представляет собой информацию, связанную с остаточными выборками. Остаточная информация может включать в себя информацию, связанную с квантованными коэффициентами преобразования для остаточных выборок.

[118] Выводимый поток битов может сохраняться на (цифровом) носителе хранения данных и затем доставляться в оборудование декодирования, либо выводимый поток битов может доставляться в оборудование декодирования через сеть.

[119] Между тем, вышеописанное оборудование кодирования может формировать восстановленный кадр (включающий в себя восстановленные выборки и восстановленный блок) на основе опорных выборок и остаточных выборок. Это выполняется таким образом, что устройство кодирования может извлекать результат прогнозирования, который является идентичным результату прогнозирования, полученному посредством процедуры прогнозирования, выполняемой в оборудовании декодирования, а также поскольку эффективность кодирования может повышаться, соответственно. Следовательно, оборудование кодирования может сохранять восстановленный кадр (либо восстановленные выборки, восстановленный блок) в запоминающем устройстве и может использовать сохраненный кадр в качестве опорного кадра для взаимного прогнозирования. Как описано выше, процедура внутриконтурной фильтрации и т.п. дополнительно может применяться к восстановленному кадру.

[120] Процедура декодирования видео/изображений, которая основана на взаимном прогнозировании, в общем, может включать в себя, например, следующее.

[121] Фиг. 7 показывает пример способа декодирования видео/изображений на основе взаимного прогнозирования.

[122] Оборудование декодирования может выполнять операции, которые соответствуют операциям, выполняемым посредством оборудования кодирования. Оборудование декодирования может выполнять прогнозирование для текущего блока на основе принимаемой информации прогнозирования и может извлекать прогнозные выборки.

[123] Более конкретно, ссылаясь на фиг. 7, оборудование декодирования может определять режим прогнозирования для текущего блока на основе информации прогнозирования, принимаемой из потока битов (S700). Оборудование декодирования может определять то, какой режим взаимного прогнозирования применяется к текущему блоку, на основе информации режима прогнозирования в информации прогнозирования.

[124] Например, то, применяется или нет режим объединения к текущему блоку, либо то, определяется или нет (A)MVP-режим, может определяться на основе флага объединения. Альтернативно, один возможный вариант режима взаимного прогнозирования может выбираться, из различных возможных вариантов режимов взаимного прогнозирования, на основе индекса объединения. Возможные варианты режимов взаимного прогнозирования могут включать в себя различные режимы взаимного прогнозирования, к примеру, режим пропуска, режим объединения и/или (A)MVP-режим и т.д.

[125] Оборудование декодирования извлекает информацию движения текущего блока на основе определенного режима взаимного прогнозирования (S710). Например, когда режим пропуска или режим объединения применяется к текущему блоку, оборудование декодирования конфигурирует список возможных вариантов объединения, который подробно описывается ниже, и может выбирать один возможный вариант объединения из возможных вариантов объединения, включенных в список возможных вариантов объединения. Выбор может выполняться на основе вышеописанного индекса объединения. Информация движения текущего блока может извлекаться посредством использования информации движения выбранного возможного варианта объединения. Информация движения выбранного возможного варианта объединения может использоваться как информация движения текущего блока.

[126] В качестве другого примера, когда (A)MVP-режим применяется к текущему блоку, оборудование декодирования конфигурирует список возможных (A)MVP-вариантов, и вектор движения выбранного возможного варианта предиктора вектора движения (MVP), который выбирается из возможных MVP-вариантов, которые включаются в список возможных (A)MVP-вариантов, может использоваться в качестве MVP текущего блока. Выбор может выполняться на основе вышеописанной информации выбора (MVP-флага или MVP-индекса). Так же, в этом случае, MVD текущего блока может извлекаться на основе информации относительно MVD, и вектор движения текущего блока может извлекаться на основе MVP текущего блока и MVD. Дополнительно, индекс опорного кадра текущего блока может извлекаться на основе информации индекса опорного кадра. Кадр, который указывается посредством индекса опорного кадра в списке опорных кадров, связанном с текущим блоком, может извлекаться в качестве опорного кадра, на который ссылаются для взаимного прогнозирования текущего блока.

[127] Между тем, информация движения текущего блока может извлекаться без конфигурирования списков возможных вариантов, и, в этом случае, вышеописанное конфигурирование списка возможных вариантов может пропускаться.

[128] Оборудование декодирования может формировать прогнозные выборки для текущего блока на основе информации движения текущего блока (S720). В этом случае, оборудование декодирования может извлекать опорный кадр на основе индекса опорного кадра текущего блока, и после этого оборудование декодирования может извлекать прогнозные выборки текущего блока посредством использования выборок опорного блока, который указывается посредством вектора движения текущего блока в опорном кадре. В этом случае, из прогнозных выборок текущего блока, процедура фильтрации прогнозных выборок, которая подробнее описывается ниже, дополнительно может выполняться для всех или части прогнозных выборок текущего блока.

[129] Например, модуль взаимного прогнозирования оборудования декодирования может включать в себя модуль определения режима прогнозирования, модуль извлечения информации движения и модуль извлечения прогнозных выборок. Модуль определения режима прогнозирования может определять режим прогнозирования для текущего блока на основе принимаемой информации режима прогнозирования, модуль извлечения информации движения может извлекать информацию движения (вектор движения и/или индекс опорного кадра и т.д.) текущего блока на основе информации относительно принимаемой информации движения, и модуль извлечения прогнозных выборок может извлекать прогнозные выборки текущего блока.

[130] Оборудование декодирования формирует остаточные выборки для текущего блока на основе принимаемой остаточной информации (S730). Оборудование декодирования может формировать восстановленные выборки для текущего блока на основе прогнозных выборок и остаточных выборок и формировать восстановленный кадр на их основе (S740). После этого, как описано выше, процедура внутриконтурной фильтрации дополнительно может применяться к восстановленному кадру.

[131] Между тем, как описано выше, высокоуровневый синтаксис (HLS) может кодироваться/передаваться в служебных сигналах для кодирования видео/изображений. Кодированный кадр может быть сконфигурирован из одного или более срезов. Параметр, описывающий кодированный кадр, передается в служебных сигналах в заголовке кадра, и параметр, описывающий срез, передается в служебных сигналах в заголовке среза. Заголовок кадра переносится в собственном формате NAL-единиц. Так же, заголовок среза присутствует в начале (или в начальной точке) NAL-единицы, включающей в себя рабочие данные среза (т.е. данные срезов).

[132] Каждый кадр ассоциирован с заголовком кадра. Кадр может быть сконфигурирован из различных типов срезов (внутренне кодированного среза (т.е. I-среза) и взаимно кодированных срезов (т.е. P-среза и B-среза)). Следовательно, заголовок кадра может включать в себя синтаксические элементы, которые требуются во внутреннем срезе кадра и взаимном срезе кадра.

[133] Кадр может сегментироваться (или разделяться) на субкадры, плитки и/или срезы. Передача в служебных сигналах субкадров может присутствовать в наборе параметров последовательности (SPS). Так же, передача в служебных сигналах плиток и квадратных срезов может присутствовать в наборе параметров кадра (PPS). Передача в служебных сигналах срезов на основе растрового сканирования может присутствовать в заголовке среза.

[134] Например, относительно сегментации кадра, синтаксические элементы, показанные ниже в таблице 1, могут включаться в SPS-синтаксис.

[135] Табл. 1

[136] Синтаксические элементы, показанные ниже в таблице 2, могут включаться в PPS-синтаксис.

[137] Табл. 2

[138]

[139] В таблице 2, num_slices_in_tile_minus1[i]+1 указывает число срезов в текущей плитке, когда i-ый срез включает в себя поднабор CTU-строк в одной плитке. Значение num_slices_in_tile_minus1[i] должно находиться в пределах диапазона включительно от 0 до RowHeight[tileY]-1. В данном документе, tileY представляет собой индекс строки плиток, включающей в себя i-ый срез. Когда num_slices_in_tile_minus1[i] не присутствует в PPS, значение num_slices_in_tile_minus1[i] извлекается в качестве 0.

[140] slice_height_in_ctu_minus1[i]+1 указывает высоту i-ого прямоугольного среза в единицах CTU-строк, когда i-ый срез включает в себя поднабор CTU-строк в одной плитке. Значение slice_height_in_ctu_minus1[i] должно находиться в пределах диапазона включительно от 0 до RowHeight[tileY]-1. В данном документе, tileY представляет собой индекс строки плиток, включающей в себя i-ый срез.

[141] Синтаксические элементы, показанные ниже в таблице 3, могут включаться в синтаксис заголовков срезов.

[142] Табл. 3

[143] Ссылаясь на таблицы 1-3, в текущем проектном решении по плиткам и срезам, прямоугольный срез может включать в себя одну или более плиток. Альтернативно, прямоугольный срез может включать в себя целое число (или общее число) CTU-строк в одной плитке.

[144] Когда прямоугольный срез включает в себя целое число (или общее число) CTU-строк в одной плитке (это соответствует случаю, в котором плитка сегментируется на два или более срезов), в текущей передаче служебных сигналов, высота каждого среза явно передается в служебных сигналах. Тем не менее, этот тип передачи служебных сигналов не представляет собой оптимальный способ передачи служебных сигналов.

[145] Схема срезов в одной плитке может включать в себя случай, в котором высоты срезов в плитке являются равномерными за исключением последнего среза, и случай, в котором высоты срезов в плитке не являются равномерными. Когда высоты срезов в плитке являются равномерными за исключением последнего среза, поскольку высоты всех срезов за исключением последнего среза в плитке являются идентичными, только высота одного среза может просто передаваться в служебных сигналах без необходимости явно передавать в служебных сигналах высоту каждого среза. Когда высоты срезов в плитке не являются равномерными, высота каждого среза в плитке должна передаваться в служебных сигналах.

[146] Нижеприведенные чертежи проиллюстрированы для того, чтобы описывать подробный пример(ы) настоящего описания изобретения. Подробные термины оборудования (или устройства) или подробные термины сигнала(ов)/информации, указываемых на чертежах, являются просто примерными. Так же, в силу этого, технические характеристики настоящего описания изобретения не должны быть ограничены только подробными терминами, используемыми на нижеприведенных чертежах.

[147] Настоящее описание изобретения предоставляет следующие способы для того, чтобы разрешать вышеописанные проблемы. Пункты каждого способа могут применяться независимо либо могут применяться в комбинации.

[148] Например, когда одна плитка включает в себя два или более срезов, число высот срезов, явно передаваемых в служебных сигналах в CTU-строках, может передаваться в служебных сигналах. Это может называться "синтаксическим элементом num_exp_slice_in_tile". В этом случае, синтаксические элементы (массив slice_row_height_minus1) для индексов начиная с от 0 до num_exp_slice_in_tile-1 могут передаваться в служебных сигналах. Это может передаваться в служебных сигналах в качестве ue(v) или u(v), и число битов, передающих в служебных сигналах такие синтаксические элементы, может варьироваться в соответствии с числом CTU-строк в плитке. В данном документе, ue(v) представляет кодированный экспоненциальным кодом Голомба синтаксический элемент 0-ого порядка, и u(v) указывает то, что v битов используются, при этом значение v варьируется в соответствии со значением других синтаксических элементов.

[149] Высоте каждого среза начиная с первого среза до n-ого среза в плитке присваиваются значения slice_row_height_minus1+1 начиная с 0 до num_exp_slice_in_tile-1, соответственно. В данном документе, n равно числу срезов, явно передаваемых в служебных сигналах в плитке (num_exp_slice_in_tile).

[150] Хотя оставшиеся CTU-строки, которые больше num_exp_slice_in_tile_minus1+1 и (явно) передаются в служебных сигналах в последний раз в плитке, по-прежнему присутствуют, новый срез задается в плитке. Другими словами, срез(ы), который(е) явно не передается(ются) в служебных сигналах, присутствует(ют) в плитке. Последний срез может иметь высоту, которая равна или меньше num_exp_slice_in_tile_minus1+1, который в последний раз передан в служебных сигналах.

[151] В качестве другого примера, когда одна плитка включает в себя два или более срезов, число срезов, включаемых в плитку, может передаваться в служебных сигналах. В этом случае, флаг, указывающий то, являются или нет высоты каждого среза в плитке равномерными, может передаваться в служебных сигналах. Когда высоты каждого среза в плитке являются равномерными, только одна высота среза может передаваться в служебных сигналах из CTU-строк. Высота каждого среза в плитке может извлекаться на основе передаваемой в служебных сигналах высоты среза. Так же, когда высоты каждого среза в плитке не являются равномерными, высоты каждого среза за исключением последнего среза в плитке могут явно передаваться в служебных сигналах.

[152] В настоящем описании изобретения, информация относительно среза(ов) и/или плитки(ок) может включать в себя информационный элемент и/или синтаксический элемент(ы), раскрытые в таблицах 1-3. Информация изображений/видео может включать в себя высокоуровневый синтаксис (HLS), раскрытый в таблицах 1-3, и высокоуровневый синтаксис (HLS) может включать в себя информацию, связанную со срезом(ами), и/или информацию, связанную с плиткой(ками). Информация, связанная со срезом(ами), может включать в себя информацию, указывающую один или более срезов в пределах текущего кадра, и информация, связанная с плиткой(ками), может включать в себя информацию, указывающую одну или более плиток в пределах текущего кадра. Плитка, включающая в себя один или более срезов, и срез, включающий в себя одну или более плиток, могут присутствовать в кадре.

[153] В качестве варианта осуществления, чтобы представлять сегментированную структуру кадра, синтаксисы, показанные ниже в таблице 4, и семантика, показанная ниже в таблице 5, могут использоваться для PPS.

[154] Табл. 4

[155] Табл. 5

num_exp_slices_in_tile[i] плюс 1 указывает число exp_slice_height_in_ctu_minus1[j], присутствующих в PPS. Если не присутствуют, значение num_exp_slices_in_tile_minus1[i] логически выводится равным 0
exp_slice_height_in_ctu_minus1[j] плюс 1 указывает j-ую явно передаваемую в служебных сигналах высоту среза в единицах CTU-строк для случая, в котором i-ый срез содержит поднабор CTU-строк из одной плитки. Значение exp_slice_height_in_ctu_minus1[j] должно составлять в диапазоне от 0 до RowHeightp[tileY]-1, включительно, где tileY является индексом строки плиток, содержащим срезы.

[156] Ссылаясь на таблицу 4 и таблицу 5, num_exp_slices_in_tile[i]+1 представляет число exp_slice_height_in_ctu_minus1[j], присутствующих в PPS. Когда num_exp_slices_in_tile[i] не присутствует в PPS, значение num_exp_slices_in_tile_minus1[i] извлекается в качестве 0.

[157] exp_slice_height_in_ctu_minus1[j]+1 указывает высоту j-ого прямоугольного среза, явно передаваемого в служебных сигналах в единицах CTU-строк, когда i-ый срез включает в себя поднабор CTU-строк в одной плитке. Значение exp_slice_height_in_ctu_minus1[j] должно находиться в пределах диапазона включительно от 0 до RowHeight[tileY]-1. В данном документе, tileY представляет собой индекс строки плиток, включающей в себя срез.

[158] Таким образом, num_exp_slices_in_tile[i] может называться "информацией (информацией по числу)" относительно числа срезов, имеющих высоту, явно передаваемую в служебных сигналах в плитке текущего кадра. Так же, exp_slice_height_in_ctu_minus1[j] может называться "информацией (информацией высоты)" относительно высоты каждого среза, имеющего высоту, явно передаваемую в служебных сигналах.

[159] Информация по числу и информация высоты могут представлять собой кодированный экспоненциальным кодом Голомба синтаксический элемент.

[160] Информация по числу может синтаксически анализироваться на основе информации относительно ширины и высоты среза, включающего в себя плитку. Когда плитка включает в себя i-ый срез, информация ширины среза, включающего в себя плитку, может соответствовать синтаксическому элементу slice_width_in_tiles_minus1[i], и информация высоты среза, включающего в себя плитку, может соответствовать синтаксическому элементу slice_height_in_tiles_minus1[i]. I-ый срез может представлять собой прямоугольный срез, и срезы в плитке также могут сегментироваться на прямоугольные срезы.

[161] Например, оборудование кодирования может формировать информацию по числу и информацию высоты на основе информации относительно срезов текущего кадра. Информация по числу и информация высоты могут включаться в информацию изображений и передаваться в служебных сигналах в оборудование декодирования в формате потока битов.

[162] Когда информация по числу синтаксически анализируется из PPS, как показано в таблице 4, оборудование декодирования может синтаксически анализировать информацию высоты из PPS на основе информации по числу. Например, когда значение информации по числу равно n (при этом n является целым числом, равным или большим 0), оборудование декодирования может синтаксически анализировать информацию высоты на n срезов (начиная с нулевого среза до (n-1)-ого среза в плитке) из PPS. Информация высоты может указывать каждую из высоты нулевого среза - высоты (n-1)-ого среза в строках единиц дерева кодирования (CTU).

[163] После этого, оборудование декодирования может извлекать высоты оставшихся срезов в плитке на основе высоты (n-1)-ого среза. Более конкретно, оборудование декодирования может извлекать высоты оставшихся срезов за исключением последнего среза в плитке начиная с n-ого среза в плитке как равные более высокой для (n-1)-ого среза. Для этого, оборудование декодирования может сравнивать оставшуюся высоту плитки, которая вычисляется посредством вычитания суммы высот срезов начиная с нулевого среза до (n-1)-ого среза из общей высоты плитки, с тем чтобы определять то, равна или выше либо нет оставшаяся высота равномерной высоты среза. В данном документе, равномерный срез может означать срезы, имеющие равномерную высоту (идентичную высоту) в плитке. Таким образом, высота равномерного среза может быть идентичной высоте (n-1)-ого среза.

[164] Когда оставшаяся высота плитки равна или выше высоты равномерного среза, высота n-ого среза может извлекаться в качестве высоты равномерного среза. Так же, когда оставшаяся высота плитки меньше высоты равномерного среза, высота n-ого среза может извлекаться в качестве оставшейся высоты. Дополнительно, когда оставшаяся высота плитки равна или выше высоты равномерного среза, обновленная оставшаяся высота может извлекаться посредством вычитания высоты n-ого среза из оставшейся высоты. Так же, когда обновленная оставшаяся высота равна или выше высоты равномерного среза, оборудование декодирования может извлекать высоту (n+1)-ого среза в качестве высоты равномерного среза. Когда обновленная оставшаяся высота меньше высоты равномерного среза, оборудование декодирования может извлекать высоту высоты (n+1)-ого среза в качестве обновленной оставшейся высоты. Таким образом за исключением последнего среза в плитке, высота срезов начиная с n-ого среза до последнего среза может извлекаться в качестве равномерной высоты. Высота последнего среза может быть равной или меньшей высоты каждого равномерного среза (срезов начиная с (n-1)-ого среза до среза непосредственно перед последним срезом).

[165] В качестве примера, когда 5 срезов включаются в одну плитку, и когда информация по числу указывает 3, информация высоты для первого-третьего срезов в плитке может синтаксически анализироваться из PPS, и высота четвертого среза в плитке может извлекаться как имеющего высоту, идентичную высоте третьего среза. В этом случае, высота пятого среза может быть большей или меньшей высоты четвертого среза.

[166] Оборудование декодирования может извлекать число срезов в плитке посредством выполнения вышеописанной процедуры сканирования. Когда значение информации по числу больше 0, процедура извлечения информации относительно высоты каждого среза в плитке и информации относительно числа срезов в плитке может указываться так, как показано ниже в таблице 5.

[167] Табл. 6

Let tileHeight be equal to RowHeigh[tileY] - Пусть tileHeight равен RowHeigh[tileY] [168] В случае прямоугольного среза, список NumCtuInSlice[i] для i в диапазоне включительно от 0 до num_slices_in_pic_minus1 может указывать число CTU в i-ом срезе, матрица CtbAddrInSlice[i][j] для i в диапазоне включительно от 0 до num_slices_in_pic_minus1 и j в диапазоне включительно от 0 до numCtuInSlice[i]-1 указывает адрес растрового сканирования кадра j-ого CTB в i-ом срезе и может извлекаться так, как показано ниже в таблице 7.

[169] Табл. 7

[170] В качестве другого варианта осуществления, чтобы представлять сегментированную структуру кадра, синтаксисы, показанные ниже в таблице 8, и семантика, показанная ниже в таблице 9, могут использоваться для PPS.

[171] Табл. 8

[172] Табл. 9

uniform_slice_spacing_flag[i], равный 1, указывает то, CTU-строки распределяются равномерно по плитке, и передается в служебных сигналах с использованием синтаксических элементов slice_height_in_ctu_minus1[i]; uniform_slice_spacing_flag[i], равный 0, указывает то, CTU-строки могут или не могут распределяться равномерно по плитке и передается в служебных сигналах с использованием синтаксических элементов num_slices_in_tile_minus1[i] и slice_height_in_ctu_minus1[i] slice_rows_height_in_ctu_minus1[i] плюс 1 указывает число срезов текущей плитки для случая, в котором i-ый срез содержит поднабор CTU-строк из одной плитки, и uniform_slice_spacing_flag[i] равен 1. Значение slice_rows_height_in_ctu_minus1[i] должно составлять в диапазоне от 0 до RowHeight[tileY]-1, включительно, где tileY является индексом строки плиток, содержащим срезы.
num_slices_in_tile_minus1[i] плюс 1 указывает j-ую явно передаваемую в служебных сигналах высоту среза в единицах CTU-строк для случая, в котором i-ый срез содержит поднабор CTU-строк из одной плитки. Значение num_slices_in_tile_minus1[i] должно составлять в диапазоне от 0 до RowHeightp[tileY]-1, включительно, где tileY является индексом строки плиток, содержащим i-ый срез. Если не присутствует, значение num_slices_in_tile_minus1[i] логически выводится равным 0.
slice_height_in_ctu_minus1[j] плюс 1 указывает высоту i-го прямоугольного среза в единицах CTU-строк для случая, в котором i-ый срез содержит поднабор CTU-строк из одной плитки. Значение slice_height_in_ctu_minus1[j] должно составлять в диапазоне от 0 до RowHeightp[tileY]-1, включительно, где tileY является индексом строки плиток, содержащим i-ый срез.

[173] Ссылаясь на таблицу 8 и таблицу 9, если значение uniform_slice_spacing_flag[i] равно 1, оно указывает то, что CTU-строки равномерно распределяются (или рассеиваются) по всей плитке и передаются в служебных сигналах посредством использования синтаксических элементов uniform_slice_height_in_ctu_minus1[i]. Если значение uniform_slice_spacing_flag[i] равно 0, оно указывает то, что CTU-строки могут или не могут равномерно распределяться (или рассеиваться) по всей плитке и передаются в служебных сигналах посредством использования синтаксических элементов num_slices_in_tile_minus1[i] и slice_height_in_ctu_minus1[i].

[174] Когда значение uniform_slice_spacing_flag[i] равно 1, slice_rows_height_in_ctu_minus1[i]+1 указывает высоту срезов за исключением последнего среза плитки в единицах CTB. Значение slice_height_in_ctu_minus1[i] должно находиться в пределах диапазона включительно от 0 до RowHeight[tileY]-1. В данном документе, tileY представляет собой индекс строки плиток, включающей в себя срезы.

[175] num_slices_in_tile_minus1[i]+1 указывает число срезов в текущей плитке, когда i-ый срез включает в себя поднабор CTU-строк в одной плитке, и когда значение uniform_slice_spacing_flag[i] равно 0. Значение num_slices_in_tile_minus1[i] должно находиться в пределах диапазона включительно от 0 до RowHeight[tileY]-1. В данном документе, tileY представляет собой индекс строки плиток, включающей в себя i-ый срез. Когда num_slices_in_tile_minus1[i] не присутствует, значение num_slices_in_tile_minus1[i] извлекается в качестве 0.

[176] slice_height_in_ctu_minus1[i]+1 указывает высоту i-ого прямоугольного среза в единицах CTU-строк, когда i-ый срез включает в себя поднабор CTU-строк в одной плитке. Значение slice_height_in_ctu_minus1[i] должно находиться в пределах диапазона включительно от 0 до RowHeight[tileY]-1. В данном документе, tileY представляет собой индекс строки плиток, включающей в себя i-ый срез.

[177] Например, оборудование кодирования может формировать по меньшей мере один из uniform_slice_spacing_flag, slice_rows_height_in_ctu_minus1, num_slices_in_tile_minus1 и slice_height_in_ctu_minus1 на основе информации относительно срезов текущего кадра.

[178] Когда uniform_slice_spacing_flag синтаксически анализируется из PPS, как показано в таблице 8, оборудование декодирования может синтаксически анализировать slice_rows_height_in_ctu_minus1 или num_slices_in_tile_minus1 из PPS на основе значения uniform_slice_spacing_flag. Например, если значение uniform_slice_spacing_flag равно 1, оборудование декодирования может синтаксически анализировать slice_rows_height_in_ctu_minus1 из PPS и затем может извлекать синтаксически проанализированный результат в качестве высоты оставшихся срезов за исключением последнего среза в плитке на основе значения slice_rows_height_in_ctu_minus1. Если значение uniform_slice_spacing_flag равно 0, оборудование декодирования может синтаксически анализировать num_slices_in_tile_minus1 и slice_height_in_ctu_minus1 из PPS и может извлекать срезы в плитке на основе синтаксически проанализированного результата.

[179] Например, переменные NumSlicesInTileMinus1[i] и SliceHeightInCtuMinus1[i+k], которые связаны с информацией по числу и информацией высоты срезов в плитке, могут извлекаться так, как показано ниже. В данном документе, k может находиться в пределах диапазона включительно от 0 до numSlicesInTileMinus1[i].

[180] Табл. 10

[181] В случае прямоугольного среза, список NumCtuInSlice[i] для i в диапазоне включительно от 0 до num_slices_in_pic_minus1 может указывать число CTU в i-ом срезе, матрица CtbAddrInSlice[i][j] для i в диапазоне включительно от 0 до num_slices_in_pic_minus1 и j в диапазоне включительно от 0 до numCtuInSlice[i]-1 указывает адрес растрового сканирования кадра j-ого CTB в i-ом срезе и может извлекаться так, как показано ниже в таблице 11.

[182] Табл. 11

[183] Фиг. 8 и фиг. 9, соответственно, показывают общие примеры способа кодирования видео/изображений и связанного компонента согласно варианту осуществления настоящего раскрытия.

[184] Способ кодирования видео/изображений, раскрытый на фиг. 8, может выполняться посредством оборудования 200 кодирования (видео/изображений), которое раскрывается на фиг. 2 и фиг. 9. Более конкретно, например, S800 по фиг. 8 может выполняться посредством модуля 210 сегментации изображений оборудования 200 кодирования, и S810 может выполняться посредством модуля 220 прогнозирования оборудования 200 кодирования. S820 может выполняться посредством остаточного процессора 230 оборудования 200 кодирования. Так же, S830 и S840 могут выполняться посредством энтропийного кодера 240 оборудования 200 кодирования. Способ кодирования видео/изображений, раскрытый на фиг. 8, может включать в себя варианты осуществления, которые описываются выше в настоящем описании изобретения.

[185] Более конкретно, ссылаясь на фиг. 8 и фиг. 9, модуль 210 сегментации изображений оборудования кодирования может извлекать срезы в плитке текущего кадра (S800). Например, модуль 210 сегментации изображений может сегментировать входное изображение (или кадр, кинокадр) на одну или более CU. Входное изображение может включать в себя один или более кадров. Кадр может сегментироваться на одну или более плиток, кирпичей, срезов и/или групп плиток. Срез может включать в себя один или более кирпичей, плиток и/или групп плиток. Кирпич может включать в себя одну или более CTU-строк. Группа плиток может включать в себя одну или более плиток. Плитка может включать в себя одну или более CTU. CTU может сегментироваться на одну или более CU. Когда конкретный срез в пределах текущего кадра представляет собой прямоугольный срез, модуль 210 сегментации изображений может сегментировать прямоугольный срез на множество плиток, и из множества плиток, модуль 210 сегментации изображений может сегментировать по меньшей мере одну плитку и затем извлекать множество прямоугольных срезов.

[186] Модуль 220 прогнозирования оборудования кодирования может выполнять по меньшей мере одно из внутреннего прогнозирования или взаимного прогнозирования для текущего блока на основе срезов, которые извлекаются в модуле 210 сегментации изображений, и затем может формировать прогнозные выборки (блок прогнозирования) и связанную с прогнозированием информацию текущего блока (S810). Модуль 220 прогнозирования может определять то, применяется или нет внутреннее прогнозирование, либо то, применяется или нет взаимное прогнозирование в текущем блоке или единицах CU. Модуль 220 прогнозирования может доставлять разнообразную информацию, связанную с прогнозированием (связанную с прогнозированием информацию), в энтропийный кодер 240. В данном документе, связанная с прогнозированием информация может включать в себя информацию, связанную с режимом взаимного прогнозирования, и информацию, связанную с режимом внутреннего прогнозирования. Когда режим прогнозирования текущего блока представляет собой режим взаимного прогнозирования, прогнозные выборки могут формироваться в модуле 221 взаимного прогнозирования модуля 220 прогнозирования. Так же, когда режим прогнозирования текущего блока представляет собой режим внутреннего прогнозирования, прогнозные выборки могут формироваться в модуле 222 внутреннего прогнозирования модуля 220 прогнозирования.

[187] Остаточный процессор 230 оборудования кодирования может формировать остаточные выборки и остаточную информацию на основе прогнозных выборок, сформированных из модуля 220 прогнозирования, и исходного кадра (исходного блока, исходных выборок) (S820). В данном документе, остаточная информация представляет собой информацию, связанную с остаточными выборками, и остаточная информация может включать в себя информацию, связанную с (квантованными) коэффициентами преобразования для остаточных выборок.

[188] Сумматор (или модуль восстановления) оборудования кодирования может формировать восстановленные выборки (восстановленный кадр, восстановленный блок, массив восстановленных выборок) посредством суммирования остаточных выборок, которые формируются в остаточном процессоре 230, и прогнозных выборок, которые формируются в модуле 221 взаимного прогнозирования или модуле 222 внутреннего прогнозирования.

[189] Энтропийный кодер 240 оборудования кодирования может формировать информацию, связанную с сегментацией на основе структуры сегментации, которая извлекается в модуле 210 сегментации изображений. Связанная с сегментацией информация может включать в себя информацию (информацию по числу) относительно числа срезов, каждый из которых имеет высоту, явно передаваемую в служебных сигналах в плитке, и информацию (информацию высоты) относительно высоты срезов, каждый из которых имеет высоту, явно передаваемую в служебных сигналах. Например, энтропийный кодер 240 может формировать информацию по числу, связанную с числом срезов, каждый из которых имеет высоту, явно передаваемую в служебных сигналах (предоставленную) в плитке, и информацию высоты, связанную с высотой срезов, каждый из которых имеет высоту, явно передаваемую в служебных сигналах (предоставленную) на основе срезов, которые извлекаются в модуле 210 сегментации изображений (S830). В данном документе, информация по числу может включать в себя вышеописанный синтаксический элемент(ы) num_exp_slices_in_tile и/или num_slices_in_tile_minus1. Информация высоты может включать в себя вышеописанный синтаксический элемент(ы) exp_slice_height_in_ctu_minus1, slice_rows_height_in_ctu_minus1 и/или slice_height_in_ctu_minus1.

[190] Энтропийный кодер 240 может кодировать информацию изображений, включающую в себя связанную с сегментацией информацию, которая включает в себя информацию по числу и информацию высоты, связанную с прогнозированием информацию, которая формируется в модуле 220 прогнозирования, и/или остаточную информацию, которая формируется в остаточном процессоре 230 (S840). Информация, которая кодируется в энтропийном кодере 240, может выводиться в формате потока битов. Поток битов может передаваться в оборудование декодирования через сеть или носитель хранения данных.

[191] Например, энтропийный кодер 240 может включать в себя информацию изображений, которая включает в себя синтаксический элемент num_exp_slices_in_tile в качестве информации по числу и синтаксический элемент exp_slice_height_in_ctu_minus1 в качестве информации высоты на основе вышеописанной таблицы 4 и таблицы 5. Информация высоты может указывать высоту срезов, каждый из которых имеет высоту, явно передаваемую в служебных сигналах в плитке в единицах CTU-строк, и, для этого, информация высоты может включать в себя синтаксические элементы для срезов, каждый из которых имеет высоту, явно передаваемую в служебных сигналах. Число синтаксических элементов, включаемых в информацию изображений, может быть идентичным значению информации по числу.

[192] В качестве другого примера, энтропийный кодер 240 может кодировать информацию изображений, включающую в себя синтаксические элементы uniform_slice_spacing_flag, num_slices_in_tile_minus1, slice_rows_height_in_ctu_minus1 и/или slice_height_in_ctu_minus1 на основе вышеописанной таблицы 8 и таблицы 9. Синтаксические элементы num_slices_in_tile_minus1, slice_rows_height_in_ctu_minus1 и slice_height_in_ctu_minus1 могут включаться или могут не включаться в информацию изображений на основе значения uniform_slice_spacing_flag.

[193] Энтропийный кодер 240 может передавать в служебных сигналах информацию по числу и информацию высоты через набор параметров кадра (PPS) в информации изображений. В этом случае, энтропийный кодер 240 может включать в себя информацию по числу и/или информацию высоты посредством использования способа кодирования экспоненциальным кодом Голомба.

[194] Фиг. 10 и фиг. 11, соответственно, показывают общие примеры способа декодирования видео/изображений и связанного компонента согласно варианту осуществления настоящего раскрытия.

[195] Способ декодирования видео/изображений, раскрытый на фиг. 10, может осуществляться посредством оборудования 300 декодирования (видео/изображений), которое раскрывается на фиг. 3 и фиг. 11. Более конкретно, например, S1000-S1020 по фиг. 10 могут выполняться посредством энтропийного декодера 310 оборудования декодирования. S1030 по фиг. 10 может выполняться посредством модуля 330 прогнозирования оборудования декодирования. Так же, S1040 по фиг. 10 может выполняться посредством сумматора 340 оборудования декодирования. Способ декодирования видео/изображений, раскрытый на фиг. 10, может включать в себя варианты осуществления, которые описываются выше в настоящем описании изобретения.

[196] Ссылаясь на фиг. 10 и фиг. 11, энтропийный декодер 310 оборудования декодирования может получать связанную с сегментацией информацию, остаточную информацию, связанную с прогнозированием информацию (информацию дифференцирования взаимного/внутреннего прогнозирования, информацию режима внутреннего прогнозирования, информацию режима взаимного прогнозирования и т.д.), связанную с внутриконтурной фильтрацией информацию и т.д., из потока битов. В данном документе, связанная с сегментацией информация может включать в себя информацию (информацию по числу) относительно числа срезов, каждый из которых имеет высоту, явно передаваемую в служебных сигналах, из срезов в плитке текущего кадра, информацию (информацию высоты) относительно высоты срезов, каждый из которых имеет высоту, явно передаваемую в служебных сигналах и т.д.

[197] Например, энтропийный декодер 310 может синтаксически анализировать информацию (информацию по числу), связанную с числом срезов, каждый из которых имеет высоту, явно передаваемую в служебных сигналах, из срезов в плитке текущего кадра, из потока битов (S1000), и может синтаксически анализировать информацию (информацию высоты), связанную с высотой срезов, каждый из которых имеет высоту, явно передаваемую в служебных сигналах из потока битов на основе информации по числу (S1010). Более конкретно, энтропийный декодер 310 может синтаксически анализировать информацию по числу и информацию высоты из набора параметров кадра (PPS) потока битов на основе вышеописанной таблицы 4. В данном документе, информация по числу может синтаксически анализироваться на основе информации относительно ширины и высоты среза, включающего в себя плитку. В этот момент, срез, включающий в себя плитку и/или срезы в плитке, может представлять собой прямоугольный срез(ы). Информация по числу и информация высоты могут представлять собой кодированные экспоненциальным кодом Голомба синтаксические элементы. Информация высоты может включать в себя синтаксические элементы для каждого среза, имеющего высоту, явно передаваемую в служебных сигналах. Число синтаксических элементов может быть идентичным значению информации по числу.

[198] Например, энтропийный декодер 310 может синтаксически анализировать синтаксические элементы slice_width_in_tiles_minus1 и slice_height_in_tiles_minus1 из набора параметров кадра (PPS) на основе таблицы 4, и энтропийный декодер 310 может синтаксически анализировать синтаксический элемент num_exp_slices_in_tile из набора параметров кадра (PPS) на основе значений синтаксических элементов slice_width_in_tiles_minus1 и slice_height_in_tiles_minus1. Так же, энтропийный декодер 310 может синтаксически анализировать число exp_slice_height_in_ctu_minus1, которое является эквивалентным значению синтаксического элемента num_exp_slices_in_tile из набора параметров кадра (PPS).

[199] Когда значение информации по числу равно n, энтропийный декодер 310 может извлекать высоты нулевого среза - (n-1)-ого среза в плитке на основе информации высоты. Так же, энтропийный декодер 310 может извлекать высоту n-ого среза в плитке на основе высоты (n-1)-ого среза. Таким образом, высота n-ого среза может извлекаться как идентичная высоте (n-1)-ого среза. В данном документе, n-ый срез может не представлять собой последний срез в плитке. Другими словами, энтропийный декодер 310 может извлекать высоты оставшихся срезов (срезов, которые явно не передаются в служебных сигналах) за исключением последнего среза в плитке как имеющие высоту, идентичную высоте (n-1)-ого среза. Следовательно, высоты срезов начиная с n-ого среза до последнего среза в плитке могут быть равномерными за исключением последнего среза в плитке. Энтропийный декодер 310 может извлекать высоту последнего среза в плитке на основе оставшейся высоты после вычитания высот других срезов в плитке из высоты плитки. Когда высоты всех срезов в плитке извлекаются, энтропийный декодер 310 может извлекать число срезов в плитке (S1020). В данном документе, число срезов в плитке может соответствовать числу срезов начиная с нулевого среза до последнего среза в плитке.

[200] Оборудование 300 декодирования может декодировать текущий кадр на основе информации по числу, информации высоты и т.д. Более конкретно, остаточный процессор 320 оборудования декодирования может формировать остаточные выборки на основе остаточной информации, которая получается из энтропийного декодера 310. Модуль 330 прогнозирования оборудования декодирования может выполнять взаимное прогнозирование и/или внутреннее прогнозирование для текущего блока, который включается в срезы в кадре, на основе связанной с прогнозированием информации, которая получается из энтропийного декодера 310 с тем чтобы формировать прогнозные выборки (S1030). Сумматор 340 оборудования декодирования может формировать восстановленные выборки на основе прогнозных выборок, которые формируются в модуле 330 прогнозирования, и остаточных выборок, которые формируются в остаточном процессоре 320 (S1040). Так же, сумматор 340 оборудования декодирования может формировать восстановленный кадр (восстановленный блок) на основе восстановленных выборок.

[201] После этого, процедура внутриконтурной фильтрации, такая как процедуры фильтрации для удаления блочности, SAO-процедуры и/или ALF-процедуры, может применяться к восстановленному кадру по мере необходимости, чтобы повышать субъективное/объективное качество кадров.

[202] Между тем, в качестве другого примера, энтропийный декодер 310 может синтаксически анализировать синтаксические элементы slice_width_in_tiles_minus1 и slice_height_in_tiles_minus1 из набора параметров кадра (PPS) потока битов на основе таблицы 8, и энтропийный декодер 310 может синтаксически анализировать синтаксический элемент uniform_slice_spacing_flag из набора параметров кадра (PPS) на основе значений синтаксических элементов slice_width_in_tiles_minus1 и slice_height_in_tiles_minus1. В этом случае, энтропийный декодер 310 может синтаксически анализировать синтаксический элемент slice_rows_height_in_ctu_minus1 или синтаксически анализировать синтаксический элемент num_slices_in_tile_minus1 из набора параметров кадра (PPS) на основе значения синтаксического элемента uniform_slice_spacing_flag. Синтаксический элемент slice_rows_height_in_ctu_minus1 может синтаксически анализироваться, когда значение синтаксического элемента uniform_slice_spacing_flag равно 1, и синтаксический элемент num_slices_in_tile_minus1 может синтаксически анализироваться, когда значение синтаксического элемента uniform_slice_spacing_flag равно 0.

[203] Когда синтаксический элемент slice_rows_height_in_ctu_minus1 синтаксически анализируется, энтропийный декодер 310 может извлекать высоты оставшихся срезов за исключением последнего среза в плитке в качестве значения slice_rows_height_in_ctu_minus1.

[204] Когда синтаксический элемент num_slices_in_tile_minus1 синтаксически анализируется, энтропийный декодер 310 может синтаксически анализировать число синтаксического элемента slice_height_in_ctu_minus1, соответствующее значению синтаксического элемента num_slices_in_tile_minus1, и значения могут извлекаться в качестве высот каждого среза в плитке, соответственно.

[205] Хотя способы описываются на основе блок-схемы последовательности операций способа, на которой этапы или блоки перечисляются в последовательности в вышеописанных вариантах осуществления, этапы настоящего документа не ограничены определенным порядком, и определенный этап может выполняться на другом этапе или в другом порядке либо одновременно относительно того, что описано выше. Дополнительно, специалисты в данной области техники должны понимать, что этапы блок-схем последовательности операций способа не являются единственно возможными, и другой этап может включаться, либо один или более этапов на блок-схеме последовательности операций способа могут удаляться без влияния на объем настоящего документа.

[206] Вышеуказанный способ согласно настоящему документу может осуществляться в форме программного обеспечения, и оборудование кодирования и/или оборудование декодирования согласно настоящему документу могут включаться в устройство для выполнения обработки изображений, например, в телевизор, компьютер, смартфон, абонентскую приставку, устройство отображения и т.п.

[207] Когда варианты осуществления настоящего документу реализуются посредством программного обеспечения, вышеуказанный способ может реализовываться посредством модуля (процесса или функции), который выполняет вышеуказанную функцию. Модуль может сохраняться в запоминающем устройстве и выполняться посредством процессора. Запоминающее устройство может устанавливаться внутри или снаружи процессора и может соединяться с процессором через различные известные средства. Процессор может включать в себя специализированную интегральную схему (ASIC), другие наборы микросхем, логическую схему и/или устройство обработки данных. Запоминающее устройство может включать в себя постоянное запоминающее устройство (ROM), оперативное запоминающее устройство (RAM), флэш-память, карту памяти, носитель хранения данных и/или другое устройство хранения данных. Другими словами, варианты осуществления согласно настоящему документу могут реализовываться и выполняться на процессоре, микропроцессоре, контроллере или микросхеме. Например, функциональные модули, проиллюстрированные на соответствующих чертежах, могут реализовываться и выполняться на компьютере, процессоре, микропроцессоре, контроллере или микросхеме. В этом случае, информация относительно реализации (например, информация относительно инструкций) или алгоритмы могут сохраняться на цифровом носителе хранения данных.

[208] Помимо этого, оборудование декодирования и оборудование кодирования, к которым применяется вариант(ы) осуществления настоящего документа, могут включаться в широковещательное мультимедийное приемо-передающее устройство, терминал мобильной связи, видеоустройство системы домашнего кинотеатра, видеоустройство системы цифрового кинотеатра, камеру наблюдения, устройство проведения видеочатов и устройство связи в реальном времени, к примеру, видеосвязи, мобильное устройство потоковой передачи, носитель хранения данных, записывающую видеокамеру, поставщик услуг на основе технологии "видео по запросу (VoD)", видеоустройство поверх сетей (OTT), поставщик услуг потоковой передачи по Интернету, трехмерное видеоустройство, устройство в стиле виртуальной реальности (VR), устройство в стиле дополненной реальности (AR), телефонное видеоустройство, терминал в транспортном средстве (например, терминал в транспортном средстве (в том числе в автономном транспортном средстве), терминал в воздушном судне или терминал в морском судне) и медицинское видеоустройство; и могут использоваться для того, чтобы обрабатывать сигнал изображения или данные. Например, OTT-видеоустройство может включать в себя игровую консоль, Blu-Ray-проигрыватель, телевизор с доступом в Интернет, систему домашнего кинотеатра, смартфон, планшетный PC и цифровое записывающее видеоустройство (DVR).

[209] Помимо этого, способ обработки, к которому применяется вариант(ы) осуществления настоящего документа, может формироваться в форме программы, выполняемой посредством компьютера, и может сохраняться на компьютерно-читаемом носителе записи. Мультимедийные данные, имеющие структуру данных согласно варианту(ам) осуществления настоящего документа, также могут сохраняться на компьютерно-читаемом носителе записи. Компьютерно-читаемый носитель записи включает в себя все виды устройств хранения данных и устройств распределенного хранения данных, на которых сохраняются компьютерно-читаемые данные. Компьютерно-читаемый носитель записи может включать в себя, например, Blu-Ray-диск (BD), универсальную последовательную шину (USB), ROM, PROM, EPROM, EEPROM, RAM, CD-ROM, магнитную ленту, гибкий диск и оптическое устройство хранения данных. Компьютерно-читаемый носитель записи также включает в себя среды, осуществленные в форме несущей волны (например, передачи по Интернету). Помимо этого, поток битов, сформированный посредством способа кодирования, может сохраняться на компьютерно-читаемом носителе записи или передаваться через сеть проводной или беспроводной связи.

[210] Помимо этого, вариант(ы) осуществления настоящего документа может осуществляться в качестве компьютерного программного продукта на основе программного кода, и программный код может выполняться на компьютере согласно варианту(ам) осуществления настоящего документа. Программный код может сохраняться на компьютерно-читаемом носителе.

[211] Фиг. 12 представляет пример системы потоковой передачи контента, к которой может применяться вариант осуществления настоящего документа.

[212] Ссылаясь на фиг. 12, система потоковой передачи контента, к которой применяются варианты осуществления настоящего документа, в общем, может включать в себя сервер кодирования, потоковый сервер, веб-сервер, хранилище мультимедиа, пользовательское устройство и устройство ввода мультимедиа.

[213] Сервер кодирования функционирует для того, чтобы сжимать в цифровые данные контент, вводимый из устройств ввода мультимедиа, таких как смартфон, камера, записывающая видеокамера и т.п., чтобы формировать поток битов и передавать его на потоковый сервер. В качестве другого примера, в случае, в котором устройство ввода мультимедиа, такое как смартфон, камера, записывающая видеокамера и т.п., непосредственно формирует поток битов, сервер кодирования может опускаться.

[214] Поток битов может формироваться посредством способа кодирования или способа формирования потоков битов, к которому применяются варианты осуществления настоящего документа. Кроме того, потоковый сервер может временно сохранять поток битов в процессе передачи или приема потока битов.

[215] Потоковый сервер передает мультимедийные данные в абонентское устройство на основе запроса пользователя через веб-сервер, который функционирует в качестве инструментария, который информирует пользователя в отношении того, какая услуга предусмотрена. Когда пользователь запрашивает услугу, которую пользователь хочет, веб-сервер передает запрос на потоковый сервер, и потоковый сервер передает мультимедийные данные пользователю. В этом отношении, система потоковой передачи контента может включать в себя отдельный сервер управления, и в этом случае, сервер управления функционирует для того, чтобы управлять командами/ответами между соответствующим оборудованием в системе потоковой передачи контента.

[216] Потоковый сервер может принимать контент из хранилища мультимедиа и/или сервера кодирования. Например, в случае если контент принимается из сервера кодирования, контент может приниматься в реальном времени. В этом случае, потоковый сервер может сохранять поток битов в течение предварительно определенного периода времени, чтобы плавно предоставлять услугу потоковой передачи.

[217] Например, абонентское устройство может включать в себя мобильный телефон, смартфон, переносной компьютер, цифровой широковещательный терминал, персональное цифровое устройство (PDA), портативный мультимедийный проигрыватель (PMP), навигационное устройство, грифельный планшетный PC, планшетный PC, ультрабук, носимое устройство (например, терминал в виде часов (интеллектуальные часы), терминал в виде очков (интеллектуальные очки), наголовный дисплей (HMD)), цифровой телевизор, настольный компьютер, систему цифровых информационных табло и т.п.

[218] Каждый из серверов в системе потоковой передачи контента может работать в качестве распределенного сервера, и в этом случае, данные, принимаемые посредством каждого сервера, могут обрабатываться распределенным способом.

Похожие патенты RU2800595C1

название год авторы номер документа
КОНФИГУРАЦИЯ СРЕЗОВ И ПЛИТОК ДЛЯ КОДИРОВАНИЯ ИЗОБРАЖЕНИЙ/ВИДЕО 2020
  • Хендри, Хендри
  • Палури, Сеетхал
  • Ким, Сеунгхван
RU2800596C1
СПОСОБ И УСТРОЙСТВО КОДИРОВАНИЯ/ДЕКОДИРОВАНИЯ ИЗОБРАЖЕНИЙ С ИСПОЛЬЗОВАНИЕМ АДАПТИВНОГО ПРЕОБРАЗОВАНИЯ ЦВЕТОВ И СПОСОБ ДЛЯ ПЕРЕДАЧИ ПОТОКА БИТОВ 2020
  • Чжао, Цзе
  • Ким, Сеунг Хван
  • Хендри, Хендри
  • Палури, Сеетхал
RU2811759C2
СПОСОБ И УСТРОЙСТВО КОДИРОВАНИЯ/ДЕКОДИРОВАНИЯ ИЗОБРАЖЕНИЙ НА ОСНОВЕ СМЕШАННОГО ТИПА NAL-ЕДИНИЦЫ И СПОСОБ ДЛЯ ПЕРЕДАЧИ ПОТОКА БИТОВ 2021
  • Хендри, Хендри
RU2812029C2
СПОСОБ И ОБОРУДОВАНИЕ КОДИРОВАНИЯ/ДЕКОДИРОВАНИЯ ИЗОБРАЖЕНИЙ ДЛЯ ВЫПОЛНЕНИЯ ВНУТРИКОНТУРНОЙ ФИЛЬТРАЦИИ НА ОСНОВЕ СТРУКТУРЫ СУБКАДРА И СПОСОБ ДЛЯ ПЕРЕДАЧИ ПОТОКА БИТОВ 2020
  • Чан, Хён Мун
  • Палури, Сеетхал
  • Хендри, Хендри
  • Нам, Джун Хак
RU2801265C1
СПОСОБ И УСТРОЙСТВО КОДИРОВАНИЯ/ДЕКОДИРОВАНИЯ ИЗОБРАЖЕНИЙ НА ОСНОВЕ СМЕШАННОГО ТИПА NAL-ЕДИНИЦЫ И СПОСОБ ДЛЯ ПЕРЕДАЧИ ПОТОКА БИТОВ 2021
  • Хендри, Хендри
RU2806784C1
СПОСОБ И ОБОРУДОВАНИЕ КОДИРОВАНИЯ/ДЕКОДИРОВАНИЯ ИЗОБРАЖЕНИЙ ДЛЯ ВЫПОЛНЕНИЯ ВНУТРИКОНТУРНОЙ ФИЛЬТРАЦИИ НА ОСНОВЕ СТРУКТУРЫ СУБКАДРА И СПОСОБ ДЛЯ ПЕРЕДАЧИ ПОТОКА БИТОВ 2020
  • Чан, Хён Мун
  • Палури, Сеетхал
  • Хендри, Хендри
  • Нам, Джун Хак
RU2815430C2
СПОСОБ И УСТРОЙСТВО КОДИРОВАНИЯ/ДЕКОДИРОВАНИЯ ИЗОБРАЖЕНИЙ С ИСПОЛЬЗОВАНИЕМ АДАПТИВНОГО ПРЕОБРАЗОВАНИЯ ЦВЕТОВ И СПОСОБ ДЛЯ ПЕРЕДАЧИ ПОТОКА БИТОВ 2020
  • Чжао, Цзе
  • Ким, Сеунг Хван
  • Хендри, Хендри
  • Палури, Сеетхал
RU2795812C1
СПОСОБ И ОБОРУДОВАНИЕ КОДИРОВАНИЯ/ДЕКОДИРОВАНИЯ ИЗОБРАЖЕНИЙ С ИСПОЛЬЗОВАНИЕМ МАТРИЦЫ КВАНТОВАНИЯ И СПОСОБ ДЛЯ ПЕРЕДАЧИ ПОТОКА БИТОВ 2020
  • Чан, Хён Мун
  • Ким, Сеунг Хван
RU2795473C1
СПОСОБ И ОБОРУДОВАНИЕ КОДИРОВАНИЯ/ДЕКОДИРОВАНИЯ ИЗОБРАЖЕНИЙ С ИСПОЛЬЗОВАНИЕМ МАТРИЦЫ КВАНТОВАНИЯ И СПОСОБ ДЛЯ ПЕРЕДАЧИ ПОТОКА БИТОВ 2020
  • Чан, Хён Мун
  • Ким, Сеунг Хван
RU2809033C2
КОДИРОВАНИЕ ВИДЕО ИЛИ ИЗОБРАЖЕНИЙ НА ОСНОВЕ ПРЕОБРАЗОВАНИЯ СИГНАЛА ЯРКОСТИ С МАСШТАБИРОВАНИЕМ СИГНАЛА ЦВЕТНОСТИ 2020
  • Ким, Сеунгхван
  • Палури, Сеетхал
RU2783334C1

Иллюстрации к изобретению RU 2 800 595 C1

Реферат патента 2023 года СПОСОБ И ОБОРУДОВАНИЕ КОДИРОВАНИЯ ИЗОБРАЖЕНИЙ/ВИДЕО

Изобретение относится области кодирования и декодирования изображения/видео. Техническим результатом является повышение эффективности декодирования изображения/видео. Предложен способ декодирования видео, содержащий этапы: синтаксического анализа, из потока битов, информации по числу относительно числа срезов, имеющего высоты, в частности, передаваемые в служебных сигналах в плитке текущего кадра; на основе информации по числу, синтаксического анализа, из потока битов, информации высоты относительно высот срезов, имеющих конкретно передаваемые в служебных сигналах высоты; извлечения числа срезов в плитке на основе информации по числу и информации высоты; формирования прогнозных выборок посредством выполнения по меньшей мере одного из внутреннего прогнозирования и взаимного прогнозирования для текущего блока текущего кадра на основе срезов в плитке; и формирования восстановленных выборок на основе прогнозных выборок. 3 н. и 10 з.п. ф-лы, 12 ил.

Формула изобретения RU 2 800 595 C1

1. Способ декодирования видео, осуществляемый посредством оборудования декодирования видео, при этом способ содержит этапы, на которых:

- синтаксически анализируют информацию по числу, связанную с числом конкретных срезов, каждый из которых имеет высоту, явно передаваемую в служебных сигналах в плитке текущего кадра, из потока битов;

- синтаксически анализируют информацию высоты, связанную с высотами конкретных срезов, каждый из которых имеет высоту, явно передаваемую в служебных сигналах, из потока битов на основе информации по числу;

- извлекают число срезов в плитке на основе информации по числу и информации высоты;

- формируют прогнозные выборки посредством выполнения по меньшей мере одного из внутреннего прогнозирования или взаимного прогнозирования для текущего блока текущего кадра на основе по меньшей мере одного из срезов в плитке; и

- формируют восстановленные выборки на основе прогнозных выборок,

при этом информация высоты включает в себя идентичное число синтаксических элементов в качестве числа конкретных срезов,

при этом на основе числа конкретных срезов, равного n, высоты от нулевого среза до (n-1)-го среза в плитке извлекаются на основе синтаксических элементов,

при этом высота n-го среза в плитке извлекается на основе высоты (n-1)-го среза,

при этом высота последнего среза в плитке извлекается на основе оставшейся высоты после вычитания высот других срезов в плитке из высоты плитки, и

при этом синтаксический элемент в информации высоты представляет высоту одного из конкретных срезов в единицах CTU-строк.

2. Способ декодирования видео по п. 1, в котором число срезов в плитке равно числу срезов начиная с нулевого среза до последнего среза.

3. Способ декодирования видео по п. 1, в котором высота n-го среза извлекается как идентичная высоте (n-1)-го среза.

4. Способ декодирования видео по п. 1, в котором высоты срезов начиная с n-го среза до среза непосредственно перед последним срезом в плитке являются равномерными.

5. Способ декодирования видео по п. 4, в котором высота последнего среза меньше или равна высоте (n-1)-го среза.

6. Способ декодирования видео по п. 1, дополнительно содержащий этап, на котором:

- сравнивают оставшуюся высоту плитки, которая вычисляется посредством вычитания суммы высот срезов начиная с нулевого среза до (n-1)-го среза из общей высоты плитки, с тем чтобы определять то, действительно ли оставшаяся высота равна или выше высоты равномерного среза,

при этом высота равномерного среза является идентичной высоте (n-1)-го среза,

при этом на основе оставшейся высоты плитки, которая вычисляется посредством вычитания суммы высот срезов начиная с нулевого среза до (n-1)-го среза из общей высоты плитки, равной или большей высоты равномерного среза, извлекается n-й срез, имеющий высоту равномерного срез, и

при этом на основе оставшейся высоты плитки, которая вычисляется посредством вычитания суммы высот срезов начиная с нулевого среза до (n-1)-го среза из общей высоты плитки, меньшей высоты равномерного среза, извлекается n-й срез, имеющий оставшуюся высоту.

7. Способ декодирования видео по п. 6, в котором на основе оставшейся высоты, равной или большей высоты равномерного среза, извлекается обновленная оставшаяся высота, при этом обновленная оставшаяся высота обновляется посредством вычитания высоты n-го среза из оставшейся высоты плитки, которая вычисляется посредством вычитания суммы высот срезов начиная с нулевого среза до (n-1)-го среза из общей высоты плитки,

при этом на основе обновленной оставшейся высоты, равной или большей высоты равномерного среза, извлекается (n+1)-й срез, имеющий высоту равномерного среза, и

при этом на основе на основе обновленной оставшейся высоты, меньшей высоты равномерного среза, извлекается (n+1)-й срез, имеющий обновленную оставшуюся высоту.

8. Способ декодирования видео по п. 1, в котором информация по числу и информация высоты включает в себя кодированный экспоненциальным кодом Голомба синтаксический элемент.

9. Способ декодирования видео по п. 1, в котором информация по числу включает в себя синтаксический элемент num_exp_slices_in_tile, и

- при этом информация высоты включает в себя синтаксический элемент exp_slice_height_in_ctu_minus1.

10. Способ декодирования видео по п. 1, в котором срезы в плитке представляют собой прямоугольные срезы.

11. Способ декодирования видео по п. 1, в котором информация по числу синтаксически анализируется на основе информации, связанной с шириной и высотой среза, включающего в себя плитку.

12. Способ кодирования видео, осуществляемый посредством оборудования кодирования видео, при этом способ содержит этапы, на которых:

- извлекают срезы в плитке текущего кадра;

- формируют связанную с прогнозированием информацию и прогнозные выборки посредством выполнения по меньшей мере одного из внутреннего прогнозирования или взаимного прогнозирования на основе по меньшей мере одного из извлеченных срезов;

- формируют остаточную информацию на основе прогнозных выборок;

- формируют информацию по числу, связанную с числом конкретных срезов, каждый из которых имеет высоту, явно передаваемую в служебных сигналах в плитке, и информацию высоты, связанную с высотами конкретных срезов, каждый из которых имеет высоту, явно передаваемую в служебных сигналах; и

- кодируют информацию изображений, включающую в себя связанную с прогнозированием информацию, остаточную информацию, информацию по числу и информацию высоты,

при этом информация высоты включает в себя идентичное число синтаксических элементов в качестве числа конкретных срезов,

при этом на основе числа конкретных срезов, равного n, синтаксические элементы в информации высоты указывают высоты от нулевого среза до (n-1)-го среза в плитке,

при этом высота n-го среза в плитке представляется на основе высоты (n-1)-го среза,

при этом высота последнего среза в плитке представляется на основе оставшейся высоты после вычитания высот других срезов в плитке из высоты плитки, и

при этом синтаксический элемент в информации высоты представляет высоту одного из конкретных срезов в единицах CTU-строк.

13. Способ передачи данных для видео, при этом способ содержит этапы, на которых:

- получают поток битов для видео, при этом поток битов формируется на основе извлечения срезов в плитке текущего кадра, формирования связанной с прогнозированием информации и прогнозных выборок посредством выполнения по меньшей мере одного из внутреннего прогнозирования или взаимного прогнозирования на основе по меньшей мере одного из извлеченных срезов, формирования остаточной информации на основе прогнозных выборок, формирования информации по числу, связанной с числом конкретных срезов, каждый из которых имеет высоту, явно передаваемую в служебных сигналах в плитке, и информации высоты, связанной с высотами конкретных срезов, каждый из которых имеет высоту, явно передаваемую в служебных сигналах, и кодирования информации изображений, включающей в себя связанную с прогнозированием информацию, остаточную информацию, информацию по числу и информацию высоты; и

- передают данные, содержащие поток битов,

при этом на основе числа конкретных срезов, равного n, синтаксические элементы в информации высоты указывают высоты от нулевого среза до (n-1)-го среза в плитке,

при этом высота n-го среза в плитке представляется на основе высоты (n-1)-го среза,

при этом высота последнего среза в плитке представляется на основе оставшейся высоты после вычитания высот других срезов в плитке из высоты плитки, и

при этом синтаксический элемент в информации высоты представляет высоту одного из конкретных срезов в единицах CTU-строк.

Документы, цитированные в отчете о поиске Патент 2023 года RU2800595C1

US 2019082178 A1, 2019.03.14
WO 2015058718 A1, 2015.04.30
TIM HELLMAN еt al
Печь для сжигания твердых и жидких нечистот 1920
  • Евсеев А.П.
SU17A1
WO 2012044709 A1, 2012.04.05
US 2015201202 A1, 2015.07.16
US 2018309987 A1, 2018.10.25

RU 2 800 595 C1

Авторы

Хендри, Хендри

Палури, Сеетхал

Ким, Сеунгхван

Даты

2023-07-25Публикация

2020-11-26Подача