СПОСОБ И УСТРОЙСТВО ИНТЕРПОЛЯЦИОННОЙ ФИЛЬТРАЦИИ ДЛЯ КОДИРОВАНИЯ С ПРЕДСКАЗАНИЕМ Российский патент 2022 года по МПК H04N19/117 H04N19/82 

Описание патента на изобретение RU2787217C1

Область техники, к которой относится изобретение

Варианты осуществления настоящего раскрытия (изобретения), в общем, относятся к области обработки изображений и, в частности, к кодированию и декодированию изображения и/или видео и, в частности, к способу и устройству внутреннего/внешнего предсказания.

Уровень техники

Кодирование видео (кодирование и декодирование видео) используется в широком диапазоне приложений цифрового видео, например, в широковещательном цифровом телевидении, передаче видео через интернет и мобильные сети, в диалоговых приложениях в реальном времени, таких как видеочат, видеоконференцсвязь, DVD и Blu- Ray диски, системы сбора и редактирования видеоконтента и в приложениях видеокамер безопасности.

Объем видеоданных, необходимых для изображения даже относительно короткого видео, может быть существенным, что может затруднить передачу данных в сети связи с ограниченной пропускной способностью. Таким образом, в современных сетях связи до передачи видеоданные обычно сжимаются. Размер видео также имеет значение, поскольку ресурсы памяти могут быть ограничены для хранения видео в устройстве хранения. Устройства сжатия видео часто используют программное обеспечение и/или аппаратное обеспечение на источнике для кодирования видеоданных до передачи или хранения, тем самым, уменьшая объем данных, необходимых для представления цифровых видеоизображений. Затем сжатые данные принимаются в точке назначения устройством распаковки видео, которое декодирует видеоданные. Из-за ограниченных сетевых ресурсов и постоянно растущих требований более высокого качества видео, требуются усовершенствованные технологии сжатия и распаковки, которые повышают коэффициент сжатия практически без ухудшения качества изображения.

Раскрытие сущности изобретения

Варианты осуществления настоящего раскрытия предлагают устройства и способы кодирования и декодирования в соответствии с независимыми пунктами формулы изобретения.

Вышеуказанные и другие задачи настоящего раскрытия решаются посредством независимых пунктов формула изобретения. Дополнительные формы реализации очевидны из зависимых пунктов формулы изобретения, описания и чертежей.

Варианты осуществления изобретения определяются признаками независимых пунктов формулы изобретения и дополнительными предпочтительными реализациями вариантов осуществления по признакам зависимых пунктов формулы изобретения.

Согласно аспекту настоящего раскрытия, предложен способ внутреннего или внешнего предсказания обработки видеокадров, содержащий этапы: получение опорной выборки; получение значения смещения субпикселя; и фильтрация, используя 4-отводной интерполяционный фильтр субпикселя, опорную выборку для получения предсказанного значения выборки, в котором коэффициенты фильтра 4-отводного интерполяционного фильтра субпикселя удовлетворяют:

в котором p является дробной частью значения смещения субпикселя и , , и являются коэффициентами фильтрации 4-отводного интерполяционного фильтра субпикселя.

В одной примерной реализации опорные выборки могут обозначаться ref [x], с

ref[ x ] = p[ −1 − refIdx + x ][ −1 − refIdx ], с x = 0..nTbW + refIdx + 1.

соответствующий массив опорных выборок и «р», относящихся к х-y двумерному массиву p[ x ][ y ], содержащий значения выборки. Количество используемых опорных выборок может быть, по меньше, одна. В другом примере количество опорных выборок может быть четыре.

В одной примерной реализации полученное значение смещения субпикселя может быть обозначаться, как

(y + 1 + refIdx ) * intraPredAngle

где «IntraPredAngle» является значением угла внутреннего предсказания.

В одной примерной реализации предсказанное значение выборки «predSamples[ x ][ y ]» может быть получено следующим образом

predSamples[ x ][ y ] = Clip1( ( ( ) + 32 ) >> 6 )

где fT[ i ] относится к коэффициентам фильтрации. Эти коэффициенты могут представлять собой коэффициенты фильтра яркости или цветности для внешнего предсказания, относящегося к fG и fC, соответственно.

Выбор коэффициентов фильтра как яркости, так и цветности, может быть реализован путем использования и установки флага «flterFlag», например, как

fT[ j ] = filterFlag ? fG[ iFact ][ j ] : fC[ iFact ][ j ]

с

iFact = ( ( y + 1 + refIdx ) * intraPredAngle ) & 31.

Значение «31» относится к дробной части значения смещения субпикселя и может принять другие значения, отличные от «31». Значения коэффициентов фильтра fG (яркости) и/или fC (цветности), получают аналитически по ходу выполнения с использованием вышеуказанного аналитического выражения для коэффициентов фильтра 4-отводного фильтра. Таким образом, коэффициенты фильтра определяются в соответствии со значением смещения субпикселя.

Следовательно, коэффициенты фильтра получают без доступа к соответствующим значениям коэффициентов фильтра из LUT, а скорее получают путем расчета.

Альтернативно, коэффициенты фильтра могут быть рассчитаны с использованием приведенных выше уравнений и значения могут храниться в LUT.

Согласно аспекту настоящего раскрытия, коэффициенты фильтра 4-отводного интерполяционного фильтра субпикселя определяются в таблице следующим образом:

P 0 16 32 16 0 1 16 32 16 0 2 15 31 17 1 3 15 31 17 1 4 14 30 18 2 5 14 30 18 2 6 13 29 19 3 7 13 29 19 3 8 12 28 20 4 9 12 28 20 4 10 11 27 21 5 11 11 27 21 5 12 10 26 22 6 13 10 26 22 6 14 9 25 23 7 15 9 25 23 7 16 8 24 24 8 17 8 24 24 8 18 7 23 25 9 19 7 23 25 9 20 6 22 26 10 21 6 22 26 10 22 5 21 27 11 23 5 21 27 11 24 4 20 28 12 25 4 20 28 12 26 3 19 29 13 27 3 19 29 13 28 2 18 30 14 29 2 18 30 14 30 1 17 31 15 31 1 17 31 15

Согласно аспекту настоящего раскрытия предложен способ внутреннего или внешнего предсказания обработки видеокадров, содержащий этапы: получение опорной выборки; получение значения смещения субпикселя; и фильтрация с использованием 4-отводного интерполяционного фильтра субпикселя, опорной выборки для получения предсказанного значения выборки, в котором коэффициенты фильтра 4-отводного интерполяционного фильтра субпикселя определяются следующим образом:

p 0 16 32 16 0 1 16 32 16 0 2 15 31 17 1 3 15 31 17 1 4 14 30 18 2 5 14 30 18 2 6 13 29 19 3 7 13 29 19 3 8 12 28 20 4 9 12 28 20 4 10 11 27 21 5 11 11 27 21 5 12 10 26 22 6 13 10 26 22 6 14 9 25 23 7 15 9 25 23 7 16 8 24 24 8 17 8 24 24 8 18 7 23 25 9 19 7 23 25 9 20 6 22 26 10 21 6 22 26 10 22 5 21 27 11 23 5 21 27 11 24 4 20 28 12 25 4 20 28 12 26 3 19 29 13 27 3 19 29 13 28 2 18 30 14 29 2 18 30 14 30 1 17 31 15 31 1 17 31 15

где p является дробной частью значения смещения субпикселя и , , и являются коэффициентами фильтра.

В одной примерной реализации значения коэффициентов фильтра могут храниться в LUT. Это означает, что для интерполяционной фильтрации субпикселя соответствующие значения коэффициентов фильтра должны быть получены из LUT.

Фиг. 23 показывает блок-схему алгоритма процесса внутреннего/внешнего предсказания. На этапе 2301 получают опорную выборку. Опорная выборка может включать в себя одну или более опорных выборок. На этапе 2302 получено значение смещения субпикселя. На этапе 2303 опорную выборку затем фильтруют с использованием интерполяционного фильтра субпикселя, имеющего коэффициенты с i = 0, … 3 фильтра. Это называется 4-отводным фильтром и/или 4-точечным фильтром.

Коэффициенты фильтра могут быть получены из аналитических выражений с заданной дробной частью р значения смещения субпикселя. Коэффициенты фильтра также могут быть получены из LUT со ссылкой на р значения.

Согласно аспекту настоящего раскрытия, бит р устанавливается на ноль.

Согласно аспекту настоящего раскрытия, р увеличивается на 1 и затем младший бит увеличенного р установлен на установлен на ноль до использования этого значения для получения коэффициентов фильтра.

Согласно аспекту настоящего раскрытия, получение коэффициентов фильтра содержит этап вычисления коэффициентов фильтра в соответствии с

Это может обеспечить преимущество вычисления коэффициента фильтра из предшествующего коэффициента фильтра. Это может дополнительно сократить время для расчета коэффициентов фильтра.

Согласно аспекту настоящего раскрытия, предусмотрен способ кодирования видео, способ содержит процесс внутреннего предсказания блока видеокадра, содержащий: фильтрацию, с использованием 4-отводного интерполяционного фильтра субпикселя, опорной выборки видеокадра; в котором 4-отводной интерполяционный фильтр субпикселя представляет собой комбинацию фильтров, с коэффициентами фильтра, по меньшей мере, один из фильтров, удовлетворяющий:

где p является дробной частью значения смещения субпикселя и , , и являются коэффициентами фильтра.

Фиг. 24 показывает блок-схему алгоритма процесса кодирования видео. На этапе 2401 выполняется процесс внутреннего предсказания путем фильтрации опорной выборки блока с использованием 4-отводного интерполяционного фильтра субпикселя.

Согласно аспекту настоящего раскрытия, 4-отводной интерполяционный фильтр является сглаживающим фильтром, который является параллельной комбинацией двух фазозависимых линейных фильтров и фильтра нижних частот.

Согласно аспекту настоящего раскрытия, 4-отводной интерполяционный фильтр субпикселя представляет собой фильтр увеличения резкости, который представляет собой параллельную комбинацию одного фазозависимого линейного фильтра и высокочастотного фильтра с изменяющейся мощностью.

Согласно аспекту нынешнего изобретения, высокочастотный фильтр с изменяющейся мощностью представляет собой фазонезависимый высокочастотный фильтр с конечной импульсной характеристикой FIR, выход которого умножен на параметр фазозависимой мощности.

Согласно любому из предшествующих аспектов настоящего раскрытия, младший бит р устанавливается на ноль.

Согласно аспекту настоящего раскрытия, р увеличивается на 1, и затем младший бит увеличенного значения установлен на ноль до использования этого значения для получения коэффициентов интерполяционного фильтра.

Согласно аспекту настоящего раскрытия, выполняется операция отсечения для выхода высокочастотного фильтра с изменяющейся мощностью.

Согласно аспекту настоящего раскрытия, предложено устройство для внутреннего или внешнего предсказания видеокадра, включающее в себя: блок получения опорной выборки, выполненный с возможностью получать опорную выборку; блок получения значения смещения субпикселя, выполненный с возможностью получать значения смещения субпикселя; и 4-отводной интерполяционный фильтр субпикселя, выполненный с возможностью фильтрации опорной выборки для получения предсказанного значения выборки, в котором коэффициенты фильтра 4-отводного интерполяционного фильтра субпикселя удовлетворяют:

где p является дробной частью значения смещения субпикселя и , , и являются коэффициентами фильтра 4-отводного интерполяционного фильтра субпикселя.

Согласно аспекту настоящего раскрытия, коэффициенты фильтра 4-отводного интерполяционного фильтра субпикселя определяются в таблице следующим образом:

p 0 16 32 16 0 1 16 32 16 0 2 15 31 17 1 3 15 31 17 1 4 14 30 18 2 5 14 30 18 2 6 13 29 19 3 7 13 29 19 3 8 12 28 20 4 9 12 28 20 4 10 11 27 21 5 11 11 27 21 5 12 10 26 22 6 13 10 26 22 6 14 9 25 23 7 15 9 25 23 7 16 8 24 24 8 17 8 24 24 8 18 7 23 25 9 19 7 23 25 9 20 6 22 26 10 21 6 22 26 10 22 5 21 27 11 23 5 21 27 11 24 4 20 28 12 25 4 20 28 12 26 3 19 29 13 27 3 19 29 13 28 2 18 30 14 29 2 18 30 14 30 1 17 31 15 31 1 17 31 15

Согласно аспекту настоящего раскрытия, предложено устройство для внутреннего или внешнего предсказания видеокадра, содержащее: блок получения опорной выборки, выполненный с возможностью получать опорную выборку; блок получения значения смещения субпикселя, выполненный с возможностью получать значение смещения субпикселя; и 4-отводной интерполяционный фильтр субпикселя, выполненный с возможностью фильтрации опорной выборки для получения предсказанного значения выборки, в котором коэффициенты фильтра 4-отводного интерполяционного фильтра субпикселя определяются следующим образом:

p 0 16 32 16 0 1 16 32 16 0 2 15 31 17 1 3 15 31 17 1 4 14 30 18 2 5 14 30 18 2 6 13 29 19 3 7 13 29 19 3 8 12 28 20 4 9 12 28 20 4 10 11 27 21 5 11 11 27 21 5 12 10 26 22 6 13 10 26 22 6 14 9 25 23 7 15 9 25 23 7 16 8 24 24 8 17 8 24 24 8 18 7 23 25 9 19 7 23 25 9 20 6 22 26 10 21 6 22 26 10 22 5 21 27 11 23 5 21 27 11 24 4 20 28 12 25 4 20 28 12 26 3 19 29 13 27 3 19 29 13 28 2 18 30 14 29 2 18 30 14 30 1 17 31 15 31 1 17 31 15

где p является дробной частью значения смещения субпикселя и , , и являются коэффициентами фильтра.

Фиг. 25 показывает схему модуля 2500 обработки внутреннего/внешнего предсказания, который содержит блок 2510 получения опорной выборки, блок 2520 получения значения смещения субпикселя и интерполяционный фильтр 2530 субпикселя.

Согласно аспекту настоящего раскрытия, предложено устройство для кодирования видео, содержащее: блок обработки внутреннего предсказания, выполненный с возможностью выполнять внутреннее предсказание блока видеокадра; и 4-отводной интерполяционный фильтр субпикселя, выполненный с возможностью фильтрации опорной выборки видеокадра; в котором 4-отводной интерполяционный фильтр субпикселя представляет собой комбинацию фильтров, с коэффициентами фильтра, по меньшей мере, одного из фильтров, удовлетворяющий:

где p является дробной частью значения смещения субпикселя и , , и являются коэффициентами фильтра.

Фиг. 26 показывает схему модуля 2600 кодирования видео, который содержит блок 2610 обработки внутреннего предсказания и интерполяционный фильтр 2620 субпикселя.

Согласно аспекту настоящего раскрытия, предусмотрен кодер (20), содержащий схему обработки для выполнения способа по любому из предшествующих аспектов настоящего раскрытия.

Согласно аспекту настоящего раскрытия, предложен декодер (30), содержащий схему обработки для выполнения способа по любому из предшествующих аспектов настоящего раскрытия.

Согласно аспекту настоящего раскрытия, предоставляется компьютерный программный продукт, содержащий программный код для выполнения способа в соответствии с любым из предшествующих аспектов настоящего раскрытия.

Согласно аспекту настоящего раскрытия, предусмотрен декодер, содержащий: один или более процессоров; и постоянный машиночитаемый носитель, соединенный с процессорами и хранящий программы для выполнения процессорами, в котором программы, при выполнении процессорами, конфигурируют декодер выполнить способ в соответствии с любым из предшествующих аспектов настоящего раскрытия.

Согласно аспекту настоящего раскрытия, предусмотрен кодер, содержащий: один или более процессоров; и постоянный машиночитаемый носитель, соединенный с процессорами и хранящий программы для выполнения процессорами, в котором программы, при выполнении процессорами, конфигурируют кодер выполнить способ в соответствии с любым из предшествующих аспектов настоящего раскрытия.

Настоящее изобретение по любому из предшествующих аспектов может обеспечить более эффективный способ внутреннего/внешнего предсказания видеокадра. Это связано с тем, что коэффициенты фильтра интерполяционного фильтра получены аналитическими способом, то есть, упомянутые коэффициенты вычисляются в процессе обработки. Это позволяет избежать хранения коэффициентов в таблице поиска (LUT), требующих времени доступа для чтения коэффициентов из памяти.

Таким образом, предсказание становится более эффективным и требует меньшего объема памяти. Это обеспечивает также недорогую реализацию предсказания. Более того, поскольку аналитические коэффициенты фильтра являются линейными на позиции р дробной выборки, и используются операции деления на 2, соответствующая операция может быть эффективно выполнена, используя быструю низкоуровневую битовую операцию. Соответствующее время для выполнения битовой операции и для расчета коэффициентов фильтра короче времени доступа к хранимым коэффициентам из LUT. Таким образом, задержка обработки сокращается.

Более того, конкретная аналитическая структура коэффициентов фильтра может обеспечить преимущество реализации низкой сложности блока (блоков) фильтра. Как было описано ранее, частотная характеристика фильтра (т.е. частотная характеристика) для различных позиций субпикселей соответствует отношению амплитуде и фазы и предотвращает появления артефактов в частотной характеристике, в частности, на высоких частотах. Линейность коэффициентов фильтра может обеспечить преимущество повторного использования оборудования.

Далее приведено подробное описание одного или нескольких вариантов осуществления со ссылкой на прилагаемые чертежи. Другие признаки, объекты и преимущества будут очевидны из описания, чертежей и формулы изобретения.

Изобретение может быть реализовано в аппаратном и/или программном обеспечении.

В целях ясности любой из вышеперечисленных вариантов осуществления может быть объединен с любыми или несколькими другими вышеуказанными вариантами осуществления для получения нового варианта осуществления в объеме настоящего раскрытия.

Эти и другие признаки будут более поняты из следующего подробного описания со ссылкой на прилагаемые чертежи и формулу изобретения.

Краткое описание чертежей

Далее приведено подробное описание вариантов осуществления изобретения со ссылкой на прилагаемые чертежи, на которых:

фиг. 1A является блок-схемой, показывающей пример системы кодирования видео, выполненной с возможностью реализации вариантов осуществления изобретения;

фиг. 1B является блок-схемой, показывающей другой пример системы кодирования видео, выполненной с возможностью реализации вариантов осуществления изобретения;

фиг. 2 представляет собой блок-схему, показывающую пример видеокодера, выполненного с возможностью реализации вариантов осуществления изобретения;

фиг. 3 представляет собой блок-схему, показывающую примерную структуру видеокодера, выполненного с возможностью реализации вариантов осуществления изобретения;

фиг. 4 является блок-схемой, иллюстрирующей пример устройства кодирования или устройства декодирования;

фиг. 5 является блок-схемой, иллюстрирующей другой пример устройства кодирования или устройства декодирования;

фиг. 6 является схемой, показывающей угловые направления внутреннего предсказания и ассоциированные с ними режимы внутреннего предсказания в HEVC;

фиг. 7 является схемой, показывающей угловые направления внутреннего предсказания и ассоциированные с ними режимы внутреннего предсказания в JEM;

фиг. 8 представляет собой схему, показывающую угловые направления внутреннего предсказания и ассоциированные режимы внутреннего предсказания в VTM-3.0 и VVC проекте v.3 спецификации;

фиг. 9 представляет собой схему, показывающую пример комбинации фильтра для сглаживания, где в интерполяционный фильтр вводится набор опорных выборок;

фиг. 10 представляет собой схему, показывающую примерную комбинацию фильтров для повышения резкости интерполяционной фильтрации, включающую в себя операцию отсечения;

фиг. 11 представляет собой схему, показывающую примерную комбинацию фильтров для повышения резкости интерполяционной фильтрации с альтернативным положением операции отсечения;

фиг. 12А представляет собой схему, показывающую примерную комбинацию фильтров для повышения резкости интерполяционной фильтрации, используя фильтр регулируемой мощности;

фиг. 12В представляет собой схему, показывающую еще одну примерную комбинацию фильтров для повышения резкости интерполяционной фильтрации с использованием фильтра регулируемой мощности;

фиг. 13-21 представляют собой схемы, показывающие различные комбинации LUT и аналитические представления коэффициентов интерполяционного фильтра;

фиг. 22 представляет собой схему, показывающую примерную реализацию способа расчета коэффициентов;

фиг. 23 представляет собой блок-схему алгоритма процесса внутреннего/внешнего предсказания;

фиг. 24 представляет собой блок-схему алгоритма кодирования видео;

фиг. 25 представляет собой блок-схему модуля обработки внутреннего/внешнего предсказания, включающего в себя блок получения опорной выборки, блок получения смещения субпикселя и интерполяционный фильтр субпикселя;

фиг. 26 представляет собой блок-схему модуля кодирования видео, включающий в себя блок обработки внешнего предсказания и интерполяционный фильтр субпикселя.

В последующем описании идентичные ссылочные позиции относятся к идентичным или, по меньшей мере, функционально эквивалентным признакам, если явно не указано иначе.

Осуществление изобретения

В нижеследующем описании приведена ссылка на сопроводительные чертежи, которые составляют часть настоящего раскрытия и показывают в качестве иллюстрации конкретные аспекты вариантов осуществления изобретения или конкретные аспекты, в которых могут использоваться варианты осуществления настоящего раскрытия. Очевидно, что варианты осуществления изобретения могут использоваться в других аспектах и содержать структурные или логические изменения, не изображенные на чертежах. Поэтому нижеследующее подробное описание не следует воспринимать в ограничивающем смысле, и объем настоящего раскрытия определяется прилагаемой формулой изобретения.

Например, очевидно, что настоящее изобретение с описанным способом также может быть верным для соответствующего устройства или системы, выполненной с возможностью выполнять способ, и наоборот. Например, если описан один или более конкретных этапов способа, соответствующее устройство может включать в себя один или более блоков, например, функциональные блоки, чтобы выполнять описанный один или множество этапов способа (например, один блок, выполняющий один или множество этапов, или множество блоков, каждый из которых выполняет один или более из множества этапов) даже, если такой один или более блоков не описаны и не проиллюстрированы явно на чертежах. С другой стороны, например, если конкретное устройство описано на основании одного или множества блоков, например, функциональных блоков, соответствующий способ может включать в себя один этап для выполнения функциональных возможностей одного или множества блоков (например, один этап, выполняющий функциональные возможности одного или множества блоков, или множество этапов, каждый из которых выполняет функциональные возможности одного или нескольких из множество блоков) даже, если такой один или множество этапов явно не описаны или не проиллюстрированы на чертежах. Кроме того, понятно, что признаки различных примерных вариантов осуществления и/или аспектов, описанных в данном документе, могут быть объединены друг с другом, если специально не указано иное.

Кодирование видео обычно относится к обработке последовательности изображений, которые образуют видео или видеопоследовательность. Вместо термина «изображение» можно использовать термин «кадр» или «изображение» как синонимы в области кодирования видео. Кодирование видео, используемое в настоящем изобретении (или настоящем раскрытии), указывает либо кодирование видео, либо декодирование видео. Кодирование видео выполняется на стороне источника, обычно, содержащее обработку (например, путем сжатия) исходных видеоизображений для уменьшения объема данных, необходимых для представления видеоизображений (для более эффективного хранения и/или передачи). Декодирование видео выполняется на стороне назначения и обычно содержит обратную обработку по сравнению с кодером для восстановления видеоизображений. Варианты осуществления, относящиеся к «кодированию» видеоизображений (или изображений в целом, как будет объяснено позже), следует понимать как относящиеся либо к «кодированию», либо к «декодированию» видеопоследовательности. Комбинация части кодирования и части декодирования также называется CODEC (Coding and Decoding).

В случае кодирования видео без потерь исходные видеоизображения могут быть восстановлены, то есть, восстановленные видеоизображения имеют то же качество, что и исходные видеоизображения (при условии отсутствия потерь передачи или других потерь данных во время хранения или передачи). В случае кодирования видео с потерями выполняется дополнительное сжатие, например, посредством квантования, для уменьшения объема данных, представляющих видеоизображения, которые не могут быть полностью восстановлены в декодере, то есть, качество восстановленных видеоизображений ниже или хуже по сравнению с качеством исходных видеоизображений.

Несколько стандартов кодирования видео принадлежат к группе «гибридных видеокодеков с потерями» (т.е. объединяют пространственное и временное предсказания в области выборки и кодирование с 2D преобразованием для применения квантования в области преобразования). Каждое изображение видеопоследовательности обычно разделяется на набор неперекрывающихся блоков, и кодирование обычно выполняется на уровне блоков. Другими словами, в кодере видео обычно обрабатывается, то есть, кодируется, на уровне блока (видеоблока), например, с использованием пространственного (внутреннее изображение) предсказания и временного (внешнее изображение) предсказания для генерирования блока предсказания, вычитание блока предсказания из текущего блока (блока, который в настоящее время обрабатывается/должен быть обработан) для получения остаточного блока, преобразование остаточного блока и квантование остаточного блока в области преобразования для уменьшения объема данных, которые должны быть переданы (сжаты), тогда как в декодере частично выполняется обратная обработка по сравнению с кодером к кодированному или сжатому блоку для восстановления текущего блока для представления. Кроме того, кодер дублирует цикл обработки декодера, так что оба будут генерировать идентичные предсказания (например, внутреннее и внешнее предсказание) и/или повторно восстанавливать для обработки, то есть, кодировать, последующие блоки.

В следующих вариантах осуществления со ссылкой на фиг. 1-3 приведено описание кодера 20, декодера 30 и системы 10 кодирования.

Фиг. 1A представляет собой блок-схему, иллюстрирующую пример системы 10 кодирования, например, системы 10 кодирования видео (или сокращенно, система 10 кодирования), которая может использовать способы этого настоящего раскрытия. Видеокодер 20 (например, кодер 20) и видеодекодер 30 (например, декодер 30) системы 10 кодирования видео представляют собой примеры устройств, которые могут быть выполнены с возможностью выполнять способы в соответствии с различными примерами, описанными в настоящем изобретении.

Как показано на фиг. 1A, система 10 кодирования содержит устройство 12 источника, выполненное с возможностью предоставлять данные 21 закодированного изображения, например, в устройство 14 назначения для декодирования данных 13 закодированного изображения.

Устройство 12 источника содержит кодер 20 и может дополнительно, т.е. возможно, содержать источник 16 изображения, препроцессор 18 (блок предварительной обработки), например, препроцессор 18 изображения и интерфейс связи или блок 22 связи.

Источник 16 изображения может содержать или быть устройством захвата изображения любого типа, например, для захвата реального изображения и/или любого вида изображения или комментария (для кодирования содержимого экрана некоторые тексты на экране также считаются часть изображения или изображения, которое должно быть закодировано), устройство генерирования, например процессор компьютерной графики для генерирования компьютерного анимированного изображения, или любое устройство для получения и/или предоставления реального изображения, компьютерного анимированного изображения (например, контент экрана, изображение виртуальной реальности (VR)) и/или любую их комбинацию (например, изображение дополненной реальности (AR)). Источником изображения может быть любой тип памяти или хранилища, в котором хранятся любые из вышеупомянутых изображений.

В отличие от препроцессора 18 и обработки, выполняемой блоком 18 предварительной обработки, изображение или данные 17 изображения также могут называться необработанным изображением или данными 17 исходного изображения.

Препроцессор 18 выполнен с возможностью принимать (необработанные) данные 17 изображения и выполнять предварительную обработку данных 17 изображения для получения предварительно обработанного изображения 19 или данных 19 предварительно обработанного изображения. Предварительная обработка выполняется препроцессором 18, которая, например, содержит обрезку, преобразование цветового формата (например, из RGB в YCbCr), цветокоррекцию или устранение шумов. Очевидно, что препроцессор 18 может быть возможным компонентом.

Видеокодер 20 выполнен с возможностью принимать данные 19 предварительно обработанного изображения и предоставлять данные 21 закодированного изображения (дополнительные подробности будут описаны ниже, например, со ссылкой на фиг. 2).

Интерфейс 22 связи устройства 12 источника может быть выполнен с возможностью принимать данные 21 закодированного изображения и передавать данные 21 закодированного изображения (или любой их дополнительной обработанной версии) по каналу 13 связи в другое устройство, например, устройство 14 назначения или любое другое устройство для хранения или прямого восстановления.

Устройство 14 назначения содержит декодер 30 (например, видеодекодер 30) и может дополнительно, т.е. возможно, содержать интерфейс связи или блок 28 связи, постпроцессор 32 (блок 32 постобработки) и устройство 34 отображения.

Интерфейс 28 связи устройства 14 назначения выполнен с возможностью принимать данные 21 закодированного изображения (или любой их дополнительно обработанной версии), например, непосредственно из устройства 12 источника или из любого другого источника, например, запоминающее устройство, например, устройство хранения данных закодированного изображения, и предоставить данные 21 закодированного изображения в декодер 30.

Интерфейс 22 связи и интерфейс 28 связи могут быть выполнены с возможностью передавать или принимать данные 21 кодированного изображения или закодированные данные 13 через прямую линию связи между устройством 12 источника и устройством 14 назначения, например, прямое проводное или беспроводное соединение или через любую сеть, например, проводная или беспроводная сеть или любая их комбинация, или любая частная и общественная сеть, или любая их комбинация.

Интерфейс 22 связи может быть, например, выполнен с возможностью упаковывать данные 21 закодированного изображения в соответствующий формат, например, пакеты и/или обрабатывать данные закодированного изображения с использованием любого вида кодирования передачи или обработки для передачи по каналу связи или сети связи.

Интерфейс 28 связи, образующий аналог интерфейса 22 связи, может быть, например, выполнен с возможностью принимать переданные данные и обрабатывать передаваемые данные с использованием любого вида соответствующего декодирования передачи или обработки и/или распаковки для получения данных 21 закодированного изображения.

Как интерфейс 22 связи, так и интерфейс 28 связи могут быть сконфигурированы как однонаправленные интерфейсы связи, как показано стрелкой для данных 13 закодированного изображения на фиг. 1A, указывающей от устройства 12 источника к устройству 14 назначения или, как интерфейсы двунаправленной связи, и может быть выполнен с возможностью, например, отправлять и получать сообщения, например, для установки соединения, подтверждения и обмена любой другой информацией, относящейся к каналу связи и/или передаче данных, например, передача данных закодированного изображения.

Декодер 30 выполнен с возможностью принимать данные 21 кодированного изображения и предоставлять данные 31 декодированного изображения или декодированного изображения 31 (дополнительные подробности будут описаны ниже, например, на основании фиг. 3 или фиг. 5).

Постпроцессор 32 устройства 14 назначения выполнен с возможностью пост-обработки данных 31 декодированного изображения (также называемых данными восстановленного изображения), например, декодированное изображение 31, для получения данных 33 изображения после обработки, например, пост-обработанное изображение 33. Постобработка, выполняемая блоком 32 постобработки, может содержать, например, преобразование цветового формата (например, из YCbCr в RGB), цветокоррекция, обрезка или повторная выборка, или любая другая обработка, например, для подготовки данных 31 декодированного изображения для отображения, например, с помощью устройства 34 отображения.

Устройство 34 отображения устройства 14 назначения выполнено с возможностью принимать данные 33 изображения после обработки для отображения изображения, например, пользователю или зрителю. Устройство 34 отображения может быть или содержать любой вид дисплея для представления восстановленного изображения, например, встроенный или внешний дисплей или монитор. Дисплеи могут, например, состоят из жидкокристаллических дисплеев (LCD), дисплеев на органических светодиодах (OLED), плазменных дисплеев, проекторов, микро-светодиодных дисплеев, жидких кристаллов на кремнии (LCoS), цифрового светового процессора (DLP) или любого другого дисплея.

Хотя фиг. 1A изображает устройство 12 источника и устройство 14 назначения как отдельные устройства, варианты осуществления устройств также могут содержать оба или обе функциональные возможности устройство 12 источника или соответствующие функциональные возможности и устройство 14 назначения или соответствующие функциональные возможности. В таких вариантах осуществления устройство 12 источника или соответствующие функциональные возможности и устройство 14 назначения или соответствующие функциональные возможности могут быть реализованы с использованием одного и того же аппаратного и/или программного обеспечения или с помощью отдельного аппаратного и/или программного обеспечения или любой их комбинации.

Как будет очевидно для специалиста на основании описания, наличие и (точное) разделение функциональных возможностей различных блоков или функций в устройстве 12 источника и/или устройстве 14 назначения, как показано на фиг. 1A, может варьироваться в зависимости от фактического устройства и реализации.

Кодер 20 (например, видеокодер 20) и декодер 30 (например, видеодекодер 30) или оба кодер 20 или декодер 30 может быть реализован посредством схемы обработки, как показано на фиг. 1В, такой как один или более микропроцессоров, процессоров цифровых сигналов (DSPs), специальные интегральные схемы (ASICs), программируемые пользователем вентильные матрицы (FPGAs), дискретная логика, оборудование или любые их комбинации. Кодер 20 может быть реализован посредством схемы 46 обработки для реализации различных модулей, как обсуждалось в отношении кодера 20 на фиг. 2 и/или любой другой кодирующей системе или подсистеме, описанной в данном документе. Декодер 30 может быть реализован посредством схемы 46 обработки для воплощения различных модулей, как обсуждалось в отношении декодера 30 на фиг. 3 и/или любую другую систему или подсистему декодера, описанную в данном документе. Схема обработки может быть выполнена с возможностью выполнять различные операции, как описано ниже. Как показано на фиг. 5, если способы частично реализованы в программном обеспечении, устройство может хранить инструкции для программного обеспечения на подходящем постоянном машиночитаемом носителе данных и может выполнять инструкции в аппаратных средствах, используя один или более процессоров для выполнения способов этого настоящего раскрытия. Любой из видеокодера 20 и видеодекодера 30 может быть интегрирован как часть комбинированного кодера/декодера (CODEC) в одном устройстве, например, как показано на фиг. 1B.

Устройство 12 источника и устройство 14 назначения могут содержать любое из широкого диапазона устройств, включающие в себя любые виды портативных или стационарных устройств, например, ноутбуки или портативные компьютеры, мобильные телефоны, смартфоны, планшеты или планшетные компьютеры, камеры, настольные компьютеры, телевизионные приставки, телевизоры, устройства отображения, цифровые медиаплееры, игровые приставки, устройства потокового видео (например, серверы служб контента или контент серверы доставки), широковещательное приемное устройство, широковещательное передающее устройство и т.п. и могут использовать или не использовать любой тип операционной системы. В некоторых случаях устройство 12 источника и устройство 14 назначения могут быть оборудованы для осуществления беспроводной связи. Таким образом, устройство 12 источника и устройство 14 назначения могут быть устройствами беспроводной связи.

В некоторых случаях система 10 кодирования видео, проиллюстрированная на фиг. 1A, является просто примером, и способы настоящего раскрытия могут применяться к настройкам кодирования видео (например, кодирование видео или декодирование видео), которые не обязательно включают в себя какой-либо обмен данными между устройствами кодирования и декодирования. В других примерах данные извлекаются из локальной памяти, передаются по сети и т.п. Устройство для кодирования видео может кодировать и сохранять данные в памяти, и/или устройство для декодирования видео может извлекать и декодировать данные из памяти. В некоторых примерах кодирование и декодирование выполняются устройствами, которые не обмениваются данными друг с другом, а просто кодируют данные в памяти и/или извлекают и декодируют данные из памяти.

Для удобства описания в настоящем документе описаны варианты осуществления изобретения, например, со ссылкой на высокоэффективное кодирование видео (HEVC) или на эталонное программное обеспечение универсального кодирования видео (VVC), стандарта кодирования видео следующего поколения, разработанного группой сотрудничества по кодированию видео (JCT-VC) группы экспертов ITU-T по кодированию видео (VCEG) и ISO/IEC группой экспертов по движущимся изображениям (MPEG). Для специалиста в данной области техники очевидно, что варианты осуществления изобретения не ограничиваются HEVC или VVC.

Кодер и способ кодирования

Фиг. 2 показывает блок-схему примерного видеокодера 20, который выполнен с возможностью реализации способов настоящего раскрытия. В примере на фиг. 2, видеокодер 20 содержит вход 201 (или входной интерфейс 201), блок 204 вычисления остатка, блок 206 обработки преобразования, блок 208 квантования, блок 210 обратного квантования и блок 212 обработки обратного преобразования, блок 214 восстановления, блок 220 контурного фильтра, буфер 230 декодированных изображений (DPB), блок 260 выбора режима, блок 270 энтропийного кодирования и блок 272 выхода (или выходной интерфейс 272). Блок 260 выбора режима может включать в себя блок 244 внешнего предсказания, блок 254 внутреннего предсказания и блок 262 разделения. Блок 244 внешнего предсказания может включать в себя блок оценки движения и блок компенсации движения (не показаны). Видеокодер 20, показанный на фиг. 2, также может называться гибридным видеокодером или видеокодером согласно гибридному видеокодеку.

Блок 204 вычисления остатка, блок 206 обработки преобразования, блок 208 квантования, блок 260 выбора режима образуют прямой путь сигнала кодера 20, тогда как, например, блок 210 обратного квантования, блок 212 обработки обратного преобразования, блок 214 восстановления, буфер 216, контурный фильтр 220, буфер 230 декодированных изображений (DPB), блок 244 внешнего предсказания и блок 254 внутреннего предсказания образуют обратный путь сигнала кодера, в котором обратный путь сигнала кодера соответствует пути сигнала декодера (см. декодер 30 на фиг. 3). Блок 210 обратного квантования, блок 212 обработки обратного преобразования, блок 214 восстановления, контурный фильтр 220, буфер 230 декодированных изображений (DPB), блок 244 внешнего предсказания и блок 254 внутреннего предсказания также относятся к формированию «встроенного декодера» видеокодера 20.

Изображения & разделение изображения (изображения и блоки)

Кодер 20 выполнен с возможностью принимать, например, через вход 201 изображение 17 (или данные 17 изображения), например, изображение последовательности изображений, образующих видео или видеопоследовательность. Принятое изображение или данные изображения также могут быть предварительно обработанным изображением 19 (или предварительно обработанными данными 19 изображения). Для простоты описания далее в настоящем документе упоминаться как изображение 17. Изображение 17 также упоминается, как текущее изображение или изображение, подлежащее кодированию (в частности, при кодировании видео для различия текущего изображения от других изображений, например, ранее закодированных и/или декодированных изображений одной и той же видеопоследовательности, то есть, видеопоследовательности, которая также содержит текущее изображение).

(Цифровое) изображение представляет собой или может рассматриваться как двумерный массив или матрица выборок со значениями интенсивности. Выборка в массиве также может называться пикселем (сокращенная форма элемента изображения) или пикселем. Количество выборок в горизонтальном и вертикальном направлении (или по оси) массива или изображения определяет размер и/или разрешение изображения. Для представления цвета обычно используются три цветовых компонента, то есть, изображение может быть представлено или содержать три массива выборок. В формате RBG или цветовом пространстве изображение содержит соответствующий массив выборок красного, зеленого и синего цветов. Однако при кодировании видео каждый пиксель обычно представлен в формате яркости и цветности или цветовом пространстве, например YCbCr, который содержит компонент яркости, обозначенный Y (иногда вместо него также используется L), и два компонента цветности, обозначенные Cb и Cr. Компонент Y яркости (или кратко, яркость) представляет яркость или интенсивность уровня серого (например, как в полутоновом изображении), в то время как два компонента цветности (или кратко, цветность) Cb и Cr представляют компоненты цветности или информации о цвете. Соответственно, изображение в формате YCbCr содержит массив выборок яркости значений выборок яркости (Y) и два массива выборок цветности значений цветности (Cb и Cr). Изображения в формате RGB могут быть преобразованы в формат YCbCr и наоборот, этот процесс также известен как преобразование цвета. Если изображение является монохромным, оно может содержать только массив выборок яркости. Соответственно, изображение может быть, например, массивом выборок яркости в монохромном формате или массивом выборок яркости и двумя соответствующими массивами выборок цветности в 4:2:0, 4:2:2 и 4:4:4 цветовой формат.

Варианты осуществления кодера 20 могут содержать блок разделения (не показан на фиг. 2), выполненный с возможностью разделять изображение 17 на множество (обычно не перекрывающихся) блоков 203 изображения. Эти блоки также могут называться корневыми блоками, макроблоками (H.264/AVC) или блоками дерева кодирования (CTB) или блоками дерева кодирования (CTU) (H.265/HEVC и VVC). Блок разделения может быть выполнен с возможностью использовать один и тот же размер блока для всех изображений видеопоследовательности и соответствующей сетки, определяющей размер блока, или изменять размер блока между изображениями, подмножествами или группами изображений и разделять каждое изображение на соответствующие блоки.

В дополнительных вариантах осуществления видеокодер может быть выполнен с возможностью принимать непосредственно блок 203 изображения 17, например один, несколько или все блоки, образующие изображение 17. Блок 203 изображения также может упоминаться как текущий блок изображения или блок изображения, который должен быть кодирован.

Подобно изображению 17, блок 203 изображения снова является или может рассматриваться как двумерный массив или матрица выборок со значениями интенсивности (значениями выборок), хотя и меньшего размера, чем изображение 17. Другими словами, блок 203 может содержать, например, один массив выборок (например, массив яркости в случае монохромного изображения 17 или массив яркости или цветности в случае цветного изображения) или три массива выборок (например, массив яркости и два массива цветности в случае цветного изображения 17) или любое другое количество и/или видов массивов в зависимости от применяемого цветового формата. Количество выборок в горизонтальном и вертикальном направлении (или оси) блока 203 определяет размер блока 203. Соответственно, блок может, например, представлять собой массив выборок MxN (M-столбец на N-строку) или MxN массив коэффициентов преобразования.

Варианты осуществления видеокодера 20, как показано на фиг. 2, могут быть дополнительно выполнены с возможностью кодировать изображение 17 блок за блоком, например, разделять и кодировать блок 203.

Вычисление остатка

Блок 204 вычисления остатка выполнен с возможностью вычислять остаточный блок 205 (также обозначен как остаток 205) на основании блока 203 изображения и блока 265 предсказания (дополнительные подробности о блоке 265 предсказания предоставлены позже), например, путем вычитания значений выборок блока 265 предсказания из значений выборок блока 203 изображения, выборка за выборкой (пиксель за пикселем) для получения остаточного блока 205 в области выборки.

Преобразование

Блок 206 обработки преобразования выполнен с возможностью применять преобразования, например, дискретное косинусное преобразование (DCT) или дискретное синусоидальное преобразование (DST) на значениях выборки остаточного блока 205 для получения коэффициентов 207 преобразования в области преобразования. Коэффициенты 207 преобразования также могут называться остаточными коэффициентами преобразования и представлять остаточный блок 205 в области преобразования.

Блок 206 обработки преобразования может быть выполнен с возможностью применять целочисленные аппроксимации DCT/DST, такие как преобразования, указанные для HEVC/H.265. По сравнению с ортогональным преобразованием DCT, такие целочисленные приближения обычно масштабируются с определенным коэффициентом. Для сохранения нормы остаточного блока, который обрабатывается прямым и обратным преобразованиями, в процессе преобразования применяются дополнительные коэффициенты масштабирования. Коэффициенты масштабирования обычно выбираются на основании определенных ограничений, таких как коэффициенты масштабирования, являющиеся степенью два для операции сдвига, разрядности коэффициентов преобразования, компромисса между точностью и затратами на реализацию и т.д. Конкретные коэффициенты масштабирования, например, указываются для обратного преобразования, например, блоком 212 обработки обратного преобразования (и соответствующим обратным преобразованием, например, блоком 312 обработки обратного преобразования в декодере 30) и соответствующие коэффициенты масштабирования для прямого преобразования, например, блоком 206 обработки преобразования в кодере 20, соответственно.

Варианты осуществления видеокодера 20 (соответственно блока 206 обработки преобразования) могут быть выполнены с возможностью выводить параметры преобразования, например, тип преобразования или преобразования, например, непосредственно или закодированные или сжатые блоком 270 энтропийного кодирования, так что, например, видеодекодер 30 может принимать и использовать параметры преобразования для декодирования.

Квантование

Блок 208 квантования выполнен с возможностью квантовать коэффициенты 207 преобразования для получения квантованных коэффициентов 209 преобразования, например, путем применения скалярного квантования или векторного квантования. Квантованные коэффициенты 209 преобразования также могут упоминаться как квантованные остаточные коэффициенты 209.

Процесс квантования может уменьшить битовую глубину, ассоциированную с некоторыми или всеми коэффициентами 207 преобразования. Например, n-битовый коэффициент преобразования может быть округлен с понижением до m-битного коэффициента преобразования во время квантования, где n больше m. Степень квантования может быть изменена путем регулировки параметра квантования (QP). Например, для скалярного квантования может применяться другое масштабирование для достижения более тонкого или более грубого квантования. Меньшие размеры этапов квантования соответствуют более тонкому квантованию, тогда как большие размеры шагов квантования соответствуют более грубому квантованию. Применимый размер шага квантования может быть указан параметром квантования (QP). Параметр квантования может, например, быть индексом для заранее определенного набора применимых размеров шага квантования. Например, малые параметры квантования могут соответствовать точному квантованию (малые размеры шага квантования), и большие параметры квантования могут соответствовать грубому квантованию (большие размеры шага квантования) или наоборот. Квантование может включать в себя деление по размеру шага квантования и соответствующее или обратное деквантование, например, блоком 210 обратного квантования, может включать в себя умножение на размер шага квантования. Варианты осуществления согласно некоторым стандартам, например HEVC, могут быть выполнены с возможностью использовать параметр квантования для определения размера шага квантования. Обычно размер шага квантования может быть вычислен на основании параметра квантования с использованием аппроксимации с фиксированной точкой уравнения, включающей в себя деление. Дополнительные коэффициенты масштабирования могут быть введены для квантования и деквантования для восстановления нормы остаточного блока, который может быть изменен из-за масштабирования, используемого при аппроксимации с фиксированной точкой уравнения для размера шага квантования и параметра квантования. В одной примерной реализации масштабирование обратного преобразования и деквантования могут быть объединены. В качестве альтернативы могут использоваться настроенные таблицы квантования и сигнализироваться из кодера к декодеру, например, в битовом потоке. Квантование является операцией с потерями, при которой потери возрастают с увеличением размеров шага квантования.

Варианты осуществления видеокодера 20 (соответственно, блок 208 квантования) могут быть выполнены с возможностью выводить параметры квантования (QP), например, непосредственно или закодированы блоком 270 энтропийного кодирования, так что, например, видеодекодер 30 может принимать и применять параметры квантования для декодирования.

Обратное квантование

Блок 210 обратного квантования выполнен с возможностью применять обратное квантование блока 208 квантования к квантованным коэффициентам для получения деквантованных коэффициентов 211, например, путем применения схемы обратного квантования, применяемой блоком 208 квантования, на основании или с использованием того же размера шага квантования, что и блок 208 квантования. Деквантованные коэффициенты 211 также могут называться деквантованными остаточными коэффициентами 211 и соответствовать, хотя обычно не идентичны коэффициентам преобразования из-за потерь при квантовании, коэффициентам 207 преобразования.

Обратное преобразование

Блок 212 обработки обратного преобразования выполнен с возможностью применять обратное преобразование, применяемое блоком 206 обработки преобразования, например, обратное дискретное косинусное преобразование (DCT) или обратное дискретное синусоидальное преобразование (DST) для получения восстановленного остаточного блока 213 (или соответствующих деквантованных коэффициентов 213) в области выборки. Восстановленный остаточный блок 213 также может называться блоком 213 преобразования.

Восстановление

Блок 214 восстановления (например, блок суммирования или сумматор 214) выполнен с возможностью добавлять блок 213 преобразования (то есть, восстановленный остаточный блок 213) к блоку 265 предсказания для получения восстановленного блока 215 в области выборки, например, путем сложения, выборка к выборке, значений выборок восстановленного остаточного блока 213 и значений выборок блока 265 предсказания.

Фильтрация

Блок 220 контурного фильтра (или коротко, «контурный фильтр» 220) выполнен с возможностью фильтрации восстановленного блока 215 для получения отфильтрованного блока 221 или, как правило, для фильтрации восстановленных выборок для получения отфильтрованных выборок. Блок контурного фильтра предназначен, например, для сглаживания пиксельных переходов или для иного способа повышения качества видео. Блок 220 контурного фильтра может содержать один или более контурных фильтров, таких как фильтр деблокинга, фильтр с адаптивным сдвигом (SAO) или другие фильтры, например, двусторонний фильтр или адаптивный контурный фильтр (ALF), или фильтры повышения резкости или сглаживания, или коллаборативные фильтры или любую их комбинацию. Хотя блок 220 контурного фильтра показан на фиг. 2 как контурный фильтр, в других конфигурациях блок 220 контурного фильтра может быть реализован как постконтурный фильтр. Отфильтрованный блок 221 также может упоминаться как фильтрованный восстановленный блок 221.

Варианты осуществления видеокодера 20 (соответственно блока 220 контурного фильтра) могут быть выполнены с возможностью выводить параметры контурного фильтра (такие как информация адаптивного смещения выборки), например, непосредственно или закодированные блоком 270 энтропийного кодирования, так что, например, декодер 30 может принимать и применять те же параметры контурного фильтра или соответствующие контурные фильтры для декодирования.

Буфер декодированных изображений

Буфер 230 декодированных изображений (DPB) может быть памятью опорных изображений, в которой хранятся данные опорных изображений для использования при кодировании видеоданных видеокодером 20. DPB 230 может быть сформирован любым из множества запоминающих устройств, таких как динамическая память произвольного доступа (DRAM), включающая в себя синхронную DRAM (SDRAM), магниторезистивную RAM (MRAM), резистивную RAM (RRAM) или другие типы запоминающих устройств. Буфер 230 декодированных изображений (DPB) выполнен с возможностью хранить фильтрованный блок 221. Буфер 230 декодированных изображений может быть дополнительно выполнен с возможностью хранить другие ранее отфильтрованные блоки, например, ранее восстановленные и отфильтрованные блоки 221 одного и того же текущего изображения или разных изображений, например, ранее восстановленные изображения, и могут предоставлять полные ранее реконструированные, то есть, декодированные, изображения (и соответствующие опорные блоки и выборки) и/или частично восстановленное текущее изображение (и соответствующие опорные блоки и выборки), например, для внешнего предсказания. Буфер 230 декодированного изображения (DPB) также выполнен с возможностью хранить один или более нефильтрованных восстановленных блоков 215 или, в общем, нефильтрованные восстановленные выборки, например, если восстановленный блок 215 не фильтруется блоком 220 контурного фильтра или любой другой дополнительно обработанной версией восстановленных блоков или выборок.

Выбор режима (разделение и предсказание)

Блок 260 выбора режима содержит блок 262 разделения, блок 244 внешнего предсказания и блок 254 внутреннего предсказания и выполнен с возможностью принимать или получать исходные данные изображения, например, исходный блок 203 (текущий блок 203 текущего изображения 17) и восстановленные данные изображения, например, фильтрованные и/или нефильтрованные восстановленные выборки или блоки одного и того же (текущего) изображения и/или из одного или множества ранее декодированных изображений, например, из буфера 230 декодированного изображения или других буферов (например, линейный буфер, не показан). Данные восстановленное изображение используется в качестве данных опорного изображения для предсказания, например, внешнее предсказание или внутреннее предсказание, для получения блока 265 предсказания или предиктора 265.

Блок 260 выбора режима может быть выполнен с возможностью определять или выбирать разделение для режима предсказания текущего блока (включающее в себя отсутствие разделения) и режима предсказания (например, режим внутреннего или внешнего предсказания) и генерировать соответствующий блок 265 предсказания, который используется для вычисления остаточного блока 205 и для восстановления восстановленного блока 215.

Варианты осуществления блока 260 выбора режима могут быть выполнены с возможностью выбирать разделение и режим предсказания (например, из тех, которые поддерживаются или доступны для блока 260 выбора режима), которые обеспечивают наилучшее совпадение или, другими словами, минимальный остаток (минимальный остаток означает лучшее сжатие для передачи или хранения), или минимальные накладные расходы на сигнализацию (минимальные накладные расходы на сигнализацию означают лучшее сжатие для передачи или хранения), или который учитывает или уравновешивает оба. Блок 260 выбора режима может быть выполнен с возможностью определять режим разделения и предсказания на основании оптимизации искажения скорости (RDO), то есть, выбирать режим предсказания, который обеспечивает минимальное искажение скорости. Такие термины, как «лучший», «минимум», «оптимальный» и т.д. в этом контексте не обязательно относятся к общему «лучшему», «минимуму», «оптимальному» и т.д., но также могут относиться к выполнению прекращения или критерий выбора, такой как значение, превышающее или падающее ниже порогового значения, или другие ограничения, потенциально ведущие к «неоптимальному выбору», но уменьшающие сложность и время обработки.

Другими словами, блок 262 разделения может быть выполнен с возможностью разделять блок 203 на уменьшенные блоки или субблоки (которые вновь образуют блоки), например, итеративно с использованием разделения дерева квадрантов (QT), двоичного разделения (BT) или троичного дерева (TT) или любой их комбинации и для выполнения, например, предсказания для каждого из разделов блоков или субблоков, в котором выбор режима содержит выбор древовидной структуры разделенного блока 203 и режимы предсказания применяются к каждому из разделов или субблокам.

Далее более подробно поясняется процесс разделения (например, блоком 260 разделения) и обработка предсказания (блоком 244 внешнего предсказания и блоком 254 внутреннего предсказания), выполняемые примерным видеокодером 20.

Разделение

Блок 262 разделения может разделять (или разбивать) текущий блок 203 на меньшие разделы, например, блоки меньшего размера квадратной или прямоугольной формы. Эти меньшие блоки (которые также могут называться субблоками) могут быть дополнительно разделены на еще меньшие разделы. Это также называется разделением дерева или иерархическим разделением дерева, в котором корневой блок, например, на корневом уровне 0 дерева (уровень 0 иерархии, глубина 0) может быть рекурсивно разделен, например, разделен на два или более блока следующего более нижнего уровня дерева, например, узлы на уровне 1 дерева (уровень 1 иерархии, глубина 1), в котором эти блоки могут быть снова разделены на два или более блоков следующего более нижнего уровня, например, уровень 2 дерева (уровень 2 иерархии, глубина 2) и т.д., пока не будет завершено разделение, например, при выполнении критерия прекращения, например, достигается максимальная глубина дерева или минимальный размер блока. Блоки, которые не разделяются далее, также называются листовыми блоками или листовыми узлами дерева. Дерево, использующее разделение на два раздела, называется двоичным деревом (BT), дерево, использующее разделение на три раздела, называется тройным деревом (TT) и дерево, использующее разделение на четыре раздела, называется деревом квадрантов (QT).

Как упоминало ранее, термин «блок», используемый в настоящем документе, может быть частью, конкретно, частью квадратной или прямоугольной формы изображения. Со ссылкой, например, на HEVC и VVC, блок может быть или соответствовать блоку дерева кодирования (CTU), блоку кодирования (CU), блоку предсказания (PU) и блоку преобразования (TU) и/или соответствовать блокам, например, блоку дерева кодирования (CTB), блоку кодирования (CB), блоку преобразования (TB) или блоку предсказания (PB).

Например, блок дерева кодирования (CTU) может быть или содержать CTB выборок яркости, два соответствующих CTBs выборок цветности изображения, которое имеет три массива выборок, или CTB выборок монохромного изображения или изображения, которое кодируется с использованием трех отдельных цветовых плоскостей и синтаксических структур, используемых для кодирования выборок. Соответственно, блок дерева кодирования (CTB) может быть блоком NxN выборок для некоторого значения N, так что разделение компонента на CTBs является разделением. Блок кодирования (CU) может быть или содержать блок кодирования выборок яркости, два соответствующих блока кодирования выборок цветности изображения, которое имеет три массива выборок, или блок кодирования выборок монохромного изображения или изображения, которое кодируется с использованием трех отдельных цветовых плоскостей и синтаксических структур, используемые для кодирования выборок. Соответственно, блок кодирования (CB) может быть блоком MxN выборок для некоторых значений M и N, так что разделение CTB на блоки кодирования является разделением.

В вариантах осуществления, например, в соответствии с HEVC, блок дерева кодирования (CTU) может быть разделен на CUs с использованием структуры дерева квадратов, обозначенной как дерево кодирования. Решение о том, кодировать ли область изображения с использованием внешнего (временного) или внутреннего (пространственного) предсказания, принимается на CU уровне. Каждый CU может быть дополнительно разделен на один, два или четыре PUs в соответствии с типом разделения PU. Внутри одного PU применяется тот же процесс предсказания, и соответствующая информация передается в декодер на основании PU. После получения остаточного блока путем применения процесса предсказания на основании типа разделения PU, CU может быть разделен на блоки преобразования (TUs) в соответствии с другой структурой дерева квадрантов, аналогичной дереву кодирования для CU.

В вариантах осуществления, например, в соответствии с последним разрабатываемым в настоящее время стандартом кодирования видео, который называется универсальным кодированием видео (VVC), разделение дерева квадратов и двоичного дерева (QTBT) с использованием разделения блока кодирования. В QTBT структуре блока, CU может иметь либо квадратную, либо прямоугольную форму. Например, блок дерева кодирования (CTU) сначала разделяется структурой деревом квадрантов. Листовые узлы дерева квадрантов могут быть дополнительно разделены с помощью древовидной структуры двоичного дерева или троичного (или тройного) дерева. Листовые узлы дерева квадрантов называются блоками кодирования (CUs) и сегментация используются для предсказания и преобразования без любого дополнительного разделения. Это означает, что в большинстве случаев CU, PU и TU имеют одинаковый размер блока в QTBT структуре блока кодирования. Параллельно, также было предложено множество разделений, например, разделение троичного дерева было использовано совместно с QTBT структуре блока.

В одном примере блок 260 выбора режима видеокодера 20 может быть выполнен с возможностью выполнять любую комбинацию способов разделения, описанных в данном документе.

Как описано выше, кодер 20 выполнен с возможностью определять или выбирать наилучший или оптимальный режим предсказания из набора (предопределенных) режимов предсказания. Набор режимов предсказания может содержать, например, режимы внутреннего предсказания и/или режимы внешнего предсказания.

Внутреннее предсказание

Набор режимов внутреннего предсказания может содержать 35 различных режимов внутреннего предсказания, например, ненаправленные режимы, такие как DC режим (или средний) и планарный режим, или направленные режимы, например, как определено в HEVC, или может содержать 67 различных режимов внутреннего предсказания, например, ненаправленные режимы, такие как DC режим (или средний) и планарный режим, или направленные режимы, например, как определено для VVC.

Блок 254 внутреннего предсказания выполнен с возможностью использовать восстановленные выборки соседних блоков одного и того же текущего изображения для генерирования блока 265 внутреннего предсказания согласно режиму внутреннего предсказания набора режимов внутреннего предсказания.

Блок 254 внутреннего предсказания (или, в общем, блок 260 выбора режима) дополнительно выполнен с возможностью выводить параметры внутреннего предсказания (или, в общем, информацию, указывающую выбранный режим внутреннего предсказания для блока) в блок 270 энтропийного кодирования в форме элементов 266 синтаксиса для включения в данные 21 кодированного изображения, чтобы, например, видеодекодер 30 мог принимать и использовать параметры предсказания для декодирования.

Внешнее предсказание

Набор (или возможные) режимов внешнего предсказания зависит от доступных опорных изображений (то есть, предшествующих, по меньшей мере, частично декодированных изображений, например, сохраненных в DBP 230) и других параметров внешнего предсказания, например будь то опорное изображение целиком или только его часть, например, окно поиска области вокруг области текущего блока, опорного кадра используется для поиска наилучшего соответствия опорного блока и/или, например, применяется ли интерполяция пикселей, например, интерполяция пол/полупикселя, четверти пикселя и/или 1/16 пикселя или нет.

В дополнение к вышеупомянутым режимам предсказания может применяться режим пропуска и/или прямой режим.

Блок 244 внешнего предсказания может включать в себя блок оценки движения (ME) и блок компенсации движения (MC) (оба не показаны на фиг. 2). Блок оценки движения выполнен с возможностью принимать или получать блок 203 изображения (текущий блок 203 изображения текущего изображения 201) и декодированное изображение 231 или, по меньшей мере, один или множество ранее восстановленных блоков, например, восстановленные блоки одного или множества других/различных ранее декодированных изображений 231 для оценки движения. Например, видеопоследовательность может содержать текущее изображение и ранее декодированные изображения 231 или, другими словами, текущее изображение и ранее декодированные изображения 231 могут быть частью или формировать последовательность изображений, образующих видеопоследовательность.

Кодер 20 может, например, быть выполнен с возможностью выбирать опорный блок из множества опорных блоков одинаковых или различных изображений из множества других изображений и предоставлять опорное изображение (или индекс опорного изображения) и/или сдвиг (пространственное сдвиг) между позицией (x, y координат) опорного блока и позицией текущего блока в качестве параметров внешнего предсказания в блок оценки движения. Это сдвиг также называется вектором движения (MV).

Блок компенсации движения выполнен с возможностью получать, например, принимать параметр внешнего предсказания и выполнять внешнее предсказание на основании или с использованием параметра внешнего предсказания для получения блока 265 внешнего предсказания. Компенсация движения, выполняемая блоком компенсации движения, может содержать выборку или генерирование блока предсказания на основании вектора движения/блока, определяемого оценкой движения, возможно выполнение интерполяции до субпиксельной точности. Интерполяционная фильтрация может генерировать дополнительные выборки пикселей из известных выборок пикселей, таким образом, потенциально увеличивая количество кандидатов блоков предсказания, которые могут использоваться для кодирования блока изображения. После приема вектора движения для PU текущего блока изображения блок компенсации движения может локализовать блок предсказания, на который указывает вектор движения, в одном из списков опорных изображений.

Блок компенсации движения может также генерировать элементы синтаксиса, ассоциированные с блоками и сегментом видео, для использования видеодекодером 30 при декодировании блоков изображения сегмента видео.

Энтропийное кодирование

Блок 270 энтропийного кодирования выполнен с возможностью применять алгоритм или схемы энтропийного кодирования (например, схемы кодирования с переменной длиной (VLC), контекстно-адаптивной схемы VLC (CALVC), схемы арифметического кодирования, контекстно-адаптивного двоичного арифметического кодирования (CABAC), основанное на синтаксисе контекстно-адаптивное двоичное арифметическое кодирование (SBAC), энтропийное кодирование с интервалом вероятности (PIPE) или другие технологии или способы энтропийного кодирования) или схему обхода (без сжатия) на квантованных остаточных коэффициентах 209, параметрах внешнего предсказания, параметрах внутреннего предсказания и/или параметрах контурного фильтра и/или других элементах синтаксиса для получения данных 21 закодированного изображения, которые могут выводиться посредством выхода 272, например, в форме кодированного битового потока 21, так что, например, декодер 30 может принимать и использовать параметры для декодирования. Закодированный битовый поток 21 может быть передан в видеодекодер 30 или сохранен в памяти для последующей передачи или извлечения видеодекодером 30.

Для кодирования видеопотока могут использоваться другие структурные вариации видеокодера 20. Например, кодер 20, не основанный на преобразовании, может квантовать остаточный сигнал напрямую без блока 206 обработки преобразования для конкретных блоков или кадров. В другой реализации кодер 20 может иметь блок 208 квантования и блок 210 обратного квантования, объединенные в единый блок.

Декодер и способ декодирования

На фиг. 3 показан пример видеодекодера 30, который выполнен с возможностью реализации способов настоящего раскрытия. Видеодекодер 30 выполнен с возможностью принимать данные 21 кодированного изображения (например, кодированного битового потока 21), например, кодируемые кодером 20, для получения декодированного изображения 331. Данные кодированного изображения или битовый поток содержит информацию для декодирования данных кодированного изображения, например, данные, которые представляют собой блоки изображения кодированного сегмента видео и ассоциированные элементы синтаксиса.

В примере на фиг. 3, декодер 30 содержит блок 304 энтропийного декодирования, блок 310 обратного квантования, блок 312 обработки обратного преобразования, блок 314 восстановления (например, сумматор 314), контурный фильтр 320, буфер 330 декодированного изображения (DBP), блок 344 внешнего предсказания и блок 354 внутреннего предсказания. Блок внешнего предсказания может быть или включать в себя блок компенсации движения. Видеодекодер 30 может, в некоторых примерах, выполнять процесс декодирования, в целом, обратный этапу кодирования, описанный применительно к видеокодеру 100 на фиг. 2.

Как объяснялось в отношении кодера 20, блок 210 обратного квантования, блок 212 обработки обратного преобразования, блок 214 восстановления, контурный фильтр 220, буфер 230 декодированного изображения (DPB), блок 344 внешнего предсказания и блок 354 внутреннего предсказания также называется формированием «встроенного декодера» видеокодера 20. Соответственно, блок 310 обратного квантования может быть идентичен по функциям блоку 110 обратного квантования, блок 312 обработки обратного преобразования может быть идентичным по функциям блоку 212 обработки обратного преобразования, блок 314 восстановления может быть идентичен по функциям блоку 214 восстановления, контурный фильтр 320 может быть идентичен по функциям контурному фильтру 220 и буфер 330 декодированного изображения может быть идентичен по функциям буферу 230 декодированного изображения. Следовательно, пояснения, предоставленные для соответствующих блоков и функций видеокодера 20, применяются соответственно к соответствующим блокам и функциям видеодекодера 30.

Энтропийное декодирование

Блок 304 энтропийного декодирования выполнен с возможностью выполнять синтаксический анализ битового потока 21 (или, в общем, данных 21 закодированного изображения) и выполнять, например, энтропийное декодирование данных 21 кодированного изображения для получения, например, квантованных коэффициентов 309 и/или параметров декодированного кодирования (не показано на фиг. 3), например, любого или всех параметров внешнего предсказания (например, индекс опорного изображения и вектор движения), параметров внутреннего предсказания (например, режим внутреннего предсказания или индекс), параметров преобразования, параметров квантования, параметров контурного фильтра и/или других элементов синтаксиса. Блок 304 энтропийного декодирования может быть выполнен с возможностью применять алгоритмы или схемы декодирования, соответствующие схемам кодирования, как описано в отношении блока 270 энтропийного кодирования кодера 20. Блок 304 энтропийного декодирования может быть дополнительно выполнен с возможностью предоставлять параметры внешнего предсказания, параметр внутреннего предсказания и/или другие элементы синтаксиса в блок 360 выбора режима и другие параметры в другие блоки декодера 30. Видеодекодер 30 может принимать элементы синтаксиса на уровне сегмента видео и/или уровне видеоблока.

Обратное квантование

Блок 310 обратного квантования может быть выполнен с возможностью принимать параметры квантования (QP) (или, в общем, информацию, относящуюся к обратному квантованию) и квантованные коэффициенты из данных 21 кодированного изображения (например, путем синтаксического анализа и/или декодирования, например, посредством блока 304 энтропийного декодирования) и применять на основании параметров квантования обратное квантование к декодированным квантованным коэффициентам 309 для получения деквантованных коэффициентов 311, которые также могут называться коэффициентами 311 преобразования. Процесс обратного квантования может включать в себя использование параметра квантования, определенного видеокодером 20 для каждого блока видео в сегменте видео, для определения степени квантования и аналогично степени обратного квантования.

Обратное преобразование

Блок 312 обработки обратного преобразования может быть выполнен с возможностью принимать деквантованные коэффициенты 311, также называемые коэффициентами 311 преобразования и применять преобразования к деквантованным коэффициентам 311 для получения восстановленных остаточных блоков 213 в области выборки. Восстановленные остаточные блоки 213 также могут называться блоками 313 преобразования. Преобразование может быть обратным преобразованием, например, обратным DCT, обратным DST, обратным целочисленным преобразованием или концептуально аналогичным процессом обратного преобразования. Блок 312 обработки обратного преобразования может быть дополнительно выполнен с возможностью принимать параметры преобразования или соответствующую информацию из данных 21 закодированного изображения (например, путем синтаксического анализа и/или декодирования, например, посредством блока 304 энтропийного декодирования) для определения преобразования, которое должно применяться к деквантованным коэффициентам 311.

Восстановление

Блок 314 восстановления (например, сумматор 314) выполнен с возможностью добавлять восстановленный остаточный блок 313 к блоку 365 предсказания для получения восстановленного блока 315 в области выборки, например, путем сложения значений выборок восстановленного остаточного блока 313 и значений выборок блока 365 предсказания.

Фильтрация

Блок 320 контурного фильтра (либо в контуре кодирования, либо после контура кодирования) выполнен с возможностью фильтрации восстановленного блока 315 для получения отфильтрованного блока 321, например, для сглаживания переходов пикселей или иного повышения качества видео. Блок 320 контурного фильтра может содержать один или более контурных фильтров, таких как фильтр деблокинга, фильтр с адаптивным сдвигом (SAO) или один или более других фильтров, например, двунаправленный фильтр, адаптивный контурный фильтр (ALF), фильтр сглаживания, фильтр увеличения резкости или коллоборативные фильтры или любую их комбинацию. Хотя на фиг. 3 показан блок 320 контурного фильтра как контурный фильтр, в других конфигурациях блок 320 контурного фильтра может быть реализован как постконтурный фильтр.

Буфер декодированного изображения

Затем декодированные видеоблоки 321 в данном кадре или изображении сохраняются в буфере 330 декодированного изображения, в котором хранятся декодированные изображения 331 в качестве опорных изображений, используемые для последующей компенсации движения для других изображений и/или вывода соответствующего изображения для отображения на дисплее.

Декодер 30 выполнен с возможностью выводить декодированное изображение 311, например, через выход 312 для представления или просмотра пользователю.

Предсказание

Блок 344 внешнего предсказания может быть идентичен блоку 244 внешнего предсказания (в частности, блоку компенсации движения) и блок 354 внутреннего предсказания может быть идентичен блоку 254 внешнего предсказания по функциям и выполняет решения о разделении или разбиении и предсказания на основании параметров разделения и/или предсказания или соответствующей информации, принятой из данных 21 закодированного изображения (например, путем синтаксического анализа и/или декодирования, например, посредством блока 304 энтропийного декодирования). Блок 360 выбора режима может быть выполнен с возможностью выполнять предсказание (внутреннее или внешнее предсказание) для каждого блока на основании восстановленных изображений, блоков или соответствующих выборок (фильтрованных или нефильтрованных) для получения блока 365 предсказания.

Когда сегмент видео кодируется как внутри кодированный (I) сегмент, блок 354 внутреннего предсказания блока 360 выбора режима выполнен с возможностью генерировать блок 365 предсказания для блока изображения текущего сегмента видео на основании сигнализируемого режима внутреннего предсказания и данных из ранее декодированных блоков текущего изображения. Когда видеоизображение кодируется как внешне кодируемый (то есть, B или P) сегмент, блок 344 внешнего предсказания (например, блок компенсации движения) блока 360 выбора режима выполнен с возможностью формировать блоки 365 предсказания для блока видео текущего сегмента видео на основании векторов движения и других элементов синтаксиса, принятых из блока 304 энтропийного декодирования. Для внешнего предсказания блоки предсказания могут быть сформированы из одного из опорных изображений в одном из списков опорных изображений. Видеодекодер 30 может составлять списки опорных кадров, список 0 и список 1, используя способы построения по умолчанию на основании опорных изображений, хранящихся в DPB 330.

Блок 360 выбора режима выполнен с возможностью определять информацию предсказания для блока видео текущего сегмента видео путем анализа векторов движения или других элементов синтаксиса, и использует информацию предсказания для формирования блоков предсказания для текущего декодируемого блока видео. Например, блок 360 выбора режима использует некоторые из принятых элементов синтаксиса для определения режима предсказания (например, внутреннее или внешнее предсказание), используемого для кодирования блоков видео сегмента видео, типа сегмента внешнего предсказания (например, B-сегмент, P-сегмент или GPB-сегмент), информации о построении для одного или нескольких списков опорных изображений для сегмента, векторов движения для каждого внешне кодированного блока видео сегмента, статус внешнего предсказания для каждого внешне кодированного блока видео сегмента и другую информацию для декодирования блоков видео в текущем сегменте видео.

Для декодирования данных 21 закодированного изображения могут использоваться другие варианты видеодекодера 30. Например, декодер 30 может формировать выходной видеопоток без блока 320 контурной фильтрации. Например, декодер 30, не основанный на преобразовании, может выполнять обратное преобразование квантования остаточного сигнала напрямую без блока 312 обработки обратного преобразования для определенных блоков или кадров. В другой реализации видеодекодер 30 может иметь блок 310 обратного квантования и блок 312 обработки обратного преобразования, объединенные в один блок.

Следует понимать, что в кодере 20 и декодере 30 результат обработки текущего этапа может быть дополнительно обработан и затем выведен на следующий этап. Например, после интерполяционной фильтрации, вывода вектора движения или контурной фильтрации может выполняться дополнительная операция, такая как ограничение или сдвиг, над результатом обработки интерполяционной фильтрации, вывода вектора движения или контурной фильтрации.

Следует отметить, что к полученным векторам движения текущего блока (включающие в себя, но не ограничивающие, векторы движения точки управления аффинного режима, векторы движения субблока аффинного, планарного, ATMVP режимов, временные векторы движения и т.п.) могут быть применены дополнительные операции. Например, значение вектора движения ограничивается заданным диапазоном в соответствии с его представляющим битом. Если представляющий бит вектора движения является bitDepth, то диапазон составляет -2 ^ (bitDepth-1) ~ 2 ^ (bitDepth-1) -1, в котором «^» означает возведение в степень. Например, если bitDepth установлен равный 16, то диапазон составляет -32768 ~ 32767; если bitDepth установлен равным 18, то диапазон составляет -131072 ~ 131071. Например, значение полученного вектора движения (например, MVs четырех 4x4 субблоков в пределах одного 8x8 блока) ограничено таким образом, что максимальная разница между целыми частями четырех 4х4 субблока MVs не превышает N пикселей, например, не более 1 пикселя.

Настоящее изобретение предлагает два способа для ограничения вектора движения в соответствии с bitDepth.

Способ 1: удалить переполнение MSB (наиболее значимый бит) посредством операций истечения

ux = (mvx + 2bitDepth)% 2 bitDepth … (1)

mvx = (ux> = 2 bitDepth -1)? (ux - 2 bitDepth): ux … (2)

uy = (mvy + 2 bitDepth)% 2bitDepth … (30)

mvy = (uy> = 2 bitDepth -1)? (uy - 2 bitDepth): uy … (4)

в котором mvx является горизонтальным компонентом вектора движения блока изображения или субблока, mvy является вертикальным компонентом вектора движения блока изображения или субблока и ux и uy указывают на промежуточное значение;

Например, если значение mvx составляет -32769, после применения формулы (1) и (2), полученное значение составляет 32767. В компьютерной системе десятичные числа хранятся в виде двоичной компоненты. Двоичная компонента -32769 составляет 1, 0111,1111,1111,1111 (17 битов) и MSB отбрасывается, поэтому полученная двоичная компонента равна 0111,1111,1111,1111 (десятичное число 32767), что является таким же, как выходное значение после применения формулы (1) и (2).

ux = (mvpx + mvdx + 2bitDepth)% 2bitDepth … (5)

mvx = (ux> = 2bitDepth -1)? (ux - 2bitDepth): ux … (6)

uy = (mvpy + mvdy + 2bitDepth)% 2bitDepth … (7)

mvy = (uy> = 2bitDepth -1)? (uy - 2bitDepth): uy …. (8)

Операции могут быть применены во время суммирования mvp и mvp, как показано в формуле (5) до (8).

Способ 2: удалить переполнение MSB посредством ограничения значения

vx = Clip3(-2bitDepth-1, 2bitDepth-1 -1, vx)

vy = Clip3(-2bitDepth-1, 2bitDepth-1 -1, vy)

в котором vx является горизонтальным компонентом вектора движения блока изображения или субблока, vy является вертикальным компонентом вектора движения блока изображения или субблока; x, y и z соответствуют трем входным значениям процесса ограничения MV и определение функции Clip3 является следующим:

Clip3( x, y, z ) =

Фиг. 4 является схемой устройства 400 кодирования видео согласно варианту осуществления настоящего раскрытия. Устройство 400 кодирования видео подходит для реализации раскрытых вариантов осуществления, как описано в данном документе. В варианте осуществления устройство 400 кодирования видео может быть декодером, таким как видеодекодер 30 по фиг. 1A или кодер, такой как видеокодер 20 по фиг. 1А.

Устройство 400 кодирования видео содержит входные порты 410 и блоки 420 приемника (Rx) для приема данных; процессор, логический блок или центральный процессор (CPU) 430 для обработки данных; блоки 440 передатчика (Tx) и выходные порты 450 для передачи данных; и память 460 для хранения данных. Устройство 400 кодирования видео может также содержать оптико-электрические (OE) компоненты и электрические-оптические (EO) компоненты, подключенные к входным портам 410, блокам 420 приемника, блокам 440 передатчика и выходным портам 450 для вывода или ввода оптических или электрических сигналов.

Процессор 430 реализован аппаратным обеспечением и программным обеспечением. Процессор 430 может быть реализован как одна или более микросхем CPU, ядер (например, как многоядерный процессор), FPGAs, ASICs и DSPs. Процессор 430 связан с входными портами 410, блоками 420 приемника, блоками 440 передатчика, выходными портами 450 и памятью 460. Процессор 430 содержит модуль 470 кодирования. Модуль 470 кодирования реализует раскрытые варианты осуществления, описанные выше. Например, модуль 470 кодирования реализует, обрабатывает, подготавливает или предоставляет различные операции кодирования. Таким образом, использование модуля 470 кодирования обеспечивает существенное улучшение функциональных возможностей устройства 400 кодирования видео и обеспечивает преобразование устройства 400 кодирования видео в другое состояние. В качестве альтернативы модуль 470 кодирования реализован как инструкции, хранящиеся в памяти 460 и выполняемые процессором 430.

Память 460 содержит один или более дисков, ленточных накопителей и твердотельных накопителей и может использоваться в качестве устройства хранения данных с переполнением, для хранения программ, когда такие программы выбраны для выполнения, и для хранения инструкций и данных, которые считываются во время выполнения программы. Память 460 может быть энергозависимой и/или энергонезависимой и может представлять собой постоянную память (ROM), оперативную память (RAM), троичную память с адресацией по содержимому (TCAM) и/или статическую память с произвольным доступом (SRAM).

Фиг. 5 является упрощенной блок-схемой устройства 500, которое может использоваться как одно или оба устройство 12 источника и устройство 14 назначения по фиг. 1 согласно примерному варианту осуществления.

Процессор 502 в устройстве 500 может быть центральным процессором. В качестве альтернативы процессор 502 может быть устройством любого другого типа или множеством устройств, способных манипулировать или обрабатывать информацию, существующую в настоящее время или разработанную в будущем. Хотя раскрытые реализации могут быть реализованы с одним процессором, как показано, например, с процессором 502, преимущества в скорости и эффективности могут быть достигнуты с использованием более чем одного процессора.

В реализации память 504 в устройстве 500 может быть постоянным запоминающим устройством (ROM) или устройством оперативной памяти (RAM). В качестве памяти 504 может использоваться любой другой подходящий тип запоминающего устройства. Память 504 может включать в себя код и данные 506, к которым обращается процессор 502 с использованием шины 512. Память 504 может дополнительно содержать в себя операционную систему 508 и прикладные программы 510, прикладные программы 510 включают в себя, по меньшей мере, одну программу, которая позволяет процессору 502 выполнять описанные в настоящем документе способы. Например, прикладные программы 510 могут содержать в себя приложения с 1 по N, которые дополнительно включают в себя приложение кодирования видео, которое выполняет описанные здесь способы.

Устройство 500 также может включать в себя одно или более устройств вывода, таких как дисплей 518. Дисплей 518 может быть, в одном примере, сенсорным дисплеем, который объединяет дисплей с сенсорным элементом, способным распознавать сенсорные вводы. Дисплей 518 может быть подключен к процессору 502 через шину 512.

Хотя изображена как одна шина, шина 512 устройства 500 может состоять из нескольких шин. Кроме того, вторичное хранилище 514 может быть напрямую связано с другими компонентами устройства 500 или может быть доступно через сеть и может содержать один интегрированный блок, такой как карта памяти, или более блоков, например, несколько карт памяти. Таким образом, устройство 500 может быть реализовано в широком разнообразии конфигураций.

Фиг. 6 иллюстрирует схему множества режимов внутреннего предсказания, используемых в UIP HEVC схеме. Для блоков яркости режимы внутреннего предсказания могут содержать до 36 режимов внутреннего предсказания, что может включать в себя три ненаправленных режима и 33 направленных режима. Ненаправленные режимы могут содержать режим по среднему предсказания (DC) и режим предсказания цветности из (LM) режима предсказания яркости. Планарный режим предсказания может выполнять предсказание, предполагая, что поверхность амплитуды блока с горизонтальной и вертикальной составляющей наклонена от границы блока. DC режим предсказания может выполнять предсказание, предполагая плоскую поверхность блока со значением, соответствующим среднему значению границы блока. Режим предсказания LM может выполнять предсказание, при условии, что значение цветности для блока совпадает с значением яркости для блока.

На фиг. 7 показан пример 67 режимов внутреннего предсказания, например, как, предложенные для VVC, множество режимов внутреннего предсказания из 67 режимов внутреннего предсказания, содержат: планарный режим (индекс 0), dc режим (индекс 1) и угловые режимы с индексами 2-66, в котором левый нижний угловой режим на фиг. 7 относится к индексу 2, и нумерация индексов увеличивается до того, как индекс 66 не будет равным верхнему правому угловому режиму на фиг. 7.

Как показано на фиг. 8, начиная со второй версии VVC, используют несколько режимов, соответствующие наклонным направлениям внутреннего предсказания, включающие в себя широкоугольные (показанные как пунктирные линии). Для любого из этих режимов следует выполнять предсказания выборок в блочной интерполяции набора соседних опорных выборок, если соответствующее положение на стороне блока является дробным. HEVC и VVC используют линейную интерполяцию между двумя соседними опорными выборками. JEM использует более сложные 4-выводные интерполяционные фильтры. Коэффициенты фильтра выбираются как гауссовые, либо кубические в зависимости от ширины или значения высоты. Решение о том, следует ли использовать ширину или высоту, согласуется с решением о выборе главной опорной стороны: когда режим внутреннего предсказания больше или равен диагональному режиму, то выбирается верхняя сторона опорных выборок в качестве главной опорной стороны и значение ширины выбирается для определения использования интерполяционного фильтра. В противном случае основная опорная сторона выбирается с левой стороны блока и высота, управляет процессом выбора фильтра. В частности, если выбранная длина боковой стороны меньше или равна 8 выборкам, применяется 4-отводная кубическая интерполяция. В противном случае интерполяционный фильтр является 4-отводным гауссовским.

Подобно внешнему предсказанию, внутреннее предсказание может потребовать интерполяционной фильтрации, когда выборки внутри блока предсказаны согласно режиму дробного наклона. Если для этой цели используется линейный фильтр, коэффициенты фильтра могут быть легко рассчитаны, если предсказуемая выборка в блоке находится на дробной (субпиксельной) позиции в отношении опорных выборок. Таким образом, линейный фильтр не требует LUT (таблица поиска) для хранения его коэффициента. Тем не менее, его можно использовать, а непосредственно вычислять. Тем не менее, если модуль предсказания использует многоотводные (например, 4- или 8-отводные) интерполяционные фильтры, то может потребоваться LUT для сохранения коэффициента интерполяционных фильтров, так это реализуется в модуле внешнего предсказания, где в таблице храниться 8-выводной DCT-IF для яркости 4-отводной DCT-IF для цветности, как показано в таблице 1 и таблице 2, соответственно.

Таблица 1. Спецификация коэффициентов fL[p] интерполяционного фильтра внешнего предсказания яркости для каждой 1/16 позиции р дробной выборки.

Позиции р дробной выборки Коэффициенты интерполяционного фильтра fL[p][0] fL[p][1] fL[p][2] fL[p][3] fL[p][4] fL[p][5] fL[p][6] fL[p][7] 1 0 1 −3 63 4 −2 1 0 2 −1 2 −5 62 8 −3 1 0 3 −1 3 −8 60 13 −4 1 0 4 −1 4 −10 58 17 −5 1 0 5 −1 4 −11 52 26 −8 3 −1 6 −1 3 −9 47 31 −10 4 −1 7 −1 4 −11 45 34 −10 4 −1 8 −1 4 −11 40 40 −11 4 −1 9 −1 4 −10 34 45 −11 4 −1 10 −1 4 −10 31 47 −9 3 −1 11 −1 3 −8 26 52 −11 4 −1 12 0 1 −5 17 58 −10 4 −1 13 0 1 −4 13 60 −8 3 −1 14 0 1 −3 8 62 −5 2 −1 15 0 1 −2 4 63 −3 1 0

Таблица 2. Спецификация коэффициентов fC[p] интерполяционного фильтра внешнего предсказания цветности для каждой 1/32 позиции р дробной выборки.

Позиции р дробной выборки Коэффициенты интерполяционного фильтра fC[ p ][ 0 ] fC[ p ][ 1 ] fC[ p ][ 2 ] fC[ p ][ 3 ] 1 −1 63 2 0 2 −2 62 4 0 3 -2 60 7 −1 4 −2 58 10 −2 5 −3 57 12 −2 6 −4 56 14 −2 7 −4 55 15 −2 8 −4 54 16 −2 9 −5 53 18 −2 10 −6 52 20 −2 11 −6 49 24 −3 12 −6 46 28 −4 13 −5 44 29 −4 14 −4 42 30 −4 15 −4 39 33 −4 16 −4 36 36 −4 17 −4 33 39 −4 18 −4 30 42 −4 19 −4 29 44 −5 20 −4 28 46 −6 21 −3 24 49 −6 22 −2 20 52 −6 23 −2 18 53 −5 24 −2 16 54 −4 25 −2 15 55 −4 26 −2 14 56 −4 27 −2 12 57 −3 28 −2 10 58 −2 29 −1 7 60 −2 30 0 4 62 −2 31 0 2 63 −1

Может быть определен конкретный набор коэффициентов, как показано в таблице 3.

Таблица 3. Спецификация коэффициентов fC и fG интерполяции внутреннего предсказания, как описано в спецификации VVC версии 3.

Позиции р дробной выборки Коэффициенты fC интерполяционного фильтра Коэффициенты fG интерполяционного фильтра fC[p][0] fC[p][1] fC[p][2] fC[p][3] fG[p][0] fG[p][1] fG[p][2] fG[p][3] 0 0 64 0 0 16 32 16 0 1 −1 63 2 0 15 29 17 3 2 −2 62 4 0 15 29 17 3 3 −2 60 7 −1 14 29 18 3 4 −2 58 10 −2 13 29 18 4 5 −3 57 12 −2 13 28 19 4 6 −4 56 14 −2 13 28 19 4 7 −4 55 15 −2 12 28 20 4 8 −4 54 16 −2 11 28 20 5 9 −5 53 18 −2 11 27 21 5 10 −6 52 20 −2 10 27 22 5 11 −6 49 24 −3 9 27 22 6 12 −6 46 28 −4 9 26 23 6 13 −5 44 29 −4 9 26 23 6 14 −4 42 30 −4 8 25 24 7 15 −4 39 33 −4 8 25 24 7 16 −4 36 36 −4 8 24 24 8 17 −4 33 39 −4 7 24 25 8 18 −4 30 42 −4 7 24 25 8 19 −4 29 44 −5 6 23 26 9 20 −4 28 46 −6 6 23 26 9 21 −3 24 49 −6 6 22 27 9 22 −2 20 52 −6 5 22 27 10 23 −2 18 53 −5 5 21 27 11 24 −2 16 54 −4 5 20 28 11 25 −2 15 55 −4 4 20 28 12 26 −2 14 56 −4 4 19 28 13 27 −2 12 57 −3 4 19 28 13 28 −2 10 58 −2 4 18 29 13 29 −1 7 60 −2 3 18 29 14 30 0 4 62 −2 3 17 29 15 31 0 2 63 −1 3 17 29 15

Вычисляется выборка с внутренним предсказанием путем свертывания с коэффициентами, определенными в соответствии со смещением субпикселя и типом фильтра следующим образом:

В этом уравнении указывает побитовую операцию сдвига вправо.

Набор коэффициентов извлечен из таблицы поиска (LUT). В таблице 3 приведен пример значений, хранящихся в соответствии с текущей структурой VVC, описанной в проекте спецификации версии 3 (DJVET-L1001 «Универсальное кодирование видео (проект 3)». Осуществляется выбор между сглаживающим (fG), повышения резкости (fG) и интерполяционными фильтрами с использованием условий MDIS (зависимый от режима внутреннего сглаживания). Таким образом, fC или fG могут использоваться для генерирования предсказанных выборок блока.

Если выбран фильтр повышения резкости, предсказанная выборка дополнительно обрезается до допустимого диапазона значений, который либо определяется с использованием SPS, или получен из битой глубины выбранного компонента.

Для некоторых случаев использования можно выгодно избежать сохранения явных LUTs для интерполяционных фильтров, поскольку обработка LUT требует дополнительной памяти и, таким образом, повышает потребление энергии, а также размер кристалла. 1-й аспект имеет решающее значение для мобильных приложений. 2-й аспект неблагоприятно влияет на цену.

Для упомянутых случаев использования разумно аналитически определить коэффициенты интерполяционных фильтров. Вместо того, чтобы выполнять извлечение из LUT, коэффициенты фильтра могут быть рассчитаны от входной позиции р дробной выборки.

Согласно варианту осуществления настоящего раскрытия, предложен способ внутреннего или внешнего предсказания обработки видеокадров, содержащий этапы: получение опорной выборки; получение значения смещения субпикселя; и фильтрация, используя 4-отводной интерполяционный фильтр субпикселя, опорной выборки для получения предсказанного значения выборки, в котором коэффициенты фильтра 4-отводного интерполяционного фильтра субпикселя удовлетворяют:

В котором р является дробной частью значения смещения субпикселя и , , , и являются коэффициентами фильтра 4-отводного интерполяционного фильтра субпикселя.

В одной примерной реализации опорные выборки могут обозначаться ref[ x ], с

ref[ x ] = p[ −1 − refIdx + x ][ −1 − refIdx ], with x = 0..nTbW + refIdx + 1.

Соответствующий массив опорных выборок и «р» относится к x-y двумерным массивам p[ x ][ y ], содержащий значения выборки. Количество используемых опорных выборок может быть, по меньшей мере, один. В другом примере количество опорных выборок может быть четыре.

В одной примерной реализации полученное значение смещения субпикселя может обозначаться

(y + 1 + refIdx ) * intraPredAngle

где «IntraРredAngle» является значением угла внутреннего предсказания.

В одной примерной реализации предсказанное значение выборки «predSamples[ x ][ y ]» может быть получено с помощью

predSamples[ x ][ y ] = Clip1( ( ( ) + 32 ) >> 6 )

где fT[ i ] обозначает коэффициенты фильтрации. Эти коэффициенты могут представлять собой коэффициенты фильтра яркости или цветности для внешнего предсказания, относящиеся к fG и fC соответственно.

Выбор коэффициентов фильтра, являющихся цветности или яркости, может быть реализован путем использования и установки флага «filterFlag», например, как

fT[ j ] = filterFlag ? fG[ iFact ][ j ] : fC[ iFact ][ j ]

с

iFact = ( ( y + 1 + refIdx ) * intraPredAngle ) & 31.

Значение «31» относится к дробной части значения смещения субпикселя и может принять другие значения, отличные от «31». Значения коэффициентов фильтра fG (яркости) и/или fC (цветности), получают аналитически по ходу выполнения с использованием вышеуказанного аналитического выражения для коэффициентов фильтра 4-отводного фильтра. Таким образом, коэффициенты фильтра определяются в соответствии со значением смещения субпикселя.

Следовательно, коэффициенты фильтра получают без доступа к соответствующим значениям коэффициентов фильтра из LUT, а скорее получают путем расчета.

Альтернативно, коэффициенты фильтра могут быть рассчитаны с использованием приведенные выше уравнения и значения могут храниться в LUT.

Согласно варианту осуществления настоящего раскрытия, коэффициенты фильтра 4-отводного интерполяционного фильтра субпикселя определены в таблице следующим образом:

p 0 16 32 16 0 1 16 32 16 0 2 15 31 17 1 3 15 31 17 1 4 14 30 18 2 5 14 30 18 2 6 13 29 19 3 7 13 29 19 3 8 12 28 20 4 9 12 28 20 4 10 11 27 21 5 11 11 27 21 5 12 10 26 22 6 13 10 26 22 6 14 9 25 23 7 15 9 25 23 7 16 8 24 24 8 17 8 24 24 8 18 7 23 25 9 19 7 23 25 9 20 6 22 26 10 21 6 22 26 10 22 5 21 27 11 23 5 21 27 11 24 4 20 28 12 25 4 20 28 12 26 3 19 29 13 27 3 19 29 13 28 2 18 30 14 29 2 18 30 14 30 1 17 31 15 31 1 17 31 15

Согласно аспекту настоящего раскрытия предложен способ внутреннего или внешнего предсказания обработки видеокадров, содержащий этапы: получение опорной выборки; получение значения смещения субпикселя; и фильтрация с использованием 4-отводного интерполяционного фильтра субпикселя, опорной выборки для получения предсказанного значения выборки, в котором коэффициенты фильтра 4-отводного интерполяционного фильтра субпикселя определяются следующим образом:

p 0 16 32 16 0 1 16 32 16 0 2 15 31 17 1 3 15 31 17 1 4 14 30 18 2 5 14 30 18 2 6 13 29 19 3 7 13 29 19 3 8 12 28 20 4 9 12 28 20 4 10 11 27 21 5 11 11 27 21 5 12 10 26 22 6 13 10 26 22 6 14 9 25 23 7 15 9 25 23 7 16 8 24 24 8 17 8 24 24 8 18 7 23 25 9 19 7 23 25 9 20 6 22 26 10 21 6 22 26 10 22 5 21 27 11 23 5 21 27 11 24 4 20 28 12 25 4 20 28 12 26 3 19 29 13 27 3 19 29 13 28 2 18 30 14 29 2 18 30 14 30 1 17 31 15 31 1 17 31 15

где p является дробной частью значения смещения субпикселя и , , и являются коэффициентами фильтра 4-отводного интерполяционного фильтра субпикселя.

В одной примерной реализации значения коэффициентов фильтра могут храниться в LUT. Это означает, что для интерполяционной фильтрации субпикселей соответствующие значения коэффициентов фильтра должны быть извлечены из LUT.

Фиг. 23 показывает блок-схему алгоритма процесса внутреннего/внешнего предсказания. На этапе 2301 получается опорную выборку. Опорная выборка может включать в себя одну или более опорных выборок. На этапе 2302 получено значение смещения субпикселя. На этапе 2303 опорную выборку затем фильтруют с использованием интерполяционного фильтра субпикселя, имеющего коэффициенты фильтра с i = 0, … 3. Это называется 4-отводным фильтром и/или 4-точечным фильтром.

Коэффициенты фильтра могут быть получены из аналитических выражений с заданной дробной частью р значения смещения субпикселя. Коэффициенты фильтра также могут быть получены из LUT со ссылкой на значения р.

Согласно варианту осуществления настоящего раскрытия, бит р устанавливается на ноль.

Согласно варианту осуществления настоящего раскрытия, р увеличивается на 1 и впоследствии младший бит увеличенного р устанавливается на ноль до того, как упомянутый р используется для получения коэффициентов фильтра.

Согласно варианту осуществления настоящего раскрытия, получение коэффициентов фильтра содержит этап вычисления коэффициентов фильтра в соответствии с

Это может обеспечить преимущество вычисления коэффициента фильтра от предшествующего коэффициента фильтра. Это может дополнительно уменьшить время для расчета коэффициентов фильтра.

Предлагаемое изобретение позволяет использовать оба подхода для получения коэффициентов фильтра: получение из LUT и непосредственным вычислением в соответствии с предлагаемыми уравнениями.

Один из признаков интерполяционного фильтра состоит в линейной зависимости его фазового сдвига на позиции р дробной выборки. Варианты осуществления изобретения используют эту зависимость, чтобы получить значение коэффициента фильтра с использованием простых операций на позиции р дробной выборки.

Линейная зависимость используется для получения коэффициентов fG сглаживания интерполяционного фильтра. Получение коэффициентов fC повышения резкости интерполяционного фильтра основано на получении абсолютного значения линейного выражения на основе p.

Согласно варианту осуществления настоящего раскрытия, предложен способ кодирования видео, способ содержит обработку внутреннего предсказания блока видеокадра, содержащую: фильтрацию с использованием 4-отводного интерполяционного фильтра субпикселя опорной выборки видеокадра; в котором 4-отводной интерполяционный фильтр субпикселя представляет собой комбинацию фильтров, с коэффициентами фильтра, по меньшей мере, одного из фильтров, удовлетворяющий:

где p является дробной частью значения смещения субпикселя и , , и являются коэффициентами фильтра.

Фиг. 24 показывает блок-схему алгоритма процесса кодирования видео. На этапе 2410 выполняется обработка внутреннего предсказания путем фильтрации опорной выборки блока с использованием 4-отводного интерполяционного фильтра субпикселя.

Согласно варианту осуществления настоящего раскрытия, 4-отводной интерполяционный фильтр субпикселя представляет собой сглаживающий фильтр, который представляет собой параллельную комбинацию двух фазозависимых линейных фильтров и фильтра низких частот.

Согласно варианту осуществления настоящего раскрытия, 4-отводной интерполяционный фильтр субпикселя представляет собой фильтр повышения резкости, который представляет собой параллельную комбинацию одного фазозависимого линейного фильтра и высокочастотного фильтра с изменяющейся мощностью.

Согласно аспекту нынешнего изобретения, высокочастотный фильтр с изменяющейся мощностью представляет собой фазонезависимый высокочастотный фильтр с конечной импульсной характеристикой FIR, выход которого умножен на параметр фазозависимой мощности.

Согласно любому из предшествующих аспектов настоящего раскрытия, младший бит р устанавливается на ноль.

Согласно аспекту настоящего раскрытия, р увеличивается на 1, и затем младший бит увеличенного значения установлен на ноль до использования этого значения для получения коэффициентов интерполяционного фильтра.

Согласно аспекту настоящего раскрытия, выполняется операция отсечения для выхода высокочастотного фильтра с изменяющейся мощностью.

Варианты осуществления изобретения выражают коэффициент фильтра как комбинация двух или более FIR (конечная импульсная характеристика) фильтров. Эта комбинация может содержать следующие варианты:

- последовательная комбинация, то есть, свертка коэффициентов;

- параллельная комбинация, то есть, взвешенная сумма коэффициентов.

Каждый из этих фильтров может или не может зависеть от параметра P фазы, который является функцией позиции р дробной выборки. Коэффициенты фильтров, принадлежащих к комбинации, имеют простое представление из параметра P фазы.

В одном варианте осуществления на фиг. 9, используется набор опорных выборок в интерполяционном фильтре.

В одном варианте осуществления для случая сглаживающего интерполяционного фильтра значение параметра P фазы является таким же значение позиции р дробной выборки. На фиг. 9, блоки F1 и F2 представляют линейные интерполяционные фильтры. Коэффициенты для каждого из этих фильтров выражены из параметра P фазы следующим образом:

В примере, здесь и дальше, операция разделения может быть определена с округлением или без возобновления, то есть:

или

В котором «а» является знаменателем деления, и «n» является степенью двух параметров знаменателя.

Блок F3 представляет собой двухотводной фильтр низких частот, имеющий постоянные коэффициенты:

,

.

В примере, фильтры F1..F3 не нормированы, F3 имеет более высокий DC усиления, чем F1 и F3 имеют более высокий DC усиления, чем F2.

Выход фильтров F1 .. F3 суммируется и нормализован. Нормализация (блок «>>») может быть выполнена, например, смещением вправо или делением с округлением, как описано выше.

Результирующее уравнение для этой комбинации (эквивалентный 4-отводному фильтру) выражается следующим образом:

Этот вариант осуществления обеспечивает реализацию на основе LUT. Согласно этой реализации, значения коэффициентов также могут быть определены с использованием LUT. Значения, хранящиеся в этой LUT, определяются с помощью таблицы 4 (для обоих случаев: с и без округления).

Таблица 4 - Спецификация коэффициента фильтра интерполяции внутреннего предсказания сглаживающего фильтра.

p С округлением Без округления 0 16 32 16 0 16 32 16 0 1 15 31 17 1 16 32 16 0 2 15 31 17 1 15 31 17 1 3 14 30 18 2 15 31 17 1 4 14 30 18 2 14 30 18 2 5 13 29 19 3 14 30 18 2 6 13 29 19 3 13 29 19 3 7 12 28 20 4 13 29 19 3 8 12 28 20 4 12 28 20 4 9 11 27 21 5 12 28 20 4 10 11 27 21 5 11 27 21 5 11 10 26 22 6 11 27 21 5 12 10 26 22 6 10 26 22 6 13 9 25 23 7 10 26 22 6 14 9 25 23 7 9 25 23 7 15 8 24 24 8 9 25 23 7 16 8 24 24 8 8 24 24 8 17 7 23 25 9 8 24 24 8 18 7 23 25 9 7 23 25 9 19 6 22 26 10 7 23 25 9 20 6 22 26 10 6 22 26 10 21 5 21 27 11 6 22 26 10 22 5 21 27 11 5 21 27 11 23 4 20 28 12 5 21 27 11 24 4 20 28 12 4 20 28 12 25 3 19 29 13 4 20 28 12 26 3 19 29 13 3 19 29 13 27 2 18 30 14 3 19 29 13 28 2 18 30 14 2 18 30 14 29 1 17 31 15 2 18 30 14 30 1 17 31 15 1 17 31 15 31 0 16 32 16 1 17 31 15

Из таблицы 4 можно заметить, что коэффициенты находятся в пределах диапазона [0, 31]. Этот факт объясняет техническую выгоду изобретения, которая состоит в использовании 16-битных множителей для 8-битных и 10-битных изображений, которые используются и будут использоваться, по меньшей мере, на среднесрочной перспективе. Типичная реализация изобретения будет содержать четыре параллельные операции умножения, в котором операнды умножения имеют битовые глубины, максимум 6 для коэффициентов фильтра и 10 для выборок. Результат умножения не превысит 16-битное значение, что делает предложенные коэффициенты, дружественные от точки зрения реализации.

В режиме внешнего предсказания выполняется компенсация движения блока движения. Компенсация движения может содержать этап интерполяционной фильтрации, которая аналогична фильтрации внутреннего предсказания. Еще одно полезное свойство изобретения состоит в том, что коэффициенты интерполяционных фильтров имеют одинаковую точность (то есть, глубина битов значения коэффициентов одинакова) для режимов внутреннего и внешнего предсказания. Если точность коэффициентов интерполяционных фильтров выше в случае внутреннего предсказания, что может отрицательно повлиять на вычислительную сложность видеокодека. Причина в том, что внутреннее предсказание по своей природе последовательно, поскольку требуется восстановленных выборок предшествующих блоков. Напротив, внешнее предсказание можно выполнять параллельно. Следовательно, если точность интерполяции выше для внутреннего предсказания, чем для внешнего предсказания, что может углубить несоответствие осуществления между конвейерами внутреннего и внешнего предсказания. Это выравнивание точности позволяет избежать таких негативных последствий.

Еще одним преимуществом предлагаемого изобретения является уменьшение разнообразия коэффициентов. Учитывая, что пары соседних строк табл.4 идентичны, практическая реализация изобретения будет использовать LUT, которая имеет всего 16 строк (строки, соответствующие четным значениям p в столбце «без округления», и строки, соответствующие нечетным значениям p в столбце «с округлением») вместо 32 строк.

Техническим эффектом изобретения является возможность реализаций, по меньшей мере, следующих:

- реализация без LUT, которые вычисляют коэффициенты фильтра с использованием значений р, в котором вычисление основано на аналитических уравнениях, описанных выше; и

- реализация на основании LUT, которые получают коэффициенты фильтра из LUT, используя значение индекса на основании значения p.

Точность значения p уменьшается при вычислении значений коэффициентов. В частности, значение коэффициентов получены на основании результата целочисленного деления на 2, то есть, р/2, которые могут быть реализованы в виде смещения вправо на 1, что просто реализуется в оборудовании. Для реализации на основе LUT точность уменьшается, что приводит к снижению памяти, необходимой для хранения LUT. В оборудовании это также уменьшит количество проводов адресной шины LUT.

Согласно варианту осуществления настоящего раскрытия, предложено устройство для внутреннего или внешнего предсказания обработки видеокадра, включающее в себя: блок получения опорной выборки, выполненный с возможностью получать опорную выборку; блок получения значения смещения субпикселя, выполненный с возможностью получать значение смещения субпикселя; и 4-отводной интерполяционный фильтр субпикселя, выполненный с возможностью фильтрации опорной выборки для получения предсказанного значения выборки, в котором коэффициенты фильтра 4-отводного интерполяционного фильтра субпикселя удовлетворяют:

где p является дробной частью значения смещения субпикселя и , , и являются коэффициентами фильтра 4-отводного интерполяционного фильтра субпикселя.

Согласно варианту осуществления настоящего раскрытия, коэффициенты фильтра 4-отводного интерполяционного фильтра субпикселя определены в таблице следующим образом:

p 0 16 32 16 0 1 16 32 16 0 2 15 31 17 1 3 15 31 17 1 4 14 30 18 2 5 14 30 18 2 6 13 29 19 3 7 13 29 19 3 8 12 28 20 4 9 12 28 20 4 10 11 27 21 5 11 11 27 21 5 12 10 26 22 6 13 10 26 22 6 14 9 25 23 7 15 9 25 23 7 16 8 24 24 8 17 8 24 24 8 18 7 23 25 9 19 7 23 25 9 20 6 22 26 10 21 6 22 26 10 22 5 21 27 11 23 5 21 27 11 24 4 20 28 12 25 4 20 28 12 26 3 19 29 13 27 3 19 29 13 28 2 18 30 14 29 2 18 30 14 30 1 17 31 15 31 1 17 31 15

Согласно аспекту настоящего раскрытия, предложено устройство для внутреннего или внешнего предсказания видеокадра, содержащее: блок получения опорной выборки, выполненный с возможностью получать опорную выборку; блок получения значения смещения субпикселя, выполненный с возможностью получать значение смещения субпикселя; и 4-отводной интерполяционный фильтр субпикселя, выполненный с возможностью фильтрации опорной выборки для получения предсказанного значения выборки, в котором коэффициенты фильтра 4-отводного интерполяционного фильтра субпикселя определяются следующим образом:

p 0 16 32 16 0 1 16 32 16 0 2 15 31 17 1 3 15 31 17 1 4 14 30 18 2 5 14 30 18 2 6 13 29 19 3 7 13 29 19 3 8 12 28 20 4 9 12 28 20 4 10 11 27 21 5 11 11 27 21 5 12 10 26 22 6 13 10 26 22 6 14 9 25 23 7 15 9 25 23 7 16 8 24 24 8 17 8 24 24 8 18 7 23 25 9 19 7 23 25 9 20 6 22 26 10 21 6 22 26 10 22 5 21 27 11 23 5 21 27 11 24 4 20 28 12 25 4 20 28 12 26 3 19 29 13 27 3 19 29 13 28 2 18 30 14 29 2 18 30 14 30 1 17 31 15 31 1 17 31 15

где p является дробной частью значения смещения субпикселя и , , и являются коэффициентами фильтра.

Фиг. 25 показывает схему модуля 2500 обработки внутреннего/внешнего предсказания, который содержит блок 2510 получения опорной выборки, блок 2520 получения значения смещения субпикселя и интерполяционный фильтр 2530 субпикселя.

Согласно аспекту настоящего раскрытия, предложено устройство для кодирования видео, содержащее: блок обработки внутреннего предсказания, выполненный с возможностью выполнять внутреннее предсказание блока видеокадра; и 4-отводной интерполяционный фильтр субпикселя, выполненный с возможностью фильтрации опорной выборки видеокадра; в котором 4-отводной интерполяционный фильтр субпикселя представляет собой комбинацию фильтров, с коэффициентами фильтра, по меньшей мере, одного из фильтров, удовлетворяющий:

где p является дробной частью значения смещения субпикселя и , , и являются коэффициентами фильтра.

Фиг. 26 показывает схему модуля 2600 кодирования видео, который содержит блок 2610 обработки внутреннего предсказания и интерполяционный фильтр 2620 субпикселя.

Согласно аспекту настоящего раскрытия, предусмотрен кодер (20), содержащий схему обработки для выполнения способа по любому из предшествующих аспектов настоящего раскрытия.

Согласно аспекту настоящего раскрытия, предложен декодер (30), содержащий схему обработки для выполнения способа по любому из предшествующих аспектов настоящего раскрытия.

Согласно аспекту настоящего раскрытия, предоставляется компьютерный программный продукт, содержащий программный код для выполнения способа в соответствии с любым из предшествующих аспектов настоящего раскрытия.

Согласно аспекту настоящего раскрытия, предусмотрен декодер, содержащий: один или более процессоров; и постоянный машиночитаемый носитель, соединенный с процессорами и хранящий программы для выполнения процессорами, в котором программы, при выполнении процессорами, конфигурируют декодер выполнить способ в соответствии с любым из предшествующих аспектов настоящего раскрытия.

Согласно аспекту настоящего раскрытия, предусмотрен кодер, содержащий: один или более процессоров; и постоянный машиночитаемый носитель, соединенный с процессорами и хранящий программы для выполнения процессорами, в котором программы, при выполнении процессорами, конфигурируют кодер выполнить способ в соответствии с любым из предшествующих аспектов настоящего раскрытия.

Настоящее изобретение по любому из предшествующих аспектов может обеспечить более эффективный способ внутреннего/внешнего предсказания видеокадра. Это связано с тем, что коэффициенты фильтра интерполяционного фильтра получены аналитическими способом, то есть, упомянутые коэффициенты вычисляются в процессе обработки. Это позволяет избежать хранения коэффициентов в таблице поиска (LUT), требующих времени доступа для чтения коэффициентов из памяти.

Таким образом, предсказание становится более эффективным и требует меньшего объема памяти. Это обеспечивает также недорогую реализацию предсказания. Более того, поскольку аналитические коэффициенты фильтра являются линейными на позиции р дробной выборки, и используются операции деления на 2, соответствующая операция может быть эффективно выполнена, используя быструю низкоуровневую битовую операцию. Соответствующее время для выполнения битовой операции и для расчета коэффициентов фильтра короче времени доступа к хранимым коэффициентам из LUT. Таким образом, задержка обработки сокращается.

Более того, конкретная аналитическая структура коэффициентов фильтра может обеспечить преимущество реализации низкой сложности блока (блоков) фильтра. Как было описано ранее, частотная характеристика фильтра (т.е. частотная характеристика) для различных позиций субпикселей соответствует отношению амплитуде и фазы и предотвращает появления артефактов в частотной характеристике, в частности, на высоких частотах. Линейность коэффициентов фильтра может обеспечить преимущество повторного использования оборудования.

В одном варианте осуществления для случая интерполяционного фильтра повышения резкости параметр S мощности определяется следующим образом:

Этот параметр S мощности определяется для получения максимального значения на позиции полупикселя (p = 16). Для позиций субпикселей, близких к целочисленным, параметр S мощности имеет более низкое значение. Примерная комбинация фильтров показана на фиг. 10. Блок F1 в этой фигуре представляет собой линейный фильтр с его коэффициентами, определенными следующим образом:

,

.

Блок F2 представляет собой высокочастотный фильтр, имеющий следующие коэффициенты:

Выход блока F2 умножается на параметр S мощности. Результат умножения дополнительно суммируется с выходом линейного фильтра F1, и полученная сумма нормализована.

Результирующее уравнение для этой комбинации (эквивалентный 4-отводному фильтру) выражается следующим образом:

Для этого уравнения также возможна реализация на основе LUT. Таблица 5 иллюстрирует значения коэффициентов.

Таблица 5. Спецификация интерполяционного фильтра внутреннего предсказания коэффициента фильтра повышения резкости

p 0 0 64 0 0 1 0 62 2 0 2 0 60 4 0 3 -1 59 7 -1 4 -1 57 9 -1 5 -1 55 11 -1 6 -2 54 14 -2 7 -2 52 16 -2 8 -3 51 19 -3 9 -3 49 21 -3 10 -3 47 23 -3 11 -4 46 26 -4 12 -4 44 28 -4 13 -4 42 30 -4 14 -5 41 33 -5 15 -5 39 35 -5 16 -6 38 38 -6 17 -5 35 39 -5 18 -5 33 41 -5 19 -4 30 42 -4 20 -4 28 44 -4 21 -4 26 46 -4 22 -3 23 47 -3 23 -3 21 49 -3 24 -3 19 51 -3 25 -2 16 52 -2 26 -2 14 54 -2 27 -1 11 55 -1 28 -1 9 57 -1 29 -1 7 59 -1 30 0 4 60 0 31 0 2 62 0

Поскольку фильтр F2 имеет отрицательные коэффициенты, нормализованный результат дополнительно обрезается, чтобы соответствовать диапазону допустимых значений, которые могут быть либо сигнализируются в SPS или получены из битовой глубины выборок.

Альтернативный вариант осуществления состоит в том, чтобы указать альтернативную позицию операции отсечения (см. фиг. 11). Этот альтернативный вариант основан на том, что линейный фильтр F1 может не иметь выходного значения, которое ниже или выше, чем любое из его входных значений.

В одном варианте осуществления блок отсечения работает с использованием следующих этапов.

Этап один состоит в определении выполнить отсечение по минимальному пороговому значению или максимальному пороговому значению.

Этап два зависит от результата этапа один. В частности, выполняется отсечение либо минимальному, либо по максимальному пороговому значению.

Минимальное пороговое значение применяется в случае, когда вход в блок отсечения является отрицательным. В противном случае применяется максимальное пороговое значение. Выход этапа два (и блока отсечения) может быть определен следующим образом:

Для входного значения рассчитывается вывод минимального порогового значения следующим образом:

Выход максимального порогового значения рассчитывается следующим образом:

в котором является максимальным значением диапазона допустимого значения выборки.

Значения и являются входными опорными выборками, показанными на фиг. 11, которые являются входом линейного фильтра F1.

В одном варианте осуществления на случае выполнения отсечения после операции умножения, рассчитывается следующим образом:

В некоторых вариантах осуществления фильтр F3 на фиг. 9, фильтр F2 на фиг. 10 и фиг. 11 может не зависеть от параметра Р фазы. Эти варианты осуществления упрощают реализацию, поскольку вывод этих фильтров может быть одинаковым для каждого входной строки предсказанных выборок, таким образом, этот этап может быть выполнен перед началом процесса интерполяции, например, на этапе фильтрации опорной выборки. Этот подход увеличивает параллелизм и, таким образом, снижает задержку направленной фильтрации.

Другой альтернативный вариант осуществления (см. фиг. 12) использует фильтр регулируемой мощности, а не только множитель выхода фильтра. Фиг. 12А показывает случай, когда выполняется отсечение выхода высокочастотного фильтра F2. Фиг. 12B показывает случай, когда выполняется отсечение выхода нормированного выхода комбинации F1 и F2. Пример фильтров регулируемой мощности может быть следующим: двусторонний фильтр, фильтр обратного преобразования и т.д.

Другой вариант осуществления использует снижение разрешения р, то есть, только 16 из 32 записей. Это достигается, например, установкой наименее значимого бита р на ноль.

Как показано на фиг. 13-21, различные комбинации с использованием LUT и аналитических представлений коэффициентов интерполяционного фильтра возможны как для внутреннего, так и для внешнего предсказания. Для примеров фиг. 14 иллюстрирует случай использования, когда вычисляются коэффициенты для сглаживания интерполяционного фильтра, используемыми в случае внутреннего предсказания, в то время, как коэффициенты для других интерполяционных фильтров для внутреннего предсказания, так и для внешнего предсказания хранятся в LUTs. Дополнительно, спецификация кодирования видео может включать в себя как LUT, так и аналитические представления коэффициентов интерполяционного фильтра для осуществления различных реализаций. Если описаны оба представления на основе LUT и аналитические представления должны обеспечивать идентичные коэффициенты.

Фиг. 22 представляет собой реализацию способа расчета коэффициентов, как показано на фиг. 1.

В уравнении

Параметр S мощности определяется следующим образом:

Эта реализация соответствует другому способу получения параметра S мощности (обозначается как результирующее значение «q» на фиг. 22). Значение позиции р дробной выборки p направляется в демультиплексор Demux, который управляется входным 1-битным сигналом SEL, который устанавливается на значение 5-го наименьшего значимого бита р (имеющего и индекс 4, если индексация начинается с нуля). Если этот бит равен «1», то сигнал SEL указывает, что значение р больше 16, и следует рассчитывать следующее значение:

= − ( not (31 xor ) ),

Где «not» и «xor» являются побитовыми операциями NOT и XOR, соответственно. Это выражение относится к q = (32 - р) и может быть записано на языках программирования C/C ++, как

= -(~(0x1F ^ )).

В противном случае (то есть, если входной сигнал SEL демультиплексора Demux равен «0»), любые расчеты обойдены, и сигнал р направляется в мультиплексор MUX, как сигнал q. Выходной сигнал r мультиплексора MUX передается в модуль, который вычисляет значение t следующим образом:

t = ((r << 1) + r) >> 3,

Где «<<» и «>>» являются смещением вправо и влево, соответственно.

Фактически, это значение t представляет собой параметр S мощности. Возможна дополнительная оптимизация путем выполнения этапов, показанных на фиг. 22, параллельно с одним из коэффициентов линейного фильтра:

z = (64 - (p << 1))

Как только значения z и S были вычислены, их можно добавить друг к другу для получения .

Хотя варианты осуществления изобретения были в основном описаны на основании кодирования видео, следует отметить, что варианты осуществления системы 10 кодирования, кодера 20 и декодера 30 (и, соответственно, системы 10) и другие варианты осуществления, описанные в данном документе, также могут быть выполнены с возможностью обработки или кодирования неподвижного изображения, то есть, обработка или кодирование отдельного изображения независимо от любого предшествующего или последующего изображения, как при кодировании видео. В общем, если обработка кодирования изображения ограничена одним изображением 17, могут быть недоступны только блоки 244 (кодер) и 344 (декодер) внешнего предсказания. Все другие функции (также называемые инструментами или технологиями) видеокодера 20 и видеодекодер 30 могут в равной степени использоваться для обработки неподвижных изображений, например, вычисление остатка 204/304, преобразование 206, квантование 208, обратное квантование 210/310, (обратное) преобразование 212/312, разделение 262/362, внутреннее предсказание 254/354 и/или контурная фильтрация 220, 320 и энтропийное кодирование 270 и энтропийное декодирование 304.

Варианты осуществления, например, кодера 20 и декодера 30, а также описанные здесь функции, например, применительно к кодеру 20 и декодеру 30 могут быть реализованы аппаратным обеспечением, программным обеспечением, встроенным программным обеспечением или любой их комбинацией. Если реализованы в программном обеспечении, функции могут храниться на машиночитаемом носителе или передаваться через среду связи в виде одной или нескольких инструкций или кода и выполняться аппаратным процессором. Машиночитаемый носитель может содержать в себя машиночитаемый носитель данных, который соответствует материальному носителю, например, носителю данных, или носителю связи, включающему в себя любой носитель, который облегчает передачу компьютерной программы из одного места в другое, например, в соответствии с протоколом связи. Таким образом, машиночитаемые носители обычно могут соответствовать (1) материальным машиночитаемым носителям данных, которые являются энергонезависимыми, или (2) средам связи, таким как сигнал или несущая волна. Носители данных могут быть любыми доступными носителями, к которым может получить доступ один или более компьютеров или один или более процессоров для извлечения инструкций, кода и/или структур данных для реализации способов, описанных в настоящем изобретении. Компьютерный программный продукт может содержать в себя машиночитаемый носитель.

В качестве примера, но не ограничения, такие машиночитаемые носители данных могут содержать RAM, ROM, EEPROM, CD-ROM или другое запоминающее устройство на оптическом диске, запоминающее устройство на магнитном диске или другие магнитные запоминающие устройства, флэш-память или любой другой носитель, который может использоваться для хранения требуемого программного кода в форме инструкций или структур данных и может быть доступен для компьютера. Дополнительно, любое соединение правильно называть машиночитаемым носителем. Например, если инструкции передаются с веб-сайта, сервера или другого удаленного источника с использованием коаксиального кабеля, оптоволоконного кабеля, витой пары, цифровой абонентской линии (DSL) или беспроводных технологий, таких как инфракрасный порт, радио и микроволновый сигнал, тогда коаксиальный кабель, оптоволоконный кабель, витая пара, DSL или беспроводные технологии, такие как инфракрасный порт, радио и микроволновый сигнал рассматриваются в качестве среды связи. Однако следует понимать, что машиночитаемые носители данных и носители данных не включают в себя соединения, несущие волны, сигналы или другие временные носители, а вместо этого относятся к энергонезависимым материальным носителям данных. Диск, как используется в настоящем документе, включает в себя компакт-диск (CD), лазерный диск, оптический диск, цифровой универсальный диск (DVD), дискету и диск Blu-ray, где диски обычно воспроизводят данные магнитным способом, и диски воспроизводят данные оптически с помощью лазеров. Комбинации вышеперечисленного также должны быть включены в объем машиночитаемых носителей.

Инструкции могут выполняться одним или несколькими процессорами, такими как один или более процессоров цифровых сигналов (DSP), микропроцессоры общего назначения, специализированные интегральные схемы (ASIC), программируемые логические матрицы (FPGA) или другие эквивалентные интегральные или дискретные логические схемы. Соответственно, термин «процессор», используемый в настоящем описании, может относиться к любой из вышеупомянутой структуре или любой другой структуре, подходящей для реализации описанных способов. Дополнительно, в некоторых аспектах, описанные в настоящем документе, функциональные возможности могут быть предоставлены в рамках выделенных аппаратных и/или программных модулей, выполненных с возможностью кодировать и декодировать или содержащиеся в комбинированном кодеке. Дополнительно, способы могут быть полностью реализованы в одной или нескольких схемах или логических элементах.

Способы настоящего раскрытия могут быть реализованы в большом количестве устройств или приспособлений, включающие в себя беспроводной телефон, интегральную схему (IC) или набор ICs (например, набор микросхем). В настоящем изобретении описаны различные компоненты, модули или блоки для представления функциональных аспектов устройств, выполненных с возможностью выполнять раскрытые технологии, но не обязательно требующих реализации различными аппаратными блоками. Скорее, как описано выше, различные блоки могут быть объединены в аппаратный блок кодека или предоставлены набором взаимодействующих аппаратных блоков, включающий в себя один или более процессоров, как описано выше, в сочетании с подходящим программным обеспечением и/или встроенным программным обеспечением.

Суммируя, настоящее изобретение относится к внутреннему или внешнему предсказанию для кодирования и декодирования видео. Для этой цели устройство и способы получают опорную выборку и значение смещения субпикселя. Для получения предсказанного значения для фильтрации опорного выборки используется 4-отводной интерполяционный фильтр субпикселя. Коэффициенты фильтрации 4-отводного интерполяционного фильтра субпикселя определены в соответствии со значением смещения субпикселя, таких как , , и , = p / 2, р является дробной частью значения смещения субпикселя.

Дополнительные варианты осуществления суммированы в следующих пунктах:

Пункт 1: Способ внутреннего или внешнего предсказания технологии кодирования видео, способ содержит:

получение опорной выборки (то есть, по меньшей мере, одну опорную выборку в примере, количество опорных выборок может быть четыре);

получение значения смещения субпикселя; и

фильтрация, используя интерполяционный фильтр субпикселя, опорной выборки для получения предсказанного значения выборки, в котором коэффициенты фильтра интерполяционного фильтра субпикселя получают в соответствии со значением смещения субпикселя.

Пункт 2: Способ по п. 1, в котором коэффициент фильтра интерполяционного фильтра субпикселя получают в зависимости от дробной части значения смещения субпикселя.

Пункт 3: Способ по п. 1 или п. 2, в котором интерполяционный фильтр субпикселя представляет собой эквивалентный 4-отводной фильтр.

Пункт 4: Способ по п. 3, в котором коэффициенты фильтра интерполяционного фильтра субпикселя получают в соответствии с

в котором р является дробной частью значения смещения субпикселя.

Пункт 5: Способ по п. 3, в котором коэффициенты фильтрации интерполяционного фильтра субпикселя получают в соответствии с

где параметр S мощности определяется следующим образом:

в котором р является дробной частью значения смещения субпикселя.

Пункт 6: Способ по любому из пп. 1-5, в котором бит (например, младший бит или самый младший бит) смещения р субпикселя устанавливается на ноль.

Пункт7: Способ по любому из пп. 1-5, в котором значение смещения p увеличивается на 1, и после этого младший бит увеличенного значения установлен на нулевое значение до использования этого значения для получения коэффициентов фильтра.

Пункт 8: Способ кодирования видео, способ содержит обработку внутреннего предсказание блока, содержащий интерполированную фильтрацию субпикселя, применяемую к опорным выборкам;

в котором интерполяционный фильтр субпикселя представляет собой комбинацию фильтров, по меньшей мере, одного из фильтров, определяемый в соответствии со смещением субпикселя.

Пункт 9: Способ по п. 8, в котором интерполяционный фильтр представляет собой сглаживающий фильтр, который является параллельной комбинацией двух фазозависимых линейных фильтров и фильтра нижних частот.

Пункт 10: Способ по п. 8, в котором интерполяционный фильтр представляет собой фильтр повышения резкости, который является параллельной комбинацией одного фазозависимого линейного фильтра и высокочастотного фильтра с изменяющейся мощностью.

Пункт 11: Способ по п. 10, в котором высокочастотного фильтра с изменяющейся мощностью представляет собой фазозависимый высокочастотный фильтр, выход которого умножается на фазозависимый параметр мощности.

Пункт 12: Способ по п. 9, в котором комбинация фильтра представляет собой эквивалент 4-отводного фильтра, имеющий коэффициенты, указанные в соответствии с уравнениями:

в котором р является позицией р дробной выборки.

Пункт 13: Способ по п. 11, в котором комбинация фильтра представляет собой эквивалент 4-отводного фильтра, имеющий коэффициенты, указанные в соответствии с уравнениями:

в котором параметр S мощности определяется следующим образом:

Пункт 14: Способ по любому из предшествующих пунктов, в котором младший бит позиции р дробной выборки устанавливается на ноль.

Пункт 15: Способ по любому из пп. 8-13, в котором позиция р дробной выборки увеличивается на 1, и после этого младший бит увеличенного значения устанавливается на ноль до использования для получения коэффициентов интерполяционного фильтра.

Пункт 16: Способ по п. 10 или п. 11, в котором операция отсечения выполняется для вывода высокочастотного фильтра с изменяющейся мощностью.

Пункт 17: Кодер (20), содержащий схему обработки для выполнения способа по любому из пп. 1-16.

Пункт 18: Декодер (30), содержащий схему обработки для выполнения способа по любому из пп. 1-16.

Пункт 19: Компьютерный программный продукт, содержащий программный код для выполнения способа по любому из пп. 1-16.

Пункт 20: Декодер, содержащий:

один или более процессоров; и

машиночитаемый носитель, соединенный с процессорами, и хранящий программы для выполнения процессором, в котором программы при выполнении процессором, побуждают декодер выполнить способ по любому из пп. 1-16.

Пункт 21: Кодер, содержащий:

один или более процессоров; и

машиночитаемый носитель, соединенный с процессорами, и хранящий программы для выполнения процессором, в котором программы при выполнении процессором, побуждают кодер выполнить способ по любому из пп. 1-16.

Пункт 22: Способ для внутреннего или внешнего предсказания технологии кодирования видео, способ содержит:

получение опорной выборки (то есть, по меньшей мере, одну опорную выборку в примере, количество опорных выборок может быть четыре);

получение позиции дробной выборки; и

фильтрацию с использованием интерполяционного фильтра субпикселя опорной выборки для получения предсказанного значения выборки, в котором коэффициенты фильтра интерполяционного фильтра субпикселя получены в соответствии с

в котором S является параметром мощности, р является позицией дробной выборки, являются коэффициентами фильтра.

Пункт 23: Способ по п. 22, в котором способ дополнительно содержит:

получение значения сигнала SEL путем принятия N-го наиболее значительного бита позиции р дробной выборки, N является положительным целым числом;

получение промежуточного значения q, в котором q устанавливается равным значению позиции р дробной выборки, когда сигнал SEL равен нулю; или q установлен на - (not (31 xor p)), когда сигнал SEL не нулевой;

получение параметра S мощности, используя одну дополнительную операцию и операции сдвига:

S = (( << 1) + ) >> 3

Пункт 24: Способ по п. 23, где N равен 5.

Пункт 25: Способ по любому из пп. 22-24, в котором интерполяционный фильтр субпикселя представляет собой эквивалент 4-отводного фильтра.

Пункт 26: Способ по любому из пп. 22-25, в котором параметр S мощности рассчитывается параллельно с коэффициентом z линейного фильтра, в котором коэффициент z линейного фильтра используется для получения коэффициента интерполяционного фильтра и где

Пункт 27: Способ по любому из пп. 22-25, в котором бит (например, младший бит или более низкий бит) позиции р дробной выборки устанавливается на ноль.

Пункт 28: Способ по любому из пп. 22-26, в котором позиция р дробной выборки повышается на 1 и затем младший бит увеличенного значения устанавливается на ноль до использования данного значения для получения коэффициентов фильтра.

Пункт 29: Способ кодирования видео, способ содержит обработку внутреннего предсказания блока, содержащую интерполяционную фильтрацию субпикселя, применяемую к опорным выборкам;

в котором интерполяционный фильтр субпикселя представляет собой комбинацию фильтров, по меньшей мере, одного из фильтров, определяемого в соответствии с позицией дробной выборки.

Пункт 29: Способ по п. 28, в котором интерполяционный фильтр представляет собой сглаживающий фильтр, который является параллельной комбинацией двух фазозависимых линейных фильтров и фильтра нижних частот.

Пункт 30: способ по п. 29, в котором интерполяционный фильтр представляет собой фильтр повышения резкости, который представляет собой параллельную комбинацию одного фазозависимого линейного фильтра и высокочастотного фильтра с изменяющейся мощностью.

Пункт 31: Способ по п. 30, в котором высокочастотный фильтр с изменяющейся мощностью представляет собой FIR фазонезависимый высокочастотный фильтр, выход которого умножается на параметр фазозависимой мощности.

Пункт 32: Кодер (20), содержащий схему обработки для выполнения способа по любому из пп. 22-31.

Пункт 33: декодер (30), содержащий схему обработки для выполнения способа по любому из пп. 22-31.

Пункт 34: Компьютерный программный продукт, содержащий программный код для выполнения способа по любому из пп. 22-31.

Пункт 35: Декодер, содержащий:

один или более процессоров; а также

машиночитаемый носитель, соединенный с процессорами, и хранящий программы для выполнения процессором, в котором программы при выполнении процессором, побуждают декодер выполнить способ по любому из пп. 22-31.

Пункт 36: Кодер, содержащий:

один или более процессоров; и

машиночитаемый носитель, соединенный с процессорами, и хранящий программы для выполнения процессором, в котором программы при выполнении процессором, побуждают кодер выполнить способ по любому из пп. 22-31.

Список ссылочных позиций

Фиг. 1А

10 система кодирования видео

12 устройство источника

13 канал связи

14 устройство назначения

16 источник изображения

17 данные изображения

18 предварительный процессор

19 предварительно обработанные данные изображения

20 видеокодер

21 закодированные данные изображения

22 интерфейс связи

28 интерфейс связи

30 видеодекодер

31 данные декодированного изображения

32 постпроцессор

33 пост-обработанные данные изображения

34 устройство отображения

Фиг1В.

40 система кодирования видео

41 устройство (устройства) визуализации

42 антенна

43 процессор (ы)

44 память

45 устройство отображения

46 схема обработки

20 видеокодер

30 видеодекодер

Фиг. 2.

17 изображение (данные)

19 предварительно обработанное изображение (данные)

20 кодер

21 данные закодированного изображения

201 вход (интерфейс)

204 вычисление остатка [блок или этап]

206 блок обработки преобразования

208 блок квантования

210 блок обратного квантования

212 блок обработки обратного преобразования

214 блок восстановления

220 блок контурного фильтра

230 буфер декодированных изображений (DPB)

260 блок выбора режима

270 блок энтропийного кодирования

272 выход (интерфейс)

244 блок внешнего предсказания

254 блок внутреннего предсказания

262 блок разделения

203 блок изображения

205 остаточный блок

213 восстановленный остаточный блок

215 восстановленный блок

221 фильтрованный блок

231 декодированное изобретение

265 блок предсказания

266 синтаксические элементы

207 коэффициенты преобразования

209 квантовые коэффициенты

211 деквантованные коэффициенты

Фиг. 3

21 данные закодированного изображения

30 видеодекодер

304 блок энтропийного декодирования

309 квантованные коэффициенты

310 блок обратного квантования

311 деквантованные коэффициентов

312 блок обработки обратного преобразования

313 восстановленный остаточный блок

314 блок восстановления

315 восстановленный блок

320 контурный фильтр

321 отфильтрованный блок

330 буфер декодированного изображения DBP

331 декодированное изображение

360 блок применения режима

365 блок предсказания

366 синтаксические элементы

344 блок внешнего предсказания

354 блок внутреннего предсказания

Фиг. 4.

400 устройство кодирования видео

410 порты ввода / порты входа

420 блоки приемника RX

430 процессор

440 блоки передатчика TX

450 порты вывода / порты выхода

460 память

470 модуль кодирования

Фиг. 5.

500 устройство источника или устройство назначения

502 процессор

504 память

506 код и данные

508 операционной системы

510 прикладные программы

512 шина

518 дисплей

Фиг. 23

2300 блок-схема алгоритма способа обработки внутреннего/внешнего предсказания

Фиг. 24

2400 блок-схема алгоритма способа кодирования видео

Фиг. 25.

2500 модуль внутреннего/внешнего предсказания

2510 блок получения опорной выборки

2520 блок получения значения смещения субпикселя

2530 интерполяционный фильтр субпикселя

Фиг. 26

2600 модуль кодирования видео

2610 блок обработки внутреннего предсказания

2620 интерполяционный фильтр субпикселя

Похожие патенты RU2787217C1

название год авторы номер документа
СПОСОБ ВЫЧИСЛЕНИЯ ПОЗИЦИИ ОПОРНОЙ ВЫБОРКИ ЦЕЛОЧИСЛЕННОЙ СЕТКИ ДЛЯ ВЫЧИСЛЕНИЯ ГРАДИЕНТА ГРАНИЧНОЙ ВЫБОРКИ БЛОЧНОГО УРОВНЯ В ВЫЧИСЛЕНИИ ОПТИЧЕСКОГО ПОТОКА С ДВОЙНЫМ ПРЕДСКАЗАНИЕМ И КОРРЕКЦИИ С ДВОЙНЫМ ПРЕДСКАЗАНИЕМ 2020
  • Сетураман, Срирам
  • А, Джива Радж
  • Котеча, Сагар
RU2820638C2
СПОСОБ И УСТРОЙСТВО КРОСС-КОМПОНЕНТНОГО ЛИНЕЙНОГО МОДЕЛИРОВАНИЯ ДЛЯ ВНУТРЕННЕГО ПРЕДСКАЗАНИЯ 2019
  • Руфицкий, Василий Алексеевич
  • Чен, Цзянле
  • Ма, Сян
  • Филиппов, Алексей Константинович
RU2786086C1
УСТРОЙСТВО И СПОСОБ ДЛЯ ОГРАНИЧЕНИЙ УРОВНЯ БЛОКА В ЗАВИСИМОСТИ ОТ РЕЖИМА И РАЗМЕРА 2019
  • Филиппов, Алексей Константинович
  • Руфицкий, Василий Алексеевич
  • Чэнь, Цзяньлэ
RU2786022C1
РАННЕЕ ПРЕКРАЩЕНИЕ УТОЧНЕНИЯ ОПТИЧЕСКОГО ПОТОКА 2020
  • Эсенлик, Семих
  • Сетураман, Срирам
  • А, Джива Радж
  • Котеча, Сагар
RU2808608C2
ПОДОБНАЯ ИНТЕРПОЛЯЦИИ ФИЛЬТРАЦИЯ ПОЛОЖЕНИЙ ЦЕЛОЧИСЛЕННЫХ ПИКСЕЛЕЙ ПРИ ВИДЕОКОДИРОВАНИИ 2009
  • Е Янь
  • Карчевич Марта
RU2477577C2
СПОСОБ ДЕКОДИРОВАНИЯ ВИДЕО ДЛЯ КОМПЕНСАЦИИ ДВИЖЕНИЯ 2020
  • Боссен, Франк, Ян
RU2739499C1
СМЕШАННЫЕ ФИЛЬТРЫ С ОТВОДАМИ 2011
  • Джоши Раджан Л.
  • Карчевич Марта
  • Чиэнь Вэй-Цзюн
RU2543953C2
УРОВНИ ОГРАНИЧЕНИЯ ДЛЯ НЕЛИНЕЙНОГО АДАПТИВНОГО КОНТУРНОГО ФИЛЬТРА 2020
  • Степин, Виктор Алексеевич
  • Иконин, Сергей Юрьевич
  • Алшина, Елена Александровна
RU2818228C2
СПОСОБ И УСТРОЙСТВО ДЛЯ КОМПЕНСАЦИИ ДВИЖЕНИЯ С ПРЕДСКАЗАНИЕМ 2019
  • Боссен, Франк, Ян
RU2721004C1
СПОСОБ И УСТРОЙСТВО ДЛЯ ФИЛЬТРАЦИИ ИЗОБРАЖЕНИЙ С АДАПТИВНЫМИ КОЭФФИЦИЕНТАМИ МНОЖИТЕЛЯ 2018
  • Есенлик, Семих
  • Котра, Ананд, Мехер
  • Чжао, Чжицзе
  • Чэнь, Цзяньлэ
RU2772313C2

Иллюстрации к изобретению RU 2 787 217 C1

Реферат патента 2022 года СПОСОБ И УСТРОЙСТВО ИНТЕРПОЛЯЦИОННОЙ ФИЛЬТРАЦИИ ДЛЯ КОДИРОВАНИЯ С ПРЕДСКАЗАНИЕМ

Изобретение относится к средствам для кодирования видео. Технический результат заключается в повышении эффективности кодирования видео. Получают опорную выборку. Получают значение смещения субпикселя. Выполняют фильтрацию, с использованием 4-отводного интерполяционного фильтра, опорной выборки для получения предсказанного значения выборки, причем коэффициенты фильтрации, 4-отводного интерполяционного фильтра, определяются следующим образом: с0=16-, с1=16+с0, с20+р, с3=, причем операция деления выполняется с округлением в меньшую сторону. При этом р является дробной частью значения смещения субпикселя, а с0, с1, с2 и с3 являются коэффициентами фильтрации. 6 н. и 6 з.п. ф-лы, 27 ил.

Формула изобретения RU 2 787 217 C1

1. Способ обработки внутреннего предсказания или внешнего предсказания видеокадра, содержащий этапы, на которых:

получают опорную выборку;

получают значение смещения субпикселя и

выполняют фильтрацию, с использованием 4-отводного интерполяционного фильтра, опорной выборки для получения предсказанного значения выборки, причем

коэффициенты фильтрации, 4-отводного интерполяционного фильтра, определяются следующим образом:

где р является дробной частью значения смещения субпикселя, а с0, с1, с2 и с3 являются коэффициентами фильтрации.

2. Способ по п. 1, в котором наименее значащий бит р устанавливается в ноль.

3. Способ по п. 1, в котором р увеличивается на 1 и впоследствии младший бит увеличенного р устанавливается в ноль до того, как упомянутый р используется для получения коэффициентов фильтрации.

4. Способ по п. 1, в котором коэффициенты фильтрации вычислены в соответствии с

,

с1=16+с0,

с20+р,

причем операция деления выполняется с округлением в меньшую сторону.

5. Устройство обработки внутреннего предсказания или внешнего предсказания видеокадра, содержащее:

блок получения опорной выборки, выполненный с возможностью получения опорной выборки;

блок получения значения смещения субпикселя, выполненный с возможностью получения значения смещения субпикселя; и

4-отводной интерполяционный фильтр, выполненный с возможностью фильтрации опорной выборки для получения предсказанного значения выборки, причем

коэффициенты фильтрации, 4-отводного интерполяционного фильтра, определяются следующим образом:

где р является дробной частью значения смещения субпикселя, а с0, с1, с2 и с3 являются коэффициентами фильтра.

6. Устройство по п. 5, в котором наименее значащий бит р установлен в ноль.

7. Устройство по п. 5, в котором р увеличивается на 1 и далее младший бит увеличенного р устанавливается в ноль до использования указанного р для получения коэффициентов фильтрации.

8. Устройство по п. 5, в котором коэффициенты фильтрации вычислены согласно

,

с1=16+с0,

с20

причем операция деления выполняется с округлением в меньшую сторону

9. Декодер, содержащий:

один или более процессоров и

постоянный машиночитаемый носитель, соединенный с процессорами и хранящий программы, вызывающие, при исполнении процессорами, выполнение декодером способа по любому из пп. 1-4.

10. Постоянный носитель, содержащий битовый поток, декодированный способом по любому из пп. 1-4.

11. Машиночитаемый носитель, хранящий программу, записанную на нем, при этом программа вызывает выполнение компьютером способа по любому из пп. 1-4.

12. Кодер, содержащий:

один или более процессоров и

постоянный машиночитаемый носитель, соединенный с процессорами и хранящий программы, вызывающие, при исполнении процессорами, выполнение кодером способа по любому из пп. 1-4.

Документы, цитированные в отчете о поиске Патент 2022 года RU2787217C1

Способ защиты переносных электрических установок от опасностей, связанных с заземлением одной из фаз 1924
  • Подольский Л.П.
SU2014A1
US 9451254 B2, 20.09.2016
Токарный резец 1924
  • Г. Клопшток
SU2016A1
Автомобиль-сани, движущиеся на полозьях посредством устанавливающихся по высоте колес с шинами 1924
  • Ф.А. Клейн
SU2017A1
Способ получения цианистых соединений 1924
  • Климов Б.К.
SU2018A1

RU 2 787 217 C1

Авторы

Руфицкий, Василий Алексеевич

Чэнь, Цзяньлэ

Филиппов, Алексей Константинович

Даты

2022-12-30Публикация

2019-12-20Подача