СПОСОБ И УСТРОЙСТВО ДЛЯ ПРЕДСТАВЛЕНИЯ И ИДЕНТИФИКАЦИИ ДЕСКРИПТОРОВ ПРИЗНАКОВ С ИСПОЛЬЗОВАНИЕМ СЖАТОЙ ГИСТОГРАММЫ ГРАДИЕНТОВ Российский патент 2014 года по МПК G06K9/64 G06T9/40 

Описание патента на изобретение RU2505856C2

ОБЛАСТЬ ТЕХНИКИ

Варианты осуществления настоящего изобретения относятся, в общем, к обработке изображений и распознаванию признаков и, в частности, к формированию и идентификации дескрипторов признаков, представляющих заранее заданные признаки в изображении.

УРОВЕНЬ ТЕХНИКИ

В ряде приложений желательно иметь возможность идентификации признаков в изображении. Например, может быть захвачено изображение, включающее характерное здание, ориентир или другой объект, при этом желательно автоматически идентифицировать это здание, ориентир или другой объект. С этой целью в приложениях машинного зрения и поиска изображений применяют идентификацию признаков изображения, которую все больше используют для распознавания объектов в реальном времени, трехмерной реконструкции, сшивки панорам, роботизированного картографирования и видеослежения.

Например, изображение может захватываться мобильным устройством, таким как мобильный телефон, цифровая фотокамера и т.п. Мобильное устройство может затем передавать изображение или дескрипторы признаков, представляющие различные признаки этого изображения, сетевому объекту, например, серверу приложений. После этого сетевой объект может сравнить изображение или дескрипторы признаков, представляющие указанное изображение, с рядом заранее заданных изображений или дескрипторов признаков ряда заранее заданных изображений. Посредством идентификации наиболее точного соответствия сетевой объект может идентифицировать признак в указанном изображении, например, характерное здание, ориентир и т.п.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

В соответствии с одним из вариантов осуществления изобретения предложены способ, устройство и компьютерный программный продукт для формирования множества сжатых дескрипторов признаков, которые могут быть представлены относительно небольшим количеством битов, что упрощает передачу и хранение дескрипторов признаков. В соответствии с еще одним вариантом осуществления настоящего изобретения предложены также способ, устройство и компьютерный программный продукт, допускающие сравнение сжатого представления дескриптора признаков с множеством сжатых представлений дескрипторов соответствующих заранее заданных признаков. Посредством сравнения, которое должно быть выполнено с использованием сжатых представлений дескрипторов признаков, соответствующий дескриптор признаков может быть идентифицирован без необходимости его предварительной распаковки, что обеспечивает потенциальное увеличение эффективности идентификации дескрипторов признаков.

В одном из вариантов осуществления изобретения предложен способ формирования дескрипторов, включающих относительное малое количество битов. С этой целью способ может определить множество градиентов для каждой ячейки из множества ячеек изображения. Способ может также назначить градиент, определенный для соответствующей ячейки, соответствующему столбцу гистограммы (бину) из множества столбцов гистограммы, чем достигается квантование градиентов. Затем, может быть определено множество дескрипторов признаков, каждый из которых включает представление распределения градиентов по множеству столбцов гистограммы соответствующей ячейки. Множество дескрипторов признаков затем может быть сжато, например, с использованием древовидного кодирования. Благодаря тому, что дескрипторы признаков определяют рассмотренным образом, а затем сжимают результирующие дескрипторы признаков, например, с использованием древовидного кодирования, указанные дескрипторы признаков могут быть представлены относительно малым количеством битов, что упрощает их передачу, хранение и/или обработку.

В еще одном варианте осуществления изобретения предложен способ идентификации признака на основе сжатого представления дескриптора признаков. В этой связи может быть выполнено сравнение сжатого представления дескриптора признаков с множеством сжатых представлений дескрипторов соответствующих заранее заданных признаков. На основе указанного сравнения может быть идентифицировано, что упомянутое сжатое представление дескриптора признаков представляет заранее заданный признак, без необходимости предварительной распаковки дескриптора признаков. Вследствие сравнения и идентификации без необходимости распаковки дескриптора признаков процесс указанной идентификации может быть выполнен эффективно.

В других вариантах осуществления настоящего изобретения предложены соответствующий процессор и соответствующий компьютерный программный продукт. В этой связи устройство согласно одному из вариантов осуществления может включать процессор, сконфигурированный для выполнения каждой из описанных выше функций. В других вариантах осуществления изобретения может быть предложен компьютерный программный продукт, включающий по меньшей мере один машиночитаемый носитель с хранимыми на нем исполняемыми компьютером инструкциями программного кода, при этом исполняемые компьютером инструкции программного кода включают инструкции программного кода, сконфигурированные для выполнения каждой из описанных выше функций.

По существу, варианты осуществления способа, устройства и компьютерного программного продукта могут допускать определение и сжатие дескрипторов признаков способом, уменьшающим количество передаваемых и/или хранимых битов, например, в сочетании с приложениями, сконфигурированными для идентификации конкретных признаков. Другие варианты осуществления способа, устройства и компьютерного программного продукта могут обеспечивать идентификацию заранее заданного признака на основе сравнения, выполняемого со сжатым представлением дескриптора признаков, что упрощает эффективную идентификацию признаков без необходимости распаковки дескрипторов признаков.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Описав, таким образом, настоящее изобретение в общих чертах, обратимся к прилагаемым сопроводительным чертежам, не обязательно выполненным в масштабе, на которых:

фиг.1 иллюстрирует блок-схему системы, поддерживающей формирование, передачу и идентификацию дескрипторов признаков в соответствии с вариантами осуществления настоящего изобретения.

фиг.2 представляет собой блок-схему устройства для формирования дескрипторов признаков в соответствии с вариантами осуществления настоящего изобретения;

фиг.3 представляет собой блок-схему устройства для идентификации сжатых представлений дескрипторов признаков в соответствии с еще одним вариантом осуществления настоящего изобретения;

фиг.4 представляет собой блок-схему, иллюстрирующую последовательность операций для формирования множества дескрипторов признаков в соответствии с одним из вариантов осуществления настоящего изобретения.

фиг.5а и 5b представляют совместное распределение градиентов x, y для большого количества ячеек и кривые контуров совместного распределения градиентов x, y, соответственно;

фиг.6a-6d представляют распределение градиентов x, y для четырех различных отдельных ячеек, которые объединены потенциально с распределениями других ячеек, так чтобы включать совместное распределение градиентов x, y, показанное на фиг.5а;

фиг.7а-7е иллюстрируют пять различных конфигураций столбцов гистограммы, которые могут применяться в сочетании с вариантами осуществления настоящего изобретения;

фиг.8 изображает рабочие характеристики приемника для аппроксимаций, обеспечиваемых четырьмя различными конфигурациями столбцов гистограммы, показанными на фиг 7a-7d, в соответствии с вариантами осуществления настоящего изобретения, в сравнении с аппроксимацией, полученной посредством масштабно-инвариантного преобразования признаков (SIFT, scale invariant feature transform).

фиг.9а представляет распределение градиентов для ячейки, а фиг.9b изображает гистограммы градиентов для распределения, показанного на фиг.9а, в несжатой форме, и последующее древовидное кодирование по методу Гаджи и Хаффмана в соответствии с вариантами осуществления настоящего изобретения.

фиг.10 представляет изображение деревьев Гаджи и деревьев Хаффмана, которые могут быть сформированы с четырьмя листьями;

фиг.11 иллюстрирует древовидное кодирование гистограмм градиентов по методу Хаффмана для двух ячеек, а также предварительное вычисление расстояний между парами распределений градиентов в соответствии с вариантами осуществления изобретения; и

фиг.12 представляет собой блок-схему, иллюстрирующую другую последовательность операций для идентификации сжатого представления дескриптора признаков в соответствии с еще одним вариантом осуществления настоящего изобретения.

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

Далее будут более подробно рассмотрены отдельные варианты осуществления настоящего изобретения со ссылками на сопроводительные чертежи, на которых показаны некоторые, но не все, варианты осуществления. Различные варианты осуществления настоящего изобретения могут быть реализованы во множестве различных форм, при этом изобретение не следует считать ограниченным вариантами осуществления, изложенными в настоящем описании; указанные варианты осуществления изобретения приведены для соответствия настоящего описания официальным требованиям подачи заявок. Одинаковые элементы обозначены одинаковыми позициями. В настоящем документе термины "данные", "контент", "информация" и им подобные могут быть использованы как взаимозаменяемые для обозначения данных, которые могут передаваться, приниматься или храниться в соответствии с вариантами осуществления настоящего изобретения. Кроме того, термин "пример" в настоящем описании не несет качественной оценки, а используется только для иллюстрации примеров. Таким образом, применение любого из упомянутых выше терминов не следует понимать как ограничение объема настоящего изобретения, определяемого вариантами его осуществления.

На фиг.1 изображена система, в которой возможно эффективное применение вариантов осуществления настоящего изобретения. Как показано на чертеже, система включает один или более терминалов 10 связи, которые могут осуществлять связь друг с другом и с различными сетевыми объектами по сети 12. Несмотря на то что в настоящем описании варианты осуществления терминала связи проиллюстрированы и описаны для примера, варианты осуществления настоящего изобретения могут быть применены и в других типах терминалов, например, персональных цифровых помощниках (portable digital assistants, PDA), пейджерах, мобильных телевизорах, мобильных телефонах, игровых устройствах, портативных компьютерах, фотоаппаратах, видеомагнитофонах, аудио/видеоплеерах, радиоприемниках, устройствах глобальной системы позиционирования (global position system, GPS) или любой комбинации выше перечисленного, а также в других типах голосовых или текстовых систем связи. Кроме того, варианты осуществления настоящего изобретения могут применяться в терминалах связи, не являющихся мобильными. Дополнительно, упомянутая сеть может быть проводной или беспроводной сетью любого типа, сконфигурированной для поддержки связи между различными терминалами связи и различными сетевыми объектами. Например, сеть может включать набор различных узлов, устройств или функций, таких как сервер 14 приложений, которые могут быть связаны друг с другом посредством соответствующих проводных и/или беспроводных интерфейсов. В некоторых вариантах осуществления изобретения, но не обязательно, сеть может быть способна поддерживать связь в соответствии с одним или более протоколами связи первого поколения (first generation, 1G), второго поколения (second generation, 2G), поколения 2.5G, третьего поколения (third-generation, 3G), поколения 3.5G, поколения 3.9G, четвертого поколения (fourth-generation, 4G), долгосрочной эволюции (long-term evolution, LTE) и/или им аналогичными. В соответствии с одним из вариантов осуществления настоящего изобретения терминал 10 связи может захватывать изображение, например, изображение мемориальной церкви на изображении, показанном на фиг.1. В соответствии с дальнейшим описанием, терминал связи в этом варианте осуществления изобретения может затем формировать и сжать набор дескрипторов признаков, представляющих различные признаки в этом изображении. Затем, терминал связи может передать сжатые дескрипторы признаков по сети 12 в сетевой объект, например, сервер 14 приложений, как показано на фиг.1. Сервер в данном варианте осуществления изобретения может затем сравнить сжатые дескрипторы признаков изображения, захваченного устройством связи, с базой данных сжатых дескрипторов признаков, представляющих различные заранее заданные признаки. Затем, сервер может идентифицировать заранее заданные признаки, которые имеют дескрипторы признаков, наиболее сходные с дескрипторами признаков изображения, захваченного терминалом связи,и, если дескрипторы признаков сходны в достаточной степени, сервер может идентифицировать, что признаки в изображении, например, здания, ориентиры и т.п., те же самые, что и заранее заданные признаки, хранимые в базе данных. Затем сервер может осуществить связь с терминалом связи для предоставления информации, идентифицирующей признак(-и) в изображении и, в некоторых случаях, может предоставлять дополнительную информацию, связанную с этим признаком(-ами), например, его название, адрес, историческую информацию, маркетинговую информацию и т.п.

Хотя терминал 10 связи может быть сконфигурирован различными способами, один из примеров терминала связи, допускающий эффективное применение настоящего изобретения, изображен в виде блок-схемы на фиг.2, иллюстрирующей мобильную станцию 20. Несмотря на то что в настоящем описании для примера проиллюстрирован и рассмотрен один из вариантов осуществления терминала связи, варианты осуществления настоящего изобретения могут быть применены и в терминалах других типов, например, персональных цифровых помощниках (PDA), пейджерах, мобильных телевизорах, игровых устройствах, компьютерах любых типов (например, портативных или мобильных компьютерах), фотоаппаратах, аудио/видеоплеерах, радиоприемниках, устройствах глобальной системы позиционирования (GPS) или любой комбинации вышеперечисленного. В соответствии с описанием, терминал связи может включать различные средства для выполнения одной или более функций согласно вариантам осуществления настоящего изобретения, включая показанные и рассмотренные более подробно в настоящем описании. Однако следует понимать, что терминал связи может включать альтернативные средства для выполнения одной или более аналогичных функций, не выходя за пределы объема настоящего изобретения.

Мобильная станция 20 проиллюстрированного варианта осуществления изобретения может включать антенну 32 (или множество антенн), функционально связанную с передатчиком 34 и приемником 36. Мобильная станция может также включать устройство, например процессор 40, который подает сигналы в передатчик и принимает сигналы от приемника. Упомянутые сигналы могут включать информации сигнализации в соответствии со стандартом радиоинтерфейса применяемой сотовой системы, и/или данные, соответствующие речи абонента, принимаемым данным или данным, формируемым абонентом. Для этого мобильная станция может быть способна работать с одним или более стандартами радиоинтерфейса, протоколами связи, типами модуляции и типами доступа. Например, мобильная станция может быть способна работать в соответствии с любым количеством протоколов связи первого, второго, третьего и/или четвертого поколения и/или аналогичными им. Например, мобильный терминал может быть способен работать в соответствии с протоколами беспроводной связи второго поколения (2G) IS-136, глобальной системы мобильной связи (Global System for Mobile communications, GSM) и IS-95, или с протоколами беспроводной связи третьего поколения (3G), такими как универсальная система мобильной связи (Universal Mobile Telecommunications System, UMTS), множественный доступ с кодовым разделением 2000 (Code Division Multiple Access 2000, CDMA 2000), широкополосный множественный доступ с кодовым разделением (Wideband Code Division Multiple Access, WCDMA), синхронный множественный доступ с кодовым и временным разделением (Time Division-Syncronous Code Division Multiple Access, TD-SCDMA), с таким протоколом беспроводной связи 3.9G как E-UTRAN (evolved-UMTS terrestrial radio access network, эволюционированная наземная сеть радиодоступа системы UMTS), с протоколами проводной связи четвертого поколения (4G) или им подобными.

Понятно, что упомянутое устройство, например процессор 40, может включать электронные схемы, реализующие, помимо прочего, звуковые и логические функции мобильной станции 20. Процессор может быть реализован различными путями. Например, процессор может быть выполнен в виде различных процессорных средств, например процессорного элемента, сопроцессора, контроллера, или различных других процессорных устройств, включая интегральные схемы, например специализированную интегральную схему (ASIC, Application Specific Integrated Circuit) или программируемую вентильную матрицу (FPGA, Field Programmable Gate Array), аппаратный ускоритель и/или аналогичные устройства. В одном из примеров осуществления изобретения процессор может быть сконфигурирован для выполнения инструкций, хранящихся в запоминающем устройстве или иным образом доступных для процессора. По существу, процессор может быть сконфигурирован для выполнения процедур (или по меньшей мере их части), рассмотренных далее более подробно в отношении фиг.4 и 12. Процессор может также включать функциональные возможности для сверточного кодирования и перемежения сообщений и данных перед модуляцией и передачей. Процессор может также включать внутренний голосовой кодер, а также внутренний модем данных.

Мобильная станция 20 может также содержать пользовательский интерфейс, включающий устройство вывода, например, наушник или громкоговоритель 44, вызывное устройство 42, микрофон 46, дисплей 48, а также интерфейс пользовательского ввода, которые могут быть соединены с процессором 40. Интерфейс пользовательского ввода, который позволяет мобильной станции принимать данные, может включать любое из ряда устройств, позволяющих мобильной станции принимать данные, например клавиатуру 50, сенсорный дисплей (не показан) или другие устройства ввода. В вариантах осуществления изобретения, включающих клавиатуру, она может включать цифровые клавиши (0-9) и связанные с ними клавиши (#, *), а также другие аппаратные и программируемые клавиши, используемые для управления мобильным терминалом 10. Альтернативно, клавиатура может иметь стандартную раскладку QWERTY. Клавиатура может также включать различные программируемые клавиши с соответствующими функциями. Дополнительно, или альтернативно, мобильная станция может включать интерфейсное устройство, такое как джойстик, или другой интерфейс пользовательского ввода. Мобильная станция может также включать аккумуляторную батарею 54, например вибрирующий батарейный блок для питания различных схем, используемых для управления мобильной станцией, а также, опционально, для обеспечения механической вибрации в качестве обнаруживаемого выходного сигнала.

Мобильная станция 20 может также включать модуль идентификации пользователя (user identity module, UIM) 58, который в общем случае называют смарт-картой. Модуль UIM может быть запоминающим устройством со встроенным процессором. UIM может включать, например, модуль идентификации абонента (subscriber identity module, SIM), универсальную карту на интегральных схемах (universal integrated circuit card, UICC), универсальный модуль идентификации абонента (universal subscriber identity module, USIM), съемный модуль идентификации пользователя (removable user identity module, R-UIM) или любую другую смарт-карту. Модуль UIM может хранить элементы информации, касающиеся мобильного абонента. В дополнение к модулю UIM мобильная станция может быть оснащена памятью. Например, мобильная станция может включать энергозависимую память 60, например, энергозависимую оперативную память (Random Access Memory, RAM), включающую область кэш для временного хранения данных. Мобильная станция может также включать другую, энергонезависимую, память 62, которая может быть встроенной и/или съемной. Энергонезависимая память может дополнительно или альтернативно включать электрически стираемую программируемую постоянную память (electrically erasable programmable read only memory, EEPROM), флеш-память или аналогичную. Память может хранить любое количество блоков информации и данных, которые могут быть использованы мобильной станцией для реализации ее функций. К примеру, память может включать идентификатор, например код международного идентификации мобильного оборудования (international mobile equipment identification, IMEI), способный осуществить уникальную идентификацию мобильной станции.

Тогда как терминал связи, один из примеров которого изображен на фиг.2, может формировать сжатые представления одного или более дескрипторов признаков в соответствии с вариантами осуществления настоящего изобретения, в сетевом объекте, например, в сервере 14 приложений или аналогичном ему устройстве, связанном с терминалом связи, могут также применяться варианты осуществления настоящего изобретения для идентификации признака(-ов) в изображении на основе анализа сжатых представлений упомянутых дескрипторов признаков. Например, на фиг.3 показана блок-схема сетевого объекта 68, способного функционировать в качестве сервера 14, или аналогичного ему устройства, в соответствии с одним из вариантов осуществления настоящего изобретения. Сетевой объект может включать различные средства для выполнения одной или более функций в соответствии с вариантами осуществления настоящего изобретения, включая более подробно проиллюстрированные и рассмотренные в настоящем описании функции. Однако следует понимать, что сетевой объект может включать альтернативные средства для выполнения одной или более подобных функций, не выходя за пределы объема настоящего изобретения.

Как показано на чертеже, сетевой объект 68 может включать средства, например, процессор 70 для выполнения различных функций сетевого объекта или управления ими. Процессор может быть реализован множеством различных способов. Например, процессор может быть выполнен в виде различных процессорных средств, таких как процессорный элемент, сопроцессор, контроллер, или различные другие процессорные устройства, включая, к примеру, ASIC, FPGA, аппаратный ускоритель и/или аналогичные устройства. В одном из примеров осуществления изобретения процессор может быть сконфигурирован для выполнения инструкций, хранящихся в памяти или иным образом доступных для процессора. По существу, процессор может быть сконфигурирован для выполнения процедур или по меньшей мере их части, рассмотренных далее более подробно в отношении фиг.12.

В одном из вариантов осуществления изобретения процессор 70 может быть связан или включать память 72, например, энергозависимую или энергонезависимую память, хранящую контент, данные и т.п. Например, память может хранить контент, переданный, от сетевого объекта и/или принимаемый им. Также, например, память может хранить программные приложения, инструкции и т.п., необходимые для выполнения процессором инструкций, связанных с функционированием сетевого объекта 68 в соответствии с вариантами осуществления настоящего изобретения. В частности, память может хранить программные приложения, инструкции и т.п., необходимые для выполнения процессором операций, описанных выше, а также далее по тексту в отношении фиг.12, для идентификации признака(-ов) в изображении на основе анализа сжатых представлений дескрипторов признаков.

В дополнение к памяти 72 процессор 70 может быть также соединен по меньшей мере с одним интерфейсом или другими средствами для передачи и/или приема данных, контента и т.п. С этой целью интерфейс(-ы) может включать по меньшей мере один интерфейс 74 связи или другие средства для передачи и/или приема данных, контента и т.п., например, между сетевым объектом 68 и терминалом 10 связи и/или между сетевым объектом и остальной сетью 12.

При функционировании, как показано на фиг.4, для представления признаков в изображении с помощью соответствующих дескрипторов признаков, терминал 10 связи и, в одном из вариантов осуществления изобретения, процессор 40 терминала связи, могут разделять изображение на множество участков, например, канонических участков, вокруг точки, представляющей интерес. См. операцию 80. Каждый участок может затем быть нормализован для обеспечения инвариантности при афинных изменениях яркости, например, посредством нормализации среднего и среднеквадратического отклонения пиксельных значений соответствующего участка для компенсации при афинном преобразовании al+b пиксельных яркостей I. См. операцию 82. Затем каждый участок может быть размыт или сглажен, например, в соответствии со сглаживанием по Гауссу с параметром сглаживания σ, например, равным 2.7 пикселей в одном из вариантов осуществления изобретения. Каждый участок может быть затем разделен на множество более мелких ячеек. См. операцию 84. В соответствии с последующим описанием, упомянутые ячейки могут быть различных размеров с применением методов масштабно-инвариантого преобразования признаков (scale invariant feature transform, SIFT) и ускоренного надежного обнаружения признаков (speeded up robust features, SURF), использующих конфигурации с квадратной сеткой 4×4, в то время как методы гистограммы положения и ориентации градиентов (gradient location and orientation histogram. GLOH) используют конфигурацию с большой полярной сеткой.

После разделения участков на более мелкие ячейки процессор 40 терминала связи 10 может определить градиенты x и y в каждой ячейке, например, с использованием центрированной производной маски [-1, 0, 1]. См. операцию 86 на фиг.4. Градиенты могут быть определены различным образом. Например, градиенты могут быть определены с помощью методов SIFT, в которых ориентацию градиентов внутри каждой ячейки квантуют в восемь битов, а значения градиентов по каждому направлению суммируют. Альтернативно, градиенты могут быть определены в соответствии с методом SURF, где дескриптор SURF включает ∑dx, ∑dy, ∑|dx| и ∑|dy| для каждой ячейки, в отличие от квантования градиентов в SIFT, где применяют бинирование (распределение по столбцам гистограммы) градиентов вдоль угловых направлений. Также градиенты могут быть определены в соответствии с методами GLOH.

Несмотря на то что градиенты могут отличаться, в зависимости от изображения и метода их определения, совместное распределение градиентов x, y для большого количества ячеек в одном из примеров изображено на фиг.5, а кривые контуров этого совместного распределения градиентов x, y показаны на фиг.5b. Совместное распределение градиентов x, y на фиг.5 включает индивидуальные распределения множества ячеек, четыре из которых изображены на фиг.6a-6d для иллюстрации возможных отличий между ними. Совместное распределение градиентов x, y в соответствующей ячейке, например, одной из изображенных на фиг.6a-6d, может быть определено как PDx, Dy (DX, DY), где N - количество пикселей в ячейке. Градиенты затем могут квантоваться, как показано в блоке 88 на фиг.4. В некоторых вариантах осуществления изобретения, однако, градиенты в ячейке, перед квантованием и окончательным определением соответствующих дескрипторов признаков, могут быть взвешены с помощью окна Гаусса.

Для квантования градиентов, они могут быть назначены соответствующему столбцу гистограммы (бину) из множества столбцов гистограммы. Перед такой процедурой назначения, однако, может быть выбрана конфигурация столбцов гистограммы, для точного и эффективного представления совместного распределения градиентов x, y. См. операции 90 и 92, показанные на фиг.4. Для выбора конфигурации столбцов гистограммы, определяемой количеством столбцов гистограммы и положением x, y столбцов гистограммы, для должного и эффективного представления совместного распределения градиентов x, y, совместное распределение градиентов x, y, например, изображенное на фиг.5А, рассматривают как градиентную пару x, y, идентифицированную как наиболее вероятную, совместно с асимметрией распределения. По отношению к совместному распределению градиентов x, y на фиг.5а градиентная пара x, y в точке (0,0) имеет наибольшую вероятность, при этом распределение имеет асимметрию (вытянуто) вдоль оси y. Для аппроксимации распределения градиентов может быть задано множество столбцов гистограммы, при этом некоторые примеры конфигурации столбцов гистограммы изображены на фиг.7а-7е. В одном из вариантов осуществления изобретения конфигурации столбцов гистограммы включают столбец гистограммы, находящийся в положении, имеющем наибольшую вероятность, и вытянуты в том же направлении или ориентации, что и само распределение. Например, каждый из примеров конфигурации столбцов гистограммы, изображенный на фиг.7а-7е, имеет столбец гистограммы в точке (0,0), при этом конфигурация либо симметрична, либо слегка вытянута в направлении оси у, при этом столбцы гистограммы равномерно распределены в интервале 0-360º. Для квантования градиентов градиентную пару dx, dy для каждого пикселя в ячейке назначают ближайшему столбцу гистограммы.

Для повышения эффективности процедуры квантования желательно иметь относительно небольшое количество столбцов гистограммы. Однако также нужно иметь достаточное количество столбцов гистограммы, так чтобы результирующая аппроксимация совместного распределения градиентов x, y имела достаточную точность. Для примера, но не ограничения, проведено сравнение точности, полученной с помощью четырех различных конфигураций столбцов гистограммы, изображенных на фиг.7a-7d, имеющих 3, 5, 7 и 9 столбцов гистограммы, соответственно, в сочетании с аппроксимацией совместного распределения градиентов x, y на фиг.5а, в единицах рабочих характеристик приемника путем сравнения частоты правильных положительных решений и ложных положительных решений для каждой из четырех различных конфигураций столбцов гистограммы с конфигурацией, предлагаемой SIFT. В соответствии с фиг.8, аппроксимация с использованием пяти столбцов гистограммы, показанных на фиг.7b, может, в одном примере сценария, по существу соответствовать характеристикам SIFT, а аппроксимация совместного распределения градиентов x, y с помощью 7 столбцов гистограммы, показанных на фиг.7 с, соответственно, может предложить улучшенные, в сравнении с SIFT, характеристики, хотя и несколько менее эффективна, по сравнению с конфигурацией для пяти столбцов на фиг.7b.

На основе квантования, терминал 10 связи и, в одном из вариантов осуществления изобретения, процессор 40 терминала связи могут формировать множество дескрипторов признаков , где i, значение которого находится в интервале от 1 до К, задано как индекс участка изображения, для которого вычисляют дескриптор, а К - количество участков, обнаруженных в изображении. См. блок 94 на фиг.4. В одном из вариантов осуществления изобретения каждый дескриптор признаков для соответствующей ячейки может быть определен таким образом, чтобы выражаться через распределение градиентов по множеству столбцов гистограммы и включать это распределение, например, с помощью вероятностного распределения. В одном из вариантов осуществления изобретения множество дескрипторов признаков может быть определено как: , где , …, представляют распределения градиентов в ячейках 1 … n дескриптора i. Размерность каждого дескриптора может быть задана как n×В, где n - количество ячеек, а В - количество столбцов гистограммы.

Может быть предпочтительным определение дескрипторов признаков непосредственно через распределения градиентов, например вероятностные распределения. В этом отношении, путем представления информации о градиентах в виде распределения вероятностей для каждой ячейки, статистика базового распределения градиентов может быть эффективно использована путем избирательного помещения центров столбцов гистограммы, в соответствии с предыдущим описанием, на основе положения градиента x, y, имеющего наибольшую вероятность, и на основе асимметрии совместного распределения градиентов x, y. Дополнительно, распределения вероятностей могут сравниваться более эффективно с использованием таких мер расстояний, как дивергенция Кульбака-Лейблера (Kullback-Leiblier, KL) и экскаваторная дистанция (Earth Mover's Distance, EMD), по сравнению с нормой L-2. Кроме того, распределения вероятностей могут быть эффективно сжаты с формированием дескрипторов, имеющих малую битовую скорость передачи, в соответствии с последующим описанием.

После определения распределения градиентов и вычисления дескрипторов признаков, терминал 10 связи и, в одном из вариантов осуществления изобретения, процессор 40 терминала связи может сжимать эти дескрипторы признаков, состоящие из распределений градиентов в соответствующих ячейках. См. операцию 96 на фиг.4. Например, распределения градиентов (и, в свою очередь, дескрипторы признаков, состоящие из распределений градиентов) могут быть сжаты с помощью древовидного кодирования, например, древовидного кодирования по методу Гаджи (Gagie) или по методу Хаффмана (Huffman), в соответствии с описанием в статье Т.Гаджи "Сжатие вероятностных распределений" (T.Gagie, "Compressing Probability Distributions"), Inf. Process. Lett., Vol.97, №4, с.133-37 (2006). Для рассмотрения этих подходов древовидного кодирования, обозначим исходное распределение как Р=p1, p2, …, pn, a сжатое распределение вероятностей с потерей качества, заданное в том же пространстве выборок, как Q=q1, q2, …, qn. В вариантах осуществления изобретения, применяющих кодирование с помощью деревьев Хаффмана, Р сжимают путем построения дерева Хаффмана на основе этого распределения и хранения кодов Хаффмана каждого символа, это гарантирует, что дивергенция D Кульбака-Лейблера между двумя распределениями (Р и Q) D (P||Q)<1, и потребует количество битов, равное O(nlogn). Если для хранения глубины каждого символа в дереве Хаффмана используют коды, с фиксированной длиной, то дерево Хаффмана может храниться в (n-1)[log(n-1)] битах. Альтернативно, если используют кодирование с помощью деревьев Гаджи, распределение Q может быть построено так, что D(p||Q)<log2(2+23-k), при этом Q может храниться ровно в kn-2 битах.

Различия между древовидным кодированием Гаджи и Хаффмана можно понять, рассмотрев сами деревья Гаджи и Хаффмана. В этом отношении, деревья Гаджи являются упорядоченными, и, следовательно, само дерево хранит информацию всего распределения Р. С другой стороны, деревья Хаффмана не упорядочены как вероятности символов, которые сортируют в процессе построения дерева. Таким образом, дерево Хаффмана дает меньшее D(P||Q) чем 1, но требует большего количества битов, равного (n-1)[log(n-1)], по сравнению с 2n - 2 битами для деревьев Гаджи.

В отношении сжатия распределений градиентов в каждой ячейке, битовая скорость передачи увеличивается как для деревьев Гаджи, так и для деревьев Хаффмана с ростом количества столбцов гистограммы, при этом также улучшаются характеристики дескриптора признаков. В качестве примера, но не ограничения, распределение градиентов одной из ячеек изображено на фиг.9а. Далее следует квантование с использованием пяти столбцов гистограммы, в соответствии с конфигурацией на фиг.7b, a результирующая гистограмма изображена на фиг.9b. Эту гистограмму затем независимо сжимают с использованием как деревьев Хаффмана, так и деревьев Гаджи, при этом результирующие распределения показаны на фиг.9b. Для одного и того же исходного распределения Р и результирующего сжатого распределения Q, схемы кодирования деревьями Гаджи (сверху) и Хаффмана (снизу) показаны ниже:

Р S С Дерево Гаджи Q 0.8281 0.4141 0 0.500 0.0000 0.8281 11010 0.125 0.0312 0.8438 11011 0.125 0.0625 0.8906 1110 0.125 0.0781 0.9609 1111 0.125

Р Sort(P) Дерево Хаффмана С Q 0.8281 0.0000 1 0.5000 0.0000 0.0312 0000 0.0625 0.0312 0.0625 0001 0.0625 0.0625 0.0781 001 0.1250 0.0781 0.8281 01 0.2500

где С - число Каталана в соответствии с дальнейшим описанием, a S определяют как S={s1, …, sn}, так чтобы:

В данном примере дивергенция Кульбака-Лейблера для кодирования с использованием дерева Гаджи равна 0.2945, а дивергенция Кульбака-Лейблера для кодирования с использованием дерева Хаффмана равна 0.2620. Следует также отметить, что в одном из вариантов осуществления изобретения сжатие с помощью деревьев Гаджи может негативно повлиять на характеристики дескрипторов признаков, по сравнению со сжатием с помощью деревьев Хаффмана. Эти отличия могут быть следствием дивергенции Кульбака-Лейблера, меньшей чем 1, получаемой при сжатии распределений с помощью деревьев Хаффмана. По существу, хотя распределения градиентов дескрипторов признаков могут быть сжаты различными способами, включая использование различных методов древовидного кодирования, в одном из вариантов осуществления изобретения кодирование с помощью дерева Хаффмана может быть более предпочтительным.

Сжатие распределений градиентов в каждой ячейке позволяет представить соответствующие дескрипторы признаков меньшим количеством битов, т.к. дескрипторы признаков определены, в свою очередь, как наборы распределений градиентов. Кроме того, путем сжатия и передачи распределений градиентов с использованием аппроксимации на основе дерева, обеспечивается ограничение дисторсии. Для дальнейшего уменьшения количества битов, необходимых для определения различных дескрипторов признаков, может быть уменьшено количество ячеек в каждом участке изображения. Однако уменьшать количество ячеек в участке изображения желательно, только если это уменьшение можно выполнить без значительного влияния на характеристики результирующего дескриптора признаков. Как отмечалось выше, в методах SIFT и SURF применяют квадратную сетку с шестнадцатью ячейками, в то время как в методах GLOH используют большие полярные гистограммы с различным количеством ячеек, например, 9 или 7. По существу, характеристики, обеспечиваемые различными конфигурациями ячеек, выражающиеся в количестве битов, необходимых для определения соответствующих признаков, можно сравнить с конфигурацией ячеек, обеспечивающей приемлемые характеристики для конкретного применения с наименьшим числом битов, необходимых для представления дескрипторов признаков, применяемых в одном из вариантов осуществления изобретения. В этом отношении, шестнадцать ячеек, используемых в методах SIFT и SURF (конфигурация в виде сетки с 16 ячейками), можно сравнить с подходами GLOH с 9 или 7 ячейками, названными GLOH 9 и GLOH 7, соответственно. В одном из сценариев, дескрипторы признаков, сформированные в соответствии с конфигурацией GLOH 9, имеют характеристики, сравнимые с дескрипторами признаков, сформированными в соответствии с конфигурацией в виде сетки с 16 ячейками, обеспечивая при этом степень сжатия битов, равную 44%. В одном из вариантов осуществления изобретения, вследствие обеспечения улучшенных характеристик и меньшей битовой скорости передачи, может быть выбрана конфигурация GLOH 9.

Как было описано выше в отношении фиг.1, приложения, требующие идентификации признаков, могут требовать передачи и/или хранения относительно большого количества признаков. Например, в контексте мобильных устройств, таких как телефоны с фотокамерой и/или распределенные сети фотокамер, расходы на связь и электропитание для передачи информации между узлами могут оказаться значительными. Для обеспечения масштабируемости и эффективности предпочтительной является идентификация различных признаков с помощью дескрипторов признаков, которые могут быть представлены с помощью относительного малого количества битов, в соответствии с одним из вариантов осуществления настоящего изобретения. Например, количество битов, необходимое для каждого дескриптора признаков, может иметь существенное значение в приложениях поиска изображений, в которых один или более дескрипторов признаков запрашиваемого изображения необходимо сравнить с рядом заранее заданных дескрипторов признаков. Поскольку заранее заданные дескрипторы признаков могут храниться в базе данных на сервере 14 или в доступном ему месте и поскольку в этой базе данных может храниться очень много, например, миллионы дескрипторов признаков, уменьшение количества битов, необходимых для определения дескриптора признаков, обеспечиваемое вариантами осуществления настоящего изобретения, может привести к значительной экономии необходимого объема хранилища. Дополнительно, уменьшение количества битов, необходимых для определения дескрипторов признаков, может уменьшить задержку системы путем уменьшения количества данных, которые необходимо передавать по сети для идентификации признаков в изображении. Аналогично, уменьшение количества битов, необходимых для представления дескрипторов признаков, может уменьшить ширину полосы пропускания, требуемую для передачи данных, необходимых для идентификации признаков, что делает задачу поддержки подобных передач более простой для мобильных приложений, в которых данные передаются по беспроводному каналу и обратным линиям связи мобильной сети.

Для облегчения выполнения анализа дескрипторов признаков в сжатом представлении, например, сервером 14, с целью сравнения их с множеством сжатых дескрипторов признаков в библиотеке заранее заданных признаков, может быть желательно, чтобы каждое сжатое распределение градиентов было представлено кодом фиксированной длины, как показано в операции 97 на фиг.4, вместо различной битовой длины, которая обычно получается при использовании кодирования с помощью дерева Хаффмана. Как отмечалось ранее, сжатые распределения Гаджи представлены в виде строго упорядоченных бинарных деревьев. Деревья Хаффмана могут быть пронумерованы путем рассмотрения перестановок листовых узлов деревьев Гаджи. Количество строго упорядоченных бинарных деревьев с n листовыми узлами может быть получено с помощью числа Каталана .Как показано на фиг.10 для дерева с четырьмя листовыми узлами, деревья Гаджи представляют собой подмножество деревьев Хаффмана, которые могут быть пронумерованы путем рассмотрения всех уникальных перестановок листовых узлов деревьев Гаджи. Например, количество деревьев Гаджи и Хаффмана для количества листовых узлов от 1 до 7 показано в следующей таблице:

Количество столбцов гистограммы Количество деревьев Гаджи Количество деревьев Хаффмана 1 1 1 2 1 1 3 2 3 4 5 13 5 14 75 6 42 525 7 132 4347

При квантовании с относительно небольшим количеством столбцов гистограммы, например, до 7 столбцов гистограммы, количество деревьев Хаффмана и Гаджи также относительно мало. В таком сценарии, все возможные комбинации деревьев могут быть пронумерованы. Дополнительно, расстояния между различными сжатыми распределениями могут быть заранее вычислены и храниться, например, в таблице расстояний. Это позволяет эффективно вычислять расстояния между дескрипторами, например, путем выполнения поиска по таблице расстояний, фиг.11 иллюстрирует сопоставление сжатых доменов для конфигурации с пятью столбцами гистограммы, как показано на фиг.7b. В этом отношении гистограмма градиентов в каждой ячейке (две ячейки показаны на фиг.11) может быть сжата с использованием кодирования с помощью дерева Хаффмана, так что для пяти листовых узлов существуют 75 возможных деревьев, что можно представить 7 битами на ячейку. Расстояния, например, вычисленные в соответствии с мерами Кульбака-Лейблера, EMD, L2 и т.п., между каждой парой распределений могут быть вычислены заранее и храниться, как показано на фиг.11. Расстояние между двумя дескрипторами может затем быть вычислено путем сложения заранее вычисленных расстояний между сжатыми распределениями градиентов в соответствующих ячейках. Могут быть использованы более эффективные меры сравнения гистограмм, например, дивергенция Кульбака-Лейблера или расстояние EMD, без дополнительного увеличения сложности.

Следует также отметить, что вероятности различных деревьев являются различными. Следовательно, еще большая степень сжатия может быть достигнута путем энтропийного кодирования индексов деревьев, например, посредством арифметического кодера, как показано в операции 98 на фиг.4, при этом более часто встречающиеся индексы деревьев представлены более короткими кодами, а более редко встречающиеся индексы деревьев представлены более длинными кодами. Для кодирования с помощью деревьев Гаджи, энтропийное кодирование индексов деревьев может обеспечить двукратное уменьшение битовой скорости передачи по сравнению с хранением строго упорядоченных бинарных деревьев. Аналогично, для кодирования с помощью деревьев Хаффмана, энтропийное кодирование индексов деревьев может обеспечить двукратное уменьшение битовой скорости передачи по сравнению с хранением кодов Хаффмана для всех символов.

Например, в одном из вариантов осуществления изобретения, в котором используются 5 столбцов гистограммы, как показано на фиг.7b, конфигурация ячеек GLOH 9 и кодирование с помощью дерева Хаффмана, дескриптор признаков может иметь размерность, равную 45, т.е. 5 измерений (одно на каждый столбец гистограммы) для сжатых распределений градиентов в каждой ячейке и 9 ячеек в конфигурации GHOH 9. В этом примере возможны 75 сжатых с помощью дерева Хаффмана распределений для каждой ячейки и в общей сложности 759 уникальных дескрипторов признаков. В несжатом виде каждая ячейка может быть представлена в этом примере с помощью 7 битов, т.е. log75, при кодах фиксированной длины 9 ячеек потребуют 63 бита. С помощью энтропийного кодирования индексов деревьев дескриптор признаков может быть уменьшен до 52 битов, сохраняя сравнимые с SIFT характеристики по меньшей мере в некоторых вариантах осуществления изобретения.

Когда дескрипторы признаков определены и сжаты, сжатые представления дескрипторов признаков могут передаваться и/или храниться, как показано в операции 100 на фиг.4. В варианте осуществления настоящего изобретения, показанном на фиг.1, устройство 10 связи может определять дескрипторы признаков для различных признаков в изображении, захваченном этим устройством связи. Сжатое представление дескрипторов признаков может затем храниться устройством связи и передаваться им серверу 14 по сети 12. В этом варианте осуществления изобретения сервер, в свою очередь, может принимать и сравнивать сжатые представления дескрипторов признаков со сжатыми представлениями множества дескрипторов признаков для набора заранее заданных признаков. См. операции 110 и 112, показанные на фиг.12.

При выполнении упомянутой процедуры сравнения сервер может идентифицировать сжатые представления дескрипторов признаков для заранее заданных признаков, наиболее близкие к сжатым представлениям дескрипторов признаков, предоставленным устройством связи. См. операцию 114. В случаях, когда сжатые представления дескрипторов признаков для заранее заданных признаков в достаточной степени схожи со сжатыми представлениями признаков, предоставленными устройством связи, например, в соответствии с последующим описанием, находятся на расстоянии, меньшем, чем заранее заданный порог, сервер может идентифицировать, что соответствующий заранее заданный признак (-и) присутствует в изображении, захваченном устройством связи. См. операцию 116. Затем сервер может предоставить устройству связи информацию о заранее заданном признаке(-ах), идентифицированном в результате процедуры сравнения. См. операцию 118. Например, сервер может обеспечить идентификацию распознанного признака, например, с помощью названия, местоположения и т.п. Дополнительно, сервер может предоставлять любую другую информацию, связанную с распознанным признаком(-ами), например, историческую информацию, маркетинговую информацию и т.п. К примеру, если сервер распознает, что сжатый дескриптор признаков представляет ресторан, сервер может предоставить название, адрес и веб-сайт этого ресторана, а также информацию о часах его работы, меню и отзывы об этом ресторане.

Для сравнения сжатых представлений дескрипторов признаков, переданных устройством 10 связи в соответствии с предыдущим вариантом осуществления изобретения, со сжатыми представлениями дескрипторов признаков различных заранее заданных признаков, сервер 14 может определить расстояние между этими сжатыми представлениями. Для сравнения распределений могут использоваться различные численные меры, например, норма L-2, дивергенция Кульбака-Лейблера и EMD. Дивергенция Кульбака-Лейблера используется в теории информации и представляет информационную дивергенцию между двумя распределениями. Дивергенцию Кульбака-Лейблера между двумя распределениями Р=p1, р2, …, pn и Q=q1, q2, …, qn определяют как

В некоторых вариантах осуществления к знаменателю приведенного выше уравнения может быть добавлен сглаживающий параметр ρ=0.001, чтобы исключить возможность определения ∞ в качестве меры расстояния. Следует, однако, отметить, что результаты не чувствительны к выбранному параметру ρ. EMD, являясь особым случаем расстояния Маллоу (Mallows), представляет собой перекрестно-биновую меру расстояния между гистограммами, в отличие от нормы L2 и дивергенции Кульбака-Лейблера, являющимися мерами расстояний между бинами. EMD определяют как минимальную "стоимость" преобразования одной гистограммы в другую, при этом для каждой пары столбцов гистограммы определено "расстояние на местности" (ground distance). "Расстояние на местности" между столбцами гистограммы определяют как расстояние между центрами столбцов гистограммы, например, как в конфигурации, показанной на фиг.7. Следует отметить, что EMD представляет собой метрику и подчиняется неравенству треугольника, тогда как дивергенция Кульбака-Лейблера - нет. Сервер 14 и, в одном из вариантов осуществления изобретения, процессор 70 сервера, могут определять расстояние dist между двумя дескрипторами признаков , , которое определяют как:

,

где dhist определяют как меру расстояния между двумя распределениями. Однако, поскольку множество возможных деревьев относительно мало, например, как указано в приведенной ранее таблице, расстояния между всеми возможными парами деревьев могут быть определены заранее и храниться в памяти 72. По существу, серверу не нужно вычислять каждое расстояние, он может, вместо этого, использовать таблицу поиска для идентификации расстояния между деревьями на основе заранее заданных расстояний, что повышает эффективность выполнения сравнения.

Как отмечалось выше, фиг.4 и 12 представляют собой блок-схемы алгоритмов устройства, способа и программного продукта в соответствии с примерами осуществления настоящего изобретения. Понятно, что каждый блок в блок-схемах, а также комбинации блоков в блок-схемах алгоритмов могут быть реализованы различными средствами, например, аппаратными средствами, программно-аппаратными средствами и/или с помощью компьютерного программного продукта, включающего одну или более инструкций компьютерной программы. Например, одна или более процедур, описанных выше, может быть осуществлена с помощью инструкций компьютерной программы. В этом отношении, инструкции компьютерной программы, осуществляющие описанные выше процедуры, могут храниться запоминающим устройством устройства 10 связи, сетевого объекта, например, сервера 14, или другого устройства, реализующего варианты осуществления настоящего изобретения, и выполняться процессором 40, 70 устройства связи, сервера или другого устройства. В этом отношении операции, рассмотренные выше в связи с блок-схемами алгоритмов на фиг.4 и 12, были описаны как выполняющиеся устройством связи и сетевым объектом, например, сервером, но на практике, любая из них или все эти операции могут выполняться соответствующими процессорами этих объектов, например, в ответ на выполнение инструкций компьютерной программы соответствующими процессорами. Понятно, что такая инструкция компьютерной программы может быть загружена в компьютер или другое программируемое устройство (например, аппаратное обеспечение) с формированием устройства, так что компьютерный программный продукт, включающий инструкции, выполняемые на компьютере (например, процессором) или другом программируемом устройстве, образует средства для реализации функций, определенных в блоке(-ах) блок-схем. Эти инструкции компьютерной программы могут также храниться в машиночитаемой памяти, которая может инструктировать компьютер (например, процессор или другое вычислительное устройство) или другое программируемое устройство для функционирования определенным образом, так что инструкции, хранимые в машиночитаемой памяти, образуют изделие, включающее средства инструкций, реализующие функции, определенные в блоке(-ах) блок-схем. Инструкции компьютерной программы могут также быть загружены в компьютер или другое программируемое устройство для выполнения серии операций на этом компьютере или другом программируемом устройстве с формированием машинореализуемого процесса таким образом, что инструкции, выполняемые на компьютере или другом программируемом устройстве, обеспечивают операции для реализации функций, определенных в блоке(-ах) блок-схем.

Соответственно, блоки в блок-схемах допускают комбинирование средств для выполнения определенных функций, а также средства программных инструкций для выполнения определенных функций. Также понятно, что один или более блоков упомянутых блок-схем, а также комбинации блоков в блок-схемах, могут быть реализованы с помощью аппаратных компьютерных систем специального назначения, выполняющих определенные функции, или с помощью комбинаций аппаратного обеспечения специального назначения и компьютерных инструкций.

В одном из примеров осуществления изобретения устройство для выполнения способа, показанного на фиг.4 и 12, может включать процессор (например, процессор(-ы) 40 и/или 70), сконфигурированный для выполнения некоторых или всех описанных выше операций (80-118). Процессор(-ы) может, например, быть сконфигурирован для выполнения операций (80-118) посредством выполнения аппаратно-реализованных логических функций, выполнения хранимых инструкций или выполнения алгоритмов для осуществления всех упомянутых операций. Альтернативно, устройство может содержать средства для выполнения всех вышеописанных операций. В этом отношении, в соответствии с одним из примеров осуществления изобретения, примеры средств для выполнения операций 80-118 могут включать, к примеру, процессор(-ы) 40 и/или 70 в соответствии с предыдущим описанием.

Множество модификаций или других вариантов осуществления изложенного в настоящем описании изобретения могут быть очевидны специалистам в данной области техники, к которой относится настоящее изобретение, с получением преимуществ, которые обеспечивает настоящее изобретение, изложенное в предыдущем описании и соответствующих чертежах. Например, несмотря на то что варианты осуществления настоящего изобретения были описаны в связи с устройством 10 связи, захватывающим изображение, а затем определяющим и сжимающим дескрипторы признаков для признаков этого изображения, может также передаваться само изображение, а сетевой объект, например, сервер 14, или другое устройство может определять и сжимать дескрипторы признаков, например, перед хранением. Альтернативно, несмотря на то что сравнение сжатых представлений дескрипторов признаков было описано в рассмотренных ранее вариантах осуществления изобретения как выполняющееся сетевым объектом, например, сервером, сравнение и идентификация соответствующих признаков может выполняться, вместо этого, устройством связи или другим устройством, если это необходимо. Таким образом, понятно, что настоящее изобретение не ограничено его конкретными вариантами осуществления, раскрытыми в настоящем описании, и что модификации и другие варианты его осуществления также находятся в пределах объема прилагаемой формулы изобретения. Несмотря на то что в настоящем описании были использованы конкретные термины, они были использованы лишь в общем и описательном смысле, а не с целью ограничения.

Похожие патенты RU2505856C2

название год авторы номер документа
СПОСОБ И УСТРОЙСТВО ДЛЯ ОТСЛЕЖИВАНИЯ И РАСПОЗНАВАНИЯ ОБЪЕКТОВ С ИСПОЛЬЗОВАНИЕМ ДЕСКРИПТОРОВ, ИНВАРИАНТНЫХ ОТНОСИТЕЛЬНО ВРАЩЕНИЯ 2010
  • Такакс Гэбриель
  • Гржезчук Радек
  • Чандрасехар Виджай
  • Джирод Бернд
RU2542946C2
СПОСОБ И УСТРОЙСТВО ДЛЯ ВЫДЕЛЕНИЯ ПРИЗНАКОВ 2015
  • Лун Фэй
  • Чэнь Чжицзюнь
  • Чжан Тао
RU2644516C2
СПОСОБ ПРЕОБРАЗОВАНИЯ ДЕСКРИПТОРА ИЗОБРАЖЕНИЯ НА ОСНОВЕ ГИСТОГРАММЫ ГРАДИЕНТОВ И СООТВЕТСТВУЮЩЕЕ УСТРОЙСТВО ОБРАБОТКИ ИЗОБРАЖЕНИЙ 2013
  • Пасчалакис Ставрос
  • Бобер Мирослав
RU2661795C2
СПОСОБ И УСТРОЙСТВО ВЫДЕЛЕНИЯ ХАРАКТЕРИСТИКИ 2015
  • Лун Фэй
  • Чэнь Чжицзюнь
  • Жан Тао
RU2635267C2
СПОСОБ И УСТРОЙСТВО ВЫДЕЛЕНИЯ ХАРАКТЕРИСТИКИ 2015
  • Лун Фэй
  • Чэнь Чжицзюнь
  • Жан Тао
RU2632578C2
СПОСОБ КОДИРОВАНИЯ ТРЕХМЕРНЫХ ДАННЫХ, СПОСОБ ДЕКОДИРОВАНИЯ ТРЕХМЕРНЫХ ДАННЫХ, УСТРОЙСТВО КОДИРОВАНИЯ ТРЕХМЕРНЫХ ДАННЫХ И УСТРОЙСТВО ДЕКОДИРОВАНИЯ ТРЕХМЕРНЫХ ДАННЫХ 2019
  • Сугио, Тосиясу
  • Игути, Норитака
RU2798155C2
СПОСОБ И СИСТЕМА РАСПОЗНАВАНИЯ ЭМОЦИОНАЛЬНОГО СОСТОЯНИЯ СОТРУДНИКОВ 2021
  • Гордеев Дмитрий Владимирович
  • Кондратьев Кирилл Андреевич
  • Островский Константин Игоревич
RU2768545C1
СПОСОБ ПРОСТРАНСТВЕННОГО ПРОГНОЗИРОВАНИЯ, СПОСОБ ДЕКОДИРОВАНИЯ ИЗОБРАЖЕНИЙ И СПОСОБ КОДИРОВАНИЯ ИЗОБРАЖЕНИЙ 2011
  • Дрюжон Виржини
  • Сибахара Йоудзи
  • Ниси Такахиро
  • Сасаи Хисао
  • Таникава Кеко
RU2571550C2
КОДЕР, ДЕКОДЕР, СПОСОБ КОДИРОВАНИЯ И СПОСОБ ДЕКОДИРОВАНИЯ 2020
  • Тома, Тадамаса
  • Ниси, Такахиро
  • Абе, Киёфуми
  • Като, Юсуке
RU2810304C2
СПОСОБ КОДИРОВАНИЯ ТРЕХМЕРНЫХ ДАННЫХ, СПОСОБ ДЕКОДИРОВАНИЯ ТРЕХМЕРНЫХ ДАННЫХ, УСТРОЙСТВО КОДИРОВАНИЯ ТРЕХМЕРНЫХ ДАННЫХ И УСТРОЙСТВО ДЕКОДИРОВАНИЯ ТРЕХМЕРНЫХ ДАННЫХ 2019
  • Сугио, Тосиясу
  • Ван, Чи
  • Ласанг, Понгсак
  • Хан, Чун Деан
  • Игути, Норитака
RU2798751C2

Иллюстрации к изобретению RU 2 505 856 C2

Реферат патента 2014 года СПОСОБ И УСТРОЙСТВО ДЛЯ ПРЕДСТАВЛЕНИЯ И ИДЕНТИФИКАЦИИ ДЕСКРИПТОРОВ ПРИЗНАКОВ С ИСПОЛЬЗОВАНИЕМ СЖАТОЙ ГИСТОГРАММЫ ГРАДИЕНТОВ

Изобретение относится к обработке изображений и распознаванию заранее заданных признаков в изображении. Технический результат заключается в повышении быстродействия и точности идентификации признаков. Предложены способ, устройство с компьютерным программным продуктом для формирования множества сжатых дескрипторов признаков, которые могут быть представлены относительно небольшим количеством битов, что упрощает передачу и хранение дескрипторов признаков. При этом осуществляют сравнение сжатого представления дескриптора признаков с множеством сжатых представлений дескрипторов соответствующих заранее заданных признаков, а соответствующий дескриптор признаков может быть идентифицирован без необходимости его предварительной распаковки, что обеспечивает потенциальное увеличение эффективности идентификации дескрипторов признаков. 4 н. и 18 з.п. ф-лы, 1 табл., 21 ил.

Формула изобретения RU 2 505 856 C2

1. Способ обработки изображения, включающий:
определение множества градиентов для каждой ячейки из множества ячеек изображения;
назначение градиентов, определенных для соответствующей ячейки, соответствующему столбцу гистограммы из множества столбцов гистограммы;
определение множества дескрипторов признаков, при этом каждый дескриптор признаков включает представление распределения градиентов по множеству столбцов гистограммы соответствующей ячейки в виде распределения вероятностей; и
сжатие множества дескрипторов признаков, при этом сжатое множество дескрипторов признаков содержит индексы.

2. Способ по п.1, также включающий энтропийное кодирование сжатых представлений множества дескрипторов признаков.

3. Способ по п.1 или 2, также включающий обеспечение по меньшей мере передачи или хранения сжатых представлений множества дескрипторов признаков.

4. Способ по п.1 или 2, также включающий выбор конфигурации столбцов гистограммы перед назначением градиентов соответствующим столбцам гистограммы, при этом выбор конфигурации столбцов гистограммы включает выбор такой конфигурации столбцов гистограммы, которая имеет столбец гистограммы, находящийся в положении, которое совпадает с градиентом, имеющим наибольшую вероятность, и вытянута в направлении, общем с распределением градиентов.

5. Способ по п.1 или 2, также включающий разбиение изображения на множество ячеек перед определением множества градиентов.

6. Способ по п.1 или 2, в котором сжатие множества дескрипторов признаков включает использование древовидного кодирования для сжатия множества дескрипторов признаков.

7. Машиночитаемый носитель, включающий компьютерный код для обеспечения выполнения операций по любому из пп.1-6 при выполнении упомянутого кода по меньшей мере одним процессором.

8. Устройство для обработки изображения, включающее:
средства для определения множества градиентов для каждой ячейки из множества ячеек изображения;
средства для назначения градиентов, определенных для соответствующей ячейки, соответствующему столбцу гистограммы из множества столбцов гистограммы;
средства для определения множества дескрипторов признаков, при этом каждый дескриптор признаков включает представление распределения градиентов по множеству столбцов гистограммы соответствующей ячейки в виде распределения вероятностей; и
средства для сжатия множества дескрипторов признаков, при этом сжатое множество дескрипторов признаков содержит индексы.

9. Устройство по п.8, дополнительно включающее средства для энтропийного кодирования сжатых представлений множества дескрипторов признаков.

10. Устройство по п.8, дополнительно включающее средства для обеспечения по меньшей мере передачи или хранения сжатых представлений множества дескрипторов признаков.

11. Устройство по п.8, дополнительно включающее средства для выбора конфигурации столбцов гистограммы перед назначением градиентов соответствующим столбцам гистограммы посредством выбора такой конфигурации столбцов гистограммы, которая имеет столбец гистограммы, находящийся в положении, которое совпадает с градиентом, имеющим наибольшую вероятность, и вытянута в направлении, общем с распределением градиентов.

12. Устройство по п.8, дополнительно включающее средства для разбиения изображения на множество ячеек перед определением множества градиентов.

13. Устройство по п.8, в котором упомянутые средства для сжатия сконфигурированы для сжатия множества дескрипторов признаков с использованием древовидного кодирования.

14. Устройство по любому из пп.8-13, в котором упомянутые средства включают по меньшей мере один процессор и по меньшей мере одну память, хранящую компьютерный программый код, при этом упомянутая по меньшей мере одна память и хранимый компьютерный программный код сконфигурированы, совместно с упомянутым по меньшей мере одним процессором, для обеспечения выполнения устройством по меньшей мере упомянутых операций.

15. Способ идентификации признаков изображения, включающий:
сравнение сжатого представления дескриптора признаков с множеством заранее заданных сжатых представлений дескрипторов признаков, соответствующих заранее заданным признакам; при этом сжатое представление дескриптора признаков является индексом, и каждый дескриптор признаков включает представление распределения градиентов по множеству столбцов гистограммы соответствующей ячейки в виде распределения вероятностей; и
на основе результатов сравнения, идентификацию сжатого представления дескриптора признаков для представления заранее заданного признака без предварительной распаковки дескриптора признаков.

16. Способ по п.15, в котором сравнение сжатого представления дескриптора признаков включает определение расстояния между сжатым представлением дескриптора признаков и каждым заранее заданным сжатым представлением дескриптора соответствующего заранее заданного признака.

17. Способ по п.16, в котором идентификация сжатого представления дескриптора признаков включает идентификацию заранее заданного признака, представленного заранее заданным сжатым представлением дескриптора признаков, который отделен от упомянутого сжатого представления дескриптора признаков расстоянием, меньшим, чем заранее заданный порог.

18. Машиночитаемый носитель, включающий компьютерный код для обеспечения выполнения операций по любому из пп.15-17 при выполнении упомянутого кода по меньшей мере одним процессором.

19. Устройство для идентификации признаков изображения, включающее:
средства для сравнения сжатого представления дескриптора признаков с множеством заранее заданных сжатых представлений дескрипторов соответствующих заранее заданных признаков, при этом сжатое представление упомянутого дескриптора признаков является индексом, и каждый дескриптор признаков включает представление распределения градиентов по множеству столбцов гистограммы соответствующей ячейки в виде распределения вероятностей; и
средства для идентификации, на основе результатов сравнения, сжатого представления дескриптора признаков для представления заранее заданного признака, без предварительной распаковки дескриптора признаков.

20. Устройство по п.19, в котором упомянутые средства для сравнения сконфигурированы для сравнения сжатого представления дескриптора признаков путем определения расстояния между сжатым представлением дескриптора признаков и каждым заранее заданным сжатым представлением дескриптора соответствующего заранее заданного признака.

21. Устройство по п.20, в котором упомянутые средства для идентификации сконфигурированы для идентификации сжатого представления дескриптора признаков путем идентификации заранее заданного признака, представленного заранее заданным сжатым представлением дескриптора признаков, который отделен от сжатого представления дескриптора признаков расстоянием, меньшим, чем заранее заданный порог.

22. Устройство по любому из пп.19-21, в котором упомянутые средства включают по меньшей мере один процессор и по меньшей мере одну память, хранящую компьютерный программный код, при этом упомянутая по меньшей мере одна память и хранимый компьютерный программный код сконфигурированы, совместно с упомянутым по меньшей мере одним процессором, для обеспечения выполнения устройством по меньшей мере упомянутых операций.

Документы, цитированные в отчете о поиске Патент 2014 года RU2505856C2

Пресс для выдавливания из деревянных дисков заготовок для ниточных катушек 1923
  • Григорьев П.Н.
SU2007A1
Пломбировальные щипцы 1923
  • Громов И.С.
SU2006A1
СПОСОБЫ КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ ВИДЕОИЗОБРАЖЕНИЯ С ИСПОЛЬЗОВАНИЕМ МЕЖУРОВНЕВОЙ ФИЛЬТРАЦИИ И ВИДЕОКОДЕР И ВИДЕОДЕКОДЕР С ИХ ИСПОЛЬЗОВАНИЕМ 2005
  • Хан Воо-Дзин
  • Ли Бае-Кеун
  • Ли Дзае-Йоунг
  • Ча Санг-Чанг
  • Ха Хо-Дзин
  • Ли Кио-Хиук
RU2337503C1
Станок для изготовления деревянных ниточных катушек из цилиндрических, снабженных осевым отверстием, заготовок 1923
  • Григорьев П.Н.
SU2008A1

RU 2 505 856 C2

Авторы

Гржезчук Радек

Чандрасехар Виджай

Такакс Гэбриель

Джирод Бернд

Даты

2014-01-27Публикация

2009-11-12Подача