ОСНОВАННОЕ НА ПРОФИЛЕ ИЗВЛЕЧЕНИЕ СОДЕРЖИМОГО ДЛЯ СИСТЕМ СРЕДСТВ ВЫДАЧИ РЕКОМЕНДАЦИЙ Российский патент 2016 года по МПК G06F17/30 

Описание патента на изобретение RU2577189C2

Область техники, к которой относится изобретение

Настоящее изобретение относится к устройству, способу и компьютерному программному продукту для управления системой средства выдачи рекомендаций для извлечения содержимого.

Уровень техники

Накопители на жестких дисках и технологии сжатия цифровых видеосигналов создали возможность для обеспечения телевидения (TV) в прямом эфире со сдвигом во времени и записи большого количества телевизионных шоу в высоком качестве, без необходимости заботиться о доступности лент или других съемных носителей данных. В то же время, преобразование в цифровую форму аудиовизуальных сигналов увеличило количество источников содержимого для обычного пользователя. Сотни каналов являются доступными при использовании простой параболической антенны и телевизионного приемника. Огромное количество видеоклипов ежедневно помещают в Интернете через различные службы, и все главные производители содержимого уже делают все свои библиотеки содержимого доступными в Интернете. В результате этого, тысячи потенциально интересных программ ежедневно становятся доступными и могут быть записаны и сохранены локально для более позднего доступа.

Однако ввиду такого огромного количества предлагаемых элементов содержимого выбор отдельного содержимого становится серьезной проблемой. Информация, которая не соответствует профилю пользователя, должна быть отфильтрована, и должен быть выбран правильный элемент содержимого, который соответствует потребностям и предпочтениям пользователя (например, профилю пользователя).

Системы средств выдачи рекомендаций рассматривают эти проблемы, оценивая степень желательности определенного элемента содержимого для определенного профиля пользователя и автоматически классифицируя элемент содержимого. Это может быть сделано посредством сравнивания характеристик элемента содержимого (например, признаков, метаданных и т.д.) с профилем пользователя или с подобными профилями других пользователей. Таким образом, системы средств выдачи рекомендаций можно рассматривать как инструменты для того, чтобы отфильтровывать нежелательное содержимое и предлагать вниманию пользователя интересное содержимое.

Использование технологии средства выдачи рекомендаций уверенно проникает на рынок. Среди различных примеров, веб-сайты предлагают средство выдачи рекомендаций, чтобы поддерживать пользователей в нахождении элементов содержимого (например, кинофильмов), которые им нравятся, а устройства электронного оборудования (например, персональные видеомагнитофоны) используют средство выдачи рекомендаций для автоматической фильтрации элементов содержимого. Системы средств выдачи рекомендаций применяются все больше и больше, чтобы индивидуализировать или персонализировать услуги и продукцию посредством изучения профиля пользователей, при этом для выведения оценок новых элементов содержимого могут использоваться технические приемы машинного обучения.

Средство выдачи рекомендаций обычно предлагается в виде автономных услуг или модулей, или в виде дополнительных устройств (например, сменных плат) к существующим услугам или модулям. Они все больше появляются в таких потребительских устройствах, как телевизионные приемники или видеомагнитофоны. Для средства выдачи рекомендаций обычно требуется обратная связь с пользователем для изучения предпочтений пользователя. Неявное изучение освобождает пользователя от необходимости явным образом оценивать элементы, и оно может быть получено с помощью наблюдения за действиями пользователя, такими как покупки, загрузки, выборы элементов для воспроизведения или удаления и т.д. Выявляемые действия пользователя могут быть интерпретированы средством выдачи рекомендаций и преобразованы в оценку. Например, средство выдачи рекомендаций может интерпретировать действие покупки как положительную оценку, или, в случае элементов видеоинформации, общая продолжительность просмотра больше/меньше 50% может подразумевать положительную/отрицательную оценку.

Пример средства выдачи рекомендаций представлен в US 2008 0104127 A1, где описана управляющая система для информационных средств, которая способна рекомендовать элементы содержимого пользователю на основании их уместности. Для поиска элементов содержимого, система сначала формирует критерии поиска, которые выводятся из данных персонализации, формируемых посредством мониторинга поведения пользователя и/или получения явных предпочтений пользователя. Например, критерии поиска могут быть строкой: "Сильвестр Сталлоне", если данные персонализации выдают, что пользователю нравится этот артист. Такой критерий поиска отсылается в базу данных сведений относительно элементов мультимедиа для поиска соответствующих элементов содержимого. Соответствующие элементы содержимого оцениваются и, если оцениваемые элементы являются уместными, в конечном счете рекомендуются пользователю.

Грубо говоря, существует два типа систем средств выдачи рекомендаций, основанных на сообществе пользователей и основанных на метаданных.

Первый тип известен как совместная фильтрация, при которой либо (i) члены сообщества характеризуются оценками, которые они дают элементам, либо (ii) элементы характеризуются оценками, которые они получают от членов сообщества. Затем эти характеристики используются для определения сходства среди пользователей или элементов, соответственно. Для определенного члена сообщества и определенного элемента, который еще не был оценен этим членом, эти сходства используются, чтобы выводить для этого члена оценку для данного элемента посредством объединения оценок подобных пользователей или подобных элементов, соответственно.

Второй тип систем средств выдачи рекомендаций использует доступные метаданные относительно элементов, которые обычно поступают в форме признаков и ассоциированных значений или списков значений. Статистические данные оценок пользователя используются для создания профиля этого пользователя в отношении пар признаков-значений с указанием для этих пар степени желательности. Для нового элемента, который еще не был оценен этим пользователем, используются его метаданные, и степени желательности каждой существующей пары признаков-значений объединяются, чтобы получить суммарную оценку. Простой, но популярный алгоритм в этом контексте называют «наивным Байесом» (naive Bayes), и он применяет классификацию по Байесу.

Пользователям персональных видеомагнитофонов хотелось бы иметь доступ к любому предлагаемому содержимому, независимо от его источника. Независимо от того, может ли содержимое передаваться по телевидению (и таким образом представлено в электронной программе передач (EPG)), или оно предлагается в библиотеке видео по требованию, или где-либо в другом месте в Интернете, пользователи хотели бы иметь к нему доступ, и система средства выдачи рекомендаций должна быть в состоянии обеспечивать рекомендации для видеоинформации независимо от ее расположения или источника. Независимо от того, основана ли она на совместной фильтрации или основана на содержимом, система средства выдачи рекомендаций должна иметь доступ ко всем элементам, для которых должны быть сформированы рекомендации. Например, средство выдачи рекомендаций для библиотеки видео по требованию должно получать доступ ко всем элементам библиотеки видео по требованию, чтобы быть в состоянии вычислять для каждого элемента вероятность того, что данному пользователю он может понравиться, и, в конечном счете, выбирать список наиболее популярных элементов.

Однако фильтрация всех баз данных и оценивание всех элементов на основании профиля пользователя не работают для очень больших распределенных баз данных, не только потому, что это неэффективно и не масштабируемо, но особенно потому, что это требует доступа ко всем элементам всех баз данных, для которых должны быть сформированы рекомендации.

РАСКРЫТИЕ ИЗОБРЕТЕНИЯ

Цель изобретения состоит в том, чтобы обеспечить эффективное управление для систем средств выдачи рекомендаций, которое обеспечивает рекомендации для элементов удаленных баз данных без необходимости получать доступ ко всем элементам базы данных.

Эта цель достигается устройством по п. 1, способом по п. 6 и компьютерным программным продуктом по п. 7 формулы изобретения.

Соответственно, профиль пользователя, обычно используемый средством выдачи рекомендаций для прогнозирования оценок пользователя, применяется для формирования целевого запроса для источников содержимого, выдающего совокупность результатов, которые могут быть отмечены или оценены средством выдачи рекомендаций и представлены пользователю в качестве предложений. Пары признаков-значений, выделенные из профиля пользователя, используются для формирования целевого запроса, подлежащего отправке источникам содержимого. Результаты объединяются и оцениваются средством выдачи рекомендаций, чтобы обеспечить список рекомендуемых, весьма уместных элементов. Следовательно, система средства выдачи рекомендаций не должна иметь полного доступа ко всем базам данных или другим типам источников содержимого, чтобы производить уместные рекомендации.

Селектор признаков обеспечен для выбора из пар признаков-значений, выделяемых выделителем признаков-значений, тех пар признаков-значений, которые являются наиболее характерными для упомянутого профиля пользователя. Таким образом, запрос может быть ограничен наиболее характерными парами признаков-значений.

Селектор признаков выполнен с возможностью использования алгоритма Relief, например, алгоритма Relief, описанного в работе Kira, K., & Rendell, L. (1992): The feature selection problem: Traditional methods and a new algorithm (Проблема выбора признаков: традиционные способы и новый алгоритм), Proceedings of the 10th National Conference on Artificial Intelligence, San Jose, CA, July 12-16, 129-134 (Материалы 10-й национальной конференции по искусственному интеллекту, Сан-Хосе, Калифорния, 12-16 июля) или его видоизменения, для выбора наиболее характерных пар признаков-значений. Таким образом, может быть обеспечена эффективная процедура отбора.

В соответствии со вторым аспектом, который может быть объединен с вышеупомянутым первым аспектом, формулирование запроса и оценка результатов могут повторяться до тех пор, пока не будет получено предварительно определенное количество соответствующих элементов содержимого.

В соответствии с третьим аспектом, который может быть объединен с вышеупомянутым первым или вторым аспектом, если существует несколько отличительных значений, связанных с единственным признаком, то это обеспечивает преимущество, заключающееся в том, что во время формирования запроса могут быть включены и выключены различные признаки, чтобы получающимся в результате набором элементов можно было управлять итеративным способом. Это может быть обобщено для множества признаков, и система может отслеживать, какие значения одних и тех же или различных признаков приводят к наилучшим результатам, и располагать их по приоритетам, чтобы улучшать этап формирования запроса и сокращать количество требуемых повторений.

В соответствии с четвертым аспектом, который может быть объединен с любым из вышеупомянутых первым - третьем аспектов, выделитель поиска признаков-значений может быть выполнен с возможностью выделения пар признаков-значений, основываясь по меньшей мере на одной из положительной и отрицательной оценок пользователя. Таким образом, могут быть сформированы запросы, которые включают и/или исключают значения признаков.

В соответствии с пятым аспектом, который может быть объединен с любым из вышеупомянутых первого - четвертого аспектов, формирователь запросов может быть выполнен с возможностью расширения запроса, используя тезаурус или онтологию.

В соответствии с шестым аспектом, который может быть объединен с любым из вышеупомянутых первого - пятого аспектов, формирователь запросов может быть выполнен с возможностью расширения запроса до категорий, отличающихся от категорий профиля пользователя. Таким образом, могут быть обеспечены междоменные рекомендации.

В соответствии с седьмым аспектом, который может быть объединен с любым из вышеупомянутых первого - шестого аспектов, профиль пользователя может быть выведен из системы средства выдачи рекомендаций.

В соответствии с восьмым аспектом, который может быть объединен с любым из вышеупомянутых первого - седьмого аспектов, могут подсчитываться совместные встречаемости пар признаков-значений, и только те пары признаков-значений, которые имеют достаточное количество совместных встречаемостей, могут быть объединены в запросе. Таким образом, количество неудачных попыток запросов может быть сокращено.

Следует отметить, что вышеупомянутое устройство может быть реализовано в виде дискретных схем аппаратного средства с дискретными компонентами аппаратного средства в виде интегральной схемы, в виде компоновки модулей с микросхемами или в виде устройства обработки сигналов или компьютерного устройства или микросхемы, управляемой подпрограммой программного обеспечения или программой, хранящейся в запоминающем устройстве.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Теперь изобретение будет описано, посредством примера, на основании вариантов осуществления в отношении прилагаемых чертежей, на которых:

фиг. 1 показывает блок-схему системы средства выдачи рекомендаций в соответствии с вариантом осуществления настоящего изобретения;

фиг. 2 показывает блок-схему последовательности операций процедуры для основанного на профиле поиска содержимого в соответствии с вариантом осуществления настоящего изобретения; и

фиг. 3 показывает таблицу с выборкой признаков-значений примерного профиля пользователя.

ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ

Теперь будут описаны варианты осуществления настоящего изобретения на основании примерной системы средства выдачи рекомендаций, которая формирует оценки на элементах содержимого, таких как книги, телепрограммы, кинофильмы и т.д.

Фиг. 1 показывает блок-схему системы средства выдачи рекомендаций в соответствии с первым вариантом осуществления, которая выполнена с возможностью поиска элементов содержимого из различных источников 103 содержимого. Источники 103 содержимого обеспечивают, например, по меньшей мере аудио/видеоинформацию в виде широковещательной передачи или в запрашиваемом виде. Кроме того, источники 103 содержимого могут обеспечивать информационные данные, например, информацию EPG в периоде вертикального обратного хода луча видеосигнала или метаданные стандарта MPEG-7 (Экспертной группы по вопросам движущегося изображения) на сегментах конкретного элемента содержимого (например, на границах сцен кинофильма). Услуга электронной программы передач (EPG) в Интернете может обеспечивать, например, информационные данные в телепрограммах. Такие информационные данные, получаемые из источников содержимого или Интернет-услуг, можно поставлять по меньшей мере в один фильтр 105 предварительного выбора (F), который ассоциирован с каналом персонализированного содержимого и фильтрует элементы содержимого соответствующим образом, например, посредством логических правил. Следует отметить, что может быть обеспечено любое количество каналов персонализированного содержимого. Выход фильтра 105 предварительного выбора соединен с механизмом 107 средства выдачи рекомендаций (RE). Таким образом, каждый канал персонализированного содержимого может иметь ассоциированный с ним собственный механизм 107 средства выдачи рекомендаций. Механизм 107 средства выдачи рекомендаций и, следовательно, канал персонализированного содержимого имеют ассоциированный с ними профиль (P) 109 пользователя. Вывод механизма 107 средства выдачи рекомендаций соединен с планировщиком (SCH) 111. Планировщик 111 соединен с устройством 113 хранения данных (например, набором накопителей на жестких дисках) и с селектором (SEL) 115. Источник 103 содержимого может быть соединен с селектором 115, который может содержать по меньшей мере один набор средств локализации содержимого (например, устройство настройки или подобное устройство), который позволяет локализировать один или больше элементов содержимого для записи на устройстве 113 хранения данных. Вывод селектора 115 соединен с устройством 113 хранения данных.

Дополнительно, первый вариант осуществления выполнен с возможностью обеспечения рекомендаций для элементов источников 103 содержимого (например, удаленных баз данных), не имея необходимости получать доступ ко всем элементам базы данных, при условии, что соответствующая база данных источников 103 содержимого имеет интерфейс запросов. Основная идея состоит в том, что профиль 109 пользователя, обычно используемый механизмом 107 средства выдачи рекомендаций для того, чтобы прогнозировать оценки пользователя, применяется для формирования целевого запроса для источников 103 содержимого, выдающих совокупность результатов, которые могут быть отмечены механизмом 107 средства выдачи рекомендаций и представлены пользователю в качестве предложений.

Например, для пользователя, которому нравятся кинофильмы о боевых искусствах, система автоматически выбирает из профиля пользователя значения признаков, которые выделяются, то есть имеют высокую степень желательности. В случае, если ключевые слова используются в качестве желательных признаков, такими значениями признаков могут быть "боевые искусства", "каратэ", или имена актеров, такие как "Брюс Ли" или "Чак Норрис". Тогда пары признаков-значений используются для формирования запроса, подлежащего отправке всему списку источников 103 содержимого (например, механизмам поиска видеоинформации и библиотекам видео по требованию). Результаты объединяются и оцениваются механизмом 107 средства выдачи рекомендаций, чтобы обеспечить список из N наиболее популярных позиций рекомендуемых уместных элементов.

Для выполнения этого, система средства выдачи рекомендаций в соответствии с первым вариантом осуществления содержит выделитель 116, или функцию выделения признаков-значений (FVE), который выполнен с возможностью получения доступа и анализа профиля 109 пользователя, чтобы извлекать комбинации пар признаков-значений, которые выделяются, например, которые имеют высокие положительные или отрицательные оценки. Факультативно, может быть обеспечен дополнительный селектор 117, или функция выбора признаков (FS), для использования только некоторое количество приоритетных значений признаков из совокупности результатов, которые являются наиболее характерными для определенного профиля пользователя. Здесь, для выбора признаков-значений также могут использоваться высокие отрицательные оценки, которые в запросе будут исключены.

Анализ профиля пользователя, выполняемый выделителем 116 поиска признаков-значений и вспомогательным селектором 117 признаков, сопровождается формирователем 118, или функцией формирования запросов, который принимает выделяемые пары признаков-значений и формирует запрос, используя данные пары признаков-значений, которые получены из анализа профиля пользователя. Затем сформированный запрос предоставляется источникам 103 содержимого.

Далее описана работа устройства, представленного на фиг. 1. Информационные данные текущего элемента содержимого, которые подлежат воспроизведению на канале персонализированного содержимого, собираются от источников 103 содержимого или через другие средства, например, через передачу в периоде вертикального обратного хода луча аналогового радиосигнала вещательного телевидения или через транспортные потоки цифрового широковещательного видеосигнала (DVB), или комбинации любых из вышеупомянутых средств. Элементом содержимого может быть телепрограмма, поток данных, содержащий видеоданные и/или аудиоданные, или сегмент программы и т.д.

Информационные данные могут содержать множество атрибутов и значений атрибутов, связанных с элементом содержимого, таких как заголовок, артисты, режиссер и жанр. Каждый профиль 109 основан на информационных данных вместе с данными, указывающими на "желательность" или "нежелательность" для пользователя. Оценка "желательности" и "нежелательности" может быть основана на обратной связи или элементах содержимого, которые проходят через связанный фильтр 105 предварительного выбора. Эта обратная связь может быть задана как явная оценка пользователями, которые используют определенный канал персонализированного содержимого. Оценки могут быть сделаны несколькими способами. Например, пользователь, используя устройство дистанционного управления, может указать для выбранного в настоящий момент элемента содержимого или данного атрибута текущего элемента содержимого свою оценку ("желательный" или "нежелательный"), нажимая соответствующие кнопки на пользовательском интерфейсе (например, устройстве дистанционного управления), при передаче текущего элемента содержимого. В качестве альтернативы, может наблюдаться поведение пользователя. Например, если пользователь просматривает текущий элемент содержимого в течение больше чем предварительно определенный временной интервал (например, 20 минут), это может автоматически указывать на "желательность". В более усовершенствованной установке, степень "желательности" может обеспечиваться или вычисляться в дискретном или непрерывном масштабе вместо только бинарной классификации на "желательный" или " нежелательный".

Когда информационные данные элемента содержимого проходят через фильтр 105, эти информационные данные направляются в механизм 107 средства выдачи рекомендаций, который вычисляет пристрастную степень или оценку "желательности", основанную на связанном с ними профиле 109 пользователя, для этого последующего элемента содержимого. Затем информационные данные, связанные с последующим элементом содержимого, передаются, наряду с вычисленной оценкой, планировщику 111, который впоследствии вычисляет планирование записи, которое будет использоваться для планирования записи элементов содержимого, предлагаемых механизмом 107 средства выдачи рекомендаций, на устройстве 113 хранения данных. В частности, планировщик 111 прежде всего может рассматривать элементы содержимого с высокой степенью или оценкой желательности, в то время как он все еще рассматривает соответствующее новое содержимое для каждого канала персонализированного содержимого. С этой целью, планирование записи, вычисленное планировщиком 111, используется для того, чтобы давать команду планировщику 115 выбирать доступные элементы содержимого из соответствующего одного из источников 103 содержимого для записи их на устройстве 113 хранения данных.

Профили использования или пользователя могут быть выведены при использовании трех основных способов: неявное профилирование; явное профилирование; и профилирование с обратной связью. Способы неявного профилирования незаметно выводят профиль использования содержимого из статистических данных использования пользователя, например, из наборов просматриваемых и не просматриваемых телевизионных представлений. Способы явного профилирования выводят профили использования содержимого из ответов пользователя на вопросы, которые включают в себя явные вопросы о том, что пользователю нравится и не нравится. Способы профилирования с обратной связью выводят профили использования из элементов содержимого, для которых пользователь обеспечил оценки степени желательности или нежелательности.

Фиг. 2 показывает блок-схему последовательности операций основанной на профиле процедуры поиска содержимого, которая может быть применена в первом варианте осуществления.

Первый этап "анализ профиля пользователя" состоит из анализа профиля пользователя извлечения комбинаций пар признаков-значений, которые больше всего выделяются. Они могут быть парами признаков-значений с высоким количеством положительных оценок по сравнению с другими комбинациями признаков-значений, и это может быть выполнено выделителем 116 признаков-значений и вспомогательным селектором 117 признаков, представленными на фиг. 1.

Фиг. 3 показывает таблицу с выборкой признаков-значений примерного профиля пользователя для признака 'ключевого слова'. На фиг. 3, ключевые слова "Япония", "Каратэ", "Боевые искусства" и "Токио" выделяются относительно остальной части ключевых слов в отношении количества положительных оценок. Пользователь дал положительную оценку десяти элементам, имеющим такие значения признаков. Эти четыре пары признаков-значений переходят на второй этап фиг. 2, "формирование запроса". На этом этапе формируется запрос с использованием данных пар признаков-значений, и это может быть выполнено формирователем 118 запросов, представленным на фиг. 1. Точная форма запроса для выполнения это запроса зависит от механизма поиска или базы данных источников 103 содержимого. Для механизмов поиска определяемого пользователем текста, запрос может состоять из списка значений пар признаков-значений. В приведенном выше примере это может иметь следующий вид: ["Япония" "Каратэ" "Боевые искусства" "Токио"]. Для баз данных или механизмов поиска, которые позволяют определять различные поля в запросе, приведенный выше пример может привести к запросу: [ключевое слово: "Япония" ключевое слово: "каратэ" ключевое слово: "боевые искусства" ключевое слово: "Токио"].

На третьем этапе запрос предъявляется совокупности механизмов поиска или баз данных, которые, возможно, содержат соответствующие элементы. Следует отметить, что различным механизмам поиска или базам данных источников 103 содержимого могут быть предъявлены разные запросы, чтобы соответствовать различным форматам и прикладным программным интерфейсам (API). Затем получаются и объединяются результаты так, чтобы сформировать один список связанных элементов. Из этого списка могут быть удалены элементы, которые пользователь уже видел или ранее поместил в черный список. Затем, на четвертом этапе, остающиеся элементы оцениваются механизмом 107 средства выдачи рекомендаций, на основании чего выводится первый профиль 109 пользователя. Результат представляет собой отсортированный список связанных элементов с теми элементами в верхней части, которые имеют высокую вероятность быть желательными для пользователя. Теперь, на пятом этапе процедуры, список оцениваемых элементов готов для Предоставления пользователю.

Этапы "формирования запроса", "предъявления запроса и получения результатов" и "оценки элементов в соответствии с профилем пользователя" могут повторяться до тех пор, пока не будет получено достаточное количество высоко оцениваемых соответствующих элементов. При каждом повторении может использоваться отличающийся набор пар признаков-значений, начиная с широкого набора, определяющего очень конкретный запрос, который может привести к слишком малочисленным результатам, и удаляя пары признаков-значений, таким образом делая запрос менее определенным, чтобы получить больше результатов. В приведенном выше примере, при первом запросе ["Япония" "Каратэ" "Боевые искусства" "Токио"] может быть получено 164 результата на базе данных видеоинформации, при втором запросе, ["Япония" "Каратэ" "Боевые искусства"], без ключевого слова "Токио", может быть получено 1180 результатов, а при третьем запросе, ["Япония" "Каратэ"], без ключевых слов "Токио" и "Боевые искусства", может быть получено 5760 результатов.

В качестве альтернативы, можно отслеживать совместную встречаемость признаков-значений (признаков-значений, которые появляются в одном и том же элементе), и предпочтительно образовывать только такие комбинации, в которых количество совместных встречаемостей достаточно высокое, чтобы сократить количество неудачных попыток запросов.

Когда используется множество пар признаков-значений, соответствующих одному и тому же признаку, как в приведенных выше примерах, в которых все пары признаков-значений соответствуют "ключевому слову" признака, при каждом повторении, формирование запроса может включать и исключать различные признаки. Например, один запрос может быть сформирован с использованием значений признаков "ключевого слова", а другой с использованием, например, значений признаков "актеров". Система может отслеживать, которые признаки приводят к лучшим результатам, и располагать их в соответствии с приоритетом, чтобы улучшить этап формирования запроса и сократить количество требуемых повторений.

В соответствии со вторым вариантом осуществления, система средства выдачи рекомендаций может быть модифицирована так, чтобы использовать только N наиболее популярных признаков, обнаруженных при использовании процедуры отбора признаков, которая может быть выполнена на вспомогательном селекторе 117 признаков, представленном на фиг. 1. N наиболее популярных признаков могут быть признаками, которые являются самыми характерными для определенного профиля.

Примером такой процедуры отбора признаков может быть алгоритм Relief, который основан на взвешивании признаков. Диагональным элементам проекционной матрицы разрешено принимать значения действительных чисел вместо двоичных единиц. Это обеспечивает возможность для применения некоторых хорошо обоснованных методик оптимизации и позволяет эффективно реализовывать алгоритм. Среди существующих алгоритмов взвешивания признаков, алгоритм Relief, как описано, например, в работе K. Kira и L. А. Rendell, A practical approach to feature selection (Практический подход к выбору признаков), Proc. 9th Int. Conf. Mach. Learn. (9-ая Международная конференция по машинному обучению) (1992), стр. 249 - 256, считается одним из самых удачных благодаря его простоте и эффективности. Недавно было показано, что алгоритм Relief представляет собой онлайновый алгоритм, который решает проблему оптимизации выпуклости (convex optimization), нацеленную на максимизацию, основанную на допустимом пределе целевой функции. Допустимый предел определяется на основании классификатора одного ближайшего соседа. По сравнению со способами фильтрации, алгоритм Relief обычно выполняется лучше благодаря обратной связи по рабочей характеристике нелинейного классификатора при поиске полезных признаков. По сравнению со стандартными способами упаковки, благодаря оптимизированию проблемы выпуклости, алгоритм Relief избегает какого-либо исчерпывающего или эвристического комбинаторного поиска, и таким образом может быть эффективно реализован. В качестве расширения первого и второго вариантов осуществления, также могут применяться отрицательные оценки профиля пользователя, чтобы создавать запросы, которые исключают результаты со значениями признаков, соответствующими отрицательным оценкам (например, ["Япония" "Каратэ" "Боевые искусства" "Токио" исключают: "Индия"]).

Этап формирования запроса, выполняемый формирователем 118 запросов, представленным на фиг. 1, также может включать в себя вспомогательную операцию "расширения запроса", которая расширяет запрос на основании данных пар признаков-значений, используя, например, тезаурус или онтологию. Это также может применяться для предотвращения несоответствий терминологии между базами данных.

Следует отметить, что поиск может быть расширен до элементов категорий, отличающихся от исходного профиля. Например, информация о книгах может быть получена, например, от Интернет-магазина и предложена на основании профиля телезрителя (междоменная рекомендация).

Следует отметить, что настоящее изобретение может быть применено к любой системе средства выдачи рекомендаций для телевизионных абонентских приставок, телевизионных приемников, мобильных телефонов, персональных цифровых секретарей (PDA), персональных компьютеров (PC), персональных видеомагнитофонов (PVR), аудиосистем (включая переносные аудиосистемы), Интернет-услуг (включая аудио и видеосистемы), и всех устройств, в которых средства выдачи рекомендаций используются для сбора, фильтрации и предоставления элементов содержимого от множества источников их пользователям. Таким образом, изобретение не ограничивается средствами выдачи рекомендаций для содержимого телевизионных передач или фильмов, но может быть применено к музыке, театральным представлениям, книгам и всем типам продуктов и услуг, для которых могут быть созданы средства выдачи рекомендаций.

Таким образом, описаны устройство, способ и компьютерный программный продукт для управления системой средства выдачи рекомендаций, при этом профиль пользователя, обычно используемый средством выдачи рекомендаций для прогнозирования оценок пользователя, применяется для формирования целевого запроса для удаленной базы данных, приводящего к совокупности результатов, которые могут быть отмечены средством выдачи рекомендаций и представлены пользователю в качестве предложений.

Хотя изобретение было проиллюстрировано и подробно описано на чертежах и в вышеприведенном описании, такое иллюстрирование и описание следует рассматривать как приведенные для примера, но не в качестве ограничения. Изобретение не ограничивается раскрытыми вариантами осуществления. Из представленного раскрытия специалистам в данной области техники будут очевидны другие модификации. Такие модификации могут содержать другие признаки, которые уже известны в данной области техники и которые могут использоваться вместо или в дополнение к признакам, уже описанным в данном описании.

Изменения раскрытых вариантов осуществления специалистам в данной области техники могут быть поняты и реализованы ими на основании изучения чертежей, раскрытия и прилагаемой формулы изобретения. В формуле изобретения термин "содержащий" не исключает другие элементы или этапы, и единственное число не исключает множество элементов или этапов. Одиночный процессор или другой модуль может выполнять по меньшей мере функции, представленные на фиг. 1 и 2, основываясь на соответствующих подпрограммах программного обеспечения. Компьютерная программа может храниться/распространяться на подходящем носителе, таком как оптический носитель для хранения информации или полупроводниковый носитель, поставляемый вместе или в виде части другого аппаратного обеспечения, но также может распространяться в других формах, например, через Интернет или другие проводные или беспроводные телекоммуникационные системы. Сам факт, что определенные меры содержатся во взаимно отличающихся зависимых пунктах формулы изобретения, не указывает, что комбинация этих мер не может использоваться с выгодой. Любые ссылочные позиции в пунктах формулы изобретения не должны рассматриваться как ограничение ее объема.

Похожие патенты RU2577189C2

название год авторы номер документа
СПОСОБ И УСТРОЙСТВО ДЛЯ ВЫБОРА ПО МЕНЬШЕЙ МЕРЕ ОДНОГО МЕДИЙНОГО ЭЛЕМЕНТА 2011
  • Пройдль Адольф
RU2595630C2
СПОСОБ И УСТРОЙСТВО ДЛЯ АВТОМАТИЧЕСКОГО ГЕНЕРИРОВАНИЯ РЕКОМЕНДАЦИЙ 2012
  • Корст Ян
  • Барбьери Мауро
  • Клаут Рамон
  • Пронк Сервериус Петрус Паулус
RU2627717C2
Способ и устройство для обучения алгоритма машинного обучения (MLA) по созданию рекомендаций содержимого в системе рекомендаций и способ и устройство для создания рекомендуемого содержимого с помощью алгоритма машинного обучения 2016
  • Лифарь Игорь Игоревич
  • Ламбурт Виктор Григорьевич
RU2731659C2
СИСТЕМА РЕКОМЕНДАТЕЛЯ С ПРИМЕНЕНИЕМ СОВМЕСТИМОГО ПРОФИЛЯ 2011
  • Пройдль Адольф
  • Дворак Томас
RU2590994C2
СПОСОБ И СЕРВЕР СОЗДАНИЯ РЕКОМЕНДОВАННОГО НАБОРА ЭЛЕМЕНТОВ 2015
  • Лифарь Игорь Игоревич
  • Ройзнер Михаил Александрович
RU2632100C2
Система для предоставления консультаций экспертов в режиме реального времени 2019
  • Киселева Полина Александровна
RU2726259C1
СИСТЕМА УПРАВЛЕНИЯ ВЫБОРКОЙ И ОБРАБОТКОЙ ДАННЫХ ГОСУДАРСТВЕННОГО РЕГИСТРА НАСЕЛЕНИЯ 2004
  • Арлазаров Владимир Львович
  • Романов Анатолий Николаевич
  • Славин Олег Анатольевич
RU2277721C1
СИСТЕМА И СПОСОБ ФОРМИРОВАНИЯ ОБУЧАЮЩЕГО НАБОРА ДЛЯ АЛГОРИТМА МАШИННОГО ОБУЧЕНИЯ 2017
  • Лахман Константин Викторович
  • Чигорин Александр Александрович
  • Юрченко Виктор Сергеевич
RU2711125C2
ОСНОВАННАЯ НА КОНТЕКСТЕ РЕКОМЕНДУЮЩАЯ СИСТЕМА 2009
  • Барбьери Мауро
  • Пронк Сервериус Петрус Паулус
RU2523930C2
Способ и система для оценивания данных о взаимодействиях пользователь-элемент 2018
  • Ушанов Дмитрий Валерьевич
  • Вотяков Роман Алексеевич
  • Пархоменко Павел Андреевич
RU2725659C2

Иллюстрации к изобретению RU 2 577 189 C2

Реферат патента 2016 года ОСНОВАННОЕ НА ПРОФИЛЕ ИЗВЛЕЧЕНИЕ СОДЕРЖИМОГО ДЛЯ СИСТЕМ СРЕДСТВ ВЫДАЧИ РЕКОМЕНДАЦИЙ

Изобретение относится к области выдачи рекомендаций пользователям сети. Технический результат - эффективное управление выдачей рекомендаций. Устройство для управления системой средства выдачи рекомендаций, содержащее селектор признаков для выбора из упомянутых пар признаков-значений, выделяемых упомянутым выделителем признаков-значений, тех пар признаков-значений, которые являются наиболее характерными для упомянутого профиля пользователя, причем упомянутый выделитель признаков-значений выполнен с возможностью выделения пар признаков-значений на основе отрицательных оценок пользователя, так что формируются запросы, которые исключают результаты с признаками-значениями, соответствующими отрицательным оценкам. 3 н. и 5 з.п. ф-лы, 3 ил.

Формула изобретения RU 2 577 189 C2

1. Устройство для управления системой средства выдачи рекомендаций, причем упомянутое устройство содержит
выделитель (116) признаков-значений для анализа профиля (109) пользователя и для выделения пар признаков-значений, которые характеризуют пользователя упомянутой системы средства выдачи рекомендаций,
формирователь (118) запросов для формирования на основе пар признаков-значений, выделенных упомянутым выделителем (116) признаков-значений, запроса, подлежащего отправке по меньшей мере одному источнику (103) содержимого, и
механизм (107) средства выдачи рекомендаций для оценки результатов, полученных в ответ на упомянутый запрос, чтобы предоставить упомянутому пользователю рекомендацию,
при этом упомянутое устройство отличается тем, что оно дополнительно содержит селектор (117) признаков для выбора из упомянутых пар признаков-значений, выделяемых упомянутым выделителем (116) признаков-значений, тех пар признаков-значений, которые являются наиболее характерными для упомянутого профиля (109) пользователя, причем упомянутый выделитель (116) признаков-значений выполнен с возможностью выделения пар признаков-значений на основе отрицательных оценок пользователя, так что формируются запросы, которые исключают результаты с признаками-значениями, соответствующими отрицательным оценкам.

2. Устройство по п. 1, в котором упомянутый выделитель (116) признаков-значений выполнен с возможностью выделения пар признаков-значений, основываясь на положительных оценках пользователя.

3. Устройство по п. 1, в котором упомянутый формирователь (118) запросов выполнен с возможностью расширения упомянутого запроса, используя тезаурус или онтологию.

4. Устройство по п. 1, в котором упомянутый формирователь (118) запросов выполнен с возможностью расширения упомянутого запроса до категорий, отличающихся от категорий упомянутого профиля (109) пользователя.

5. Устройство по п. 1, в котором упомянутый профиль (109) пользователя получен от упомянутой системы средства выдачи рекомендаций.

6. Устройство по п. 1, в котором селектор признаков выполнен с возможностью использования алгоритма Relief в качестве алгоритма выбора признаков для выбора упомянутых наиболее характерных пар признаков-значений.

7. Способ управления системой средства выдачи рекомендаций, причем упомянутый способ содержит этапы, на которых:
анализируют профиль пользователя и выделяют пары признаков-значений, которые характеризуют пользователя упомянутой системы средства выдачи рекомендаций,
формулируют, на основании выделенных пар признаков-значений, запрос, подлежащий отправке по меньшей мере одному источнику (103) содержимого, оценивают результаты, полученные в ответ на упомянутый запрос, чтобы предоставить упомянутому пользователю рекомендацию,
повторяют упомянутые этапы формулирования и оценки до тех пор, пока не будет получено предварительно определенное количество соответствующих элементов содержимого, и
подсчитывают совместные встречаемости пар признаков-значений, которые появляются в одном и том же элементе, и объединяют в упомянутом запросе только пары признаков-значений с достаточным количеством совместных встречаемостей,
причем пары признаков-значений выделяют на основе отрицательных оценок пользователя, так что формируются запросы, которые исключают результаты с признаками-значениями, соответствующими отрицательным оценкам.

8. Носитель данных, хранящий компьютерный программный продукт, причем компьютерный программный продукт содержит средство кодирования для осуществления этапов способа по п. 7 при исполнении на компьютерном устройстве.

Документы, цитированные в отчете о поиске Патент 2016 года RU2577189C2

Станок для изготовления деревянных ниточных катушек из цилиндрических, снабженных осевым отверстием, заготовок 1923
  • Григорьев П.Н.
SU2008A1
Способ и приспособление для нагревания хлебопекарных камер 1923
  • Иссерлис И.Л.
SU2003A1
Способ обработки целлюлозных материалов, с целью тонкого измельчения или переведения в коллоидальный раствор 1923
  • Петров Г.С.
SU2005A1
Способ и приспособление для нагревания хлебопекарных камер 1923
  • Иссерлис И.Л.
SU2003A1

RU 2 577 189 C2

Авторы

Барбьери Мауро

Пронк Сервериус Петрус Паулус

Корст Ян

Даты

2016-03-10Публикация

2011-06-15Подача