Раскрытие сущности изобретения
Техническая проблема
Кроме того, в устройствах обработки информации, способных принимать и захватывать звучание голосов пользователей для распознавания речи, осуществления голосовых вызовов и других подобных операций, были проведены исследования структур, способных еще более улучшить качество захвата звучания путем подавления посторонних акустических звуков (иными словами, шумов), отличных от захвата звуков целевого голоса. Например, Патентная Литература 1 описывает пример структуры для подавления шумов.
С другой стороны, поскольку сценарии применения устройств обработки информации становятся весьма разнообразными, как в случаях, когда такие устройства обработки информации используются вне помещений, предполагается существование ситуаций, когда среда, окружающая эти устройства обработки информации, изменяется динамически. В такой ситуации можно также предположить случаи, в которых звуки, исходящие извне устройств обработки информации, такие как звук ветра или звуки, сопровождающиеся вибрацией, захватываются в виде шумов. Такие звуки представляют собой шумы, возникающие случайным образом, поскольку места, откуда исходят эти звуки, или моменты времени, когда возникают эти звуки, являются нерегулярными.
Соответственно, настоящее изобретение предлагает устройство обработки информации, способное принимать и захватывать целевые звуки более подходящим образом даже в средах, где шумы возникают случайным образом.
Решение проблемы
Согласно настоящему изобретению, предложено устройство обработки информации, содержащее: модуль захвата звука; и держатель, конфигурированный так, что он имеет выступающий участок обтекаемой формы, занимающий по меньшей мере часть держателя и удерживающий модуль захвата звука таким образом, что этот модуль захвата звука расположен на переднем конце или рядом с передним концом выступающего участка.
Преимущества изобретения
Настоящее изобретение, описанное выше, предлагает устройство обработки информации, выполненное с возможностью захвата целевого звука более подходящим образом даже в среде, где шумы возникают случайным образом.
Отметим, что описанные выше эффекты не являются исчерпывающими. Вместо или вместе с описываемыми выше эффектами могут быть достигнуты какие-либо эффекты, рассматриваемые в настоящем описании, или другие эффекты, которые могут быть выведены из настоящего описания.
Краткое описание чертежей
Фиг. 1 представляет пояснительную схему, иллюстрирующую пример упрощенной конфигурации устройства обработки информации согласно первому варианту настоящего изобретения.
Фиг. 2 представляет пояснительную схему, иллюстрирующую пример упрощенной конфигурации устройства обработки информации согласно варианту настоящего изобретения.
Фиг. 3 представляет пояснительную схему, иллюстрирующую пример измерительной среды, в которой измеряют влияние звука ветра.
Фиг. 4 представляет схему, иллюстрирующую примеры позиций для размещения нескольких модулей захвата звука, установленных в устройстве обработки информации.
Фиг. 5 представляет пояснительную схему, иллюстрирующую примеры результатов измерений звука ветра посредством модуля захвата звука в случае, когда ветер попадает в устройство обработки информации под разными углами (с разных направлений).
Фиг. 6 представляет блок-схему, иллюстрирующую пример функциональной конфигурации устройства обработки информации согласно варианту настоящего изобретения.
Фиг. 7 представляет схему, иллюстрирующую пример процесса получения целевого звука на основе результата захвата звука от каждого из нескольких модулей захвата звука в составе устройства обработки информации согласно варианту настоящего изобретения.
Фиг. 8 представляет логическую схему, иллюстрирующую пример последовательности операций, выполняемых устройством обработки информации согласно варианту настоящего изобретения.
Фиг. 9 представляет пояснительную схему, иллюстрирующую пример устройства обработки информации согласно Примеру 1.
Фиг. 10 представляет пояснительную схему, иллюстрирующую другой пример устройства обработки информации согласно Примеру 1.
Фиг. 11 представляет пояснительную схему, иллюстрирующую другой пример устройства обработки информации согласно Примеру 1.
Фиг. 12 представляет пояснительную схему, иллюстрирующую пример устройства обработки информации согласно Примеру 2.
Фиг. 13 представляет пояснительную схему, иллюстрирующую другой пример устройства обработки информации согласно Примеру 2.
Фиг. 14 представляет пояснительную схему, иллюстрирующую другой пример устройства обработки информации согласно Примеру 2.
Фиг. 15 представляет пояснительную схему, иллюстрирующую другой пример устройства обработки информации согласно Примеру 2.
Фиг. 16 представляет пояснительную схему, иллюстрирующую пример устройства обработки информации согласно Примеру 3.
Фиг. 17 представляет пояснительную схему, иллюстрирующую пример формы использования устройства 30 обработки информации согласно Модифицированному Примеру 3.
Фиг. 18 представляет пояснительную схему, иллюстрирующую пример устройства обработки информации согласно Примеру 4.
Фиг. 19 представляет пояснительную схему, иллюстрирующую другой пример устройства обработки информации согласно Примеру 4.
Фиг. 20 представляет пояснительную схему, иллюстрирующую пример устройства обработки информации согласно Примеру 5.
Фиг. 21 представляет пояснительную схему, иллюстрирующую пример упрощенной конфигурации области возле объектива модуля считывания изображения в устройстве обработки информации согласно Примеру 5.
Фиг. 22 представляет блок-схему, иллюстрирующую пример функциональной конфигурации устройства обработки информации согласно второму варианту настоящего изобретения.
Фиг. 23 представляет пояснительную схему, иллюстрирующую базовые принципы процедуры, осуществляемой модулем оценки мощности некоррелированной составляющей.
Фиг. 24 представляет блок-схему, иллюстрирующую пример функциональной конфигурации устройства обработки информации согласно третьему варианту настоящего изобретения.
Фиг. 25 представляет схему, иллюстрирующую пример аппаратной конфигурации устройства обработки сигнала согласно варианту настоящего изобретения.
Осуществление изобретения
Далее, предпочтительный вариант (ы) настоящего изобретения будут описаны подробно со ссылками на прилагаемые чертежи. Отметим, что в настоящем описании и на прилагаемых чертежах структурным элементам, имеющим по существу одинаковые функции и структуры, присвоены одинаковые цифровые позиционные изображения, а повторное объяснение этих структурных элементов опущено.
Кроме того, описание будет сделано в следующем порядке.
1. Первый вариант
1.1. Обзор
1.2. Исследование позиции установки модуля захвата звука
1.3. Функциональная конфигурация
1.4. Процедура
1.5. Примеры
1.5.1. Пример 1: пример устройства, носимого на шее
1.5.2. Пример 2: пример устройства, носимого на голове
1.5.3. Пример 3: пример применения в портативном информационном терминале
1.5.4. Пример 4: пример применения в носимом устройстве типа наручных часов
1.5.5. Пример 5: пример применение в устройстве для считывания изображения
2. Второй вариант
2.1. Обзор
2.2. Функциональная конфигурация
2.3. Подробности о модуле оценки мощности некоррелированной составляющей
2.4. Подробности о модуле оценки мощности случайных шумов
2.5. Оценка
3. Третий вариант
3.1. Обзор
3.2. Функциональная конфигурация
3.3. Подробности способа вычисления функции многоканального фильтра Винера
3.4. Оценка
4. Аппаратная конфигурация
5. Заключение
1. Первый вариант
1.1. Обзор
Сначала, пример упрощенной конфигурации устройства обработки информации согласно первому варианту настоящего изобретения будет описан со ссылками на фиг. 1. После этого будет рассмотрена техническая проблема устройства обработки информации согласно указанному варианту. На фиг. 1 представлена пояснительная схема, иллюстрирующая пример упрощенной конфигурации устройства обработки информации согласно первому варианту настоящего изобретения.
В примере, показанном на фиг. 1, устройство 10 обработки информации представляет собой так называемое носимое устройство. Более конкретно, устройство 10 обработки информации выполнено в форме частично открытого кольца (другими словами, в форме стяжки для наушников или в U-образной форме), так что это устройство носит пользователь таким образом, что по меньшей мере часть внутренней поверхности кольца входит в контакт с частью шеи пользователя (иными словами, свисает по обе стороны шеи).
В дополнение к этому, устройство 10 обработки информации содержит модуль захвата звука, такой как так называемый микрофон, и принимает и захватывает речь, произносимую пользователем, в качестве акустической информации от модуля захвата звука. Например, в варианте, показанном на фиг. 1, устройство 10 обработки информации содержит несколько модулей захвата звука, которым присвоены позиционные обозначения 111 – 113. Более конкретно, модули захвата звука 111 – 113, установлены, например, в корпусе 101 устройства 10 обработки информации.
Например, на фиг. 2 представлена пояснительная схема, иллюстрирующая пример упрощенной конфигурации устройства 10 обработки информации согласно варианту настоящего изобретения, так что эта схема иллюстрирует пример части, в которой модуль 111 захвата звука установлен в устройстве 10 обработки информации. Как показано на фиг. 1 и 2, когда пользователь носит устройство 10 обработки информации на шее, выступающий участок, который имеет обтекаемую форму и выступает от пользователя вперед, оказывается расположен возле рта пользователя, а модуль 111 захвата звука установлен на переднем конце (или возле переднего конца) выступающего участка, так что он обращен в направлении, в котором отходит этот выступающий участок. Кроме того, модуль 111 захвата звука может представлять собой устройство, отдельное от устройства 10 обработки информации, и может быть закреплен на переднем конце (или возле переднего конца) выступающего участка, так что он обращен в направлении, в котором отходит этот выступающий участок. Кроме того, в последующее описание случая, в котором модуль 110 захвата звука установлен в устройстве 10 обработки информации, будет, как предполагается, также включен случай, в котором этот модуль 110 захвата звука выполнен отдельно от устройства 10 обработки информации и закреплен по меньшей мере на части этого устройства 10 обработки информации.
В дополнение к этому, как показано на фиг. 1, модули 112 и 113 захвата звука установлены в устройстве 10 обработки информации таким образом, что они обращены во взаимно различных направлениях. Более конкретно, когда пользователь носит устройство 10 обработки информации, модули 112 и 113 захвата звука расположены по существу в симметричных позициях один относительно другого, если принять шею пользователя в качестве начала отсчета. Кроме того, позиции, где установлены указанные модули захвата звука будут в подробностях отдельно описаны ниже. в устройстве 10 обработки информации, в примере, показанном на фиг. 1, модули 112 и 113 захвата звука установлены на корпусе 101, имеющем кольцевую форму, таким образом, что эти модули обращены относительно кольца наружу (иными словами, в сторону, противоположную относительно центра кольца). Иными словами эти модули 112 и 113 захвата звука установлены так, что они обращены во взаимно противоположных направлениях.
В описанной конфигурации, например, устройство 10 обработки информации может распознавать содержание речи, произносимой пользователем, посредством анализа на основе технологии распознавания речи или технологии обработки естественного языка для распознавания речи (акустической информации) пользователя, принятой и захваченной модулями захвата звука (например, модулями 111 – 113 захвата звука). Таким образом, например, устройство 10 обработки информации может распознавать содержание команд от пользователя и может выполнять разнообразные процессы (приложения) в соответствии с результатом распознавания.
В дополнение к этому, в качестве другого примера, устройство 10 обработки информации может иметь, так называемую, вызывающую функцию. В этом случае устройство 10 обработки информации может передать речь, принятую и захваченную модулями захвата звука, (например, модулями 111 – 113 захвата звука) другому устройству обработки информации, являющемуся партнером по вызову.
С другой стороны, например, рассмотрим ситуацию, в которой окружающая среда для устройства 10 обработки информации динамически изменяется в разнообразных сценариях использования, как в случае, когда устройство 10 обработки информации, такое как, так называемое, носимое пользователем устройство, показанное на фиг. 1, используется вне помещений. В такой ситуации, например, шумы, возникающие случайным образом, такие как звук ветра, шум, сопровождаемый вибрацией, и шуршание, возникающее вследствие ношения устройства, в ряде случаев принимают и захватывают модули захвата звука из состава устройства 10 обработки информации.
Соответственно, в настоящем описании, позиция установки каждого модуля захвата звука и пример обработки сигнала на основе результата захвата звука, полученного модулем захвата звука, будут описаны подробно в качестве примера структуры, способной принимать и захватывать целевые звуки, более подходящим образом даже в средах, в которых шумы возникают случайным образом.
1.2. Исследование позиции установки модуля захвата звука
Сначала, будет описан результат исследований позиций установки модулей захвата звука, способных принимать и захватывать звуки речи пользователя более подходящим образом в примере случая, в котором устройство 10 обработки информации согласно рассматриваемому варианту представляет собой носимое устройство, предназначенное для ношения пользователем на шее, как показано на фиг. 1. Более конкретно, будет описан пример результата измерений звука ветра каждым из модулей захвата звука в составе устройства 10 обработки информации, в котором эти модули захвата звука установлены в нескольких точках, в случае, в котором ветер приходит с взаимно различных угловых направлений, в предположении, что так называемый звук ветра является шумом.
Например, на фиг. 3 представлена пояснительная схема, иллюстрирующая пример измерительной среды, в которой измеряют влияние звука ветра. В ходе этих измерений, как показано на фиг. 3, устройство 10 обработки информации надевают на шею манекена U1, моделирующего часть тела пользователя выше грудной клетки, а перед этим манекеном U1 помещают циркулятор U2. Затем, выбрав вертикальное направление манекена U1 в качестве оси, и поворачивая манекен U1 с шагом 10 градусов в пределах от 0 градусов до 360 градусов, изменяли тем самым угол направления прихода ветра от циркулятора U2 к устройству 10 обработки информации и выполняли измерения звука ветра, принятого и захваченного каждым модулем захвата звука.
На фиг. 4 представлена схема, иллюстрирующая примеры позиций для размещения нескольких модулей захвата звука, установленных в устройстве 10 обработки информации, для проведения измерений. В частности, в примере, показанном на фиг. 4, в устройстве 10 обработки информации установлены модули M1 – M6 захвата звука. Маркеры, добавляемые в устройстве 10 обработки информации, схематично указывают позиции, в которых установлены модули M1 – M6 захвата звука. Кроме того, в маркерах, к которым добавлены стрелки, эти стрелки указывают направления, куда обращены модули захвата звука, соответствующие этим маркерам. В дополнение к этому, что касается маркеров, к которым не добавлены стрелки, относительно модулей захвата звука (иными словами модулей M3 и M6 захвата звука), соответствующих этим маркерам, предполагается, что эти модули обращены в направлении вертикально вверх (иными словами, ближняя сторона в направлении глубины чертежа) для устройства 10 обработки информации.
В частности, модуль M1 захвата звука эквивалентен модулю 111 захвата звука в устройстве 10 обработки информации, описываемом со ссылками на фиг. 1. Иными словами, когда пользователь носит устройство 10 обработки информации на себе, модуль M1 захвата звука установлен на переднем конце выступающего участка, расположенного так, что он отходит вперед от пользователя, в позиции, эквивалентной близости ко рту пользователя. В дополнение к этому, модуль M5 захвата звука эквивалентен модулю 112 захвата звука в устройстве 10 обработки информации, описываемом со ссылками на фиг. 1. Иными словами, когда пользователь носит устройство 10 обработки информации на себе, модуль M5 захвата звука располагается вне корпуса 101 устройства 10 обработки информации в позиции, эквивалентной области слева от пользователя (направление примерно 270 градусов на фиг. 3), так что этот модуль обращен наружу от корпуса 101 (другими словами, в направлении примерно 270 градусов на фиг. 3).
В дополнение к этому, когда пользователь носит устройство 10 обработки информации на себе, модули M2 – M4 и M6 захвата звука установлены в позициях, эквивалентных областям справа спереди от пользователя (другими словами, в направлении примерно 45 градусов на фиг. 3). При этом модуль M2 захвата звука установлен так, что он обращен к внутренней стороне корпуса 101 через пространство между корпусом 101 устройства 10 обработки информации и шеей пользователя. В дополнение к этому, модуль M4 захвата звука установлен на наружной стороне корпуса 101 устройства 10 обработки информации, так что он обращен вовне от корпуса 101 (другими словами, в направлении примерно 45 градусов на фиг. 3). Кроме того, модули M3 и M6 захвата звука установлены так, что они обращены в вертикальном направлении вверх, как описано выше.
В дополнение к этому, на фиг. 5 представлена пояснительная схема, иллюстрирующая примеры результатов измерений звука ветра посредством модуля захвата звука в случае, когда ветер приходит к устройству 10 обработки информации под разными углами (с разных направлений). Иными словами, фиг. 5 иллюстрирует примеры результатов захвата звука при восприятии звуков ветра посредством модулей M1 – M6 захвата звука, описываемых со ссылками на фиг. 4, в измерительной среде, описываемой со ссылками на фиг. 3. Кроме того, на графиках показаны результаты захвата звука в модулях M1 – M6 захвата звука, как показано на фиг. 5, числовые величины, записанные по окружности, указывают направления, по которым приходит ветер от циркулятора U2. В дополнение к этому, числовые величины, записанные в радиальных направлениях графиков, указывают уровни звуков, принимаемых соответствующими модулями захвата звука (иными словами, уровни звука, измеренные модулями захвата звука). Иными словами, на графиках, показывающих результаты захвата звука посредством модулей M1 – M6 захвата звука, иллюстрируемых на фиг. 5, видно, что влияние звуков ветра (иными словами, шумов) тем меньше, чем меньше измеренные уровни звука (другими словами, измеренные величины расположены на внутренних сторонах графиков).
Здесь, если сосредоточиться конкретно на результатах измерений, выполненных модулем M1 захвата звука, можно понять, что влияние звука ветра мало в ситуации, когда ветер приходит к пользователю прямо спереди (иными словами, в направлении 0 градусов). В дополнение к этому, для модуля M1 захвата звука можно понять, что влияние звука ветра меньше, чем для других модулей захвата звука, даже в тех случаях, когда ветер приходит с направления, отличного от направления прямо спереди.
Из этого, например, можно сделать вывод, что влияние шума, возникающего случайно, такого как звук ветра, может быть уменьшено путем установки одного модуля захвата звука на переднем конце (или возле переднего конца) обтекаемого выступающего участка, так что этот модуль обращен в том направлении, в котором отходит выступающий участок, как это имеет место для модуля 111 захвата звука, показанного на фиг. 1.
В дополнение к этому, если сосредоточиться на результатах измерений, выполненных модулями M5 и M6 захвата звука, можно понять, что влияние звука ветра мало в случае, когда ветер приходит со стороны шеи пользователя в такой модуль захвата звука. Понятно, что это происходит потому, что ветер оказывается блокирован шеей или головой пользователя и тем самым влияние звука ветра уменьшается.
Отсюда, например, можно сделать вывод, что характеристики другого модуля захвата звука (например, модуля 111 захвата звука, показанного на фиг. 1) можно компенсировать посредством установки какого-либо модуля захвата звука таким образом, что часть (например, шея или голова) тела пользователя, на которую надето для ношения устройство 10 обработки информации, может быть использована в качестве экрана против ветра или другого подобного фактора, как для модулей 112 и 113 захвата звука, показанных на фиг. 1.
Выше со ссылками на фиг. 3 – 5 был описан результат исследования позиций установки модулей захвата звука, способных принимать и захватывать звуки речи пользователя, более подходящим образом (иными словами, таким образом, чтобы уменьшить влияние шумов, таких как звук ветра) в примере, в котором устройство 10 обработки информации согласно рассматриваемому варианту представляет собой носимое устройство, надеваемое на шею пользователя.
1.3. Функциональная конфигурация
Далее, пример функциональной конфигурации устройства 10 обработки информации согласно рассматриваемому варианту будет описан со ссылками на фиг. 6, в частности, с упором на процедуру получения целевого звука (например, звука голоса пользователя) на основе результатов захвата звука в каждом из нескольких модулей захвата звука в составе рассматриваемого устройства 10 обработки информации. На фиг. 6 представлена блок-схема, иллюстрирующая пример функциональной конфигурации устройства 10 обработки информации согласно рассматриваемому варианту настоящего изобретения.
Как показано на фиг. 6, устройство 10 обработки информации содержит несколько модулей 111 – 11M захвата звука 111 – 11M (где M – положительное целое число), модуль 13 разложения на частотные составляющие, модуль 15 оценки мощности в канале, модуль 16 вычисления коэффициентов фильтрации, модуль 17 фильтрации и модуль 18 объединения частотных составляющих. Кроме того, в последующем описании, если модули 111 – 11M захвата звука не нужно конкретно отличать один от другого, эти модули 111 – 11M захвата звука могут называться просто “модули 110 захвата звука”. Кроме того, число (иными словами, M) модулей 110 захвата звука ничем конкретно не ограничено, пока этих модулей захвата звука несколько. Это число модулей захвата звука предпочтительно равно 3 или более.
Модуль 110 захвата звука содержит устройство захвата звука, которое принимает звуковые волны (иными словами, звуковые волны, распространяющиеся через внешнюю среду и приходящие к устройству) из внешней среды, как это делается в так называемом микрофоне. Кроме того, модули 110 захвата звука принимают голосовой входной сигнал от пользователя, который должен быть принят устройством 10 обработки информации. В дополнение к этому, например, модуль 110 захвата звука может содержать несколько устройств захвата звука, таких как решетка микрофонов. Модуль 110 захвата звука передает акустический сигнал, полученный на основе результата захвата звуковых волн из внешней среды, в модуль 13 разложения на частотные составляющие. Кроме того, коэффициент передачи для акустического сигнала с выхода модуля 110 захвата звука можно регулировать посредством, например, усилителя или другого подобного устройства, так что отрегулированный акустический сигнал может быть преобразован из аналоговой формы в цифровую форму посредством аналого-цифрового преобразования, а полученные в результате цифровые сигналы могут быть переданы на вход модуля 13 разложения на частотные составляющие. Кроме того, в последующем описании, если m (где 1≤m≤M) представляет собой номер канала для модуля 110 захвата звука и n – обозначает дискретный момент времени, то акустический сигнал с выхода этого модуля 110 захвата звука выражен в виде xm(n).
Модуль 13 разложения на частотные составляющие разлагает акустический сигнал xm(n) с выхода модуля 110 захвата звука на частотные составляющие и передает эти частотные составляющие на выход. В частности, модуль 13 разложения на частотные составляющие разлагает акустический сигнал xm(n) на частотные составляющие путем осуществления таких процедур, как разбиение кадра, применение заданной вырезающей функции, преобразование из временной области в частотную область (например, быстрое преобразование Фурье (Fast Fourier Transform (FFT)), дискретное преобразование Фурье (Discrete Fourier Transform (DFT)) или другое подобное преобразование) или другая подобная операция, применительно к полученному им акустическому сигналу xm(n). Кроме того, в последующем описании, частотные составляющие акустического сигнала xm(n) в некоторых случаях записывают как Xm(i, k). Здесь, i обозначает номер кадра и k обозначает номер дискретной частоты. Затем, модуль 13 разложения на частотные составляющие передает на выход каждую частотную составляющую Xm(i, k) полученного акустического сигнала xm(n) каждому из модулей – модулю 17 фильтрации и модулю 15 оценки мощности в канале, расположенным в последнем каскаде. Таким образом, что касается каждого из модулей 111 – 11M захвата звука, они передают на выход каждую частотную составляющую Xm(i, k) акустического сигнала xm(n) каждому из модулей – модулю 17 фильтрации и модулю 15 оценки мощности в канале.
Модуль 15 оценки мощности в канале получает каждую частотную составляющую Xm(i, k) акустического сигнала xm(n) для каждого модуля 110 захвата звука (иными словами, каждого из модулей 111 – 11M захвата звука) от модуля 13 разложения на частотные составляющие. После этого, модуль 15 оценки мощности в канале оценивает энергетический спектр сигнала каждого модуля 110 захвата звука для каждой частоты на основе каждой частотной составляющей Xm(i, k) акустического сигнала xm(n), соответствующего каждого модуля 110 захвата звука. Здесь, если Pm(i, k) представляет собой энергетический спектр, соответствующий i-ому кадру и частоте k в m-ом модуле 110 захвата звука (иными словами, в модуле 11m захвата звука), тогда этот энергетический спектр Pm(i, k) представлен вычисляемым выражением, обозначенным ниже как (Выражение 1). Кроме того, в следующем (Выражении 1), величина Xm*(i, k) обозначает величину, комплексно-сопряженную относительно величины Xm(i, k). В дополнение к этому, в (Выражении 1), r обозначает коэффициент сглаживания в направлении кадра для подавления резких изменений энергетического спектра (0≤r<1).
Математическая формула 1
(Выражение 1)
Затем модуль 15 оценки мощности в канале передает результат оценки энергетического спектра Pm(i, k) для каждого модуля 110 захвата звука в модуль 16 вычисления коэффициентов фильтрации для каждой частоты.
Этот модуль 16 вычисления коэффициентов фильтрации осуществляет вычисление коэффициента фильтрации, используемого в модуле 17 фильтрации, который будет описан ниже, для выполнения процедуры фильтрации, на основе результата оценки энергетического спектра Pm(i, k) для каждого модуля 110 захвата звука для каждой частоты на выходе от модуля 15 оценки мощности в канале.
В частности, модуль 16 вычисления коэффициентов фильтрации генерирует матрицу R(i, k), представленную в следующем (Выражении 2), на основе результата оценки энергетического спектра Pm(i, k) для каждого модуля 110 захвата звука, получаемого (спектра) от модуля 15 оценки мощности в канале для каждой частоты.
Математическая формула 2
(Выражение 2)
В дополнение к этому, для каждого модуля 110 захвата звука, модуль 16 вычисления коэффициентов фильтрации осуществляет вычисление вектора a(k) матрицы многообразия, указывающего характеристики затухания и задержки до модуля 110 захвата звука для каждой частоты на основе расстояния между модулем 110 захвата звука и источником целевого звука (например, ртом или другой подобной частью пользователя). Кроме того, расстояние между источником целевого звука и каждым модулем 110 захвата звука может быть задано заранее на основе относительного расположения между источником звука и устройством 10 обработки информации (далее, каждым из модулей 110 захвата звука, установленных в устройстве 10 обработки информации), когда это устройство 10 обработки информации пользователь носит на себе.
Здесь вектор a(k) матрицы многообразия представлен вычисляемыми выражениями, обозначенными ниже как (Выражение 3) и (Выражение 4). Кроме того, в следующих вычисляемых выражениях dm обозначает расстояние между источником (например, ртом) целевого звука и m-ым модулем 110 захвата звука (иными словами, модулем 11m захвата звука). В дополнение к этому, параметр gm обозначает затухание до момента, когда целевой звук приходит в модуль 11m захвата звука. В дополнение к этому, ωk обозначает угловую частоту, соответствующую номеру k дискретной частоты. В дополнение к этому, C обозначает скорость звука. В дополнение к этому, надстрочный индекс T, присоединенный к обозначению какой-либо матрицы, указывает на транспонирование матрицы. Кроме того, в последующем описании матрица, к обозначению которой присоединен надстрочный индекс T, называется в некоторых случаях «транспонированная векторная матрица».
Математическая формула 3
(Выражение 3)
(Выражение 4)
Затем, модуль 16 вычисления коэффициентов фильтрации осуществляет вычисление коэффициента w(i, k) фильтрации, используемого модулем 17 фильтрации, который будет описан ниже, для выполнения процедуры фильтрации на основе сформированной матрицы R(i, k), вычисленного вектора a(k) матрицы многообразия и условия, представленного как (Выражение 5) ниже. Здесь матрица, к обозначению которой присоединен надстрочный индекс H, обозначает комплексно-сопряженное транспонирование матрицы. Кроме того, в последующем описании матрица, к обозначению которой присоединен надстрочный индекс H, называется в некоторых случаях «комплексно-сопряженная транспонированная векторная матрица».
Математическая формула 4
(Выражение 5)
Коэффициент w(i, k) фильтрации для каждой частоты представлен в вычисляемом выражении, обозначенном как (Выражение 6). Кроме того, индекс i указывает номер кадра, и индекс k указывает номер дискретной частоты.
Математическая формула 5
(Выражение 6)
Кроме того, коэффициент w(i, k) фильтрации, указанный выше в качестве (Выражения 6), представляет собой коэффициент, поддерживающий коэффициент передачи составляющей a(k), приходящей от источника (например, рта) целевого звука, на уровне 1 и минимизирующий шумовую составляющую (например, звук ветра или другой подобный звук), как представлено выше в (Выражении 5). Затем модуль 16 вычисления коэффициентов фильтрации передает на выход коэффициент w(i, k) фильтрации, вычисленный для каждой частоты, в модуль 17 фильтрации.
Модуль 17 фильтрации получает каждую частотную составляющую Xm(i, k) акустического сигнала xm(n) для каждого модуля 110 захвата звука (иными словами, каждого из модулей 111 – 11M захвата звука) от модуля 13 разложения на частотные составляющие. Кроме того, модуль 17 фильтрации получает коэффициент w(i, k) фильтрации, вычисленный для каждой частоты, от модуля 16 вычисления коэффициентов фильтрации. Этот модуль 17 фильтрации использует каждую частотную составляющую Xm(i, k) акустического сигнала xm(n) от каждого модуля 110 захвата звука в качестве входного сигнала и генерирует выходной сигнал Y(i, k) путем осуществления процедуры фильтрации на основе полученного коэффициента w(i, k) фильтрации для каждой частоты.
В частности, модуль 17 фильтрации использует каждую частотную составляющую Xm(i, k) акустического сигнала xm(n) от каждого модуля 110 захвата звука в качестве входного сигнала и генерирует выходной сигнал Y(i, k) для каждой частоты путем выполнения взвешенного суммирования входного сигнала на основе полученного коэффициента w(i, k) фильтрации для каждой частоты. Например, выходной сигнал Y(i, k) представлен посредством вычисляемого выражения, приведенного ниже как (Выражение 7). Кроме того, индекс i указывает номер кадра, и индекс k указывает номер дискретной частоты.
Математическая формула 6
(Выражение 7)
Затем модуль 17 фильтрации передает выходной сигнал Y(i, k), генерируемый для каждой частоты, в модуль 18 объединения частотных составляющих.
Этот модуль 18 объединения частотных составляющих получает выходной сигнал Y(i, k), генерируемый для каждой частоты, от модуля 17 фильтрации. Модуль 18 объединения частотных составляющих генерирует акустический сигнал y(n) путем объединения полученных выходных сигналов Y(i, k) для каждой частоты. Иными словами, модуль 18 объединения частотных составляющих выполняет процедуру, обратную процедуре, осуществляемой в описанном выше модуле 13 разложения на частотные составляющие. В частности, модуль 18 объединения частотных составляющих генерирует акустический сигнал y(n), в котором выходные сигналы Y(i, k) для каждой частоты объединены путем выполнения такой процедуры, как преобразование из частотной области во временную область (например, обратное преобразование FFT (IFFT), обратное преобразование DFT (IDFT) или другая подобная процедура), применение заданной вырезающей функции, комбинирование кадров или другая подобная процедура, над выходными сигналами Y(i, k) для каждой частоты.
Например, на фиг. 7 представлена схема, иллюстрирующая пример процесса получения целевого звука на основе результата захвата звука от каждого из нескольких модулей захвата звука в составе устройства 10 обработки информации согласно рассматриваемому варианту. Пример, показанный на фиг. 7, иллюстрирует случай, в котором применяются четыре микрофона, а также модули 111 – 114 захвата звука используются в качестве нескольких модулей 110 захвата звука. Иными словами, пример, иллюстрируемый на фиг. 7, показывает результаты захвата звука (иными словами, принятые и захваченные акустические сигналы) посредством модулей 111 – 114 захвата звука и пример акустического сигнала (комбинированного звука), в котором эти результаты захвата звука посредством модулей 111 - 114 захвата звука объединены путем обработки сигнала устройством 10 обработки информации.
Как описано выше, коэффициент w(i, k) для осуществления процедуры фильтрации с целью объединения результатов захвата звука (более конкретно, каждой частотной составляющей Xm(i, k) акустического сигнала xm(n)) от каждого из нескольких модулей 110 захвата звука имеет такие характеристики, согласно которым коэффициент передачи для составляющей a(k), приходящей от источника (например, рта) целевого звука поддерживают равным 1, а шумовая составляющая (например, звук ветра или другой подобный звук) минимизирована. В такой конфигурации результаты захвата звука от каждого модуля 110 захвата звука объединяют таким образом, чтобы входной сигнал того модуля 110 захвата звука, для которого уровень шумовой составляющей меньше, (другими словами, того модуля 110 захвата звука, для которого влияние шумовой составляющей меньше) получил в результате взвешивания дополнительный приоритет. Применение такой процедуры позволяет принимать и захватывать целевой звук более подходящим образом путем подавления влияния шумов даже в средах, в которых шумы, такие как звук ветра, появляются случайным образом.
Кроме того, как описано выше, устройство 10 обработки информации согласно рассматриваемую варианту имеет такую конфигурацию, в которой целевой звук получают путем объединения результатов захвата звука от нескольких модулей 110 захвата звука, и отличается от конфигурации, в которой осуществляется просто переключение модулей 110 для выбора модуля 110 захвата звука, получающего результат захвата звука, из совокупности нескольких таких модулей 110 захвата звука. Более конкретно, в конфигурации, в которой просто переключают модули 110 для выбора модуля 110 захвата звука, получающего результат захвата звука, акустический сигнал в некоторых случаях деградирует до и после переключения. В частности, такая деградация акустического сигнала имеет тенденцию проявляться заметнее в ситуации, в которой направление прихода шумов, таких как звук ветра, изменяется динамически. Однако устройство 10 обработки информации согласно рассматриваемому варианту выделяет целевой звук путем объединения составляющих с использованием описанной выше обработки сигнала. Поэтому в ситуации, в которой направление прихода шумов, таких как звук ветра, изменяется динамически, деградация акустического сигнала не происходит, а целевой звук может быть получен в более естественном виде.
Кроме того, обработка сигнала применительно к результатам захвата звука от каждого модуля 110 захвата звука, описанная выше, является просто примером, так что содержание такой обработки сигнала ничем не ограничивается до тех пор, пока результаты захвата звука от каждого модуля 110 захвата звука можно объединять таким образом, чтобы входной сигнал того модуля 110 захвата звука, для которого уровень шумовой составляющей оказался меньше, получил в результате взвешивании более высокий приоритет.
Затем, модуль 18 объединения частотных составляющих передает на выход сформированный им акустический сигнал y(n) в качестве результата захвата целевого звука. Этот акустический сигнал y(n) с выхода модуля 18 объединения частотных составляющих используется для, например, осуществления различных процедур (например, распознавания голоса и речи, голосового вызова и других подобных процедур), выполняемых устройством 10 обработки информации.
Кроме того, конфигурация, показанная на фиг. 6, представляет собой просто пример, так что конфигурация устройства 10 обработки информации этим примером, представленным на фиг. 6, не ограничивается до тех пор, пока можно реализовать описанные выше процедуры. Например, в варианте, показанном на фиг. 6, свой модуль 13 разложения на частотные составляющие установлен для каждого из модулей 111 – 11M захвата звука, однако и один модуль 13 разложения на частотные составляющие может обрабатывать акустические сигналы от каждого из нескольких модулей 110 захвата звука. В дополнение к этому, часть этой конфигурации может быть присоединена снаружи устройства 10 обработки информации. В качестве конкретного примера, по меньшей мере некоторые из указанных нескольких модулей 110 захвата звука могут быть отделены от такого устройства 10 обработки информации и присоединены к нему.
Пример функциональной конфигурации устройства 10 обработки информации согласно рассматриваемому варианту был описан выше со ссылками на фиг. 6 и 7 с упором на процедуру получения целевого звука на основе результатов захвата звука от каждого из совокупности нескольких модулей захвата звука в составе устройства 10 обработки информации.
1.4. Процедура
Далее, пример одной из процедур из ряда процедур, осуществляемых в устройстве 10 обработки информации согласно рассматриваемому варианту будет описан со ссылками на фиг. 8 конкретно с упором на процедуру получения целевого звука (например, звука голоса пользователя) на основе результатов захвата звука каждым из нескольких модулей захвата звука в составе устройства 10 обработки информации. На фиг. 8 представлена логическая схема, иллюстрирующая пример последовательности операций, выполняемых устройством 10 обработки информации согласно рассматриваемому варианту настоящего изобретения.
Этап S101
Звуковые волны из внешней среды принимаются и захватываются несколькими модулями 110 захвата звука приема устройством 10 обработки информации. Каждый из этих модулей 110 захвата звука подстраивает коэффициент передачи акустического сигнала (аналогового сигнала) на основе результата захвата звука, преобразует акустический сигнал после подстройки из аналоговой формы в цифровую форму посредством аналого-цифрового преобразования и передает преобразованный акустический сигнал (цифровой сигнал) xm(n) в модуль 13 разложения на частотные составляющие.
Этап S103
Модуль 13 разложения на частотные составляющие разлагает акустический сигнал xm(n) на частотные составляющие посредством выполнения разбиения кадра, применения заданной вырезающей функции, преобразования из временной области в частотную область и других подобных процедур над акустическим сигналом xm(n) с выходов модулей 110 захвата звука. Затем модуль 13 разложения на частотные составляющие передает каждую частотную составляющую Xm(i, k) акустического сигнала xm(n) в каждый из модулей – модуль 17 фильтрации и модуль 15 оценки мощности в канале, расположенные в последнем каскаде. Таким образом, для каждого из нескольких модулей 110 захвата звука 110, частотную составляющую Xm(i, k) акустического сигнала xm(n) передают в каждый из модулей – модуль 17 фильтрации и модуль 15 оценки мощности в канале.
Этап S105
Модуль 15 оценки мощности в канале получает частотную составляющую Xm(i, k) акустического сигнала xm(n) для каждого модуля 110 захвата звука от модуля 13 разложения на частотные составляющие. После этого каждый модуль 15 оценки мощности в канале оценивает энергетический спектр каждого модуля 110 захвата звука для каждой частоты на основе частотных составляющих Xm(i, k) акустического сигнала xm(n), соответствующего каждому модулю 110 захвата звука. Затем модуль 15 оценки мощности в канале передает результат оценки энергетического спектра Pm(i, k) для каждого модуля 110 захвата звука для каждой частоты в модуль 16 вычисления коэффициентов фильтрации.
Этап S107
Модуль 16 вычисления коэффициентов фильтрации вычисляет коэффициент w(i, k) фильтрации, используемый модулем 17 фильтрации, который будет описан ниже, для выполнения процедуры фильтрации на основе результатов оценки энергетического спектра Pm(i, k) для каждого модуля 110 захвата звука для каждой частоты с выхода модуля 15 оценки мощности в канале.
В частности, модуль 16 вычисления коэффициентов фильтрации генерирует матрицу R(i, k) на основе энергетического спектра Pm(i, k) для каждого модуля 110 захвата звука. В дополнение к этому, для каждого модуля 110 захвата звука, модуль 16 вычисления коэффициентов фильтрации вычисляет вектор a(k) матрицы многообразия, указывающий характеристики затухания и задержки распространения сигнала до модуля 110 захвата звука для каждой частоты на основе расстояния между каждым модулем 110 захвата звука и источником целевого звука. Затем, этот модуль 16 вычисления коэффициентов фильтрации вычисляет коэффициент w(i, k) фильтрации на основе сформированной матрицы R(i, k) и вычисленного вектора a(k) матрицы многообразия и передает этот коэффициент w(i, k) фильтрации в модуль 17 фильтрации.
Этап S109
Модуль 17 фильтрации получает каждую частотную составляющую Xm(i, k) акустического сигнала xm(n) для каждого модуля 110 захвата звука от модуля 13 разложения на частотные составляющие. Кроме того, модуль 17 фильтрации получает коэффициент w(i, k) фильтрации, вычисленный для каждой частоты, от модуля 16 вычисления коэффициентов фильтрации. Этот модуль 17 фильтрации использует каждую частотную составляющую Xm(i, k) акустического сигнала xm(n) от каждого модуля 110 захвата звука в качестве входного сигнала и генерирует выходной сигнал Y(i, k) для каждой частоты путем выполнения взвешенного суммирования с входным сигналом на основе полученного коэффициента w(i, k) фильтрации для каждой частоты. Затем этот модуль 17 фильтрации передает выходной сигнал Y(i, k), генерируемый для каждой частоты, в модуль 18 объединения частотных составляющих.
Этап S111
Модуль 18 объединения частотных составляющих объединяет выходной сигнал Y(i, k) для каждой частоты посредством выполнения таких процедур, как преобразование сигнала из частотной области во временную область, применение заданной вырезающей функции и объединение кадров над выходным сигналом Y(i, k) для каждой частоты от модуля 17 фильтрации. Таким образом, происходит генерация акустического сигнала y(n), в котором объединены результаты захвата звука от каждого модуля 110 захвата звука. Кроме того, акустический сигнал y(n), генерируемый модулем 18 объединения частотных составляющих, используется в качестве результата захвата звука для, например, различных процедур (например, распознавание речи и голоса, голосовой вызов и другие подобные процедуры), выполняемых устройством 10 обработки информации.
Например, один из процессов из ряда процессов, осуществляемых устройством 10 обработки информации согласно рассматриваемому варианту, был описан со ссылками на фиг. 8 конкретно с упором на процедуру получения целевого звука на основе результатов захвата звука от каждого из нескольких модулей захвата звука из состава устройства 10 обработки информации.
1.5. Примеры
Далее другие типы устройств 10 обработки информации согласно рассматриваемому варианту будут описаны на примерах.
1.5.1. Пример 1: пример устройства, носимого на шее
Сначала, согласно Примеру 1, варианты устройства обработки информации, включая носимое устройства, которое может быть установлено на шее пользователя, таким образом, как так называемое носимое устройства типа воротника, иллюстрируемое на фиг. 1, будет описано со ссылками на фиг. 9 – 11.
Например, на фиг. 9 представлена пояснительная схема, иллюстрирующая пример устройства обработки информации согласно Примеру 1 и иллюстрирующая пример носимого устройства обработки информации, которое пользователь может носить на шее. Кроме того, в настоящем описании устройство обработки информации, показанное на фиг. 9, в некоторых случаях называется “устройство 10a обработки информации”, чтобы отличать это устройство обработки информации от устройства 10 обработки информации согласно описанному выше варианту или от устройств обработки информации согласно другим примерам.
Как показано на фиг. 9, устройство 10a обработки информации содержит модули 111 - 114 захвата звука. Здесь модули 111 – 113 захвата звука соответствуют модулям 111 – 113 захвата звука из состава устройства 10 обработки информации, описанного выше со ссылками на фиг. 1. В дополнение к этому, в случае, когда устройство 10a обработки информации пользователь носит на шее, модуль 114 захвата звука установлен в позиции со стороны спины пользователя и обращен от пользователя назад. В этой конфигурации, например, можно еще в большей степени исключить влияние шумов, приходящих к пользователю сзади.
Кроме того, в устройстве 10a обработки информации, выступающие участки обтекаемой формы отходят в направлениях, куда обращены модули 112 – 114 захвата звука, в местах, где должны располагаться модули 112 – 114 захвата звука, причем эти модули 112 - 114 захвата звука установлены на передних концах этих выступающих участков. В этой конфигурации, как и в модуле 111 захвата звука, влияние шума, такого как звук ветра, может быть исключено, и таким образом, модули 112 – 114 захвата звука могут принимать и захватывать звуковые волны, приходящие из направлений, в которых отходят выступающие участки, (иными словами, из направлений, куда обращены эти модули захвата звука) более подходящим образом.
Кроме того, расположение позиций, где находятся указанные выступающие участки, (иными словами, позиции, где установлены модули 110 захвата звука) ничем конкретно не ограничено. Поэтому, например, эти выступающие участки могут быть расположены в местах, где корпус 101 имеет расширения для размещения разнообразных схем, таких как драйверы, аккумуляторов и других подобных компонентов, так что модули 110 захвата звука могут быть установлены на передних концах (или возле передних концов) выступающих участков.
В дополнение к этому, на фиг. 10 представлена пояснительная схема, иллюстрирующая другой пример устройства обработки информации согласно Примеру 1 и иллюстрирующая пример устройства обработки информации, представляющего собой носимое устройство, которое пользователь может носить на шее. Кроме того, в настоящем описании устройство обработки информации, показанное на фиг. 10, называется, в некоторых случаях, “устройство 10b обработки информации”, чтобы отличать это устройство обработки информации от устройства 10 обработки информации согласно описанному выше варианту или от устройств обработки информации согласно другим примерам.
Как показано на фиг. 10, устройство 10b обработки информации имеет кольцевую форму и такую конфигурацию, в которой часть, отмеченная цифровым позиционным обозначением 19, может быть открытой. Кроме того, концы, отделяемые один от другого проемом в области 19, могут быть разъединены или прикреплены один к другому. В этой конфигурации пользователь носит на себе устройство 10b обработки информации таким образом, что внутренняя поверхность кольцевой части входит в контакт с шеей пользователя (иными словами, пользователь носит устройство на шее).
В дополнение к этому, в устройстве 10b обработки информации, модули 115 – 118 захвата звука установлены так, что они обращены от кольца наружу (иными словами, в сторону, противоположную центру кольца) во взаимно различных позициях по окружности корпуса, выполненного в форме кольца. Кроме того, в устройстве 10b обработки информации, модули 115 – 118 захвата звука эквивалентны модулям 110 захвата звука (например, модулям 111 – 113 захвата звука или другим подобным модулям, показанным на фиг. 1) согласно описанному выше варианту.
В этой конфигурации, для каждого из модулей 115 – 118 захвата звука, влияние шумов ослаблено, поскольку шумы, приходящие от сторон, противоположных направлениям, куда обращены модули захвата звука, экранируются частью тела пользователя (иными словами, шеей), на которой этот пользователь носит рассматриваемое устройство 10b обработки информации. В частности, в устройстве 10b обработки информации, показанном на фиг. 10, влияние шумов (в частности, шумов, приходящих со стороны шеи пользователя), таких как звук ветра, еще более ослаблено, поскольку каждый из модулей 115 – 118 захвата звука находится ближе к шее пользователя, чем в устройстве 10 обработки информации, показанном на фиг. 1. Также очевидно, что влияние шумов, приходящих со стороны части тела пользователя, еще более ослаблено в модулях M5 и M6 захвата звука (иными словами, в модулях захвата звука, расположенных ближе к указанной частью тела пользователя), как описано со ссылками на фиг. 5. Кроме того, поскольку модули 115 – 118 захвата звука установлены так, что они обращены во взаимно разных направлениях, например, также можно компенсировать характеристики других модулей захвата звука на основе результатов захвата звука посредством некоторых модулей захвата звука.
Кроме того, даже в устройстве 10b обработки информации, показанном на фиг. 10, выступающие участки обтекаемой формы могут быть расположены по меньшей мере в частях корпуса, а модули 110 захвата звука (например, по меньшей мере некоторые из модулей 115 – 118 захвата звука) могут быть установлены на передних концах (или возле передних концов) выступающих участков.
В дополнение к этому, на фиг. 11 представлена пояснительная схема, иллюстрирующая другой пример устройства обработки информации согласно Примеру 1 и иллюстрирующая пример устройства обработки информации, представляющего собой носимое устройство, имеющее так называемую форму ожерелья. Кроме того, в настоящем описании устройство обработки информации, показанное на фиг. 11, называется, в некоторых случаях, “устройством 10c обработки информации”, чтобы отличать устройство обработки информации от устройства 10 обработки информации согласно описанному выше варианту или устройства обработки информации согласно другим примерам.
На фиг. 11 цифровое позиционное обозначение 119 указывает пример модуля 110 захвата звука в устройстве 10 обработки информации согласно описанному выше варианту. Иными словами, в устройстве 10c обработки информации, имеющем форму ожерелья, например, обтекаемый выступающий участок может быть расположен на участке, эквивалентном так называемому кулону и обращенном относительно пользователя вперед, когда пользователь носит это устройство 10c обработки информации. Модуль 119 захвата звука может быть установлен на переднем конце (или возле переднего конца) выступающего участка.
Кроме того, в примере, показанном на фиг. 11, в устройстве 10c обработки информации установлен один модуль 110 захвата звука, однако в этом устройстве могут быть установлены несколько таких модулей 110 захвата звука. Кроме того, в случае, в котором в устройстве 10c обработки информации установлены несколько модулей 110 захвата звука, каждый из этих нескольких модулей 110 захвата звука может быть установлен так, что все эти модули обращены во взаимно разных направлениях.
В качестве Примера 1 варианты устройства 10 обработки информации, представляющие собой носимое устройство, которое пользователь носит на шее, такое как носимое устройство типа воротника, показанное на фиг. 1, были описаны выше со ссылками на фиг. 9 – 11.
1.5.2. Пример 2: пример устройства, носимого на голове
Далее, согласно Примеру 2, варианты устройства обработки информации, представляющего собой носимое устройство, которое пользователь может носить на голове, будут описаны со ссылками на фиг. 12 – 15.
Например, на фиг. 12 представлена пояснительная схема, иллюстрирующая пример устройства обработки информации согласно Примеру 2 и иллюстрирующая пример устройства обработки информации, представляющего собой носимое устройство, которое можно носить на голове пользователя. Кроме того, в настоящем описании устройство обработки информации, показанное на фиг. 12, называется, в некоторых случаях, “устройством 20a обработки информации”, чтобы отличать это устройство обработки информации от устройства 10 обработки информации согласно описанному выше варианту или от устройств обработки информации согласно другим примерам.
Как показано на фиг. 12, когда устройство 20a обработки информации пользователь носит на голове, корпус, в котором располагается схема и другие подобные компоненты для реализации разнообразных функций устройства, находится возле уха пользователя. В качестве конкретного примера, в варианте, показанном на фиг. 12, устройство 20a обработки информации содержит наушник, вставляемый в ушное отверстие пользователя, и держатель, имеющий форму тросика и поддерживающий корпус, когда этот держатель зацеплен за ухо пользователя. В устройстве 20a обработки информации корпус удерживается возле уха пользователя посредством блока наушника и держателя, имеющего форму тросика.
В дополнение к этому, как показано на фиг. 12, устройство 20a обработки информации содержит модули 211 и 212 захвата звука. Кроме того, в устройстве 20a обработки информации, модули 211 и 212 захвата звука эквивалентны модулям 110 захвата звука (например, модулям 111 – 113 захвата звука или другим подобным модулям, как показано на фиг. 1) из состава устройства 10 обработки информации согласно описанному выше варианту.
В частности, устройство 20a обработки информации имеет выступающий участок обтекаемой формы, отходящий так, что он обращен вперед, на конце корпуса, удерживаемого возле уха пользователя и находящегося на передней стороне от пользователя в состоянии, когда устройство 20a обработки информации надето на голову пользователя. Тогда модуль 211 захвата звука установлен на переднем конце выступающего участка и обращен в направлении (передняя сторона от пользователя), в котором отходит выступающий участок. В дополнении к этому, когда устройство 20a обработки информации надето на голову пользователя, модуль 212 захвата звука установлен по меньшей мере на части боковой поверхности на наружной стороне (иными словами, на стороне, противоположной голове) корпуса, так что он обращен в направлении наружу (иными словами, в поперечном направлении относительно пользователя). В дополнение к этому, устройство 20a обработки информации может содержать выступающий участок обтекаемой формы, отходящий направлении наружу относительно корпуса от боковой поверхности корпуса, а модуль 212 захвата звука может быть установлен на переднем конце выступающего участка.
Кроме того, пример, показанный на фиг. 12, был описан с упором на корпус, удерживаемый возле левого уха пользователя, однако корпус, удерживаемый возле правого уха пользователя, может иметь конфигурацию, аналогичную корпусу, удерживаемому возле левого уха. В частности, корпус, удерживаемый на правом ухе, может иметь конфигурацию, эквивалентную модулю 212 захвата звука, или может иметь конфигурацию, эквивалентную модулям 211 и 212 захвата звука.
В дополнение к этому, на фиг. 13 представлена пояснительная схема, иллюстрирующая другой вариант устройства обработки информации согласно Примеру 2 и иллюстрирующая пример устройства обработки информации, представляющего собой так называемое носимое устройство типа очков, которое пользователь может носить на голове. Кроме того, в настоящем описании устройство обработки информации, показанное на фиг. 13, называется, в некоторых случаях, “устройством 20b обработки информации”, чтобы отличать это устройство обработки информации от устройства 10 обработки информации согласно описанному выше варианту или от устройств обработки информации согласно другим примерам.
Как показано на фиг. 13, устройство 20b обработки информации содержит модули 213 – 215 захвата звука. Кроме того, в устройстве 20b обработки информации, модули 213 – 215 захвата звука эквивалентны модулям 110 захвата звука (например, модулям 111 – 113 захвата звука или другим подобным модулям, показанным на фиг. 1) в составе устройства 10 обработки информации согласно описанному выше варианту.
Например, в устройстве 20b обработки информации, модуль 213 захвата звука установлен по меньшей мере в части участка, эквивалентного передней стороне очков. В качестве более конкретного примера устройство 20b обработки информации содержит выступающий участок обтекаемой формы, отходящий от передней стороны участка, эквивалентного перемычке между стеклами очков, а модуль 213 захвата звука установлен на переднем конце выступающего участка и обращен в направлении, в котором отходит этот выступающий участок. В дополнение к этому, в качестве другого примера, как это указано цифровым позиционным обозначением 213', выступающий участок и модуль захвата звука могут быть установлены в другой части, отличной от участка, эквивалентного перемычке между стеклами очков, на передней стороне очков.
В дополнение к этому, в устройстве 20b обработки информации, модули 214 и 215 захвата звука установлены по меньшей мере частично в участках, эквивалентных заушникам очков. Кроме того, например, когда устройство 20b обработки информации надето на голову пользователя, модули 214 и 215 захвата звука могут быть установлены так, чтобы они были обращены в стороны, противоположные голове пользователя (поперечное направление пользователя).
В дополнение к этому, на фиг. 14 представлена пояснительная схема, иллюстрирующая другой вариант устройства обработки информации согласно Примеру 2, а также иллюстрирующая другой вариант устройства обработки информации, представляющего собой носимое устройство, которое пользователь может носить на голове. Кроме того, в настоящем описании устройство обработки информации, иллюстрируемое на фиг. 14, называется, в некоторых случаях, “устройством 20c обработки информации” с целью отличать это устройство обработки информации от устройства 10 обработки информации согласно описываемому выше варианту или от устройств обработки информации согласно другим примерам.
Как показано на фиг. 14, устройство 20c обработки информации содержит модули 216 – 218 захвата звука. Кроме того, в устройстве 20c обработки информации, модули 216 – 218 захвата звука эквивалентны модулям 110 захвата звука (например, модулям 111 – 113 захвата звука или другим подобным модулям, показанным на фиг. 1) из состава устройства 10 обработки информации согласно описанному выше варианту.
Более конкретно, модули 216 – 218 захвата звука установлены во взаимно разных позициях на участках (например, в передней части и на заушниках), эквивалентных оправе очков и обращены во взаимно разных направлениях. Более конкретно, когда устройство 20c обработки информации надето на голову пользователя, модули 216 – 218 захвата звука установлены так, что они обращены в стороны, противоположные голове пользователя.
В этой конфигурации для каждого из модулей 216 и 218 захвата звука влияние шумов ослаблено, поскольку шумы, приходящие с противоположных сторон, относительно направлений, куда обращены указанные модули захвата звука, экранируются головой пользователя. В дополнение к этому, поскольку модули 216 – 218 захвата звука установлены так, что они обращены во взаимно различных направлениях, например, можно также компенсировать характеристики других модулей захвата звука на основе результатов захвата звука некоторыми из этих модулей захвата звука.
В дополнение к этому, на фиг. 15 представлена пояснительная схема, иллюстрирующая другой пример устройства обработки информации согласно Примеру 2, а также иллюстрирующая пример устройства обработки информации, представляющего собой носимое на голове устройство, такое как так называемая головная гарнитура. Кроме того, в настоящем описании устройство обработки информации, показанное на фиг. 15, называется, в некоторых случаях, “устройством 20d обработки информации”, чтобы отличать это устройство обработки информации от устройства 10 обработки информации согласно описанному выше варианту или устройств обработки информации согласно другим примерам.
В примере, показанном на фиг. 15, устройство 20d обработки информации содержит модуль 25 считывания изображения и модуль 219 захвата звука. Кроме того, в устройстве 20d обработки информации, модуль 219 захвата звука эквивалентен модулям 110 захвата звука (например, модулям 111 – 113 захвата звука или другим подобным модулям, показанным на фиг. 1) из состава устройства 10 обработки информации согласно описываемому выше варианту.
Конкретнее, в случае, когда устройство 20d обработки информации надето на голову пользователя, модуль 25 считывания изображения оказывается установлен в положении, когда область спереди от пользователя находится в пределах угла зрения из корпуса устройства 20d обработки информации. Например, в варианте, показанном на фиг. 15, модуль 25 считывания изображения установлен на корпусе устройства 20d обработки информации так, что этот модуль обращен в направлении вперед от пользователя.
В дополнение к этому, устройство 20d обработки информации имеет выступающий участок обтекаемой формы, отходящий вперед от пользователя по меньшей мере от части корпуса в состоянии, в котором это устройство 20d обработки информации пользователь носит на голове, а модуль 219 захвата звука установлен на переднем конце выступающего участка так, что этот модуль обращен в направлении, в котором отходит выступающий участок. Например, в варианте, показанном на фиг. 15, модуль 219 захвата звука установлен возле модуля 25 считывания изображения. В дополнение к этому, в качестве другого примера, как указано цифровым позиционным обозначением 219', выступающий участок обтекаемой формы отходит так, что он обращен вперед от пользователя, по меньшей мере от части держателя, удерживающего устройство 20d обработки информации на голове пользователя, так что модуль захвата звука может быть установлен на переднем конце выступающего участка таким образом, что он обращен в направлении, в котором отходит выступающий участок.
В качестве Примера 2, варианты устройства обработки информации, представляющего собой носимое устройство, которое пользователь может носить на голове, были описаны выше со ссылками на фиг. 12 – 15. Кроме того, примеры, описанные выше, представляют собой просто примеры, а настоящее изобретение не обязательно ограничивается приведенными выше примерами. В качестве конкретного примера, устройство обработки информации, представляющее собой носимое на голове устройства в форме так называемой стяжки для наушников, может иметь конфигурацию, эквивалентную модулям 110 захвата звука из состава устройства 10 обработки информации согласно описанному выше варианту.
1.5.3. Пример 3: пример применения в портативном информационном терминале
Далее, согласно Примеру 3, вариант устройства обработки информации, содержащий портативный информационный терминал, такой как так называемый смартфон, будет описан со ссылками на фиг. 16 и 17.
Например, на фиг. 16 представлена пояснительная схема, иллюстрирующая пример устройства обработки информации согласно Примеру 3. Кроме того, в рассматриваемом описании устройство обработки информации, показанное на фиг. 16, называется в некоторых случаях “устройством 30 обработки информации”, чтобы отличать это устройство обработки информации от устройства 10 обработки информации согласно описанному выше варианту или от устройств обработки информации согласно другим примерам.
Как показано на фиг. 16, устройство 30 обработки информации содержит модули 311 – 314 захвата звука. Кроме того, в устройстве 30 обработки информации модули 311 – 314 захвата звука эквивалентны модулям 110 захвата звука (например, модулям 111 – 113 захвата звука или другим подобным модулям, показанным на фиг. 1) из состава устройства 10 обработки информации согласно описанному выше варианту.
В частности, корпус устройства 30 обработки информации имеет по существу прямоугольную поверхность 36 по меньшей мере на части и выступающие участки обтекаемой формы, выполненные в заданных областях, включая углы поверхности 36 (иными словами, в углах или рядом с углами), и обращенные от корпуса наружу. Другими словами, корпус устройства 30 обработки информации имеет по существу плоскую поверхность 36 и несколько боковых поверхностей 371 – 374, обращенных в разных направлениях, вдоль краев поверхности 36, а также выступающие участки обтекаемой формы в заданных областях, включая участки, с которыми соединены боковые поверхности. Кроме того, поверхность 36 может быть эквивалентна, например, поверхности, на которой установлен дисплей. В дополнение к этому, углы корпуса устройства 30 обработки информации могут представлять собой выступающие участки. Далее, каждый из модулей 311 – 314 захвата звука установлен на переднем конце (или возле переднего конца) выступающего участка и обращен прочь от корпуса устройства 30 обработки информации.
В дополнение к этому, на фиг. 17 представлена пояснительная схема, иллюстрирующая пример формы использования устройства 30 обработки информации согласно Модифицированному Примеру 3 и иллюстрирующая пример случая, когда пользователь осуществляет голосовой вызов с использованием указанного устройства 30 обработки информации.
Как показано на фиг. 17, когда пользователь осуществляет голосовой вызов, держа устройство 30 обработки информации возле своего правого уха, это устройство 30 обработки информации располагается так, что модуль 312 захвата звука обращен, по существу, к передней стороне головы пользователя. В такой конфигурации, например, когда пользователь осуществляет голосовой вызов, будучи в движении, модуль 312 захвата звука редко воспринимает влияние звука ветра, создаваемого ветром, приходящим спереди вследствие движения пользователя. Кроме того, можно также рассмотреть случай, когда пользователь осуществляет голосовой вызов, держа устройство 30 обработки информации возле своего левого уха. В этом случае устройство 30 обработки информации располагается так, что модуль 311 захвата звука обращен, по существу, к передней стороне головы пользователя, и, таким образом, этот модуль 311 захвата звука редко воспринимает влияние звука ветра, сопровождаемого ветром, приходящим спереди вследствие движения пользователя. Иными словами, устройство 30 обработки информации может ослабить влияние звука ветра, сопровождаемого ветром, приходящим спереди вследствие движения пользователя, на основе описанной выше конфигурации.
В дополнение к этому, в устройстве 30 обработки информации, модули 311 – 314 захвата звука установлены так, что они обращены во взаимно различных направлениях. В этой конфигурации устройство 30 обработки информации может компенсировать характеристики других модулей захвата звука на основе результатов захвата звука по меньшей мере некоторыми модулями захвата звука.
В качестве Примера 3, варианты устройства обработки информации, содержащего портативный информационный терминал, такой как так называемый смартфон, были описаны выше со ссылками на фиг. 16 и 17.
1.5.4. Пример 4: пример применения в носимом устройстве типа наручных часов
Далее, согласно Примеру 4, варианты устройства обработки информации, содержащие так называемое носимое устройство в форме наручных часов, которое можно носить на руке, будут описаны со ссылками на фиг. 18 и 19.
Например, на фиг. 18 представлена пояснительная схема, иллюстрирующая пример устройства обработки информации согласно Примеру 4. Кроме того, в настоящем описании устройство обработки информации, показанное на фиг. 18, называется, в некоторых случаях, “устройство 40a обработки информации” с целью отличить это устройство обработки информации от устройства 10 обработки информации согласно описанному выше варианту или от устройств обработки информации согласно другим примерам.
Как показано на фиг. 18, устройство 40a обработки информации содержит модули 411 – 415 захвата звука. Кроме того, в устройстве 30 обработки информации, модули 411 – 415 захвата звука эквивалентны модулям 110 захвата звука (например, модулям 111 – 113 захвата звука или другим подобным модулям, показанным на фиг. 1) из состава устройства 10 обработки информации согласно описанному выше варианту.
В частности, устройство 40a обработки информации содержит корпус 481, в котором размещены схемы и другие подобные компоненты для реализации различных функций устройства, и держатель 482 в форме ремешка, удерживающего корпус 481 на руке пользователя. Корпус 481 имеет по существу прямоугольную поверхность по меньшей мере в своей части и выступающие участки обтекаемой формы, выполненные в заданных областях, включая углы указанной по существу прямоугольной поверхности, так что эти выступающие участки обращены вовне относительно корпуса 481, как и в устройстве 30 обработки информации согласно описанному выше Примеру 3. Кроме того, эта по существу прямоугольная поверхность эквивалентна поверхности корпуса на той стороне, где установлен циферблат так называемых часов. Тогда каждый из модулей 411 – 414 захвата звука установлен на переднем конце (или возле переднего конца) своего выступающего участка и обращен вовне относительно корпуса 481.
В дополнение к этому, в держателе 482, установлен свой модуль 415 захвата звука в позиции, по существу симметричной корпусу 481, считая руку в качестве позиции отсчета, и обращен в направлении прочь от руки, в состоянии, в котором устройство 40a обработки информации надето на руку.
В этой конфигурации по меньшей мере один из модулей 411 – 415 захвата звука в составе устройства 40a обработки информации обращен по существу в направлении маха руки, например, даже в ситуации, когда пользователь качает или машет рукой, на которой он носит устройство 40a обработки информации. Поэтому, устройство 40a обработки информации может ослабить влияние звука ветра, создаваемого махом руки, в соответствии с результатами захвата звука модулями 411 – 414 захвата звука. В дополнение к этому, в устройстве 40a обработки информации, модули 411 – 415 захвата звука установлены так, что они обращены во взаимно различных направлениях. В частности, для модуля 415 захвата звука шум, приходящий с противоположной относительно направления, куда обращен этот модуль 415 захвата звука, стороны, экранирован рукой, на которую надето устройство 40a обработки информации. В этой конфигурации устройство 40a обработки информации может также компенсировать характеристики других модулей захвата звука на основе результатов захвата звука по меньшей мере некоторыми модулями захвата звука из совокупности модулей 411 – 415 захвата звука.
В дополнение к этому, на фиг. 19 представлена пояснительная схема, иллюстрирующая другой пример устройства обработки информации согласно Примеру 4. Кроме того, в настоящем описании устройство обработки информации, показанное на фиг. 19, называется, в некоторых случаях, “устройством 40b обработки информации”, чтобы отличать это устройство обработки информации от устройства 10 обработки информации согласно описанному выше варианту или от устройств обработки информации согласно другим примерам.
Как показано на фиг. 19, это устройство 40b обработки информации содержит модуль 416 захвата звука, расположенный на участке, эквивалентном участку, где находится маховичок для «завода» так называемых часов, и отмеченному цифровым позиционным обозначением (далее называемый “участок 483 маховичка”). В частности, если выполнить такой участок 483 маховичка в обтекаемой форме, этот участок 483 маховичка может быть использован в качестве выступающего участка, в котором установлен модуль 416 захвата звука. Кроме того, в устройстве 40b обработки информации, модуль 416 захвата звука эквивалентен модулям 110 захвата звука (например, модулю 111 захвата звука) из состава устройства 10 обработки информации согласно описанному выше варианту.
В качестве Примера 4, варианты устройства обработки информации, представляющего собой носимое устройство типа так называемых наручных часов, которые можно носить на руке, были описаны выше со ссылками на фиг. 18 и 19.
1.5.5. Пример 5: пример применение в устройстве для считывания изображения
Далее, согласно Примеру 5, варианты устройства обработки информации, содержащие формирователь сигналов изображения, способный захватывать движущееся изображение или неподвижное изображение, будут описаны со ссылками на фиг. 20 и 21.
Например, на фиг. 20 представлена пояснительная схема, иллюстрирующая пример устройства обработки информации согласно Примеру 5. Кроме того, в настоящем описании устройство обработки информации, показанное на фиг. 20, называется, в некоторых случаях, “устройство 50 обработки информации”, чтобы отличать это устройство обработки информации от устройства 10 обработки информации согласно описанному выше варианту или от устройств обработки информации согласно другим примерам.
На фиг. 20, цифровое позиционное обозначение 53 указывает модуль считывания изображения, который захватывает изображение, такое как движущееся изображение или неподвижное изображение. В дополнение к этому, цифровые позиционные обозначения 511 и 512 указывают примеры модулей захвата звука, установленных в устройстве 50 обработки информации. Кроме того, в устройстве 50 обработки информации, модули 511 и 512 захвата звука эквивалентны модулям 110 захвата звука (например, модулям 111 – 113 захвата звука или другим подобным модулям, показанным на фиг. 1) из состава устройства 10 обработки информации согласно описанному выше варианту.
В частности, как показано на фиг. 20, устройство 50 обработки информации содержит, например, выступающий участок обтекаемой форм, отходящий в направлении, в котором модуль 53 считывания изображения захватывает изображение, (далее также называемое здесь “направлением считывания изображения”) от части поверхности корпуса, в котором установлен модуль 53 считывания изображения, так что эта поверхность обращена в направлении считывания изображения. Далее, модуль 511 захвата звука установлен на переднем конце (или возле переднего конца) выступающего участка, обращенного в направлении считывания изображения (другими словами, в направлении вперед) для модуля 53 считывания изображения.
В дополнение к этому, модуль 512 захвата звука может быть установлен возле модуля 53 считывания изображения (например, возле объектива модуля 53 считывания изображения). Например, на фиг. 21 представлена пояснительная схема, иллюстрирующая пример упрощенной конфигурации области возле объектива модуля 53 считывания изображения в устройстве 50 обработки информации согласно Примеру 5. В примере, показанном на фиг. 21, в устройстве 50 обработки информации, выступающий участок 551, отходящий в направлении наружу от корпуса устройства 50 обработки информации, располагается возле объектива модуля 53 считывания изображения. В дополнение к этому, выступающий участок 551 содержит выступающий участок 553 обтекаемой формы, отходящий в направлении считывания изображения (иными словами, вперед) для модуля 53 считывания изображения, а модуль 513 захвата звука установлен на переднем конце (или возле переднего конца) выступающего участка 553.
В этой конфигурации устройство 50 обработки информации может ослабить влияние звука ветра, сопровождаемого ветром, приходящим спереди вследствие движения пользователя, например, даже в ситуации, когда пользователь захватывает изображение, находясь в движении.
В дополнение к этому, устройство 50 обработки информации, хотя это и не показано на фиг. 20 и 21, может содержать другие модули захвата звука, отличные от модулей 511 и 512 захвата звука. В этом случае, другие модули захвата звука могут быть установлены так, что они обращены в направлениях, отличных от направлений ориентации модулей 511 и 512 захвата звука. В качестве более конкретного случая, например, другие модули захвата звука могут быть установлены на поверхности, представляющей собой поверхность корпуса устройства 50 обработки информации, противоположную направлению считывания изображения от модуля 53 считывания изображения, так что эта поверхность обращена в направлении, противоположном направлению считывания изобретения (иными словами, в направлении назад). В этой конфигурации, например, можно компенсировать характеристики модулей 511 и 512 захвата звука на основе результатов захвата звука другими модулями захвата звука.
В Примере 5, варианты устройства обработки информации, содержащие формирователь сигналов изображения, способный захватывать движущееся изображение или неподвижное изображение, были описаны выше со ссылками на фиг. 20 и 21.
2. Второй вариант
2.1. Обзор
Далее будет описан второй вариант настоящего изобретения. В устройстве 10 обработки информации согласно описанному выше первому варианту можно уменьшить влияние возникающих случайным образом шумов, таких как звук ветра, путем осуществления процедуры фильтрации, состоящей в том, что входной сигнал модуля захвата звука, которому соответствует меньший измеренный уровень (иными словами, уровень принятых и захваченных звуковых волн), получает приоритет на основе результата захвата звука в каждом из нескольких модулей захвата звука. Посредством такого управления можно ослабить влияние шумов более подходящим образом, в частности, в случае, когда влияние шума, такого как звук ветра, появляющийся случайным образом, оказывается больше.
С другой стороны, если по оценкам результат захвата звука от каждого из модулей захвата звука остается неизменным, как в случае описанного выше управления, результат захвата звука от модуля захвата звука, принявшего целевой звук с более высоким уровнем, не используется в ситуации, в которой целевой звук, такой как звук голоса, принимают и захватывают в качестве главного компонента. Иными словами, в ситуации, в которой влияние шума, такого как звук ветра, возникающий случайным образом, мало, например, результат захвата звука в модуле захвата звука, имеющем небольшое отношение сигнал/шум (SN) используется предпочтительно.
Соответственно, в этом варианте предложен пример структуры, способной поддерживать эффект подавления шума, такого как звук ветра, появляющийся случайным образом, как в описанном выше первом варианте, и принимать целевой звук более подходящим образом, в случае, когда влияние шума, появляющегося случайным образом, мало.
2.2. Функциональная конфигурация
Сначала, например, функциональная конфигурация устройства обработки информации согласно рассматриваемому варианту будет описана со ссылками на фиг. 22. На фиг. 22 представлена блок-схема, иллюстрирующая пример функциональной конфигурации устройства обработки информации согласно второму варианту настоящего изобретения. Кроме того, в настоящем описании устройство обработки информации согласно рассматриваемому варианту называется, в некоторых случаях, “устройство 60 обработки информации”, чтобы отличать явным образом это устройство обработки информации от устройства 10 обработки информации (см. фиг. 6) согласно описанному выше первому варианту.
Как показано на фиг. 22, устройство 60 обработки информации согласно рассматриваемому варианту содержит модули 111 – 11M захвата звука (где M – положительное целое число), модуль 13 разложения на частотные составляющие, модуль 65 оценки мощности в канале, модуль 66 вычисления коэффициентов фильтрации, модуль 17 фильтрации и модуль 18 объединения частотных составляющих. Кроме того, несколько модулей 111 – 11M захвата звука (где M – положительное целое число), модуль 13 разложения на частотные составляющие, модуль 17 фильтрации и модуль 18 объединения частотных составляющих эквивалентны конфигурациям, в которых такие же цифровые позиционные обозначения, присвоенные в устройстве 10 обработки информации (см. фиг. 6) согласно описанному выше первому варианту. Иными словами, устройство 60 обработки информации согласно рассматриваемому варианту отличается от устройства 10 обработки информации согласно описанному выше первому варианту содержанием обработки данных в модуле 65 оценки мощности в канале и в модуле 66 вычисления коэффициентов фильтрации. Следовательно, функциональная конфигурация устройства 60 обработки информации согласно рассматриваемому варианту будет описана ниже конкретно с упором на отличия от устройства 10 обработки информации согласно описанному выше первому варианту. Подробное описание той части конфигурации, которая совпадает с соответствующей частью устройства 10 обработки информации, будет опущено.
Как показано на фиг. 22, модуль 65 оценки мощности в канале содержит модуль 651 оценки входной мощности, модуль 653 оценки мощности некоррелированной составляющей и модуль 655 оценки мощности случайных шумов.
Модуль 651 оценки входной мощности эквивалентен модулю 15 оценки мощности в канале из состава устройства 10 обработки информации согласно описанному выше первому варианту. Иными словами, модуль 651 оценки входной мощности оценивает энергетический спектр каждого модуля 110 захвата звука для каждой частоты на основе каждой частотной составляющей Xm(i, k) акустического сигнала xm(n), соответствующего каждому из модулей 110 захвата звука. Затем модуль 651 оценки входной мощности передает результат оценки энергетического спектра Pm(i, k) для каждого модуля 110 захвата звука для каждой частоты в модуль 655 оценки мощности случайных шумов.
Модуль 653 оценки мощности некоррелированной составляющей принимает обратную связь по выходному сигналу Y(i, k), генерируемую в результате выполнения процедуры фильтрации модулем 17 фильтрации. Кроме того, выходной сигнал Y(i, k) представляет собой звуковые волны, в составе которых влияние шума (случайный шум) подавлено для каждой частотной составляющей Xm(i, k) акустического сигнала xm(n), принятого и захваченного предварительно каждым модулем 110 захвата звука, и которые эквивалентны, например, частотной составляющей целевого звука, такого как звук речи, произнесенной пользователем, в каждом модуле 110 захвата звука. После этого, модуль 653 оценки мощности некоррелированной составляющей оценивает энергетический спектр Qm(i, k) составляющей, некоррелированной с выходным сигналом Y(i, k), на основе корреляции между каждой частотной составляющей Xm(i, k) акустического сигнала xm(n), соответствующего каждому модулю 110 захвата звука, и передает выходной сигнал Y(i, k) по обратной связи. Кроме того, составляющая, не коррелированная с выходным сигналом Y(i, k), (далее называемая здесь также просто “некоррелированная составляющая”) в частотной составляющей Xm(i, k), эквивалентна шумовой составляющей, такой как случайный шум, входящий в частотную составляющую Xm(i, k). В дополнение к этому, подробности обработки сигнала посредством модуля 653 оценки мощности некоррелированной составляющей будут отдельно описано ниже. Затем модуль 653 оценки мощности некоррелированной составляющей передает результат оценки энергетического спектра Qm(i, k) для каждого модуля 110 захвата звука для каждой частоты в модуль 655 оценки мощности случайных шумов.
Модуль 655 оценки мощности случайных шумов получает результат оценки энергетического спектра Pm(i, k) для каждого модуля 110 захвата звука для каждой частоты от модуля 651 оценки входной мощности. В дополнение к этому, модуль 655 оценки мощности случайных шумов получает результат оценки энергетического спектра Qm(i, k) некоррелированной составляющей, соответствующей каждому модулю 110 захвата звука для каждой частоты, от модуля 653 оценки мощности некоррелированной составляющей. Затем, модуль 655 оценки мощности случайных шумов определяет энергетический спектр Wm(i, k) для каждого модуля 110 захвата звука для каждой частоты, используемый модулем 66 вычисления коэффициентов фильтрации для вычисления коэффициента w(i, k) фильтрации на основе результатов оценки полученного энергетического спектра Pm(i, k) и полученного энергетического спектра Qm(i, k). Кроме того, подробности процедуры определения энергетического спектра Wm(i, k) модулем 655 оценки мощности случайных шумов будут отдельно описаны ниже. Затем модуль 655 оценки мощности случайных шумов передает информацию, указывающую энергетический спектр Wm(i, k) для каждого модуля 110 захвата звука для каждой частоты, в модуль 66 вычисления коэффициентов фильтрации.
Модуль 66 вычисления коэффициентов фильтрации вычисляет коэффициент w(i, k) фильтрации, используемый модулем 17 фильтрации для осуществления процедуры фильтрации на основе информации, указывающей энергетический спектр Wm(i, k) для каждого модуля 110 захвата звука для каждой частоты, от модуля 65 оценки мощности в канале. Кроме того, модуль 66 вычисления коэффициентов фильтрации отличается от модуля 16 вычисления коэффициентов фильтрации согласно описанному выше первому варианту в том, что энергетический спектр Wm(i, k) применяется вместо энергетического спектра Pm(i, k) во время генерации матрицы R(i, k), описанной выше в (Выражении 2).
С другой стороны, последующая процедура, иными словами, процедура, относящаяся к вычислению коэффициента w(i, k) фильтрации на основе вектора a(k) матрицы многообразия и сформированной матрицы R(i, k), описанной выше, на основе (Выражение 3) – (Выражение 6), является такой же, как процедура, осуществляемая в модуле 16 вычисления коэффициентов фильтрации согласно описанному выше первому варианту. Поэтому, подробное описание содержания этой процедуры будет опущено.
Как описано выше, модуль 66 вычисления коэффициентов фильтрации вычисляет коэффициент w(i, k) фильтрации на основе информации, указывающей полученный энергетический спектр Wm(i, k) для каждого модуля 110 захвата звука для каждой частоты, и передает вычисленный коэффициент w(i, k) фильтрации в модуль 17 фильтрации. Кроме того, последующие процедуры являются такими же, как процедуры в устройстве 10 обработки информации (см. фиг. 6) согласно описанному выше первому варианту.
Пример функциональной конфигурации устройства обработки информации согласно рассматриваемому варианту, описанному выше со ссылками на фиг. 22.
2.3. Подробности о модуле оценки мощности некоррелированной составляющей
Далее, будут описаны подробности процедуры вычисления энергетического спектра Qm(i, k) для некоррелированной составляющей, соответствующей каждому модулю 110 захвата звука для каждой частоты, в модуле 653 оценки мощности некоррелированной составляющей.
Сначала будет описан базовый принцип вычисления энергетического спектра Qm(i, k) в модуле 653 оценки мощности некоррелированной составляющей. Звуковые волны (сигнал), поступающие в модуль захвата звука, такой как микрофон, содержат, например, целевой звук Sm, такой как звук голоса или другой подобный звук, издаваемый пользователем, и так называемый фоновый шум Nm, и случайный шум Wm, такой как звук ветра. Иными словами, каждая частотная составляющая Xm(i, k) акустического сигнала xm(n) от каждого модуля 110 захвата звука выражена соотношением, обозначенным ниже как (Выражение 8) на основе целевого звука Sm, фонового шума Nm и случайного шума Wm.
Математическая формула 7
(Выражение 8)
Здесь, когда осуществляется прием и захват звуковых волн (сигнала) , поступающих на входы каждого из M модулей захвата звука, эти звуковые волны представлены в корреляционном выражении, обозначенном ниже как (Выражение 9).
Математическая формула 8
(Выражение 9)
В приведенном выше (Выражении 9), S обозначает результат захвата целевого звука Sm из M модулей захвата звука. Аналогично, N представляет собой результат захвата фонового шума Nm из M модулей захвата звука, и W представляет собой результат захвата случайного шума Wm из M модулей захвата звука. Кроме того, величины S, N и W выражены в форме векторов. В дополнение к этому, величина Sorg обозначает целевой звук, приходящий от источника звука, и представлена скалярной величиной. В дополнение к этому, вектор ak эквивалентен описанному выше вектору a(k) матрицы многообразия. Иными словами, величина S обозначает составляющую целевого звука с учетом влияния деградации, задержки или других подобных неблагоприятных факторов, воздействующих на сигнал, когда целевой звук Sorg с выхода источника звука распространяется в процессе до момента, когда этот целевой звук приходит в модуль захвата звука.
Здесь моменты появления случайного шума W, такого как звук ветра, являются случайными и могут быть определены как сигнал приблизительно без корреляции между несколькими модулями захвата звука (в частности, модулями захвата звука, расположенными распределенным образом, как показано на фиг. 1) в устройстве обработки информации согласно настоящему изобретению.
На основе этой характеристики приведенное выше (Выражение 9) может быть определено как соотношение между векторами, показанными на фиг. 23. На фиг. 23 представлена пояснительная схема, иллюстрирующая базовые принципы процедуры, осуществляемой модулем 653 оценки мощности некоррелированной составляющей. Кроме того, пример, представленный на фиг. 23, показывает случай, когда звуки голоса пользователя, принимают и захватывают в качестве целевого звука. В дополнение к этому, векторное пространство, показанное на фиг. 23, определяют на основе вектора ak многообразия.
На фиг. 23, вектор X обозначает звуковые волны (иными, словами, входной сигнал), принимаемые и захваченные модулем захвата звука и эквивалентные волнам X, входящим в состав (Выражения 9). В дополнение к этому, вектор Y идеально эквивалентен составляющей (иными словами, речевой составляющей пользователя) на основе результата оценки целевого звука Sorg в составе входного сигнала X. Иными словами, составляющая Y схематично указывает речевую составляющую пользователя (или составляющую, обладающую корреляцией с речевой составляющей пользователя) в совокупности составляющих входного сигнала X. С другой стороны, вектор Z эквивалентен составляющей, обладающей слабой корреляцией (или не имеющей корреляции) с речевой составляющей пользователя из совокупности составляющих, входящих во входной сигнал X.
Кроме того, когда можно подавить и фоновый шум N, и случайный шум W, составляющая Z представляет собой только составляющие фонового шума N и случайного шума W. Однако в конфигурации, в которой каждый модуль захвата звука находится на ободе вокруг шеи, как в устройстве обработки информации (например, см. фиг. 1) согласно настоящему изобретению, модули захвата звука располагаются относительно близко один к другому. Поэтому фоновый шум N измеряют в качестве составляющей, обладающей корреляцией среди модулей захвата звука. Поэтому составляющая Y содержит составляющую фонового шума N в дополнение к речевой составляющей S пользователя. С другой стороны, поскольку случайный шум W, такой как звук ветра, обладает слабой корреляцией с речевой составляющей пользователя, этот случайный шум W показан в виде составляющей Z.
Используя описанные выше характеристики, модуль 653 оценки мощности некоррелированной составляющей выделяет составляющую, обладающую слабой корреляцией (или не обладающую корреляцией вообще) с выходным сигналом Y, в качестве составляющей случайного шума W с использованием обратной связи по выходному сигналу Y (иными словами, речевой составляющей пользователя). Кроме того, в последующем описании, составляющая Z называется “некоррелированной составляющей Z”.
Например, если число модулей 110 захвата звука равно 4, вектор ak матрицы многообразия представлен вычисляемым выражением, указанным ниже как (Выражение 10) на основе вычисляемого выражения, обозначенного выше как (Выражение 4).
Математическая формула 9
(Выражение 10)
Здесь, на основе скалярного произведения входного сигнала X и вектора ak многообразия, можно выделить составляющую, получаемую путем проецирования входного сигнала X на вектор ak многообразия. На основе этих характеристик некоррелированная составляющая Z может быть выделена в качестве составляющей, ортогональной вектору ak многообразия на основе вычисляемого выражения, обозначенного ниже как (Выражение 11).
Математическая формула 10
(Выражение 11)
Здесь, в указанном выше (Выражении 11), составляющая, обозначенная как (akH⋅ak)-1⋅akH⋅X, эквивалентна речевой составляющей Y пользователя, показанной на фиг. 23. Иными словами, приведенное выше (Выражение 11) может быть представлено вычисляемым выражением, указанным ниже как (Выражение 12).
Математическая формула 11
(Выражение 12)
Здесь, когда выходной сигнал Y (иными словами, выходной сигнал, подвергнутый процедуре фильтрации в модуле 17 фильтрации), возвращенный по обратной связи, применен в качестве составляющей Y в приведенном выше (Выражении 12), это (Выражение 12) может быть представлено в виде вычисляемого выражения, приведенного ниже как (Выражение 13), на основе описанного выше (Выражения 6).
Математическая формула 12
(Выражение 13)
Посредством вычисления мощности сигнала на основе некоррелированной составляющей Z, вычисленной таким способом, и выполнения сглаживания во времени, можно оценить энергетический спектр этой некоррелированной составляющей Z. Здесь энергетический спектр Qm(i, k) некоррелированной составляющей Z, соответствующей i-ому кадру и k-ой частоте в m-ом модуле 110 захвата звука (иными словами, в модуле 11m захвата звука) представлен вычисляемым выражением, приведенным ниже как (Выражение 14). Кроме того, Zm*(i, k) в последующем (Выражении 14) обозначает комплексно-сопряженное число относительно величины Zm(i, k). В дополнение к этому, в (Выражении 14), r обозначает коэффициент сглаживания в направлении кадра для подавления резких изменений в энергетическом спектре (0≤r<1).
Математическая формула 13
(Выражение 14)
При таком подходе модуль 653 оценки мощности некоррелированной составляющей вычисляет энергетический спектр Qm(i, k) этой некоррелированной составляющей.
Кроме того, когда модуль 653 оценки мощности некоррелированной составляющей может использовать результаты захвата звука от двух или более модулей 110 захвата звука во время оценки энергетического спектра Qm(i, k), нет необходимости использовать результаты захвата звука от всех модулей 110 захвата звука. В качестве конкретного примера, при оценке энергетического спектра Qm(i, k), этот модуль 653 оценки мощности некоррелированной составляющей может не использовать результат захвата звука от модуля 110 захвата звука, установленного в позиции, в которой затруднительно принимать и захватывать целевой звук голоса или другой подобный звук, как это имеет место в модуле 110 захвата звука, расположенном на задней стороне головы пользователя.
Выше были описаны подробности процедуры вычисления энергетического спектра Qm(i, k) некоррелированной составляющей, соответствующей каждому модулю 110 захвата звука для каждой частоты в модуле 653 оценки мощности некоррелированной составляющей.
2.4. Подробности о модуле оценки мощности случайных шумов
Далее будут описаны подробности процедуры определения энергетического спектра Wm(i, k) для каждого модуля 110 захвата звука для каждой частоты, используемой в модуле 655 оценки мощности случайных шумов для вычисления коэффициента w(i, k) фильтрации.
Как описано выше, модуль 655 оценки мощности случайных шумов определяет энергетический спектр Wm(i, k) на основе результатов оценки энергетического спектра Pm(i, k), полученного от модуля 651 оценки входной мощности, и энергетического спектра Qm(i, k) некоррелированной составляющей, полученного от модуля 653 оценки мощности некоррелированной составляющей.
Случай, в котором применяется энергетический спектр Qm
Например, модуль 655 оценки мощности случайных шумов может передавать в модуль 66 вычисления коэффициентов фильтрации результат оценки энергетического спектра Qm(i, k) некоррелированной составляющей в качестве энергетического спектра Wm(i, k). Кроме того, в этом случае модуль 65 оценки мощности в канале может не иметь в своем составе модуль 651 оценки входной мощности.
Случай, в котором избирательно переключаются между энергетическим спектром Pm и энергетическим спектром Qm
В дополнение к этому, в качестве другого примера, модуль 655 оценки мощности случайных шумов может избирательно передавать в модуль 66 вычисления коэффициентов фильтрации один из результатов оценки – оценку энергетического спектра Pm(i, k) или оценку энергетического спектра Qm(i, k), на основе заданного условия, в качестве энергетического спектра Wm(i, k).
Случай, в котором адаптивно вычисляют энергетический спектр Wm
В дополнение к этому, в качестве еще одного примера, модуль 655 оценки мощности случайных шумов может адаптивно вычислять энергетический спектр Wm(i, k) на основе результатов оценки энергетического спектра Pm(i, k) и энергетического спектра Qm(i, k).
Например, модуль 655 оценки мощности случайных шумов вычисляет энергетический спектр Wm~, в котором соотношение между целевым звуком (звук голоса или другой подобный звук) и случайным шумом учитывают с использованием энергетического спектра Pm(i, k) и энергетического спектра Qm(i, k) в качестве входных данных на основе вычисляемого выражения, обозначенного ниже как (Выражение 15). Кроме того, “Wm~” обозначает символ с волной над “Wm”. В дополнение к этому, Pm и Qm, показанные ниже, записаны посредством обобщения энергетического спектра Pm(i, k) и энергетического спектра Qm(i, k).
Математическая формула 14
(Выражение 15)
Например, следующее (Выражение 16) представляет конкретный пример функции F для вычисления энергетического спектра Wm~, в котором соотношение между целевым звуком и случайным шумом учитывают с использованием энергетического спектра Pm(i, k) и энергетического спектра Qm(i, k) в качестве входных данных.
Математическая формула 15
(Выражение 16)
Затем модуль 655 оценки мощности случайных шумов вычисляет энергетический спектр Wm на основе вычисляемого выражения, обозначенного ниже как (Выражение 17), с использованием энергетического спектра Wm~, в котором учтено описываемое выше соотношение между целевым звуком и случайным шумом. Кроме того, в (Выражении 17), коэффициент r обозначает коэффициент сглаживания в направлении кадра для подавления резких изменений энергетического спектра (0≤r<1). Иными словами, модуль 655 оценки мощности случайных шумов может сглаживать энергетический спектр Wm, вычисленный с использованием вычисляемого выражения, обозначенного ниже как (Выражение 17), между кадрами на основе задания коэффициента r.
Математическая формула 16
(Выражение 17)
Здесь, энергетический спектр Pm представлен в (Выражении 16), иными словами, результат оценки энергетического спектра Pm(i, k) посредством модуля 651 оценки входной мощности эквивалентен уровню звуковых волн, принятых и захватываченных модулем 110 захвата звука, как описано выше. С другой стороны, энергетический спектр Qm тоже представлен в (Выражении 16), иными словами, результат оценки энергетического спектра Qm(i, k) посредством модуля 653 оценки мощности некоррелированной составляющей эквивалентен уровню случайного шума, такого как звук ветра. Иными словами весовой коэффициент Qm/(Pm+Qm), представленный в (Выражении 16), изменяется на основе соотношения между целевым звуком, таким как звук голоса, и случайным шумом, таким как звук ветра.
В частности, если уровень сигнала целевого звука достаточно велик по отношению к уровню случайного шума, влияние энергетического спектра Pm является преобладающим, а весовой коэффициент Qm/(Pm+Qm) становится меньше. Иными словами, в этом случае весовой коэффициент Qm/(Pm+Qm) обозначает параметр контроля для дальнейшего подавления использования результата захвата звука из соответствующего канала (иными словами, модуля 110 захвата звука). Здесь величина, обратная весовому коэффициенту Qm/(Pm+Qm), применяется для вычисления коэффициента w(i, k) фильтрации. Поэтому в случае, когда уровень сигнала целевого звука в достаточной степени велик по сравнению с уровнем случайного шума, коэффициент w(i, k) фильтрации вычисляют таким образом, чтобы сделать использование результата захвата звука в соответствующем канале еще более приоритетным.
Напротив, в случае, когда влияние случайного шума, такого как звук ветра, оказывается больше, влияние энергетического спектра Qm преобладает сильнее, и весовой коэффициент Qm/(Pm+Qm) становится больше. Иными словами, в этом случае, весовой коэффициент Qm/(Pm+Qm) обозначает параметр контроля для дальнейшей приоритезации использования результата захвата звука из соответствующего канала (иными словами, модуля 110 захвата звука). Здесь величина, обратная весовому коэффициенту Qm/(Pm+Qm), применяется для вычисления коэффициента w(i, k) фильтрации, как описано выше. Поэтому, в случае, когда влияние случайного шума достаточно велико, коэффициент w(i, k) фильтрации вычисляют таким образом, чтобы еще больше подавить использование результата захвата звука в соответствующем канале.
Иными словами, применение описанного выше алгоритма управления делает использование результата захвата звука модулем 110 захвата звука, полученного путем захвата звука голоса, обладающего более высоким уровнем, более предпочтительным, а коэффициент w(i, k) фильтрации вычисляют в ситуации, в которой влияние случайного шума, такого как звук ветра, мало, и происходит прием и захват главным образом звука голоса. Таким образом, в ситуации, где влияние случайного шума, такого как звук ветра, велико, как в описанном выше первом варианте, использование результата захвата звука модулем 110 захвата звука, в котором измеренный уровень ниже, является более предпочтительным, и соответственно вычисляют коэффициент w(i, k) фильтрации. При таком подходе, модуль 655 оценки мощности случайных шумов может адаптивно вычислять энергетический спектр Wm(i, k) для вычисления коэффициента w(i, k) фильтрации в соответствии с соотношением между целевым звуком, таким как звук голоса, и случайным шумом, таким как звук ветра.
Затем модуль 655 оценки мощности случайных шумов может передать энергетический спектр Wm(i, k), вычисленный на основе приведенного выше (Выражения 17), в модуль 66 вычисления коэффициентов фильтрации.
Выше были описаны подробности процедуры определения энергетического спектра Wm(i, k) для каждого модуля 110 захвата звука для каждой частоты, используемого модулем 655 оценки мощности случайных шумов для вычисления коэффициента w(i, k) фильтрации. Кроме того, описанные выше примеры представляют собой всего лишь примеры. Содержание заявки ничем конкретно не ограничено до тех пор, пока энергетический спектр Wm(i, k) может быть определен на основе результата оценки по меньшей мере одного из спектров – энергетического спектра Pm(i, k) и/или энергетического спектра Qm(i, k).
2.5. Оценка
Как описано выше, устройство 60 обработки информации согласно рассматриваемому варианту оценивает энергетический спектр Qm(i, k) некоррелированной составляющей на основе результатов захвата звука по меньшей мере двумя модулями 110 захвата звука из совокупности нескольких модулей 110 захвата звука и обратной связи по выходному сигналу Y(i, k) модуля 17 фильтрации. Затем это устройство 60 обработки информации использует полученный результат оценки энергетического спектра Qm(i, k) некоррелированной составляющей для вычисления коэффициента w(i, k) фильтрации. В такой конфигурации, устройство 60 обработки информации может сохранять эффект подавления шума, такого как звук ветра, возникающий случайным образом, как в описанном выше первом варианте, и может далее получать целевой звук более подходящим образом, в случае, когда влияние шума, возникающего случайным образом, мало.
Кроме того, обработка сигнала согласно рассматриваемому варианту была описана выше с упором, например, на случай применения в показанном на фиг. 1 так называемом носимом устройстве, которое пользователь носит на шее. С другой стороны, возможные области применения обработки сигнала согласно рассматриваемому варианту нет необходимости ограничивать только примером, показанным на фиг. 1. В частности, обработка сигнала согласно рассматриваемому варианту может быть применима до тех пор, пока устройство содержит несколько модулей захвата звука. Кроме того, более предпочтительно, несколько модулей захвата звука могут быть расположены таким образом, что расстояния от этих модулей до источника целевого звука (например, говорящего рта) будут различными. В дополнение к этому, более предпочтительно, указанные несколько модулей захвата звука могут быть расположены во взаимно разных направлениях от источника целевого звука.
3. Третий вариант
3.1. Обзор
Далее пример случая, в котором технология согласно настоящему изобретению применена к так называемому многоканальному фильтру Винера, будет описан в соответствии с третьим вариантом настоящего изобретения.
Сначала будет приведен общий обзор многоканальных фильтров Винера для дальнейшего улучшения характеристик устройств обработки информации согласно рассматриваемому варианту. Многоканальные фильтры Винера представляют собой технологию, используемую для подавления фоновых шумов. Например, в случае, когда функция Wmwf представляет многоканальный фильтр Винера, эту функцию Wmwf рассчитывают на основе вычисляемого выражения, приведенного ниже как (Выражение 18).
Математическая формула 17
(Выражение 18)
В приведенном выше (Выражении 18), параметр S обозначает целевой звук, такой как звук голоса, и эквивалентен параметру Sorg, представленному в приведенном выше (Выражение 9). В дополнение к этому, параметр X обозначает звуковые волны (иными словами, входной сигнал), принимаемые и захваченные модулем захвата звука, и эквивалентен параметру X, представленному в приведенном выше (Выражении 9). В дополнение к этому, параметр W упрощенно обозначает фильтрующую функцию, которую нужно применить к входному сигналу X в многоканальном фильтре Винера. Иными словами, в идеале, многоканальный фильтр Винера восстанавливает первоначальный исходный сигнал на основе целевой функции, представленной в приведенном выше (Выражении 18).
Однако, в общем случае, затруднительно независимо измерить целевой звук S. Поэтому измерения здесь заменены проблемой минимизации для поиска компромисса между деградацией сигнала и уровнем подавления шумов с использованием некоторых каналов из совокупности нескольких каналов (иными словами, модулей захвата звука) в качестве опоры. В этом случае, например, функция Wmwf многоканального фильтра Винера представлена вычисляемым выражением, обозначенным ниже, как (Выражение 19).
Математическая формула 18
(Выражение 19)
В приведенном выше (Выражении 19), параметр Xi обозначает выходной сигнал на основе результата захвата звука в канале, используемом в качестве опоры. Кроме того, в последующем описании канал, используемый в качестве опоры, называется «опорный микрофон». В дополнение к этому, параметр N обозначает фоновый шум и эквивалентен параметру N, представленному в приведенном выше (Выражении 9). В дополнение к этому, коэффициент μ представляет собой коэффициент (весовой), заданный в соответствии с уровнем подавления шума относительно целевого звука, и, например, задаваемый заранее на основе результатов предшествующего эксперимента или подобных данных. В дополнение к этому, параметры Rx и Rn в приведенном выше (Выражении 19) представлены вычисляемыми выражениями (Выражение 20) и (Выражение 21). В дополнение к этому, в (Выражении 19), опорный микрофон обозначен ei. Здесь параметр ei представляет собой вектор M-го порядка, в котором только i-ая составляющая равна 1, а все остальные составляющие равны 0, и который, например, представлен следующим (Выражением 22).
Математическая формула 19
(Выражение 20)
(Выражение 21)
(Выражение 22)
Кроме того, в приведенном выше (Выражении 20), параметр X обозначает входной сигнал на основе результата захвата звука в каждом из нескольких каналов в виде вектора. Иными словами, параметр Rx вычисляют на основе входного сигнала X. В дополнение к этому, в (Выражении 21), параметр N обозначает имеющий форму вектора входной сигнал (иными словами, сигнал, эквивалентный шуму) на основе результата захвата звука в каждом из нескольких каналов в той секции, где прием и захват целевого звука не производится (далее также называется “секция паузы”). Поэтому, например, параметр Rn вычисляют в секции паузы, определяемой на основе результата измерений в секции, в которой принимают и захватывают целевой звук (далее также называется “секция целевого звука”). Кроме того, в дальнейшем параметр Rx также называется “входная коррелированная матрица” и Rn также называется “шумовая коррелированная матрица”.
Здесь, как описано выше в других вариантах, случайный шум, такой как звук ветра, шум, сопровождаемый вибрацией, и шорох, возникающий из-за ношения устройства пользователем, принимает и захватывает модуль захвата звука в некоторых случаях, в которых окружающая среда, например при использовании устройства вне помещения, изменяется динамически. С другой стороны, случай, в котором случайный шум подмешивается в модуль захвата звука (иными словами, в опорный микрофон) жестко определен вектором ei в (Выражение 19), при этом затруднительно подавить случайный шум посредством известного многоканального фильтра Винера.
Соответственно, в рассматриваемом варианте будет предложен пример структуры, дополнительно уменьшающей влияние случайного шума в многоканальном фильтре Винера путем применения описанной выше технологии к многоканальному фильтру Винера в других вариантах.
Конкретнее, в устройстве обработки информации согласно рассматриваемому варианту влияние случайного шума дополнительно уменьшено путем адаптивного выбора модуля захвата звука, в котором влияние случайного шума меньше, чем в опорном микрофоне, на основе результата оценки описанного выше энергетического спектра Pm (или энергетического спектра Wm). Например, вычисляемое выражение, обозначенное ниже как (Выражение 23), указывает базовый принцип, относящийся к определению функции Wmwf многоканального фильтра Винера в устройстве обработки информации согласно рассматриваемому варианту.
Математическая формула 20
(Выражение 23)
Как понятно из сравнения между приведенным выше (Выражением 23) и описанным выше (Выражением 19), выходной сигнал Y на основе результата оценки энергетического спектра Pm (или энергетического спектра Wm), описанного выше в других вариантах, применяется в качестве выходного сигнала Xi на основе результата захвата звука посредством опорного микрофона в устройстве обработки информации согласно рассматриваемому варианту. На основе этой конфигурации устройство обработки информации согласно рассматриваемому варианту динамически выбирает модуль захвата звука, в котором влияние случайного шума меньше, чем в опорном микрофоне, даже в ситуации, в которой влияние случайного шума более очевидно (иными словами, в ситуации, в которой окружающая среда изменяется динамически). Таким образом, устройство обработки информации согласно рассматриваемому варианту может дополнительно уменьшить влияние случайного шума и выделить целевой звук более подходящим образом, чем устройство, в котором применен известный многоканальный фильтр Винера. Кроме того, в дальнейшем устройство обработки информации согласно рассматриваемому варианту будет дополнительно описано подробно.
3.2. Функциональная конфигурация
Пример функциональной конфигурации устройства обработки информации согласно рассматриваемому варианту будет описано со ссылками на фиг. 24. На фиг. 24 представлена блок-схема, иллюстрирующая пример функциональной конфигурации устройства обработки информации согласно рассматриваемому варианту настоящего изобретения. Кроме того, в настоящем описании, устройство обработки информации согласно рассматриваемому варианту, называется, в некоторых случаях, “устройство 70 обработки информации” с целью явно отличать это устройство обработки информации от устройств обработки информации (например, устройств 10 и 60 обработки информации) согласно описанным выше других вариантов.
Как показано на фиг. 24, устройство 70 обработки информации согласно рассматриваемому варианту содержит несколько модулей 111 – 11M захвата звука (где M – положительное целое число), модуль 13 разложения на частотные составляющие, модуль 71 оценки мощности в канале, модуль 72 вычисления коэффициентов фильтрации, модуль 73 вычисления входной коррелированной матрицы, модуль 74 вычисления шумовой коррелированной матрицы, модуль 75 вычисления функции многоканального фильтра Винера, модуль 76 фильтрации в многоканальном фильтре Винера и модуль 77 объединения частотных составляющих. Кроме того, несколько модулей 111 – 11M захвата звука (где M – положительное целое число) и модуль 13 разложения на частотные составляющие эквивалентны конфигурациям, в которых такие же цифровые позиционные обозначения присвоены в устройстве 10 обработки информации (см. фиг. 6) согласно описанному выше первому варианту. Иными словами, устройство 70 обработки информации согласно рассматриваемому варианту отличается от устройства 10 обработки информации согласно описанному выше первому варианту содержанием процедуры обработки данных в модуле 71 оценки мощности в канале, модуле 72 вычисления коэффициентов фильтрации, модуле 73 вычисления входной коррелированной матрицы, модуле 74 вычисления шумовой коррелированной матрицы, модуле 75 вычисления функции многоканального фильтра Винера, модуле 76 фильтрации в многоканальном фильтре Винера и модуле 77 объединения частотных составляющих. Соответственно, функциональная конфигурация устройства 70 обработки информации согласно рассматриваемому варианту будет описано ниже конкретно с упором на отличия от устройства 10 обработки информации согласно описанному выше первому варианту. Подробное описание таких же компонентов конфигурации, какие входят в состав устройства 10 обработки информации, будет опущено.
Модуль 76 фильтрации в многоканальном фильтре Винера
Модуль 76 фильтрации в многоканальном фильтре Винера получает каждую частотную составляющую Xm(i, k) из состава акустического сигнала xm(n) для каждого модуля 110 захвата звука от модуля 13 разложения на частотные составляющие. В дополнение к этому, модуль 76 фильтрации в многоканальном фильтре Винера получает результат вычисления функции Wmwf(i, k) многоканального фильтра Винера для каждой частоты от модуля 75 вычисления функции многоканального фильтра Винера, который будет описан ниже. Кроме того, подробности способа вычисления функции Wmwf(i, k) многоканального фильтра Винера будут отдельно описаны ниже. Кроме того, модуль 76 фильтрации в многоканальном фильтре Винера использует каждую частотную составляющую Xm(i, k) акустического сигнала xm(n) от каждого модуля 110 захвата звука в качестве входного сигнала и генерирует выходной сигнал S для каждой частоты путем выполнения процедуры фильтрации на основе функции Wmwf(i, k) многоканального фильтра Винера. Например, выходной сигнал S представлен вычисляемым выражением, обозначенным ниже как (Выражение 24). Кроме того, в следующем (Выражении 24), не записаны номер i кадра и номер k дискретной частоты.
Математическая формула 21
(Выражение 24)
Затем модуль 76 фильтрации в многоканальном фильтре Винера передает выходной сигнал S, генерируемый для каждой частоты, в модуль 77 объединения частотных составляющих.
Модуль 77 объединения частотных составляющих
Модуль 77 объединения частотных составляющих получает выходной сигнал S, генерируемый для каждой частоты, от модуля 76 фильтрации в многоканальном фильтре Винера. Модуль 77 объединения частотных составляющих генерирует акустический сигнал путем объединения полученных выходных сигналов S для каждой частоты. Кроме того, поскольку процедура, осуществляемая модулем 77 объединения частотных составляющих, является такой же, как процедура генерации акустического сигнала y(n) путем объединения выходных сигналов Y(i, k) для каждой частоты в модуле 18 объединения частотных составляющих согласно описанным выше первому и второму вариантам, подробное описание этой процедуры здесь будет опущено.
Модуль 71 оценки мощности в канале и модуль 72 вычисления коэффициентов фильтрации
Далее будет описана конфигурация модуля 71 оценки мощности в канале и модуля 72 вычисления коэффициентов фильтрации. Эти модуль 71 оценки мощности в канале и модуль 72 вычисления коэффициентов фильтрации могут иметь конфигурацию в соответствии с такой же структурой, как в устройстве 10 обработки информации согласно описанному выше первому варианту, или могут иметь конфигурацию в соответствии с такой же структурой, как в устройстве 60 обработки информации согласно второму варианту. Соответственно эта конфигурация может быть описана ниже с упором на каждый случай.
Пример 1 конфигурации модуля 71 оценки мощности в канале и модуля 72 вычисления коэффициентов фильтрации
Сначала будет описан случай конфигурации модуля 71 оценки мощности в канале и модуля 72 вычисления коэффициентов фильтрации с применением такой же структуры, как в первом устройстве 10 обработки информации (см. фиг. 6) согласно описанному выше первому варианту. В этом случае модуль 71 оценки мощности в канале и модуль 72 вычисления коэффициентов фильтрации эквивалентны модулю 15 оценки мощности в канале и модулю 16 вычисления коэффициентов фильтрации согласно первому варианту.
В частности, модуль 71 оценки мощности в канале оценивает энергетический спектр Pm(i, k) каждого модуля 110 захвата звука для каждой частоты на основе каждой частотной составляющей Xm(i, k) акустического сигнала xm(n), соответствующего каждому модулю 110 захвата звука.
В дополнение к этому, модуль 72 вычисления коэффициентов фильтрации вычисляет коэффициент w(i, k) фильтрации на основе результата оценки энергетического спектр Pm(i, k). Затем модуль 72 вычисления коэффициентов фильтрации вычисляет функцию G фильтра для каждой частоты на основе результата вычисления коэффициента w(i, k) фильтрации и передает результат вычисления функции G фильтра в модуль 75 вычисления функции многоканального фильтра Винера, который будет описан ниже.
Пример 2 конфигурации модуля 71 оценки мощности в канале и модуля 72 вычисления коэффициентов фильтрации
Далее будет описан случай конфигурации модуля 71 оценки мощности в канале и модуля 72 вычисления коэффициентов фильтрации с применением такой же структуры, как в первом устройстве 60 обработки информации (см. фиг. 22) согласно описанному выше второму варианту. В этом случае модуль 71 оценки мощности в канале и модуль 72 вычисления коэффициентов фильтрации эквивалентны модулю 65 оценки мощности в канале и модулю 66 вычисления коэффициентов фильтрации согласно второму варианту.
В частности, модуль 71 оценки мощности в канале оценивает энергетический спектр Pm(i, k) для каждого модуля 110 захвата звука для каждой частоты на основе каждой частотной составляющей Xm(i, k) акустического сигнала xm(n), соответствующего каждому модулю 110 захвата звука.
В дополнение к этому, модуль 71 оценки мощности в канале принимает обратную связь по акустическому сигналу для каждой частоты, в котором влияние шума (в частности, случайного шума) подавлено на основе процедуры фильтрации.
В качестве конкретного примера, модуль 72 вычисления коэффициентов фильтрации может принимать обратную связь по акустическому сигналу S для каждой выходной частоты в качестве результата процедуры фильтрации модулем 76 фильтрации в многоканальном фильтре Винера.
В дополнение к этому, в качестве другого примера, посредством отдельной установки конфигурации, эквивалентной модулю 17 фильтрации, в модуле устройства 60 обработки информации согласно второму варианту, модуль 72 вычисления коэффициентов фильтрации может принимать обратную связь по акустическому сигналу для каждой частоты, в которой шумовая составляющая подавлена из этой конфигурации. В этом случае, модуль 72 вычисления коэффициентов фильтрации принимает обратную связь по акустическому сигналу, эквивалентному выходному сигналу Y(i, k) в устройстве 60 обработки информации согласно второму варианту.
Когда принята обратная связь, модуль 71 оценки мощности в канале оценивает энергетический спектр Qm(i, k) акустического сигнала и некоррелированной составляющей на основе корреляции между обратной связью по акустическому сигналу и частотной составляющей Xm(i, k) акустического сигнала xm(n), соответствующего каждому модулю 110 захвата звука.
Затем, модуль 71 оценки мощности в канале может определить энергетический спектр Wm(i, k) каждого модуля 110 захвата звука для каждой частоты, используемый для модуля 72 вычисления коэффициентов фильтрации с целью вычисления коэффициента w(i, k) фильтрации на основе результатов оценки энергетического спектра Pm(i, k) и энергетического спектра Qm(i, k). Кроме того, поскольку способ вычисления энергетического спектра Pm(i, k) и энергетического спектра Qm(i, k) или способ определения энергетического спектра Wm(i, k) являются такими же, как соответствующие способы, применяемые в модуле 65 оценки мощности в канале согласно описанному выше второму варианту, подробное описание этих способов будет опущено.
В дополнение к этому, модуль 72 вычисления коэффициентов фильтрации вычисляет коэффициент w(i, k) фильтрации на основе результата оценки энергетического спектра Wm(i, k). Затем модуль 72 вычисления коэффициентов фильтрации может вычислять функцию G фильтра для каждой частоты на основе результата вычисления коэффициента w(i, k) фильтрации и передает результат вычисления функции G фильтра в модуль 75 вычисления функции многоканального фильтра Винера, который будет описан ниже.
Кроме того, как описано выше, функцию G фильтра вычисляют на основе коэффициента w(i, k) фильтрации. Поэтому, в свете описанных выше (Выражение 2) – (Выражение 6), например, функция G фильтра может быть представлено вычисляемыми выражениями, обозначенными ниже как (Выражение 25) и (Выражение 26).
Математическая формула 22
(Выражение 25)
(Выражение 26)
Кроме того, в приведенных выше (Выражении 25) и (Выражении 26), параметр Rw эквивалентен матрице R(i, k) в описанном выше (Выражении 6). Иными словами, в случае на основе такой же идеи, как в первом варианте, параметр Rw представляет собой матрицу на основе результата оценки энергетического спектра Pm(i, k). В дополнение к этому, в случае на основе такой же идеи, как в первом варианте, параметр Rw представляет собой матрицу на основе энергетического спектра Wm(i, k), найденного в соответствии с результатами оценки энергетического спектра Pm(i, k) и энергетического спектра Qm(i, k).
После этого будут описаны модуль 73 вычисления входной коррелированной матрицы, модуль 74 вычисления шумовой коррелированной матрицы и модуль 75 вычисления функции многоканального фильтра Винера.
Модуль 73 вычисления входной коррелированной матрицы
Модуль 73 вычисления входной коррелированной матрицы получает каждую частотную составляющую Xm(i, k) акустического сигнала xm(n) для каждого модуля 110 захвата звука от модуля 13 разложения на частотные составляющие. После этого, модуль 73 вычисления входной коррелированной матрицы вычисляет входную коррелированную матрицу Rx для каждой частоты на основе описанного выше (Выражения 20) с использованием каждой из полученных частотных составляющих Xm(i, k) в качестве входных данных. Затем модуль 73 вычисления входной коррелированной матрицы передает входную коррелированную матрицу Rx, вычисленную для каждой частоты, в модуль 75 вычисления функции многоканального фильтра Винера.
Модуль 74 вычисления шумовой коррелированной матрицы
Модуль 74 вычисления шумовой коррелированной матрицы получает каждую частотную составляющую Xm(i, k) акустического сигнала xm(n) для каждого модуля 110 захвата звука от модуля 13 разложения на частотные составляющие. После этого, модуль 74 вычисления шумовой коррелированной матрицы задает секцию паузы на основе результата получения каждой частотной составляющей Xm(i, k) акустического сигнала xm(n). Затем, модуль 74 вычисления шумовой коррелированной матрицы вычисляет шумовую коррелированную матрицу Rn для каждой частоты на основе описанного выше (Выражения 21) с использованием каждой частотной составляющей Xm(i, k) в заданной секции паузы в качестве входных данных. Затем модуль 74 вычисления шумовой коррелированной матрицы передает шумовую коррелированную матрицу Rn, вычисленную для каждой частоты, в модуль 75 вычисления функции многоканального фильтра Винера.
Модуль 75 вычисления функции многоканального фильтра Винера
Модуль 75 вычисления функции многоканального фильтра Винера получает результат вычисления функции G фильтра на основе коэффициента w(i, k) фильтрации для каждой частоты от модуля 72 вычисления коэффициентов фильтрации. В дополнение к этому, модуль 75 вычисления функции многоканального фильтра Винера получает результат вычисления входной коррелированной матрицы Rx для каждой частоты от модуля 73 вычисления входной коррелированной матрицы. В дополнение к этому, модуль 75 вычисления функции многоканального фильтра Винера получает результат вычисления шумовой коррелированной матрицы Rn для каждой частоты от модуля 74 вычисления шумовой коррелированной матрицы. После этого, модуль 75 вычисления функции многоканального фильтра Винера вычисляет функцию Wmwf(i,k) многоканального фильтра Винера для каждой частоты на основе функции G фильтра, входной коррелированной матрицы Rx и шумовой коррелированной матрицы Rn, получаемых для каждой частоты. Затем модуль 75 вычисления функции многоканального фильтра Винера передает результат вычисления функции Wmwf(i, k) многоканального фильтра Винера в модуль 76 фильтрации в многоканальном фильтре Винера. Таким образом, модуль 76 фильтрации в многоканальном фильтре Винера может осуществлять процедуру фильтрации для каждой частотной составляющей Xm(i, k) акустического сигнала xm(n) для каждого модуля 110 захвата звука на основе функции Wmwf(i, k) многоканального фильтра Винера. Кроме того, более подробно содержание способа вычисления функции Wmwf(i, k) многоканального фильтра Винера будет отдельно описано ниже.
Пример функциональной конфигурации устройства обработки информации согласно рассматриваемому варианту был описан выше со ссылками на фиг. 24. Кроме того, например, модуль 75 вычисления функции многоканального фильтра Винера и модуль 76 фильтрации в многоканальном фильтре Винера в конфигурации описанного выше устройства 70 обработки информации эквивалентны примеру “модуля управления выходом”.
3.3. Подробности способа вычисления многоканального фильтра Винера
Далее способ вычисления функции Wmwf(i, k) многоканального фильтра Винера будет описан более подробно. Кроме того, в настоящем описании, пояснения номера i кадра и номера k дискретной частоты будут опущены.
Сначала сфокусируемся на описанном выше (Выражении 23). Как описано выше, функцию G фильтра вычисляют на основе коэффициента w(i, k) фильтрации. Поэтому, выходной сигнал Y, описываемый в (Выражении 23), может быть представлен вычисляемым выражением, обозначенным ниже как (Выражение 27), в соответствии с входным сигналом X и функцией G фильтра на основе коэффициента w(i, k) фильтрации в свете описанного выше (Выражения 7).
Математическая формула 23
(Выражение 27)
Иными словами, описанное выше (Выражение 23) может быть представлено в вычисляемом выражении, обозначенном ниже как (Выражение 28), в соответствии с выходным сигналом Y, функцией G фильтра, входной коррелированной матрицей Rx и шумовой коррелированной матрицей Rn, представленными в приведенном выше (Выражении 27).
Математическая формула 24
(Выражение 28)
Здесь, как понятно из сравнения между приведенным выше (Выражением 28) и описанным выше (Выражением 19), про приведенное выше (Выражение 28) может быть известно, что оно эквивалентно вычисляемому выражению, в котором матрица ei, определяющая опорный микрофон, замещена функцией G фильтра в описанном выше (Выражении 19). В дополнение к этому, функция G фильтра также может быть представлена в вычисляемом выражении, обозначенном ниже как (Выражение 29) в свете описанных выше (Выражения 25) и (Выражения 26).
Математическая формула 25
(Выражение 29)
Здесь, в приведенном выше (Выражении 29), коэффициенты g1, .., gi, .., gM представляют собой коэффициенты, определяемые на основе матрицы Rw в (Выражении 25) и (Выражении 26). Более конкретно, коэффициенты g1, .., gi, .., gM определяют на основе, например, результата оценки энергетического спектра Pm(i, k) в описанном выше первом варианте или результата оценки энергетического спектра Wm(i, k) во втором варианте. Иными словами, коэффициенты g1, .., gi, .., gM обозначают весовые коэффициенты в соответствии с величиной влияния случайного шума в каждом модуле 110 захвата звука и, другими словами, указывают насколько надежен результат захвата звука для каждого модуля 110 захвата звука в качестве результата захвата целевого звука.
Иными словами, в устройстве 70 обработки информации согласно рассматриваемому варианту коэффициенты g1, .., gi, .., gM изменяются в соответствии с результатом захвата звуковых волн (конкретнее, случайного шума) каждым модулем 110 захвата звука и, например, модуль 110 захвата звука, в котором влияние случайного шума меньше, динамически выбирают в качестве опорного микрофона в соответствии с этими коэффициентами.
3.4. Оценка
Как описано выше, устройство 70 обработки информации согласно рассматриваемому варианту оценивает энергетический спектр (например, описанный выше энергетический спектр Pm(i, k) или энергетический спектр Wm(i, k)) для каждого модуля 110 захвата звука для каждой частоты на основе каждой частотной составляющей Xm(i, k) акустического сигнала xm(n), соответствующего каждому модулю 110 захвата звука. Затем устройство 70 обработки информации оценивает коэффициент w(i, k) фильтрации на основе результата оценки энергетического спектра и использует результат оценки коэффициента w(i, k) фильтрации для вычисления функции Wmwf(i, k) многоканального фильтра Винера. В этой конфигурации устройство 70 обработки информации согласно рассматриваемому варианту может динамически выбирать модуль 110 захвата звука, в котором влияние случайного шума меньше, в качестве опорного микрофона из совокупности нескольких модулей 110 захвата звука. Иными словами, устройство 70 обработки информации согласно рассматриваемому варианту может дополнительно уменьшить влияние случайного шума и далее выбирать целевой звук более подходящим образом, чем в случае применения известного многоканального фильтра Винера, в котором опорный микрофон задан фиксировано.
Кроме того, сфера применения обработки сигнала согласно рассматриваемому варианту не обязана быть ограниченной только примером показанного на фиг. 1 так называемого носимого устройства, которое пользователь носит на шее. В частности, обработка сигнала согласно рассматриваемому варианту может быть применена до тех пор, пока устройство содержит несколько модулей захвата звука. Кроме того, более предпочтительно, несколько модулей захвата звука могут быть расположены таким образом, что расстояния от каждого модуля до источника (например, говорящего рта) целевого звука отличаются одно от другого. В дополнение к этому, более предпочтительно, указанные несколько модулей захвата звука могут располагаться во взаимно различных направлениях относительно источника целевого звука.
4. Аппаратная конфигурация
Далее пример аппаратной конфигурации устройства 10 обработки информации (иными словами, описанных выше устройств 11 – 14 обработки сигнала) согласно каждому варианту настоящего изобретения будет описан со ссылками на фиг. 25. На фиг. 25 представлена схема, иллюстрирующая пример аппаратной конфигурации устройства 10 обработки сигнала согласно варианту настоящего изобретения.
Как показано на фиг. 25, устройство 10 обработки информации согласно рассматриваемому варианту содержит процессор 901, оперативное запоминающее устройство 903, запоминающее устройство 905 большой емкости, устройство 907 оперирования, отчетное устройство 909, акустическое устройство 911, устройство 913 захвата звука и шину 917. В дополнение к этому, устройство 10 обработки информации может содержать устройство 915 связи.
Процессор 901 может представлять собой, например, центральный процессор (central processing unit (CPU)), графический процессор (graphics processing unit (GPU)), цифровой процессор сигнала (digital signal processor (DSP)) или систему на кристалле (system on chip (SoC)) и осуществляет разнообразные процедуры устройства 10 обработки информации. Процессор 901 может содержать, например, электронную схему, выполняющую различные арифметические процедуры. Кроме того, модуль 13 разложения на частотные составляющие, модуль 15 оценки мощности в канале, модуль 16 вычисления коэффициентов фильтрации, модуль 17 фильтрации и модуль 18 объединения частотных составляющих, описанные выше, могут быть реализованы процессором 901.
Оперативное запоминающее устройство 903 содержит запоминающее устройство с произвольной выборкой (random access memory (RAM)) и постоянное запоминающее устройство (read-only memory (ROM)) и хранит данные и программу, выполняемую процессором 901. Запоминающее устройство 905 большой емкости может содержать носитель данных, такой как полупроводниковое запоминающее устройство или накопитель на жестком диске.
Устройство 907 оперирования имеет функцию генерации входного сигнала, когда пользователь выполняет нужную манипуляцию. Это устройство 907 оперирования может содержать, например, сенсорную панель. В дополнение к этому, в качестве другого примера, устройство 907 оперирования может содержать, например, модуль ввода, такой как кнопка, переключатель, или клавиатура, используемые пользователем для ввода информации, и схему управления вводом, генерирующую входной сигнал на основе ввода пользователем и передающую этот входной сигнал процессору 901.
Отчетное устройство 909 представляет собой пример устройства вывода и может быть, например, таким устройством, как жидкокристаллический дисплей (liquid crystal display (LCD)) или дисплей на органических светодиодах (organic light emitting diode (OLED)). В этом случае отчетное устройство 909 может сообщать заданную информацию пользователю путем представления информации на экране.
Кроме того, описанные выше примеры отчетного устройства представляют собой просто примеры. Варианты отчетного устройства 909 ничем конкретно не ограничены до тех пор, пока оно может сообщать заданную информацию пользователю. В качестве конкретного примера, отчетное устройство 909 может представлять собой устройство, сообщающее заданную информацию пользователю посредством мерцающей картинки, такой как система светодиодов (light emitting diode (LED)). В дополнение к этому, отчетное устройство 909 может также представлять собой устройство, сообщающее заданную информацию пользователю посредством вибрации, как так называемый вибратор.
Акустическое устройство 911 представляет собой устройство, сообщающее заданную информацию пользователю посредством вывода заданного акустического сигнала через громкоговоритель или другим подходящим способом.
Устройство 913 захвата звука представляет собой устройство, принимающее и захватывающее звуки голоса пользователя или звуковые волны, приходящие из окружающей среды, в качестве акустической информации (акустического сигнала), как микрофон. В дополнение к этому, устройство 913 захвата звука может принимать данные аналогового акустического сигнала, представляющего принятый и захватываченный звук голоса или звуковые волны, в качестве акустической информации или может преобразовывать аналоговый акустический сигнал в цифровой акустический сигнал и принимать данные этого преобразованного цифрового акустического сигнала в качестве акустической информации. Кроме того, в этом устройстве 913 захвата звука могут быть реализованы описанные выше модули 110 захвата звука (например, модули 111 – 11M захвата звука, показанные на фиг. 6).
Устройство 915 связи представляет собой средство связи, входящее в состав устройства 10 обработки информации и осуществляющее связь с внешним устройством через сеть связи. Это устройство 915 связи представляет собой проводной или беспроводной интерфейс связи. Когда устройство 915 связи является беспроводным интерфейсом связи, это устройство 915 связи может содержать антенну связи, высокочастотную (RF) схему и процессор видеодиапазона.
Устройство 915 связи имеет функцию осуществления разного рода процедур обработки сигнала применительно к сигналу, принимаемому от внешнего устройства, и может передавать цифровой сигнал, сгенерированный на основе принятого аналогового сигнала, процессору 901.
Шина 917 соединяет процессор 901, оперативное запоминающее устройство 903, запоминающее устройство 905 большой емкости, устройство 907 оперирования, отчетное устройство 909, акустическое устройство 911, устройство 913 захвата звука и устройство 915 связи. Эта шина 917 может содержать шины нескольких типов.
В дополнение к этому, может быть также создана программа, в соответствии с которой аппаратура, такая как процессор, оперативное запоминающее устройство и запоминающее устройство большой емкости, входящие в состав компьютера, выполняют такие же функции, какие выполняет конфигурация указанного выше устройства 10 обработки информации. В дополнение к этому, может быть также предложен читаемый компьютером носитель информации, на котором записана такая программа.
5. Заключение
Как описано выше, устройство 10 обработки информации согласно вариантам настоящего изобретения имеет выступающий участок обтекаемой формы по меньшей мере на части. Модуль 110 захвата звука закреплен в устройстве таким образом, что этот модуль захвата звука располагается на переднем конце или возле переднего конца указанного выступающего участка. В этой конфигурации, например, можно ослабить влияние шума, возникающего случайным образом, такого как звук ветра, шум, сопровождаемый вибрацией, или шорох, возникающий вследствие ношения устройства, и принимать и захватывать целевой звук (например, звук голоса пользователя) более подходящим образом.
В дополнение к этому, устройство 10 обработки информации согласно рассматриваемым вариантам может содержать несколько модулей 110 захвата звука. Указанные несколько модулей 110 захвата звука могут быть закреплены таким образом, что эти модули 110 захвата звука обращены во взаимно различных направлениях. В этой конфигурации, даже в ситуации, когда шум, такой как звук ветра, шум, сопровождаемый вибрацией, или шорох, возникающий вследствие ношения устройства, возникает случайным образом, можно компенсировать характеристики других модулей захвата звука на основе результатов захвата звука некоторыми модулями захвата звука (иными словами, тех модулей захвата звука, для которых влияние шума мало).
Предпочтительный вариант (ы) настоящего изобретения был (и) выше описан (ы) подробно со ссылками на прилагаемые чертежи, тогда как настоящее изобретение приведенными выше примерами не исчерпывается. Специалист в рассматриваемой области может найти разнообразные изменения и модификации, оставаясь в пределах объема прилагаемой Формулы изобретения, и следует понимать, что все эти изменения и модификации естественным образом попадают в пределы технического объема настоящего изобретения.
Далее, эффекты, рассматриваемые в настоящем описании, являются всего лишь иллюстрациями или примерами, но никак не ограничивают настоящее изобретение. Иными словами, вместе или вместо изложенных выше эффектов технология согласно настоящему изобретению может обеспечить достижение других эффектов, которые будут ясны для специалистов в рассматриваемой области из описания настоящего изобретения.
Кроме того, предлагаемая технология может быть конфигурирована, как описано ниже.
(1) Устройство обработки информации, содержащее:
модуль захвата звука; и
держатель, выполненный так, что он имеет выступающий участок обтекаемой формы по меньшей мере на своей части и удерживает указанный модуль захвата звука так, что указанный модуль захвата звука располагается на переднем конце или возле переднего конца выступающего участка.
(2) Устройство обработки информации по (1), дополнительно содержащее:
один или более вторых модулей захвата звука, выполненных отлично от первого модуля захвата звука, и являющихся дополнительными модулями захвата звука для первого модуля захвата звука.
(3) Устройство обработки информации по (2), в котором
держатель удерживает множество вторых модулей захвата звука так, что вторые модули захвата звука, указанного множества, обращены во взаимно различных направлениях.
(4) Устройство обработки информации по (1), в котором
держатель предназначен для ношения на заданной части тела пользователя и для крепления модуля захвата звука так, что указанный модуль захвата звука и часть тела пользователя располагаются заданным образом один относительно другой.
(5) Устройство обработки информации по (4), в котором
указанная часть тела пользователя является шеей, а
когда держатель надет на шею, выступающий участок располагается так, что передний конец этого выступающего участка обращен по существу в направлении вперед от пользователя.
(6) Устройство обработки информации по (4) или (5), содержащее:
множество вторых модулей захвата звука, выполненных отлично от первого модуля захвата звука, и являющихся дополнительными модулями захвата звука для первого модуля захвата звука, при этом
по меньшей мере два вторых модуля захвата звука из указанного множества вторых модулей захвата звука закреплены в по существу взаимно симметричных позициях относительно указанной части тела пользователя.
(7) Устройство обработки информации по (2), содержащее:
модуль обработки сигнала, выполненный с возможностью подавления шумовой составляющей относительно звуковых волн, приходящих к первому модулю захвата звука с заданного направления, на основе звуковых волн, принятых и захватываченных от каждого из модулей – первого модуля захвата звука и одного или более вторых модулей захвата звука.
(8) Устройство обработки информации по (7), при этом
указанный модуль обработки сигнала выполнен с возможностью оценки уровня сигнала для каждой частотной составляющей акустического сигнала на основе звуковых волн, принятых и захватываченных от каждого из модулей – первого модуля захвата звука и одного или более вторых модулей захвата звука, и подавления шумовой составляющей на основе результата оценки уровень сигнала.
(9) Устройство обработки информации по (7), в котором
на основе корреляции между первыми звуковыми волнами, принятыми и захватываченными по меньшей мере от каждого из множества модулей захвата звука из совокупности, содержащей указанный первый модуль захвата звука и один или более вторых модулей захвата звука, и вторыми звуковыми волнами, в составе которых шумовая составляющая была подавлена посредством предшествующей обработки, модуль обработки сигнала подавляет шумовую составляющую, входящую в состав первых звуковых волн.
(10) Устройство обработки информации по (9), в котором
держатель удерживает множество модулей захвата звука так, что расстояния между заданным источником звука и по меньшей мере двумя модулями захвата звука из совокупности указанного множества модулей захвата звука отличаются одно от другого.
(11) Устройство обработки информации по (9) или (10), в котором
держатель выполнен с возможностью удержания множества модулей захвата звука так, что каждый из по меньшей мере двух модулей захвата звука из указанного множества модулей захвата звука расположен во взаимно различных направлениях относительно заданного источника звука.
(12) Устройство обработки информации по (2), содержащее:
модуль управления выходом для избирательной передачи на выход звуковых волн, принятых и захватываченных некоторыми модулями захвата звука из указанных первого модуля захвата звука и одного или более вторых модулей захвата звука, при этом
модуль управления выходом выполнен с возможностью оценки уровня сигнала каждой частотной составляющей звуковых волн на основе звуковых волн, принятых и захватываченных каждым из совокупности указанных первого модуля захвата звука и одного или более вторых модулей захвата звука, и выбора некоторых модулей захвата звука на основе результата оценки уровня сигнала.
(13) Устройство обработки информации по (12), в котором
указанный модуль управления выходом содержит многоканальный фильтр Винера выполнен с возможностью выбора опорного микрофона для многоканального фильтра Винера на основе результата оценки уровня сигнала.
(14) Устройство обработки информации по (1), в котором
указанный держатель представляет собой корпус, имеющий по существу прямоугольную поверхность по меньшей мере в части, и
этот корпус имеет выступающий участок в заданной области, содержащий угол указанной по существу прямоугольной поверхности и удерживает модуль захвата звука на переднем конце или возле переднего конца выступающего участка.
(15) Устройство обработки информации по (14), содержащее
множество модулей захвата звука, и
корпус имеет, на каждом из множества углов по существу прямоугольной поверхности, выступающий участок в заданной области, содержащей этот угол, и удерживает модули захвата звука на переднем конце или возле переднего конца указанного выступающего участка.
(16) Устройство обработки информации по (14) или (15), содержащее:
ремешок, конфигурированный для удержания корпуса относительно руки пользователя, при этом
когда устройство обработки информации надето на руку пользователя, этот ремешок содержит модуль захвата звука, отличный от указанных модулей захвата звука и находящийся в позиции, по существу симметричной корпусу, относительно руки пользователя.
(17) Устройство обработки информации по (1), в котором
указанный держатель представляет собой конструкцию типа оправы очков, носимых на голове пользователя, и
эта оправа имеет выступающий участок по меньшей мере в передней части и удерживает модуль захвата звука на переднем конце или возле переднего конца выступающего участка.
(18) Устройство обработки информации по (17), в котором
оправа имеет выступающий участок на перемычке между линзами очков или возле этой перемычки и удерживает модуль захвата звука на переднем конце или возле переднего конца выступающего участка.
Список позиционных обозначений
10 - устройство обработки информации
13 - модуль разложения на частотные составляющие
15 - модуль оценки мощности в канале
16 - модуль вычисления коэффициентов фильтрации
17 - модуль фильтрации
18 - модуль объединения частотных составляющих
110 – 113 - модуль захвата звука
60 - устройство обработки информации
65 - модуль оценки мощности в канале
651 - модуль оценки входной мощности
653 - модуль оценки мощности некоррелированной составляющей
655 - модуль оценки мощности случайных шумов
66 - модуль вычисления коэффициентов фильтрации.
Изобретение относится к акустике. Носимое устройство для обработки звуковой информации содержит первое устройство захвата звука; второе устройство захвата звука выполненное отлично от первого устройства захвата звука, средство индикации, выполненное с возможностью сообщения заданной информации посредством свечения с заданным мерцанием. Держатель, выполненный с возможностью удержания первого устройства захвата звука, второго устройства захвата звука и средства индикации устройства. Устройство обработки сигналов, выполненное с возможностью извлечения речи, произносимой пользователем, когда элемент держателя надет на шею пользователя, на основе акустического звука захваченного первым устройством захвата звука и акустического звука захваченного вторым устройством захвата звука. При этом элемент держателя имеет форму частично открытого кольца и выступающий участок обтекаемой формы по меньшей мере на части конца выступающего участка. Когда элемент держателя надет на шею пользователя, элемент держателя удерживает первое устройство захвата звука обращенным, по существу, по направлению вертикально вверх, а второе устройство захвата звука обращенным, по существу, вперед от пользователя. Технический результат – повышение качества звука в средах, где шумы возникают случайным образом. 8 з.п. ф-лы, 25 ил.
1. Носимое устройство для обработки звуковой информации, содержащее:
первое устройство захвата звука; и
второе устройство захвата звука, выполненное отлично от первого устройства захвата звука;
отчетное устройство, выполненное с возможностью сообщения заданной информации посредством свечения с заданным мерцанием;
держатель, выполненный с возможностью удержания первого устройства захвата звука, второго устройства захвата звука и отчетного устройства;
устройство обработки сигналов, выполненное с возможностью извлечения речи, произносимой пользователем, когда элемент держателя надет на шею пользователя, на основе акустического звука, захваченного первым устройством захвата звука и акустического звука захваченного вторым устройством захвата звука; при этом
элемент держателя имеет форму частично открытого кольца и выступающий участок обтекаемой формы по меньшей мере на части конца выступающего участка, и
когда элемент держателя надет на шею пользователя, элемент держателя удерживает первое устройство захвата звука обращенным, по существу, по направлению вертикально вверх, а второе устройство захвата звука обращенным, по существу, вперед от пользователя.
2. Носимое устройство по п. 1, дополнительно содержащее устройство ввода, выполненное с возможностью приема входной информации от пользователя.
3. Носимое устройство по п. 1, дополнительно содержащее устройство связи, выполненное с возможностью связи с внешним устройством и предоставления извлеченного голоса.
4. Носимое устройство по п. 1, в котором
устройство обработки сигналов выполнено с возможностью подавления первого компонента шума акустического звука, поступающего на первое устройство захвата звука в заданном направлении, на основании акустического звука, захваченного каждым из первого устройства захвата звука и второго устройства захвата звука.
5. Носимое устройство по п. 4, в котором
устройство обработки сигналов выполнено с возможностью оценки уровня сигнала каждого частотного компонента акустического звука на основе акустического звука, захваченного первым устройством захвата звука и вторым устройством захвата звука и подавления компонента звука на основе результата оценки уровня сигнала.
6. Носимое устройство по п. 1, в котором
элемент держателя выполнен с возможностью удержания множества устройств захвата звука так, что расстояния, между заданными источниками звука и по меньшей мере двумя устройствами захвата звука из множества устройств захвата звука, отличаются друг от друга.
7. Носимое устройство по п. 1, в котором
элемент держателя выполнен с возможностью удержания множества устройств захвата звука так, что каждое из по меньшей мере двух устройств захвата звука из множества устройств захвата звука расположены во взаимно разных направлениях относительно заданного источника звука.
8. Носимое устройство по п. 1, в котором
указанный элемент держателя представляет собой конструкцию типа оправы очков, носимых на голове пользователя, а
указанная оправа имеет выступающий участок по меньшей мере в передней части и выполнена с возможностью удержания модуля захвата звука на переднем конце или возле переднего конца выступающего участка.
9. Носимое устройство по п. 8, в котором
оправа имеет выступающую часть на перемычке между линзами очков или возле указанной перемычки и выполнена с возможностью удержания модуля захвата звука на переднем конце или возле переднего конца выступающей части.
US 2008201138 A1, 21.08.2008 | |||
US 20050027515 A1, 03.02.2005 | |||
JP 2014116648 A, 26.06.2014 | |||
WO 2015003220 A1, 15.01.2015 | |||
US 6285757 B1, 04.09.2001 | |||
СПОСОБ И УСТРОЙСТВО ФОРМИРОВАНИЯ ИЗОБРАЖЕНИЯ ДЛЯ РАСПОЗНАВАНИЯ НАПРАВЛЕНИЯ РАСПРОСТРАНЕНИЯ ЗВУКА РЕЧИ | 2006 |
|
RU2345422C2 |
US 20150078555 A1, 19.03.2015 | |||
Способ защиты переносных электрических установок от опасностей, связанных с заземлением одной из фаз | 1924 |
|
SU2014A1 |
CN 202998463 U, 12.06.2013 | |||
US 20020193130 A1, 19.12.2002 | |||
US 20080037801 A1, 14.02.2008 | |||
US 2015280763 A1, |
Авторы
Даты
2020-07-24—Публикация
2016-10-06—Подача