ПРИКЛАДНОЕ ИСПОЛЬЗОВАНИЕ СИСТЕМЫ ГОЛОС/ЗВУКОВОЕ СОПРОВОЖДЕНИЕ (Г/ЗС) Российский патент 2005 года по МПК H04H1/02 

Описание патента на изобретение RU2257676C2

Область техники, к которой относится изобретение

Варианты осуществления настоящего изобретения относятся, в целом, к способу и устройству для обработки аудиосигналов и, в частности, к способу и устройству для обработки аудиосигналов для использования в прикладных целях.

Уровень техники

Конечные пользователи высококлассной или дорогостоящей аппаратуры, содержащей многоканальные усилители и многоканальные акустические системы, в настоящее время имеют ограниченные возможности регулировки громкости сигнала центрального канала многоканальной аудиосистемы независимо от аудиосигналов на других каналах. Поскольку во многих фильмах для озвучивания основного диалога используется центральный канал, а для остальных звуковых эффектов используются другие каналы, такая функция ограниченной регулировки позволяет пользователю увеличивать амплитуду канала основного диалога для повышения его разборчивости на протяжении громких фрагментов звуковых эффектов. Современная реализация этой ограниченной регулировки страдает существенными недостатками. Во-первых, эта функция регулировки доступна только тем конечным пользователям, которые располагают дорогостоящим проигрывателем цифровых универсальных дисков (DVD, ЦУД) и многоканальной акустической системой, например, шестиканальной акустической системой домашнего кинотеатра, которая позволяет регулировать уровень громкости любой колонки независимо от других. Таким образом, пользователь, который не может позволить себе приобрести такую систему, не в состоянии прослушивать запись или транслируемую программу с возможностью увеличивать амплитуду канала основного диалога, чтобы сделать его более разборчивым.

Во-вторых, эта регулировка рассчитана только на одного потребителя. Например, уровень основного диалога относительно фона, выбранный пользователем для обеспечения нужной ему разборчивости речи, может не удовлетворять других людей, находящихся в помещении. Таким образом, несколько слушателей, имеющих разные слушательские предпочтения, не могут одновременно пользоваться этой функцией регулировки.

Кроме того, такая регулировка требует непрерывной перенастройки при переходах предпочтительного аудиосигнала или голосового диалогового сигнала (на центральном канале) и сигнала звукового сопровождения (на всех остальных каналах). Наконец, недостаток заключается в том, что настройки отношений голос/звуковое сопровождение (Г/ЗС), приемлемые для одного аудиофрагмента кинопрограммы, могут оказаться негодными для другого аудиофрагмента в случае чрезмерного увеличения уровня звукового сопровождения, или чрезмерного снижения уровня диалога.

Следует учитывать тот факт, что подавляющее большинство конечных пользователей не имеют и многие годы не будут иметь домашнего кинотеатра, в котором предусмотрена такая функция регулировки, т.е. декодера Dolby Digital, шестиканального усилителя с регулируемым усилением и многоканальной акустической системы. Кроме того, конечные пользователи не могут обеспечить сохранения на протяжении всей программы того отношения Г/ЗС, которое было выбрано в начале программы.

На фиг.3 изображена схема размещения элементов обычного домашнего кинотеатра в помещении. Несмотря на отсутствие установленных правил, касающихся аудиопродукции, отвечающей системе 5.1 пространственных каналов, существуют промышленные стандарты. Используемый здесь термин “пространственные каналы” относятся к физическому размещению выходного устройства (например, колонок) и к тому, каким образом звук от выходного устройства достигает конечного пользователя. Один из этих стандартов требует, чтобы большая часть диалога размещалась на центральном канале 526. Другие звуковые эффекты, требующие пространственного позиционирования, должны размещаться на любых других четырех колонках, а именно, левой, правой, левой окружающего звука и правой окружающего звука, обозначенных, соответственно, Л 521, П 522, ЛО 523 и ПО 524. Кроме того, во избежание повреждения колонок промежуточного диапазона, низкочастотные эффекты (НЧЭ) размещаются на канале 0.1, приходящем на отдельную низкочастотную колонку 525. Цифровое сжатие аудиосигнала позволяет изготовителю предоставлять пользователю расширенный динамический диапазон звучания, невозможный при аналоговой передаче аудиосигнала. При таком расширенном динамическом диапазоне, основной диалог звучит слишком тихо на фоне очень громких звуковых эффектов. Для пояснения приведем такой пример. Предположим, динамический диапазон аналоговой передачи (или записи) составляет 95 дБ, а уровень диалога обычно составляет 80 дБ. В этом случае, громкие фрагменты звукового сопровождения могут заглушать диалог, когда сигналы звукового сопровождения достигают верхнего предела, превосходящего уровень речевого сигнала. Использование цифрового сжатия аудиосигнала еще больше обостряет эту ситуацию, поскольку обеспечивает динамический диапазон в 105 дБ. Очевидно, в этом случае громкое звуковое сопровождение воспроизводится более реалистично, за счет увеличения его амплитуды, но, на фоне других звуков, диалог остается на том же уровне (80 дБ). Пользователи DVD часто жалуются на слишком низкий уровень записи диалога. На самом деле, диалог записан на нужном уровне и звучит более достоверно и реалистично, чем в аналоговых записях с ограниченным динамическим диапазоном.

Даже для потребителей, располагающих в настоящее время правильно отрегулированными системами домашнего кинотеатра, диалог часто заглушается громкими фрагментами звукового сопровождения на многих DVD-фильмах, выпущенных в настоящее время. Лишь малая группа потребителей способна в некоторой степени повышать разборчивость звучания, увеличивая громкость центрального канала и/или снижая громкость всех остальных каналов. Однако, такая фиксированная регулировка приемлема лишь для некоторых фрагментов аудиосигнала, в результате чего уровни уходят от нужной настройки. Настройку уровней колонок обычно производят таким образом, чтобы обеспечить определенный уровень звукового давления (УЗД) в точке размещения зрителя. Эта правильная настройка обеспечивает максимально реалистичное звучание. К сожалению, при этом громкие звуки воспроизводятся очень громко. Однако, любая регулировка уровней колонок будет нарушать настройку.

Сущность изобретения

Способ предоставления многочисленным пользователям возможности регулировать соотношение голос/звуковое сопровождение (Г/ЗС) заключается в том, что принимают в первом декодере голосовой сигнал и сигнал звукового сопровождения и, одновременно, принимают во втором декодере голосовой сигнал и сигнал звукового сопровождения, причем прием сигналов голоса и звукового сопровождения осуществляют по отдельности; и раздельно регулируют в каждом из декодеров принимаемые по отдельности сигналы голоса и звукового сопровождения.

Краткое описание чертежей

Фиг.1 иллюстрирует общий подход, согласно настоящему изобретению, к отделению полезной голосовой информации от общего фонового аудиосигнала в записанной или транслируемой программе.

Фиг.2 иллюстрирует иллюстративный вариант осуществления настоящего изобретения, касающийся приема и воспроизведения кодированных сигналов программы.

Фиг.3 иллюстрирует соответствующую регулировку пространственного позиционирования обычной системы домашнего кинотеатра.

Фиг.4 иллюстрирует блок-схему системы одновременного вещания аудиосигнала многочисленным пользователям с возможностью регулировки голос/звуковое сопровождение (Г/ЗС), согласно варианту осуществления настоящего изобретения.

Фиг.5 иллюстрирует вариант осуществления многоканальной передачи согласно настоящему изобретению.

Фиг.6 иллюстрирует альтернативный вариант осуществления настоящего изобретения.

Фиг.7 иллюстрирует альтернативный вариант осуществления настоящего изобретения.

Фиг.8 иллюстрирует альтернативный вариант осуществления настоящего изобретения, который предусматривает обработку сигналов для многоканального представления.

Фиг.9 иллюстрирует альтернативный вариант осуществления настоящего изобретения.

Фиг.10 иллюстрирует вариант осуществления, предусматривающий суммирование и плавную регулировку голосовой составляющей и составляющей звукового сопровождения с помощью одного регулятора.

Фиг.11 иллюстрирует альтернативный вариант осуществления настоящего изобретения, предусматривающий использование авто-Г/ЗС.

Фиг.12 иллюстрирует вариант осуществления настоящего изобретения, предусматривающий использование многофункционального ползункового регулятора.

Фиг.13 иллюстрирует логическую блок-схему работы многофункционального ползункового регулятора.

Фиг.14 иллюстрирует альтернативный вариант осуществления настоящего изобретения.

Фиг.15 иллюстрирует альтернативный вариант осуществления настоящего изобретения.

Фиг.16 иллюстрирует блок регулировки Г/ЗС для использования в пассажирских самолетах, согласно варианту осуществления настоящего изобретения.

Фиг.17 иллюстрирует альтернативный вариант осуществления настоящего изобретения.

Фиг.18 иллюстрирует альтернативный вариант осуществления настоящего изобретения.

Фиг.19 иллюстрирует конфигурацию наушников согласно варианту осуществления настоящего изобретения.

Фиг.20 иллюстрирует вариант осуществления, предусматривающий возможность возврата к исходному микшированию наряду с возможностью для конечного пользователя регулировать Г/ЗС согласно принципам настоящего изобретения.

Фиг.21 иллюстрирует вариант осуществления, альтернативный по отношению к показанному на фиг.20.

Фиг.22 иллюстрирует процесс формирования программы согласно варианту осуществления настоящего изобретения.

Фиг.23 иллюстрирует альтернативный вариант осуществления настоящего изобретения.

Фиг.24 иллюстрирует среду многоканального прослушивания, в которой находится пользователь.

Фиг.25 иллюстрирует применение системы Г/ЗС и авто-Г/ЗС к головным телефонам с многоканальной обработкой согласно принципам настоящего изобретения.

Фиг.26 иллюстрирует традиционные процессы воспроизведения.

Фиг.27 иллюстрирует альтернативный вариант осуществления настоящего изобретения.

Фиг.28 иллюстрирует альтернативный вариант осуществления настоящего изобретения.

Подробное описание

Настоящее изобретение относится к способу и устройству для обеспечения функции голос/звуковое сопровождение. Кроме того, изобретение обеспечивает технологические, эргономические, экономические и прикладные усовершенствования за счет использования функций голос/звуковое сопровождение (Г/ЗС) и авто-Г/ЗС. Функция Г/ЗС предусматривает индивидуальную регулировку отношения голосового сигнала аудиопрограммы к звуковому сопровождению путем раздельной и независимой регулировки громкости вокала (речевого или голосового сигнала) и громкости звукового сопровождения (которое может включать в себя музыку, звуковые эффекты, смех или другие неречевые звуки, входящие в состав полной аудиопрограммы). Функция авто-Г/ЗС или автоподстройка Г/ЗС предусматривает автоматическую регулировку отношения Г/ЗС, при которой переходы программы (например, взрыв) не заглушают голос.

Значение отношения предпочтительного аудиосигнала к звуковому сопровождению

В основе настоящего изобретения лежит осознание того, что диапазон слушательских предпочтений, касающихся отношения предпочтительного аудиосигнала к любому звуковому сопровождению, достаточно велик и даже больше, чем ожидалось.

Это важное открытие является результатом тестирования малой выборки населения в отношении их предпочтений относительно отношения уровня предпочтительного аудиосигнала к уровню сигнала всего звукового сопровождения.

Особенности регулировки в соответствии с диапазоном предпочтений для слабослышащих или нормальных слушателей

Для того чтобы понять, как нормальные и слабослышащие пользователи воспринимают соотношение между диалогом и звуковым сопровождением при прослушивании аудиопрограмм разных типов, были проведены тщательные исследования. Было обнаружено, что население значительно различается в отношении предпочтений в регулировке голоса относительно звукового сопровождения. Было проведено два эксперимента на случайной выборке населения, включая учащихся начальной школы, учащихся средней школы, граждан среднего возраста и пожилых граждан. Всего было протестировано 71 человек. Тест состоял в том, что пользователю предлагали отрегулировать уровень голоса и уровень звукового сопровождения при просмотре футбольного матча (где звуковое сопровождение представляло собой шум толпы) и при прослушивании популярной песни (где звуковое сопровождение представляло собой музыку). Для каждого варианта выбора была сформирована метрика, именуемая отношением Г/ЗС (голоса к звуковому сопровождению) и полученная делением линейного значения громкости диалога или голоса на линейное значение громкости звукового сопровождения.

В результате этого тестирования выяснились некоторые факты. Во-первых, не нашлось двух людей, которые выбрали бы одинаковое отношение голоса к звуковому сопровождению ни для спортивных, ни для музыкальных программ. Это очень важный результат, опровергающий общепринятое мнение, будто создатели программ способны обеспечить приемлемое для всех Г/ЗС (не подлежащее регулировке со стороны потребителя). Результаты тестирования показали, что это невозможно. Во-вторых, хотя люди с нарушениями слуха обычно выбирают более высокие Г/ЗС (для повышения разборчивости), люди с нормальным слухом также предпочитают не те отношения, которые в настоящее время обеспечивают создатели программ.

Следует также обратить внимание на тот факт, что любое устройство, предусматривающее регулировку Г/ЗС, чтобы удовлетворить значительную часть населения, должно обеспечивать, по меньшей мере, те пределы регулировки, которые были выявлены на основании проведенных тестов. Поскольку на видео и в домашнем кинотеатре можно смотреть самые разные программы, отношение должно принимать значения от, по меньшей мере, самого низкого отношения для любого вида программ (музыка или спорт) до самого высокого отношения для музыки и спорта. Эти пределы составляют от 0,1 до 20,17 или, в децибелах, 46 дБ. Следует также отметить, что тестированию была подвергнута лишь выборка населения и что диапазон регулировки, в принципе, должен быть бесконечным, поскольку весьма вероятно, что среди зрителей спортивных программ найдется человек, который не желает слушать шум толпы, или человек, не желающий слушать комментатора. Заметим, что такого рода исследования и особое внимание к обеспечению широкого диапазона регулировки отношений Г/ЗС не отражено в уровне техники и не обсуждался в литературе.

В ходе этого тестирования выбрали группу людей старшего возраста и попросили их установить соотношение (этот тест был позже проведен на группе студентов) между фиксированным фоновым шумом и голосом комментатора, причем последний можно было изменять, а первый был установлен на уровне 6,00. Тестирование старшей группы дало следующие результаты:

Таблица IИспытуемыйУстановка17,5024,5034,0047,5053,0067,0076,5087,7595,50107,00115,00

Чтобы дополнительно проиллюстрировать тот факт, что люди всех возрастов имеют различные потребности и предпочтения в слышимости, была выбрана группа из 21 студента колледжа, которым предложили прослушать смесь голоса и фона и выбрать, однократно отрегулировав уровень голоса, отношение голоса к фону. Фоновый шум, в данном случае, шум толпы на футбольном матче, был зафиксирован на уровне шести (6,00), и студентам предлагалось отрегулировать громкость голоса комментатора, который был записан отдельно и представлял собой чистый или практически чистый голос. Другими словами, студенты должны были пройти тот же тест, что и группа людей старшего возраста. Студенты были выбраны для того, чтобы минимизировать долю результатов, обусловленных недостатками слуха, связанными с возрастом. Всем студентам было чуть меньше двадцати или слегка за двадцать. Тестирование дало следующие результаты:

Таблица IIСтудентУстановка голоса14,7523,7534,2544,5055,2065,7574,2586,7093,25106,00115,00125,25133,00144,25153,25163,00176,00182,00194,00205,50216,00

Возраст участников старшей группы (результаты тестирования которой приведены в Таблице I) колебался от 36 до 59 лет с преобладанием лиц в возрасте от 40 до 50 лет. Из результатов теста можно выявить тенденцию к возрастанию средней установки,

свидетельствующую о некотором ухудшении слуха. Диапазон вновь проходит от 3,00 до 7,75 с разбросом 4,75, который подтверждает обнаруженный диапазон расхождения предпочтительного для людей отношения голоса к фону или любого предпочтительного сигнала к звуковому сопровождению (ПС/ЗС). Общий разброс установок громкости для обеих групп испытуемых находится в пределах от 2,0 до 7,75. Эти уровни представляют фактические значения на механизме регулировки громкости, используемом для осуществления этого эксперимента. Они обеспечивают указание диапазона значений сигнал/шум (при сравнении с уровнем “шума” 6,00), который может быть желательным для разных пользователей.

Чтобы лучше понять, как это соотносится с вариациями относительной громкости, выбираемой разными пользователями, учтем, что изменение нелинейной регулировки громкости от 2,0 до 7,75 выражает увеличение на 20 дБ или в десять (10) раз. Таким образом, даже для такой малой выборки населения и одного типа аудиопрограммы, было обнаружено, что разные слушатели предпочитают совершенно разные уровни “предпочтительного сигнала” относительно “звукового сопровождения”. Это предпочтение наблюдается в разных возрастных группах, показывая, что оно согласуется с индивидуальным предпочтением и основными слуховыми возможностями, что до сих пор вовсе нельзя было предположить.

Как показывают результаты тестирования, диапазон выбора для студентов (что видно из Таблицы II), не страдающих недостатками слуха, связанными с возрастом, заключен в границах от низкой установки 2,00 до высокой 6,70 с разбросом 4,70, который составляет почти половину полного диапазона от 1 до 10. Тест демонстрирует несостоятельность представлений о возможности универсальной регулировки большинства записанных и транслируемых аудиосигналов, если дать возможность отдельному слушателю регулировать смешение сигналов в соответствии с его собственными предпочтениями и слуховыми потребностями. Разброс в установках, выбранных студентами, оказался столь же широким, как и для старшей группы, что демонстрирует индивидуальные различия в предпочтениях и слуховых потребностях. Один из результатов этого теста состоит в том, что слуховые предпочтения разных людей сильно отличаются.

Дальнейшее тестирование подтвердило этот результат на более обширной группе выборки. Кроме того, результаты различаются в зависимости от типа аудиосигнала. Например, как показано на фиг.3, когда источником аудиосигнала была музыка, отношение голоса к звуковому сопровождению колебалось примерно от нуля до 10, а когда источником аудиосигнала была спортивная программа, это отношение колебалось примерно от нуля до 20. Кроме того, по сравнению с музыкой, стандартное (среднеквадратичное) отклонение увеличивалось примерно в три раза, а среднее значение возрастало более чем вдвое.

Окончательный результат вышеописанного тестирования состоит в том, что, если один человек выберет отношение предпочтительного аудиосигнала к звуковому сопровождению и зафиксирует его на постоянной основе, то, скорее всего, он создаст аудиопрограмму, которая не будет удовлетворять значительную долю населения. Кроме того, согласно вышесказанному, оптимальное отношение может представлять собой функцию времени, которая изменяется быстро или медленно. Следовательно, для удовлетворения слушательских потребностей “нормальных” слушателей, т.е. не страдающих нарушениями слуха, желательно иметь возможность в полном объеме управлять отношением предпочтительного аудиосигнала к звуковому сопровождению. Кроме того предоставление конечному пользователю максимально регулировать это отношение позволяет конечному пользователю оптимизировать свое восприятие при прослушивании.

Очевидным выражением одного аспекта настоящего изобретения является независимая регулировка конечным пользователем предпочтительного аудиосигнала и звукового сопровождения. Чтобы проиллюстрировать подробности настоящего изобретения, рассмотрим приложение, в котором предпочтительным аудиосигналом является полезная голосовая информация.

Формирование предпочтительного аудиосигнала и сигнала звукового сопровождения

Фиг.1 иллюстрирует общий подход к отделению полезной голосовой информации от общего фонового аудиосигнала в записанной или транслируемой программе. Прежде всего, директор программы должен определить полезный голос. В этом качестве следует выделять голос(а) актера, группы актеров или комментаторов.

Выделенные полезные голоса воспринимаются голосовым микрофоном 301. В качестве голосового микрофона 301 следует использовать либо микрофон ближнего действия (для комментаторов), либо линейный микрофон высокой направленности, применяемый в звукозаписи. Помимо узкой диаграммы направленности, эти микрофоны 301 должны иметь частотную характеристику, ограниченную голосовым диапазоном, предпочтительно 200-5000 Гц. Сочетание направленности и полосовой фильтрации минимизирует фоновый шум, акустически примешивающийся к полезной голосовой информации в процессе записи. При создании некоторых типов программ, вместо того, чтобы бороться с акустическим смешением, можно записывать полезный голосовой сигнал диалога отдельно, а затем объединять диалог с видеосоставляющей программы. Фоновые микрофоны 302 должны иметь весьма широкую полосу частот для обеспечения высокого качества фоновой аудиоинформации, например, музыки.

Камера 303 используется для обеспечения видеосоставляющей программы. Аудиосигналы (голос и полезный голос) кодируются совместно с видеосигналом в кодере 304. Обычно, для отделения аудиосигнала от видеосигнала используют разные несущие частоты для модуляции. Поскольку вещание в настоящее время осуществляется, в основном, в стерео-режиме, один способ кодирования полезной голосовой информации совместно с фоном состоит в мультиплексировании полезной голосовой информации на отдельных стереоканалах, в сущности, таким же образом, как левый передний и правый передний каналы добавляются к двухканальному стереофоническому сигналу для получения квадрафонической дисковой записи. Хотя для этого понадобился бы дополнительный диапазон вещания, при записи программ проблем не возникает, поскольку тракт аудиосигнала в проигрывателях видеодисков или лент предусматривает демодуляцию полезной голосовой информации.

После кодирования сигналов любыми приемлемыми средствами, кодированные сигналы поступают на вещательную систему 305 для передачи через антенну 313 или на записывающую систему 306 для записи на ленту или диск. В случае записи аудиовидеоинформации, фоновую и голосовую информацию можно просто размещать на разных дорожках записи.

Прием и демодуляция предпочтительного аудиосигнала и сигнала звукового сопровождения

На фиг.2 показан иллюстративный вариант осуществления приема и воспроизведения кодированных сигналов программы. Приемная система 307 принимает транслируемый сигнал и демодулирует кодированные аудио/видео-сигналы, передаваемые на главной несущей частоте. При воспроизведении записанной программы 314, кодированные аудио/видео-сигналы считываются головками видеомагнитофона или лазерным устройством чтения проигрывателя 308 компакт-дисков.

В любом случае, эти сигналы поступают на декодирующую систему 309. Декодер 309 разделяет сигналы на видеосигнал, голосовой аудиосигнал и фоновый аудиосигнал, используя стандартные методы декодирования, например, амплитудное детектирование в сочетании с демодуляцией в режиме частотного или временного разделения. Фоновый аудиосигнал поступает на отдельный усилитель 310 с регулируемым усилением, который слушатель может настраивать по своему усмотрению. Голосовой сигнал поступает на усилитель 311 с регулируемым усилением, который слушатель может регулировать в соответствии со своими личными потребностями, что обсуждалось выше.

Два отрегулированных сигнала поступают на суммирующий усилитель 312 с единичным усилением, который суммирует их, выдавая конечный выходной аудиосигнал. Альтернативно, два отрегулированных сигнала поступают на суммирующий усилитель 312 с единичным усилением, и суммарный сигнал регулируют усилителем 315 с регулируемым усилением, который выдает конечный выходной аудиосигнал. Таким образом, в процессе воспроизведения аудиопрограммы, слушатель может регулировать уровень полезного голоса относительно уровня фона, добиваясь оптимального звучания аудиопрограммы в соответствии со своими личными требованиями к прослушиванию. Неоднократно воспроизводя один и тот же аудиосигнал, один и тот же слушатель может всякий раз переустанавливать отношение по причине изменения своего слухового восприятия, и гибкость регулировки позволяет сколько угодно раз изменять установку.

Варианты осуществления Г/ЗС и авто-Г/ЗС

Согласно вышесказанному, предпочтительное отношение голоса к звуковому сопровождению значительно различается для разных людей и различается для разных типов программ (например, для спортивных и музыкальных). На фиг.4 изображена блок-схема, иллюстрирующая систему Г/ЗС для одновременного использования несколькими пользователями, согласно варианту осуществления настоящего изобретения. Согласно фигуре, система 400 содержит приемопередатчик 210 и многочисленные воспроизводящие устройства, например, устройства 220 индивидуального прослушивания (УИП). Хотя на фигуре показано только три УИП, количество УИП не ограничивается сущностью и объемом настоящего изобретения.

Приемопередатчик 210 содержит приемный компонент 223 и передающий компонент 222 и принимает транслируемый или записанный сигнал 235. Согласно одному варианту осуществления настоящего изобретения, сигнал 235 содержит раздельные составляющую голосового сигнала и составляющую звукового сопровождения, которые одновременно поступают в приемопередатчик 210. Эти сигналы могут декодироваться декодером (не показан) перед дальнейшей обработкой. Альтернативно, сигнал 235 может обрабатываться системными компонентами и схемами, входящими в состав передатчика 222 для формирования отдельной голосовой составляющей 239 и отдельной составляющей 240 звукового сопровождения.

Передатчик 221 передает раздельные составляющие голоса и звукового сопровождения на каждое УИП посредством беспроводной или инфракрасной передачи или посредством многопроводной передачи. Эти сигналы принимаются приемником 231 УИП, который может представлять собой, например, инфракрасный приемник, беспроводной радиочастотный РЧ-приемник или входное гнездо многоканального аудиосигнала в случае проводного соединения. Один из выходных сигналов приемника 231 УИП, а именно, принятый голосовой сигнал 239, поступает на отдельный усилитель с регулируемым усилением 229, настройку которого конечный пользователь может производить по своему усмотрению.

Другой выходной сигнал, а именно, принятый сигнал 240 звукового сопровождения, поступает на усилитель 230 с регулируемым усилением, настройку которого слушатель может производить по своему усмотрению. Эти отрегулированные сигналы поступают в сумматор 228, и суммарный сигнал прежде, чем поступить в преобразователь 226, может также проходить через усилитель 227 с регулируемым усилением для дополнительной регулировки. Преобразователь преобразует электрический сигнал, поступающий от усилителя 227 с регулируемым усилением, в слышимый акустический аудиосигнал 232.

Согласно рассмотренному выше вариант осуществления, показанный на фиг.4, предусматривает передачу двух (или более) сигналов, из которых, по меньшей мере, один сигнал является чисто речевым или практически чисто речевым сигналом (голос), а другой(ие) сигнал(ы) содержит(ат) звуковое сопровождение (которое также может содержать отдельные речевые составляющие). Если звуковое сопровождение содержит речевые составляющие, отношение Г/ЗС можно сделать только более положительным, чтобы повысить разборчивость диалога.

При наличии нескольких пользователей в одной и той же среде прослушивания, для осуществления раздельной регулировки Г/ЗС, каждого пользователя нужно обеспечить устройством индивидуального прослушивания (УИП), в качестве которого может выступать, но не исключительно, головной телефон, слуховой аппарат, кохлеарный имплантант, вспомогательное устройство прослушивания, глазная гарнитура или головная гарнитура со встроенными динамиками. Такая глазная гарнитура может включать в себя, например, очки, снабженные динамиками, микрокомпьютер. Термин УИП, используемый в данном контексте, означает устройство воспроизведения аудиосигнала, способное принимать электрический или беспроводной сигнал и преобразовывать его в слышимый звук, который не мешает другим слушателям, находящимся в той же общей среде.

После приема двух (или более) сигналов в устройстве индивидуального прослушивания, сигналы раздельно регулируются посредством независимых регуляторов громкости (или регуляторов других типов, описанных ниже) для достижения предпочтительного Г/ЗС для отдельного пользователя. Затем сигналы объединяются и дополнительно усиливаются и регулируются, после чего преобразуются устройством индивидуального прослушивания в слышимый звук. Поскольку пользователь устройства индивидуального прослушивания не испытывает помех от других людей, находящихся в той же среде прослушивания, которые также могут пользоваться устройствами индивидуального прослушивания (с другой установкой предпочтительного Г/ЗС), то несколько слушателей, находящихся в одной и той же среде, могут независимо регулировать Г/ЗС по своему усмотрению. Для этого используется одновременная передача (проводная или беспроводная) сигналов всем слушателям. Такую технологию можно применять в общественном кинотеатре. Зрители, сидящие в зале, могут смотреть кинофильм, независимо регулируя Г/ЗС на своих наушниках, вспомогательных устройствах прослушивания (ВУП), слуховых аппаратах или иных устройствах индивидуального прослушивания, рассмотренных выше. Для иллюстрации принципов, отраженных на фиг.4, обратимся к нижеследующему краткому описанию.

Передача в аудиторию

Чтобы каждый конечный пользователь мог независимо регулировать уровень голоса относительно звукового сопровождения, сигналы должны поступать на устройство индивидуального прослушивания либо по отдельности, либо таким образом (возможно, в кодированном виде), чтобы два сигнала можно было разделить прежде, чем подвергнуть их независимой регулировке. Передачу двух сигналов можно осуществлять, например, в режиме ЧМ-стерео, передавая по одному из каналов (левому или правому) голосовой сигнал, по другому каналу - звуковое сопровождение. В случае необходимости прослушивать через УИП стерео-программу, требуется более сложная, многоканальная передача. Если голосовой сигнал и сигнал звукового сопровождения содержат пространственную информацию, то для представления конечному пользователю многоканальной программы требуется четырехканальная передача (проводная либо беспроводная).

Фиг.5 иллюстрирует один из возможных вариантов осуществления такой многоканальной передачи в соответствии с принципами настоящего изобретения. Левый голосовой канал и правый голосовой канал мультиплексируются (или, альтернативно, кодируются) в мультиплексоре 9, как и левый канал звукового сопровождения и правый канал звукового сопровождения в мультиплексоре 10. Это позволяет с помощью проводных или беспроводных средств связи 12 принимать в стереоприемнике 13 двухканальный стереосигнал, передаваемый передатчиком 11. Затем независимо осуществляется извлечение и регулировка 16 четырех сигналов для формирования полных левого 17 и правого 18 каналов, содержащих пространственную информацию голосового сигнала и сигнала звукового сопровождения. Существует много способов передачи этих сигналов с возможностью раздельной регулировки и сохранения пространственной информации. Альтернативно, можно передавать левый и правый каналы звукового сопровождения совместно с отдельным голосовым моноканалом (поскольку вокальная информация, в большинстве случаев, не носит пространственного характера).

Регулировка центрального канала

В продолжение вышеприведенного рассмотрения, рассмотрим возможность регулировки Г/ЗС при передаче центрального канала, входящего в состав многоканальной программы. При создании многоканальной программы, центральный канал используют для основного диалога фильма. Для основных звуковых эффектов и музыки используются один или несколько других аудиоканалов 4.1. В настоящее время, чисто голосовой канал недоступен широкой публике. Поэтому, пока чисто голосовой канал недоступен широкой публике для большинства транслируемых и записанных программ, в качестве вышеописанного голосового канала можно использовать центральный канал. Таким образом, приемник, изображенный на фиг.4, может представлять собой многоканальный звуковой декодер, например. Digital Theater Sound (DTS) (окружающий звук цифрового (домашнего) театра), Sony Dynamic Digital Sound (SDDS) (система динамического цифрового звука фирмы Sony, Dolby Digital (цифровой декодер Долби) или иной декодер многоканального формата. Такой декодер 19, согласно фиг.6, преобразует цифровой входной сигнал в аналоговые выходные сигналы левого, правого, левого окружающего звука, правого окружающего звука, центрального и низкочастотного каналов. Смеситель 20 может объединять все каналы, кроме центрального (в разных отношениях, зависящих от желаемого пространственного эффекта), и его выходной сигнал представляет собой канал моно- либо стереосигнала, который передается (21) по отдельности и одновременно с центральным каналом, который является приближением чисто диалогового канала. Прием осуществляется в соответствии с фиг.4.

Декодер в составе устройства индивидуального прослушивания и обеспечение пространственной обработки

Заметим, что, хотя вариант осуществления, представленный на фиг.6 совместно с фиг.4, предусматривает передачу аналоговых сигналов на УИП, при наличии централизованного приемника или многоканального декодера, в пределах сущности и объема данного изобретения, многоканальный декодер может входить в состав УИП, что позволяет передавать цифровой сигнал, для извлечения голоса и звукового сопровождения из которого требуется декодирование. Этот подход проиллюстрирован на фиг.7. Цифровой сигнал, считываемый из источника программ, например, с DVD, CD, TIVO или ленты, или принимаемый от вещателя (цифровое телевидение или цифровое радио), передается 22 непосредственно на УИП 28. УИП содержит встроенный приемник 23 для приема инфракрасного, радио или иного транслируемого сигнала, который поступает в декодер 24, отвечающий техническим условиям декодирования, соответствующим формату сжатия, на котором он работает, например, Dolby Digital или DTS. Смеситель 26 использует выходные сигналы декодера для генерации сигнала звукового сопровождения и голосового сигнала (чисто голосового сигнала либо сигнала центрального канала), которые регулируются пользователем по отдельности посредством усилителей с регулируемым усилением и/или аттенюаторов 25, а затем объединяются, согласно вышеописанному, и преобразуются (27) в слышимый аудиосигнал, который является выходным сигналом УИП. Этот конкретный вариант осуществления облегчает многоканальное представление аудиопрограммы на УИП, поскольку передаваемый сигнал является цифровым (менее подвержен шумам) и требует только одного канала передачи, но может приводить к дополнительным затратам, поскольку процесс декодирования осуществляется на каждом отдельном УИП, а не централизованно. Многоканальное представление может включать в себя любую обработку сигналов, которая перераспределяет в пространстве представления левого, левого окружающего звука, правого, правого окружающего звука и центрального каналов для обеспечения более естественных ощущений в УИП, например, в наушниках. Регулировка Г/ЗС предусмотрена в сочетании с этим типом обработки для обеспечения повышения разборчивости диалога без влияния на любую пространственную обработку, производимую в дополнение к микшированию Г/ЗС, регулируемому пользователем.

На фиг.8 более подробно представлен один возможный вариант осуществления, предусматривающий пространственную обработку для многоканального представления. Приемник 29 и декодер 30 являются либо общими, либо входящими в состав УИП, в зависимости от варианта осуществления, предпочтительного для реализации. Регулировка 31 центрального канала или другого чисто голосового канала осуществляется отдельно, до пространственной обработки, равно как и регулировка 32 общего уровня сигнала звукового сопровождения. Блок 33 пространственной обработки принимает многоканальное представление (или, в некоторых случаях, двухканальное представление) в том виде, в каком оно было первоначально записано, и генерирует более реалистичную звуковую сцену для УИП. В этом случае регулировка Г/ЗС не влияет на пространственную обработку в блоке 33, но, тем не менее, позволяет пользователю выбирать нужный уровень голоса по отношению к звуковому сопровождению.

“Регуляторы громкости”, используемые для Г/ЗС (аттенюатор)

Физические механизмы регулировки голоса и звукового сопровождения и общей регулировки громкости имеют многочисленные варианты осуществления. Наиболее общий механизм регулировки предусматривает регулируемое пользователем усиление голоса, регулируемое пользователем усиление звукового сопровождения, и дополнительную регулировку усиления суммарного сигнала (общую регулировку громкости). Все эти возможности показаны на фиг.4. Когда пользователь желает устанавливать отношение Г/ЗС, а также общий уровень для комфортного прослушивания, следует воспользоваться дополнительным вариантом осуществления, который обеспечивает более удобный для пользователя механизм регулировки, позволяющий осуществлять регулировку за меньшее количество этапов. В большинстве представлений диалог является главным звуком, вокруг которого группируется программа. Поэтому, согласно фиг.9, общий уровень диалога определяет громкость программы, т.е. общий уровень программы обычно устанавливают, исходя из уровня диалога. Поэтому, имея только два регулятора (регулятор общего уровня громкости и аттенюатор сигнала звукового сопровождения), пользователь может выбирать нужный Г/ЗС и общий уровень громкости, выполняя простой двухэтапный процесс. Сначала устанавливают общий уровень при помощи общего регулятора 37 громкости (на фиг.9), тем самым регулируя уровень голоса в главной программе. Теперь, диалог находится на нужном уровне, и остается только установить Г/ЗС. Теоретически, имея на канале звукового сопровождения только аттенюатор, можно повышать разборчивость до 100%, снижая уровень сигнала звукового сопровождения и не затрагивая уровень голоса. Кроме того, аттенюатор можно реализовать с использованием регулируемого делителя напряжения, который не требует питания, но, тем не менее, позволяет пользователю регулировать отношение Г/ЗС до любого значения выше 0 дБ. Для дополнительной экономии энергии, основной регулятор 37 громкости, расположенный после сумматора 36, также можно реализовать в виде аттенюатора. В этом случае, усилитель 38 должен обладать достаточным коэффициентом усиления, чтобы подавать на преобразователь 39 наибольший уровень громкости, когда аттенюатор 37 пропускает полный сигнал без какого-либо деления напряжения. Согласно дополнительному варианту осуществления, регулятор 35 громкости может размещаться на голосовом канале, а не на канале звукового сопровождения, что позволило бы пользователю регулировать общий уровень программы как функцию уровня сигнала звукового сопровождения, а не диалога. Устанавливать на голосовом канале аттенюатор нежелательно, поскольку, в этом случае, не удастся получить положительные отношения Г/ЗС. Вместо этого нужно, в случае реализации данного варианта осуществления, размещать на голосовом канале активный усилительный каскад, что позволило бы в достаточной степени повышать уровень голосового сигнала по отношению к неизменному уровню сигнала звукового сопровождения для обеспечения достаточно большого положительного отношения Г/ЗС. Общая громкость в этом случае, как и раньше, регулируется общим регулятором громкости.

“Балансировка отношения”, реализуемая с помощью одного органа управления

Дополнительный вариант осуществления регулировки Г/ЗС и общей громкости, согласно настоящему изобретению, предусматривает ручку Г/ЗС, используемую в качестве единого регулятора с двумя входами. Этот регулятор с одной ручкой, в отличие от регуляторов уровня с двумя ручками и аттенюатора с одной ручкой, может регулировать баланс между голосом и звуковым сопровождением. Согласно фиг.10, голос и звуковое сопровождение суммируется и плавно регулируется единым регулятором 40 и дополнительно регулируется регулятором 41 усиления полного аудиосигнала (активный или аттенюатором). Сам по себе регулятор баланса широко применяется для регулировки перепада перед-зад или баланса право-лево в автомобильных или домашних стереосистемах. Главным отличием данного применения является то, что регулировке подлежит отношение составляющих аудиосигнала, а не распределение аудиосигнала между отдельными колонками. В действительности, при желании, для регулировки пространственного позиционирования аудиосигнала, можно реализовать дополнительные регуляторы типа баланса. Благодаря реализации регулятора Г/ЗС с одной ручкой, пользователь может в полном объеме регулировать Г/ЗС (доступны все отношения) с помощью одной ручки. Затем можно выставлять нужный уровень общей громкости.

Авто-Г/ЗС

Функция автоподстройки Г/ЗС позволяет конечному пользователю не только выставлять нужное отношение голоса к звуковому сопровождению, но и подстраивать отношение при переходных изменениях громкости голоса либо звукового сопровождения. Например, футбольный матч содержит диалог комментаторов и фоновый шум, создаваемый болельщиками. Если нужное Г/ЗС выставлено в тот момент, когда на трибунах было относительно тихо, то возможно, что при усилении криков болельщиков (но при прежнем уровне голосов комментаторов), шум толпы будет заглушать голоса комментаторов. Аналогично, если Г/ЗС выставлено в то время, когда комментаторы говорили очень громко, возможно, что, когда комментаторы вернутся к нормальной громкости речи, уровень будет слишком низок для хорошей разборчивости.

Система Г/ЗС, основанная на стандартном отклонении

Чтобы пользователю не приходилось непрерывно регулировать эти уровни, пользователь, установив отношение, может нажать кнопку, и это отношение будет храниться в памяти и поддерживаться до конца программы. Один способ осуществления этого процесса состоит в том, что, в момент нажатия кнопки, стандартные (среднеквадратичные) отклонения голосового сигнала и сигнала звукового сопровождения вычисляются и сохраняются в памяти. По ходу программы, для каждого сигнала продолжается вычисление стандартного отклонения в режиме реального времени. Если это отклонение превышает сохраненное значение, сигнал умножается на отношение сохраненного значения к фактическому значению, и, таким образом, его громкость снижается. Аналогично, если отклонение оказывается значительно ниже сохраненного значения, сигнал может умножаться на то же отношение для увеличения уровня. Если нужно повысить уровень (когда фактическое отклонение ниже сохраненного значения), то необходимо выявлять отрезки времени, когда сигнал отсутствует, во избежание нежелательного усиления уровня шума. (Такая ситуация может произойти, когда отношение приближается к бесконечности при фактическом отклонении, близком к нулю. Наиболее общий вид рассмотренного здесь способа авто-Г/ЗС можно выразить следующим уравнением, в котором:

G1 - коэффициент усиления (регулировка громкости) голосового сигнала;

G2 - коэффициент усиления (регулировка громкости) сигнала звукового сопровождения;

G3 - коэффициент усиления (регулировка громкости) полного сигнала;

Г - голосовой сигнал;

ЗС - сигнал звукового сопровождения;

σГфакт - фактическое стандартное отклонение голосового сигнала;

σCфакт - фактическое стандартное отклонение сигнала звукового сопровождения;

σГсохр - сохраненное стандартное отклонение голосового сигнала;

σСсохр- сохраненное стандартное отклонение сигнала звукового сопровождения.

Сохраненное стандартное отклонение каждого из соответствующих сигналов (голосового и звукового сопровождения) сохраняется и сравнивается с фактическими стандартными отклонениями в режиме реального времени. В данном случае стандартное отклонение используется как мера уровня каждого из сигналов. Можно использовать и другие метрики, в том числе, пиковый уровень за период времени. Чтобы управлять регулировкой громкости и результатами ее воздействия на уровень полного выходного сигнала, может понадобиться вычислять стандартные отклонения после усиления сигналов с коэффициентами усиления G1 и G2. Результаты немного отличаются в том, что, после сохранения стандартных отклонений, дальнейшие регулировки громкости голосового сигнала и сигнала звукового сопровождения будут неэффективны, пока не будут введены новые сохраненные значения. Если нужно работать в таком режиме, то вычисления отклонения для Г (голоса) и ЗС (звукового сопровождения) должны включать в себя коэффициенты усиления G1 и G2, выбираемые пользователем. При необходимости дальнейшей регулировки усиление следует применять после вышеупомянутых операций вычисления отклонения и умножения.

Эти идеи подробно проиллюстрированы на фиг.11. Одни и те же операции выполняются по отдельности над голосовым сигналом и сигналом звукового сопровождения. Заметим, что более простая и весьма эффективная реализация этой идеи состоит в том, чтобы исключить операции, производимые над голосовым сигналом, и изменять только сигнал звукового сопровождения по мере изменения стандартного отклонения. Такой упрощенный вариант позволяет вдвое снизить объем необходимых вычислений (за счет исключения вычислений, производимых на голосовом сигнале), поскольку предполагается, что изменение на диалоговом канале мало по сравнению с изменением, которое может происходить на канале звукового сопровождения. Тем не менее, на фиг.11 представлена наиболее полная реализация, предусматривающая операции как над голосовым сигналом, так и над сигналом звукового сопровождения. Пунктирными линиями показаны альтернативные операции, не подлежащие использованию в сочетании с операциями, указанными сплошными линиями, но обеспечивающие отличия в функционировании схемы, описанные в предыдущем абзаце. Регулируемое пользователем усиление 45 диалога можно применять либо до (с использованием элемента 46), либо после (с использованием элемента 44) вычисления стандартного отклонения. После того, как в некоторый момент времени пользователь выбрал нужный режим работы, стандартные отклонения голосового сигнала и сигнала звукового сопровождения сохраняются в ячейке памяти (47 или 47А), которая может представлять собой энергозависимую или энергонезависимую память. Это сохраненное значение используется в качестве числителя в процессе умножения 48 и 48А для каждого сигнала, тогда как в качестве знаменателя используется текущее фактическое стандартное отклонение, все равно, до или после регулируемого пользователем усиления. (Заметим, что сплошные и пунктирные линии не реализуются одновременно.) Не показан блок ветвления, который сравнивает текущее отношение с единицей. Если оно меньше единицы, что свидетельствует о том, что текущий фактический уровень выше сохраненного уровня, то громкость необходимо снизить в этом отношении. Если оно больше единицы, то, при некотором условии, лучше ничего не делать, а просто пропустить сигнал, подвергнутый лишь регулируемому пользователем усилению (для этого необходим условный оператор, который проверяет состояние отношения по отношению к текущему состоянию и принимает решение). Это препятствует умножению на очень большие отношения в случае низкого уровня сигнала, что привело бы к чрезмерному возрастанию уровню шума на тихих фрагментах. Кроме того, можно установить нижний предел отношения посредством дополнительного условия, что позволило бы соответствующим образом усиливать умеренно низкие уровни, но оставлять без изменения очень низкие уровни (или отсутствие) сигнала или изменять его в соответствии с последним значением отношения до того, как условие будет нарушено.

Сохранение различных установок Г/ЗС и авто-Г/ЗС

Сохранение значений отношения, соответствующих пользовательским предпочтениям, в элементах памяти 47 и 47А полезно использовать для регулировки звука при наличии разных типов программ или разных слушателей, использующих одно и то же аппаратное/программное обеспечение. Поскольку разные слушатели предпочитают различные Г/ЗС, и соответствующие уровни аудиосигнала могут различаться в зависимости от типа программы, необходимо обеспечить множественные участки памяти для разных типов программ и разных пользователей. Применяя, например, имя или пароль для каждой ячейки памяти, разные пользователи могут извлекать из памяти различные установки Г/ЗС для тех или иных программ. В зависимости от используемого способа, представленного на фиг.11, элементы памяти могут содержать нужный уровень голоса, нужное стандартное отклонение голоса, нужный уровень сигнала звукового сопровождения и/или нужное стандартное отклонение сигнала звукового сопровождения. Это позволит пользователю повторно использовать устройство воспроизведения с одной и той же установкой (возможно, разной для спорта и комедии ситуаций), не производя повторную регулировку уровней Г/ЗС и не переустанавливая режим автоподстройки. Не существует предела, установленного для количества ячеек памяти, которые могут быть доступны в устройстве воспроизведения. На фиг.11 показаны пользовательские органы управления, например, в виде кнопок, с помощью которых можно выбирать текущие стандартные отклонения, подлежащие сохранению и дальнейшему использованию в качестве сохраненных стандартных отклонений. Кроме того, пользователь регулирует G1, G2 и С3. Существует несколько способов предоставления конечному пользователю возможности осуществления таких регулировок, в зависимости от используемой аппаратуры. Например, на наушниках может быть установлено несколько кнопок для сохранения различных отношений и выбора тех или иных отношений в зависимости от продолжительности нажатия на кнопку. Если эти регулировки осуществляются с помощью персонального компьютера, электронной записной книжки или сотового телефона, они могут представлять собой органы управления, реализуемые программно в виде графического пользовательского интерфейса. Для дальнейшего упрощения регулировок, можно объединить все эти органы управления (Г/ЗС и автоподстройки отношения Г/ЗС) в едином органе управления. Отношение звукового сопровождения к голосу можно регулировать, как показано на фиг.10, с помощью единого регулятора баланса. Однако, для реализации функции авто-Г/ЗС, описанной со ссылкой на фиг.11, необходимо видоизменить режим работы регулятора, добавив автоподстройку отношения.

На фиг.12 изображена диаграмма, иллюстрирующая принцип действия многофункционального ползункового регулятора, который призван выполнять все функции с использованием единого органа управления. (Заметим, что это может быть орган управления любого типа, включая поворотную ручку, программное средство управления, нажимную кнопку приращений и т.д., но его функции остаются неизменными.) Установив регулятор Г/ЗС-авто-Г/ЗС в среднее положение, пользователь получает исходное микширование, при котором голос и звуковое сопровождение входят в полный сигнал в примерно равных долях. При постепенном перемещении ползунка влево, уровень голоса не меняется, а звуковое сопровождение начинает ослабевать, но функция автоподстройки при этом не действует. Начиная с некоторого заданного расстояния от состояния мертвой точки (где N обозначает это расстояние и может быть, по желанию, сколь угодно малым), значение, с которым сравнивается стандартное отклонение, начинает уменьшаться, т.е. начинается сжатие сигнала звукового сопровождения. Это продолжается до тех пор, пока сохраненное стандартное отклонение (изменяющееся при перемещении ползунка) не станет столь малым, что результатом деления будет число, близкое к нулю, и останется только голос. Обратное движение ручки приводит к тем же процессам, но с обратным соотношением между голосом и звуковым сопровождением.

На фиг.13 приведена блок-схема, иллюстрирующая принцип действия многофункционального регулятора, показанного на фиг.12. Регулятор управляет сохраненным значением стандартного отклонения сигнала звукового сопровождения по достижении точки N в левой половине шкалы. Аналогично, сохраненное стандартное отклонение голосового сигнала регулируется смещением ползунка достаточно далеко вправо. Одна из возможных альтернатив варианту осуществления, показанному на фиг.13, состоит в исключении регулировки голоса в режиме авто-Г/ЗС и, таким образом, в обеспечении лишь снижения фактического уровня голоса при перемещении ручки влево. (Аргумент в пользу такого варианта осуществления представлен в предыдущих параграфах.) Согласно блок-схеме, изображенной на фиг.13, стандартное отклонение сигнала звукового сопровождения вычисляется (52) и сравнивается (53) с сохраненным стандартным отклонением 56 сигнала звукового сопровождения, которое регулируется перемещением ползунка 57 в положение левее точки N. Если фактическое стандартное отклонение превышает сохраненное стандартное отклонение, то сигнал звукового сопровождения умножается на сохраненное значение и делится на фактическое значение прежде, чем будет изменен уровень громкости сигнала 55 звукового сопровождения, также регулируемый ползунком 57. В противном случае, сигнал звукового сопровождения просто умножается на текущую установку 55 ползунка, после чего объединяется с отрегулированным голосовым сигналом. При перемещении ползунка достаточно далеко вправо, те же операции осуществляются на тракте голосового сигнала. Регулировка с помощью одного органа управления особенно полезна в применениях, в которых приходится решать вопрос свободного места, например, в наушниках или слуховом аппарате. Это позволяет выполнять все функции нескольких регуляторов с помощью всего одного органа управления, осуществляя все регулировки.

Дополнительные потребительские применения Г/ЗС

Другие варианты прикладного использования Г/ЗС могут включать в себя:

- Переносной “поясной блок”, который принимает и передает отрегулированный и/или управляемый сигнал на акустический преобразователь

- Модернизированное устройство, используемое для облегчения регулировки Г/ЗС при просмотре фильмов на борту самолета

- Отдельный аудио-декодер, который можно использовать в сочетании с существующей аппаратурой домашнего кинотеатра для обеспечения дополнительных регулировок Г/ЗС для многочисленных пользователей

- Регуляторы Г/ЗС для головных телефонов, пульт дистанционного управления с возможностью регулировки Г/ЗС

Выше приведено описание аппаратуры Г/ЗС, специально предназначенной для обеспечения регулировки Г/ЗС, а описания, приведенные в нижеследующем разделе, объясняют, как аппаратуру Г/ЗС можно интегрировать в существующую звуковоспроизводящую аппаратуру. Это, однако, не ограничивает аппаратуру, описанную в данном разделе, использованием в сочетании с существующей звуковоспроизводящей аппаратурой. В действительности, как будет видно, аппаратура, ориентированная на Г/ЗС, предназначена для сопряжения именно с существующей звуковоспроизводящей аппаратурой, например, телевизором или системой домашнего кинотеатра. Следует также заметить, что каждый из конкретных вариантов осуществления, рассмотренных в предыдущем разделе, можно непосредственно применять к каждому из вариантов осуществления, рассмотренных в данном разделе, чтобы обеспечивать новое, удобное для пользователя, средство регулировки отношения Г/ЗС. Например, первый вариант осуществления, рассмотренный в этом разделе, предусматривает переносной электронный блок, способный принимать два сигнала (или более), один из которых является голосовым сигналом, а другие являются сигналами звукового сопровождения, объединять и регулировать эти сигналы и повторно передавать их, например, на миниатюрные наушники, ВУП, слуховой аппарат, головной телефон, кохлеарный имплантант, глазную гарнитуру или головную гарнитуру со встроенными динамиками. Вариант осуществления единого регулятора, описанный в предыдущем разделе и подробно изображенный на фиг.9, может быть включен в этот переносной блок для предоставления конечному пользователю возможности единой регулировки в портативном формате. Хотя, каждая из соответствующих комбинаций технологий не будет подробно рассмотрена на примерах, их можно вывести из описанных выше, в качестве примера (работа на двух сигналах) методологий Г/ЗС, в сочетании с аппаратурой Г/ЗС, которая принимает два сигнала.

Переносные устройства Г/ЗС (ПГЗС)

Используемый здесь термин ПГЗС относится к переносным устройствам Г/ЗС, используемым в разнообразных средах в сочетании со стандартными УИП (устройствами индивидуального прослушивания, например, наушниками, слуховыми аппаратами, кохлеарными имплантантами, глазной или головной гарнитурой со встроенными динамиками, и т.п.). Устройство ПГЗС способно принимать беспроводные (или проводные) передачи, например, от источника, который выдает, по меньшей мере, два сигнала, один из которых является чистым или почти чистым диалогом, а другой является сигналом звукового сопровождения. (Для дополнительного пространственного позиционирования можно использовать и большее количество каналов, что описано в предыдущем разделе). Передатчик 58, изображенный на фиг.14, может быть стандартизован для работы в определенном диапазоне частот и на низкой мощности, чтобы устройство ПГЗС 59 можно было использовать в разнообразных средах. Это может быть диапазон 900 МГц для радиосвязи или стандартный диапазон инфракрасной линии связи в пределах прямой видимости. После того, как провайдеры согласуют стандартный формат беспроводной связи, можно будет передавать голос и звуковое сопровождение на аудиторию в общественных местах, например, церквях и кинотеатрах. ПГЗС может представлять собой универсальный проигрыватель, способный принимать (60) такие сигналы, регулировать голос (61, 68) отдельно от звукового сопровождения (62, 69), объединять их для формирования полной программы (64, 70) и передавать (63) их посредством проводного или беспроводного соединения на УИП 67, содержащий приемник 65 и преобразователь 66 для преобразования сигнала в слышимый звук. Способы регулировки подробно описаны в предыдущем разделе и предусматривают использование усилителей с регулируемым усилением или аттенюаторов, а также возможность автоподстройки Г/ЗС. Блок ПГЗС может представлять собой стандартизованный блок для работы со многими существующими УИП за счет включения в его состав, например, гнезда для стереонаушников на 1/4" на передающем каскаде 63. Этот вариант осуществления может также требовать наличия усилителя головных телефонов в устройстве ПГЗС. Кроме того, ПГЗС может содержать стандартный разъем для подключения проводного слухового аппарата. Все, что нужно для согласования ПГЗС с аппаратурой домашнего кинотеатра, это стереопередатчик, где один канал является голосовым, а другой является каналом звукового сопровождения, и приемник, настроенный на прием двух сигналов.

В качестве частного случая вышеприведенного описания устройства ПГЗС, рассмотрим регулятор ГЗС/авто-ГЗС, предназначенный для использования на пассажирских самолетах при просмотре кинофильмов. При просмотре фильма в полете, разборчивость диалога может быть особенно низкой из-за шума двигателей, заглушающего диалог фильма. Имея возможность по отдельности регулировать голос и звуковое сопровождение, конечный пользователь может повысить разборчивость диалога при просмотре фильма в полете. Этой цели можно добиться, не создавая помех существующей инфраструктуре передачи аудиосигналов. Мы должны предположить, что источник аудиосигнала (видеомагнитофон (VCR, ВМ), DVD, вещание или другой источник аудиосигнала) имеет диалоговую дорожку, отдельную от дорожки или дорожек звукового сопровождения. Это можно осуществлять несколькими путями, один из которых состоит в использовании центрального канала в многоканальных форматах или, альтернативно, в использовании чисто голосовой дорожки, которую могут предусматривать некоторые стандарты сжатия аудиосигнала. (Формирование чисто голосовой дорожки не является предметом данного конкретного изобретения, в отличие от аппаратуры и реализации, используемой для ее регулировки и доставки ее конечному пользователю). Авиационная инфраструктура доставки аудиосигнала включает в себя тракт стереосигнала (2-канальный), ведущий к конечному пользователю, который реализуется посредством либо 1) электронного переноса информации на подлокотник каждого кресла (для чего требуются стандартные головные телефоны с разъемом, отвечающим авиационному стандарту), либо 2) волноводной системы, в которой предусмотрены миниатюрные громкоговорители, вмонтированные в подлокотник, которые, будучи подключены к пластмассовой трубке, передают звук на уши пользователя. Для реализации модифицированного под нужды авиации устройства регулировки Г/ЗС, встроенного в подлокотник, необходимо предположить, что голос поступает на один канал (левый или правый), а звуковое сопровождение поступает на другой канал, и это относится ко всем подлокотникам в самолете. Неизбежную при этом утрату стереоэффекта следует рассматривать как минимальную жертву в пользу потенциального улучшения восприятия программы в целом. Кроме того, при прослушивании аудиопрограмм в полете, слабые стереоэффекты нередко заглушаются шумом двигателей. Поскольку электронные способы передачи сигнала коренным образом отличаются от волноводных, для их реализации требуются два разных варианта осуществления, представленные на фиг.15 и 16. Однако, при необходимости создать универсальный механизм регулировки, компоненты, изображенные на фиг.15 и 16, можно объединить в один аппаратный модуль, который сможет работать в сочетании с любым подлокотником, используемым в самолете.

На фиг.15 представлен вариант авиационного блока, который можно использовать для электронных соединений в подлокотниках кресел на самолете. Разъемы 71, например, могут представлять собой стандартные штекеры, которые можно вставлять в гнезда подлокотника для приема сигналов левого и правого каналов, поступающих из центрального пункта. Эти сигналы регулируются (72, 73 и 74, 75) для достижения предпочтительного отношения Г/ЗС голосового сигнала (левый канал) и сигнала звукового сопровождения (правый канал). Отрегулированные сигналы объединяются для формирования полной аудиопрограммы и подвергаются дополнительной регулировке (77 и 78). Усилитель 79 требуется для усиления сигнала, подаваемого на преобразователи, входящие в состав УИП. Выходы 80 авиационного блока Г/ЗС состоят из разъемов, например, гнезд под штекеры, которые существуют в современных подлокотниках и позволяют авиакомпаниям использовать свои существующие наушники в качестве устройств УИП.

На фиг.16 представлен вариант авиационного блока, который можно использовать в сочетании с волноводами в существующих подлокотниках. Для регулировки уровней каждого из двух сигналов (голоса и звукового сопровождения), требуется обратное преобразование сигналов в электронный формат. Устройство содержит два микрофона 82, 83 и два микрофонных усилителя 84, 85, которые воспринимают выходной сигнал громкоговорителей, встроенных в подлокотник, которые обычно подключаются к волноводам. Выходной сигнал усилителей представляет собой электрический сигнал, который является голосовым сигналом или сигналом звукового сопровождения. Эти сигналы независимо регулируются посредством 86, 87 и 88, 89, после чего формируется (90) полный сигнал. Он дополнительно регулируется (91, 92) по общему уровню и поступает на другой громкоговоритель 93. Волновод и выходные разъемы 94, идентичные тем, которые используются в подлокотнике, позволяют выводить сигнал из авиационного блока Г/ЗС, что позволяют использовать стандартные головные телефоны волноводного типа в сочетании с этой конструкцией.

Беспроводной передатчик в DVD, телевизоре и т.д. для передачи двух сигналов

Рассмотрим применение регулировки Г/ЗС к домашнему кинотеатру, а также телевидению и просмотру фильмов. Часто в одной комнате сидят многочисленные зрители с разными слушательскими предпочтениями относительно соотношения между голосом и звуковым сопровождением. Данное изобретение позволяет подавать несколько сигналов на УИП, используемые многочисленными пользователями, что дает возможность каждому из них индивидуально пользоваться функцией Г/ЗС (и авто-Г/ЗС) по своему усмотрению. Как и раньше, источник аудиосигнала (телепередача, DVD и т.п.) содержит, по меньшей мере, одну дорожку, которую можно считать чисто голосовой или в основном голосовой, а также, по меньшей мере, одну дорожку, которую можно считать содержащей сигнал звукового сопровождения. (В будущем, отдельные стандарты и форматы аудиосигнала смогут поддерживать определенного рода чисто голосовую дорожку). Данное изобретение призвано удовлетворять потребность нескольких пользователей, находящихся в одной и той же среде прослушивания, одновременно и по отдельности иметь доступ к, по меньшей мере, двум аудиосигналам, чтобы устанавливать их соотношение в соответствии со своими личными особенностями восприятия. Согласно первому и наиболее предпочтительному варианту осуществления (по соображениям экономии места и средств), многоканальный беспроводной передатчик встроен в звуковоспроизводящую аппаратуру (например, телевизора или проигрывателя DVD), который по отдельности направляет голосовой сигнал и сигнал звукового сопровождения на аудиторию, чтобы слушатели, снабженные УИП с возможностью Г/ЗС, которые способны принимать передачу, могли независимо регулировать Г/ЗС. Помимо размещения беспроводного передатчика внутри звуковоспроизводящей аппаратуры, можно предусмотреть отдельные разъемы аудио-выхода, обеспечивающие доступ к сигналу звукового сопровождения (монофоническому или многоканальному) и чисто голосовому сигналу (монофоническому или многоканальному) для проводной регулировки на отдельном УИП, не снабженном средством беспроводного приема. В случае наличия аудио-разъемов и отсутствия беспроводного передатчика в телевизоре, проигрывателе DVD или ином устройстве, пользователь может подключать отдельный многоканальный беспроводной приемник к этим выходным разъемам, чтобы сделать раздельные аудиосигналы доступными аудитории. Эти идеи проиллюстрированы на фиг.17. Источник сигнала 96 может выдавать, в кодированном или модулированном виде, полную программу, которая также может содержать видеоинформацию. Источники сигналов могут включать в себя, например, сигнал телевизионного вещания (спутникового, кабельного или наземного) и кодированный сигнал DVD или CD, считанный лазером. Эта информация должна приниматься и декодироваться прежде, чем превратятся в электрические сигналы, представляющие аудиоинформацию. Декодер способен выделять чисто голосовой(ые) канал(ы) (если таковой существует в источнике сигнала) и поддерживать его (их) отдельно от канала(ов) звукового сопровождения. С раздельными сигналами голоса и звукового сопровождения, полученными на выходе каскада приема/декодирования 98, можно поступать по-разному: 1) можно обеспечить доступ к ним посредством раздельных разъемов 97 выходного аудиосигнала (например, звуковых штекеров), или 2) можно направлять их на многоканальный беспроводной передатчик 99, который также входит в состав устройства воспроизведения 95. Устройство воспроизведения 95 может представлять собой проигрыватель DVD, в котором источник сигнала является внутренним по отношению к устройству, или телевизор, в котором источник является внешним. В случае вывода сигналов через аппаратные средства вывода, к этим средствам вывода можно присоединять отдельный внешний многоканальный передатчик 100, способный сопрягаться с принимающим УИП, чтобы обеспечивать беспроводной прием и регулировку Г/ЗС на УИП для всех пользователей, находящихся в одной и той же среде прослушивания.

Дополнительный декодер Г/ЗС для использования совместно с другими системами, не совместимыми с Г/ЗС

В качестве альтернативного варианта осуществления, можно предусмотреть особый декодер, специально предназначенный для применений Г/ЗС. Это позволяет пользователям, которые в данное время не располагают декодером/передатчиком Г/ЗС, обеспечивать совместимость с Г/ЗС, не обновляя никаких конкретных компонентов (т.е. не теряя вложенных средств). Предположим, проигрыватель DVD, телевизор или радиоприемник начинает передавать кодированный чисто голосовой канал. Современные приемные устройства не только не в состоянии принимать и выделять эту информацию, но также не способны обеспечивать функцию Г/ЗС для одного человека, не говоря уже о многочисленных пользователях, находящихся в одной и той же среде. Устройство 111, показанное на фиг.18, предоставляет все эти возможности пользователю, имеющему доступ к источникам сигнала с выделением голоса, но не располагающему средствами выделения и регулировки отношения Г/ЗС. Сигнал источника 101 сигнала может представлять собой то же, что и раньше (телевизионную передачу, информацию DVD и т.д.) и может поступать непосредственно на систему первичного воспроизведения 102, которая может представлять собой телевизор или проигрыватель DVD, который не может обеспечивать регулировку Г/ЗС, поскольку эта функция в нем изначально не предусмотрена. Тот же сигнал источника сигнала поступает на внешний блок Г/ЗС 111, где установлен соответствующий приемник или декодер для выделения и разделения голосовой и аудио-составляющих из источника сигнала согласно стандарту, который поддерживает тип данных, присутствующих в сигнале. Такой декодер может представлять собой декодер Dolby Digital, способный выделять моду ослабленного слышания, но данное изобретение, конечно, не ограничивается этим конкретным декодером. Другие популярные форматы аудиосигнала, может быть, когда-нибудь обеспечат средство передачи чисто вокальной дорожки в дополнение к существующему аудиосигналу. Блок 111, отвечающий данному варианту осуществления, может содержать тот или иной декодер, в зависимости от его применения. Таким образом, внешнее устройство имеет три возможности после того, как оно декодировало и отделило вокальную дорожку от дорожек звукового сопровождения. Во-первых, в устройстве могут быть предусмотрены аппаратные средства вывода 104, 110 в виде аудио-разъемов, например, типа RCA или звуковых штекеров, которые могут обеспечивать подачу сигнала линейного уровня на передатчик или проводное УИП с возможностью регулировки Г/ЗС; во-вторых, в приемнике может быть предусмотрен многоканальный передатчик 105, осуществляющий беспроводную передачу раздельных голосового сигнала и сигнала(ов) звукового сопровождения на УИП с возможностью регулировки Г/ЗС; или, в-третьих, регулировка Г/ЗС для одного пользователя 107 может быть предусмотрена непосредственно в устройстве, в котором голос и звуковое сопровождение регулируются по отдельности, суммируются и дополнительно регулируются (108) по общему уровню громкости прежде, чем будут выведены (109) в качестве выходных сигналов на другой блок воспроизведения аудиосигнала.

Заметим, что, хотя на фиг.18 показан только один регулируемый выход (имеется в виду вывод монофонического полного сигнала), можно, не выходя за рамки сущности и объема изобретения (как было отмечено в предыдущих описаниях), предусмотреть несколько выходов для многоканального пространственного позиционирования аудиосигнала. Например, при наличии программы 5-канального звукового сопровождения (левый, центральный, правый, левый окружающего звука и правый окружающего звука) совместно с 5-канальной (или менее) голосовой аудиопрограммой, их можно объединить после регулировки уровней таким образом, чтобы голос можно было разместить на любой колонке за счет использования раздельной регулировки громкости или непосредственно на центральной колонке (обычный вариант). Это по-прежнему дает возможность пользователю регулировать Г/ЗС и, вместе с тем, создает ощущение погружения в звук.

Прием и Г/ЗС, подлежащие использованию в сочетании с существующей беспроводной передачей смешанных (видео и аудио) сигналов DVD

Появляется новый класс продукции, который позволяет потребителям наслаждаться видео- и аудиопрограммами DVD из удаленных источников. Эта беспроводная технология доставляет аудио и видео информацию от удаленного проигрывателя DVD на телевизор или домашний кинотеатр. Это позволяет владельцам привода DVD на персональном компьютере использовать этот привод для просмотра содержимого DVD на других устройствах, помимо компьютера. Регулировку Г/ЗС на УИП, а также на централизованном домашнем кинотеатре можно использовать в сочетании с беспроводной DVD-технологией двумя способами. Во-первых, поскольку современные проигрыватели DVD способны посылать беспроводные аудиосигналы в систему домашнего кинотеатра, УИП можно оборудовать беспроводным приемником, настроенным на ту же частоту, который позволяет УИП перехватывать ту же передачу. Поскольку видеоинформация нужна только в устройстве воспроизведения изображения, но не на УИП, аудиосигнал можно избирательно декодировать в УИП для воспроизведения. Важно отметить, что за процессом приема беспроводного сигнала должен следовать процесс декодирования для выделения голоса и звукового сопровождения из беспроводного сигнала DVD. Затем следуют регулировка, объединение и преобразование сигнала в слышимый звук, при этом осуществляется полная регулировка уровня голоса, уровня звукового сопровождения, общего уровня, а также включаются любые функции авто-Г/ЗС. Вся вышеупомянутая аппаратура размещается в устройстве индивидуального прослушивания, так что каждый пользователь может регулировать Г/ЗС и уровень по своему вкусу; такая система представлена на фиг.4, где передатчик передает полный сигнал DVD, но декодер УИП выделяет из входного битового потока только аудиосоставляющую.

Существует второй вариант осуществления Г/ЗС, используемого в сочетании с беспроводной передачей DVD, который позволяет снизить общие затраты, но за счет увеличения количества необходимых компонентов. Как и раньше, осуществляется передача полного сигнала DVD от проигрывателя DVD на устройство воспроизведения, например, домашний кинотеатр. Приемник полного сигнала DVD на домашнем кинотеатре общего пользования может повторно передавать только голосовой сигнал и сигнал звукового сопровождения в соответствии с вариантом осуществления, аналогичным представленному на фиг.4, но отличающимся тем, что приемопередатчик принимает беспроводной сигнал от беспроводного передатчика DVD общего пользования. Это позволяет оборудовать многочисленные УИП, находящиеся в одном помещении, только беспроводным приемником, но не цифровым декодером. Процесс декодирования осуществляется централизованно в домашнем кинотеатре, причем видеосоставляющая поступает в устройство просмотра, а аудиосоставляющая (принятая от проигрывателя DVD и декодированная) ретранслируется от приемника, декодера, передатчика в УИП, принимающие голосовой сигнал и сигнал звукового сопровождения.

Орган управления Г/ЗС на корпусе головного телефона

Рассмотрим следующую группу вариантов осуществления функций регулировки Г/ЗС в конкретной аппаратуре, предназначенной для применений Г/ЗС, а именно, в устройстве индивидуального прослушивания с возможностью Г/ЗС. Существует три класса УИП, к которым применим данный вариант осуществления: это наушники, слуховой аппарат, вспомогательное устройство прослушивания, кохлеарные имплантанты, глазная гарнитура, головная гарнитура со встроенными громкоговорителями, использующие проводную или беспроводную технологию. Обычно, вспомогательное устройство прослушивания использует наушники в сочетании с микрофоном или беспроводным передатчиком, в зависимости от назначения изделия. В некотором смысле, саму по себе беспроводную систему, показанную на фиг.4, можно рассматривать как вспомогательное устройство прослушивания. Но, в целом, технология Г/ЗС, предусматривающая прием, разделение, регулировку, объединение и доставку сигналов, можно использовать и в других изделиях, помимо ВУП. Беспроводные наушники, головные телефоны или миниатюрные головные телефоны должны содержать органы управления непосредственно на корпусе наушников. На фиг.19 представлен вариант осуществления, согласно которому вся необходимая аппаратура размещается в самих наушниках 112, и необходимые органы управления для регулировки Г/ЗС легко доступны конечному пользователю на внешней стороне корпуса головного телефона. Сначала, беспроводной приемник 113 принимает многочисленные аудиосигналы, передаваемые источником после декодирования (если требуется). Демодулятор 114 детектирует аудиосигналы, выдавая вокальную(ые) дорожку(и) и дорожку(и) звукового сопровождения, подлежащие ручной регулировке 115, суммированию 117 и дополнительной регулировке уровня 116, усилению посредством усилителя 118 головного телефона и воспроизведению посредством громкоговорителя 119 головного телефона. Ручки 115, 116 громкости могут располагаться на внешней части наушников и могут дополняться регулятором баланса, в случае использования многоканального (стерео) воспроизведения. В случае передачи и приема на УИП многочисленных каналов, их можно регулировать и объединять для формирования необходимого стереоэффекта или пространственной проекции, используя аппаратное и программное обеспечение, показанное на фиг.5 и/или 8.

Регулировка Г/ЗС в слуховом аппарате с помощью пульта дистанционного управления

Помимо регулировки Г/ЗС, осуществляемой в головном телефоне, физические размеры которого позволяют разместить вышеупомянутую аппаратуру, может понадобиться также осуществлять регулировку Г/ЗС в УИП малого размера, например, слуховом аппарате или миниатюрном головном телефоне. В таких малых УИП невозможно разместить всю необходимую аппаратуру и органы ручного управления для регулировки уровней двух или более сигналов. В этом случае, предпочтительнее использовать устройство, подобное описанному выше со ссылкой на фиг.13. Согласно данному варианту осуществления, применимому к малым УИП, в состав УИП должен входить только беспроводной приемник. Технология поверхностного монтажа и миниатюризация электронных компонентов облегчают размещение маломощного беспроводного приемника в малых объемах. (Заметим, что, поскольку прием раздельных сигналов от источника осуществляет портативный регулировочный блок, а следовательно, передавать отрегулированный сигнал необходимо в пределах дальностей не более пяти футов, требуется меньшая мощность антенного усилителя). Удаленный приемопередатчик, описанный со ссылкой на фиг.13, можно сконструировать в виде пульта дистанционного управления для УИП. С помощью такого пульта дистанционного управления можно регулировать громкость голоса и звукового сопровождения, регулировать общую громкость УИП, а также передавать сигналы в УИП и принимать сигналы от источника. Возможность размещения всего комплекта электроники, необходимой для регулировки Г/ЗС, например, в слуховом аппарате (или в миниатюрном УИП) определяется дальнейшим развитием технологии. Необходимость в использовании пульта дистанционного управления для регулировки уровня громкости обусловлена еще и тем, что слуховой аппарат должен быть как можно менее заметным. Соответственно, пульт дистанционного управления необходим еще и из эстетических соображений.

Варианты осуществления головных телефонов с Г/ЗС в условиях кинотеатра

Индивидуальную регулировку Г/ЗС можно реализовать в кинотеатрах, модифицировав конструкцию наушников в соответствии с раскрытой здесь технологией. Зрители смогут воспользоваться возможностью регулировать уровень голоса независимо от звукового сопровождения, в то же время наслаждаясь окружающим (объемным) звуком или большим экраном кинотеатра. При необходимости в полном объеме управлять звуковым сопровождением и голосом на используемых в кинотеатре вспомогательных устройствах прослушивания или наушниках, необходимо применять звукоизолирующие наушники, снабженные достаточной пассивной и/или активной противошумовой защитой. Пассивная противошумовая защита, обеспечиваемая околоушными подушками, двойным наружным корпусом и звукопоглощающим материалом, эффективно подавляет частоты внешнего шума с нижней границей около 500 Гц. Для дополнительного подавления более низких частот, от которых не могут защитить пассивные средства, можно дополнить конструкцию таких наушников активной противошумовой защитой. Такие наушники для кинотеатров могут иметь конструкцию наподобие рассмотренной в предыдущих вариантах осуществления наушников. Вторая альтернатива предусматривает некоторое сужение функциональных возможностей, если достаточно регулировать только вокал. При записи звуковой дорожки многих кинофильмов, уровень голосового сигнала может оказаться слишком низким, чтобы обеспечивать хорошую разборчивость на фоне громких фрагментов звукового сопровождения. Поэтому, во время воспроизведения таких фрагментов, желательно повышать уровень чисто диалогового сигнала. Прием, регулировку громкости и воспроизведение чисто диалогового сигнала можно осуществлять с использованием наушников, не имеющих звукоизоляции, которые не мешают слушать внешние звуки. Таким образом, пользователь может воспринимать объемное звучание многоканального звукового сопровождения и, вместе с тем, регулировать громкость диалога, добиваясь максимальной разборчивости.

Следует осознавать, что регулировка отношения голосового сигнала к сигналу звукового сопровождения (Г/ЗС) (этап процесса микширования при профессиональном изготовлении звукозаписи) может противоречить представлениям некоторых людей о свободе творчества. Например, звукорежиссеры уделяют большое внимание правильному микшированию звуков для создания нужных эффектов в музыкальном произведении, кинофильме и телепередаче. Поэтому, необходимо либо предусмотреть средства передачи полной программы с оригинальным (неизмененным) режиссерским микшированием, либо обеспечить средства для простого возврата к этому микшированию. Это позволило бы конечному пользователю выбирать между возможностью воспринимать режиссерское микширование (отвечающее замыслу постановщиков) и возможностью самостоятельно регулировать отношение Г/ЗС. Существует, по меньшей мере, четыре способа достижения этой цели, и они будут представлены ниже.

Варианты осуществления выбора между Г/ЗС и художественным микшированием (оригинальным микшированием аудиосигнала)

Способ 1

На фиг.20 представлены первые две возможности сохранения режиссерского микширования (отвечающего замыслу постановщиков) наряду с предоставлением конечному пользователю возможности самостоятельно регулировать Г/ЗС. Постановщик берет отдельные дорожки 120 всех элементов, составляющих полную программу, и объединяет их (121), формируя монофоническую или многоканальную программу 122, подлежащую записи или трансляции 123 для конечного пользователя. Помимо режиссерского смешанного сигнала, голосовой сигнал (подвергнутый синхронизации, задержке и обработке 124, идентичной 121), используемый при формировании режиссерского смешанного сигнала, следует поддерживать отдельно от режиссерского смешанного сигнала на этапах записи и трансляции 123. Обычно, сигнал транслируется на одной частоте в определенном диапазоне частот, поэтому его часто представляют в виде одного сигнала, в том числе, на фиг.20, поступающего в блок 126. (Хотя он показан в виде одного сигнала, в модулированном/кодированном сигнале содержатся множество сигналов). Устройство декодирования/воспроизведения 125 декодирует или демодулирует запись или передачу для обеспечения оригинального режиссерского смешанного сигнала 126 наряду с чисто диалоговой дорожкой 127, которая была создана и записана в дополнение к режиссерскому смешанному сигналу. Диалоговый сигнал проходит через переключатель 129, который может отключать диалоговый сигнал от выхода устройства 133 полного сигнала. Когда переключатель разомкнут, режиссерский смешанный сигнал можно воспроизводить в исходном виде посредством воспроизводящей аппаратуры 133 в любой многоканальной конфигурации 131, в которой он был первоначально сформирован, и регулировать общую громкость полной программы с помощью регулятора 128 громкости. Когда переключатель 129 замкнут, диалоговый сигнал проходит через регулятор 130 громкости и суммируется (132) с режиссерским смешанным сигналом (в случае использования многоканального формата, он обычно суммируется с центральным каналом или, в равной степени, с левым и правым каналами). Это позволяет конечному пользователю регулировать уровень полной программы 128 по отношению к уровню диалога в регуляторе 130 громкости. Полностью выведя регулятор 130 громкости диалога, можно вернуться к режиссерскому смешанному сигналу. Если диалог, содержащийся в режиссерском смешанном сигнале и на отдельной диалоговой дорожке, записывается или транслируется одновременно (т.е. при наличии синхронизации), то между двумя дорожками не будет никакой задержки; поэтому, при увеличении громкости диалога, объединяемого с режиссерским смешанным сигналом, будет возрастать отношение голоса к звуковому сопровождению, что можно слышать через систему 133 воспроизведения. Синхронизацию можно осуществлять, обрабатывая диалоговый сигнал с помощью всех тех элементов задержки (например, ревербераторов или фильтров), которые используются для обработки диалога при формировании режиссерского смешанного сигнала. Это гарантирует, что диалог в режиссерском смешанном сигнале и на отдельной диалоговой дорожке полностью синхронизированы. Заметим, что данный конкретный вариант осуществления не позволяет получать отношения Г/ЗС ниже, чем отношение Г/ЗС в режиссерском смешанном сигнале. Если это необходимо, можно использовать следующие два варианта осуществления.

Способ 2

Как и прежде, предполагаем, что режиссерский смешанный сигнал и диалог поступают из вещательного тракта или записи и что оба диалоговых сигнала (один - в составе режиссерского смешанного сигнала, а другой - в чистом виде) синхронизированы друг с другом. На фиг.21 изображена альтернативная конфигурация для обработки режиссерского смешанного сигнала и диалогового сигнала после их декодирования, которая позволяет получать отрицательные отношения Г/ЗС (т.е. дает возможность пользователю, при желании, снижать уровень голоса и повышать уровень звукового сопровождения). Декодированный диалоговый сигнал 135 вычитается (136) из режиссерского смешанного сигнала 134, в результате чего получается смешанный сигнал 137, представляющий исключительно звуковое сопровождение.

Уровень 139 звукового сопровождения регулируется независимо от уровня 138 диалога, после чего эти сигналы объединяются (140) для создания полной регулируемой пользователем программы. Режиссерский смешанный сигнал поступает на один контакт переключателя 141, который обеспечивает выбор между регулируемым пользователем смешанным сигналом и режиссерским смешанным сигналом. Эта конфигурация позволяет снижать уровень диалогового сигнала до такой степени, когда остается только звуковое сопровождение. Следующий вариант осуществления также позволяет пользователю в полном объеме регулировать отношение Г/ЗС, а также получать режиссерский смешанный сигнал благодаря использованию информации уровней режиссерской записи, полученной до процесса кодирования.

Способ 3

Фиг.22 иллюстрирует процесс формирования аудиопрограммы, в котором передают информацию о том, каким образом микширована программа, чтобы обеспечить, с одной стороны, доступ потребителя к режиссерскому смешанному сигналу, и, с другой стороны, возможность в полном объеме регулировать отношение Г/ЗС. Элементы 143 оригинальной программы микшируют (144) для формирования многоканальной или монофонической программы, которую непрерывно контролируют на слух, пока не отрегулируют уровни всех входных сигналов 143 для правильного воспроизведения с точки зрения звукорежиссера, выпускающего программу. В результате режиссерского микширования получают собственно диалоговый сигнал 149, уровень диалогового сигнала 148, правильный с точки зрения постановщика, весь объединенный аудиосигнал 146, за исключением основного диалога, и общий уровень 147 звукового сопровождения. Соответствующая уровневая информация подвергается цифровому кодированию (150, 151) и, в качестве метаданных, объединяется (152, 153) с реальными аудиосигналами. Кодированные сигналы, содержащие соответствующую уровневую информацию, подлежат передаче, трансляции или записи 154. Устройство воспроизведения снабжено декодером 155, который выделяет аудиоинформацию, а также заголовочную информацию 156, содержащую уровни оригинального режиссерского микширования (возможно, относительно некоторого цифрового максимального значения, зависящего от разрешения записи). Уровень звукового сопровождения и уровень 157 диалога могут поступать в схемы 158, 159 регулировки усиления, которые обеспечивают правильные уровни и восприятие режиссерского микширования после объединения (162) автоматически отрегулированных сигналов диалога и звукового сопровождения. Это происходит в том случае, когда переключатель (или переключатели) 160 и 161 обеспечивают подачу выходных сигналов блока 156 заголовочной информации в схемы регулировки усиления. Когда переключатель (или переключатели) переведены в правое положение, обеспечивающее подачу выходных сигналов блока 164 пользовательского микширования Г/ЗС, пользователь самостоятельно определяет уровень 158 звукового сопровождения и уровень 159 диалога. Хотя показанные линии сигнала, во многих случаях, свидетельствуют о наличии единичных сигналов, в пределах сущности и объема изобретения, каждую линию сигнала можно рассматривать как вектор, в котором присутствуют множественные сигналы, например, левого, правого, левого окружающего звука, правого окружающего звука и центрального каналов для пространственного позиционирования, уровни которых регулируются регулятором 158 уровня звукового сопровождения, указанным на фиг.22. Аналогично, чисто голосовая дорожка может также содержать многоканальную информацию, которую можно регулировать регулятором 159.

Г/ЗС в сочетании с существующей звуковоспроизводящей аппаратурой

Выше были рассмотрены варианты осуществления, позволяющие конечному пользователю регулировать Г/ЗС при электронном воспроизведении программ (транслируемых или записанных) на устройствах индивидуального прослушивания УИП, благодаря чему отдельные слушатели, находящиеся в одной и той же среде прослушивания, могут одновременно устанавливать различные отношения Г/ЗС. Дополнительные варианты осуществления изобретения предусматривают объединение вышеописанных устройств индивидуального прослушивания со следующими электронными приборами:

- Сотовыми телефонами

- Портативными компьютерами

- Электронными записными книжками

- Устройствами воспроизведения МРЗ

Персональными аудиопроигрывателями, в которых для хранения музыки используются магнитные носители информации

Эти устройства можно использовать для индивидуального воспроизведения музыки или аудиопрограммы, содержащей диалог и звуковое сопровождение, которое может заглушать диалог. Варианты осуществления, рассмотренные в предыдущих разделах, применимы к четырем вышеперечисленным устройствам для обеспечения регулировки Г/ЗС при воспроизведении аудиосигнала, вне зависимости от формата его кодирования, при формировании или первоначальной записи которого диалог был отделен от звукового сопровождения.

Г/ЗС на персональных компьютерах

Интернет стал популярным средством распространения программ цифрового качества. Потребители, принимающие музыку, фильмы или другую аудиопродукцию в режиме реального времени (или с задержкой) по линии передачи данных на своем персональном компьютере, могут, тем или иным способом, реализовать функции Г/ЗС или авто-Г/ЗС. Для регулировки усиления сигналов голоса и звукового сопровождения, можно использовать исключительно программные средства и управлять ими посредством графического интерфейса пользователя. Голос и звуковое сопровождение декодируются по отдельности аппаратными или программными средствами, в зависимости от системы персонального компьютера. Сигналы можно усиливать в цифровом формате, передавая программе декодирования несколько линий исходного кода, что позволяет умножать каждый из двух сигналов (голоса и звукового сопровождения) на константы, задаваемые пользователем. Пользователь задает эти константы до суммирования сигналов, посредством программного пользовательского интерфейса, который позволяет регулировать две константы, умножаемые на декодированные сигналы голоса и звукового сопровождения. Кроме того, можно предусмотреть дополнительную регулировку громкости полного сигнала, чтобы пользователь мог регулировать общую громкость программы, подлежащей воспроизведению. Альтернативно, при необходимости обеспечить пользователя более удобными органами управления, можно обеспечить ручку(и) Г/ЗС (см. методологические рассмотрения возможных реализаций ручки регулятора) в качестве фактического аппаратного средства на компьютерных колонках, клавиатуре, мыши или мониторе, т.е. на всех компонентах системы ПК. Если регулировка Г/ЗС осуществляется аппаратными средствами (например, в виде ручки на мониторе), а декодирование сигнала осуществляется программными средствами, то необходим протокол квитирования, позволяющий гарантировать, что регулировки, произведенные с помощью аппаратного регулятора, отразились на программно-реализуемом усилении и операции умножения. Фиг.23 иллюстрирует один из возможных вариантов согласования аппаратных и программных средств управления. Выходной сигнал напряжения 167, генерируемый из полного напряжения 166 в зависимости от перемещения и положения аппаратного(ых) регулятора(ов) 165, необходимо дискретизировать, чтобы преобразовать информацию положения в число, выражающее громкость относительно полного напряжения 166. Одна из возможных аппаратных реализаций такого регулятора представляет собой поворотный делитель напряжения, а именно, потенциометр, на один вывод которого подают полное напряжение, другой вывод заземлен, а со скользящего контакта снимают часть напряжения, зависящую от поворотного положения. Выходной сигнал АЦП периодически считывается программным средством 169, которое управляет потоком сигнала, выдавая оцифрованное числовое значение, выбранное пользователем. Эти числовые значения (одно для голоса и одно для звукового сопровождения) умножаются (170) на соответствующие сигналы, и полученные сигналы суммируются (172) для формирования полной программы, отрегулированной по Г/ЗС. Программные и аппаратные средства регулировки Г/ЗС на устройстве воспроизведения персонального компьютера можно использовать и в других комбинациях. Для чисто аппаратной реализации требуется, чтобы сигналы декодировались и выводились в качестве выходных сигналов звуковой платы или самой материнской платы ПК, аналогично тому, как это происходит в устройстве, показанном на фиг.18. Данная реализация позволяет регулировать громкость двух сигналов с использованием аппаратного усиления или ослабления без использования графического интерфейса пользователя (ГИП). Каждая конфигурация имеет свои преимущества:

- Полностью аппаратная; недорогая, органы управления легко доступны и обеспечивают простую регулировку с высокой степенью визуального контроля

- Полностью программная: для реализации Г/ЗС не требуется никакого обновления аппаратуры, обеспечивает высокую гибкость в отношении возможностей и функций регулировки, конечный пользователь имеет возможность индивидуальной настройки ГИП

- Программно-аппаратная: высокая степень визуального контроля механизма регулировки, требуется меньше Ц/А преобразователей, поскольку выводится суммарный сигнал, а не звуковое сопровождение и диалог.

Авто-Г/ЗС на персональных компьютерах

Следует также заметить, что, хотя персональный компьютер можно использовать в качестве устройства индивидуального прослушивания, наушники (которые также являются УИП) часто используются в сочетании с ПК. Таким образом, ПК может выступать в качестве источника сигнала для других УИП. Поэтому, рассмотренные выше варианты осуществления, относящиеся к телевизору и DVD, также можно реализовать применительно к источникам сигнала на ПК, например, в виде гнезда для головного телефона с подключенными к нему регуляторами Г/ЗС. Кроме того, хотя до сих пор были рассмотрены только регулировки Г/ЗС, на ПК можно реализовать также функцию автоподстройки Г/ЗС. В действительности, для расчета параметров сигналов в режиме реального времени требуется центральный процессор (ЦП) или процессор цифрового сигнала (ПЦС), способный производить большое количество операций в секунду. Поэтому, наличие достаточной вычислительной мощности облегчает реализацию функций авто-Г/ЗС на ПК. Все функции авто-Г/ЗС и пользовательские регулировки, рассмотренные в предыдущих разделах, можно реализовать с использованием любых опций аппаратно-программного интерфейса, рассмотренных в предыдущем параграфе. Однако, чисто аппаратная реализация может быть затруднена с учетом необходимой вычислительной мощности и операций в режиме реального времени, необходимых для непрерывного ограничения уровней сигнала. Поэтому, реализовать авто-Г/ЗС предпочтительно либо исключительно программными средствами, либо посредством аппаратных регулировок в сочетании с программным математическим обеспечением.

На фиг.24 показан пользователь в условиях многоканального прослушивания, в которых должно быть 2, 3, 4, 5 или более колонок, хотя на фиг.24 показан случай 5 колонок: левой, центральной, правой, левого окружающего звука и правого окружающего звука. От каждой колонки проходит путь, имеющий частотную характеристику, до каждого уха, в результате чего получается всего 10 путей. Если электрические сигналы, раскачивающие эти колонки, отфильтровать с учетом оценок этих путей прежде, чем объединить их для формирования сигналов правого уха и левого уха, можно создать более реалистичную звуковую сцену для прослушивания через головные телефоны. Это, с очевидностью, полезный результат, поскольку он позволяет слушателю испытывать ощущения многоканального окружающего (объемного) звука, не приобретая многоканальную систему усилителя/колонок. Однако, изобретение должно предоставлять конечному пользователю возможность регулировать Г/ЗС в сочетании с многоканальной пространственной обработкой, чтобы добиваться нужной разборчивости и, в то же время, испытывать ощущения объемного звука с использованием головных телефонов.

Г/ЗС и авто-Г/ЗС на головных телефонах с многоканальной обработкой - используемые в сочетании с головными телефонами системы Долби.

Конструкция, изображенная на фиг.25, основана на том предположении, что, помимо полной аудиопрограммы, предусмотрена отдельная диалоговая дорожка. Поэтому данный конкретный вариант осуществления не дает возможности получать отрицательные отношения Г/ЗС. Однако, если одновременно декодировать две многоканальные программы (звуковое сопровождение и голос), то, варьируя в полном объеме уровни звукового сопровождения и/или голоса, можно получать все возможные отношения Г/ЗС. Согласно фиг.25, полная многоканальная аудиопрограмма (звуковое сопровождение плюс голос) 173 проходит через регулятор 174 общей громкости, который, в конечном итоге, действует как регулятор звукового сопровождения. Пространственная обработка в блоке 175 осуществляется в соответствии с устройствами, известными из уровня техники, и заключается в фильтрации и/или задержке каждого сигнала для создания нужного многоканального эффекта. Однако, перед объединением для формирования двухканальной программы, прослушиваемой на головном телефоне, к соответствующему(им) каналу(ам) примешивается (176) измененный диалоговый сигнал. Процесс пространственной обработки предусматривает поддержку информации о том, на какой колонке должна звучать диалоговая дорожка, и эта информация формируется при операции принятия решения в блоке 178. Большинство аудиопрограмм предусматривает размещение речи либо на центральном канале, либо на правом и левом каналах одновременно (искусственный центр). В рамках данного описания, примем, что диалог поступает только на центральный канал. Когда блок 178 дает команду разместить диалог на центральном канале, блок 181 обработки диалога копирует информацию пространственной обработки (фильтр, время задержки и т.д.) для канала, выбранного для размещения диалога. Сначала диалог 179 регулируется по уровню 180 (регулировка уровня голоса), после чего подвергается обработке (центрального) канала, скопированной из блока 175 многоканальной пространственной обработки. После обработки 181 диалога, колонка, на которую он будет направлен, вновь обращается к 178, после чего сигнал примешивается (176) к соответствующему каналу. Если, например, голос подлежит размещению на левом и правом каналах, то блок 178 будет направлять, через 176, соответствующим образом обработанный голос на каждый из этих каналов и ни на какой другой канал. Уровень звукового сопровождения можно повышать или снижать с помощью регулятора 174, а уровень диалога можно повышать или снижать с помощью регулятора 180, обеспечивая положительные регулировки Г/ЗС, поскольку голос входит в состав полной программы 173. Отрегулированная по Г/ЗС, пространственно обработанная многоканальная программа проходит дальнейшую обработку (согласно уровню техники) в блоке 177 для генерации двухканальной программы, подлежащей прослушиванию на головных телефонах. Эта двухканальная программа подвергается дополнительной регулировке громкости в блоке 182 и поступает в громкоговорители 183 головного телефона. Реализация элементов, известных из уровня техники, рассмотренная в качестве элементов 175 и 177 на фиг.25, относится к головным телефонам системы Долби. Вышеприведенный вариант осуществления Г/ЗС рассчитан на использование головных телефонов системы Долби, а также любых других головных телефонов с многоканальной обработкой, позволяющей преобразовывать многочисленные пространственные каналы сигнала в два канала головного телефона.

Г/ЗС на устройствах воспроизведения “сохраненных программ”

Нелинейное телевидение предоставляет телезрителям значительные преимущества, состоящие в возможности записывать и хранить программы для дальнейшего просмотра. Новейшая техника, устройства записи телепрограмм на жестком диске (некоторые компании, включая TiVo, Replay и Microsoft) отличаются от традиционной техники видеозаписи тем, что обеспечивают способы записи, значительно более удобные для пользователя, предоставляют возможность одновременно записывать несколько каналов и почти мгновенно осуществлять воспроизведение. Весьма вероятно, что, в будущем, телепрограммы будут просматривать, в основном, в записи, в нелинейном режиме, выбирая для просмотра наиболее удобное время. Поэтому, важно внедрить функцию регулировки Г/ЗС в эти устройства воспроизведения. Регулировочная аппаратура может размещаться, частично, в пульте дистанционного управления, в качестве обеспечения ГИП видеоэкрана или в физической аппаратуре механизма воспроизведения. В процессе записи должна записываться вся передаваемая информация, включая отдельную голосовую дорожку. Тогда, механизмы воспроизведения и регулировки будут включать в себя те же компоненты, которые были рассмотрены в предыдущих вариантах осуществления аппаратуры регулировки Г/ЗС и авто-Г/ЗС.

Повторное изготовление

В настоящее время, изготовление аудиопродукции (для вещания, кино, музыки и т.д.) можно рассматривать как многоступенчатую процедуру, которая известна из уровня техники и описана на фиг.26. Звукорежиссер располагает звуками нескольких типов, подлежащими записи для формирования полной аудиопрограммы. Эти звуки 184 можно подразделить на несколько типов, в том числе, звуковые эффекты, музыка, голос и другие звуки. Общепринято, что голосовой сегмент произведения имеет первостепенное значение для понимания фабулы или текста программы или аудиопродукта. Сначала, все эти звуки записываются по отдельности (185). Некоторые звуки не записываются через микрофон, например, звуковые эффекты, которые часто копируются из фонотеки звуковых эффектов. При записи первого оригинала, не обязательно синхронизировать все звуки. Система нелинейных записи и воспроизведения позволяет в процессе формирования программы 186 компоновать звуки с видеосигналом и другими звуками в течение нескольких циклов воспроизведения/записи, нередко, с использованием программного обеспечения, управляющего записью и редактированием. В процессе формирования программы 186, все звуки синхронизируются друг с другом (и с видеосигналом, если он присутствует), смешиваются в определенных отношениях и выводятся в каналы 187 окружающего (объемного) звука в соответствии с предпочтениями звукорежиссера. Например, голоса актеров, разговаривающих на экране, обычно помещают на центральный канал, расположенный ближе всего к экрану. Чтобы передавать или записывать большие объемы информации, часто требуется процесс кодирования или сжатия 188. Если, в случае аналоговой записи и воспроизведения, это делается не всегда, то, при многоканальном цифровом воспроизведении, часто используется тот или иной способ кодирования (для защиты от копирования) и/или сжатия (с потерями или без потерь), в зависимости от носителей записи или требований вещания. Кодированная или сжатая программа подлежит записи или трансляции (189) и воспроизведению или приему (190) конечным пользователем. Из фиг.26 видно, что конечный пользователь не имеет никакой возможности регулировать уровень диалога относительно звукового сопровождения, поскольку регулировка 186 полностью принадлежит изготовителю. После микширования, практически невозможно отделить голос от звукового сопровождения и возвратить его к его исходному качеству записи 184.

Однако изготовитель может вернуться к исходной программе 185, где все элементы записи отделены друг от друга, и отделить голос от звукового сопровождения. Данный вариант осуществления изобретения призван обеспечить средства и возможности получения диалога и звукового сопровождения и повторной записи их по отдельности, чтобы конечный пользователь имел возможность регулировать относительные уровни в соответствии со своими потребностями. На фиг.27 показан один из возможных путей достижения этой цели. Исходная запись 191 практически всех фильмов и многодорожечных аудиопрограмм существует в виде архивированных носителей, полностью отдельных. Кроме того, наряду с этими исходными записями, существует также информация об уровнях и размещении всех дорожек, используемых при изготовлении оригинальной записи. Эта информация используется на двух отдельных многоканальных микшерных пультах 192 (для всего звукового сопровождения) и 193 (только для голоса) для формирования двух отдельных многоканальных программ, которые могут иметь 6 каналов, обозначенных позицией 187, а также больше или меньше, в зависимости от нужных эффектов. Поэтому, режиссерская информация, используемая при обработке 186 оригинальной записи, используется для генерации тех же точно эффектов одновременно для звукового сопровождения и голоса по отдельности. Каждую из этих многоканальных программ можно, таким образом, объединять на выходах 192 и 193 для формирования той же полной программы 187 из оригинального смешанного сигнала, однако они будут полностью отдельными. Каждая из этих многоканальных программ затем кодируется или сжимается, как в блоке 188, но с использованием полностью раздельных блоков 194 и 195. Эти два кодированных канала можно затем дополнительно кодировать или мультиплексировать (196) для получения единого сигнала, подлежащего трансляции или записи (197).

После воспроизведения, этот сигнал декодируется для формирования двух многоканальных сигналов, которые можно регулировать (199) по Г/ЗС аппаратными средствами и с использованием вариантов осуществления, рассмотренных в предыдущих разделах данного описания изобретения.

Повторное изготовление первого оригинала многоканальной аудиопрограммы в виде, удобном для регулировки Г/ЗС, повторное изготовление стереопрограммы в виде, удобном для регулировки Г/ЗС

На фиг.27 представлен наиболее общий способ передачи голоса и звукового сопровождения по отдельности конечному пользователю таким образом, что вся пространственная информация как для звукового сопровождения, так и для голоса поддерживается в ходе воспроизведения, фиг.28 иллюстрирует противоположный край этого спектра, на котором не предусмотрено никакой поддержки пространственной информации, но конечный пользователь имеет возможность независимо регулировать уровни голоса и звукового сопровождения. Исходная запись существует как в виде 185 и 191, так и в виде 200 на фиг.28. Все составляющие, рассматриваемые как звуковое сопровождение (неголосовые элементы полной аудиозаписи) микшируются по уровню только в блоке 201. Это значит, что принимается решение по относительному вкладу одной составляющей звукового сопровождения по отношению к другой составляющей звукового сопровождения, но никакое пространственное позиционирование не производится, поскольку выходной сигнал блока 201 представляет собой единичный сигнал, а не многоканальный сигнал. Кроме того, уровень голоса регулируется (202) таким образом, что при объединении без какой-либо регулировки, уровень голоса по отношению к звуковому сопровождению в точности совпадает с режиссерским замыслом. Программы с отрегулированным голосом и отрегулированным звуковым сопровождением записываются на носитель 203 стереосигнала, который может представлять собой, например, CD, DVD, аналоговые ленты т.п., но могут также включать в себя вещание аудиосигнала в стереоформате. При этом, получается записанная или транслируемая программа в стереоформате, где голос и звуковое сопровождение поддерживаются отдельно на левой и правой или правой и левой дорожке, соответственно. Заметим, что для того, чтобы все изделия уверенно распознавали наличие голоса на правом или левом канале и наличие звукового сопровождения на другом канале, необходимо некоторое соглашение. Его можно выбирать, исходя из консенсуса, достигаемого производителями бытовой электроники, и сущность и объем изобретения не ограничивается тем или иным вариантом выбора. Устройство 204 стереовоспроизведения выдает два сигнала в качестве выходных сигналов (левого и правого), один из которых содержит только голос, а другой - только звуковое сопровождение. Для обеспечения восприятия полной программы одновременно с регулировкой Г/ЗС, эти два сигнала проходят через два усилителя 205 и 206 с регулируемым усилением, осуществляющие регулировку соответствующих уровней, после чего суммируются для формирования полной программы. Эту полную программу можно дополнительно регулировать по уровню регулятором 207. Полностью отрегулированная полная программа расщепляется, если воспроизводится 208 посредством системы стереовоспроизведения. Преимущество такой конфигурации в том, что она дает возможность осуществлять изготовление и воспроизведение программы с Г/ЗС с использованием современных бытовых электронных устройств и исходных записей. Чтобы пользоваться регулировкой Г/ЗС, необходимо лишь минимальное дополнительное оборудование (205, 206, 207). Недостаток состоит в утрате стереоэффекта. Однако, многие стереоэффекты столь слабы, и качество систем воспроизведения столь низко, что большинство потребителей предпочтут стереоэффекту возможность регулировать Г/ЗС.

Два варианта осуществления, рассмотренные выше со ссылками на фиг.27 и 28, представляют самую сложную и самую простую возможности обеспечения конечного пользователя функцией Г/ЗС. Опираясь на вышеприведенное описание изобретения, можно предложить любой вариант осуществления, предусматривающий любое количество записываемых, создаваемых и воспроизводимых каналов, помимо этих двух конкретных вариантов осуществления, представленных на фиг.27 и 28.

Похожие патенты RU2257676C2

название год авторы номер документа
ПОВЫШЕНИЕ РАЗБОРЧИВОСТИ РЕЧИ В ЗВУКОЗАПИСИ РАЗВЛЕКАТЕЛЬНЫХ ПРОГРАММ 2008
  • Мюш Ханнес
RU2440627C2
РЕНДЕРИНГ ОТРАЖЕННОГО ЗВУКА ДЛЯ ОБЪЕКТНО-ОРИЕНТИРОВАННОЙ АУДИОИНФОРМАЦИИ 2013
  • Крокетт Бретт Г.
  • Хукс Спенсер
  • Сифельдт Алан
  • Ландо Джошуа Б.
  • Браун С. Филлип
  • Мехта Срипал С.
  • Марри Стюарт
RU2602346C2
ОПТИМИЗАЦИЯ ГРОМКОСТИ И ДИНАМИЧЕСКОГО ДИАПАЗОНА ЧЕРЕЗ РАЗЛИЧНЫЕ УСТРОЙСТВА ВОСПРОИЗВЕДЕНИЯ 2018
  • Райдмиллер, Джеффри
  • Норкросс, Скотт Грегори
  • Рёден, Карл Йонас
RU2777880C2
ОПТИМИЗАЦИЯ ГРОМКОСТИ И ДИНАМИЧЕСКОГО ДИАПАЗОНА ЧЕРЕЗ РАЗЛИЧНЫЕ УСТРОЙСТВА ВОСПРОИЗВЕДЕНИЯ 2014
  • Райдмиллер Джеффри
  • Норкросс Скотт Грегори
  • Рёден Карл Йонас
RU2665873C1
МЕТОДЫ УЛУЧШЕНИЯ ДИАЛОГОВ 2007
  • Ох Хиен-О
  • Дзунг Йанг Вон
  • Фаллер Кристоф
RU2408164C1
СИСТЕМА, СПОСОБ И ПОСТОЯННЫЙ МАШИНОЧИТАЕМЫЙ НОСИТЕЛЬ ДАННЫХ ДЛЯ ГЕНЕРИРОВАНИЯ, КОДИРОВАНИЯ И ПРЕДСТАВЛЕНИЯ ДАННЫХ АДАПТИВНОГО ЗВУКОВОГО СИГНАЛА 2020
  • Робинсон, Чарльз К.
  • Тсингос, Николас Р.
  • Шабанне, Кристоф
RU2820838C2
СПОСОБ И УСТРОЙСТВО ДЛЯ ТЕРАПИИ ЗВУКАМИ ОКРУЖАЮЩЕЙ СРЕДЫ, ИНТЕРФЕЙС ПОЛЬЗОВАТЕЛЯ И СИСТЕМА УПРАВЛЕНИЯ 2006
  • Дэвис Луис Фишер Мл.
RU2412557C2
СИСТЕМА И СПОСОБ ДЛЯ ГЕНЕРИРОВАНИЯ, КОДИРОВАНИЯ И ПРЕДСТАВЛЕНИЯ ДАННЫХ АДАПТИВНОГО ЗВУКОВОГО СИГНАЛА 2012
  • Робинсон Чарльз К.
  • Тсингос Николас Р.
  • Шабанне Кристоф
RU2731025C2
УСТРОЙСТВО И СПОСОБ ГЕНЕРИРОВАНИЯ ВЫХОДНЫХ ЗВУКОВЫХ СИГНАЛОВ ПОСРЕДСТВОМ ИСПОЛЬЗОВАНИЯ ОБЪЕКТНО-ОРИЕНТИРОВАННЫХ МЕТАДАННЫХ 2009
  • Шрейнер Стефан
  • Физель Вольфганг
  • Нюзингер Матиас
  • Гельмут Оливер
  • Спершнайдер Ральф
RU2604342C2
ОПТИМИЗАЦИЯ ГРОМКОСТИ И ДИНАМИЧЕСКОГО ДИАПАЗОНА ЧЕРЕЗ РАЗЛИЧНЫЕ УСТРОЙСТВА ВОСПРОИЗВЕДЕНИЯ 2014
  • Райдмиллер Джеффри
  • Норкросс Скотт Грегори
  • Реден Карл Йонас
RU2631139C2

Иллюстрации к изобретению RU 2 257 676 C2

Реферат патента 2005 года ПРИКЛАДНОЕ ИСПОЛЬЗОВАНИЕ СИСТЕМЫ ГОЛОС/ЗВУКОВОЕ СОПРОВОЖДЕНИЕ (Г/ЗС)

Изобретение относится к области обработки аудиосигналов для использования в прикладных целях. Многочисленным пользователям предоставляется возможность регулировать соотношение голос/звуковое сопровождение (Г/ЗС) путем приема в первом декодере голосового сигнала и сигнала звукового сопровождения и одновременного приема во втором декодере голосового сигнала и сигнала звукового сопровождения, причем прием сигналов голоса и звукового сопровождения осуществляют по отдельности, и раздельно регулируют в каждом из декодеров принимаемые по отдельности сигналы голоса и звукового сопровождения. Технический результат - создание средства, позволяющего осуществлять индивидуальную регулировку отношения голосового сигнала аудиопрограммы к звуковому сопровождению путем раздельной и независимой регулировки речевого сигнала и громкости звукового сопровождения, которое может включать в себя музыку, смех, звуковые эффекты или другие неречевые звуки, входящие в состав полной аудипрограммы. 2 н. и 25 з.п. ф-лы, 28 ил., 2 табл.

Формула изобретения RU 2 257 676 C2

1. Система кинотеатра, которая выводит кинокартину каждому из многочисленных слушателей таким образом, что допускает индивидуальную регулировку громкости аудиосигнала для многочисленных слушателей, находящихся в кинозале, содержащая видеоустройство, которое отображает видеосоставляющую кинокартины на аудиторию, систему колонок, которая излучает соответствующую аудиосоставляющую кинокартины на аудиторию, один или несколько элементов носителя информации, в которых хранятся видеосоставляющая кинокартины, соответствующая аудиосоставляющая кинокартины, первый аудиосигнал, являющийся, в основном, вокальным сигналом и имеющий один или несколько каналов пространственной информации, и второй аудиосигнал, содержащий, в основном, аудиоинформацию, отличную от аудиоинформации первого аудиосигнала, и имеющий один или несколько каналов пространственной информации передатчик, который передает первый и второй аудиосигналы из одного или нескольких элементов носителя информации синхронно с передачей видеосоставляющей и соответствующей аудиосоставляющей кинокартины на многочисленные устройства индивидуального прослушивания, причем каждое из устройств индивидуального прослушивания связано с каждым из многочисленных слушателей в кинозале, и каждое из устройств индивидуального прослушивания содержит первый приемник, который принимает передаваемый первый аудиосигнал независимо от системы колонок, второй приемник, который принимает передаваемый второй аудиосигнал независимо от системы колонок, первое регулировочное устройство, которое регулирует первый аудиосигнал на основании входных сигналов, поступающих от пользователя, второе регулировочное устройство, которое регулирует второй аудиосигнал на основании входных сигналов, поступающих от пользователя, устройство объединения аудиосигналов, которое объединяет каналы пространственной информации первого аудиосигнала с соответствующими каналами пространственной информации второго аудиосигнала для создания объединенного аудиосигнала, и один или несколько преобразователей, которые принимают объединенный аудиосигнал, преобразуют объединенный аудиосигнал в звуки и выводят звуки таким образом, чтобы их мог слышать каждый из многочисленных слушателей, связанных с каждым из многочисленных устройств индивидуального прослушивания, находящихся в кинозале, причем система позволяет каждому из многочисленных слушателей регулировать первый и второй аудиосигналы независимо от других слушателей, находящихся в кинозале.2. Система по п.1, отличающаяся тем, что, по меньшей мере, один из аудиосигналов, первый или второй, является монофоническим сигналом или стереофоническим сигналом, причем стереофонический сигнал имеет левый и правый каналы пространственной информации, или сигналом окружающего звука, причем сигнал окружающего звука имеет каналы пространственной информации, которые включают в себя левый, центральный, правый каналы и один или несколько каналов окружающего звука, или многоканальным сигналом окружающего звука, причем многоканальный сигнал окружающего звука имеет каналы пространственной информации, которые включают в себя левый, левый центральный, центральный, правый центральный, правый каналы и один или несколько каналов окружающего звука.3. Система по п.1, отличающаяся тем, что первое и второе регулировочные устройства являются усилителями активной регулировки громкости или аттенюаторами пассивной регулировки громкости или объединены в единое устройство регулировки громкости.4. Система по п.3, отличающаяся тем, что при смещении устройства регулировки громкости в одном направлении, громкость первого аудиосигнала возрастает, тогда как громкость второго аудиосигнала убывает, а при смещении устройства регулировки громкости в другом направлении, громкость второго аудиосигнала возрастает, тогда как громкость первого аудиосигнала убывает.5. Система по п.1, отличающаяся тем, что первый приемник принимает первый цифровой битовый поток, который содержит первый аудиосигнал, а второй приемник принимает второй цифровой битовый поток, который содержит второй аудиосигнал, и система дополнительно содержит первый декодер, который декодирует первый цифровой битовый поток, и второй декодер, который декодирует второй цифровой битовый поток.6. Система по п.1, отличающаяся тем, что первый приемник и второй приемник интегрированы в единый приемник, при этом единый приемник принимает единый цифровой битовый поток, который содержит первый аудиосигнал и второй аудиосигнал, и система дополнительно содержит единый декодер, который декодирует единый цифровой битовый поток.7. Система по п.1, отличающаяся тем, что первый и второй приемники принимают беспроводные передачи.8. Система по п.1, отличающаяся тем, что устройства индивидуального прослушивания представляют собой, по меньшей мере, стереонаушники, монофонические головные телефоны, слуховые аппараты, вспомогательные устройства прослушивания или портативные приемники, причем портативные приемники выдают объединенный аудиосигнал на один или несколько электроакустических преобразователей, или, по меньшей мере, сотовый телефон, устройство беспроводной связи, портативный компьютер, электронную записную книжку, персональное устройство воспроизведения аудиосигнала, телевизор или проигрыватель цифрового универсального диска (DVD, ЦУД).9. Система по п.1, отличающаяся тем, что дополнительно содержит, по меньшей мере, волновод и/или усилитель для доставки объединенного аудиосигнала и процессор, который вычисляет отношение громкости первого аудиосигнала к громкости второго аудиосигнала, причем, по меньшей мере, одно из устройств, а именно, первое регулировочное устройство, второе регулировочное устройство или устройство объединения аудиосигналов, автоматически регулирует и поддерживает отношение громкости первого аудиосигнала к громкости второго аудиосигнала, при этом процессор вычисляет стандартное отклонение аудиосигнала за конечный период времени, а отношение сохраняется в памяти для использования устройством объединения аудиосигналов, кроме того, пользователь управляет первым и вторым регулировочными устройствами посредством графического интерфейса пользователя, а первое регулировочное устройство и второе регулировочное устройство подключены к единому управляемому пользователем устройству регулировки громкости, причем единое управляемое пользователем устройство регулировки громкости предназначено для регулировки громкости проходящего через него объединенного аудиосигнала таким образом, что при смещении единого управляемого пользователем устройства регулировки громкости в одном направлении возрастает уровень громкости первого аудиосигнала и убывает уровень громкости второго аудиосигнала, а при смещении единого управляемого пользователем устройства регулировки громкости в другом направлении возрастает громкость второго аудиосигнала и убывает громкость первого аудиосигнала.10. Система по п.1, отличающаяся тем, что соответствующая аудиосоставляющая кинокартины хранится в качестве первого аудиосигнала и второго аудиосигнала.11. Система по п.1, отличающаяся тем, что представляет собой компьютер, а первое и второе регулировочные устройства функционируют с использованием, по меньшей мере, программного и/или аппаратного обеспечения компьютера.12. Система по п.1, отличающаяся тем, что дополнительно содержит третье регулировочное устройство, которое регулирует громкость объединенного аудиосигнала, причем третье регулировочное устройство содержит управляемый пользователем переключатель, который мгновенно обеспечивает оригинальное режиссерское микширование первого аудиосигнала и второго аудиосигнала, или процессор окружающего звука, который преобразует объединенный аудиосигнал в аудиосигнал, имеющий заданное количество каналов пространственной информации, причем процессор окружающего звука преобразует объединенный аудиосигнал, имеющий левый, центральный, правый, правый окружающего звука и левый окружающего звука каналы пространственной информации, в сигнал, имеющий только левый и правый каналы пространственной информации.13. Система по п.1, отличающаяся тем, что второй аудиосигнал содержит, по меньшей мере, часть первого аудиосигнала.14. Способ функционирования системы кинотеатра, которая выводит кинокартину каждому из многочисленных слушателей таким образом, что допускает индивидуальную регулировку громкости аудиосигнала для многочисленных слушателей, находящихся в кинозале, заключающийся в том, что отображают видеосоставляющую кинокартины на аудиторию, выводят соответствующую аудиосоставляющую кинокартины на аудиторию с использованием системы колонок, обеспечивают один или несколько элементов носителя информации, где хранятся видеосоставляющая кинокартины, соответствующая аудиосоставляющая кинокартины, первый аудиосигнал, являющийся, в основном, вокальным сигналом и имеющий один или несколько каналов пространственной информации, и второй аудиосигнал, содержащий, в основном, аудиоинформацию, отличную от аудиоинформации первого аудиосигнала, и имеющий один или несколько каналов пространственной информации, передают первый и второй аудиосигналы из одного или нескольких элементов носителя информации синхронно с передачей видеосоставляющей и соответствующей аудиосоставляющей кинокартины, принимают передаваемые первый и второй аудиосигналы с использованием многочисленных устройств индивидуального прослушивания, которые не зависят от системы колонок, причем каждое из многочисленных устройств индивидуального прослушивания связано с каждым из многочисленных слушателей в кинозале, регулируют первый аудиосигнал на основании входных сигналов, поступающих от пользователя, регулируют второй аудиосигнал на основании входных сигналов, поступающих от пользователя, объединяют каналы пространственной информации первого аудиосигнала с соответствующими каналами пространственной информации второго аудиосигнала для создания объединенного аудиосигнала, преобразуют объединенный аудиосигнал в звуки с использованием одного или нескольких преобразователей и выводят звуки таким образом, чтобы их мог слышать каждый из многочисленных слушателей, причем позволяют каждому из многочисленных слушателей регулировать первый и второй аудиосигналы независимо от других многочисленных слушателей.15. Способ по п.14, отличающийся тем, что, по меньшей мере, один из аудиосигналов, первый или второй, является монофоническим сигналом или стереофоническим сигналом, причем стереофонический сигнал имеет левый и правый каналы пространственной информации, или сигналом окружающего звука, причем сигнал окружающего звука имеет каналы пространственной информации, которые включают в себя левый, центральный, правый каналы и один или несколько каналов окружающего звука, или многоканальным сигналом окружающего звука, причем многоканальный сигнал окружающего звука имеет каналы пространственной информации, которые включают в себя левый, левый центральный, центральный, правый центральный, правый каналы и один или несколько каналов окружающего звука.16. Способ по п.14, отличающийся тем, что операции регулировки осуществляют с использованием усилителей активной регулировки громкости или аттенюаторов пассивной регулировки громкости или единого устройства регулировки громкости.17. Способ по п.16, отличающийся тем, что при смещении устройства регулировки громкости в одном направлении громкость первого аудиосигнала возрастает, тогда как громкость второго аудиосигнала убывает, а при смещении устройства регулировки громкости в другом направлении громкость второго аудиосигнала возрастает, тогда как громкость первого аудиосигнала убывает.18. Способ по п.14, отличающийся тем, что при приеме принимают первый цифровой битовый поток, который содержит первый аудиосигнал, и второй цифровой битовый поток, который содержит второй аудиосигнал, при этом дополнительно декодируют первый цифровой битовый поток и декодируют второй цифровой битовый поток.19. Способ по п.14, отличающийся тем, что прием осуществляют с использованием единого приемника и при приеме принимают единый

цифровой битовый поток, который содержит первый аудиосигнал и второй аудиосигнал, при этом дополнительно декодируют единый цифровой битовый поток.

20. Способ по п.14, отличающийся тем, что при приеме принимают беспроводные передачи.21. Способ по п.14, отличающийся тем, что в качестве устройств индивидуального прослушивания используют, по меньшей мере, стереонаушники, монофонические головные телефоны, слуховые аппараты, вспомогательные устройства прослушивания или портативные приемники, причем портативные приемники выдают объединенный аудиосигнал на один или несколько электроакустических преобразователей, или, по меньшей мере, сотовый телефон, устройство беспроводной связи, портативный компьютер, электронную записную книжку, персональное устройство воспроизведения аудиосигнала, телевизор или проигрыватель цифрового универсального диска (DVD, ЦУД).22. Способ по п.14, отличающийся тем, что дополнительно доставляют объединенный аудиосигнал с использованием, по меньшей мере, волновода и/или усилителя.23. Способ по п.14, отличающийся тем, что дополнительно вычисляют отношение громкости первого аудиосигнала к громкости второго аудиосигнала и автоматически регулируют и поддерживают отношение громкости первого аудиосигнала к громкости второго аудиосигнала, причем при операции вычисления вычисляют стандартное отклонение аудиосигнала за конечный период времени, при этом дополнительно сохраняют в памяти отношение для использования устройством объединения аудиосигналов, а операции регулировки осуществляют с помощью пользователя посредством графического интерфейса пользователя или с использованием единого управляемого пользователем устройства регулировки громкости, причем единое управляемое пользователем устройство регулировки громкости предназначено для регулировки громкости проходящего через него объединенного аудиосигнала таким образом, что при смещении единого управляемого пользователем устройства регулировки громкости в одном направлении возрастает уровень громкости первого аудиосигнала и убывает уровень громкости второго аудиосигнала, а при смещении единого управляемого пользователем устройства регулировки громкости в другом направлении возрастает громкость второго аудиосигнала и убывает громкость первого аудиосигнала, или с использованием, по меньшей мере, программного и/или аппаратного обеспечения компьютера.24. Способ по п.14, отличающийся тем, что соответствующую аудиосоставляющую кинокартины хранят в качестве первого аудиосигнала и второго аудиосигнала.25. Способ по п.14, отличающийся тем, что дополнительно регулируют громкость объединенного аудиосигнала, причем при регулировке объединенного аудиосигнала используют управляемый пользователем переключатель, который мгновенно обеспечивает оригинальное режиссерское микширование первого аудиосигнала и второго аудиосигнала.26. Способ по п.25, отличающийся тем, что при регулировке объединенного аудиосигнала преобразуют объединенный аудиосигнал в аудиосигнал, имеющий заданное количество каналов пространственной информации, причем при операции преобразования преобразуют объединенный аудиосигнал, имеющий левый, центральный, правый, правый окружающего звука и левый окружающего звука каналы пространственной информации, в сигнал, имеющий только левый и правый каналы пространственной информации.27. Способ по п.14, отличающийся тем, что второй аудиосигнал содержит, по меньшей мере, часть первого аудиосигнала.

Документы, цитированные в отчете о поиске Патент 2005 года RU2257676C2

US 5617331 А, 01.04.1997
US 5155770 A, 13.10.1992
US 5285503 A, 08.02.1994
US 5852800 A, 22.12.1998
ПРОСТРАНСТВЕННАЯ ЗВУКОВОСПРОИЗВОДЯЩАЯ СИСТЕМА 1996
  • Ефремов Владимир Анатольевич
RU2106075C1

RU 2 257 676 C2

Авторы

Водри Майкл А.

Сондерс Уилльям Р.

Даты

2005-07-27Публикация

2001-01-30Подача