Показать метаданные Скрыть метаданные

(19)

(11)

2 195 715

(13)

(51)

МПК

G10L19/00(2000-01-01)

(21) (22)

Заявка

2001113835/09, 2001-05-21

(24)

Дата начала отсчета патента

2001-05-21

(22)

дата подачи заявки

2001-05-21

(45)

опубликовано

2002-12-27

(72)

авторы

Лобашев А.И.Тарусов В.А.Тюлегенев А.О.Устинов А.А.

(73)

патентообладатели

Военный Университет Связи

(56)

Документы, цитированные в отчете о поиске

WO 00/22610 A1, 20.04.2000US 6138089 А, 24.10.2000.

СПОСОБ СЖАТИЯ И ВОССТАНОВЛЕНИЯ РЕЧЕВЫХ СООБЩЕНИЙ Российский патент 2002 года по МПК G10L19/00

Описание патента на изобретение RU2195715C1

Изобретение относится к области электросвязи, а именно к области, связанной с сокращением избыточности передаваемой информации. Предлагаемый способ может быть использован для передачи речевых сообщений по цифровым каналам связи со скоростью до 4 кбит/с и может быть отнесен к классу способов кодирования формы речевого сигнала или способов непосредственного кодирования-восстановления.

Известны способы кодирования формы речевого сигнала, см., например, книгу: Дж. Кейтер Компьютеры - синтезаторы речи. - М.: Мир, 1985, с.87-103, включающие выполнение трех операций: временную дискретизацию аналоговых сигналов, их квантование и кодирование (представление квантованных дискретных отсчетов речевого сигнала двоичными цифрами). Рассматриваемый способ главным образом определяет механизм кодирования и декодирования квантованных дискретных отсчетов речевого сигнала.

Известны также способы кодирования дискретных квантованных отсчетов речевого сигнала на основе дельта-модуляции, адаптивной дельта-модуляции, импульсно-кодовой модуляции, дифференциальной импульсно-кодовой модуляции, метода блочного кодирования с ортогональным преобразованием, см., например, книгу: Назаров М.В., Петров Ю.Н. Методы цифровой обработки и передачи цифровых сигналов. - M.: Радио и связь, 1985, с.142-161. Недостатком перечисленных выше способов-аналогов является относительно низкая информационная эффективность, под которой понимается достижение определенного качества восстановления речевой информации при заданной скорости передачи. В рассмотренных способах-аналогах приемлемое качество восстановления речевой информации достигается при скорости передачи более 16 кбит/с.

Аналогом является также способ, описанный в патенте Великобритании 2280827 А, МПК⁷ G 10 L 3/02 от 08.02.1995. Известный способ включает дискретизацию непрерывного сигнала, квантование дискретных отсчетов, формирование матрицы квантованных отсчетов речевого сигнала, ее преобразование к цифровому виду с использованием американского стандарта сжатия JPEG, передаче цифрового потока по каналу связи, приеме цифрового потока из канала связи, восстановлении матрицы квантованных отсчетов речевого сигнала из цифрового потока с использованием стандарта JPEG и обратном преобразовании квантованных отсчетов в непрерывный речевой сигнал. Однако недостатком этого способа является большая временная задержка речевого сигнала, что исключает возможность применения данного способа для ведения телефонных переговоров по цифровым каналам связи.

Наиболее близким по своей технической сущности к заявленному способу сжатия и восстановления речевых сообщений является способ, описанный в патенте России 2152646 А, МПК⁷ G 10 L 3/02 от 2000 г.

Способ-прототип включает дискретизацию непрерывного речевого сигнала, квантование дискретных отсчетов, формирование матрицы квантованных отсчетов речевого сигнала размером N•N элементов, преобразование матрицы квантованных отсчетов речевого сигнала размером N•N элементов к цифровому виду путем генерации случайной квадратной матрицы квантованных отсчетов размером m•m элементов, формировании множества нулевых и единичных элементов в виде прямоугольных матриц размером N•m и m•N элементов, генерации случайных матриц размером N•m и m•N элементов, преобразовании матриц размером N•m и m•N элементов путем деления элементов каждой строки матрицы размером N•m элементов на сумму единиц соответствующей строки и деления элементов каждого столбца матрицы размером m•N элементов на сумму единиц соответствующего столбца, вычислении матрицы восстановленных отсчетов речевого сигнала размером N•N элементов, вычислении суммы квадратов разностей между элементами полученной в результате перемножения матрицы восстановленных отсчетов речевого сигнала размером N•N элементов и элементами матрицы квантованных отсчетов речевого сигнала размером N•N элементов, последовательной инверсии i-того элемента матриц m•N и N•m элементов, вычислении матрицы восстановленных отсчетов речевого сигнала размером N•N элементов с инвертированным элементом, вычислении суммы квадратов разностей между элементами матрицы восстановленных отсчетов речевого сигнала размером N•N элементов и элементами матрицы квантованных отсчетов речевого сигнала размером N•N элементов, сравнении вычисленных ошибок и сохранении значения инвертированного i-того элемента матриц m•N и N•m элементов если разность больше нуля и инвертировании повторно i-той элемента матриц m•N и N•m элементов, если разность меньше нуля, передачи множества нулевых и единичных элементов прямоугольных матриц размером N•m и m•N элементов по каналу связи, приему множества нулевых и единичных элементов матриц размером N•m и m•N элементов из канала связи, формировании матрицы восстановленных отсчетов речевого сигнала размером N•N элементов, преобразовании матрицы восстановленных отсчетов речевого сигнала размером N•N элементов в непрерывный речевой сигнал.

Способ-прототип позволяет снизить значение временной задержки передаваемой информации до величины, при которой возможно ведение телефонных переговоров по низкоскоростным цифровым каналам связи.

Недостатком этого способа-прототипа является относительно большая требуемая пропускная способность цифрового канала связи (4-8 кбит/с), что ограничивает возможность применения данного способа для ведения телефонных переговоров по низкоскоростным цифровым каналам связи.

Целью изобретения является разработка способа сжатия и восстановления речевых сообщений, обеспечивающего снижение требуемой пропускной способности цифрового канала связи, при которой возможно ведение телефонных переговоров по низкоскоростным цифровым каналам связи.

Поставленная цель достигается тем, что в известном способе сжатия и восстановления речевых сообщений, заключающемся в том, что предварительно идентично генерируют на передающей и приемной сторонах случайную квадратную матрицу квантованных отсчетов размером m•m элементов, каждый элемент которой принадлежит диапазону квантованных дискретных отсчетов речевого сигнала, дискретизируют непрерывный речевой сигнал, квантуют дискретные отсчеты, формируют матрицу квантованных отсчетов речевого сигнала размером N•N элементов, формируют множество единичных и нулевых элементов в виде прямоугольных матриц размером N•m и m•N элементов, передают множество единичных и нулевых элементов по каналу связи, принимают его из канала связи, формируют матрицу восстановленных отсчетов речевого сигнала размером N•N элементов и преобразуют матрицу восстановленных отсчетов речевого сигнала в непрерывный речевой сигнал, для формирования множества единичных и нулевых элементов в виде прямоугольных матриц размером N•m и m•N элементов на передаче предварительно генерируют из множества единичных и нулевых элементов случайным образом нечетные элементы каждого столбца матрицы размером m•N элементов и нечетные элементы каждой строки матрицы размером N•m элементов.

Затем присваивают четным элементам каждого столбца матрицы размером m•N элементов и четным элементам каждой строки матрицы размером N•m элементов инвертированные значения предшествующих по номеру нечетных элементов столбцов и строк матрицы размером m•N элементов и матрицы размером N•m элементов соответственно.

После этого преобразуют матрицы размером N•m и m•N элементов путем деления элементов каждой строки матрицы размером N•m элементов на сумму единиц соответствующей строки и деления элементов каждого столбца матрицы размером m•N элементов на сумму единиц соответствующего столбца, вычисляют матрицу восстановленных отсчетов речевого сигнала размером N•N элементов путем перемножения полученной после преобразования прямоугольной матрицы размером N•m элементов с ранее идентично сформированной на передающей и приемной сторонах случайной квадратной матрицей квантованных отсчетов размером m•m элементов и полученной после преобразования матрицей размером m•N элементов, вычисляют сумму квадратов разностей между элементами полученной в результате перемножения матрицы восстановленных отсчетов речевого сигнала размером N•N элементов и соответствующими элементами матрицы квантованных отсчетов речевого сигнала размером N•N элементов.

Затем последовательно инвертируют каждый нечетный элемент столбцов матрицы размером m•N элементов и каждый нечетный элемент строк матрицы размером N•m элементов и одновременно инвертируют последующие по номеру четные элементы столбцов матрицы размером m•N элементов и последующие по номеру четные элементы строк матрицы размером N•m элементов. Преобразуют матрицы размером N•m и m•N элементов путем деления элементов каждой строки матрицы размером N•m элементов на сумму единиц соответствующей строки и деления элементов каждого столбца матрицы размером m•N элементов на сумму единиц соответствующего столбца, вычисляют матрицу восстановленных отсчетов речевого сигнала размером N•N элементов путем перемножения полученной после преобразования прямоугольной матрицы размером N•m элементов с ранее идентично сформированной на передающей и приемной сторонах случайной квадратной матрицей квантованных отсчетов размером m•m элементов и полученной после преобразования матрицы размером m•N элементов. Вычисляют сумму квадратов разностей между элементами полученной в результате этого перемножения матрицы восстановленных отсчетов речевого сигнала размером N•N элементов и соответствующими элементами матрицы квантованных отсчетов речевого сигнала размером N•N элементов и вычитают эту сумму из полученной до инвертирования элемента суммы квадратов разностей между элементами матрицы восстановленных отсчетов речевого сигнала размером N•N элементов и элементами матрицы квантованных отсчетов речевого сигнала размером N•N элементов. В случае положительной разности - сохраняют значения инвертированных элементов, а в случае отрицательной разности - их повторно инвертируют. Затем сформированные множества нулевых и единичных элементов в виде нечетных элементов каждого столбца матрицы размером m•N элементов и нечетных элементов каждой строки матрицы размером N•m элементов передают в канал связи. Для формирования матрицы восстановленных отсчетов речевого сигнала размером N•N элементов восстанавливают недостающие четные элементы каждого столбца матрицы размером m•N элементов и четные элементы каждой строки матрицы размером N•m элементов, присваивая им инвертированные значения предшествующих по номеру нечетных элементов столбцов и строк матрицы размером m•N элементов и матрицы размером N•m элементов соответственно.

Предлагаемый способ позволяет перейти от представления речевого сигнала в виде матрицы квантованных отсчетов размером N•N элементов (для передачи каждого элемента которой требуется 8 бит) к представлению речевого сигнала в виде произведения трех матриц, одну из которых передавать по каналу связи нет необходимости (она заранее формируется на передающей и приемной сторонах), а две другие преобразуют в целочисленные матрицы (для передачи каждого элемента которых требуется 1 бит) и их размер меньше исходной матрицы квантованных отсчетов речевого сигнала (N•m и m•N элементов, m<N). Более того, наложение ограничений на структуру этих матриц позволяет передавать их по каналу связи в усеченном виде (только их нечетные строки или столбцы), что позволяет снизить значение величины требуемой пропускной способности канала до величины, при которой возможно ведение телефонных переговоров по низкоскоростным цифровым каналам связи.

Проведенный анализ уровня техники позволил установить, что аналоги, характеризующиеся совокупностью признаков, тождественными всем признакам заявленного технического решения, отсутствуют, что указывает на соответствие заявленного способа условию патентоспособности "новизна". Результаты поиска известных решений в данной и смежных областях техники с целью выявления признаков, совпадающих с отличительными от прототипа признаками заявленного способа, показали, что они не следуют явным образом из уровня техники. Из уровня техники также не выявлена известность влияния предусматриваемых существенными признаками заявленного изобретения преобразовании на достижение указанного технического результата. Следовательно, заявленное изобретение соответствует условию патентоспособности "изобретательский уровень".

Заявленный способ поясняется чертежами.

- Фиг.1 График кривой, описывающей форму непрерывного речевого сигнала.

- Фиг.2 Пример квантованных дискретных отсчетов речевого сигнала.

- Фиг. 3 Пример формирования матрицы квантованных отсчетов речевого сигнала размером N•N элементов.

- Фиг. 4 Представление матрицы восстановленных квантованных отсчетов речевого сигнала в виде произведения трех матриц.

- Фиг.5 Структура матриц [Y]_Nxm, [X]_mxN, и [Y_pr]_Nxm, [X_pr]_mxN.

- Фиг.6 Преобразование матрицы квантованных отсчетов речевого сигнала к цифровому виду и обратное преобразование принятого из канала связи цифрового потока в матрицу восстановленных отсчетов речевого сигнала.

- Фиг.7 Последовательная оптимизация элементов матриц [Х]_mxN и [Y]^T _mxN.

Возможность реализации заявленного способа сжатия и восстановления речевых сообщений при сохранении хорошего качества восстановления (высокой разборчивости и узнаваемости речи) объясняется следующим. Существует традиционный подход, когда с целью сокращения объема информации, который необходимо передать по каналу связи в единицу времени, каждое кодируемое сообщение (блок последовательных отсчетов в виде матрицы квантованных отсчетов речевого сигнала), представляется своей оценкой в виде произведения матрицы опорных векторов (базиса) на матрицу коэффициентов разложения. Получатель, используя принятые коэффициенты разложения и базис, осуществляет восстановление сообщений источника. Примеры такого подхода известны: дискретное косинусное преобразование, быстрое преобразование Фурье, преобразование Карунена-Лоэва, Вейвлет-преобразования и другие. Использование этих методов не позволяет достичь требуемого коэффициента сжатия при хорошем качестве восстановления речи. То есть объем информации, который необходимо передать по каналу связи в единицу времени при сохранении хорошего качества восстановления речевых сообщений, велик за счет больших размерностей и разрядности матрицы опорных векторов (базиса).

В предлагаемом способе опорные вектора (базис) не передаются, а формируются на приемной стороне из случайной матрицы и принятых из канала связи целочисленных коэффициентов.

Предлагаемый способ предполагает проведение следующих действий.

Формирование случайной квадратной матрицы квантованных отсчетов [B]_mxm может быть выполнено на основе датчика случайных чисел, например на основе шумового диода. Для выполнения требования идентичности матрицы [B]_mxm приемника, аналогичной матрице передатчика, перед началом каждого сеанса связи элементы матрицы [B]_mxm могут быть сгенерированы на передаче и переданы но цифровому каналу связи на приемную сторону, например, в составе синхропосылки.

Дискретизацию непрерывного речевого сигнала, представленного на фиг.1, выполняют в соответствии с теоремой Котельникова. В предлагаемом способе выбрана общепринятая частота дискретизации непрерывного речевого сигнала 8 кГц.

Затем осуществляют квантование дискретных отсчетов. Квантование осуществляется на основе способов, описанных, например, в кн.: Назаров М.В., Петров Ю.Н. Методы цифровой обработки и передачи цифровых сигналов. - М.: Радио и связь, 1985, с. 142-161.

Далее, на основе множества квантованных дискретных отсчетов речевого сигнала осуществляют формирование матрицы квантованных отсчетов речевого сигнала [A]_NxN. Формирование матрицы квантованных отсчетов речевого сигнала [A]_NxN показано на фиг.3. При этом матрица квантованных отсчетов формируется из N² квантованных дискретных отсчетов речевого сигнала, каждому элементу которой А, где j=1,2,...,N; i=1,2,...,N присваивают квантованное значение отсчета речевого сигнала, k-й номер которого определяют в соответствии с выражением: k=j+N•(i-1).

Для преобразования матрицы квантованных отсчетов речевого сигнала [A]_NxN с целью уменьшения объема информации, передаваемого по каналу связи, используют подход, основанный на представлении матрицы [A]_NxN в виде произведения трех матриц: прямоугольной матрицы размером N•m элементов (в дальнейшем обозначим ее как [Y_pr]_Nxm), случайной квадратной матрицы квантованных отсчетов размером m•m элементов (в дальнейшем обозначим ее как [B]_mxm) и прямоугольной матрицы размером m•N элементов (в дальнейшем обозначим ее как [Х_pr] _mxN). Тогда, при кодировании матрицы квантованных отсчетов речевого сигнала [A] _NxN, на передаче необходимо найти такие оптимальные матрицы [Y_pr]_Nxm и [Х_pr]_mxN, которые при перемножении с матрицей [B]_mxm образуют некоторую матрицу восстановленных дискретных отсчетов речевого сигнала размером N•N элементов (в дальнейшем обозначим эту матрицу как ), наиболее близкую по заданному критерию к матрице квантованных дискретных отсчетов речевого сигнала [A]_NxN.

Особенностью матриц [Y_pr]_Nxm и [X_pr]_mxN является то, что они могут быть легко приведены к цифровому виду. Это достигается тем, что на элементы этих матриц накладываются следующие ограничения:
- элементы матриц [Y_pr]_Nxm и [X_pr]_mxN принимают значения в диапазоне от нуля до единицы;
- ненулевые элементы каждой строки матрицы [Y_pr]_Nxm равны между собой и в сумме образуют единицу;
- ненулевые элементы каждого столбца матрицы [X_pr]_mxN равны между собой и в сумме образуют единицу;
При таких ограничениях если элементы каждой строки матрицы [Y_pr]_Nxm умножить на количество ненулевых элементов в этой строке, то будет получена матрица [Y] _Nxm, элементы которой определены только на множестве "1" и "0". Аналогично, если элементы каждого столбца матрицы [X_pr]_mxN умножить на количество ненулевых элементов в столбце, то будет получена матрица [X]_mxN, элементы которой определены только на множестве "1" и "0".

Так как при поиске оптимальных матриц [Y_pr]_Nxm и [X_pr]_mxN осуществляют не полный перебор всех возможных значений элементов столбцов и строк матриц [Y]_Nxm и [Х]_mxN, то можем накладывать ограничения на структуру матриц [Y]_Nxm и [X]_mxN и на процесс оптимизации этих матриц с целью уменьшения количества информации, которую нужно будет в дальнейшем передавать по каналам связи.

Процедура, реализующая поиск на передаче оптимальных матриц [Y]_Nxm и [X] _mxN подробно описана в Приложении 1.

Таким образом, представление матрицы квантованных отсчетов речевого сигнала [A] _NxN к цифровому виду на передаче осуществляют на основе формирования множества нулевых и единичных элементов в виде прямоугольных матриц размером N•m (матрица [Y]_Nxm) и m•N (матрица [X]_mxN) элементов.

После определения оптимальных матриц [Y_pr]_Nxm и [X_pr]_mxN передают в канал связи не все значения матриц [Y]_Nxm и [X]_mxN, а только значения нечетных элементов каждого столбца матрицы [X]_mxN и нечетных элементов каждой строки матрицы [Y]_Nxm.

Принимают из канала связи значения нечетных элементов каждого столбца матрицы [X] _mxN и нечетных элементов каждой строки матрицы [Y]_Nxm, восстанавливают недостающие четные элементы строк и столбцов матриц [Y]_Nxm и [X] _mxN. При этом четным элементам каждого столбца матрицы [X]_mxN и четным элементам каждой строки матрицы [Y] _Nxm присваивают инвертированные значения предшествующих по номеру элементов столбца для матрицы [X]_mxN и строки для матрицы [Y]_Nxm.

После приема из канала связи цифрового потока и восстановления матриц [Y]_Nxm и [X]_Nxm их преобразуют в матрицы [Y_pr]_Nxm и [X_pr]_mxN соответственно. Преобразование выполняют путем деления элементов каждой строки матрицы [Y] _Nxm на сумму единиц соответствующей строки и деления элементов каждого столбца матрицы [X]_mxN на сумму единиц соответствующего столбца. После этого формируют матрицу восстановленных отсчетов речевого сигнала путем перемножения матриц [Y_pr]_Nxm и [X_pr]_mxN и ранее сформированной квадратной матрицы квантованных дискретных отсчетов [В] _mxm в соответствии с выражением и выполняют обратное преобразование из матрицы восстановленных квантованных отсчетов речевого сигнала в непрерывный речевой сигнал. Наглядно представление матрицы восстановленных дискретных отсчетов речевого сигнала в виде произведения трех матриц представлено на фиг.4.

Для оценки эффективности предлагаемого способа сжатия и восстановления речевых сообщений было проведено имитационное моделирование на ПЭВМ. При кодировании речевых сообщений использовалось 8-разрядное АЦП. При этом размер кодируемого блока составлял 16•16 элементов, что обеспечивало задержку передачи речи 32 мс. Такая величина временной задержки передаваемой информации ниже временной задержки, реализуемой в способе-прототипе (в способе-прототипе величина временной задержки речевого сигнала составляет 72 мс). Задержка 32 мс позволяет осуществить ведение дуплексных телескопных переговоров по низкоскоростным каналам связи. Размер случайной квадратной матрицы квантованных дискретных отсчетов составлял 8•8 элементов. В предлагаемом способе высокая степень сжатия речевой информации достигалась за счет того, что для формирования на приеме матрицы восстановленных отсчетов речевого сигнала [A] _NxN в цифровой канал связи необходимо передать количество двоичных единиц, определяемое размерами матриц [Y]_Nxm и [X]_mxN с учетом того, что передавать их надо в усеченном (ровно в 2 раза) виде. При этом достигаемый коэффициент сжатия (коэффициент уменьшения требуемой скорости передачи цифрового потока) может быть найден по формуле

где L - число уровней квантования дискретных отсчетов речевого сигнала.

При выборе N= 16, m=8 (L=256) обеспечивался коэффициент сжатия 16 раз (скорость передачи на выходе кодера - 4 [кбит/с]). При выборе размера случайной матрицы квантованных отсчетов речевого сигнала 6•6 элементов коэффициент сжатия речевых сообщений составил 21.3 раз (скорость передачи на выходе кодера - 3 [кбит/с]). Качество восстановленной речи на приеме оценивалось по соотношению сигнал/шум и составило около 8 [дБ]. При этом восстановленная речь сохраняет свою естественность, натуральность и обладает хорошей разборчивостью. Анализ вычислительной сложности показал, что сложность кодирования/декодирования предлагаемой процедуры (количество операций умножения, деления, сложения, вычитания) пропорционально приблизительно величине m². Поэтому, предлагаемый способ сжатия и восстановления речи может быть реализован на современных процессорах обработки сигналов.

Приложение 1.

Процедура поиска оптимальных матриц [Y]_Nxm и [X]_mxN
Процесс поиска оптимальных матриц [Y]_Nxm, [X]_mxN, определенных на множестве "1" и "0", может занимать достаточно большое время вследствие большой размерности искомых матриц и ограничения на целочисленность их элементов. Известно, что задачи подобного типа обладают экспоненциальной сложностью. Поэтому для сокращения времени поиска оптимальных матриц [Y]_Nxm, [X]_mxN, в заявленном способе предлагается реализовать приближенный метод поиска. В качестве приближенного метода поиска в изобретении предложено использовать известный метод Гаусса-Зейделя для решения оптимизационных задач с большим числом неизвестных. Данный метод предполагает разбиение всего множества неизвестных на несколько подмножеств, например два, и осуществление оптимизации одного подмножества при фиксированном другом. Далее, для найденного оптимального подмножества выполняют оптимизацию элементов другого подмножества. Данный процесс повторяется, пока изменение одного из подмножеств не будет приводить к максимизации (минимизации) выбранного критерия.

В изобретении предлагается разбить все множество оптимизируемых элементов на два подмножества: подмножество элементов матрицы [Y]_Nxm и подмножество элементов матрицы [X]_mxN. Затем, фиксируя элементы матрицы [Y]_Nxm, определить оптимальные элементы матрицы [X]_mxN. Далее, для найденной оптимальной матрицы [X]_mxN, определить оптимальные элементы матрицы [Y]_Nxm. Данный процесс повторяется, пока изменение одного из подмножеств не будет приводить к максимизации выбранного критерия. При таком подходе для оптимизации элементов матриц [X]_mxN и [Y]_Nxm можно воспользоваться одним и тем же алгоритмом. Это объясняется тем, что данные матрицы "меняются местами" при транспонировании матрицы квантованных отсчетов речевого сигнала [A]_NxN. Наглядно это представлено на фиг.7. Единственное различие состоит в том, что вместо оптимальной матрицы [Y] _Nxm будет получена оптимальная матрица [Y] ^T _mxN.

Однако из нее легко получить оптимальную матрицу [Y]_Nxm, выполняя операцию транспонирования ([Y]Tm×N

)^T.
Таким образом, достаточно рассмотреть процедуру оптимизации элементов матрицы [X]_mxN. Для оптимизации элементов матрицы [X]_mxN в изобретении предложен эвристический метод названный методом "пробных инверсий". Сущность метода состоит в следующем. Предварительно на передаче случайным образом генерируют нечетные элементы каждого столбца прямоугольной матрицы [X]_mxN и нечетные элементы каждой строки прямоугольной матрицы [Y]_Nxm, элементы которых принимают значения "1" или "0". Присваивают четным элементам столбцов матрицы [X]_mxN и четным элементам строк матрицы [Y]_Nxm инвертированные значения предшествующих по номеру нечетных элементов столбцов и строк матрицы [X]_mxN и матрицы [Y]_Nxm соответственно. В течение всего процесса оптимизации матриц [X]_mxN и [Y]_Nxm при инверсии одного элемента матрицы инвертируется и элемент, связанный с ним по предлагаемому правилу. Затем осуществляют преобразование матрицы [Y]_Nxm в матрицу [Y_pr]_Nxm путем деления элементов каждой строки матрицы [Y]_Nxm на сумму единиц соответствующей строки.

Наглядно преобразование матрицы представлено на фиг.5. Затем выполняют умножение матриц [Y_pr]_Nxm и [B]_mxm, получая при этом матрицу
[D_Y]_Nxm=[Y_pr]_Nxm[B]_mxm.

После выполнения данных подготовительных действий осуществляют оптимизацию элементов матрицы [X]_mxN путем пробной инверсии ее каждого нечетного элемента каждого столбца. Одновременно с инверсией каждого нечетного k-го элемента j-го столбца производят инверсию последующего по номеру k+1-го элемента этого столбца.

Отметим, что инверсия (замена "1" на "0" или "0" на "1") любого k-го нечетного элемента, где k=1,3,...,m-1 и связанного с ним по описанному выше правилу последующего k+1-го четного элемента j-го столбца, где j=1,2,...,N матрицы [X] _mxN приводит к изменению только элементов j-го столбца матрицы , получаемой в результате произведения

где - матрица восстановленных отсчетов речевого сигнала при инверсии k-го нечетного и связанного с ним по описанному выше правилу k+1-го четного элемента j-го столбца матрицы [X]_mxN;
[X_pr] ^k,j _mxN - матрица, полученная после инверсии k-го нечетного и связанного с ним по описанному выше правилу k+1-го четного элемента j-го столбца матрицы [X]_mxN и ее последующего преобразования путем деления элементов каждого столбца на сумму единиц соответствующего столбца. Поэтому при поиске оптимальных элементов j-го столбца матрицы [X]_mxN достаточно вычислить сумму квадратов разностей между элементами j-го столбца матрицы квантованных отсчетов речевого сигнала [A]_NxN и элементами j-го столбца матрицы восстановленных квантованных отсчетов речевого сигнала

где а_kj - k-е элементы j-го столбца матрицы [A]_NxN;
- k-е элементы j-го столбца матрицы .

На основании этого можно заключить, что поиск оптимальных элементов матрицы [X] _mxN можно осуществлять последовательно по каждому k-у нечетному элементу j-го столбца, где j=1,2,...,N, k=1,3,...,m-1. Поэтому достаточно рассмотреть алгоритм оптимизации элементов j-го столбца матрицы [X]_mxN.

Процесс поиска оптимальных элементов j-го столбца матрицы [X]_mxN в заявленном способе предлагается осуществить в виде следующей последовательности действий:
1. Положить i=0.

2. Сформировать вектор:

где
3. Вычислить:

4. Положить i=i+1.

5. Вычислить: k=2i-1.

6. Выполнить:
- инверсию k-го нечетного элемента вектора :
- инверсию k+1-го четного элемента вектора :
- сформировать вектор:
6. Вычислить:

выполнить: если , то присвоить

если то значения e² _j, и оставить без изменения.

9. Выполнить: если i≠m/2, то увеличить i на единицу и перейти к пункту 4;
если i= m/2, то перейти поиску оптимальных элементов следующего столбца матрицы [X]_mxN.

В результате выполнения данных операций на передаче получают оптимальную матрицу [X] _mxN. После этого на передаче кодер выполняет поиск оптимальной матрицы [Y]_Nxm аналогичным образом.

Иллюстрации к изобретению RU 2 195 715 C1

Реферат патента 2002 года СПОСОБ СЖАТИЯ И ВОССТАНОВЛЕНИЯ РЕЧЕВЫХ СООБЩЕНИЙ

Изобретение относится к передаче речевых сообщений. Его использование позволяет получить технический результат в виде обеспечения требуемой пропускной способности для ведения телефонных разговоров по низкоскоростным каналам связи. Способ заключается в том, что предварительно идентично генерируют на передающей и приемной сторонах случайную квадратную матрицу квантованных отсчетов речевого сигнала, дискретизируют непрерывный речевой сигнал, квантуют дискретные отсчеты, формируют квадратную матрицу квантованных отсчетов речевого сигнала, формируют множество единичных и нулевых элементов в виде прямоугольных матриц меньшего размера, передают множество единичных и нулевых элементов по каналу связи, принимают его из канала связи, формируют квадратную матрицу восстановленных отсчетов речевого сигнала и преобразуют матрицу восстановленных отсчетов речевого сигнала в непрерывный речевой сигнал. Технический результат достигается благодаря тому, что при поиске оптимальных матриц осуществляют неполный перебор всех возможных значений элементов в строках и столбцах матриц, на структуру и процесс оптимизации которых наложены соответствующие ограничения. 7 ил.

Формула изобретения RU 2 195 715 C1

Способ сжатия и восстановления речевых сообщений, заключающийся в том, что предварительно идентично генерируют на передающей и приемной сторонах случайную квадратную матрицу квантованных отсчетов размером m•m элементов, каждый элемент которой принадлежит диапазону квантованных дискретных отсчетов речевого сигнала, дискретизируют непрерывный речевой сигнал, квантуют дискретные отсчеты, формируют матрицу квантованных отсчетов речевого сигнала размером N•N элементов, формируют множество единичных и нулевых элементов в виде прямоугольных матриц размером N•m и m•N элементов, передают множество единичных и нулевых элементов по каналу связи, принимают его из канала связи, формируют матрицу восстановленных отсчетов речевого сигнала размером N•N элементов и преобразуют матрицу восстановленных отсчетов речевого сигнала в непрерывный речевой сигнал, отличающийся тем, что для формирования множества единичных и нулевых элементов в виде прямоугольных матриц размером N•m и m•N элементов на передаче предварительно генерируют из множества единичных и нулевых элементов случайным образом нечетные элементы каждого столбца матрицы размером m•N элементов и нечетные элементы каждой строки матрицы размером N•m элементов, присваивают четным элементам каждого столбца матрицы размером m•N элементов и четным элементам каждой строки матрицы размером N•m элементов инвертированные значения предшествующих по номеру нечетных элементов столбцов и строк матрицы размером m•N элементов и матрицы размером N•m элементов соответственно, после чего преобразуют матрицы размером N•m и m•N элементов путем деления элементов каждой строки матрицы размером N•m элементов на сумму единиц соответствующей строки и деления элементов каждого столбца матрицы размером m•N элементов на сумму единиц соответствующего столбца, вычисляют матрицу восстановленных отсчетов речевого сигнала размером N•N элементов путем перемножения полученной после преобразования прямоугольной матрицы размером N•m элементов с ранее идентично сформированной на передающей и приемной сторонах случайной квадратной матрицей квантованных отсчетов размером m•m элементов и полученной после преобразования матрицей размером m•N элементов, вычисляют сумму квадратов разностей между элементами полученной в результате перемножения матрицы восстановленных отсчетов речевого сигнала размером N•N элементов и соответствующими элементами матрицы квантованных отсчетов речевого сигнала размером N•N элементов, затем последовательно инвертируют каждый нечетный элемент столбцов матрицы размером m•N элементов и каждый нечетный элемент строк матрицы размером N•m элементов, и одновременно инвертируют последующие по номеру четные элементы столбцов матрицы размером m•N элементов и последующие по номеру четные элементы строк матрицы размером N•m элементов, преобразуют матрицы размером N•m и m•N элементов путем деления элементов каждой строки матрицы размером N•m элементов на сумму единиц соответствующей строки и деления элементов каждого столбца матрицы размером m•N элементов на сумму единиц соответствующего столбца, вычисляют матрицу восстановленных отсчетов речевого сигнала размером N•N элементов путем перемножения полученной после преобразования прямоугольной матрицы размером N•m элементов с ранее идентично сформированной на передающей и приемной сторонах случайной квадратной матрицей квантованных отсчетов размером m•m элементов и полученной после преобразования матрицы размером m•N элементов, вычисляют сумму квадратов разностей между элементами полученной в результате перемножения матрицы восстановленных отсчетов речевого сигнала размером N•N элементов и соответствующими элементами матрицы квантованных отсчетов речевого сигнала размером N•N элементов и вычитают эту сумму из ранее полученной суммы квадратов разностей между элементами матрицы восстановленных отсчетов речевого сигнала размером N•N элементов и элементами матрицы квантованных отсчетов речевого сигнала размером N•N элементов, в случае положительной разности сохраняют значения инвертированных элементов, а в случае отрицательной разности их повторно инвертируют, затем сформированные множества нулевых и единичных элементов в виде нечетных элементов каждого столбца матрицы размером m•N элементов и нечетных элементов каждой строки матрицы размером N•m элементов передают в канал связи, а для формирования матрицы восстановленных отсчетов речевого сигнала размером N•N элементов восстанавливают недостающие четные элементы каждого столбца матрицы размером m•N элементов и четные элементы каждой строки матрицы размером N•m элементов, присваивая им инвертированные значения предшествующих по номеру нечетных элементов столбцов и строк матрицы размером m•N элементов и матрицы размером N•m элементов соответственно.

Документы, цитированные в отчете о поиске Патент 2002 года RU2195715C1

СПОСОБ СЖАТИЯ И ВОССТАНОВЛЕНИЯ РЕЧЕВЫХ СООБЩЕНИЙ	1998	Устинов А.А. Тюлегенев А.О. Данилюк В.В.	RU2152646C1
СПОСОБ СУШКИ ПИЛОМАТЕРИАЛОВ И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ	2004	Волков Геннадий Павлович	RU2280827C2
WO 00/22610 A1, 20.04.2000
US 6138089 А, 24.10.2000.

RU 2 195 715 C1

Авторы

Лобашев А.И.

Тарусов В.А.

Тюлегенев А.О.

Устинов А.А.

Даты

2002-12-27—Публикация

2001-05-21—Подача

название	год	авторы	номер документа
СПОСОБ СЖАТИЯ И ВОССТАНОВЛЕНИЯ РЕЧЕВЫХ СООБЩЕНИЙ	2001	Устинов А.А. Лобашев А.И. Тарусов В.А.	RU2195714C1
СПОСОБ СЖАТИЯ И ВОССТАНОВЛЕНИЯ РЕЧЕВЫХ СООБЩЕНИЙ	1998	Устинов А.А. Тюлегенев А.О. Данилюк В.В.	RU2152646C1
СПОСОБ СЖАТИЯ И ВОССТАНОВЛЕНИЯ РЕЧЕВЫХ СООБЩЕНИЙ	2003	Бардюков Д.А. Тарусов В.А. Тюлегенев А.О. Устинов А.А.	RU2244963C1
СПОСОБ СЖАТИЯ И ВОССТАНОВЛЕНИЯ СООБЩЕНИЙ	2003	Бардюков Д.А. Живодерников А.Ю. Тарусов В.А. Тюлегенев А.О. Устинов А.А.	RU2246798C1
СПОСОБ СЖАТИЯ И ВОССТАНОВЛЕНИЯ СООБЩЕНИЙ	2004	Бардюков Д.А. Комарович В.Ф. Устинов А.А.	RU2261532C1
СПОСОБ СЖАТИЯ И ВОССТАНОВЛЕНИЯ СООБЩЕНИЙ	2005	Бардюков Дмитрий Алексеевич Комарович Владимир Феликсович Устинов Андрей Александрович	RU2288547C1
СПОСОБ СЖАТИЯ И ВОССТАНОВЛЕНИЯ РЕЧЕВЫХ СООБЩЕНИЙ	2002	Устинов А.А. Лобашев А.И. Тарусов В.А. Тюлегенев А.О. Бардюков Д.А.	RU2216791C1
СПОСОБ СЖАТИЯ И ВОССТАНОВЛЕНИЯ СООБЩЕНИЙ	2002	Лобашев А.И. Тарусов В.А. Устинов А.А. Тюлегенев А.О.	RU2226043C1
СПОСОБ СЖАТИЯ И ВОССТАНОВЛЕНИЯ РЕЧЕВЫХ СООБЩЕНИЙ	2006	Тюлегенев Алексей Олегович	RU2343565C2
СПОСОБ СЖАТИЯ И ВОССТАНОВЛЕНИЯ РЕЧЕВЫХ СООБЩЕНИЙ	2009	Оков Игорь Николаевич Дворников Сергей Викторович Осадчий Александр Иванович Бардюков Дмитрий Алексеевич Устинов Андрей Александрович Супян Арсений Юрьевич	RU2400830C1