СПОСОБ СЖАТИЯ И ВОССТАНОВЛЕНИЯ РЕЧЕВЫХ СООБЩЕНИЙ Российский патент 2002 года по МПК G10L19/00 H03M7/30 

Описание патента на изобретение RU2195714C1

Изобретение относится к области электросвязи, а именно к области, связанной с сокращением избыточности передаваемой информации. Предлагаемый способ может быть использован для передачи речевых сообщений по цифровым каналам связи со скоростью до 4 кбит/с и может быть отнесен к классу способов кодирования формы речевого сигнала или способов непосредственного кодирования-восстановления.

Известны способы кодирования формы речевого сигнала, см., например, книгу: Дж. Кейтер Компьютеры - синтезаторы речи, М.: Мир, 1985, с.87-103, включающие выполнение трех операций: временную дискретизацию аналоговых сигналов, их квантование и кодирование (представление квантованных дискретных отсчетов речевого сигнала двоичными цифрами). Рассматриваемый способ главным образом определяет механизм кодирования и декодирования квантованных дискретных отсчетов речевого сигнала.

Известны также способы кодирования дискретных квантованных отсчетов речевого сигнала на основе дельта-модуляции, адаптивной дельта модуляции, импульсно-кодовой модуляции, дифференциальной импульсно-кодовой модуляции, метода блочного кодирования с ортогональным преобразованием, см., например, книгу: М.В. Назаров, Ю.Н. Петров. Методы цифровой обработки и передачи цифровых сигналов. - М.: Радио и связь, 1985, с.142-161. Недостатком перечисленных выше способов - аналогов является относительно низкая информационная эффективность, под которой понимается достижение определенного качества восстановления речевой информации при заданной скорости передачи. В рассмотренных способах - аналогах приемлемое качество восстановления речевой информации достигается при скорости передачи более 16 кбит/с.

Аналогом является также способ, описанный в патенте Великобритании 2280827 А, МПК7 G 10 L 3/02 от 08.02.1995. Известный способ включает дискретизацию непрерывного сигнала, квантование дискретных отсчетов, формирование матрицы квантованных отсчетов речевого сигнала, ее преобразование к цифровому виду с использованием американского стандарта сжатия JPEG, передачу цифрового потока по каналу связи, прием цифрового потока из канала связи, восстановление матрицы квантованных отсчетов речевого сигнала из цифрового потока с использованием стандарта JPEG и обратное преобразование квантованных отсчетов в непрерывный речевой сигнал. Однако недостатком этого способа является большая временная задержка речевого сигнала, что исключает возможность применения данного способа для ведения телефонных переговоров по цифровым каналам связи.

Наиболее близким по своей технической сущности к заявленному способу сжатия и восстановления речевых сообщений является способ, описанный в патенте России 2152646 А, МПК7 G 10 L 3/02 от 2000 г.

Способ-прототип включает дискретизацию непрерывного речевого сигнала, квантование дискретных отсчетов, формирование матрицы квантованных отсчетов речевого сигнала размером N•N элементов, преобразование матрицы квантованных отсчетов речевого сигнала размером N•N элементов к цифровому виду путем генерации случайной квадратной матрицы квантованных отсчетов размером m•m элементов, формирования множества нулевых и единичных элементов в виде прямоугольных матриц размером N•m и m•N элементов, генерации случайных матриц размером N•m и m•N элементов, преобразования матриц размером N•m и m•N элементов путем деления элементов каждой строки матрицы размером N•m элементов на сумму единиц соответствующей строки и деления элементов каждого столбца матрицы размером m•N элементов на сумму единиц соответствующего столбца, вычисления матрицы восстановленных отсчетов речевого сигнала размером N•N элементов, вычисления суммы квадратов разностей между элементами полученной в результате перемножения матрицы восстановленных отсчетов речевого сигнала размером N•N элементов и элементами матрицы квантованных отсчетов речевого сигнала размером N•N элементов, последовательной инверсии i-го элемента матриц m•N и N•m элементов, вычисления матрицы восстановленных отсчетов речевого сигнала размером N•N элементов с инвертированным элементом, вычисления суммы квадратов разностей между элементами матрицы восстановленных отсчетов речевого сигнала размером N•N элементов и элементами матрицы квантованных отсчетов речевого сигнала размером N•N элементов, сравнения вычисленных ошибок и сохранения значения инвертированного i-го элемента матриц m•N и N•m элементов, если разность больше нуля, и инвертирования повторно i-го элемента матриц m•N и N•m элементов, если разность меньше нуля, передачи множества нулевых и единичных элементов прямоугольных матриц размером N•m и m•N элементов по каналу связи, приема множества нулевых и единичных элементов матриц размером N•m и m•N элементов из канала связи, формирования матрицы восстановленных отсчетов речевого сигнала размером N•N элементов, преобразования матрицы восстановленных отсчетов речевого сигнала размером N•N элементов в непрерывный речевой сигнал.

Способ-прототип позволяет снизить значение временной задержки передаваемой информации до величины, при которой возможно ведение телефонных переговоров по низкоскоростным цифровым каналам связи.

Недостатком этого способа-прототипа является относительно большая требуемая пропускная способность цифрового канала связи (4-8 Кбит/с), что ограничивает возможность применения данного способа для ведения телефонных переговоров по низкоскоростным цифровым каналам связи.

Целью изобретения является разработка способа сжатия и восстановления речевых сообщений, обеспечивающего снижение требуемой пропускной способности цифрового канала связи, при которой возможно ведение телефонных переговоров по низкоскоростным цифровым каналам связи.

Поставленная цель достигается тем, что в предлагаемом способе сжатия и восстановления речевых сообщений, предварительно, идентично на передающей и приемной сторонах генерируют случайную квадратную матрицу квантованных отсчетов размером m•m элементов, каждый элемент которой принадлежит диапазону квантованных дискретных отсчетов речевого сигнала. Затем дискретизируют непрерывный речевой сигнал, квантуют дискретные отсчеты, формируют матрицу квантованных отсчетов речевого сигнала размером N•N элементов. При этом для формирования матрицы квантованных отсчетов речевого сигнала размером N•N элементов каждому ее элементу Аj,i, гдe j=1,2,..,N; i=1,2,...,N присваивают квантованное значение дискретного отсчета речевого сигнала, k-й номер которого определяют в соответствии с выражением: k=j+N•(i-1).

Затем формируют множество единичных и нулевых элементов в виде прямоугольных матриц размером N•m и m•N элементов, передают множество единичных и нулевых элементов по каналу связи, принимают его из канала связи, формируют матрицу восстановленных отсчетов речевого сигнала размером N•N элементов и преобразуют матрицу восстановленных отсчетов речевого сигнала в непрерывный речевой сигнал.

Предлагаемый способ отличается от способа - прототипа тем, что для формирования множества единичных и нулевых элементов в виде прямоугольных матриц размером N•m и m•N элементов на передаче предварительно генерируют из множества единичных и нулевых элементов случайным образом нечетные столбцы матрицы размером m•N элементов и нечетные строки матрицы размером N•m элементов, присваивают элементам четных столбцов матрицы размером m•N элементов и четных строк матрицы размером N•m элементов значения элементов нечетных столбцов и строк матрицы размером m•N элементов и матрицы размером N•m элементов соответственно. При этом элементам каждого четного столбца матрицы размером m•N элементов и каждой четной строки матрицы размером N•m элементов с номерами от 1 до m/2, присваивают значение элемента соответствующего номера из предыдущего столбца для матрицы размером m•N элементов и предыдущей строки для матрицы размером N•m элементов, а элементам каждого четного столбца матрицы размером m•N элементов и каждой четной строки матрицы размером N•m элементов с номерами от m/2+1 до m, присваивают значение элемента соответствующего номера последующего столбца для матрицы размером m•N элементов и последующей строки для матрицы размером N•m элементов. После этого преобразуют матрицы размером N•m и m•N элементов путем деления элементов каждой строки матрицы размером N•m элементов на сумму единиц соответствующей строки и деления элементов каждого столбца матрицы размером m•N элементов на сумму единиц соответствующего столбца, вычисляют матрицу восстановленных отсчетов речевого сигнала размером N•N элементов путем перемножения полученной после преобразования прямоугольной матрицы размером N•m элементов с ранее идентично сформированной на передающей и приемной сторонах случайной квадратной матрицей квантованных отсчетов размером m•m элементов и полученной после преобразования матрицей размером m•N элементов, вычисляют сумму квадратов разностей между элементами полученной в результате перемножения матрицы восстановленных отсчетов речевого сигнала размером N•N элементов и соответствующими элементами матрицы квантованных отсчетов речевого сигнала размером N•N элементов. Затем последовательно инвертируют каждый элемент нечетных столбцов матрицы размером m•N элементов и нечетных строк матрицы размером N•m элементов, и одновременно инвертируют элементы четных столбцов матрицы размером m•N элементов и четных строк матрицы размером N•m элементов. При этом элементам каждого четного столбца матрицы размером m•N элементов и каждой четной строки матрицы размером N•m элементов с номером от 1 до m/2 присваивают значение элемента соответствующего номера из предыдущего столбца для матрицы размером m•N элементов и предыдущей строки для матрицы размером N•m элементов, а элементам с номером от m/2+l до m присваивают значение элемента соответствующего номера из последующего столбца для матрицы размером m•N элементов и последующей строки для матрицы размером N•m элементов. Преобразуют матрицы размером N•m и m•N элементов путем деления элементов каждой строки матрицы размером N•m элементов на сумму единиц соответствующей строки и деления элементов каждого столбца матрицы размером m•N элементов на сумму единиц соответствующего столбца, вычисляют матрицу восстановленных отсчетов речевого сигнала размером N•N элементов путем перемножения полученной после преобразования прямоугольной матрицы размером N•m элементов с ранее идентично сформированной на передающей и приемной сторонах случайной квадратной матрицей квантованных отсчетов размером m•m элементов и полученной после преобразования матрицы размером m•N элементов. Вычисляют сумму квадратов разностей между элементами полученной в результате этого перемножения матрицы восстановленных отсчетов речевого сигнала размером N•N элементов и соответствующими элементами матрицы квантованных отсчетов речевого сигнала размером N•N элементов и вычитают эту сумму из полученной до инвертирования элемента суммы квадратов разностей между элементами матрицы восстановленных отсчетов речевого сигнала размером N•N элементов и элементами матрицы квантованных отсчетов речевого сигнала размером N•N элементов. В случае положительной разности - сохраняют значения инвертированных элементов, а в случае отрицательной разности - их повторно инвертируют. Затем сформированные множества нулевых и единичных элементов в виде нечетных столбцов прямоугольной матрицы размером N•m элементов и нечетных строк прямоугольной матрицы размером m•N элементов передают в канал связи, после их приема из канала связи, восстанавливают недостающие четные столбцы и строки матриц размером N•m и m•N элементов соответственно. При этом, если номер элемента каждого четного столбца матрицы размером m•N элементов и каждой четной строки матрицы размером N•m элементов имеет значение от 1 до m/2, то данному элементу присваивают значение элемента соответствующего номера из предыдущего столбца для матрицы размером m•N элементов и предыдущей строки для матрицы размером N•m элементов, если номер элемента каждого четного столбца матрицы размером m•N элементов и каждой четной строки матрицы размером N•m элементов имеет значение от m/2+l до m, то данному элементу присваивают значение элемента соответствующего номера из последующего столбца для матрицы размером m•N элементов и последующей строки для матрицы размером N•m элементов.

Предлагаемый способ позволяет перейти от представления речевого сигнала в виде матрицы квантованных отсчетов размером N•N элементов (для передачи каждого элемента которой требуется 8 бит) к представлениям речевого сигнала в виде произведения трех матриц, одну из которых передавать по каналу связи нет необходимости (она заранее формируется на передающей и приемной сторонах), а две другие преобразуют в целочисленные матрицы (для передачи каждого элемента которых требуется 1 бит) и их размер меньше исходной матрицы квантованных отсчетов речевого сигнала (N•m и m•N элементов, m<N). Более того, наложение ограничений на структуру этих матриц позволяет передавать их по каналу связи в усеченном виде (только их нечетные столбцы или строки), что позволяет снизить значение величины требуемой пропускной способности канала до величины, при которой возможно ведение телефонных переговоров по низкоскоростным цифровым каналам связи.

Проведенный анализ уровня техники позволил установить, что аналоги, характеризующиеся совокупностью признаков, тождественных всем признакам заявленного технического решения, отсутствуют, что указывает на соответствие заявленного способа условию патентоспособности "новизна". Результаты поиска известных решений в данной и смежных областях техники с целью выявления признаков, совпадающих с отличительными от прототипа признаками заявленного способа, показали, что они не следуют явным образом из уровня техники. Из уровня техники также не выявлена известность влияния предусматриваемых существенными признаками заявленного изобретения преобразований на достижение указанного технического результата. Следовательно, заявленное изобретение соответствует условию патентоспособности "изобретательский уровень".

Заявленный способ поясняется чертежами:
- фиг. 1 - график кривой, описывающей форму непрерывного речевого сигнала;
- фиг.2 - пример квантованных дискретных отсчетов речевого сигнала;
- фиг. 3 - пример формирования матрицы квантованных отсчетов речевого сигнала размером N•N элементов;
- фиг. 4 - представление матрицы восстановленных квантованных отсчетов речевого сигнала в виде произведения трех матриц;
- фиг.5 - структура матриц [Y]Nxm, [X]mxN и
- фиг.6 - преобразование матрицы квантованных отсчетов речевого сигнала к цифровому виду и обратное преобразование принятого из канала связи цифрового потока в матрицу восстановленных отсчетов речевого сигнала;
- фиг. 7 - последовательная оптимизация элементов матриц [Х]mxN и [Y] TmxN.

Уменьшение объема информации, который необходимо передать по каналу связи в единицу времени, можно достичь снижением частоты дискретизации непрерывного речевого сигнала или уменьшением числа уровней квантования, но при этом качество восстановления речи убывает быстрее, чем получаемый выигрыш.

Возможность реализации заявленного способа сжатия и восстановления речевых сообщений при сохранении хорошего качества восстановления (высокой разборчивости и узнаваемости речи) объясняется следующим. Существует традиционный подход, когда с целью сокращения объема информации, который необходимо передать по каналу связи в единицу времени, каждое кодируемое сообщение (блок последовательных отсчетов в виде матрицы квантованных отсчетов речевого сигнала) представляется своей оценкой в виде произведения матрицы опорных векторов (базиса) на матрицу коэффициентов разложения. Получатель, используя принятые коэффициенты разложения и базис, осуществляет восстановление сообщений источника. Примеры такого подхода известны: дискретное косинусное преобразование, быстрое преобразование Фурье, преобразование Карунена-Лоэва, Вейвлет-преобразования и другие. Использование этих методов не позволяет достичь требуемого коэффициента сжатия при хорошем качестве восстановления речи. То есть объем информации, который необходимо передать по каналу связи в единицу времени при сохранении хорошего качества восстановления речевых сообщений, велик за счет больших размерностей и разрядности матрицы опорных векторов (базиса).

В предлагаемом способе опорные вектора (базис) не передаются, а формируются на приемной стороне из случайной матрицы и принятых из канала связи целочисленных коэффициентов.

Предлагаемый способ предполагает проведение следующих действий.

Формирование случайной квадратной матрицы квантованных отсчетов [В]mxm может быть выполнено на основе датчика случайных чисел, например, на основе шумового диода. Для выполнения требования идентичности матрицы [B]mxm приемника аналогичной матрице передатчика перед началом каждого сеанса связи элементы матрицы [B]mxm могут быть сгенерированы на передаче и переданы по цифровому каналу связи на приемную сторону, например, в составе синхропосылки.

Дискретизацию непрерывного речевого сигнала, представленного на фиг.1, выполняют в соответствии с теоремой Котельникова. В предлагаемом способе выбрана общепринятая частота дискретизации непрерывного речевого сигнала 8 кГц.

Затем осуществляют квантование дискретных отсчетов. Квантование осуществляется на основе способов, описанных, например, в кн.: М.В. Назаров, Ю.Н. Петров. Методы цифровой обработки и передачи цифровых сигналов. - М.: Радио и связь, 1985, с.142-161.

Далее, на основе множества квантованных дискретных отсчетов речевого сигнала осуществляют формирование матрицы квантованных отсчетов речевого сигнала [A]NxN. Формирование матрицы квантованных отсчетов речевого сигнала [A]NxN показано на фиг.3. При этом матрица квантованных отсчетов формируется из N2 квантованных дискретных отсчетов речевого сигнала, каждому элементу которой Аji, где j=1,2,...,N; i=1,2,...,N присваивают квантованное значение отсчета речевого сигнала, k-й номер которого определяют в соответствии с выражением: k=j+N•(i-1).

Для преобразования матрицы квантованных отсчетов речевого сигнала [A]NxN с целью уменьшения объема информации, передаваемого по каналу связи, используют подход, основанный на представлении матрицы [A]NxN в виде произведения трех матриц: прямоугольной матрицы размером N•m элементов (в дальнейшем обозначим ее как [Ypr]Nxm), случайной квадратной матрицы квантованных отсчетов размером m•m элементов (в дальнейшем обозначим ее как [B]mxm) и прямоугольной матрицы размером m•N элементов (в дальнейшем обозначим ее как [Хpr] mxN). Тогда, при кодировании матрицы квантованных отсчетов речевого сигнала [А]NxN на передаче необходимо найти такие оптимальные матрицы [Ypr] Nxm и [Хpr] mxN, которые при перемножении с матрицей [B]mxm образуют некоторую матрицу восстановленных дискретных отсчетов речевого сигнала размером N•N элементов (в дальнейшем обозначим эту матрицу как наиболее близкую по заданному критерию к матрице квантованных дискретных отсчетов речевого сигнала [A]NxN.

Особенностью матриц [Ypr]Nxm и [Хpr]mxN является то, что они могут быть легко приведены к цифровому виду. Это достигается тем, что на элементы этих матриц накладываются следующие ограничения:
- элементы матриц [Ypr]Nxm и [Хpr]mxN принимают значения в диапазоне от нуля до единицы;
- ненулевые элементы каждой строки матрицы [Ypr]Nxm равны между собой и в сумме образуют единицу;
- ненулевые элементы каждого столбца матрицы [Хpr]mxN равны между собой и в сумме образуют единицу.

При таких ограничениях, если элементы каждой строки матрицы [Ypr]Nxm умножить на количество ненулевых элементов в этой строке, то будет получена матрица [Y]Nxm, элементы которой определены только на множестве 1 и 0. Аналогично, если элементы каждого столбца матрицы [Xpr]mxN умножить на количество ненулевых элементов в столбце, то будет получена матрица [Х]mxN, элементы которой определены только на множестве 1 и 0.

Так как при поиске оптимальных матриц [Ypr]Nxm и [Хpr]mxN осуществляют неполный перебор всех возможных значений элементов столбцов и строк матриц то можем накладывать ограничения на структуру матриц и на процесс оптимизации этих матриц с целью уменьшения количества информации, которую нужно будет в дальнейшем передавать по каналам связи.

Процедура, реализующая поиск на передаче оптимальных матриц [Y]Nxm и [Х] mxN, подробно описана в Приложении 1.

Таким образом, представление матрицы квантованных отсчетов речевого сигнала [А] NxN к цифровому виду на передаче осуществляют на основе формирования множества нулевых и единичных элементов в виде прямоугольных матриц размером N•m (матрица [Y]Nxm) и m•N (матрица [X]mxN) элементов.

После определения оптимальных матриц [Ypr]Nxm и [Хpr]mxN передают в канал связи не все значения матриц [Y]Nxm и а только значения элементов нечетных столбцов матрицы и значения элементов нечетных строк матрицы [Y] Nxm. Принимают из канала связи значения элементов нечетных столбцов матрицы и значения элементов нечетных строк матрицы [Y]Nxm, восстанавливают недостающие четные столбцы и строки матриц [Y]Nxm и соответственно, при этом, если номер элемента каждого четного столбца матрицы и каждой четной строки матрицы [Y]Nxm имеет значение от 1 до m/2, то данному элементу присваивают значение элемента соответствующего номера из предыдущего столбца для матрицы и предыдущей строки для матрицы [Y]Nxm, если номер элемента каждого четного столбца матрицы и каждой четной строки матрицы [Y]Nxm имеет значение от m/2+l до m, то данному элементу присваивают значение элемента соответствующего номера из последующего столбца для матрицы и последующей строки для матрицы [Y]Nxm.

После приема из канала связи цифрового потока и восстановления матриц [Y]Nxm и [Х]mxN их преобразуют в матрицы [Ypr]Nxm и [Хpr]mxN соответственно. Преобразование выполняют путем деления элементов каждой строки матрицы [Y] Nxm на сумму единиц соответствующей строки и деления элементов каждого столбца матрицы [Х] mxN на сумму единиц соответствующего столбца. После этого формируют матрицу восстановленных отсчетов речевого сигнала путем перемножения матриц [Ypr] Nxm и [Xpr]mxN и ранее сформированной квадратной матрицы квантованных дискретных отсчетов [B]mxm в соответствии с выражением: и выполняют обратное преобразование из матрицы восстановленных квантованных отсчетов речевого сигнала в непрерывный речевой сигнал. Наглядно представление матрицы восстановленных дискретных отсчетов речевого сигнала в виде произведения трех матриц представлено на фиг.4.

Для оценки эффективности предлагаемого способа сжатия и восстановления речевых сообщений было проведено имитационное моделирование на ПЭВМ. При кодировании речевых сообщений использовалось 8-ми разрядное АЦП. При этом размер кодируемого блока составлял 15•15 элемента, что обеспечивало задержку передачи речи 0,28 мс. Такая величина временной задержки передаваемой информации ниже временной задержки, реализуемой в способе-прототипе (в способе-прототипе величина временной задержки речевого сигнала составляет 0,72 с. ). Задержка 0,28 мс позволяет осуществить ведение дуплексных телефонных переговоров по низкоскоростным каналам связи. Размер случайной квадратной матрицы квантованных дискретных отсчетов составлял 8•8 элементов. В предлагаемом способе высокая степень сжатия речевой информации достигалась за счет того, что для формирования на приеме матрицы восстановленных отсчетов речевого сигнала [А] NxN в цифровой канал связи необходимо передать количество двоичных единиц, определяемое размерами матриц [Y]Nxm и [X]mxN с учетом того, что передавать их надо в усеченном (приблизительно в 2 раза) виде. При этом достигаемый коэффициент сжатия (коэффициент уменьшения требуемой скорости передачи цифрового потока) может быть найден по формуле:

где L - число уровней квантования дискретных отсчетов речевого сигнала.

При выборе N= 15, m=8 (L=256) обеспечивался коэффициент сжатия 14 раз (скорость передачи на выходе кодера - 4.55 [кбит/с]). При выборе размера случайной матрицы квантованных отсчетов речевого сигнала 6•6 элементов коэффициент сжатия речевых сообщений составил 18.75 раза (скорость передачи на выходе кодера - 3.41 [кбит/с] ). Качество восстановленной речи на приеме оценивалось по соотношению сигнал/шум и составило около 9 [dБ]. При этом восстановленная речь сохраняет свою естественность, натуральность и обладает хорошей разборчивостью. Анализ вычислительной сложности показал, что сложность кодирования/декодирования предлагаемой процедуры (количество операций умножения, деления, сложения, вычитания) пропорционально приблизительно величине m2. Поэтому, предлагаемый способ сжатия и восстановления речи может быть реализован на современных процессорах обработки сигналов.

Похожие патенты RU2195714C1

название год авторы номер документа
СПОСОБ СЖАТИЯ И ВОССТАНОВЛЕНИЯ РЕЧЕВЫХ СООБЩЕНИЙ 2001
  • Лобашев А.И.
  • Тарусов В.А.
  • Тюлегенев А.О.
  • Устинов А.А.
RU2195715C1
СПОСОБ СЖАТИЯ И ВОССТАНОВЛЕНИЯ РЕЧЕВЫХ СООБЩЕНИЙ 1998
  • Устинов А.А.
  • Тюлегенев А.О.
  • Данилюк В.В.
RU2152646C1
СПОСОБ СЖАТИЯ И ВОССТАНОВЛЕНИЯ РЕЧЕВЫХ СООБЩЕНИЙ 2003
  • Бардюков Д.А.
  • Тарусов В.А.
  • Тюлегенев А.О.
  • Устинов А.А.
RU2244963C1
СПОСОБ СЖАТИЯ И ВОССТАНОВЛЕНИЯ СООБЩЕНИЙ 2003
  • Бардюков Д.А.
  • Живодерников А.Ю.
  • Тарусов В.А.
  • Тюлегенев А.О.
  • Устинов А.А.
RU2246798C1
СПОСОБ СЖАТИЯ И ВОССТАНОВЛЕНИЯ СООБЩЕНИЙ 2004
  • Бардюков Д.А.
  • Комарович В.Ф.
  • Устинов А.А.
RU2261532C1
СПОСОБ СЖАТИЯ И ВОССТАНОВЛЕНИЯ РЕЧЕВЫХ СООБЩЕНИЙ 2002
  • Устинов А.А.
  • Лобашев А.И.
  • Тарусов В.А.
  • Тюлегенев А.О.
  • Бардюков Д.А.
RU2216791C1
СПОСОБ СЖАТИЯ И ВОССТАНОВЛЕНИЯ СООБЩЕНИЙ 2005
  • Бардюков Дмитрий Алексеевич
  • Комарович Владимир Феликсович
  • Устинов Андрей Александрович
RU2288547C1
СПОСОБ СЖАТИЯ И ВОССТАНОВЛЕНИЯ РЕЧЕВЫХ СООБЩЕНИЙ 2006
  • Тюлегенев Алексей Олегович
RU2343565C2
СПОСОБ СЖАТИЯ И ВОССТАНОВЛЕНИЯ СООБЩЕНИЙ 2002
  • Лобашев А.И.
  • Тарусов В.А.
  • Устинов А.А.
  • Тюлегенев А.О.
RU2226043C1
СПОСОБ СЖАТИЯ И ВОССТАНОВЛЕНИЯ РЕЧЕВЫХ СООБЩЕНИЙ 2009
  • Оков Игорь Николаевич
  • Дворников Сергей Викторович
  • Осадчий Александр Иванович
  • Бардюков Дмитрий Алексеевич
  • Устинов Андрей Александрович
  • Супян Арсений Юрьевич
RU2400830C1

Иллюстрации к изобретению RU 2 195 714 C1

Реферат патента 2002 года СПОСОБ СЖАТИЯ И ВОССТАНОВЛЕНИЯ РЕЧЕВЫХ СООБЩЕНИЙ

Изобретение относится к области электросвязи, а именно к области, связанной с сокращением избыточности передаваемой информации. Предлагаемый способ может быть использован для передачи речевых сообщений по цифровым каналам связи со скоростью до 4 кбит/с и может быть отнесен к классу способов кодирования формы речевого сигнала или способов непосредственного кодирования-восстановления. Техническим результатом является разработка способа сжатия и восстановления речевых сообщений, обеспечивающего снижение требуемой пропускной способности цифрового канала связи, при которой возможно ведение телефонных переговоров по низкоскоростным цифровым каналам связи. Способ сжатия и восстановления речевых сообщений заключается в том, что дискретизируют непрерывный речевой сигнал, квантуют дискретные отсчеты, формируют матрицу квантованных отсчетов речевого сигнала, формируют множество единичных и нулевых элементов в виде прямоугольных матриц, передают множество единичных и нулевых элементов по каналу связи, принимают его из канала связи, формируют матрицу восстановленных отсчетов речевого сигнала и преобразуют матрицу восстановленных отсчетов речевого сигнала в непрерывный речевой сигнал. Так как при поиске оптимальных прямоугольных матриц осуществляют неполный перебор всех возможных значений элементов столбцов и строк матриц, то можно накладывать ограничения на структуру прямоугольных матриц и на процесс оптимизации этих матриц с целью уменьшения количества информации, которую нужно будет в дальнейшем передавать по каналам связи. 7 ил.

Формула изобретения RU 2 195 714 C1

Способ сжатия и восстановления речевых сообщений, заключающийся в том, что предварительно идентично генерируют на передающей и приемной сторонах случайную квадратную матрицу квантованных отсчетов размером m•m элементов, каждый элемент которой принадлежит диапазону квантованных дискретных отсчетов речевого сигнала, дискретизируют непрерывный речевой сигнал, квантуют дискретные отсчеты, формируют матрицу квантованных отсчетов речевого сигнала размером N•N элементов, формируют множество единичных и нулевых элементов в виде прямоугольных матриц размером N•m и m•N элементов, передают множество единичных и нулевых элементов по каналу связи, принимают его из канала связи, формируют матрицу восстановленных отсчетов речевого сигнала размером N•N элементов и преобразуют матрицу восстановленных отсчетов речевого сигнала в непрерывный речевой сигнал, отличающийся тем, что для формирования множества единичных и нулевых элементов в виде прямоугольных матриц размером N•m и m•N элементов на передаче предварительно генерируют из множества единичных и нулевых элементов случайным образом нечетные столбцы матрицы размером m•N элементов и нечетные строки матрицы размером N•m элементов, присваивают элементам четных столбцов матрицы размером m•N элементов и четных строк матрицы размером N•m элементов значения элементов нечетных столбцов и строк матрицы размером m•N элементов и матрицы размером N•m элементов соответственно, при этом элементам каждого четного столбца матрицы размером m•N элементов и каждой четной строки матрицы размером N•m элементов с номерами от 1 до m/2 присваивают значение элемента соответствующего номера из предыдущего столбца для матрицы размером m•N элементов и предыдущей строки для матрицы размером N•m элементов, а элементам каждого четного столбца матрицы размером m•N элементов и каждой четной строки матрицы размером N•m элементов с номерами от m/2+1 до m присваивают значение элемента соответствующего номера последующего столбца для матрицы размером m•N элементов и последующей строки для матрицы размером N•m элементов, после чего преобразуют матрицы размером N•m и m•N элементов путем деления элементов каждой строки матрицы размером N•m элементов на сумму единиц соответствующей строки и деления элементов каждого столбца матрицы размером m•N элементов на сумму единиц соответствующего столбца, вычисляют матрицу восстановленных отсчетов речевого сигнала размером N•N элементов путем перемножения полученной после преобразования прямоугольной матрицы размером N•m элементов с ранее идентично сформированной на передающей и приемной сторонах случайной квадратной матрицей квантованных отсчетов размером m•m элементов и полученной после преобразования матрицей размером m•N элементов, вычисляют сумму квадратов разностей между элементами полученной в результате перемножения матрицы восстановленных отсчетов речевого сигнала размером N•N элементов и соответствующими элементами матрицы квантованных отсчетов речевого сигнала размером N•N элементов, затем последовательно инвертируют каждый элемент нечетных столбцов матрицы размером m•N элементов и нечетных строк матрицы размером N•m элементов, и одновременно инвертируют элементы четных столбцов матрицы размером m•N элементов и четных строк матрицы размером N•m элементов, при этом элементам каждого четного столбца матрицы размером m•N элементов и каждой четной строки матрицы размером N•m элементов с номером от 1 до m/2 присваивают значение элемента соответствующего номера из предыдущего столбца для матрицы размером m•N элементов и предыдущей строки для матрицы размером N•m элементов, а элементам с номером от m/2+1 до m присваивают значение элемента соответствующего номера из последующего столбца для матрицы размером m•N элементов и последующей строки для матрицы размером N•m элементов, преобразуют матрицы размером N•m и m•N элементов путем деления элементов каждой строки матрицы размером N•m элементов на сумму единиц соответствующей строки и деления элементов каждого столбца матрицы размером m•N элементов на сумму единиц соответствующего столбца, вычисляют матрицу восстановленных отсчетов речевого сигнала размером N•N элементов путем перемножения полученной после преобразования прямоугольной матрицы размером N•m элементов с ранее идентично сформированной на передающей и приемной сторонах случайной квадратной матрицей квантованных отсчетов размером m•m элементов и полученной после преобразования матрицы размером m•N элементов, вычисляют сумму квадратов разностей между элементами полученной в результате перемножения матрицы восстановленных отсчетов речевого сигнала размером N•N элементов и соответствующими элементами матрицы квантованных отсчетов речевого сигнала размером N•N элементов и вычитают эту сумму из ранее полученной суммы квадратов разностей между элементами матрицы восстановленных отсчетов речевого сигнала размером N•N элементов и элементами матрицы квантованных отсчетов речевого сигнала размером N•N элементов, в случае положительной разности сохраняют значения инвертированных элементов, а в случае отрицательной разности их повторно инвертируют, затем сформированные множества нулевых и единичных элементов в виде нечетных столбцов прямоугольной матрицы размером N•m элементов и нечетных строк прямоугольной матрицы размером m•N элементов передают в канал связи, а для формирования матрицы восстановленных отсчетов речевого сигнала размером N•N элементов восстанавливают недостающие четные столбцы и строки матриц размером N•m и m•N элементов соответственно, при этом если номер элемента каждого четного столбца матрицы размером m•N элементов и каждой четной строки матрицы размером N•m элементов имеет значение от 1 до m/2, то данному элементу присваивают значение элемента соответствующего номера из предыдущего столбца для матрицы размером m•N элементов и предыдущей строки для матрицы размером N•m элементов, если номер элемента каждого четного столбца матрицы размером m•N элементов и каждой четной строки матрицы размером N•m элементов имеет значение от m/2+1 до m, то данному элементу присваивают значение элемента соответствующего номера из последующего столбца для матрицы размером m•N элементов и последующей строки для матрицы размером N•m элементов.

Документы, цитированные в отчете о поиске Патент 2002 года RU2195714C1

СПОСОБ СЖАТИЯ И ВОССТАНОВЛЕНИЯ РЕЧЕВЫХ СООБЩЕНИЙ 1998
  • Устинов А.А.
  • Тюлегенев А.О.
  • Данилюк В.В.
RU2152646C1
СПОСОБ СУШКИ ПИЛОМАТЕРИАЛОВ И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ 2004
  • Волков Геннадий Павлович
RU2280827C2
Установка для очистки шахтных водосборников 1980
  • Панченко Валерий Павлович
  • Колодеца Геннадий Петрович
  • Фуников Владимир Степанович
  • Морозов Игорь Васильевич
SU907258A1
US 5822370 А, 13.10.1998
DE 19822377 А, 25.11.1999.

RU 2 195 714 C1

Авторы

Устинов А.А.

Лобашев А.И.

Тарусов В.А.

Даты

2002-12-27Публикация

2001-04-28Подача