Изобретение относится к области цифровой обработки речевых сигналов и может найти применение в устройствах связи.
Известно устройство для выделения акустических сигналов в каналах связи, описанное в патенте RU 2171549, H04Q 1/46, недостатком которого является недостаточно высокая эффективность подавления внешних акустических помех.
Известно устройство для выделения тональных сигналов в каналах связи по патенту RU 2214051, H04B 3/46, H04Q 1/457, H04M 1/50. Устройство относится к области электросвязи, в частности к автоматическим средствам приема сигналов канальной сигнализации в системах многоканальной связи, и может использоваться для обнаружения акустических сигналов в телефонных каналах. Известное техническое решение обладает недостаточно высокой эффективностью при решении задачи разделения речи и пауз в условиях наличия акустических помех.
Известен способ разделения речи и пауз путем анализа значений фаз частотных составляющих шума и сигнала по патенту RU 2680735 G10L 21/0272, недостатком которого является недостаточно высокая эффективность при решении задачи разделения речи и пауз в условиях наличия акустических помех с большим числом частотных составляющих.
Известен способ разделения речи и пауз путем анализа значений корреляционной функции помехи и смеси сигнала и помехи по патенту RU 2691603 G10L 15/00. Известное техническое решение обладает недостаточно высокой эффективностью при решении задачи разделения речи и пауз в условиях присутствии акустических помех, значения параметров которых близки к значениям параметров речевого сигнала.
Известен способ разделения речи и пауз путем сравнительного анализа значений мощностей помехи и смеси сигнала и помехи по патенту RU 2668407 G10L 25/93. Недостатком данного способа является его недостаточно высокая эффективность при решении задачи разделения речи и пауз в условиях наличия акустических помех с большим уровнем мощности.
Известен способ разделения речи и пауз, описанный в книге «Цифровая обработка речевых сигналов. //Л.Р. Рабинер, Р.В. Шафер. Перевод с английского под редакцией М.В. Назарова и Ю.Н. Прохорова. Москва, «Радио и связь», 1981», стр. 123 - 126. Недостатком данного способа является недостаточно высокое значение вероятности правильного решения о появлении речевого сигнала в условиях наличия акустического шум.
Известен способ спектрального анализа электрических сигналов (патент РФ № 2431853 G10R 23/16), в котором анализируемый электрический сигнал подают одновременно на гребенку фильтров, настроенных на различные частоты и измеряют сигналы на выходах этих фильтров, причем до проведения измерений диапазон контролируемых частот разбивают на элементы разрешения с шагом дискретизации, соответствующим желаемым точности и разрешению спектрального анализа. Недостатком данного способа является сложность технической реализации и недостаточно высокая скорость обмена информацией, при реализации данного способа в устройствах связи.
Известен способ спектрального анализа сигналов (патент РФ 2127888 G10R 23/16), в котором при дискретизации и квантовании сигнала создают последовательности дискретных значений сигнала с различными частотами следования отсчетов в каждой из них. При этом дискретные значения этих последовательностей фильтруют с помощью цифровых полосовых фильтров и цифровых фильтров нижних частот. Сигналы с выходов цифровых полосовых фильтров подвергают обработке, связанной с определением амплитудных значений, а на их основе и остальных информативных параметров полосовых сигналов. Недостатком данного способа является сложность его технической реализации.
Известен способ спектрального анализа сигналов (патент РФ 2229725 G10R 23/16), в котором формируют опорный синусоидальный сигнал, который многократно сдвигают по фазе относительно анализируемого периодического многочастотного сигнала. Оба сигнала представляются отсчетами мгновенных значений для одних и тех же моментов времени tj=t1, t2,..., tN, где N - число разбиений на периоде Т. Далее находят точки совместного решения а(b0) при различных круговых частотах опорного сигнала и фазах опорного сигнала, строят вольт-амперные характеристики и определяют их площадь FBAX min, причем вывод о присутствии гармонической составляющей с некоторой круговой частотой и фазой в анализируемом сигнале а(tj) делают, исходя из условия FBAX=0. Затем определяют максимальную площадь вольт-амперной характеристики FВАХ max К при ϕК ±90° и находят амплитуду K-й спектральной составляющей. По значениям ωК, ϕК и Amk судят о спектральном составе анализируемого сигнала а(tj). Недостатком данного способа является большая вычислительная сложность и, соответственно, трудность технической реализации в системах связи.
Известен способ спектрального анализа многочастотных периодических сигналов, представленных цифровыми отсчетами (Функциональный контроль и диагностика электротехнических систем и устройств по цифровым отсчетам мгновенных значений тока и напряжения. /под редакцией Е.И. Гольдштейна - Томск: Изд. «Печатная мануфактура», 2003, с. 92-94).
Недостатком известного способа является его недостаточно высокая эффективность при решении задачи определения факта появления речевого сигнала при наличии акустических помех.
Наиболее близким по технической сущности к предлагаемому является способ спектрального анализа многочастотных периодических сигналов с использованием компенсации комбинационных составляющих, описанный в патенте РФ № 2730043 G10R 23/16, принятый за прототип.
Способ-прототип заключается в том, что для исходного сигнала a(ti), заданного отсчетами мгновенных значений в моменты времени
t1, t2, …,tj, …, tN; t2-t1 =t3-t2=tN-tN-1= … =Δt; Δt=Т/N,
где Δt - шаг дискретизации;
N - количество точек за время T,
для последовательности частот ω1, ω2, …, ωi, …, ωn, (опорные частоты) определяют мгновенную спектральную плотность (МСП) по выражениям:
где S1(ωj) и S2(ωj) - синусная и косинусная составляющие мгновенной спектральной плотности.
Каждый результат преобразования сигнала и помехи, которые образуются после умножения входного сигнала на синус и косинус опорных частот, разделяют на две одинаковые составляющие.
Обработку полученных сигналов осуществляют одинаково в соответствующих линейках - каждый из полученных сигналов разветвляют на две одинаковые составляющие, первую составляющую фильтруют фильтром нижних частот (ФНЧ), полоса которого согласована с полосой анализируемого сигнала, одновременно вторую составляющую фильтруют полосовым фильтром, полоса пропускания которого выбирается так, что верхняя частота полосового фильтра соответствует верхней частоте анализируемого сигнала. Нижнюю частоту полосового фильтра устанавливают равной некоторому заранее заданному значению. Выбор ФНЧ и полосового фильтра осуществляют с идентичными в максимальной степени фазочастотными характеристиками и так, что амплитудно-частотная характеристика (АЧХ) полосового фильтра в области частот близких к нулю имеет максимально-возможную крутизну; в области частот, начиная со значения, для которого разность значений АЧХ ФНЧ и полосового фильтра становится меньше некоторой заранее заданной величины, обеспечивают идентичность их АЧХ в максимальной степени. Сигналы, прошедшие ФНЧ и полосовой фильтр, вычитают один из другого. Результат вычитания преобразуют в цифровой вид.
По данным значениям, соответствующим синусной и косинусной составляющей одной частоты, определяют МСП для каждой опорной частоты и запоминают эти значения пропорциональные амплитуде сигналов.
Из полученных значений находят МСП с максимальным значением, определяют значение порога путем умножения найденного максимального значения МСП на коэффициент, значение которого устанавливают заранее. Полученные значения МСП сравнивают с порогом, по результатам сравнения делают вывод о наличии или об отсутствии сигнала с соответствующей частотой.
Рассчитанные значения МСП считают амплитудой сигнала с соответствующей частотой, определяют дискретные значения фаз, используемые при проведении спектрального анализа ϕ1, ϕ2, …, ϕj …, ϕm, таким образом, чтобы:
ϕ2-ϕ1= Δϕ; ϕ3-ϕ2= Δϕ; …; ϕm-ϕ(m-1) =Δϕ, Δϕ =2π/m,
где Δϕ - шаг дискретизации фазы;
m - количество значений фаз, используемое при ее дискретизации.
Определяют отсчеты для каждого значения частоты исходного сигнала a(ti), заданного отсчетами мгновенных значений, для которых проводят анализ и каждого значения фазы, с использованием способа выбора отсчетов, при использовании которого «расстояние» между моментами времени взятия отсчетов и рассчитанными значениями времени взятия отсчетов было минимальным.
Для каждой частоты и каждого значения фазы рассчитывают сумму абсолютных значений отсчетов. Для каждой частоты находят сумму отсчетов с максимальным значением, запоминают соответствующие значения фазы как фазу сигнала с соответствующей частотой.
Недостатком способа-прототипа является невозможность выделения частотных составляющих речевого сигнала при наличии акустических помех.
Задача предлагаемого способа - обеспечение возможности выделения частотных составляющих речевого сигнала при наличии акустических помех.
Для решения поставленной задачи в способе выделения речевого сигнала с использованием временного анализа спектра аддитивной смеси сигнала и акустических помех, заключающемся в том, что для исходного сигнала a(ti), заданного отсчетами мгновенных значений в моменты времени - интервал анализа
t1, t2, …,tj, …, tN; t2-t1 =t3-t2=tN-tN-1= … =Δt; Δt=Т/N,
где Δt - шаг дискретизации;
N - количество точек за время T,
для последовательности частот ω1, ω2, …, ωi, …, ωn, (опорные частоты) определяют мгновенную спектральную плотность (МСП) по выражениям:
;
;
,
где S1(ωj) и S2(ωj) - синусная и косинусная составляющие спектральной плотности, которые получают с использованием способа квадратурной обработки с компенсацией комбинационных составляющих, а именно, каждый результат преобразования сигнала и помехи, которые образуются после умножения входного сигнала на синус и косинус опорных частот, разделяют на две одинаковые составляющие, обработку полученных сигналов осуществляют одинаково в соответствующих линейках - каждый из полученных сигналов разветвляют на две одинаковые составляющие, первую составляющую фильтруют фильтром нижних частот (ФНЧ), полоса которого согласована с полосой анализируемого сигнала, одновременно вторую составляющую фильтруют полосовым фильтром, полоса пропускания которого выбирается так, что верхняя частота полосового фильтра соответствует верхней частоте анализируемого сигнала, нижнюю частоту полосового фильтра устанавливают равной некоторому заранее заданному значению, выбор ФНЧ и полосового фильтра осуществляют с идентичными в максимальной степени фазо-частотными характеристиками и так, что амплитудно-частотная характеристика (АЧХ) полосового фильтра в области частот близких к нулю имеет максимально-возможную крутизну, в области частот, начиная со значения, для которого разность значений АЧХ ФНЧ и полосового фильтра становится меньше некоторой заранее заданной величины, обеспечивают идентичность их АЧХ в максимальной степени, сигналы, прошедшие ФНЧ и полосовой фильтр, вычитают один из другого, результат вычитания преобразуют в цифровой вид, по данным значениям, соответствующим синусной и косинусной составляющей одной частоты, определяют значение спектральной плотности (СП) для каждой опорной частоты и запоминают эти значения пропорциональные амплитуде сигналов и соответствующие значения частот, согласно изобретению, формируют «скользящее окно» - интервал времени заданной длительности, «скользящее окно» в течение всего времени анализа периодически сдвигают на интервал заранее установленной величины - интервал сдвига, предварительно, в условиях отсутствия акустических помех, для нескольких разновидностей речевого сигнала осуществляют обработку речевого сигнала способом квадратурной обработки с компенсацией комбинационных составляющих, рассчитывают средние значения СП для каждой частоты и дисперсию этих значений, рассчитывают пороговое значение для дисперсии средних значений СП гармоник - пороговое значение для дисперсии СП, путем умножения найденного значения дисперсии амплитуд на коэффициент, значение которого устанавливают заранее, устанавливают: пороговое значение для значений СП гармоник, минимальное и максимальное пороговые значения для значений СП гармоник сигнала; пороговое значение для возможного изменения СП, определяемое исходя из точности расчета их значений и возможного изменения СП за интервал сдвига - пороговое значение для возможного изменения СП гармоник; пороговое значение для числа обнаруженных гармоник; минимальное и максимальное пороговые значения времени существования - длительности гармоник речевого сигнала,
для первого положения «скользящего окна» устанавливают значение его левой границы - меньшее значение равным нулю, осуществляют обработку смеси сигнала или помехи или смеси сигнала и помехи - входной сигнал способом квадратурной обработки с компенсацией комбинационных составляющих, числу зарегистрированных речевых сигналов присваивают значение, равное нулю, рассчитывают число гармоник, значения СП которых превышают порог - обнаруженные гармоники, если это число равно нулю то осуществляют сдвиг «скользящего окна», если данное число больше нуля, то запоминают значения СП и соответствующие им значения частот гармоник, рассчитывают число гармоник, для которых значения СП превышают минимальное и не превышают максимальное пороговые значения для СП сигнала, если это число не превышает пороговое значение для числа обнаруженных гармоник, то эти гармоники помечают как составляющие помехи, осуществляют сдвиг «скользящего окна», если данное число гармоник превышает пороговое значение для числа обнаруженных гармоник, то рассчитывают дисперсию значений СП этих гармоник, если рассчитанное значение дисперсии превышает пороговое значение для дисперсии СП, то эти гармоники помечают как составляющие помехи, осуществляют сдвиг «скользящего окна», если рассчитанное значение дисперсии не превышает пороговое значение для дисперсии СП, то эти гармоники помечают как составляющие первого речевого сигнала, устанавливают значение времени существования гармоник первого речевого сигнала равным значению длительности «скользящего окна», значение его времени появления устанавливают равным нулю, номеру данного речевого сигнала присваивают значение, равное единице, осуществляют сдвиг «скользящего окна», при первом сдвиге - второе положения «скользящего окна», осуществляют обработку помехи или речевого сигнала или аддитивной смеси сигнала и помехи способом квадратурной обработки с компенсацией комбинационных составляющих, устанавливают значение его левой границы равным величине интервала сдвига, рассчитывают число обнаруженных гармоник, если это число равно нулю, и если на предыдущем шаге гармоники не были обнаружены, то осуществляют сдвиг «скользящего окна», если число обнаруженных гармоник больше нуля, то запоминают значения СП и соответствующие значения частот гармоник, если на предыдущем шаге гармоники были обнаружены, число обнаруженных гармоник равно нулю или среди обнаруженных гармоник отсутствуют гармоники с такими же частотами, как у гармоник, обнаруженных на предыдущем шаге, то осуществляют следующие действия: если некоторые из гармоник, обнаруженных на предыдущем шаге, были помечены как гармоники помехи, то уничтожают информацию о параметрах этих гармоник; для гармоник, обнаруженных на предыдущем шаге, которые были помечены как гармоники речевого сигнала, находят гармоники, время существования которых превышает минимальное пороговое значение и не превышает максимальное пороговое значение длительности речевого сигнала, рассчитывают их число, если это число не превышает пороговое значение для числа обнаруженных гармоник, то считают, что данные гармоники являются гармониками помехи, уничтожают информацию о значениях их частот и СП, в противном случае рассчитывают дисперсию значений СП этих гармоник, если рассчитанное значение дисперсии превышает пороговое значение для дисперсии СП, то эти гармоники помечают как составляющие помехи, уничтожают информацию о значениях их частот и СП, если рассчитанное значение дисперсии не превышает пороговое значение для дисперсии СП, эти гармоники считают гармониками первого речевого сигнала, рассчитывают его длительность как сумму значений «скользящего окна» и интервала сдвига, запоминают информацию о значении длительности сигнала; гармоники, время существования которых не превышает минимальное пороговое значение или превышает максимальное пороговое значение длительности речевого сигнала, считают гармониками помехи, уничтожают информацию о значениях их частот и СП,
если на предыдущем шаге гармоники были обнаружены и число обнаруженных на текущем шаге гармоник не равно нулю из обнаруженных гармоник выделяют гармоники, частоты которых отличаются от частот гармоник, обнаруженных для предыдущего положения «скользящего окна» - гармоники с новыми частотами, если их число больше нуля, то запоминают значения СП этих гармоник, и соответствующие им значения частот, если существуют гармоники, обнаруженные для текущего положения «скользящего окна», значения частот которых совпадают с значениями частот гармоник, обнаруженных для предыдущего положения «скользящего окна», то сравнивают разности значений их СП с пороговым значением для возможного изменения СП, если полученные разности значений СП равны или превышают соответствующий порог, то считают, что появились гармоники с новыми значениями СП, значения их СП устанавливают равными соответствующим рассчитанным разностям значений СП, если модули полученных разностей значений СП не превышают соответствующий порог то считают, что значения СП гармоник, обнаруженных на предыдущем шаге и их принадлежность к гармоникам помехи или сигнала не изменились, в случае если значение разности имеет отрицательное значение считают, что принадлежность гармоник, обнаруженных на предыдущем шаге, к гармоникам помехи или сигнала не изменились, значения их СП устанавливают равными соответствующим рассчитанным значениям СП, рассчитывают суммарное значение числа гармоник с новыми частотами и гармоник с новыми значениями СП, если это число превышает пороговое значение для числа обнаруженных гармоник, то эти гармоники помечают как составляющие речевого сигнала, его номер рассчитывают путем увеличения на единицу номера речевого сигнала с максимальным значением, который был до этого использован, устанавливают значение его времени появления равным значению левой границы «скользящего окна», значение его длительности устанавливают равным длительности «скользящего окна», запоминают эти значения, значения СП этих гармоник, и соответствующие им значения частот, осуществляют сдвиг «скользящего окна», если данное число обнаруженных гармоник не превышает пороговое значение для числа обнаруженных гармоник, то эти гармоники помечают как составляющие помехи, запоминают значения СП этих гармоник и соответствующие им значения частот, осуществляют сдвиг «скользящего окна», при n-м сдвиге «скользящего окна» - (n+1)-е положение «скользящего окна», осуществляют обработку помехи или речевого сигнала или аддитивной смеси сигнала и помехи способом квадратурной обработки с компенсацией комбинационных составляющих, определяют значение его левой границы как суммарное значение предыдущего значения левой границы «скользящего окна» и величины интервала сдвига,
рассчитывают число обнаруженных гармоник, если это число равно нулю, и если на предыдущем шаге гармоники не были обнаружены, то осуществляют сдвиг «скользящего окна», если число обнаруженных гармоник больше нуля, то запоминают значения СП и соответствующие значения частот гармоник, если на предыдущем шаге гармоники были обнаружены, число обнаруженных гармоник равно нулю или среди обнаруженных гармоник отсутствуют гармоники с такими же частотами, как у гармоник, обнаруженных на предыдущем шаге, то осуществляют следующие действия: если некоторые из этих гармоник были помечены как гармоники помехи, то уничтожают информацию о параметрах этих гармоник; для гармоник, которые были помечены как гармоники речевого сигнала, если они принадлежат разным речевым сигналам, то для всех групп гармоник, принадлежащих разным речевым сигналам осуществляют следующее, проверяют выполнение условия, что их время существования превышает минимальное пороговое значение и не превышает максимальное пороговое значение длительности речевого сигнала, рассчитывают число гармоник, для которых выполняется данное условие, если это число для какой-либо группы гармоник не превышает пороговое значение для числа обнаруженных гармоник, то считают, что данные гармоники являются гармониками помехи, уничтожают информацию о значениях их частот и СП, осуществляют перенумерацию речевых сигналов, в противном случае рассчитывают дисперсию значений СП этих гармоник, если рассчитанное значение дисперсии превышает пороговое значение для дисперсии СП, то гармоники, входящие в данные группы, считают составляющими помехи, уничтожают информацию о значениях их частот и СП, осуществляют перенумерацию речевых сигналов, если рассчитанное значение дисперсии гармоник данной группы не превышает пороговое значение для дисперсии СП, то эти гармоники соответствующих групп считают гармониками соответствующего речевого сигнала, рассчитывают их длительности как сумму значений длительности соответствующего речевого сигнала и интервала сдвига, запоминают информацию о длительности речевых сигналов, гармоники, время существования которых не превышает минимальное пороговое значение или превышает максимальное пороговое значение длительности речевого сигнала, считают гармониками помехи, уничтожают информацию о значениях их частот и СП, осуществляют перенумерацию речевых сигналов, осуществляют сдвиг «скользящего окна», если на предыдущем шаге гармоники были обнаружены и число обнаруженных на текущем шаге гармоник не равно нулю, из обнаруженных гармоник выделяют гармоники, частоты которых отличаются от частот гармоник, обнаруженных для предыдущего положения «скользящего окна», если их число больше нуля, то запоминают значения СП этих гармоник, и соответствующие им значения частот, если существуют гармоники, обнаруженные для текущего положения «скользящего окна», значения частот которых совпадают с значениями частот гармоник, обнаруженных для предыдущего положения «скользящего окна», то сравнивают разности значений их СП с пороговым значением для возможного изменения СП, если полученные разности значений СП равны или превышают соответствующий порог, то считают, что появились гармоники с новыми значениями СП, значения их СП устанавливают равными соответствующим рассчитанным разностям значений СП, если полученные разности значений СП не превышают соответствующий порог, то считают, что значения СП гармоник, обнаруженных на предыдущем шаге, и их принадлежность к гармоникам помехи или сигнала не изменились, в случае если разности имеют отрицательное значение считают, что принадлежность гармоник, обнаруженных на предыдущем шаге, к гармоникам помехи или сигнала не изменились, значения их СП устанавливают равными соответствующим рассчитанным значениям СП, рассчитывают суммарное значение числа гармоник с новыми частотами и гармоник с новыми значениями СП, если это число не превышает пороговое значение для числа обнаруженных гармоник, то эти гармоники помечают как составляющие помехи, запоминают значения СП этих гармоник, и соответствующие им значения частот, осуществляют сдвиг «скользящего окна», если это число превышает пороговое значение для числа обнаруженных гармоник, то эти гармоники помечают как составляющие речевого сигнала, его номер рассчитывают путем увеличения на единицу номера речевого сигнала с максимальным значением, который был до этого использован, устанавливают значение его времени появления равным значению левой границы «скользящего окна», значение его длительности устанавливают равным длительности «скользящего окна», запоминают эти значения, значения СП этих гармоник, и соответствующие им значения частот, осуществляют сдвиг «скользящего окна», процесс завершают после того, как время анализа заканчивается.
если на предыдущем шаге гармоники были обнаружены и число обнаруженных на текущем шаге гармоник не равно нулю, из обнаруженных гармоник выделяют гармоники, частоты которых отличаются от частот гармоник, обнаруженных для предыдущего положения «скользящего окна», если их число больше нуля, то запоминают значения СП этих гармоник, и соответствующие им значения частот,
если существуют гармоники, обнаруженные для текущего положения «скользящего окна», значения частот которых совпадают с значениями частот гармоник, обнаруженных для предыдущего положения «скользящего окна», то сравнивают разности значений их СП с пороговым значением для возможного изменения СП, если полученные разности значений СП равны или превышают соответствующий порог, то считают, что появились гармоники с новыми значениями СП, значения их СП устанавливают равными соответствующим рассчитанным разностям значений СП, если полученные разности значений СП не превышают соответствующий порог, то считают, что значения СП гармоник, обнаруженных на предыдущем шаге, и их принадлежность к гармоникам помехи или сигнала не изменились, в случае если разности имеют отрицательное значение считают, что принадлежность гармоник, обнаруженных на предыдущем шаге, к гармоникам помехи или сигнала не изменились, значения их СП устанавливают равными соответствующим рассчитанным значениям СП,
рассчитывают суммарное значение числа гармоник с новыми частотами и гармоник с новыми значениями СП,
если это число не превышает пороговое значение для числа обнаруженных гармоник, то эти гармоники помечают как составляющие помехи, запоминают значения СП этих гармоник, и соответствующие им значения частот, осуществляют сдвиг «скользящего окна»,
если это число превышает пороговое значение для числа обнаруженных гармоник, то эти гармоники помечают как составляющие речевого сигнала, его номер рассчитывают путем увеличения на единицу номера речевого сигнала с максимальным значением, который был до этого использован, устанавливают значение его времени появления равным значению левой границы «скользящего окна», значение его длительности устанавливают равным длительности «скользящего окна», запоминают эти значения, значения СП этих гармоник, и соответствующие им значения частот, осуществляют сдвиг «скользящего окна», процесс завершают после того, как время анализа заканчивается.
Предлагаемый способ заключается в следующем.
Последовательность опорных частот ω1, ω2, …, ωi, …, ωn формируют, исходя из необходимой точности анализа речевого сигнала. Например, путем формирования сетки частот по принципу задания расстояния между соседними частотами как какой-либо процент от предыдущего значения частоты, то есть
где: Fi, F(i-1) - i-е и (i-1)-е значения частот, соответственно;
Kp - процент от предыдущего значения частоты.
При этом: F1= Fmin (300 Гц);
Fn ≤ Fmax (3400 Гц).
Здесь: Fmin - минимальное значение частоты спектра речевого сигнала;
Fmax - максимальное значение частоты спектра речевого сигнала;
n - число используемых опорных частот.
Для исходного сигнала a(ti), заданного отсчетами мгновенных значений в моменты времени - интервал анализа
t1, t2, …,tj, …, tN; t2-t1 =t3-t2=tN-tN-1= … =Δt; Δt=Т/N,
где Δt - шаг дискретизации;
N - количество точек за время T,
берут отсчеты аддитивной смеси сигнала и помехи.
Отсчеты опорных сигналов формируют также как отсчеты аддитивной смеси сигнала и помехи.
В условиях отсутствия акустических помех, для нескольких разновидностей речевого сигнала осуществляют обработку речевого сигнала способом квадратурной обработки с компенсацией комбинационных составляющих.
Обработку осуществляют следующим образом.
Для последовательности частот ω1, ω2, …, ωi, …, ωn, (опорные частоты) определяют спектральную плотность (СП) по выражениям:
;
;
,
где S1(ωj) и S2(ωj) - синусная и косинусная составляющие спектральной плотности, которые получают с использованием способа квадратурной обработки с компенсацией комбинационных составляющих.
Обработку осуществляют с использованием способа компенсации шумов преобразования - гармоник разностной частоты (комбинационные составляющие), например, способом, описанном в патенте РФ №2683021.
Для обработки одной частоты используют две линейки устройства. То есть, если используют k опорных частот, то число линеек равно
N=2*k.
Принятую аддитивную смесь сигнала и помехи подают на первые входы блоков умножения 1.1-1.n, на вторые входы которых подают соответствующие опорные сигналы, например,
Uоп1=sin(x1);
Uоп2=cos(x1).
…
Uоп(n-1)=sin(xk);
Uопn=cos(xk).
Результаты умножения сигнала и помехи на соответствующие опорные сигналы обрабатывают одинаково. А именно, каждый результат преобразования сигнала и помехи, которые образуются после умножения входного сигнала на синус и косинус опорных частот, разделяют на две одинаковые составляющие. Обработку полученных сигналов осуществляют одинаково в соответствующих линейках - каждый из полученных сигналов разветвляют на две одинаковые составляющие, первую составляющую фильтруют фильтром нижних частот (ФНЧ), полоса которого согласована с полосой анализируемого сигнала, одновременно вторую составляющую фильтруют полосовым фильтром, полоса пропускания которого выбирается так, что верхняя частота полосового фильтра соответствует верхней частоте анализируемого сигнала, нижнюю частоту полосового фильтра устанавливают равной некоторому заранее заданному значению.
Выбор ФНЧ и полосового фильтра осуществляют с идентичными в максимальной степени фазо-частотными характеристиками и так, что амплитудно-частотная характеристика (АЧХ) полосового фильтра в области частот близких к нулю имеет максимально-возможную крутизну, в области частот, начиная со значения, для которого разность значений АЧХ ФНЧ и полосового фильтра становится меньше некоторой заранее заданной величины, обеспечивают идентичность их АЧХ в максимальной степени (рисунок, поясняющий процесс обработки, приведен на фиг. 1).
Сигналы, прошедшие ФНЧ и полосовой фильтр, вычитают один из другого. Результат вычитания преобразуют в цифровой вид. По данным значениям, соответствующим синусной и косинусной составляющей одной частоты, определяют значение спектральной плотности (СП) для каждой опорной частоты и запоминают эти значения пропорциональные амплитуде сигналов и соответствующие значения частот.
Рассчитывают средние значения СП для каждой частоты и дисперсию этих значений известным образом, см., например, «Е.С. Вентцель, Теория вероятностей, изд. «Наука», М. 1969 г., стр. 96».
Рассчитывают пороговое значение для дисперсии средних значений СП гармоник - пороговое значение для дисперсии СП, путем умножения найденного значения дисперсии амплитуд на коэффициент, значение которого устанавливают заранее.
Рассчитывают начальное пороговое значение для значений СП гармоник - начальные пороговые значения для СП, путем умножения рассчитанных средних значений СП на коэффициент, значение которого устанавливают заранее.
Устанавливают:
- пороговое значение для значений СП гармоник;
- минимальное и максимальное пороговые значения для значений СП гармоник сигнала;
- пороговое значение для возможного изменения СП, определяемое исходя из точности расчета их значений и возможного изменения СП за интервал сдвига - пороговое значение для возможного изменения СП гармоник;
- пороговое значение для числа обнаруженных гармоник;
- пороговое значение для максимального числа гармоник сигнала;
- минимальное и максимальное пороговые значения длительности гармоник речевого сигнала - времени существования гармоник речевого сигнала.
Значение длительности «скользящего окна» может быть установлено, например, равным 20 мс.
Значение длительности интервала сдвига может быть установлено, например, равным 5 мс.
Пороговое значение для числа обнаруженных гармоник может быть установлено, например, равным 8.
Пороговое значение для максимального числа гармоник сигнала может быть установлено, например, равным 15.
Минимальное пороговое значение длительности гармоник речевого сигнала может быть установлено, например, равным 20 мс.
Максимальное пороговое значение длительности гармоник речевого сигнала может быть установлено, например, равным 200 мс.
Значения данных пороговых значений, а также коэффициента, который используют при расчете порогового значение для дисперсии СП гармоник, близкие к оптимальным определяют путем математического моделирования или экспериментальным путем. При этом в качестве критерия оптимизации может использоваться, например, минимальное среднее значение среднеквадратического отклонения (см., например, «Е.С. Вентцель, Теория вероятностей, изд. «Наука», М. 1969 г.», стр. 96) восстановленного фрагмента речевого сообщения от его эталонного вида - речевое сообщение в условиях отсутствия помех, для различных значений отношения мощностей сигнала и помехи.
Для первого положения «скользящего окна» осуществляют следующее (рисунки, поясняющий процесс анализа спектров аддитивной суммы речевого сигнала и акустических помех, приведены на фиг. 2, фиг. 3).
Устанавливают значение его левой границы - меньшее значение равным нулю, осуществляют обработку смеси сигнала или помехи, или смеси сигнала и помехи - входной сигнал способом квадратурной обработки с компенсацией комбинационных составляющих, числу зарегистрированных речевых сигналов присваивают значение, равное нулю.
Рассчитывают число гармоник, значения СП которых превышают порог - обнаруженные гармоники, если это число равно нулю, то осуществляют сдвиг «скользящего окна», если данное число больше нуля, то запоминают значения СП и соответствующие им значения частот гармоник.
Рассчитывают число гармоник, для которых значения СП превышают минимальное и не превышают максимальное пороговые значения для СП сигнала. Если это число не превышает пороговое значение для числа обнаруженных гармоник, то эти гармоники помечают как составляющие помехи.
Осуществляют сдвиг «скользящего окна».
Если данное число гармоник превышает пороговое значение для числа обнаруженных гармоник, то рассчитывают дисперсию значений СП этих гармоник. Если рассчитанное значение дисперсии превышает пороговое значение для дисперсии СП, то эти гармоники помечают как составляющие помехи.
Осуществляют сдвиг «скользящего окна».
Если рассчитанное значение дисперсии не превышает пороговое значение для дисперсии СП, то эти гармоники помечают как составляющие первого речевого сигнала. Устанавливают значение времени существования гармоник первого речевого сигнала равным значению длительности «скользящего окна». Значение его времени появления устанавливают равным нулю. Номеру данного речевого сигнала присваивают значение, равное единице.
Осуществляют сдвиг «скользящего окна».
При первом сдвиге - второе положение «скользящего окна», осуществляют обработку помехи или речевого сигнала, или аддитивной смеси сигнала и помехи способом квадратурной обработки с компенсацией комбинационных составляющих. Устанавливают значение его левой границы равным величине интервала сдвига.
Рассчитывают число обнаруженных гармоник. Если это число равно нулю, и если на предыдущем шаге гармоники не были обнаружены, то осуществляют сдвиг «скользящего окна».
Если число обнаруженных гармоник больше нуля, то запоминают значения СП и соответствующие значения частот гармоник.
Если на предыдущем шаге гармоники были обнаружены, число обнаруженных гармоник равно нулю или среди обнаруженных гармоник отсутствуют гармоники с такими же частотами, как у гармоник, обнаруженных на предыдущем шаге, то осуществляют следующие действия:
если некоторые из гармоник, обнаруженных на предыдущем шаге, были помечены как гармоники помехи, то уничтожают информацию о параметрах этих гармоник;
для гармоник, обнаруженных на предыдущем шаге, которые были помечены как гармоники речевого сигнала, находят гармоники, время существования которых превышает минимальное пороговое значение и не превышает максимальное пороговое значение длительности речевого сигнала, рассчитывают их число, если это число не превышает пороговое значение для числа обнаруженных гармоник, то считают, что данные гармоники являются гармониками помехи, уничтожают информацию о значениях их частот и СП, в противном случае рассчитывают дисперсию значений СП этих гармоник, если рассчитанное значение дисперсии превышает пороговое значение для дисперсии СП, то эти гармоники помечают как составляющие помехи, уничтожают информацию о значениях их частот и СП, если рассчитанное значение дисперсии не превышает пороговое значение для дисперсии СП, эти гармоники считают гармониками первого речевого сигнала, рассчитывают его длительность как сумму значений «скользящего окна» и интервала сдвига, запоминают информацию о значении длительности сигнала.
Рассчитывают значения амплитуд гармоник, помеченных как гармоники речевого сигнала по формуле
где: Uгi - значение амплитуды i-й гармоники;
Kпр - коэффициент преобразования;
Uспi - значение СП i-й гармоники.
Значение коэффициента преобразования определяют путем математического моделирования или экспериментальным путем.
Гармоники, время существования которых не превышает минимальное пороговое значение или превышает максимальное пороговое значение длительности речевого сигнала, считают гармониками помехи, уничтожают информацию о значениях их частот и СП.
Если на предыдущем шаге гармоники были обнаружены и число обнаруженных на текущем шаге гармоник не равно нулю из обнаруженных гармоник выделяют гармоники, частоты которых отличаются от частот гармоник, обнаруженных для предыдущего положения «скользящего окна» - гармоники с новыми частотами. Если их число больше нуля, то запоминают значения СП этих гармоник, и соответствующие им значения частот.
Если существуют гармоники, обнаруженные для текущего положения «скользящего окна», значения частот которых совпадают с значениями частот гармоник, обнаруженных для предыдущего положения «скользящего окна», то сравнивают разности значений их СП с пороговым значением для возможного изменения СП. Если полученные разности значений СП равны или превышают соответствующий порог, то считают, что появились гармоники с новыми значениями СП.
Значения их СП устанавливают равными соответствующим рассчитанным разностям значений СП.
Если модули полученных разностей значений СП не превышают соответствующий порог, то считают, что значения СП гармоник, обнаруженных на предыдущем шаге и их принадлежность к гармоникам помехи или сигнала, не изменились.
В случае если значение разности имеет отрицательное значение, считают, что принадлежность гармоник, обнаруженных на предыдущем шаге, к гармоникам помехи или сигнала не изменились. Значения их СП устанавливают равными соответствующим рассчитанным значениям СП.
Рассчитывают суммарное значение числа гармоник с новыми частотами и гармоник с новыми значениями СП. Если это число превышает пороговое значение для числа обнаруженных гармоник, то эти гармоники помечают как составляющие речевого сигнала. Его номер рассчитывают путем увеличения на единицу номера речевого сигнала с максимальным значением, который был до этого использован. Устанавливают значение его времени появления равным значению левой границы «скользящего окна». Значение его длительности устанавливают равным длительности «скользящего окна». Запоминают данное значение длительности сигнала, значения СП этих гармоник, и соответствующие им значения частот.
Осуществляют сдвиг «скользящего окна»
Если данное число обнаруженных гармоник не превышает пороговое значение для числа обнаруженных гармоник, то эти гармоники помечают как составляющие помехи. Запоминают значения СП этих гармоник и соответствующие им значения частот.
Осуществляют сдвиг «скользящего окна».
При n-ом сдвиге «скользящего окна» - (n+1)-ое положение «скользящего окна», осуществляют обработку помехи или речевого сигнала, или аддитивной смеси сигнала и помехи способом квадратурной обработки с компенсацией комбинационных составляющих. Определяют значение его левой границы как суммарное значение предыдущего значения левой границы «скользящего окна» и величины интервала сдвига.
Рассчитывают число обнаруженных гармоник. Если это число равно нулю, и если на предыдущем шаге гармоники не были обнаружены, то осуществляют сдвиг «скользящего окна».
Если число обнаруженных гармоник больше нуля, то запоминают значения СП и соответствующие значения частот гармоник. Если на предыдущем шаге гармоники были обнаружены, число обнаруженных гармоник равно нулю или среди обнаруженных гармоник отсутствуют гармоники с такими же частотами, как у гармоник, обнаруженных на предыдущем шаге, то осуществляют следующие действия:
если некоторые из этих гармоник были помечены как гармоники помехи, то уничтожают информацию о параметрах этих гармоник;
для гармоник, которые были помечены как гармоники речевого сигнала, если они принадлежат разным речевым сигналам, то для всех групп гармоник, принадлежащих разным речевым сигналам, осуществляют следующее,
проверяют выполнение условия, что их время существования превышает минимальное пороговое значение и не превышает максимальное пороговое значение длительности речевого сигнала, рассчитывают число гармоник, для которых выполняется данное условие, если это число для какой-либо группы гармоник не превышает пороговое значение для числа обнаруженных гармоник, то считают, что данные гармоники являются гармониками помехи, уничтожают информацию о значениях их частот и СП, осуществляют перенумерацию речевых сигналов, в противном случае рассчитывают дисперсию значений СП этих гармоник, если рассчитанное значение дисперсии превышает пороговое значение для дисперсии СП, то гармоники, входящие в данные группы, считают составляющими помехи, уничтожают информацию о значениях их частот и СП, осуществляют перенумерацию речевых сигналов, если рассчитанное значение дисперсии гармоник данной группы не превышает пороговое значение для дисперсии СП, то эти гармоники соответствующих групп считают гармониками соответствующего речевого сигнала, рассчитывают их длительности как сумму значений длительности соответствующего речевого сигнала и интервала сдвига, запоминают информацию о длительности речевых сигналов, гармоники, время существования которых не превышает минимальное пороговое значение или превышает максимальное пороговое значение длительности речевого сигнала, считают гармониками помехи, уничтожают информацию о значениях их частот и СП, осуществляют перенумерацию речевых сигналов, осуществляют сдвиг «скользящего окна».
Если на предыдущем шаге гармоники были обнаружены и число обнаруженных на текущем шаге гармоник не равно нулю, из обнаруженных гармоник выделяют гармоники, частоты которых отличаются от частот гармоник, обнаруженных для предыдущего положения «скользящего окна». Если их число больше нуля, то запоминают значения СП этих гармоник, и соответствующие им значения частот.
Если существуют гармоники, обнаруженные для текущего положения «скользящего окна», значения частот которых совпадают с значениями частот гармоник, обнаруженных для предыдущего положения «скользящего окна», то сравнивают разности значений их СП с пороговым значением для возможного изменения СП. Если полученные разности значений СП равны или превышают соответствующий порог, то считают, что появились гармоники с новыми значениями СП. Значения их СП устанавливают равными соответствующим рассчитанным разностям значений СП. Если полученные разности значений СП не превышают соответствующий порог, то считают, что значения СП гармоник, обнаруженных на предыдущем шаге, и их принадлежность к гармоникам помехи или сигнала не изменились. В случае если разности имеют отрицательное значение, то считают, что принадлежность гармоник, обнаруженных на предыдущем шаге, к гармоникам помехи или сигнала не изменились. Значения их СП устанавливают равными соответствующим рассчитанным значениям СП. Рассчитывают суммарное значение числа гармоник с новыми частотами и гармоник с новыми значениями СП.
Если это число не превышает пороговое значение для числа обнаруженных гармоник, то эти гармоники помечают как составляющие помехи. Запоминают значения СП этих гармоник, и соответствующие им значения частот.
Осуществляют сдвиг «скользящего окна».
Если это число превышает пороговое значение для числа обнаруженных гармоник, то эти гармоники помечают как составляющие речевого сигнала. Его номер рассчитывают путем увеличения на единицу номера речевого сигнала с максимальным значением, который был до этого использован. Устанавливают значение его времени появления равным значению левой границы «скользящего окна». Значение его длительности устанавливают равным длительности «скользящего окна». Запоминают эти значения, значения СП данных гармоник, и соответствующие им значения частот.
Осуществляют сдвиг «скользящего окна».
Процесс завершают после того, как время анализа заканчивается.
На выход системы подают информацию о номере речевого сигнала, значениях частот, амплитуд и времени появления и времени существования гармоник речевого сигнала.
Воспроизводят сигнал в соответствующих интервалах, длительность которых равна величине интервала сдвига. Значение времени начала интервалов рассчитывают следующим образом
где: Тиij - значение времени начала i-го интервала, при обработке j-го речевого сигнала;
i - номер интервала, в котором воспроизводят j-й речевой сигнал;
Тис - значение интервала сдвига.
При этом
Ти0=Тни,
где Тни - значение времени начала речевого сигнала.
Воспроизводят речевой сигнал в цифровом виде путем суммирования соответствующих значений амплитуд гармонических составляющих, существующих в данном временном интервале.
Таким образом, за счет проводимого временного анализа спектра аддитивной смеси сигнала и акустических помех, распознают гармоники помехи по значениям СП, по величине дисперсии значений СП гармоник, по числу одновременно появившихся гармоник, по времени их существования, что позволяет повысить эффективность выделения гармоник речевого сигнала при наличии акустического шума.
Структурная схема устройства, при использовании которого может быть реализован предлагаемый способ, приведена на фиг.4, где обозначено:
1 - электроакустическое устройство (ЭАУ);
2 - фильтр нижних частот (ФНЧ);
3 - усилитель низких частот (УНЧ);
4 - аналого-цифровой преобразователь (АЦП);
5 - первое вычислительное устройство (ВУ);
6 - второе вычислительное устройство (ВУ).
Устройство содержит последовательно соединенные электроакустическое устройство 1, фильтр нижних частот 2, усилитель низких частот 3, аналого-цифровой преобразователь 4, первое вычислительное устройство 5 и второе вычислительное устройство 6, выход которого является выходом всего устройства, вход ЭАУ 1 является входом устройства для реализации предлагаемого способа.
Устройство работает следующим образом.
Помеху или речевой сигнал, или аддитивную смесь речевого сигнала и помехи, которые поступают на вход ЭАУ 1, с его выхода подают на вход ФНЧ 2, где их фильтруют. Полосу ФНЧ 2 согласуют с полосой речевого сигнала. Затем помеху или речевой сигнал, или аддитивную смесь речевого сигнала и помехи усиливают в УНЧ 3 и затем подают на вход АЦП 4.
Отсчеты помехи или речевого сигнала или аддитивной смеси речевого сигнала и помехи, образуемые в АЦП 4, в цифровом виде поступают на вход первого ВУ 5.
В ВУ 5, поступившие отсчеты сигнала или помехи или смеси сигнала и помехи обрабатывают с использованием способа спектрального анализа многочастотных периодических сигналов с использованием компенсации комбинационных составляющих, описанного выше.
В ВУ 6, поступившие значения частот и СП гармоник с ВУ 5, обрабатывают по описанному выше алгоритму.
На выход ВУ 6 подают информацию о номере речевого сигнала, значениях частот, амплитуд и времени появления и времени существования (длительности) гармоник речевого сигнала.
АЦП 4 может быть выполнен, например, на микросхеме AD7495BR фирмы Analog Devices.
Первое 5 и второе 6 вычислительные устройства могут быть выполнены, например, в виде единого микропроцессорного устройства с соответствующим программным обеспечением, например, процессора серии TMS320VC5416 фирмы Texas Instruments, или в виде программируемой логической интегральной схемы (ПЛИС), с соответствующим программным обеспечением, например, ПЛИС XCV400 фирмы Xilinx.
Таким образом, заявляемый способ может быть реализован описанным устройством.
Изобретение относится к области вычислительной техники для обработки аудиоданных. Технический результат заключается в повышении эффективности выделения гармоник речевого сигнала при наличии акустического шума. Технический результат достигается за счет того, что проводят спектральный анализ шума или аддитивной смеси речевого сигнала и шума в установленном интервале - «скользящем окне», которое в течение всего времени анализа периодически сдвигают на интервал заранее установленной величины. Спектральный анализ проводят методом анализа многочастотных периодических сигналов, представленных цифровыми отсчетами, с использованием компенсации комбинационных составляющих. Распознают принадлежность гармоник речевому сигналу или помехе по значению спектральной плотности (СП), по числу одновременно появившихся гармоник, по времени их существования, по дисперсии значений СП гармоник. На выход системы подают информацию о номере речевого сигнала, значениях частот, амплитуд и времени появления и времени существования гармоник речевого сигнала. 4 ил.
Способ выделения речевого сигнала с использованием временного анализа спектра аддитивной смеси сигнала и акустических помех, заключающийся в том, что для исходного сигнала a(ti), заданного отсчетами мгновенных значений в моменты времени – интервал анализа
t1, t2, …,tj, …, tN; t2-t1 =t3-t2=tN-tN-1= … =Δt; t=Т/N,
где Δt - шаг дискретизации;
N - количество точек за время T,
для последовательности частот 1, 2, …, i, …, n, (опорные частоты) определяют мгновенную спектральную плотность (МСП) по выражениям:
S(ωj)= ;
;
,
где S1(j) и S2(j) - синусная и косинусная составляющие спектральной плотности, которые получают с использованием способа квадратурной обработки с компенсацией комбинационных составляющих, а именно, каждый результат преобразования сигнала и помехи, которые образуются после умножения входного сигнала на синус и косинус опорных частот, разделяют на две одинаковые составляющие, обработку полученных сигналов осуществляют одинаково в соответствующих линейках - каждый из полученных сигналов разветвляют на две одинаковые составляющие, первую составляющую фильтруют фильтром нижних частот (ФНЧ), полоса которого согласована с полосой анализируемого сигнала, одновременно вторую составляющую фильтруют полосовым фильтром, полоса пропускания которого выбирается так, что верхняя частота полосового фильтра соответствует верхней частоте анализируемого сигнала, нижнюю частоту полосового фильтра устанавливают равной некоторому заранее заданному значению, выбор ФНЧ и полосового фильтра осуществляют с идентичными в максимальной степени фазочастотными характеристиками и так, что амплитудно-частотная характеристика (АЧХ) полосового фильтра в области частот, близких к нулю, имеет максимально-возможную крутизну, в области частот, начиная со значения, для которого разность значений АЧХ ФНЧ и полосового фильтра становится меньше некоторой заранее заданной величины, обеспечивают идентичность их АЧХ в максимальной степени, сигналы, прошедшие ФНЧ и полосовой фильтр, вычитают один из другого, результат вычитания преобразуют в цифровой вид, по данным значениям, соответствующим синусной и косинусной составляющей одной частоты, определяют значение спектральной плотности (СП) для каждой опорной частоты и запоминают эти значения пропорциональные амплитуде сигналов и соответствующие значения частот, отличающийся тем, что формируют «скользящее окно» – интервал времени заданной длительности, «скользящее окно» в течение всего времени анализа периодически сдвигают на интервал заранее установленной величины – интервал сдвига, предварительно, в условиях отсутствия акустических помех, для нескольких разновидностей речевого сигнала осуществляют обработку речевого сигнала способом квадратурной обработки с компенсацией комбинационных составляющих, рассчитывают средние значения СП для каждой частоты и дисперсию этих значений, рассчитывают пороговое значение для дисперсии средних значений СП гармоник – пороговое значение для дисперсии СП, путем умножения найденного значения дисперсии амплитуд на коэффициент, значение которого устанавливают заранее, устанавливают: пороговое значение для значений СП гармоник, минимальное и максимальное пороговые значения для значений СП гармоник сигнала; пороговое значение для возможного изменения СП, определяемое исходя из точности расчета их значений и возможного изменения СП за интервал сдвига – пороговое значение для возможного изменения СП гармоник; пороговое значение для числа обнаруженных гармоник; минимальное и максимальное пороговые значения времени существования – длительности гармоник речевого сигнала,
для первого положения «скользящего окна» устанавливают значение его левой границы – меньшее значение равным нулю, осуществляют обработку смеси сигнала или помехи или смеси сигнала и помехи – входной сигнал способом квадратурной обработки с компенсацией комбинационных составляющих, числу зарегистрированных речевых сигналов присваивают значение, равное нулю, рассчитывают число гармоник, значения СП которых превышают порог – обнаруженные гармоники, если это число равно нулю, то осуществляют сдвиг «скользящего окна», если данное число больше нуля, то запоминают значения СП и соответствующие им значения частот гармоник, рассчитывают число гармоник, для которых значения СП превышают минимальное и не превышают максимальное пороговые значения для СП сигнала, если это число не превышает пороговое значение для числа обнаруженных гармоник, то эти гармоники помечают как составляющие помехи, осуществляют сдвиг «скользящего окна», если данное число гармоник превышает пороговое значение для числа обнаруженных гармоник, то рассчитывают дисперсию значений СП этих гармоник, если рассчитанное значение дисперсии превышает пороговое значение для дисперсии СП, то эти гармоники помечают как составляющие помехи, осуществляют сдвиг «скользящего окна», если рассчитанное значение дисперсии не превышает пороговое значение для дисперсии СП, то эти гармоники помечают как составляющие первого речевого сигнала, устанавливают значение времени существования гармоник первого речевого сигнала равным значению длительности «скользящего окна», значение его времени появления устанавливают равным нулю, номеру данного речевого сигнала присваивают значение, равное единице, осуществляют сдвиг «скользящего окна», при первом сдвиге – второе положение «скользящего окна», осуществляют обработку помехи или речевого сигнала или аддитивной смеси сигнала и помехи способом квадратурной обработки с компенсацией комбинационных составляющих, устанавливают значение его левой границы равным величине интервала сдвига, рассчитывают число обнаруженных гармоник, если это число равно нулю, и если на предыдущем шаге гармоники не были обнаружены, то осуществляют сдвиг «скользящего окна», если число обнаруженных гармоник больше нуля, то запоминают значения СП и соответствующие значения частот гармоник, если на предыдущем шаге гармоники были обнаружены, число обнаруженных гармоник равно нулю или среди обнаруженных гармоник отсутствуют гармоники с такими же частотами, как у гармоник, обнаруженных на предыдущем шаге, то осуществляют следующие действия: если некоторые из гармоник, обнаруженных на предыдущем шаге, были помечены как гармоники помехи, то уничтожают информацию о параметрах этих гармоник; для гармоник, обнаруженных на предыдущем шаге, которые были помечены как гармоники речевого сигнала, находят гармоники, время существования которых превышает минимальное пороговое значение и не превышает максимальное пороговое значение длительности речевого сигнала, рассчитывают их число, если это число не превышает пороговое значение для числа обнаруженных гармоник, то считают, что данные гармоники являются гармониками помехи, уничтожают информацию о значениях их частот и СП, в противном случае рассчитывают дисперсию значений СП этих гармоник, если рассчитанное значение дисперсии превышает пороговое значение для дисперсии СП, то эти гармоники помечают как составляющие помехи, уничтожают информацию о значениях их частот и СП, если рассчитанное значение дисперсии не превышает пороговое значение для дисперсии СП, эти гармоники считают гармониками первого речевого сигнала, рассчитывают его длительность как сумму значений «скользящего окна» и интервала сдвига, запоминают информацию о значении длительности сигнала; гармоники, время существования которых не превышает минимальное пороговое значение или превышает максимальное пороговое значение длительности речевого сигнала, считают гармониками помехи, уничтожают информацию о значениях их частот и СП,
если на предыдущем шаге гармоники были обнаружены и число обнаруженных на текущем шаге гармоник не равно нулю, из обнаруженных гармоник выделяют гармоники, частоты которых отличаются от частот гармоник, обнаруженных для предыдущего положения «скользящего окна» – гармоники с новыми частотами, если их число больше нуля, то запоминают значения СП этих гармоник и соответствующие им значения частот, если существуют гармоники, обнаруженные для текущего положения «скользящего окна», значения частот которых совпадают с значениями частот гармоник, обнаруженных для предыдущего положения «скользящего окна», то сравнивают разности значений их СП с пороговым значением для возможного изменения СП, если полученные разности значений СП равны или превышают соответствующий порог, то считают, что появились гармоники с новыми значениями СП, значения их СП устанавливают равными соответствующим рассчитанным разностям значений СП, если модули полученных разностей значений СП не превышают соответствующий порог, то считают, что значения СП гармоник, обнаруженных на предыдущем шаге, и их принадлежность к гармоникам помехи или сигнала не изменились, в случае если значение разности имеет отрицательное значение, считают, что принадлежность гармоник, обнаруженных на предыдущем шаге, к гармоникам помехи или сигнала не изменились, значения их СП устанавливают равными соответствующим рассчитанным значениям СП, рассчитывают суммарное значение числа гармоник с новыми частотами и гармоник с новыми значениями СП, если это число превышает пороговое значение для числа обнаруженных гармоник, то эти гармоники помечают как составляющие речевого сигнала, его номер рассчитывают путем увеличения на единицу номера речевого сигнала с максимальным значением, который был до этого использован, устанавливают значение его времени появления равным значению левой границы «скользящего окна», значение его длительности устанавливают равным длительности «скользящего окна», запоминают эти значения, значения СП этих гармоник и соответствующие им значения частот, осуществляют сдвиг «скользящего окна», если данное число обнаруженных гармоник не превышает пороговое значение для числа обнаруженных гармоник, то эти гармоники помечают как составляющие помехи, запоминают значения СП этих гармоник и соответствующие им значения частот, осуществляют сдвиг «скользящего окна», при n-м сдвиге «скользящего окна» – (n+1)-е положение «скользящего окна», осуществляют обработку помехи или речевого сигнала или аддитивной смеси сигнала и помехи способом квадратурной обработки с компенсацией комбинационных составляющих, определяют значение его левой границы как суммарное значение предыдущего значения левой границы «скользящего окна» и величины интервала сдвига,
рассчитывают число обнаруженных гармоник, если это число равно нулю, и если на предыдущем шаге гармоники не были обнаружены, то осуществляют сдвиг «скользящего окна», если число обнаруженных гармоник больше нуля, то запоминают значения СП и соответствующие значения частот гармоник, если на предыдущем шаге гармоники были обнаружены, число обнаруженных гармоник равно нулю или среди обнаруженных гармоник отсутствуют гармоники с такими же частотами, как у гармоник, обнаруженных на предыдущем шаге, то осуществляют следующие действия: если некоторые из этих гармоник были помечены как гармоники помехи, то уничтожают информацию о параметрах этих гармоник; для гармоник, которые были помечены как гармоники речевого сигнала, если они принадлежат разным речевым сигналам, то для всех групп гармоник, принадлежащих разным речевым сигналам, осуществляют следующее: проверяют выполнение условия, что их время существования превышает минимальное пороговое значение и не превышает максимальное пороговое значение длительности речевого сигнала, рассчитывают число гармоник, для которых выполняется данное условие, если это число для какой-либо группы гармоник не превышает пороговое значение для числа обнаруженных гармоник, то считают, что данные гармоники являются гармониками помехи, уничтожают информацию о значениях их частот и СП, осуществляют перенумерацию речевых сигналов, в противном случае рассчитывают дисперсию значений СП этих гармоник, если рассчитанное значение дисперсии превышает пороговое значение для дисперсии СП, то гармоники, входящие в данные группы, считают составляющими помехи, уничтожают информацию о значениях их частот и СП, осуществляют перенумерацию речевых сигналов, если рассчитанное значение дисперсии гармоник данной группы не превышает пороговое значение для дисперсии СП, то эти гармоники соответствующих групп считают гармониками соответствующего речевого сигнала, рассчитывают их длительности как сумму значений длительности соответствующего речевого сигнала и интервала сдвига, запоминают информацию о длительности речевых сигналов, гармоники, время существования которых не превышает минимальное пороговое значение или превышает максимальное пороговое значение длительности речевого сигнала, считают гармониками помехи, уничтожают информацию о значениях их частот и СП, осуществляют перенумерацию речевых сигналов, осуществляют сдвиг «скользящего окна», если на предыдущем шаге гармоники были обнаружены и число обнаруженных на текущем шаге гармоник не равно нулю, из обнаруженных гармоник выделяют гармоники, частоты которых отличаются от частот гармоник, обнаруженных для предыдущего положения «скользящего окна», если их число больше нуля, то запоминают значения СП этих гармоник и соответствующие им значения частот, если существуют гармоники, обнаруженные для текущего положения «скользящего окна», значения частот которых совпадают с значениями частот гармоник, обнаруженных для предыдущего положения «скользящего окна», то сравнивают разности значений их СП с пороговым значением для возможного изменения СП, если полученные разности значений СП равны или превышают соответствующий порог, то считают, что появились гармоники с новыми значениями СП, значения их СП устанавливают равными соответствующим рассчитанным разностям значений СП, если полученные разности значений СП не превышают соответствующий порог, то считают, что значения СП гармоник, обнаруженных на предыдущем шаге и их принадлежность к гармоникам помехи или сигнала не изменились, в случае если разности имеют отрицательное значение, считают, что принадлежность гармоник, обнаруженных на предыдущем шаге, к гармоникам помехи или сигнала не изменились, значения их СП устанавливают равными соответствующим рассчитанным значениям СП, рассчитывают суммарное значение числа гармоник с новыми частотами и гармоник с новыми значениями СП, если это число не превышает пороговое значение для числа обнаруженных гармоник, то эти гармоники помечают как составляющие помехи, запоминают значения СП этих гармоник, и соответствующие им значения частот, осуществляют сдвиг «скользящего окна», если это число превышает пороговое значение для числа обнаруженных гармоник, то эти гармоники помечают как составляющие речевого сигнала, его номер рассчитывают путем увеличения на единицу номера речевого сигнала с максимальным значением, который был до этого использован, устанавливают значение его времени появления равным значению левой границы «скользящего окна», значение его длительности устанавливают равным длительности «скользящего окна», запоминают эти значения, значения СП этих гармоник и соответствующие им значения частот, осуществляют сдвиг «скользящего окна», процесс завершают после того, как время анализа заканчивается.
Способ спектрального анализа многочастотных периодических сигналов с использованием компенсации комбинационных составляющих | 2019 |
|
RU2730043C1 |
Способ разделения речи и пауз путем анализа значений фаз частотных составляющих шума и сигнала | 2018 |
|
RU2680735C1 |
Токарный резец | 1924 |
|
SU2016A1 |
Способ приготовления лака | 1924 |
|
SU2011A1 |
US 8880396 B1, 04.11.2014. |
Авторы
Даты
2022-12-22—Публикация
2022-04-05—Подача