Обнаружение событий в дыхательных звуках субъекта Российский патент 2024 года по МПК A61B5/08 A61B7/00 

Описание патента на изобретение RU2829970C1

Связанные заявки

Настоящая заявка претендует на приоритет заявки на патент Австралии №2020902025, зарегистрированной 18 июня 2020 г., содержание которой включено в настоящую заявку путем ссылки.

Область техники

Настоящее изобретение относится к медицинским устройствам, а более конкретно - к системам, устройствам и способам для обнаружения конкретных акустических событий, например, звуков храпа или звуков дыхания, таких как хрипы, путем анализа записи звуков, издаваемых субъектом.

Уровень техники

Любые ссылки на известные способы, устройства или документы не следует рассматривать как свидетельство или признание того, что они формировали или формируют часть общих знаний.

Известны медицинские устройства, которые содержат датчик для преобразования звуков субъекта в электрические сигналы и которые дополнительно содержат различные устройства, реагирующие на сигналы этого датчика, и обрабатывают звуки, издаваемые субъектом, с генерированием прогноза о наличии болезней дыхательных путей. Если симптом болезни заключается в таком событии как храп или хрипы в дыхании, тогда предпочтительно было бы усовершенствовать медицинское устройство, чтобы оно было в состоянии опознать сегменты звуков, производимых субъектом, которые включают в себя эти события, например, в противоположность фону. Медицинское устройство, способное быстро распознать сегменты указанного события, повысило бы эффективность устройства, поскольку оно могло бы затем обработать только сегменты, содержащие указанное событие, и быстро отфильтровывать другие части записи.

Известно несколько подходов к идентификации конкретных событий, представляющих интерес с точки зрения звуков, производимых субъектом. Например, одно такое техническое решение описано в документе "Obstructive sleep apnea screening by integrating snore feature classes. Abeyratne U 2013 https://www.ncbi.nlm.n ih. gov/pubmed/23343563'', а другое - в "Dynamics of snoring sounds and its connection with obstructive sleep apnea. A. Alencar 2013".

В обоих этих подходах требуется обнаружить звуки храпа или дыхания на записи звуков субъекта. Однако уровни звуков храпа и звуков дыхания могут быть очень низкими относительно уровня фона записи, зафиксированного датчиком. Кроме того, способы обнаружения храпа на основе высоты тона не пригодны для обнаружения звуков дыхания, у которых нет никакого различимого тона.

Может произойти так, что отношение сигнал/шум для звуков, ассоциированных с событием, и фона, довольно низок. Следовательно, создать медицинское устройство, позволяющее достичь поставленной цели, представляет собой технически трудную задачу. Записи субъекта имеют очень низкий уровень громкости, и многие события, представляющий интерес, тонут в фоновом шуме.

Имеется потребность найти такое решение проблемы обнаружения одного или более типов акустических событий у субъекта в присутствии значительного фона, которое является усовершенствованием или по меньшей мере полезной альтернативой тем решениям, которые доступны в настоящее время.

Сущность изобретения

Согласно первому аспекту настоящего изобретения, предложен способ идентификации сегментов цифровой аудиозаписи субъекта, при этом указанные сегменты содержат конкретные акустические события, представляющие интерес, включающий:

фильтрование цифровой аудиозаписи на основе характеристического частотного диапазона акустических событий с получением фильтрованного цифрового аудиосигнала;

обработку фильтрованного цифрового аудиосигнала с получением соответствующей огибающей сигнала;

аппроксимацию огибающей сигнала статистическим распределением;

определение порогового значения для огибающей сигнала на основе статистического распределения и заранее заданного уровня вероятности; и

идентификацию сегментов огибающей сигнала, которые превышают пороговое значение, чтобы тем самым идентифицировать соответствующие сегменты цифровой аудиозаписи субъекта как сегменты цифровой аудиозаписи, содержащие конкретные акустические события, представляющие интерес.

В еще одном варианте осуществления настоящего изобретения цифровая звукозапись представляет собой запись цифрового аудиосигнала, который состоит из множества кадров. Например, цифровой аудиосигнал может содержать множество последовательных неперекрывающихся кадров. В одном примере каждый кадр имеет пятиминутную продолжительность, хотя они могут быть короче или длиннее.

В еще одном варианте осуществления настоящего изобретения цифровой аудиосигнал формируется с частотой дискретизации 44,1 кГц.

В еще одном варианте осуществления настоящего изобретения способ включает применение первой субдискретизации, при которой частота дискретизации уменьшается в целое число раз с получением первого субдискретизированного цифрового аудиосигнала. Например, цифровой аудиосигнал может быть субдискретизирован в три раза, от 44,1 кГц до 14,7 кГц, чтобы у первого субдискретизированного аудиосигнала была частота дискретизации 14,7 кГц.

В еще одном варианте осуществления настоящего изобретения первый субдискретизированный цифровой аудиосигнал фильтруют в характеристическом частотном диапазоне для выбора акустических событий, представляющих интерес, с получением тем самым первого субдискретизированного и отфильтрованного в соответствии с событием цифрового аудиосигнала.

В еще одном варианте осуществления настоящего изобретения события, представляющие интерес, включают звуки дыхания, при этом фильтрование цифровой аудиозаписи включает применение фильтра верхних частот.

В еще одном варианте осуществления настоящего изобретения события, представляющие интерес, включают звуки храпа, при этом фильтрование цифровой аудиозаписи включает применение фильтра нижних частот.

В еще одном варианте осуществления настоящего изобретения обработка фильтрованного цифрового сигнала с получением соответствующей огибающей сигнала, осуществляется путем процедуры обнаружения огибающей.

В еще одном варианте осуществления настоящего изобретения процедура обнаружения огибающей включает применение фильтра абсолютной величины к первому субдискретизированному и отфильтрованному в соответствии с событием сигналу с получением отфильтрованного сигнала абсолютной величины.

В еще одном варианте осуществления настоящего изобретения отфильтрованный сигнал абсолютной величины фильтруют прямым и обратным фильтром с получением отфильтрованного фильтром нижних частот сигнала абсолютной величины.

В еще одном варианте осуществления настоящего изобретения способ включает применение второй субдискретизации к отфильтрованному фильтром нижних частот сигналу абсолютной величины с получением огибающей сигнала, при этом огибающая сигнала содержит первую огибающую сигнала, которая является оценкой амплитуды аудиозаписи.

В еще одном варианте осуществления настоящего изобретения применение второй субдискретизации включает передискретизацию от 14,7 кГц до 100 Гц.

В еще одном варианте осуществления настоящего изобретения способ включает применение логарифмического сжатия к первой огибающей сигнала с получением второй огибающей сигнала, которая включает оценку мощности цифровой аудиозаписи.

В еще одном варианте осуществления настоящего изобретения аппроксимация статистическим распределением огибающей сигнала статистическим распределением включает аппроксимацию статистическим распределением второй огибающей сигнала, которая включает оценку мощности.

В еще одном варианте осуществления настоящего изобретения аппроксимация огибающей сигнала статистическим распределением включает сортировку отсчетов, составляющих огибающую сигнала, по интервалам (столбцам) с получением гистограммы. Например, в еще одном варианте осуществления настоящего изобретения может иметься 300 интервалов (столбцов гистограммы).

В еще одном варианте осуществления настоящего изобретения аппроксимация статистическим распределением включает выбор модального интервала гистограммы, в который отсортировано самое большое количество отсчетов.

В еще одном варианте осуществления настоящего изобретения интервал с номером n содержит отсчеты в диапазоне от n×(размер шага)+min до (n+1)×(размер шага)+min.

В еще одном варианте осуществления настоящего изобретения статистическое распределение включает распределение Пуассона, имеющее параметр лямбда, и аппроксимация статистическим распределением включает установку параметра лямбда равным номеру модального интервала.

В еще одном варианте осуществления настоящего изобретения определение порогового значения для огибающей сигнала на основе статистического распределения и заранее заданного уровня вероятности включает вычисление кумулятивной функции распределения (CDF) в отношении статистического распределения.

В еще одном варианте осуществления настоящего изобретения определение порогового значения для огибающей сигнала включает обнаружение порогового интервала, который представляет собой интервал, соответствующий заранее заданной вероятности, при этом уровень заранее заданной вероятности включает уровень вероятности для кумулятивной функции распределения.

В еще одном варианте осуществления настоящего изобретения, определение порогового значения включает установку порогового значения, равным величине из диапазона значений отсчетов в пороговом интервале.

В еще одном варианте осуществления настоящего изобретения пороговое значение устанавливают равным верхнему пределу диапазона значений отсчетов в пороговом интервале.

В еще одном варианте осуществления настоящего изобретения используют временной фильтр для отбрасывания сегментов, которые не находятся в пределах заранее заданного диапазона длительности, основанном на событиях, представляющих интерес.

В еще одном варианте осуществления настоящего изобретения события, представляющие интерес, включают звуки храпа, при этом диапазон продолжительности составляет от 225 миллисекунд до 4 секунд.

В еще одном варианте осуществления настоящего изобретения способ включает запись информации, указывающей время начала и конца для каждого из сегментов огибающей сигнала, которые лежат выше порогового значения, в энергонезависимую память в ассоциации с цифровой аудиозаписью.

Согласно еще одному аспекту настоящего изобретения, предложено устройство, содержащее машину для идентификации акустических событий, сконфигурированную для идентификации частей цифровой аудиозаписи субъекта, содержащих конкретные акустические события, представляющие интерес, содержащее:

процессор для обработки цифровой записи в соответствии,

цифровую память, которая связана с процессором с возможностью передачи данных и в которой хранятся цифровые инструкции, конфигурирующие процессор, при этом указанные инструкции заставляют процессор осуществлять:

фильтрование записи на основе характеристического частотного диапазона акустических событий;

обработку фильтрованной записи с получением соответствующей огибающей сигнала;

аппроксимацию огибающей сигнала статистическим распределением для определения порогового значения, соответствующего заранее заданному уровню вероятности; и

идентификацию сегментов огибающей сигнала, которые превышают порог, для идентификации соответствующих сегментов цифровой аудиозаписи как сегментов, содержащих конкретные акустические события.

В еще одном варианте осуществления настоящего изобретения устройство содержит микрофон, который сконфигурирован для улавливания звуков от субъекта.

В еще одном варианте осуществления настоящего изобретения устройство содержит аудиоинтерфейс, содержащий фильтр и аналогово-цифровой преобразователь, сконфигурированный для преобразования звуков субъекта в цифровой аудиосигнал.

В еще одном варианте осуществления настоящего изобретения устройство сконфигурировано для хранения цифрового аудиосигнала как цифровой аудиозаписи в цифровой памяти, доступной для процессора.

В еще одном варианте осуществления настоящего изобретения устройство содержит интерфейс человек-машина.

В еще одном варианте осуществления настоящего изобретения инструкции, хранящиеся в цифровой памяти, включают инструкции, которые заставляют процессор отображать на интерфейсе человек-машина информацию, включая информацию, идентифицирующую сегменты в цифровой аудиозаписи, содержащие события, представляющие интерес.

В еще одном варианте осуществления настоящего изобретения инструкции, хранящиеся в цифровой памяти, включают инструкции, которые заставляют процессор отображать на интерфейсе человек-машина информацию, включая информацию, идентифицирующую событие, представляющее интерес.

В еще одном варианте осуществления настоящего изобретения информация, которая отображается на интерфейсе человек-машина, включает информацию, идентифицирующую время начала и время окончания каждого из сегментов, идентифицированных как содержащие события, представляющие интерес.

В еще одном варианте осуществления настоящего изобретения цифровая память содержит инструкции, которые заставляют процессор записывать время начала и конца для каждого идентифицированного сегмента в энергонезависимую память, таким образом помечая сегменты, содержащие события, представляющие интерес, в цифровой аудиозаписи.

Согласно еще одному аспекту настоящего изобретения, предложен считываемый компьютером носитель, содержащий материальные инструкции для выполнения одним или более процессорами для реализации способа по п. 1.

Согласно еще одному аспекту настоящего изобретения, предложено устройство для идентификации частей цифровой записи субъекта, содержащей конкретные акустические события, представляющие интерес, содержащее:

датчик для преобразования звуков субъекта в соответствующий аналоговый электрический сигнал;

блок аналогово-цифрового преобразователя для генерирования цифровой аудиозаписи из аналогового электрического сигнала;

фильтр событий, представляющих интерес, для фильтрации цифровой аудиозаписи фильтром с частотными параметрами конкретных акустических событий, представляющих интерес, с получением цифровой аудиозаписи, отфильтрованной в соответствии с событиями, представляющими интерес;

блок огибающей сигнала для обработки указанной отфильтрованной цифровой аудиозаписи с получением соответствующей огибающей сигнала;

блок генератора гистограммы, реагирующий на сигналы блока огибающей сигнала, для сортировки цифровых отсчетов, образующих огибающую сигнала, по их величинам в множество интервалов и идентификации модального интервала из множества интервалов;

генератор статистического распределения вероятности, реагирующий на сигнал генератора гистограммы и способный вычислять статистическое распределение вероятности на основе идентификации модального интервала и определять пороговое значение для огибающей сигнала по статистическому распределению вероятности и заранее заданному уровню вероятности; и

блок идентификации события, реагирующий на сигнал генератора статистической вероятности и способный идентифицировать сегменты огибающей сигнала выше порогового значения и физически идентифицировать соответствующие сегменты цифровой записи как содержащие событие, представляющее интерес.

Согласно еще одному аспекту настоящего изобретения, предложен способ обработки цифровой аудиозаписи субъекта для идентификации одного или более событий, представляющих интерес, включающий:

предварительную обработку цифровой аудиозаписи, включая применение к ней субдискретизации и фильтрования для получения соответствующей огибающей сигнала, содержащей множество цифровых отсчетов;

сортировку множества цифровых отсчетов по их величинам в множество интервалов;

определение модального интервала из множества интервалов, при этом модальный интервал - это интервал, в который отсортировано самое большое количество цифровых отсчетов, имеющих величину в пределах диапазона этого интервала;

вычисление статистического распределения вероятности на основе идентифицированного модального интервала;

определение порогового интервала, который представляет собой интервал, соответствующий заранее заданному уровню вероятности для распределения вероятности;

установку порогового значения равным значению из диапазона порогового интервала; и

определение сегментов огибающей сигнала, лежащих выше порогового значения, таким образом физически идентифицируя соответствующие сегменты цифровой аудиозаписи, содержащие одно или более событий, представляющих интерес.

В еще одном варианте осуществления настоящего изобретения огибающая сигнала содержит сигнал оценки мощности для цифровой аудиозаписи.

В еще одном варианте осуществления настоящего изобретения огибающая сигнала содержит сигнал оценки амплитуды для цифровой аудиозаписи.

В еще одном варианте осуществления настоящего изобретения субдискретизация и фильтрование цифровой аудиозаписи включают применение фильтра нижних частот к цифровой аудиозаписи в прямом и обратном направлениях.

В еще одном варианте осуществления настоящего изобретения субдискретизация и фильтрование цифровой аудиозаписи включают применение фильтра верхних частот, при этом события, представляющие интерес, включают звуки дыхания субъекта.

В еще одном варианте осуществления настоящего изобретения субдискретизация и фильтрование цифровой аудиозаписи включают применение фильтра нижних частот, при этом события, представляющие интерес, включают звуки храпа субъекта.

В еще одном варианте осуществления настоящего изобретения вычисление статистического распределения вероятности на основе идентификации модального интервала включает вычисление распределения Пуассона с использованием номера модального интервала в качестве параметра лямбда в распределении Пуассона.

Согласно еще одному аспекту настоящего изобретения, предложено устройство для идентификации частей цифровой записи субъекта, содержащей конкретное звуковое событие, содержащее:

процессор для обработки цифровой записи в соответствии с инструкциями, хранящимися в цифровой памяти, доступной для процессора, при этом указанные инструкции содержат инструкции для того, чтобы процессор реализовал способ обнаружения сегментов цифровой записи, содержащей конкретные события, представляющие интерес.

Очевидно, что особенности или признаки любого аспекта или варианта осуществления настоящего изобретения могут быть включены в любой другой аспект, если это не противоречит логике.

Краткое описание чертежей

Предпочтительные особенности, варианты осуществления и вариации настоящего изобретения станут очевидны из последующего подробного описания, которое дает специалистам в данной области техники достаточно информации для реализации изобретения. Подробное описание не следует расценивать как ограничение объема предыдущего раздела «Сущность изобретения». В подробном описании имеются ссылки на сопровождающие чертежи, где:

На фиг. 1 показана последовательность операций для способа согласно предпочтительному варианту осуществления настоящего изобретения.

На фиг. 2 показано изображение кадра цифрового аудиосигнала, записанного во время реализации способа.

На фиг. 3 показаны первые двадцать две секунды сигнала, показанного на фиг. 2.

На фиг. 4 показана диаграмма субдискретизированного, сжатого и отфильтрованного сигнала, полученного во время реализации способа, включая оценку амплитуды, соответствующей сигналу на фиг. 3.

На фиг. 4А показана записи сигнала, показанного на фиг. 4, включающая оценку мощности, соответствующую сигналу на фиг. 3.

На фиг. 5 показана гистограмма сигнала на фиг. 4, которая генерируется во время реализации способа, и кривая распределения Пуассона на основе гистограммы и кумулятивной функции распределения (CDF) для распределения Пуассона, также показанной на чертеже.

На фиг. 6 показана диаграмма, соответствующая фиг. 4А, и показан уровень порога для события.

На фиг. 7 показан сигнал на фиг. 3 и демонстрируются сегменты, идентифицированные как содержащие события, представляющие интерес и соответствующие значениям времени сегментов, указанным на фиг. 6.

На фиг. 8 показана блок-схема устройства для идентификации события, представляющего интерес, в аудиосигнале субъекта согласно одному из вариантов осуществления настоящего изобретения.

На фиг. 9 показана блок-схема машины для идентификации события согласно одному из вариантов осуществления настоящего изобретения.

На фиг. 10 показан внешний вид машины, изображенной на фиг. 9, в процессе использования.

На фиг. 11 показан внешний вид машины, изображенной на фиг. 9, на последующей стадии использования.

Подробное описание предпочтительных вариантов осуществления

Способ автоматического обнаружения события согласно предпочтительному варианту осуществления настоящего изобретения описан со ссылкой на последовательность операций, показанных на фиг. 1.

В кратком изложении способ включает обработку цифровой аудиозаписи для идентификации сегментов записи, содержащих конкретные аудиособытия. Цифровую аудиозапись обрабатывают с использованием многих процессов, включая фильтрование цифровой аудиозаписи на шаге 11 и обработку фильтрованной цифровой аудиозаписи с получением соответствующей огибающей сигнала, как обозначено штриховой линией 14. Затем огибающую сигнала аппроксимируют статистическим распределением, которое, как правило, представляет собой распределением Пуассона, но которое может быть другим статистическим распределением, таким как гамма-распределение, как показано штриховой линией 16. Затем определяют пороговое значение в отношении огибающей сигнала, как обозначено штриховой линией 18. Пороговое значение определяют на основе статистического распределения и заранее заданного уровня вероятности. Сегменты огибающей сигнала, которые превышают пороговое значение, идентифицируют, например, как начало и конец каждого такого сегмента, чтобы, таким образом, идентифицировать соответствующие сегменты цифровой аудиозаписи, которые содержат конкретные аудиособытия, представляющие интерес. Например, аудиособытиями, представляющими интерес, могут быть звуки храпа, хрипов или дыхания.

Первоначально, до начала выполнения способа, рассмотренного в кратком обзоре, датчик в виде микрофона 4 преобразует аналоговый акустический сигнал 2 от субъекта 1 в соответствующий аналоговый электрический сигнал 3. Аналоговый электрический сигнал 3 затем обрабатывают на шаге 5 фильтром защиты от наложения спектров (AAF, anti-aliasing filter), а на шаге 6 - аналогово-цифровым преобразователем (АЦП) с формированием соответствующего цифрового аудиосигнала. На шаге 9 цифровой аудиосигнал из аналогово-цифрового преобразователя 6 запоминают в электронном запоминающем устройстве, таком как цифровая память, в виде цифровой аудиозаписи. Цифровую аудиозапись впоследствии восстанавливают в виде цифрового аудиосигнала 8 и обрабатывают на последующих шагах способа на фиг. 1 в соответствии с предпочтительным вариантом осуществления способа согласно настоящему изобретению. В данном варианте осуществления настоящего изобретения цифровой аудиосигнал 8 состоит из множества последовательных неперекрывающихся пятиминутных кадров. На фиг. 2 показан единственный кадр 36 цифрового аудиосигнала 8, который при частоте отсчетов 44,1 кГц состоит из 44100×5×60=13230 отсчетов.

На фиг. 3 более подробно показаны первые двадцать секунд (обозначенные на фиг. 2 позицией 44) цифрового аудиосигнала 8 в кадре 36.

На шаге 10 цифровой аудиосигнал 8 извлекают из цифровой памяти и подвергают первой субдискретизации от первоначальной частоты дискретизации 44,1 кГц до 14,7 кГц, чтобы количество отсчетов в секунду сократилось в три раза. Субдискретизация такого типа дает первый субдискретизированный цифровой аудиосигнал 40, который содержит меньше отсчетов, для последующей обработки. Так как цифровой аудиосигнал будет обработан с целью обнаружения порогового уровня шума, быстрые переходные процессы несущественны, и, таким образом, субдискретизация не сопровождается потерей точности. На шаге 11 первый субдискретизированный цифровой аудиосигнал 40 фильтруют с использованием полосового фильтра или фильтра верхних или нижних частот с частотой, выбранной для аудиособытия, представляющего интерес, которое должно надежно идентифицироваться в цифровом аудиосигнале 8. Например, на шаге 11 к первому субдискретизированного цифровому аудиосигналу 40 можно применить фильтр верхних частот с частотой отсечки 1000 Гц, если специфическое аудиособытие, представляющее интерес - звук дыхания. Альтернативно, если специфическое аудиособытие, представляющее интерес, включает звуки храпа, то можно использовать фильтр нижних частот с частотой отсечки 1000 Гц.

На шагах 13-19 производят процедуру 14 обнаружения огибающей, включая предварительную обработку сигнала 42 до осуществления последующих шагов с целью идентификации события, представляющего интерес, как будет пояснено ниже.

На шаге 13 к субдискретизированному и отфильтрованному согласно событию аудиосигналу 42 применяют обработку для получения абсолютной величины, которая переворачивает все отрицательные отсчеты в положительную плоскость с получением соответствующего аудиосигнала 44 абсолютной величины. Например, если на шаге 7 аналогово-цифровое преобразование происходит с разрешением 16 битов, тогда каждый отсчет будет иметь целое значение в диапазоне от -32768 до +32767. Обработка на шаге 13 инвертирует знак отрицательных отсчетов по амплитуде так, чтобы все отсчеты принимали целые значения в диапазоне от 0 до +32767.

Аудиосигнал 44 абсолютной величины затем проходит через прямой и обратный фильтр нижних частот 7 Гц на шаге 15. Чтобы на шаге 15 работала обратная часть процедуры, необходимо, чтобы аудиосигнал 44 абсолютной величины хранился в цифровой памяти. Прямой-обратный фильтр производит фильтрацию нижних частот без воздействия на фазу содержимого, представляющего интерес.

На шаге 17 к сигналу 44 абсолютной величины применяют вторую операцию субдискретизации. Вторая операция субдискретизации повторно производит субдискретизацию от 14,7 кГц до 100 Гц.

На фиг. 4 показан отфильтрованный после прямого-обратного фильтра сигнал, генерируемый на шаге 15, который включает первый сигнал огибающей или просто «огибающую сигнала», которая соответствует исходному записанному сигналу 8 и которая представляет собой оценку амплитуды записанного сигнала 8.

Затем на шаге 19 к сигналу 46 оценки амплитуды применяют логарифмическое сжатие, чтобы снизить большие вариации входного сигнала. До применения логарифмического сжатия отсчеты, имеющие отношение мощности, меньше 10-5, подгоняют до величины 10-5, чтобы ограничить диапазон величин после применения логарифмического сжатия. Получение абсолютной величины на шаге 13, фильтрация нижних частот на шаге 15, субдискретизация на шаге 17 и логарифмическое сжатие на шаге 19 приводит к формированию второй огибающей 47 сигнала, соответствующей исходной цифровой записи 8. Вторая огибающая 47 сигнала является сигналом оценки мощности, представляющим собой оценку мощности исходного цифрового аудиосигнала 8.

На шаге 21 вычисляют гистограмму 48 (фиг. 5) величин отсчетов в кадре, например, в течение пяти минут, для второй огибающей 47 сигнала. Гистограмму 48 генерируют, сортируя 2000 отсчетов, которые содержат вторую огибающую 47 сигнала (сигнал оценки мощности) по величинам, помещая каждую в один из 300 интервалов (столбцов гистограммы) согласно величине.

Очевидно, что в других вариантах осуществления настоящего изобретения можно использовать другое отношение субдискретизации, чтобы пятиминутные кадры содержали меньше или больше, чем 2000 отсчетов. Кроме того, хотя предпочтителен пятиминутный кадр, кадр может быть длиннее или короче, и его длина может быть отрегулирована на основе отношения субдискретизации и количества интервалов, которые будут использоваться. Кроме того, очевидно, что можно использовать больше или меньше 300 интервалов, хотя 300 - предпочтительное количество интервалов, которое, как было обнаружено, хорошо работает для описанного отношения субдискретизации и длины кадра.

Хотя предпочтительно, чтобы процедура вычисления гистограммы на шаге 21 выполнялась на второй огибающей 47 сигнала, которая представляет сигнал оценки мощности, она может быть альтернативно выполнена на первой огибающей сигнала, то есть сигнале 46 оценки амплитуды. Причина выполнения процедуры логарифмического сжатия на шаге 19 состоит в том, чтобы избежать быстрых амплитудных изменений амплитуды огибающей сигнала, которые сделали бы менее достоверными последующую гистограмму и шаги аппроксимации статистическим распределением, которые будут раскрыты ниже.

Для второй огибающей сигнала, которая включает сигнал 47 оценки мощности, изображенный на фиг. 4А, каждый отсчет находится в пределах диапазона от -5,0 до -2,9 (минимальная и максимальная мощности в кадре). Отсчеты, составляющие сигнал 47 оценки мощности, могут быть отсортированы в 300 интервалов (последовательно пронумерованные от «0» до «299») с размером шага (Мах-Min)/(Число интервалов), то есть (-2,9 - -5,0)/300≈0,007. Интервал с номером n содержит отсчеты в диапазоне от n × размер шага + min до (n+1) × размер шага+min. Например, интервал номер 150 содержит отсчеты в диапазоне оцениваемой мощности от 150×0,007+-5.0 до (150+1)×0,007+-5.0, то есть, от -3,95 до -3,94.

На шаге 23 выбирают модальный интервал гистограммы 48. Модальный интервал - это интервал, в который отсортировано самое большое количество отсчетов в кадре. В примере, показанном на фиг.5, почти 400 отсчетов из 30000 отсчетов, включающих вторую огибающую 47 сигнала в пятиминутных кадрах, были отсортированы в интервал номер 135, так что он содержит больше отсчетов, чем любой другой интервал, и, таким образом, интервал номер 135 является модальным интервалом. Модальный интервал 135 содержит отсчеты для второй огибающей сигнала с величинами, представляющими оценки мощности для исходного записанного сигнала 8 в диапазоне от (135×0,007+-5.0) до ((135+1)×0,007+-5.0), то есть, от -4,053 до -4,046.

На шаге 25 параметр лямбда в распределении Пуассона устанавливают равным номеру модального интервала, чтобы подогнать распределение к гистограмме. Таким образом, лямбда=135, так как интервал 135 содержит большинство отсчетов. На шаге 27 вычисляют распределение Пуассона с лямбда=135. Распределение Пуассона, графически показанное линией 50 на фиг.5, аппроксимирует гистограмму 48. На шаге 29 вычисляют кумулятивную функцию распределения (CDF) для распределения Пуассона. CDF показана на диаграмме фиг. 5 как кривая 52.

На шаге 31 выбирают пороговый интервал гистограммы 48, который представляет собой интервал, который соответствует уровню очень высокой вероятности для CDF 52. Уровень вероятности установлен очень высоким, потому что желательно идентифицировать аудиосегменты, которые содержат события, представляющие интерес, с высоким уровнем доверительности. В случае, показанном на фиг. 5, уровень вероятности установлен равным 0,999999 от полной вероятности под кривой CDF, равной 1. Было обнаружено, что уровень вероятности 0,999999 соответствует номеру интервала 195, как показано штриховой вертикальной линией 51. Номер интервала 195, который, таким образом, является пороговым интервалом, содержит отсчеты с величинами, представляющими оценки энергии в диапазоне от 195×0,007+-5.0 до (195+1)×0,007+-5.0, то есть от -3,632 до -3,625. На шаге 33 верхний предел величины отсчетов в интервале 195, то есть -3,625, устанавливают как пороговое значение для второй огибающей сигнала, то есть сигнала 47 оценки мощности.

На шаге 35 определяют сегменты второй огибающей 47 сигнала, содержащие отсчеты с величинами, которые все превышают пороговое значение, сравнивая каждый отсчет, составляющий вторую огибающую 47 сигнала, с этим пороговым значением.

На фиг. 6 показано пороговое значение 56, наложенное на вторую огибающую сигнала 47 (то есть, сигнал оценки мощности).

Видно, что вторая огибающая сигнала превышает порог на следующих сегментах: [t1,t2]; [t3,t4]; [t5,t6]; [t7,t8]; [t9,t10] и [t11,t12].

На шаге 37 применен простой временной фильтр, чтобы выбрать сегменты со значениями выше порога, которые потенциально соответствуют звукам дыхания во сне, то есть событиям, представляющим интерес, на том основании, что эти события должны иметь продолжительность свыше 225 миллисекунд и меньше 4 с. Соответственно, временной интервал 101 отбрасывают, оставляя только временные интервалы, идентифицированные как содержащие конкретные события дыхания во сне, то есть временные интервалы 100, 102, 103, 104 и 105.

Эти сегменты с очень высокой вероятностью соответствуют сегментам в исходном сигнале 8, содержащим отсчеты для конкретного события, которое было отфильтровано на шаге 11 как событие, представляющее интерес.

На шаге 39 сегменты со значениями выше порогового значения физически маркируют относительно исходного цифрового аудиосигнала 8 как временные интервалы 100, 101, 102, 103, 104 и 105. «Физическая» маркировка означает, что время начала и конца или эквивалентную информацию для каждого из сегментов со значениями выше порога записывают в энергонезависимую память в ассоциации с цифровой аудиозаписью, чтобы сегменты со значениями выше порога можно было бы легко идентифицировать и обрабатывать затем по мере необходимости.

Цифровой аудиосигнал 8, вместе с метками, идентифицирующими те сегменты в сигнале, которые содержат события, представляющие интерес, можно обработать дополнительно. Например, если событие, представляющее интерес, это звуки храпа, тогда сегменты, маркированные как содержащие храп, можно обработать с использованием известных технических решений, чтобы определить, указывают ли звуки храпа на апноэ сна. Аналогично, если событие, представляющее интерес, представляет собой хрип, цифровой аудиосигнал и метки, идентифицирующие сегменты, содержащие звуки хрипа, можно обработать, чтобы определить, указывает ли этот хрип, например, на астму.

На фиг. 8 показана блок-схема устройства 600 для идентификации части цифровой записи субъекта, содержащей специфическое аудиособытие, согласно способу, описанному выше. Устройство 600 содержит:

датчик в виде микрофона 601 для преобразования звуков 3 субъекта 1 в соответствующий аналоговый электрический сигнал 8 (фиг. 2).

Микрофон 601 связан с блоком 604 аналогово-цифрового преобразователя, предназначенным для генерирования цифровой аудиозаписи из аналогового электрического сигнала. Блок 604 аналогово-цифрового преобразователя состоит из фильтра 602 защиты от наложения спектров и аналогово-цифрового преобразователя 603, который производит соответствующий цифровой сигнал из звуков 3 субъекта 1. В данном варианте осуществления настоящего изобретения блок 604 аналогово-цифрового преобразователя производит сигнал с частотой дискретизации 44,1 кГц с 16-разрядным разрешением. Очевидно, что другие частоты дискретизации и разрядные разрешения также могут использоваться в других вариантах осуществления настоящего изобретения.

Выходной порт блока 604 аналогово-цифрового преобразователя выдает цифровой сигнал в пятиминутных кадрах в цифровую память 605. Выходной порт связан также с субдискретизатором 607, который предназначен для субдискретизации от 44,1 кГц до 14,7 кГц.

Сигнал из первого субдискретизатора 607 или через фильтр 611 звука храпа, или через фильтр 613 звука дыхания поступает в фильтр 615 абсолютной величины в зависимости от положения связанных переключателей 609а и 609b. Фильтр 611 звука храпа и фильтр 613 звука дыхания представляют собой соответственно фильтр нижних частот с отсечкой 1000 Гц для выбора звуков храпа и фильтр верхних частот с отсечкой 1000 Гц для выбора звуков дыхания. Оба фильтра представляют собой фильтры Баттерворта верхних/нижних частот 2-го порядка с бесконечной импульсной характеристикой (IIR) и отсечкой 1000 Гц.

Выход переключателя 609b соединен с фильтром 615 абсолютной величины, который предназначен для того, чтобы изменить знак всех отрицательных отсчетов в фильтрованном цифровом аудиосигнале. Фильтр 615 абсолютной величины в свою очередь соединен с цифровой памятью 617, которая хранит кадры фильтрованного цифрового сигнала, полученные из фильтра 615 абсолютной величины.

Прямой-обратный фильтр 619 нижних частот (ФНЧ) соединен с цифровой памятью 617 для фильтрации хранящегося сигнала как в прямом, так и в обратном направлениях с помощью фильтра Баттерворта нижних частот 2-го порядка с бесконечной импульсной характеристикой и отсечкой 7 Гц. Сигнал фильтруется дважды, в прямом и обратном направлении, для сохранения фазы.

Второй субдискретизатор 621 соединен с выходом прямого-обратного фильтра 619 нижних частот для выполнения субдискретизации сигнала до частоты 100 Гц с получением сигнала оценки амплитуды, такого как сигнал 46 на фиг. 4.

Блок 620 логарифмического усилителя соединен с выходом второго субдискретизатора 621. Блок логарифмического усилителя генерирует сигнал оценки мощности, например, сигнал 47 на фиг. 4А. Цифровая память 622 соединена с блоком 620 логарифмического усилителя и хранит кадры сигнала оценки мощности.

Блок 623 генератора гистограммы соединен с выходом второго блока субдискретизации. Блок 623 генератора гистограммы предназначен для сортировки цифровых отсчетов, включающих сигнал оценки мощности, по их значениям во множество интервалов (столбцов гистограммы) и генерирования сигнала, указывающего модальный интервал из множества интервалов и величину лямбда в распределения Пуассона для заданного порога высокой вероятности в распределении.

Генератор 625 статистического распределения вероятности реагирует на сигнал генератора 623 гистограммы и вычисляет статистическое распределение вероятности на основе идентифицированного модального интервала. Блок 623 генератора гистограммы и генератор 625 распределения может быть машиной с одной или более программируемыми вентильными матрицами (FPGA) или микроконтроллерами, например, сконфигурированными для вычисления распределения, такого как распределение Пуассона, с использованием сигнала, указывающего модальный интервал в качестве параметра лямбда для распределения Пуассона.

Блок 627 идентификации события реагирует на сигнал генератора 625 статистической вероятности и физически идентифицирует те сегменты цифровой записи в цифровой памяти 605, содержащие специфическое событие, которые содержат отсчеты выше величины фона для заранее заданного уровня вероятности.

Блок 627 идентификации события может или вставлять коды метаданных в файл 629 хранения первоначального аудиосигнала, или, альтернативно, может записать файл, содержащий последовательность временных интервалов, которые эффективно маркируют сегменты аудиосигнала, содержащие событие, представляющее интерес.

В качестве альтернативы распределению Пуассона изобретатели проверили другие логарифмические-нормальные распределение, в результате чего пришли к выводу, что нормальное распределение также будет работать. Однако распределение Пуассона предпочтительно, так как у него имеется техническое преимущество, заключающееся в простоте аппроксимации, поскольку в нем имеется лишь один параметр (то есть параметр лямбда), оценить который можно непосредственно из гистограммы.

Требованием для выбранного распределения является то, что оно может аппроксимировать гистограмму отсчетов, а шумовые отсчеты подчиняются этому распределению.

Например, если выбрано семейство гамма-распределений, то можно использовать функцию аппросимации, например такую, как из библиотеки scipy программ Python по ссылке https://docs.scipvy.org/doc/scipy/reference/generated/scipy.stats.gamma.html, чтобы оценить параметры гамма-распределения.

При использовании устройство 600, которое может быть выполнено в достаточно малом корпусе, чтобы его можно было держать рукой, удерживается оператором в нескольких сантиметрах от лица субъекта. Если требуется длительная запись, устройство 600 может быть установлено на треноге для продолжительной записи. Оператор конфигурирует связанные переключатели 609а, 609b, чтобы выбрать или фильтр 611 звука храпа, или фильтр 613 звука дыхания, в зависимости от типа события, представляющего интерес, которое будет идентифицировано в записанном аудиосигнале. В процессе записи, оцифрованная звукозапись сохраняется в цифровой памяти 605, которая, как правило, включает носитель записи, такой как SD-карта. В то же время сигнал различным образом субдискретизируется и фильтруется различными блоками 607 621 устройства 600, как описано выше, с получением сигнала оценки мощности на выходе второго субдискретизатора 621. Затем генератор 623 гистограммы сортирует отсчеты, помещая сигнал оценки мощности согласно его значению в множество интервалов, чтобы определить модальный интервал. Генератор 625 распределения вероятности использует номер модального интервала как параметр лямбда для распределения Пуассона, чтобы вычислить соответствующее распределение Пуассона, и по кумулятивной функции распределения для этого распределения идентифицировать интервал, соответствующий очень высокой вероятности содержания отсчетов выше уровня шума. Блок 627 идентификации события реагирует на сигнал генератора 625 статистической вероятности для надежной идентификации тех сегментов цифровой записи, хранящихся в цифровой памяти 605 и содержащих специфическое событие, которые содержат отсчеты со значением выше фона для заранее заданного уровня вероятности.

Очевидно, что в варианте осуществления настоящего изобретения предложен способ идентификации сегментов записи сигнала, содержащих такие звуки субъекта, которые содержат конкретные аудиособытия, представляющие интерес. Способ включает фильтрование записи на основе характеристического частотного диапазона аудиособытий. Например, нижний частотный диапазон используется, если в аудиособытии, представляющем интерес, преобладают низкочастотные звуки, такие как храп, в отличие от высокочастотного диапазона для других звуков, таких как звуки дыхания. Кроме того, способ включает обработку фильтрованной записи с получением соответствующего сигнала оценки мощности, который представляет собой оценку мощности записанного исходного аудиосигнала. Затем способ включает аппроксимацию сигнала оценки мощности статистическим распределением, например, распределением Пуассона, и определение порогового значения уровня шума для этого распределения с использованием высокого уровня вероятности, чтобы пороговое значение шума действительно было выше уровня шума сигнала относительно события, представляющего интерес. Затем сегменты записи звуков субъекта идентифицируют как сегменты, которые лежат выше порогового значения уровня шума.

Способ быстро опознает в записи звуков субъекта сегменты, которые с большой вероятностью содержат событие, представляющее интерес, так что время и вычислительную мощность можно потратить на дополнительный анализ этих сегментов, не тратя напрасно время на обработку тех сегментов, которые не содержат аудиособытие, представляющее интерес.

На фиг. 9 показана блок-схема машины 751 для идентификации аудиособытия согласно другому варианту осуществления настоящего изобретения, предназначенной для идентификации и маркировки сегментов аудиозаписи, которые содержат события, представляющие интерес, такие, например, как звуки храпа или хрипы. В описываемом варианте осуществления настоящего изобретения устройство реализовано с использованием одного или более процессоров, микрофона и памяти смартфона. Машина 751 для идентификации аудиособытия содержит по меньшей мере один процессор 753, связанный с электронной памятью 755. Электронная память 755 содержит операционную систему (ОС) 758, такую как операционная система Android или Apple iOS для процессора 753. Согласно предпочтительному варианту осуществления настоящего изобретения, электронная память 755 также содержит программный продукт для идентификации аудиособытия, или приложение 756. Приложение 756 для идентификации кашля содержит инструкции, которые выполняются процессором 753 машины 751 для идентификации аудиособытия, чтобы обработать звуки 702 от субъекта 1 в соответствии со способом на фиг. 1. Во время работы процессор 753 под командой приложения 756 обрабатывает звуки 702 и представляет список сегментов, содержащих аудиособытия, представляющие интерес, оператору 754 посредством интерфейса 761 с жидкокристаллическим (ЖК) сенсорным экраном. Идентифицированные звуковые события можно затем при желании обработать. Приложение 756 может быть реализовано как считываемые компьютером инструкции на физическом носителе, таком как оптический или магнитный диск 750, который может быть считан дисководом, соединенным с USB-портом 765. Альтернативно, приложение может также быть загружено с удаленного файлового сервера через интерфейс 773 WAN/WLAN.

Процессор 753 осуществляет связь с множеством периферийных блоков 759 773, как обозначено на фиг. 9, через шину 757 данных, которая состоит из металлических проводников, вдоль которых передаются цифровые сигналы 200 между процессором и различным периферийным оборудованием. Следовательно, при необходимости машина 751 для идентификации акустических событий может установить соединение для передачи голоса и данных с голосовой сетью 781 и/или сетью передачи данных через блок 773 WAN/WLAN и радиочастотную антенну 779.

Машина 751 содержит также другое периферийное оборудование, такое как блок 759 камеры на приборах с зарядовой связью (ПЗС), который действует как цифровой фотоаппарат, чтобы изображение субъекта 752 можно было при желании захватить вместе с местоположением, в котором это изображение взято, с использованием данных из модуля 767 GPS. Кроме того, машина 751 содержит блок 769 порта адаптера питания и управления аккумулятором для приведения машины в действие. Интерфейс 761 на основе жидкокристаллического сенсорного экрана действует как интерфейс человек-машина и позволяет оператору 754 считывать результаты, команды ввода и данные в машину 751. USB-порт 765 предназначен для обеспечения последовательного соединения с возможностью передачи данных во внешнее запоминающее устройство, такое как флэш-память, или для организации кабельного соединения с сетью передачи данных или внешним экраном и клавиатурой и т.д. Кроме того, имеется вторичная карта 764 памяти для дополнительного вторичного хранения данных при необходимости, в дополнение к внутреннему пространству для хранения данных, обеспеченному памятью 755.

Аудио-интерфейс 771 соединяет микрофон 775 с шиной 757 данных и содержит электрическую схему сглаживающего фильтра и аналогово-цифровой дискретизатор для преобразования аналогового электрического сигнала 4 из микрофона 775 (который соответствует звуковому сигналу 3 от субъекта) в цифровой аудиосигнал 8, который хранится как запись в цифровом аудиофайле 702 в памяти 755 для обработки процессором 753 под управлением приложения 756. Например, процессор может быть процессором Snapdragon 865, производимым компанией Qualcomm Corporation, хотя подходят и другие процессоры с малым потреблением энергии. Аудио-интерфейс 771 соединен также с динамиком 777. Аудио-интерфейс 771 содержит цифро-аналоговый преобразователь для преобразования цифрового аудиосигнала в аналоговый сигнал и усилитель звуковой частоты, который связан с громкоговорителем 771, чтобы аудиосигнал 702, записанный в памяти 755 или вторичной памяти 764, можно было воспроизвести для прослушивания оператором 754.

Машину 751 программируют с помощью приложения 756 так, чтобы она идентифицировала сегменты, содержащие события, представляющие интерес, такие как хрипы или храп, в записи звука субъекта.

Как сказано выше, хотя машина 751 для идентификации акустических событий, показанная на фиг. 9, выполнена в виде смартфона, который уникально сконфигурирован приложением 756, в ней можно было бы использовать другой тип вычислительного устройства, такой как настольный компьютер, ноутбук или планшетное вычислительное устройство, или даже она может быть реализована в облачной вычислительной среде, при этом аппаратные средства содержат виртуальную машину, которая специально запрограммирована приложением 756.

Вариант выполнения процедуры, которую использует машина 751 для идентификации звуков, чтобы идентифицировать сегменты, содержащие событие, представляющее интерес, в записи 702 субъекта 752, и которая содержит инструкции, составляющие приложение 756, показан в последовательности операций на фиг. 1, которая была описана выше.

В процессе работы оператор 754 или субъект 3 выбирает приложение 756 на экране выбора приложений, генерируемого операционной системой 758 на интерфейсе 761 в виде сенсорного жидкокристаллического экрана. В ответ на этот выбор процессор 753 отображает экран, например экран 782 на фиг. 10, чтобы подсказать оператору 754 действия по управлению машиной 751 для начала записи звука 3 от субъекта 752 через микрофон 775 и аудио-интерфейс 771. Аудио-интерфейс 771 преобразует звук в цифровые сигналы 200, которые передаются по шине 757 и записываются процессором 753 как один или более цифровых файлов 702 в память 755 и/или вторичную SD-карту 764 памяти. В этом предпочтительном варианте осуществления настоящего изобретения запись должна продолжаться в течение времени, которое достаточно, чтобы охватить несколько аудиособытий, представляющих интерес.

После окончания записи процессор 753 под управлением инструкций, составляющих приложение 756 и реализующих способ на фиг. 1, обрабатывает запись 702 и идентифицирует в записи сегменты, содержащие события, представляющие интерес. Идентифицированные сегменты можно затем отобразить на экране 778, на котором в настоящем примере идентифицировано 270 сегментов, которые содержат аудиособытие, представляющее интерес, наряду с началом и концом каждого сегмента. Процессор 753 под управлением приложения 756 записывает также номера идентифицированных сегментов и их начало и конец в энергонезависимую память в виде файла 753, который может также содержать запись звуковой волны, чтобы физически маркировать событие, представляющее интерес, относительно записи звуковой волны.

Способ, который осуществляется процессором 753 в комбинации с инструкциями, содержащими приложение 756 для маркировки событий, идентифицирует сегменты в записи 702 звуков субъекта, которые с большой вероятностью будут содержать события, представляющие интерес. Следовательно, время и вычислительную мощность можно при желании потратить на дальнейший анализ этих сегментов, не тратя напрасно время на обработку сегментов, которые не содержат звуковые события, представляющие интерес.

В соответствии с требованиями, изобретение было описано на языке, более или менее конкретном для структурных или методических признаков. Термин «содержит» и его вариации, такие как «содержащий» и «состоящий из» использован повсюду в охватывающем смысле, и не исключает любые дополнительные функции.

Очевидно, что изобретение не ограничено конкретными особенностями, показанными или описанными, так как описанные здесь средства включают предпочтительные формы осуществления изобретения. Поэтому изобретение может быть заявлено в любой из его форм или модификаций в пределах объема пунктов формулы изобретения при должной интерпретации специалистами в данной области техники.

Всюду в описании и формуле изобретения, термин «по существу» или «приблизительно» (если такие термины присутствуют) следует понимать как не ограниченные диапазоном, обозначенным этими терминами, если из контекста не следует обратное.

Любой вариант осуществления настоящего изобретения предназначен только для иллюстрации и не призван ограничить изобретение. Поэтому очевидно, что к любому варианту осуществления настоящего изобретения, описанному выше, могут быть сделаны различные другие изменения и модификации без отхода от объема изобретения.

Похожие патенты RU2829970C1

название год авторы номер документа
АУДИОУПРАВЛЯЕМЫЙ ЗАХВАТ ИЗОБРАЖЕНИЙ 2009
  • Ояла Паси
  • Билку Раду
RU2531023C2
УСТРОЙСТВО И СПОСОБ РАСЧЕТА ПАРАМЕТРОВ РАСШИРЕНИЯ ПОЛОСЫ ПРОПУСКАНИЯ ПОСРЕДСТВОМ УПРАВЛЕНИЯ ФРЕЙМАМИ НАКЛОНА СПЕКТРА 2009
  • Нуендорф Макс
  • Краемер Ульрих
  • Нагел Фредерик
  • Диш Саша
  • Вабник Стефан
RU2443028C2
Способ для оценки чувства ритма человека 2018
  • Касаткин Владимир Николаевич
  • Румянцев Александр Григорьевич
  • Анисимов Виктор Николаевич
RU2685774C1
ДЕТЕКТИРОВАНИЕ ИЗЛУЧЕНИЯ С ПОМОЩЬЮ НЕПАРАМЕТРИЧЕСКОГО РАЗЛОЖЕНИЯ НАЛОЖЕННЫХ ИМПУЛЬСОВ 2020
  • Маклин, Кристофер
  • Поли, Майкл
  • Мэнтон, Джонатан
RU2802542C2
СПОСОБ МНОГОМОДАЛЬНОГО БЕСКОНТАКТНОГО УПРАВЛЕНИЯ МОБИЛЬНЫМ ИНФОРМАЦИОННЫМ РОБОТОМ 2020
  • Рюмин Дмитрий
  • Кипяткова Ирина Сергеевна
  • Кагиров Ильдар Амирович
  • Аксёнов Александр
  • Карпов Алексей Анатольевич
RU2737231C1
МНОГОПАРАМЕТРИЧЕСКАЯ КЛАССИФИКАЦИЯ СЕРДЕЧНО-СОСУДИСТЫХ ТОНОВ 2007
  • Шмидт Самуэль Эмиль
  • Струийк Йоханнес
  • Графф Клаус
RU2449730C2
СПОСОБ МНОГОСТРУКТУРНЫХ, МНОГОУРОВНЕВЫХ ФОРМАЛИЗАЦИИ И СТРУКТУРИРОВАНИЯ ИНФОРМАЦИИ И СООТВЕТСТВУЮЩЕЕ УСТРОЙСТВО 2012
  • Жирков Александр
  • Ораевский Алексей
  • Гришин Андрей
  • Блондхейм Джордж
  • Вандингер Макс
  • Аттвуд Вэйд
RU2612603C2
УСТРОЙСТВО И СПОСОБ ДЛЯ ОПРЕДЕЛЕНИЯ ПРЕДВАРИТЕЛЬНО ОПРЕДЕЛЕННОЙ ХАРАКТЕРИСТИКИ, ОТНОСЯЩЕЙСЯ К ОБРАБОТКЕ СПЕКТРАЛЬНОГО УЛУЧШЕНИЯ АУДИОСИГНАЛА 2018
  • Гампп, Патрик
  • Уле, Кристиан
  • Диш, Саша
  • Карампоурниотис, Антониос
  • Хафенштайн, Юлия
  • Хелльмут, Оливер
  • Херре, Юрген
  • Прокайн, Петер
RU2733278C1
УСТРОЙСТВО И СПОСОБ ДЛЯ ФОРМИРОВАНИЯ ОТФИЛЬТРОВАННОГО ЗВУКОВОГО СИГНАЛА, РЕАЛИЗУЮЩЕГО РЕНДЕРИЗАЦИЮ УГЛА МЕСТА 2016
  • Карапетян Александр
  • Плогстис Ян
  • Фляйшманн Феликс
RU2717895C2
СПОСОБ И СИСТЕМА ОБМЕНА ИНФОРМАЦИЕЙ МЕЖДУ УСТРОЙСТВАМИ 2022
  • Марков Денис Александрович
  • Цаплин Андрей Борисович
  • Карлов Майкл
RU2783261C1

Иллюстрации к изобретению RU 2 829 970 C1

Реферат патента 2024 года Обнаружение событий в дыхательных звуках субъекта

Группа изобретений относится к медицине, а именно к способу идентификации сегментов цифровой аудиозаписи дыхательных звуков субъекта и устройству для его осуществления. При этом проводят фильтрование цифровой аудиозаписи на основе характеристического частотного диапазона акустических событий с получением фильтрованного цифрового аудиосигнала. Обрабатывают фильтрованный цифровой аудиосигнал с получением огибающей сигнала. Сортируют отсчеты, составляющие огибающую сигнала, по интервалам для формирования гистограммы. Аппроксимируют гистограммы статистическим распределением. Определяют пороговое значение для огибающей сигнала на основе статистического распределения и заранее заданного уровня вероятности. Идентифицируют сегменты огибающей сигнала, которые превышают пороговое значение для идентификации сегменты цифровой аудиозаписи как сегментов, содержащих конкретные акустические события. Определение порогового значения включает вычисление кумулятивной функции распределения в отношении статистического распределения. Определение порогового значения включает определение порогового интервала, который соответствует заранее заданной вероятности, уровень которой включает уровень вероятности для кумулятивной функции распределения. Достигается надежная идентификация в анализируемом сигнале событий, представляющих интерес, которые содержат отсчеты со значением выше фонового шума. 3 н. и 25 з.п. ф-лы, 11 ил.

Формула изобретения RU 2 829 970 C1

1. Способ идентификации сегментов цифровой аудиозаписи дыхательных звуков субъекта, где указанные сегменты содержат конкретные акустические события, представляющие интерес, включающий:

фильтрование цифровой аудиозаписи на основе характеристического частотного диапазона акустических событий с получением фильтрованного цифрового аудиосигнала;

обработку фильтрованного цифрового аудиосигнала с получением соответствующей огибающей сигнала;

сортировку отсчетов, составляющих огибающую сигнала, по интервалам для формирования гистограммы;

аппроксимацию гистограммы статистическим распределением;

определение порогового значения для огибающей сигнала на основе упомянутого статистического распределения и заранее заданного уровня вероятности; и

идентификацию сегментов огибающей сигнала, которые превышают пороговое значение, чтобы тем самым идентифицировать соответствующие сегменты цифровой аудиозаписи звуков субъекта как сегменты цифровой аудиозаписи, содержащие конкретные акустические события, представляющие интерес,

при этом определение порогового значения для огибающей сигнала на основе статистического распределения и заранее заданного уровня вероятности включает вычисление кумулятивной функции распределения (CDF) в отношении статистического распределения, и

определение порогового значения для огибающей сигнала включает определение порогового интервала, который соответствует заранее заданной вероятности, при этом уровень заранее заданной вероятности включает уровень вероятности для кумулятивной функции распределения.

2. Способ по п.1, включающий применение первой субдискретизации, при которой частоту дискретизации цифровой аудиозаписи уменьшают в целое число раз с получением первого субдискретизированного цифрового аудиосигнала.

3. Способ по п.2, в котором первый субдискретизированный цифровой аудиосигнал фильтруют в характеристическом частотном диапазоне для выбора акустических событий, представляющих интерес, с получением таким образом первого субдискретизированного и фильтрованного в соответствии с событием цифрового аудиосигнала.

4. Способ по п.3, в котором события, представляющие интерес, содержат звуки дыхания, при этом фильтрование цифровой аудиозаписи включает применение фильтра верхних частот.

5. Способ по п.3, в котором события, представляющие интерес, содержат звуки храпа, при этом фильтрование цифровой аудиозаписи включает применение фильтра нижних частот.

6. Способ по любому из пп.3-5, в котором обработку фильтрованного цифрового аудиосигнала для получения соответствующей огибающей сигнала производят с помощью процедуры обнаружения огибающей.

7. Способ по п.6, в котором процедура обнаружения огибающей включает применение фильтра абсолютной величины к первому субдискретизированному и фильтрованному в соответствии с событием сигналу с получением фильтрованного сигнала абсолютной величины.

8. Способ по п.7, в котором фильтрованный сигнал абсолютной величины фильтруют прямым и обратным фильтром с получением сигнала абсолютной величины, фильтрованного фильтром нижних частот.

9. Способ по п.8, в котором обработка фильтрованного цифрового аудиосигнала с получением соответствующей огибающей сигнала включает применение второй субдискретизации к сигналу абсолютной величины, фильтрованному фильтром нижних частот, для получения огибающей сигнала, которая является оценкой амплитуды аудиозаписи.

10. Способ по п.9, в котором применение второй субдискретизации включает передискретизацию от 14,7 кГц до 100 Гц.

11. Способ по п.9 или 10, в котором обработка фильтрованного цифрового аудиосигнала с получением соответствующей огибающей сигнала включает применение логарифмического сжатия к огибающей сигнала, которая является оценкой амплитуды аудиозаписи, с получением огибающей сигнала, которая содержит оценку мощности цифровой аудиозаписи.

12. Способ по любому из предыдущих пунктов, в котором аппроксимация статистическим распределением включает выбор модального интервала гистограммы, который представляет собой интервал, в который отсортировано самое большое число отсчетов.

13. Способ по п.12, в котором статистическое распределение содержит распределение Пуассона, имеющее параметр лямбда, и аппроксимация статистическим распределением включает установление параметра лямбда равным номеру модального интервала.

14. Способ по любому из предыдущих пунктов, в котором определение порогового значения включает установку порогового значения равным значению из диапазона величин отсчетов в пороговом интервале.

15. Способ по любому из предыдущих пунктов, в котором пороговое значение устанавливают на верхний предел диапазона величин отсчетов в пороговом интервале.

16. Способ по любому из предыдущих пунктов, в котором используют временной фильтр для отбрасывания сегментов, которые не находятся в пределах заранее заданного диапазона продолжительностей, основанного на событиях, представляющих интерес.

17. Способ по п.16, в котором события, представляющие интерес, включают звуки храпа, при этом диапазон продолжительностей включает продолжительность больше 225 миллисекунд и меньше 4 секунд.

18. Способ по любому из предыдущих пунктов, включающий запись информации, указывающей начало и конец для каждого из сегментов огибающей сигнала, которые превышают пороговое значение, на энергонезависимый носитель и в ассоциации с цифровой аудиозаписью.

19. Устройство для идентификации сегментов цифровой аудиозаписи дыхательных звуков субъекта, где указанные сегменты содержат конкретные акустические события, представляющие интерес, содержащее:

процессор для обработки цифровой записи,

цифровую память, которая связана с процессором с возможностью передачи данных и в которой хранятся цифровые инструкции, конфигурирующие процессор, при этом указанные инструкции заставляют процессор осуществлять:

фильтрование записи на основе характеристического частотного диапазона акустических событий;

обработку фильтрованной записи с получением соответствующей огибающей сигнала;

сортировку отсчетов, составляющих огибающую сигнала, по интервалам для формирования гистограммы;

аппроксимацию гистограммы статистическим распределением для определения порогового значения, соответствующего заранее заданному уровню вероятности; и

идентификацию сегментов огибающей сигнала, которые превышают пороговое значение, для идентификации соответствующих сегментов цифровой аудиозаписи как сегментов, содержащих конкретные акустические события,

при этом определение порогового значения, соответствующего заранее заданному уровню вероятности, включает вычисление кумулятивной функции распределения (CDF) в отношении статистического распределения, и

определение порогового значения включает определение порогового интервала, который соответствует заранее заданной вероятности, при этом уровень заранее заданной вероятности включает уровень вероятности для кумулятивной функции распределения.

20. Устройство по п.19, содержащее микрофон, который сконфигурирован для улавливания звуков субъекта.

21. Устройство по п.19 или 20, содержащее аудиоинтерфейс, содержащий фильтр и аналогово-цифровой преобразователь, сконфигурированный для преобразования звуков субъекта в цифровой аудиосигнал.

22. Устройство по п.21, которое сконфигурировано для хранения цифрового аудиосигнала как цифровой аудиозаписи в цифровой памяти, доступной для процессора.

23. Устройство по любому из пп.19-22, содержащее интерфейс человек-машина.

24. Устройство по п.23, в котором инструкции, хранящиеся в цифровой памяти, включают инструкции, которые заставляют процессор отображать на интерфейсе человек-машина информацию, включающую информацию, идентифицирующую сегменты в цифровой аудиозаписи, содержащие события, представляющие интерес.

25. Устройство по п.24, в котором инструкции, хранящиеся в цифровой памяти, включают инструкции, которые заставляют процессор отображать на интерфейсе человек-машина информацию, включающую информацию, идентифицирующую событие, представляющее интерес.

26. Устройство по п.24 или 25, в котором информация, которая отображается на интерфейсе человек-машина, включает информацию, идентифицирующую время начала и время окончания каждого из сегментов, идентифицированных как содержащие события, представляющие интерес.

27. Устройство по п.26, в котором цифровая память содержит инструкции, которые заставляют процессор записывать время начала и конца каждого идентифицированного сегмента в энергонезависимую память, таким образом физически помечая сегменты, содержащие события, представляющие интерес, в цифровой аудиозаписи.

28. Считываемый компьютером носитель, содержащий инструкции для выполнения одним или более процессорами для осуществления способа по п.1.

Документы, цитированные в отчете о поиске Патент 2024 года RU2829970C1

US 2019239772 A1, 08.08.2019
US 2007010722 A1, 11.01.2007
WO 2013142908 A1, 03.10.2013
KR 20180007913 A, 24.01.2018
WO 2020104465 A2, 28.05.2020
KR 20120061780 A, 13.06.2012
Датчик для измерения контактного давления сыпучих тел 1974
  • Шалацкий Леонид Григорьевич
SU504945A1
0
SU167630A1
СИСТЕМА ДЛЯ АНАЛИЗА И ФОРМИРОВАНИЯ ИЗОБРАЖЕНИЯ ШУМА ДЫХАТЕЛЬНЫХ ПУТЕЙ 2003
  • Кушнир Игал
  • Ботбол Мейр
RU2314751C2

RU 2 829 970 C1

Авторы

Вуд Джаван Таннер

Пелтонен Веса Туомас Кристиан

Мэй Джон Кэмпбелл

Партридж Николас Ким

Даты

2024-11-11Публикация

2021-06-18Подача