The new method for the analysis and visualization of the fine temporal structure of the transient evoked otoacoustic emission signal

Belov1 O.A.; Alekseeva N.N.; Tavartkiladze G.A.

doi:https://doi.org/

Закрыть метаданные

Рекомендуем статьи по данной теме:

Исследование связи индивидуальных характеристик биоэлектрической активности головного мозга с уровнями стресса, нервно-психического напряжения, агрессии, тревожности и депрессии. Журнал неврологии и психиатрии им. С.С. Корсакова. 2025;(5):108-117

Спектральный анализ в метаболомике новообразований кожи. Клиническая дерматология и венерология. 2025;(3):277-283

Резюме / Abstract:

С целью анализа и визуализации временно`й структуры сигнала задержанной вызванной отоакустической эмиссии (ЗВОАЭ) разработан метод представления сигнала в виде набора тональных компонент с быстро меняющейся амплитудой и относительно стабильной частотой, основанный на объединении трех спектрограмм с различным частотным и временны`м разрешением посредством блока нечеткой логики с последующим уточнением частот компонент, оценкой их амплитуд по методу наименьших квадратов, коррекцией числа значимых компонент и окончательной группировкой результатов. Метод получил название Pitch-Envelope Analysis (PEA). Для отображения результатов предложен вид диаграммы, названный компонентограммой. Метод может быть использован для анализа непрерывного сигнала в реальном времени, в том числе и для обработки речи.

Ключевые слова / Keywords:

задержанная вызванная отоакустическая эмиссия

спектральный анализ

спектрограммы

Авторы / Authors:

Белов1 О.А.

Российский научно-практический центр аудиологии и слухопротезирования ФМБА России, Москва, Россия 117513

Алексеева Н.Н.

Российский научно-практический центр аудиологии и слухопротезирования ФМБА России, Москва, Россия 117513;
Кафедра сурдологии РМАПО Минздрава России, Москва, Россия 123995

SPIN РИНЦ: 3421-4779
ORCID: 0000-0002-3407-3107

Таварткиладзе Г.А.

ФГУ "Российский научно-практический центр аудиологии и слухопротезирования"

SPIN РИНЦ: 1920-4450
Scopus AuthorID: 6701603360
ResearcherID: I-6114-2016
ORCID: 0000-0003-0118-908X

Закрыть метаданные

Визуализация сигнала задержанной вызванной отоакустической эмиссии как в виде зависимости временно`го ряда, так и в виде частотного спектра сигнала в целом не позволяет изучить тонкую временную структуру этого сигнала. Более подходящими для этой цели являются спектрограммы [1] и вэйвлет-преобразования [2]. Однако эти методы дают размытое представление, в котором каждой компоненте сигнала соответствует целая область, что хотя и не сильно мешает визуальному восприятию, но затрудняет дальнейший компьютерный анализ. Кроме этого, оба метода склонны давать артефакты в виде ложных пиков.

На основании проведенных исследований [3, 4] можно предположить, что сигнал ЗВОАЭ по своему происхождению состоит из набора тональных посылок с быстро меняющейся амплитудой, но достаточно стабильной частотой.

Нами был разработан метод разложения сигнала на компоненты, отвечающие этому условию. В основу метода была положена неопубликованная идея Криса Джеймса из Cochlear Europe, представленная в устном докладе на симпозиуме «Sound processing and beyond» (Amsterdam, Sept. 2012), в котором было предложено использовать комбинацию двух спектрограмм с различными частотными и временны`ми разрешениями для анализа речевого сигнала. В результате поэлементного перемножения спектрограмм автор получал одновременно хорошее частотное и временно`е разрешение. Тем не менее результат содержал значительные артефакты. Мы использовали 3 спектрограммы, что значительно уменьшило количество артефактов. В оригинальном методе частотное разрешение определялось дискретностью Фурье-преобразования (ФП). Нами разработан способ уточнения частоты. Однако основным отличием нашего алгоритма стало использование метода наименьших квадратов для оценки амплитуды. Кроме того, были добавлены алгоритмы отбора и упорядочивания компонент, что сделало результаты более пригодными для дальнейшей компьютерной обработки.

Алгоритм предназначен для анализа сигнала, который предположительно состоит из набора тональных компонент и шума, причем амплитуда компонент меняется существенно быстрее, чем частота, и одновременно присутствует небольшое их количество. В отличие от большинства алгоритмов спектрального анализа, алгоритм PEA пытается представить каждую компоненту как тон с быстро меняющейся амплитудой, а не как результат биений между несколькими частотами. В то же время при малом шуме и отсутствии близких по частоте компонент алгоритм имеет высокое частотное разрешение, значительно превышающее величину, обратную к временно`му разрешению.

Входной сигнал обрабатывается по кадрам длиной в фиксированное число отсчетов. Для каждого кадра алгоритм PEA делает оценку мгновенной частоты и комплексной амплитуды нескольких доминирующих компонент. Результаты алгоритм группирует по каналам. Число каналов фиксировано и, как правило, близко к ¹/3 от числа отсчетов в кадре. Для обработки как сигнала ЗВОАЭ, так и речи оптимальная длительность кадра находится в диапазоне 1-2 мс. Алгоритм возвращает также остаток, не описываемый полученными компонентами. По этому остатку и данным в каналах сигнал может быть восстановлен без потерь.

Было показано, что предложенный метод позволяет не только отобразить тонкую структуру эмиссии, но и провести автоматическую классификацию компонент по их нелинейной зависимости от амплитуды стимула и по их воспроизводимости.

Предварительные исследования дают основания полагать, что алгоритм может быть использован для кодирования сигнала в кохлеарных имплантах и в слуховых аппаратах, и, в частности, для частотной транспозиции речи.

Методы

Сигнал обрабатывается в несколько этапов, выполняемых последовательно для каждого кадра входных данных.

На первом этапе производится расчет спектра входного сигнала с помощью ФП. Вычисляются 3 преобразования Фурье одинаковой длины, но с использованием трех различных окон. Длина ненулевой части первого окна составляет ровно 2 кадра, а для других окон выбирается под определенную задачу при настройке алгоритма.

В действительности, вместо прямого расчета ФП мы используем предварительный расчет ФП с окном и без окна для отдельных кадров. Результирующие спектры вычисляются по предварительным путем их комбинации, что существенно сокращает объем вычислений.

Далее алгоритм находит несколько частот, на которых предположительно находятся компоненты, путем совместного анализа спектров блоком нечеткой логики. В простейшем случае спектры просто покомпонентно перемножаются, однако могут быть заданы и более сложные правила, позволяющие отдать предпочтение определенным компонентам. Частотное разрешение этого этапа определяется длиной ФП.

В алгоритме Криса Джеймса использовались два набора спектров, что давало ложные пики в результирующем спектре при быстром переключении от тона к тону. Хотя в нашем алгоритме эти ложные пики и устраняются на этапе расчета амплитуд, они все равно занимают канал обработки, и поэтому уменьшают чувствительность к слабым сигналам. Введение третьего спектра позволило существенно увеличить чувствительность алгоритма в таких ситуациях.

На следующем этапе алгоритм уточняет частоты тонов. Часть сигнала в полосе, окружающей найденный тон, сдвигается в область низких частот, где и происходит оценка частоты прямым расчетом по скорости изменения фазы или методом Прони. В настоящее время эффективность реализации обоих методов расчета примерно одинакова.

На следующем этапе для каждого кадра алгоритм строит базис, состоящий из тонов с найденными частотами. Производится разложение исходного сигнала по этому базису по методу наименьших квадратов. В некоторых случаях это разложение может приводить к интерпретации малого сигнала с быстро меняющейся амплитудой как разности двух существенно больших тонов. Чтобы избежать подобного поведения, вводятся специальная проверка и цикл уменьшения количества тонов.

На последнем этапе компоненты результата упорядочиваются таким образом, чтобы похожие частоты оставались в одном канале как можно дольше. Эта обработка существенно упрощает использование результатов преобразования.

Метод может быть оптимизирован под конкретную задачу путем подбора параметров. Задаются временно`е разрешение, количество каналов, допустимая задержка при работе в реальном времени, глубина просмотра, зависящая от типичной длительности компонентов. Эта оптимизация может быть выполнена с помощью графического интерфейса.

Для графического представления результатов анализа был разработан вид графика, названный компонентограммой. Компонентограмма состоит из двух панелей с общей осью времени. На верхней панели приведен остаток от разложения сигнала на тональные компоненты или, для некоторых задач, остаток, разделенный на частотные полосы. Масштаб этой панели тот же, что и для амплитуды на нижней панели.

Для графического представления результатов анализа был разработан вид графика, названный компонентограммой. Компонентограмма состоит из двух панелей с общей осью времени. На верхней панели приведен остаток от разложения или, для некоторых задач, остаток, разделенный на частотные полосы. Масштаб этой панели тот же, что и для амплитуды на нижней панели.

На нижней панели вертикальная ось проградуирована в частоте, но фактически отображается амплитудное представление компоненты, однако смещенное на величину мгновенной частоты. Другими словами, вертикальное смещение каждой точки графика есть сумма мгновенной частоты и мгновенного значения, масштабированных в соответствии с обеими осями. При восприятии неоднозначности не возникает, так как по алгоритму частота изменяется относительно медленно, а постоянная составляющая у компоненты отсутствует.

На рис. 1

Рисунок 1. Пример сигнала ЗВОАЭ. Левый верхний фрагмент: форма стимула; правый - спектры среднего и разности буферов накопления; нижний фрагмент: два буфера накопления и их разность.

приведен пример сигнала ЗВОАЭ, зарегистрированного на нашем оборудовании в нормально слышащем ухе при амплитуде стимула 0,3 Па и числе накоплений, равном 4000. Кривая над графиком ЗВОАЭ показывает разность буферов накопления.

На рис. 2

Рисунок 2. Компонентограмма сигнала, приведенного на рис. 1.

приведена компонентограмма того же сигнала. На рис. 3

Рисунок 3. Компонентограмма сигнала ЗВОАЭ, зарегистрированного на том же ухе при стимуле, большем по амплитуде в 1,5 раза.

представлена компонентограмма сигнала ЗВОАЭ на том же ухе, но на стимул 0,45 Па. Визуально можно идентифицировать как аналогичные компоненты, так и компоненты, присутствующие только на одной записи. Видно также, что одни компоненты зависят от амплитуды стимула, а другие демонстрируют нелинейный рост или отсутствие роста. В настоящее время мы разрабатываем метод автоматической классификации компонентов в наборе записей.

Заключение

Разработанный метод позволяет как визуально анализировать, так и количественно оценивать поведение отдельных компонент сигнала ЗВОАЭ. Если подтвердится предположение о том, что эти компоненты, как правило, соответствуют различным процессам и различным областям улитки, то мы получим новый инструмент для более точного анализа зависимости этих процессов от различных факторов. Кроме того, новые возможности по классификации компонент позволяют повысить точность скрининговых исследований.