Кирьянов П.А.

ФГБУ «Российский центр судебно-медицинской экспертизы» Минздрава России, Москва, Россия, 125284

Каганов А.Ш.

ФГБУ "Российский центр судебно-медицинской экспертизы" Минздрава России, Москва

Возможности спектрального анализа в преодолении несопоставимости речевого материала при проведении медико-криминалистической идентификации говорящего

Авторы:

Кирьянов П.А., Каганов А.Ш.

Подробнее об авторах

Прочитано: 1050 раз


Как цитировать:

Кирьянов П.А., Каганов А.Ш. Возможности спектрального анализа в преодолении несопоставимости речевого материала при проведении медико-криминалистической идентификации говорящего. Судебно-медицинская экспертиза. 2017;60(4):25‑28.
Kir’yanov PA, Kaganov ASh. The possibilities for the use of the spectral analysis to overcome the incompatibility of the speech materials for the purpose of medical criminalistic identification of the speaker. Forensic Medical Expertise. 2017;60(4):25‑28. (In Russ.)
https://doi.org/10.17116/sudmed201760425-28

Рекомендуем статьи по данной теме:
Спек­траль­ный ана­лиз в ме­та­бо­ло­ми­ке но­во­об­ра­зо­ва­ний ко­жи. Кли­ни­чес­кая дер­ма­то­ло­гия и ве­не­ро­ло­гия. 2025;(3):277-283

В предыдущих статьях [1—3] был представлен анализ применения аппарата спектрального анализа для решения задачи медико-криминалистической идентификации личности по голосу и звучащей речи. В данной публикации рассмотрены спектральные характеристики речи в качестве устойчивых идентификационных признаков в условиях ограниченного объема речевого материала и неполной сопоставимости исходных и сравнительных записей. Необходимость в сравнительном идентификационном исследовании стабильных показателей объясняется тем, что только устойчивые индивидуализирующие признаки говорящего могут быть задействованы для установления наличия или отсутствия тождества того или иного материального объекта, в данном случае человека, по его отображениям, т. е. для идентификации в ее криминалистическом понимании.

Теоретические положения

В практике традиционного формантного анализа​1​᠎ широко используется подход, при котором (в соответствии с общей концепцией рассмотрения речи как задачи фильтрации) для обеспечения стабильности результатов измерений форманты гласных оценивают в одинаковом фонетическом контексте (в «триадах») с учетом комбинаторных и позиционных изменений [4]. При постановке реальных задач медико-криминалистической идентификации личности речевой материал обычно ограничен. По этой причине эксперт-исследователь далеко не всегда может воспользоваться указанной технологией и отобрать достаточное для представительной выборки количество «триад». В подобном случае приходится решать задачи с ограничениями, наложенными на начальные условия.

Таким образом, появляется необходимость развития теории применительно к речевому материалу ограниченного или малого объема. Эффективной в этих случаях может оказаться методика получения и оценки значений формантных характеристик гласных, позволяющая сравнивать фонетические контексты, традиционно определяемые как несовпадающие, но такие, в которых сохраняется акустическое качество исследуемых звуков [5].

Например, при сопоставлении ударных и безударных гласных необходимо учесть качество согласных по таким параметрам, как твердость—мягкость (предшествующего, последующего согласного, т. е. позиции типа tat—tat’, t’at—t’at’, в которых изменяется степень смещения фокуса артикуляции гласного вперед). Так, для гласного [а] в словах х[а]тят, Т[а]тьяна, с[а]дись, сиг[а]рета общей является позиция tat’; а для гласного [ы] в словах пассаж[ы]р, ж[ы]вой, тяж[ы]ло — позиция типа tat.

В современных исследованиях формантного состава ударных гласных показано [6], что в позициях типа t’at и t’at’ степень продвижения гласных вперед практически совпадает. По этой причине в общем ряду можно рассматривать фонетические позиции гласного в таких словах, как «слинял» и «пять»; «нюхать» и «люди»; «тетка» и «тетя» и т. д.

Далее следует усреднить значения формант исследуемого гласного по анализируемой выборке, ибо, как указывал Л.Р. Зиндер, «… результаты (измерений — А.К.), даже если перед нами несколько произнесений одного и того же диктора, будут колебаться»​2​᠎. Близость числовых значений усредненных значений формант исходной и сравнительной звукозаписей явится в этом случае одной из разновидностей стабильности данного показателя, а сами средние значения формант можно рассматривать в качестве устойчивого идентификационного признака.

В настоящее время нет убедительных доказательств того, что значения формант являются единственными индивидуализирующими признаками для определения акустического качества звуков. Как показывает анализ речевого материала в многообразии конкретных медико-криминалистических идентификаций, точнее было бы говорить о том, что существует несколько параллельно функционирующих систем, позволяющих выделить признаки спектральной группы, индивидуализирующие говорящего, наподобие того, как существует по крайней мере две параллельно действующие системы голосообразования [8].

Именно за счет нескольких систем признаков различного типа обеспечивается устойчивость речевой коммуникации, в том числе в условиях помех, шумов и искажений (особенно важно в идентификационном исследовании говорящего по реальным звукозаписям). Параллельные системы признаков могут быть реализованы в рамках допустимой для речевого аппарата человека акустической теории речеобразования [9].

Относительно параллельно функционирующих систем, позволяющих выделить идентификационные признаки спектральной группы, следует отметить, что устойчивые признаки могут иметь разную природу. К числу таких устойчивых признаков относятся и формантные соотношения F2/F1, F3/F1, F3/F2 и т. д. Анализ этих соотношений необходим при идентификации фигуранта, который находится в разном эмоциональном состоянии (спокоен, возбужден, подавлен, испуган, оживлен и др.), в различных речевых условиях (деловой разговор, выступление перед аудиторией, разговор со следователем и др.), т. е. при наличии ограничений, связанных с неполной сопоставимостью исходной и сравнительной записей [5]. В подобных ситуациях формантные соотношения обладают бόльшей устойчивостью по сравнению с абсолютными значениями формант и поэтому являются более доказательными идентификационными признаками. Такой вывод основан на нашем опыте решения задачи распознавания говорящего по реальным фонограммам. Мы установили, что при изменениях значений формант по тем или иным причинам (например, в зависимости от ситуации речевого общения, эмоционального состояния говорящего и др.) соотношения формант практически не меняются.

Примеры медико-криминалистических исследований

В качестве иллюстрации приведенных теоретических положений рассмотрим пример из нашей экспертной практики. Мы проанализировали спектральные характеристики речи (по признаку соотношения формант F2/F1) в различных речевых условиях и в разном эмоциональном состоянии говорящего. Результаты приведены в табл. 1 и обозначены как ситуация 1 и ситуация 2.

Таблица 1. Сравнение соотношений формант F1 и F2 в речевых сигналах одного говорящего, полученных в различных речевых условиях и при разном эмоциональном состоянии

В первом случае фигурант эмоционально собран, осторожен, краток. Голос звучит сухо, деловито, приглушенно. Во втором случае артикуляторно четко и полно представлена реализация гласных, согласные не напряжены, речь нетороплива (темп речи снижен по сравнению с ситуацией 1 примерно на 10%).

Как видно из данных табл. 1, в ситуациях 1 и 2 усредненные формантные показатели речи значительно расходятся, но соотношение F2/F1 остается практически неизменным — устойчивым, как отмечалось ранее, соотношения формант меняются в незначительной степени или практически не меняются.

Итак, соотношение формант остается стабильным, а данный идентификационный признак — формантные соотношения оказывается устойчивым даже на материале ограниченного объема.

Таким образом, теоретическое положение, что акустическое качество звуков определяется соотношением уровней сигнала в полосах спектра [10], получает новое развитие при сопоставлении речи одного и того же говорящего, т. е. при установлении наличия или отсутствия тождества в криминалистическом понимании.

Результаты исследования акустического качества русских гласных оценивали с помощью абсолютных и относительных формантных показателей. Следует отметить, что средневзвешенное относительное отклонение исходного (ситуация 1) и сравнительного (ситуация 2) речевого материала, подсчитанное по средним значениям формант, в данном примере составило 8,4%, а средневзвешенное относительное отклонение, подсчитанное по отношениям F2/F1 (столбцы 2 и 3 табл. 1), — всего 3,5%​3​᠎. Оба показателя находятся в пределах внутридикторской вариативности, однако соотношение формант в данном случае более «сильный» идентификационный признак, чем средние значения. Можно утверждать, что как идентификационный признак соотношение формант обладает бόльшим «весом», чем средние значения формант.

Наилучшее совпадение относительных формантных показателей исходной и сравнительной записей по звуку [a] объяснимо: среди всех гласных русского языка гласный [a] наиболее устойчив в спектральном отношении к шумам акустической обстановки и искажениям. Вследствие приведенных ранее причин спектральные характеристики гласного [a] оказались наиболее устойчивыми к различиям в речевой ситуации, в контекстном окружении, в объеме и качестве речевого материала исходной записи и фонограммы-образца.

Итак, фундаментальная мысль об определении акустического качества звуков через соотношения уровней сигнала в полосах спектра при решении задачи криминалистической идентификации говорящего реализовалась с помощью отношений средних значений частот формант F2/F1, т. е. форманты явились доступным для речевого аппарата способом достижения необходимых полосных соотношений.

Рассмотрим соотношения не только F1 и F2, но и F1 и F3, F2 и F3 формант, распространив гипотезу Л.А. Варшавского и И.М. Литвака [10] не только на соседние, но и на более отдаленные друг от друга полосы спектра.

В табл. 2 приведены сравнительные характеристики русских гласных (по признаку соотношений формант F2/F1, F3/F2, F3/F1) в различных речевых условиях и в неодинаковом эмоциональном состоянии фигуранта. В первом случае для речи говорящего характерно беспокойство в сочетании с растерянностью. Интонации варьируются от умоляющих до требовательных и даже гневных. В ситуации 2 речь более сдержанная, обдуманная, достаточно логична.

Таблица 2. Сравнение соотношений формант F1, F2 и F3 в речевых сигналах одного говорящего, полученных в различных речевых условиях и при разном эмоциональном состоянии

Из данных табл. 2 видно, что соотношения формант, полученные в процессе формантного анализа гласных [а], [и], [о] в фонетически сильных позициях для голоса и речи фигуранта в записи исходных телефонных разговоров (ситуация 1) и в сравнительной записи разговора со следователем (ситуация 2) меняются в незначительной степени или практически не меняются.

Таким образом, идентификационные признаки — формантные соотношения F2/F1, F3/F2, F3/F1 вновь оказались устойчивыми, а положение о том, что акустическое качество звуков определяется соотношением уровней сигнала в полосах спектра [10], получило дальнейшее развитие при сопоставлении характеристик речи одного и того же говорящего не только в соседних, но и в более отдаленных друг от друга полосах спектра.

Результаты, полученные по выбранной метрике, показали, что средневзвешенное относительное отклонение исходного (ситуация 1) и сравнительного (ситуация 2) речевого материала, подсчитанное по отношениям F2/F1, F3/F2, F3/F1 (столбцы 3 и 4 табл. 2), составляет около 3,5%. Это существенно меньше среднестатистической внутридикторской вариативности.

Интересно отметить, что как и в предыдущем примере наилучшее совпадение параметров исходной и сравнительной записей (с учетом F3) получено по звуку [a]. Таким образом, характеристики гласного [a] вновь оказались наиболее устойчивыми к различиям речевого материала, связанным не только с наличием шумов акустической обстановки и искажений (в данном примере на фонограмме-образце), но и с несовпадением речевых ситуаций 1 и 2, т. е. к ограничениям, наложенным на речевой материал реальных криминалистических экспертиз.

Таким образом, экспертная практика убедитель-но доказывает, что спектральный анализ является мощным инструментом определения характеристик тех идентификационных признаков говорящего, которые связаны с биометрическими характеристиками и функционально-динамическим комплексом устно-рече-вых навыков фигуранта судебно-медицинской экспер-тизы.

Авторы заявляют об отсутствии конфликта интересов.

1Известно, что в значениях формант косвенным образом отражаются биометрические характеристики речевого тракта лица, подлежащего идентификации (см., например, [1]).

2См., например, [7].

3Для оценки близости формантных показателей использовали метрику δΣ=(Σ (1/|yj|)(|xj|–|yj|) ·100%)/N [5].

Подтверждение e-mail

На test@yandex.ru отправлено письмо со ссылкой для подтверждения e-mail. Перейдите по ссылке из письма, чтобы завершить регистрацию на сайте.

Подтверждение e-mail

Мы используем файлы cооkies для улучшения работы сайта. Оставаясь на нашем сайте, вы соглашаетесь с условиями использования файлов cооkies. Чтобы ознакомиться с нашими Положениями о конфиденциальности и об использовании файлов cookie, нажмите здесь.