Сайт издательства «Медиа Сфера»
содержит материалы, предназначенные исключительно для работников здравоохранения. Закрывая это сообщение, Вы подтверждаете, что являетесь дипломированным медицинским работником или студентом медицинского образовательного учреждения.
Применение параметрической статистики к данным визометрии
Журнал: Вестник офтальмологии. 2024;140(5): 70‑77
Прочитано: 977 раз
Как цитировать:
Многие клинические исследования в офтальмологии измеряют остроту зрения как ключевой критерий работы глаз. Важным этапом любого из них является статистический анализ полученных данных, поэтому критически важным становится их представление в удобной для анализа форме. Широкое распространение параметрических методов, несмотря на доступность в современных статистических пакетах непараметрических аналогов, объясняется их большей статистической мощностью, позволяющей получить статистически значимые результаты при меньшем числе наблюдений [1]. При этом проблем с применимостью непараметрических критериев не существует, но, поскольку они работают не с исходными значениями данных, а с их рангами, отмечается их меньшая информативность [2].
В основе всех современных методов визометрии лежит измерение минимального угла разрешения исследуемого глаза (MAR) в угловых минутах, однако прямое использование этого значения для записи остроты зрения оказалось неудобным. В визометрических данных MAR представлен косвенным образом, зависящим от используемого способа нотации [3]. В настоящий момент в России наиболее популярен десятичный способ нотации, предложенный F. Monoyer [4], в котором значение остроты зрения связано с MAR по формуле Дондерса Dec=1/MAR (или Dec=MAR–1). Таблицы Головина—Сивцева представляют остроту зрения именно таким образом. В мировой практике большую популярность получил логарифмический способ нотации, в котором MAR связан со значением остроты зрения логарифмической формулой LogMAR=log10(MAR). В этой нотации работают таблицы ETDRS. В обоих случаях MAR преобразуется для получения более удобного представления, причем (видимо, случайно) они оба являются частными случаями семейства степенных преобразований, предложенных в 1957 г. J.W. Tukey [5] (Tukey ladder of Powers):
.
Эти преобразования используются для приведения несимметрично распределенных данных к более симметричному, нормальному, виду. При изменении значения λ плавно меняется коэффициент асимметрии. Оптимальное значение λ подбирается таким образом, чтобы итоговое распределение было максимально нормальным. Десятичной нотации в этом семействе соответствует преобразование с λ= –1,0 (–x–1 или –1/x). Эта формула отличается от формулы Дондерса только противоположным знаком (табл. 1). Логарифмической нотации соответствует преобразование с λ=0 (log10x)
Таблица 1. Сравнение десятичного и логарифмического способов нотации
| Способ нотации | Десятичный | Логарифмический |
| Формула | Dec=1/MAR | LogMAR=log10(MAR) |
| Tukey λ | –1,0 | 0 |
Таблицы ETDRS [6], разработанные в 1982 г., вместе с применяемым в них логарифмическим способом нотации де факто стали мировым стандартом для измерения остроты зрения в научных исследованиях [7]. Тем не менее существуют публикации, отмечающие что логарифмическая нотация в чем-то уступает десятичной [8]. Наиболее подробно критика логарифмической нотации представлена в статье Г.И. Рожковой «LogMAR для остроты зрения хуже, чем лошадиная сила для мощности электрической лампочки» [9].
С точки зрения удобства статистической обработки оптимальным было бы преобразование, дающее симметричное, близкое к нормальному, распределение. Доступные данные многоцентровых исследований, проведенных на больших популяциях, показывают, что по крайней мере в логарифмической нотации наблюдается значимая асимметрия распределения остроты зрения (рис. 1—3).
Рис. 1. Распределение остроты зрения в исследовании CIEMS [10], 4711 участников.
Корригированная острота зрения лучшего глаза, измеренная по методике ETDRS. Значения в логарифмической (LogMAR) и десятичной (Dec) нотациях.
Рис. 2. Распределение дискриминантных (частично прочитанных) строк, составленное по данным прескрининговых визитов, в исследовании ETDRS [11], 3710 участников.
Максимально корригированная острота зрения обоих глаз. Значения в логарифмической (LogMAR) и десятичной (Dec) нотациях.
Рис. 3. Распределение данных об остроте зрения в исследовании AREDS2 [12], 4203 участника.
Максимально корригированная острота зрения обоих глаз, измеренная по методике ETDRS. Восстановлено по метаданным исследования, выложенным на платформе dbGaP (https://www.ncbi.nlm.nih.gov/gap). Значения в логарифмической (LogMAR) и десятичной (Dec) нотациях.
Во всех трех случаях распределение несимметрично с положительным значением коэффициента асимметрии, поскольку правый хвост распределения (по отношению к моде) тяжелее левого. Описание таких данных с помощью нормального распределения будет давать завышенную оценку числа случаев с плохим зрением и заниженную — с хорошим.
Цель исследования — используя степенные преобразования Tukey, определить способ нотации остроты зрения, наиболее подходящий для методов параметрической статистики.
Исследовались как результаты собственных измерений, так и восстановленные данные визометрии из нескольких крупных многоцентровых исследований (CIEMS [10] — 4711 участников; ETDRS [11] — 3710 участников; AREDS2 [12] — 4203 участника).
Собственные данные собирались путем измерения остроты зрения обоих глаз у 100 здоровых испытуемых по протоколу ETDRS. Все проводимые процедуры соответствовали принципам, изложенным в Хельсинкской декларации 1975 г. и ее пересмотренном варианте 2000 г. Перед исследованием испытуемые были подробно информированы о процедуре и дали согласие на ее проведение. Для предъявления таблиц использовали устройство Illuminator Cabinet производства компании Precision Vision (США). Согласно стандартному протоколу, с расстояния 4 м определялась клиническая рефракция обоих глаз по таблице R, затем корригированная острота зрения измерялась отдельно по таблице 1 для правого глаза и по таблице 2 для левого. Распознанные оптотипы фиксировались исследователем по отдельности. Все испытуемые смогли с расстояния 4 м каждым глазом прочесть по крайней мере 20 символов, поэтому исследование с расстояния 1 м не проводилось. Согласно стандартному протоколу, letter score в этом случае равен количеству распознанных с расстояния 4 м оптотипов плюс 30. Перевод letter score в логарифмическую нотацию осуществляли по формуле:
LogMAR=1,7–0,02·N,
где N соответствует letter score.
Распределение данных визометрии в исследовании CIEMS (The Central India Eye and Medical Study) получено путем измерения высоты столбиков гистограммы Fig. 1 соответствующей публикации [10], изображающей распределение корригированной остроты зрения лучшего глаза, исследованной методом ETDRS.
Данные визометрии исследования ETDRS (Early Treatment Diabetic Retinopathy Study) недоступны напрямую. Вместо них исследовали распределение дискриминантных (частично прочитанных) строк, составленное по данным прескрининговых визитов ETDRS по Fig. 3 публикации [11]. Данные восстанавливались аналогичным способом.
Гистограммы распределения остроты зрения исследования AREDS2 (The Age-related Eye Disease Study 2) не публиковались, однако они имеются в открытом виде на платформе dbGaP. Восстановление данных из доступных на этой платформе гистограмм проводилось так же, как и в предыдущих случаях.
Минимальный угол разрешения для последующего анализа получали на основании данных корригированной остроты зрения по формуле:
MAR=10LogMAR,
где MAR — минимальный угол разрешения в угловых минутах, LogMAR — острота зрения в логарифмической нотации.
Статистический анализ проводили с помощью R версии 4.1.1 (R Foundition for Statistical Computing). Подбор значения λ осуществляли с шагом 0,01. Оценку близости к нормальному распределению преобразованных данных осуществляли с использованием теста Шапиро—Уилка. Поскольку ограничением алгоритма для этого теста был объем выборки до 4000, в данных CIEMS и AREDS2 количество измерений для каждого возможного значения было сокращено в 2 раза, что не сказалось на форме распределения. Оптимальным считали значение λ, при котором критерий W теста принимал максимальное значение. Одновременно строили график скорости изменения критерия W (dW/dλ), значения коэффициентов асимметрии и эксцесса (последние для сохранения пропорциональности на графике уменьшены в 3 раза). В таком представлении расстояние от каждой кривой до нулевой линии наглядно показывает близость распределения данных к нормальному распределению при конкретном λ, поскольку для нормального распределения все перечисленные показатели равны нулю.
Для всех наборов данных найденное оптимальное значение λ оказалось ближе к –1,0 (десятичная нотация), чем к 0 (логарифмическая нотация) (табл. 2).
Таблица 2. Оптимальные значения λ, при которых распределение максимально приближено к нормальному (для четырех источников данных визометрии)
| Источник данных | Оптимальное значение λ |
| CIEMS | –1,31 |
| ETDRS | –0,8 |
| AREDS 2 | –0,88 |
| Собственные данные | –1,66 |
В табл. 3—5 приведены характеристики четырех наборов исходных данных после их преобразования при оптимальном λ (см. табл. 3), при λ=0 (см. табл. 4) и при λ= –1,0 (см. табл. 5).
Таблица 3. Нормальность распределения при оптимальном λ
| Источник данных | Значение W | Достоверность соответствия нормальному распределению по тесту Шапиро—Уилка | Коэффициент асимметрии | Коэффициент эксцесса |
| CIEMS | 0,794 | p<0,00001 | 0,3 | 2,425 |
| ETDRS | 0,968 | p<0,00001 | 0,069 | –0,557 |
| AREDS 2 | 0,966 | p<0,00001 | 0,073 | –0,475 |
| Собственные данные | 0,984 | p=0,019 | –0,042 | 0,039 |
Таблица 4. Нормальность распределения при λ=0 (логарифмическая нотация)
| Источник данных | Значение W | Достоверность соответствия нормальному распределению по тесту Шапиро—Уилка | Коэффициент асимметрии | Коэффициент эксцесса |
| CIEMS | 0,677 | p<0,00001 | 2,232 | 5,462 |
| ETDRS | 0,899 | p<0,00001 | 1,146 | 1,105 |
| AREDS 2 | 0,878 | p<0,00001 | 1,324 | 1,761 |
| Собственные данные | 0,713 | p<0,00001 | 3,579 | 20,249 |
Таблица 5. Степень нормальности распределения при λ= –1,0 (десятичная нотация)
| Источник данных | Значение W | Достоверность соответствия нормальному распределению по тесту Шапиро—Уилка | Коэффициент асимметрии | Коэффициент эксцесса |
| CIEMS | 0,787 | p<0,00001 | 0,799 | 1,787 |
| ETDRS | 0,964 | p<0,00001 | –0,154 | –0,507 |
| AREDS 2 | 0,964 | p<0,00001 | –0,062 | –0,478 |
| Собственные данные | 0,957 | p<0,00001 | 0,708 | 1,759 |
Процесс подбора оптимального значения λ для четырех наборов данных представлен на графиках (рис. 4—7). Коэффициенты асимметрии и эксцесса в десятичной нотации оказались ближе к нулю, а значение критерия W — больше, чем в логарифмической нотации.
Рис. 4. График зависимости скорости изменения W, коэффициента асимметрии и эксцесса от λ по результатам собственных измерений.
По результатам теста Шапиро—Уилка, самое близкое к нормальному распределению дает степенное преобразование со значением λ= –1,66. Здесь и на рис. 5—7: черная линия — скорость изменения критерия W (dW/dλ), красная — коэффициент асимметрии/3, зеленая — коэффициент эксцесса/3.
Рис. 5. График зависимости скорости изменения W, коэффициента асимметрии и эксцесса для различных значений λ по данным исследования CIEMS.
По результатам теста Шапиро—Уилка, самое близкое к нормальному распределению дает степенное преобразование со значением λ= –1,31.
Рис. 6. График зависимости скорости изменения W, коэффициента асимметрии и эксцесса для различных значений λ по данным исследования ETDRS.
По результатам теста Шапиро—Уилка, самое близкое к нормальному распределению дает степенное преобразование со значением λ= –0,8.
Рис. 7. График зависимости скорости изменения W, коэффициента асимметрии и эксцесса для различных значений λ по данным исследования AREDS2.
По результатам теста Шапиро—Уилка, самое близкое к нормальному распределению дает степенное преобразование со значением λ= –0,88.
Во всех исследованных случаях найденное оптимальное значение λ оказалось ближе к –1,0 (десятичная нотация), чем к 0 (логарифмическая нотация).
При сравнении значений критерия W для логарифмической нотации (λ=0) и десятичной нотации (λ= –1,0) во всех случаях W в десятичной нотации оказалось больше, чем в логарифмической.
Коэффициенты асимметрии и эксцесса в десятичной нотации оказались ближе к нулю, чем в логарифмической. Все это указывает на бóльшую близость к нормальному распределению данных остроты зрения в десятичной нотации.
Ни в одном из исследованных случаев оптимальное преобразование не позволило пройти тест Шапиро—Уилка на нормальность. Меньше всего от нормального отличалось распределение, полученное на основании собственных данных (p=0,019). Это, вероятно, объясняется высокой чувствительностью теста к повторяющимся значениям. Данные многоцентровых исследований имеют больше повторов, поскольку доступны только с округлением. Восстановленные данные доступны с точностью до 0,1 LogMAR, что соответствует одной строчке таблицы ETDRS; собственные данные получены с точностью до 0,02 LogMAR — один символ той же таблицы. Если бы была техническая возможность определять остроту зрения с меньшим шагом, тест Шапиро—Уилка выполнялся бы успешнее. Исследование с помощью квантиль-квантильного графика (рис. 8), менее чувствительного к повторяющимся значениям, показывает хорошее соответствие найденного оптимального преобразования нормальному распределению, что позволяет использовать методы параметрической статистики для этих данных.
Рис. 8. Квантиль-квантильный график собственных данных при оптимальном λ= –1,66.
Практически все точки лежат внутри области, соответствующей нормальному распределению.
Анализ данных визометрии из нескольких разных источников показал, что распределение остроты зрения в десятичной нотации ближе к нормальному распределению, чем в логарифмической нотации. Поэтому, несмотря на имеющиеся в настоящий момент рекомендации, мы предлагаем проводить статистическую обработку и представление данных визометрии в десятичной нотации. Возможно, десятичная нотация также не является идеальной, поскольку во всех исследованных случаях существовало степенное преобразование, дающее лучшую симметричность распределения.
Участие авторов:
Концепция и дизайн исследования: В.С.
Сбор и обработка материала: Ш.М., В.С.
Статистическая обработка: Т.Б. В.С.
Написание текста: В.С., Т.Б.
Редактирование: В.С., Т.Б.
Авторы заявляют об отсутствии конфликта интересов.
Литература / References:
Подтверждение e-mail
На test@yandex.ru отправлено письмо со ссылкой для подтверждения e-mail. Перейдите по ссылке из письма, чтобы завершить регистрацию на сайте.
Подтверждение e-mail
Мы используем файлы cооkies для улучшения работы сайта. Оставаясь на нашем сайте, вы соглашаетесь с условиями использования файлов cооkies. Чтобы ознакомиться с нашими Положениями о конфиденциальности и об использовании файлов cookie, нажмите здесь.