При интерпретации результатов количественных исследований клиницисты, а равно и специалисты лабораторий чаще всего прибегают к оценке соответствия результата референтным пределам. В соответствии с требованиями ГОСТ Р ИСО 15189−2015 каждая лаборатория должна сама устанавливать их для измеряемых аналитов и пересматривать в случаях, когда они перестают отвечать характеристикам обслуживаемой популяции, а также при внесении изменений в преаналитические или аналитические процедуры. Референтные интервалы (РИ) определяют, исходя из особенностей обследуемого контингента, характеристик используемых аналитических систем, достижения необходимой диагностической эффективности методики, собственных практических и экономических возможностей. Учитывая сложное взаимоотношение этих условий, можно говорить об адекватности установленного интервала и его пределов задачам конкретной лаборатории, но не об их «пригодности» в отношении того или иного аналитического метода, теста, аналита в принципе.
Вопрос разработки или переноса РИ лежит не только в плоскости биомедицинской статистики. В нем есть составляющие аналитического качества и даже аспекты организации и экономики здравоохранения. Важно помнить, что выбор референтных пределов, равно как и величина аналитического смещения, влияет на чувствительность и специфичность методики посредством изменения количества ложноотрицательных и ложноположительных результатов. К. Фрейзер в своей монографии иллюстрирует нелинейность этого влияния [1]. Таким образом, вопрос адекватности тех или иных РИ непосредственно связан с величиной аналитического смещения, присущей данной тест-системе, а также с пониманием задач, поставленных перед лабораторией клиницистами. Этот тезис следует пояснить. В случае скринингового характера исследований, проводимых лабораторией, РИ должен быть достаточно узким, чтобы обеспечить необходимую чувствительность. В то же время чрезмерно «строгий» РИ может привести к увеличению затрат за счет назначения повторных исследований или дополнительных тестов.
Клинический анализ крови, будучи включенным в стандарты оказания помощи при всех без исключения заболеваниях, по праву может быть признан самым распространенным из всех видов лабораторных тестов [2]. В то же время данное исследование представляет собой набор многочисленных показателей, весьма разнородных по своему применению и не всегда взаимосвязанных. Более того, учитывая несколько различных методов (каналов) измерения, применяемых в современном гематологическом анализаторе, можно говорить де факто и о разных аналитических системах, объединенных в одном приборе. В качестве важнейшей отдельной составляющей клинического анализа крови можно рассматривать комплекс эритроцитарных параметров, применяемых главным образом для диагностики анемического синдрома, а также полицитемии.
Диагностическими критериями ВОЗ для диагностики анемий у женщин являются концентрация гемоглобина (Hb) менее 120 г/л, число эритроцитов (RBC) менее 3,8 млн/мкл, гематокрит (Hct) менее 36%. Для мужчин эти цифры составляют менее 130 г/л, 4,0 млн/мкл и 39% соответственно [3]. В 2016 г. ужесточились диагностические критерии ВОЗ в отношении истинной полицитемии. Пороговый уровень Hb был снижен для мужчин со 185 до 165 г/л, для женщин со 165 до 160 г/л [4]. В качестве альтернативного варианта стал учитываться уровень Hct: выше 49% для мужчин и 48% для женщин [5]. Столь близкое расположение диагностических критериев патологии к физиологической области накладывает весьма жесткие требования к установлению нижних референтных пределов этих параметров. В то же время помещение результата исследования в «прокрустово ложе» старых «норм», известных с советских времен, недопустимо как противоречащее современной концепции РИ.
Подходы к определению РИ разделяют на прямые, рекомендованные IFCC [6], и непрямые (косвенные). Первые в свою очередь делятся на «a priori» и «a posteriori». Прямые подходы являются предпочтительными. Однако они сопряжены с рядом сложностей, особенно в отношении эритроцитарных параметров, требующих обязательной стратификации по полу. Главным образом это проблемы организационно-экономического характера — не всякая лаборатория может позволить себе в относительно короткий промежуток времени отобрать и обследовать не менее 240 здоровых человек для формирования мужской и женской референтных групп. Сюда следует добавить затраты на анкетирование или привлечение врачей-клиницистов для предварительного обследования кандидатов в референтные индивидуумы. Также нельзя исключать того, что эти масштабные исследования придется повторить спустя какое-то время в целях пересмотра Р.И. Не всегда бывает возможно обеспечить референтную группу, репрезентативную интересующей лабораторию популяции. Особенно это касается пожилых пациентов и детей. Существенные трудности с подбором референтной группы естественным образом возникают у лабораторий, обслуживающих исключительно стационарных пациентов.
В этом случае проблема определения РИ может быть эффективно решена с помощью косвенных подходов, путем анализа накопленного массива данных пациентов. Обычно после применения тех или иных критериев включения/исключения используются стандартные статистические методы анализа полученной выборки: параметрические или непараметрические. Однако могут быть применены и другие математические инструменты, в частности графический метод разделения смешанных выборок по C. Bhattacharya [7], обладающий своими преимуществами. Непрямые подходы не требуют дополнительных затрат, но имеют свои особенности. Концепция их применения к разработке гематологических РИ недостаточно изучена и раскрыта.
Цель исследования — поиск возможности разработки РИ эритроцитарных параметров на основе анализа массива данных пациентов многопрофильного стационара с использованием метода Bhattacharya.
Материал и методы
Проведен статистический анализ данных, накопленных в процессе рутинной эксплуатации гематологического анализатора Sysmex XT-4000i, по показателям Hb, RBC, MCV, RDW-CV, RDW-SD, Hct, MCH, MCHC. В отношении анализаторов серии XT к настоящему времени опубликовано достаточное количество работ с данными по РИ, определенными различными методами и для разных популяций, что представляет возможности для объективного сравнения наших результатов. Для работы был использован массив необработанных данных взрослых пациентов многопрофильного стационара за 8 мес одного года. Все результаты были получены при анализе венозной крови, взятой в вакуумные пробирки с антикоагулянтом К2ЭДТА. В исследование включали только записи пациентов, проходивших однократное обследование по клиническому анализу крови в течение указанного периода. Это преследовало две цели. Во-первых, пациент, у которого тест повторяется неоднократно, с большей вероятностью окажется болен и будет иметь патологические результаты, вклад которых в расчет мы старались минимизировать [8, 9]. Во-вторых, что важнее, повторное включение данных одних и тех же пациентов приведет к превалированию компонента внутрииндивидуальной вариации над межиндивидуальной и в, конечном счете, к сужению ширины рассчитанного Р.И. Из анализа исключали пациентов гематологического отделения, а также доноров отделения переливания крови. Исходный массив данных не включал в себя сколь-нибудь значимое число результатов анализов беременных женщин в силу отсутствия соответствующих клинических подразделений в составе лечебно-профилактического учреждения. В результате в исследование были включены 4977 записей, из них 3057 мужских и 1920 женских. Женскую и мужскую выборки данных анализировали раздельно. Их возрастные характеристики были следующими: медиана возраста мужчин 58 лет (межквартильный размах 42—68), женщин 56 лет (43—64). Целесообразность дальнейшей стратификации этих групп по возрасту была оценена методами Sinton и соавт. [1], а также Harris and Boyd [1, 9].
Далее полученные выборки были проанализированы по методу Bhattacharya для получения РИ непосредственно измеряемых аналитов, таких как Hb, RBC и MCV. Интервалы между концентрациями для частотного распределения результатов по каждому из этих параметров были выбраны с учетом величины выборок с тем, чтобы ход распределения в интересующей нас области был в достаточной мере аппроксимированным гауссовской кривой: для Hb 5г/л, RBC 0,2 млн/мкл, MCV 2фл. Сама методика в ее классическом варианте описана в литературе [7]. Построение графиков частотного распределения, а также графиков зависимости Dlg y от величины показателя x выполняли в программе MS Excel. При этом использование функции построения линии тренда для нисходящих участков графика Dlg y vs x обеспечивало автоматический расчет коэффициентов уравнения регрессии, которые в свою очередь использованы нами в формулах расчета среднего и стандартного отклонения. Это несколько видоизменило классические формулы расчета, упростив их и позволив избежать «ручного» определения величины угла q и необходимости ввода дополнительных коэффициентов для коррекции взаимоотношения шкал осей графика. В нашем виде формулы расчета выборочного среднего (X) и стандартного отклонения (s) приобрели следующий вид:
где a — коэффициент сдвига уравнения регрессии, b— коэффициент наклона уравнения регрессии, h — интервал между концентрациями в частотном распределении.
Референтные пределы для вышеуказанных аналитов рассчитывали параметрическим методом, исходя из вычисленных выборочных средних и стандартных отклонений, как X±1,96s.
РИ расчетных показателей Hct, MCH, MCHC, а также индексов RDW-CV и RDW-SD были получены на следующем этапе с применением стандартных статистических методов. При этом из дальнейшего анализа исключали записи пациентов, у которых хоть одно из значений показателей Hb, RBC или MCV выходило за пределы ранее рассчитанных для них Р.И. Данный алгоритм позволил, не прибегая к специальным методам, удалить «хвосты» распределения [10], в которых могут содержаться так называемые выбросы (outliers) — значения, выпадающие из непрерывного статистического распределения. Далее применяли непараметрический метод расчета. В отношении Hct и MCH были установлены двусторонние РИ, в отношении MCHC — рассчитан нижний референтный предел (RL), а для RDW-CV и RDW-SD — верхний (RU). Во всех случаях референтные пределы устанавливали с учетом охвата 95% референтного распределения.
Результаты и обсуждение
В результате статистических расчетов по методу Bhattacharya получены выборочные средние и стандартные отклонения для измеряемых аналитов, на основе которых рассчитаны их РИ (табл. 1).
У здоровых людей разброс значений большинства эритроцитарных показателей формирует частотное распределение, близкое к нормальному [11], которое может быть описано с помощью среднего значения и стандартного отклонения. Однако за счет присутствия в общей выборке патологических результатов и даже отдельных подгрупп пациентов с той или иной патологией общий вид распределения будет непараметрическим: скошенным или полимодальным. Поэтому даже в больших и, казалось бы, репрезентативных выборках, анализируемых стандартными статистическими методами, зачастую наблюдают распределения, отличные от нормального. Этим объясняется и тот факт, что один и тот же показатель в группе мужчин (например, Hb) может иметь параметрический характер распределения, а у женщин — нет [2]. При статистической обработке такой выборки могут возникать определенные трудности, обусловленные влиянием патологических компонентов, находящихся по краям распределения. В частности, получение РИ Hb для женщин стандартными статистическими методами приводит к тому, что интервал захватывает зону анемии (RL=112 г/л), вступая в противоречие с критериями ВОЗ.
Метод Bhattacharya же предусматривает разделение параметрических компонентов смешанной выборки. Расчет стандартного отклонения происходит по наклону логарифмического графика в центральной части распределения, вблизи среднего, совпадавшего, по нашим наблюдениям, с медианой (табл. 2). Это позволяет исключить влияние на конечный результат компонентов по краям распределения, которые могут содержать выбросы или результаты патологических подгрупп пациентов [9]. Данный метод позволяет достаточно эффективно вычленить группу результатов здоровых людей, которая будет вполне репрезентативна в отношении референтной популяции.
Индексы МСН, МСНС приобретают диагностическое значение в том случае, если имеются патологические сдвиги со стороны измеряемых аналитов красной крови. Hct, ранее самостоятельный диагностический показатель, в настоящее время также стал расчетным параметром. Следовательно, мы вправе ожидать в целом «нормальных» значений расчетных индексов у пациентов, не имеющих патологических сдвигов со стороны Hb, RBC и MCV, а применение стандартных статистических методов к определению РИ индексов в рамках предложенного нами алгоритма представляется оправданным. Использование 95% доверительного интервала для полученной таким образом выборки позволяет несколько сузить РИ индексов. Рациональность этого проиллюстрирована скаттерограммами на рис. 1, где референтные пределы МСН и Hct отсекают некоторые результаты, попадающие в РИ Hb, RBC и MCV, но имеющие маргинальные и, по всей видимости, патологические их соотношения. При таком подходе расчетный индекс может нести дополнительную диагностическую информацию, позволяющую выявить тенденции к пока еще не явным патологическим сдвигам. Статистические характеристики полученных в исследовании референтных распределений гематологических индексов приведены в табл. 3.
Индекс МСНС имеет особенности интерпретации. Его повышение связано фактически с единственным заболеванием — наследственным микросфероцитозом. Распространенность данной нозологической формы невысока, для жителей Северной Европы — 1 случай на 5000 населения [12]. Исследованиями показано, что при установлении cutoff МСНС на уровне 345 г/л [13] диагностическая чувствительность индекса в отношении наследственного микросфероцитоза составляет 86,17%, специфичность — 90,43%. При использовании порогового значения 355 г/л эти характеристики принимают величину 41,07 и 94,47% соответственно [14]. Рассчитав с учетом частоты заболевания прогностическое значение положительного теста [15] для одной и второй величины cutoff, получим 0,21 и 0,36%. Это означает, что, установив RU даже на уровне 355 г/л, мы отсечем популяцию, в которой на 1 больного (истинно-положительный результат) будут приходиться 276 здоровых пациентов (ложноположительные результаты). Очевидно, что величина RU для МСНС малоинформативна с точки зрения скрининга.
В то же время снижение МСНС происходит при гипохромных анемиях, наиболее распространенных из всех анемий. Следовательно, выбор RL, отсекающего основную массу результатов пациентов с признаками гипохромии, напротив, имеет существенное диагностическое значение — он не должен захватывать излишнее количество патологических результатов. Однако для МСНС по аналогии со всеми другими аналитами и индексами традиционно устанавливают двусторонний Р.И. Целесообразность этого сомнительна. В этом случае, очевидно, возникает диспропорция: верхние 2,5% популяции, выходящие за пределы RU, будут более чем на 99% состоять из здоровых пациентов, а в нижнюю часть РИ в то же время попадет существенное число лиц с гипохромией эритроцитов. Следовательно, одновременно увеличивается доля и ложноположительных результатов с одной стороны РИ, и ложноотрицательных — с другой. На наш взгляд, для МСНС как явно «одностороннего» диагностического показателя следует устанавливать только RL на уровне нижних 5% референтного распределения, а отдельно принимать пороговое значение для диагностики наследственного микросфероцитоза. Поскольку часто повышение МСНС носит ложный характер и связано с лабораторными ошибками, клинико-диагностическая лаборатория в качестве альтернативы также может установить для себя технический флаг на высокие значения этого показателя, который не будет выдаваться заказчику исследования.
Индексы RDW-CV и RDW-SD, строго говоря, не являются расчетными. Они выражают дисперсию объема эритроцитов — измеряемого параметра, и представляют собой самостоятельный лабораторный показатель. Величина RDW не связана с основными количественными характеристиками клеток, на что указывает слабость корреляционных связей между ними. В нашем исследовании коэффициенты корреляции Пирсона между RDW-SD и RBC, Hb и MCV (в общей группе) составили -0,35, -0,29 и 0,38 соответственно. Для RDW-CV: -0,15, -0,41 и -0,21. Поэтому вначале здесь также был применен метод Bhattacharya. Интервалы были избраны следующим образом: RDW-CV 0,4%, RDW-SD 1 фл. Однако при дальнейшем анализе были получены признаки неоднородности выборок. Наиболее явно это прослеживалось в женской группе, в которой распределение RDW-CV и RDW-SD имело бимодальный характер. Так, для RDW-SD были обнаружены два компонента со следующими характеристиками: X1=42,8, s1=1,8; X2=44,8, s2=2,5 (рис. 2). Для RDW-CV компоненты выборки характеризовались X1=13,2, s1=1,3; X2=13,5, s2=0,7. Нетрудно рассчитать, что в последнем случае один компонент имел существенно большую дисперсию, чем второй, и полностью перекрывал его. В отношении группы мужчин не прослеживалось бимодальной картины, но характер логарифмического графика также указывал на неоднородность выборки.
В литературе имеются данные о существенном влиянии возраста пациентов на величину RDW, особенно в его абсолютном (RDW-SD) выражении [16]. При этом не только сдвигается медиана этого показателя, но и расширяется доверительный интервал. Вероятно, прогрессирующее увеличение RDW в пожилом возрасте ассоциируется и со снижением механической прочности и деформируемости эритроцитов, и с имеющейся хронической патологией, а также может рассматриваться как предиктор летальности [17]. Однако данных, позволяющих уверенно говорить о патологическом характере возрастных изменений показателя, недостаточно. Утверждение о самостоятельной диагностической роли RDW в отсутствие других сдвигов со стороны красной крови, по-видимому, тоже преждевременно. Стратификация же по узким возрастным группам требует кратного увеличения выборки пациентов. Учитывая эти аспекты, было принято решение применить в отношении расчета РИ RDW ту же тактику, что и для других эритроцитарных индексов. Результаты приведены в табл. 3.
Несмотря на то что RDW изменяется отнюдь не только при анемиях, но и при многих других заболеваниях, что отразилось в геометрической прогрессии роста количества публикаций, посвященной клиническим применениям этого параметра [18], при интерпретации оценивается лишь его повышение. В этом случае по аналогии с МСНС представляется оправданным использование одного референтного предела — верхнего, на уровне 95 перцентиля референтного распределения.
Заключение
Проведенное исследование продемонстрировало пригодность графического метода Bhattacharya для разработки РИ эритроцитарных показателей, а также некоторые его преимущества перед стандартными статистическими методами. В частности, на примере Hb в женской группе мы видим, что на РИ, рассчитанный с помощью выбранного нами математического инструмента, меньше влияют патологические результаты пациенток с гипохромией, неизбежно попадающие в выборку. Оба вышеперечисленных подхода могут эффективно комбинироваться. Кроме того, за счет возможности метода Bhattacharya разделять общую выборку на гауссовские компоненты попутно может быть оценена и ее однородность. Это дает важную научно-практическую информацию и может повлиять на дизайн самого исследования. С практической точки зрения примененный подход явился рациональным и объективным способом разработки рабочих РИ для лаборатории крупного многопрофильного стационара, не располагающей возможностями массового привлечения здоровых амбулаторных пациентов.
Сведения об авторах
Ивойлов О.О. — https://orcid.org/0000-0002-4684-8440
Максимова Н.Л. — https://orcid.org/0000-0003-2877-545X
Криворучко А.Б. — https://orcid.org/0000-0003-2035-4888
Иванов А.М. — https://orcid.org/0000-0002-8899-7524
Ивойлов О.О., Максимова Н.Л., Криворучко А.Б., Иванов А.М. Практические подходы к установлению референтных интервалов эритроцитов на основе данных пациентов. Лабораторная служба. 2019;8(2):17-24. https://doi.org/10.17116/labs2019802117
Автор, ответственный за переписку: Ивойлов Олег Олегович — e-mail: kbld@mail.ru; тел.: +7(916)081-2631; https://orcid.org/0000-0002-4684-8440
Corresponding author: Ivoylov O.O. — e-mail: kbld@mail.ru; tel.: +7(916)081-2631; https://orcid.org/0000-0002-4684-8440