Фенилкетонурия (ФКУ) — аутосомно-рецессивное заболевание обмена веществ, связанное с недостаточной активностью фермента фенилаланингидроксилазы (ФАГ). ФКУ характеризуется нарушением умственного развития, а также может сопровождаться такими симптомами, как атопический дерматит, аутизм, задержка моторного развития, судороги. Психомоторные нарушения появляются с первых месяцев жизни ребенка [1].Частота ФКУ значительно варьирует в зависимости от популяции: средняя частота в РФ, по данным неонатального скрининга, составляет 1:7000 новорожденных [2].
Причиной развития ФКУ являются патогенные мутации в гене ФАГ (PAH). В настоящее время описано более 1100 вариантов нуклеотидной последовательности гена PAH [3]. Частота и спектр патогенных вариантов может варьировать в зависимости от региона и этнической принадлежности [4, 5]. По данным молекулярно-генетических исследований, проводившихся среди больных ФКУ в различных областях РФ, наиболее частыми являются варианты: R408W (rs5030858), Y414C (rs5030860), P281L (rs5030851), A300S (rs5030853), IVS12+1G>A (rs5030861), IVS10-11G>A (rs5030855) R261Q (rs5030849) [5—9]. Наблюдается высокая частота гетерозиготного носительства вариантов нуклеотидной последовательности гена PAH среди здорового населения РФ и в среднем составляет 1:35 [10, 11]. Однако популяционные исследования ранее не проводились. Все это делает актуальным изучение состава и частоты полиморфных вариантов, вызывающих развитие ФКУ, в различных регионах России, а также поиск метода, пригодного для проведения широкого скрининга не только в семьях высокого риска, но и у людей с неотягощенным семейным анамнезом, планирующих беременность. В связи с этим целью данного исследования была разработка специализированной панели для диагностики гетерозиготного носительства вариантов нуклеотидной последовательности гена PAH и ее апробация на популяционной выборке ЭССЕ-Вологда.
Материал и методы
Участники исследования. В исследование случайным образом было включено 642 человека из популяционной выборки (1642 человека, возраст 25 лет —64 года) исследования «Эпидемиология сердечно-сосудистых заболеваний в различных регионах Российской Федерации» (ЭССЕ-РФ), проведенного в Вологодской области (ЭССЕ-Вологда). Взятие крови из локтевой вены проводили натощак после 12 ч голодания. Образцы биологического материала замораживали и хранили при температуре не выше –20 °C до момента отправки в федеральный координационный центр (ФГБУ «Национальный медицинский исследовательский центр профилактической медицины» Минздрава России), для проведения анализов крови. Кровь собирали в пробирки с ЭДТА. Исследование было выполнено в соответствии со стандартами надлежащей клинической практики (Good Clinical Practice) и принципами Хельсинкской декларации. Исследование было одобрено этическими комитетами федерального и регионального центров. Информированное согласие на участие в исследовании пациенты подписывали на этапе проведения ЭССЕ-Вологда.
Молекулярно-генетическое тестирование, разработка диагностических панелей для моногенных заболеваний. Выделение ДНК проводили с помощью набора QIAamp DNA Blood Mini Kit (Qiagen, Германия). Концентрацию ДНК определяли на спектрофотометре NanoPhotometer (Implen, Германия). Панели для генетической диагностики с помощью ПЦР в реальном времени были разработаны для анализа на приборе Quant Studio 12K Flex Real-Time PCR System (Thermo Fisher Scientific, США), который себя хорошо зарекомендовал в качестве высокопроизводительного при генотипировании и анализе экспрессии генов [12]. По рекомендациям фирмы-производителя необходимая для системы Quant Studio 12K Flex Real-Time PCR концентрация ДНК составляет 50 нг/мкл, кроме того требуется оценка чистоты образцов ДНК на спектрофотометре и соотношение показателей A260/A280 и A260/A230 должно быть между 1,7 и 1,9. Было выявлено, что при концентрации образцов ДНК менее 10 нг/мкл в среднем доля выявленных генотипов (call rate) составляет 50%, что является низким показателем для такого метода. Для концентраций выше 10 нг/мкл доля выявленных генотипов составляла в среднем 90%, оптимальной была концентрация 30—50 нг/мкл. Анализ проводили с использованием методики TaqMan (Thermo Fisher Scientific, США) согласно протоколам производителя. Найденный вариант подтверждался методом секвенирования по Сэнгеру на Applied Biosystem 3500 (Thermo Fisher Scientific, США) с использованием реактивов и протоколов фирмы-производителя.
Результаты и обсуждение
Создание перечня генетических вариантов гена PAH для диагностической панели. Для создания панели были использованы данные о частотах патогенных вариантов PAH, выявленных в проведенных ранее исследованиях больных ФКУ в Воронеже, Самаре, Курске, Москве, Ростовской и Московской областях и Центральном регионе России [5—9, 13, 14], а также данные о частотах гетерозиготного носительства вариантов PAH в различных когортах жителей РФ [10, 11]. После анализа данных спектра и распространенности патогенных вариантов, отбирали наиболее частые и характерные для российской популяции. Всего в диагностическую панель вошло 23 варианта нуклеотидной последовательности гена PAH (табл. 1). Наиболее частые из них: R408W — частота среди больных в разных регионах России варьирует от 47,9 до 75%, IVS12+1G>A (от 3,3 до 4,2%), R158Q (от 1,5 до 2,7%), R261Q (от 0,7 до 9,9%), P281L (от 0,7 до 9,1%), R252W (от 1,7 до 2,2%), IVS4+5G>T и Y414C (от 0,8 до 2,8%). Эффективность детекции носителей (detection efficiency of carriers или detection rate) с помощью данной панели составляет примерно 90%.
Таблица 1. Аннотация вариантов нуклеотидных последовательностей гена PAH, включенных в диагностическую панель
№ | Мутация в гене РАН | rs ID | Аннотация | ID зонда | Аллельная частота ExAC | Аллельная частота у европейцев (кроме финов) ExAC | Частота у российских пациентов с ФКУ (%) | Регион исследования |
1 | R408W | rs5030858 | missense | C__32329998_10 | 0,0006594 | 0,001109 | 62,31 | Ростовская область [8] |
48,6 | Центральный регион [6] | |||||||
55,4 | Воронеж [13] | |||||||
50 | Самара [13] | |||||||
50 | Московская область [13] | |||||||
75 | Курск [13] | |||||||
47,9 | Москва [9] | |||||||
2 | A403V | rs5030857 | missense | C__27863418_20 | 0,0005358 | 0,0009294 | 1,1 | Центральный регион [6] |
0,4 | Ростовская область [7] | |||||||
3 | Y414C | rs5030860 | missense | ANGZJJD | 0,0004945 | 0,0008243 | 2,8 | Москва [9] |
0,4 | Ростовская область [7] | |||||||
0,8 | Центральный регион [6] | |||||||
4 | A300S | rs5030853 | missense | C__27863387_20 | 0,0004462 | 0,0007209 | 0,7 | Москва [9] |
0,79 | Ростовская область [7] | |||||||
5 | IVS12+1G>A | rs5030861 | splice donor | C__32329996_10 | 0,0003465 | 0,0006 | 3,85 | Ростовская область [8] |
3,97 | Ростовская область [7] | |||||||
3,3 | Центральный регион [6] | |||||||
4,2 | Москва [9] | |||||||
6 | R261Q | rs5030849 | missense | AN9HNAZ | 0,0002719 | 0,0004196 | 3,85 | Ростовская область [8] |
3,57 | Ростовская область [7] | |||||||
6,5 | Самара [13] | |||||||
6,3 | Курск [13] | |||||||
0,7 | Данные МГНЦ3 [13] | |||||||
5,3 | Центральный регион [6] | |||||||
9,9 | Москва [9] | |||||||
7 | IVS10-11G>A | rs5030855 | intron variant | C__32330003_20 | 0,0002727 | 0,0004053 | 3,85 | Ростовская область [8] |
2,2 | Центральный регион [6] | |||||||
8 | R158Q | rs5030843 | missense | C__32330008_10 | 0,00009896 | 0,00018 | 2,69 | Ростовская область [8] |
2,7 | Воронеж [13] | |||||||
2,2 | Самара [13] | |||||||
1,5 | Данные МГНЦ3 [13] | |||||||
2,5 | Центральный регион [6] | |||||||
3,5 | Москва [9] | |||||||
9 | P281L | rs5030851 | missense | C__27863379_10 | 0,00009884 | 0,0001798 | 2,69 | Ростовская область [8] |
5 | Центральный регион [6] | |||||||
2,7 | Воронеж [13] | |||||||
4,3 | Самара [13] | |||||||
9,1 | Московская область [13] | |||||||
6,3 | Курск [13] | |||||||
7,5 | Данные МГНЦ3 [13] | |||||||
0,7 | Москва[9] | |||||||
10 | L48S | rs5030841 | missense | C__61900229_20 | 0,00008238 | 0,0001499 | 2,1 | Москва [9] |
0,4 | Ростовская область [7] | |||||||
1,7 | Центральный регион [6] | |||||||
11 | R243X | rs5030846 | stop gained | C__27863366_10 | 0,00004952 | 0,0000901 | 1,4 | Центральный регион [6] |
0,4 | Ростовская область [7] | |||||||
12 | R252W | rs5030847 | missense | C____657294_10 | 0,00004945 | 0,00008995 | 1,92 | Ростовская область [8] |
2,2 | Самара [13] | |||||||
1,5 | Данные МГНЦ3 [13] | |||||||
1,7 | Центральный регион [6] | |||||||
2,1 | Москва [9] | |||||||
13 | S349P | rs62508646 | missense | ANCE79N | 0,00003332 | 0,00004534 | ||
14 | IVS2+5G>C | rs62507288 | splice region | ANAAENR | 0,0000412 | 0,00004496 | 0,6 | Центральный регион [6] |
15 | E280K | rs62508698 | missense | ANDJ2UK | 0,00004118 | 0,00004495 | 0,7 | Москва [9] |
0,8 | Центральный регион [6] | |||||||
16 | IVS4+5G>T | rs62507321 | splice region | C__89758964_10 | 0,00004118 | 0,00004495 | 2,8 | Москва [9] |
0,79 | Ростовская область [7] | |||||||
1,1 | Центральный регион [6] | |||||||
17 | R243Q | rs62508588 | missense | C__64676825_10 | 0,00007428 | 0,00003003 | 0,8 | Центральный регион [6] |
18 | R111X | rs76296470 | stop gained | C__33221788_10 | 0,00004943 | 0,00002997 | 2,1 | Москва[9] |
19 | I306V | rs62642934 | missense | C__27863391_20 | 0,000008251 | 0,00001501 | 0,4 | Ростовская область [7] |
20 | c,47_48delCT | rs62642906 | frameshift | C__89759003_20 | 0,000008238 | 0,00001499 | 0,4 | Ростовская область [7] |
21 | c,664_665delGA | rs62514936 | frameshift | C_104519192_20 | 0,000008239 | 0,00001499 | 2,1 | Москва [9] |
22 | R261X | rs5030850 | stop gained | C__27528517_10 | 0,000008239 | 0,00001498 | 1,2 | Ростовская область [8] |
0,8 | Центральный регион [6] | |||||||
1,4 | Москва [9] | |||||||
23 | EX5del | Рп19::chr12:103260374-103260441 | ANH6D4A | 1,92 | Ростовская область [8] |
Примечание. MAF — частота редкого аллеля; а — MAF согласно базе данных ExAC (https://exac.broadinstitute.org/); b — MAF среди европейского населения (кроме финнов) согласно базе данных ExAC.
Обоснование выбора технологии для диагностической панели. Диагностическую панель разработали с использованием технологии Open Array (Thermo Fisher Scientific, США), с помощью которой возможно создавать форматы, позволяющие единовременно анализировать от 12 до 240 вариантов нуклеотидных последовательностей, используя систему Quant Studio 12K Flex Real-Time PCR на основе полимеразной цепной реакции (ПЦР) в реальном времени в современном формате нанофлюидного слайда. Технология Open Array обеспечивает высокую пропускную способность и низкую трудозатратность при невысокой стоимости анализа. Этот метод используется для лабораторных исследований в медицине: при изучении болезни Паркинсона [15], для анализа экспрессии генов, связанных с развитием злокачественных образований [16], а также для проведения молекулярно-генетического тестирования на наличие мутаций, связанных с потерей слуха [17].
Апробация диагностической панели на носительство гетерозиготных вариантов нуклеотидной последовательности гена PAH. Определение носительства гетерозиготных вариантов нуклеотидной последовательности гена PAH выполнили у 642 (44% мужчин) участников исследования, средний возраст которых составил 44±11 лет.
В результате исследования выявлено 17 гетерозиготных носителей вариантов, ассоциированных с ФКУ, частота в выборке — 2,65% (95% ДИ 1,55—4,21), или 1:38, что согласуется с данными другого исследования, проведенного в Москве и включающего 2168 здоровых индивидов, где частота носительства мутаций гена PAH составила 1:33 [11].
Всего было выявлено шесть гетерозиготных вариантов нуклеотидной последовательности гена PAH: R408W (rs5030858), A403V (rs5030857), I306V (rs62642934), L48S (rs5030841), IVS12+1G>A (rs5030861), R261Q (rs5030849_C_Т) (табл. 2).
Таблица 2. Результаты апробации разработанной диагностической панели на популяционной выборке ЭССЕ-Вологда, n=642
№ | Название мутации | rs ID | Частота гетерозигот, % | MAF в выборке ЭССЕ- Вологда, % | MAF (gnomAD)а, % | MAF (gnomAD-EUR)b, % |
1 | R408W | rs5030858 | 1,56 | 0,779 | 0,09 | 0,172 |
2 | A403V | rs5030857 | 0,31 | 0,156 | 0,06 | 0,074 |
3 | I306V | rs62642934 | 0,31 | 0,156 | 0,002 | 0,004 |
4 | L48S | rs5030841 | 0,16 | 0,078 | 0,01 | 0,017 |
5 | IVS12+1G>A | rs5030861 | 0,16 | 0,078 | 0,04 | 0,081 |
6 | R261Q | rs5030849_C_Т | 0,16 | 0,078 | 0,02719 | 0,04 |
Всего | — | 2,65 | — | — | — |
Примечание. MAF — частота редкого аллеля; а — MAF согласно базе данных gnomAD (https://gnomad.broadinstitute.org/); b — MAF среди европейского населения (кроме финнов) согласно базе данных gnomAD.
Средняя точность генотипирования, доля выявленных с помощью системы Quant Studio 12K Flex Real-Time PCR генотипов (call rate), составила 93,5%. Воспроизводимость результатов генотипирования оценивали на двух плашках Open Array в разные дни разными сотрудниками, с использованием разных микродозаторов. В результате доля выявленных генотипов (call rate), полученных на одной плашке, составила 93%, на второй — 99%. Воспроизводимость результатов по параллелям составила в среднем 90%.
В качестве подтверждающего метода проводили автоматическое секвенирование ДНК по Сэнгеру выборочных гетерозиготных образцов, выявленных с помощью разработанной панели, а также гомозиготных образцов дикого типа в качестве контролей. Всего было получено 15 последовательностей с прочтением с прямого и обратного праймеров, во всех случаях генотипы по 6 вариантам нуклеотидных последовательностей гена PAH подтвердились (рисунок).
Верификация результатов генотипирования с помощью секвенирования по Сэнгеру.
На хроматограммах представлены последовательности: 1 — rs5030858 (G\A); 2 — rs5030857 (G\A); 3 — rs62642934 (T/C); 4 — rs5030841 (A/G); 5 — rs5030861 (G/A); 6 — rs5030849 (C/T).
Самым распространенным среди выявленных вариантов нуклеотидной последовательности гена PAH был вариант R408W (частота гетерозигот — 1,56%), что согласуется с данными, полученными на других европейских популяциях и свидетельствующими о том, что вариант R408W является наиболее частой причиной развития ФКУ [4, 18]. R408W (rs5030858) — миссенс-мутация в 12-м экзоне, приводящая к замене аргинина на триптофан в кодоне 408. Популяционных данных о частоте гетерозигот варианта R408W в РФ нет, однако в исследовании, включающем 400 здоровых жительниц Санкт-Петербурга, показано, что частота мутации R408W составила 0,75% [19], а в исследовании, включающем 1000 доноров крови, идентифицирующих себя как русских, частота носительства варианта R408W составила 2,4% [10].
Частота гетерозиготного носительства вариантов A403V (rs5030857) и I306V (rs62642934) в нашем исследовании составила 0,31%. Частота данных мутаций среди больных Ростовской области составляет 0,4% [7].
Описано, что данные варианты связаны с легкими проявлениями ФКУ [20].
Более редкими в нашем исследовании были гетерозиготные варианты L48S (rs5030841), IVS10-11G>A (rs5030855) и R158Q (rs5030843), частота которых составила 0,16%. Вариант L48S является самой частой причиной ФКУ в Сербии, а также он распространен у турецких и итальянских пациентов с ФКУ [21]. Вариант IVS12 + 1G>A имеет европейское происхождение [22]. Его частота у больных ФКУ центрального региона РФ составляет 2,3% [14]. Вариант R261Q является вторым по встречаемости в выборке больных ФКУ Московского региона [9], в Ростовской области частота мутации R261Q у больных ФКУ составляет 3,57% [7]. Вариант R261Q один из наиболее распространенных в странах Южной Европы, а также в Нидерландах и Швейцарии [4].
Таким образом, в Вологодском регионе в среднем на каждые 38 человек приходится 1 здоровый носитель варианта нуклеотидной последовательности, связанного с развитием ФКУ. Это означает, что приблизительно 1 пара из 1400 состоит из двух носителей гетерозиготных вариантов, соответственно, риск рождения ребенка, больного ФКУ, составляет 1:5600. Снижение частоты рецессивных заболеваний можно достичь с помощью проведения преконцепционной профилактики, т.е. скрининга носительства рецессивных аллелей на этапе планирования деторождения. Прямые затраты на лечение больного с ФКУ в течение 16 лет, включающие в себя расходы на медицинские (в том числе диагностические) услуги и диетотерапию (лечебные смеси) составляют около 4,3 млн руб. [23]. В то же время при применении в терапии ФКУ, в соответствии с современными рекомендациями [24], аналога тетрагидробиоптерина (сапроптерина), затраты на лечение возрастают до 15,9 млн руб. [23]. Учитывая себестоимость скрининга на носительство вариантов, ассоциированных с развитием ФКУ, с помощью разработанной диагностической панели, составляющую около 1500 руб., преконцепционная профилактика, направленная на снижение рождаемости детей, больных ФКУ, представляется экономически целесообразной.
Заключение
В результате исследования была разработана панель для выявления гетерозиготного носительства вариантов нуклеотидной последовательности гена РАН. Полученные данные свидетельствуют о высокой частоте гетерозиготного носительства вариантов PAH в российской популяции. Метод определения генотипов с помощью системы Quant Studio 12K Flex Real-Time PCR характеризуется высокой воспроизводимостью, скоростью выполнения и имеет относительно невысокую стоимость анализа. Предложенная панель позволяет одномоментно проводить анализ по 23 вариантам гена PAH и может быть использована для скрининга носительства ФКУ.
Конфликт интересов. Все авторы заявляют об отсутствии потенциального конфликта интересов, требующего раскрытия в данной статье.
The authors declare no conflicts of interest.
Финансирование. Отсутствует.
Настоящая статья не содержит каких-либо исследований с использованием животных в качестве объектов.