Высокопроизводительное секвенирование как инструмент для детектирования и идентификации патогенов в клиническом материале
Журнал: Лабораторная служба. 2024;13(4): 49‑56
Прочитано: 1089 раз
Как цитировать:
На протяжении всей истории человечества инфекционные заболевания являлись ведущей причиной смертности [1], оставаясь серьезной проблемой здравоохранения и в настоящее время. По данным ВОЗ, заболевания инфекционного генеза входят в пятерку основных причин смертности в мире, доходя до первой по значимости позиции в развивающихся странах [2]. Пандемия COVID-19, затронувшая около 9,7% населения Земли (более 776 млн случаев на 8 сентября 2024 г.) [3], суммарный экономический ущерб от которой только в первый год оценивают в $35 трлн [4], показала необходимость реорганизации и развития подходов к анализу случаев заболеваний неясной этиологии. Рутинные диагностические исследования, в основном основанные на ПЦР либо использующие иммунологические или микробиологические подходы, постоянно оптимизируются и дорабатываются, однако в целом позволяют выявлять ограниченный спектр известных и хорошо охарактеризованных патогенов [5]. Поэтому в современных условиях стремительного распространения патогенов в совокупности с их способностью к генетической изменчивости секвенирование стало незаменимым инструментом для эпидемиологического мониторинга и разработки эффективных стратегий в борьбе в возникающими вспышками инфекционных заболеваний. Развитие технологий секвенирования в реальном времени дало возможность практически мгновенного получения генетической информации [6]. В совокупности с быстрыми методиками пробоподготовки и упрощенными протоколами, не требовательными к лабораторным условиям, технологии секвенирования становятся мощным оружием полевой эпидемиологии, позволяя оперативно и достоверно идентифицировать новые патогенные штаммы и выявлять их генетические особенности [7].
Сегодня данные, получаемые посредством высокопроизводительных платформ секвенирования, используются для мониторинга динамики распространения патогенных микроорганизмов и вирусов, анализа их генетической структуры и изменчивости, построения филогенетических связей между генетическими линиями и реконструкции путей их перемещения, позволяя осуществлять расшифровку вспышек инфекционных заболеваний более точно по сравнению с традиционными подходами [8]. Кроме того, высокопроизводительное секвенирование является единственным доступным молекулярно-генетическим методом выявления и изучения новых, неизвестных ранее патогенов [9]. Поэтому данные методы все чаще находят применение в клинической микробиологии, в особенности при исследовании материала от пациентов с иммуносупрессией, для выявления неожиданных или новых патогенных микроорганизмов [10].
Для интеграции высокопроизводительного секвенирования в современные клинико-диагностические процессы необходимо учитывать множество факторов, начиная с выбора оптимальных секвенирующих платформ и заканчивая усовершенствованием алгоритмов обработки и интерпретации данных. Различные поколения технологий секвенирования предоставляют широкие возможности для молекулярного профилирования патогенов, применение которых определяется спецификой исследуемого материала и задачами диагностики. Более того, существуют различные методологические подходы к секвенированию, такие как метагеномные и таргетные стратегии, каждая из которых имеет свои преимущества в определенных задачах инфекционной диагностики. Важно отметить, что рынок технологий для идентификации патогенов динамично развивается, предлагая все более передовые решения. Однако масштабное внедрение этих технологий в рутинную лабораторную практику осложняется проблемами, связанными с процессами стандартизации и сертификации оборудования и реагентов, доступных для клинического применения, трудностями в оптимизации сложных биоинформатических методов для проведения анализа больших объемов данных в клинических условиях, а также с высокими экономическими затратами на их внедрение и эксплуатацию.
Традиционно выделяют три поколения технологий секвенирования. Первым поколением считаются появившиеся в 70-х годах XX века методы, основанные на химической деградации и остановке синтеза полинуклеотидной цепи, — секвенирование по методу Сэнгера. Несмотря на то что метод по-прежнему актуален во многих областях молекулярной генетики, его основное ограничение — низкая производительность делает его малоэффективным для клинических задач, требующих анализа большого объема материала.
Ко второму поколению, или секвенированию нового поколения (NGS от англ. next generation sequencing или HTS — high throughput sequencing), относят различные коммерческие технологии массового параллельного секвенирования (табл. 1). Их высокая производительность и точность являются ключевыми преимуществами, обуславливающими применение в диагностике генетических заболеваний, онкологии, репродуктивной медицине, а также в целях диагностики инфекционных заболеваний [11]. Данные технологии позволяют не только идентифицировать патогены, но и выявлять ключевые генетические особенности, включая мутации, маркеры резистентности и факторы вирулентности [12]. Такой подход предоставляет значительную клиническую ценность, позволяя оперативно корректировать лечение и обоснованно выбирать стратегии терапии [13]. Даже с учетом высоких затрат на оборудование и реагенты стоимость NGS остается относительно низкой за счет большого объема получаемых данных, что делает эту технологию экономически оправданной для клинического применения [14].
Сравнительная таблица секвенирующих платформ, доступных в РФ, с указанием их технических характеристик
| Производитель | Платформа | Макс. выход | Кол-во бактериальных геномов* | Макс. длина прочтения | Пороговое качество данных*** | Время работы |
| Платформы второго поколения | ||||||
| Illumina | iSeq 100 | 1.2 Gb | 2.4 | 2·150 bp | Q30 | 9.5—19 ч |
| MiniSeq | 7.5 Gb | 15 | 2·150 bp | Q30 | 5—24 ч | |
| MiSeq | 15 Gb | 30 | 2·300 bp | Q30 | 4—56 ч | |
| NextSeq 550 | 120 Gb | 240 | 2·150 bp | Q30 | 12—30 ч | |
| NextSeq 1000/2000 | 360 Gb | 720 | 2·300 bp | Q30 | 11—48 ч | |
| NovaSeq 6000 | 6000 Gb | 12 000 | 2·250 bp | Q30 | 13—45 ч | |
| NovaSeq X | 16 000 Gb | 32 000 | 2·150 bp | Q30 | 13—48 ч | |
| Ion Torrent™ | Gene Studio S5 | 15 Gb | 30 | 600 bp | Q20 | 4.5—19 ч. |
| Gene Studio S5 Plus | 30 Gb | 60 | 600 bp | Q20 | 3—11.5 ч | |
| Gene Studio S5 Prime | 50 Gb | 100 | 600 bp | Q20 | 3—8.5 ч | |
| MGI Tech Co., Ltd. (MGI) | DNBSEQ-G99 | 48 Gb | 96 | 2·150 bp | Q30 | 5—12 ч |
| DNBSEQ-G50 | 150 Gb | 300 | 2·150 bp | Q30 | 9—40 ч | |
| DNBSEQ-G400 | 1440 Gb | 2880 | 2·300 bp | Q30 | 13—109 ч | |
| DNBSEQ-T7 | 6000 Gb | 12 000 | 2·150 bp | Q30 | 24 ч | |
| DNBSEQ-T10 | 76 800 Gb | 153 600 | 2·150 bp | Q30 | 96—106 ч | |
| DNBSEQ-T20 | 72 000 Gb | 144 000 | 2·150 bp | Q30 | 60—80 ч | |
| GeneMind | FASTASeq 300 | 60 Gb | 120 | 2×300 bp | Q30 | 5.5—48 ч |
| GenoLab M | 150 Gb | 300 | 2·150 bp | Q30 | 13—50 ч | |
| SURFSeq 5000 | 2200 Gb | 4400 | 2·150 bp | Q30 | 12—38 ч | |
| Salus BioMed | Saluseq Nimbo | 18 Gb | 32 000 | 2·150 bp/400 bp | Q30 | 3.4—12 ч |
| Salus Pro | 600 Gb | 1200 | 2·150 bp | Q30 | 4.8—42 ч | |
| Salus EVO | 2000 Gb | 4000 | 2·150 bp | Q30 | 8—24 ч | |
| Sikun | Sikun 500 | 50 Gb | 1000 | 2·150 bp | Q30 | 3,5—24 ч |
| Sikun 1000 | 100 Gb | 2000 | 2·150 bp | Q30 | 3,5—24 ч | |
| Sikun 2000 | 200 Gb | 4000 | 2·150 bp | Q30 | 3,5—24 ч | |
| Платформы третьего поколения | ||||||
| Pacific Biosciences | Revio | 90 Gb | 180 | 15—18 kbp | Q30 | 24 ч |
| Sequel | 10 Gb | 20 | 15—20 kbp | Q30 | 20 ч | |
| Sequel II | 80 Gb | 160 | 15—20 kbp | Q30 | 30 ч | |
| Oxford Nanopore Technologies | MinION | 50 Gb | 100 | 200 bp — 4 Mbp | Q20 | 10 мин — 72 ч** |
| GridION | 250 Gb | 500 | 200 bp — 4 Mbp | Q20 | 10 мин — 72 ч** | |
| P2 | 580 Gb | 1160 | 200 bp — 4 Mbp | Q20 | 10 мин — 72 ч** | |
| PromethION 24 | 7000 Gb | 14 000 | 200 bp — 4 Mbp | Q20 | 10 мин — 72 ч** | |
| PromethION 48 | 14 000 Gb | 28 000 | 200 bp — 4 Mbp | Q20 | 10 мин — 72 ч** | |
| Нанопорус | Нанопорус | 50 Gb | 100 | 200 bp — 4 Mbp | Q20 | 10 мин — 72 ч** |
| MGI Tech Co., Ltd. (MGI) | CycloneSEQ | 50Gb | 100 | 100 bp — 1 Mbp | Q8 | 10 мин — 72 ч** |
| QiTan Tech | QNome-3841 | 5 Gb | 10 | 200 bp — 4 Mbp | Q8 | 1 мин — 72 ч** |
| QNome-3841hex | 30 Gb | 60 | 200 bp — 4 Mbp | Q8 | 1 мин — 72 ч** | |
Примечание. * — эквивалент производительности платформы, выраженный в количестве одновременно секвенированных бактериальных геномов размером 5 Mbp со средним покрытием 100×; ** — генерация данных в режиме реального времени с началом регистрации последовательностей через несколько минут с момента инициализации процесса секвенирования; *** — минимальный уровень точности прочтения нуклеотидов, при котором данные считаются приемлемыми для анализа. Обычно измеряется с помощью Q-score (оценки качества): например, Q20 указывает на вероятность ошибки 1 на 100 (точность 99%), а Q30 — 1 на 1000 (точность 99,9%).
Тем не менее ни один из существующих сегодня методов NGS не позволяет получить прочтения длиной больше 600 нуклеотидов (см. табл. 1), и, следовательно, исследуемая ДНК должна подвергаться значительной фрагментации. Кроме того, для усиления сигнала до детектируемого платформами второго поколения уровня используется ферментативная амплификация фрагментированного генетического материала. Это неизбежно приводит к сдвигам в представленности отдельных участков анализируемой ДНК и неравномерному покрытию участков генома.
Третье поколение технологий — одномолекулярное секвенирование не требует значительной фрагментации и амплификации молекул ДНК. Из всех имеющихся на рынке технологий (см. табл. 1) наибольшую популярность получила технология нанопорового секвенирования, которая за одно десятилетие значительно расширила спектр применения в различных областях биологии и медицины за счет своей высокой точности, скорости и доступности. Благодаря возможности чтения длинных фрагментов нанопоровое секвенирование нашло широкое применение в геномике, в частности в устранении пробелов и усовершенствовании референсных геномов [15]; внесен большой вклад в пополнение базы геномов вирусов, бактерий и других живых организмов [16,17]. Также распространенным направлением применения данного метода является секвенирование РНК, позволяющее анализировать полный состав транскриптов [18], изучать механизмы репликации патогенов и их взаимодействия с клеткой-хозяином [19]. Развитие секвенирования третьего поколения привело к существенно новому уровню изучения метагеномов и исследования эволюции, разнообразия и функционирования экосистем [20].
На российском рынке представлены все современные технологии секвенирования и использующие их платформы, предназначенные для применения в клинических и исследовательских целях. Каждая из этих систем обладает различными характеристиками по количеству генерируемых данных, скорости их получения и точности секвенирования; оптимизируется как для целевого секвенирования небольших участков генома, так и для проведения полноразмерного геномного анализа. Это позволяет адаптировать их использование под конкретные диагностические или научные задачи. При этом выбор конкретной платформы должен быть основан на специфике и объеме задач. Немаловажным является также наличие у секвенирующей платформы регистрационного удостоверения Росздравнадзора. В таблице представлены основные характеристики всех платформ, доступных в РФ, включая их производительность, скорость работы и качество секвенирования.
Существует два принципиально разных подхода для молекулярной диагностики инфекционных заболеваний: метагеномное и таргетное секвенирование. Методологии различаются по технологическим требованиям, особенностям пробоподготовки и глубине охвата генетического материала, что определяет их специфичность и целесообразность применения в различных клинических сценариях.
Технология метагеномного секвенирования позволяет исследовать полную генетическую информацию микроорганизмов и вирусов, содержащихся в биоматериале, что исключает необходимость предварительной гипотезы о наличии того или иного патогена [10]. Основное преимущество метагеномного подхода заключается в его универсальности, поскольку технология позволяет выявлять широкий спектр патогенов различной природы — от бактерий и вирусов до грибов и простейших. Этот подход эффективно используется при диагностике инфекций неизвестной этиологии, включая сепсис, менингит, пневмонии, острые кишечные инфекции и другие [21]. Методология открывает возможности для выявления как известных, так и ранее неописанных патогенов, включая редкие и трудно культивируемые микроорганизмы, что критически важно для диагностики заболеваний, вызванных мультифакторными инфекциями [22]. Метагеномное секвенирование также используется для изучения антибиотикорезистентности в микробных популяциях и отслеживания эволюции патогенов в реальном времени [23]. Данная технология демонстрирует широкий спектр возможностей в области клинической диагностики и микробиологии, поскольку способствует углубленному пониманию роли микробных экосистем в патогенезе и здоровье человека [24].
Основной проблемой метагеномного секвенирования являются высокие требования к качеству исходного биологического материала, поскольку даже небольшие загрязнения или незначительная деградация образцов могут значительно повлиять на результаты анализа. Это обусловлено тем, что в метагеномных исследованиях проводится секвенирование всей ДНК, присутствующей в образце, включая как целевые микроорганизмы, так и фоновые контаминанты. Такой подход требует тщательной пробоподготовки и строгого контроля качества образцов для получения достоверных данных [25]. Дополнительно отсутствие стандартизированных протоколов для проведения метагеномных исследований, а также отсутствие унифицированных и лицензированных наборов реагентов, предназначенных для клинического использования, создают серьезные барьеры для их повсеместного внедрения. Это осложняется необходимостью применения сложных биоинформатических методов для обработки больших объемов данных, что также является препятствием для использования технологии в клинических учреждениях с ограниченными ресурсами [26].
Таргетное секвенирование фокусируется на заранее определенных участках геномов, что позволяет более успешно детектировать известные патогены и специфические генетические маркеры, такие как фрагменты геномов возбудителей широко распространенных вирусных и бактериальных инфекций и гены резистентности к антибиотикам [27]. Этот метод обладает высокой чувствительностью и достоверностью, а также экономической эффективностью, что делает его подходящим для быстрого выявления возбудителей, особенно в условиях эпидемий [28]. Данная технология наиболее востребована в областях клинической диагностики, где требуется оперативное выявление инфекционного агента для назначения действенного лечения, а также в исследованиях, направленных на детекцию полиморфизмов и мутаций, ассоциированных с наследственными генетическими заболеваниями, развитием онкологических процессов, а также генетических изменений, определяющих индивидуальную чувствительность пациента к терапии [29]. Однако ограничение применения таргетного секвенирования связано с невозможностью обнаружения новых или недостаточно охарактеризованных патогенов, что может быть критичным при диагностике мультифакторных инфекций или сложных клинических случаев [27].
Для преодоления данного ограничения было разработано инновационное решение, основанное на технологиях таргетного секвенирования, однако предлагающее широкий спектр одновременно исследуемых патогенов, с возможностью выявление новых, неизвестных ранее [30]. Система предполагает использование универсального биоинформатического алгоритма анализа, который позволяет автоматически проводить поиск возможных маркерных областей для дизайна таргетных мультипраймерных панелей на выбранную группу патогенов [31]. При этом группы могут быть очень широкими, например все вирусы, вызывающие респираторные заболевания. Таким образом, для задач исследования в автоматическом режиме разрабатывается библиотека олигонуклеотидов, позволяющая проводить исследование сразу всех значимых патогенов. Так, были разработаны мультиплексные праймерные панели для таргетного секвенирования, которые включают решения для точной идентификации возбудителей бактериальных, респираторных [32], острых кишечных инфекций, а также нейроинфекций, что существенно расширяет возможности точной и своевременной диагностики в этих областях [30, 33]. Подобный подход был также успешно применен в задачах мониторинга природных резервуаров инфекций [34]. Кроме того, было показано, что данный подход не только обеспечивает выявление широко известных возбудителей, но также позволяет обнаруживать менее изученные или даже новые инфекционные агенты [35, 36].
Важнейшая цель обработки данных — это корректная идентификация патогенных агентов и их отделение от генетического материала хозяина. Этот процесс требует применения специализированных алгоритмов и инструментов, таких как геномные базы данных, биоинформатические инструменты и методы машинного обучения [37]. Комплексный подход к обработке метагеномных данных позволяет не только выявить патогенные последовательности, но и исследовать их роль в экосистемах, эволюцию и возможное взаимодействие с другими микроорганизмами.
Большинство современных пайплайнов содержат следующие этапы: тримминг данных — удаление низкокачественных оснований, адаптеров и других артефактных элементов из секвенированных прочтений [38]; этап сборки протяженных геномных последовательностей, оптимизированный для работы с короткими [39] или длинными прочтениями [40]; таксономическая идентификация — сопоставление полученных последовательностей с ранее известными с использованием одного из алгоритмов [41]; получение финального отчета о проведенном исследовании. В результате работы программ генерируется детализированный отчет, содержащий информацию о найденных патогенах. Помимо таксономических данных отчет может включать функциональную аннотацию, которая помогает определить биологические роли идентифицированных патогенов. Важно, что отчет содержит также качественные показатели для каждого обнаруженного генома, включая оценку качества последовательностей и возможные примеси от других организмов. В таком случае этот отчет позволит исследователям не только идентифицировать патогены, но и оценить надежность данных, предоставляя основу для дальнейших исследований [42].
Примером такого комплексного решения может служить программа Pathogenid — универсальный биоинформатический конвейер обработки данных секвенирования [43]. Программа способна обрабатывать 4 различные задачи: задачу анализа прочтений на наличие нуклеиновых кислот бактериальных, грибковых и вирусных патогенов, а также анализ прочтений на наличие генетических детерминантов лекарственной устойчивости. Программа обрабатывает сырые данные, поступающие с высокопроизводительных платформ секвенирования как второго, так и третьего поколений, и на выходе предоставляет пользователю финальный детализированный отчет, содержащий результаты исследования, а также полный спектр метрик качества классификации.
Несмотря на стремительное развитие технологии секвенирования и ее значительный потенциал в медицинской диагностике, широкий переход к рутинному применению методики в клиническую практику сопряжен с рядом значительных барьеров, как технологических, так и экономических. Одной из ключевых проблем является отсутствие широкого спектра доступного и стандартизированного оборудования и наборов реагентов, прошедших клинические испытания, соответствующих нормативным требованиям и зарегистрированных для клинического применения [44].
Кроме того, внедрение секвенирования в рутинную клиническую практику осложняется экономическими факторами, при этом их характер зависит от типа и поколения секвенирования. Ключевые проблемы связаны с высокими затратами на оборудование и наборы зарегистрированных реагентов, сложностью интеграции данных в существующие системы здравоохранения, требованиями к высокой квалификации специалистов, а также с вопросами стандартизации, интерпретации и хранения получаемых данных [45]. Кроме того, для каждой клинической задачи требуется индивидуальный подход к выбору и применению лабораторных методик проведения секвенирования, что усложняет процесс обучения и подготовки персонала к выполнению узкопрофильных процедур.
Для анализа данных NGS требуются мощные вычислительные ресурсы, при этом существует два подхода к их организации: использование локальных вычислительных серверов для обработки данных на месте; использование облачных сервисов, таких как Yandex Cloud. Первый вариант приводит к необходимости закупки и обслуживания дорогостоящего оборудования, а второй — к необходимости включения в бюджет лаборатории дополнительной оплаты подписок на облачные сервисы, что чаще всего в долгосрочной перспективе превышает стоимость локально устанавливаемого оборудования. Помимо этого, стоимость лицензированного оборудования для технологии NGS остается высокой, а требования к регулярному обновлению программного обеспечения и переподготовке персонала увеличивают общие расходы на его поддержание [46]. Биоинформатикам для разработки и использования сложных аналитических алгоритмов, таких как выравнивание прочтений, идентификация вариантов и интерпретация результатов, необходимо овладеть рядом специализированных инструментов. Медицинским специалистам для интерпретации биологических выводов на основе NGS-данных требуется подготовка в области молекулярной генетики и геномной медицины. Они должны понимать основные принципы NGS и быть способны трактовать результаты в клиническом контексте [25].
Технологии третьего поколения, в частности нанопоровые платформы, обладают уникальными преимуществами благодаря возможности проводить секвенирование в реальном времени с минимальными требованиями к пробоподготовке. Однако технология имеет ограниченное применение в клинической практике из-за низкой точности получаемых данных в сравнении с предшествующими поколениями [47]. Этот фактор имеет критическое значение в таких областях медицины, как онкогенетика, диагностика наследственных заболеваний и неонатальная скрининговая диагностика. В этих случаях требуется высокая точность для определения геномных мутаций и полиморфизмов, а любые ошибки могут привести к ложным диагнозам и неверному выбору лечения [48]. Проблемы с точностью также затрудняют секвенирование патогенов, для которых достоверное определение геномных вариаций существенно важно для оценки лекарственной устойчивости и разработки терапевтических стратегий. Тем не менее с развитием технологии и разработки новых версий проточных ячеек точность получаемых данных повышается [49]. Это открывает перспективы для более широкого применения нанопорового секвенирования в клинической практике в будущем, особенно в тех направлениях, в которых ключевое значение имеет скорость, а не точность анализа. Кроме того, для всех видов секвенирования сохраняется актуальность этических вопросов. Защита персональных данных пациентов и обеспечение соответствия международным нормативам требуют строгих протоколов для использования генетической информации в клинической практике [50]. Регулирование в этой области направлено на предотвращение возможного несанкционированного использования данных и минимизацию рисков нарушения конфиденциальности.
Современные технологии секвенирования открывают широкие перспективы для клинической диагностики инфекционных заболеваний неясной этиологии, поскольку высокая точность и универсальность методов позволяет идентифицировать широкий спектр патогенов. Однако масштабное применение секвенирования сопровождается рядом вызовов, основную роль среди которых играют сложность обработки больших массивов данных и необходимость их быстрой и достоверной интерпретации в условиях реальной клинической практики. Это требует создания специализированных биоинформатических решений, которые обеспечат автоматизацию анализа и улучшат качество алгоритмов интерпретации. Для полного раскрытия потенциала этих технологий необходимо не только развитие программного обеспечения, но и стандартизация методологических подходов, а также расширение спектра доступного лицензированного диагностического оборудования и материалов для проведения лабораторных протоколов. Важным аспектом также остается экономическая доступность и этическое регулирование, особенно при работе с генетической информацией пациентов. Таким образом, дальнейшее перспективы этих методов в клинической практике будут зависеть от их способности развиваться в сторону более производительных, экономически оправданных и технологически надежных решений, удовлетворяющих строгим требованиям клинической диагностики.
Авторы заявляют об отсутствии конфликта интересов.
Литература / References:
Подтверждение e-mail
На test@yandex.ru отправлено письмо со ссылкой для подтверждения e-mail. Перейдите по ссылке из письма, чтобы завершить регистрацию на сайте.
Подтверждение e-mail
Мы используем файлы cооkies для улучшения работы сайта. Оставаясь на нашем сайте, вы соглашаетесь с условиями использования файлов cооkies. Чтобы ознакомиться с нашими Положениями о конфиденциальности и об использовании файлов cookie, нажмите здесь.