Недостатки, ограничения и ошибки NGS
Неисчерпывающие списки генов в наборах обогащения.
Пробоподготовка
Дубликаты
Потеря аллеля
Дыры в покрытии
Беспощадная химия
GC-контент
Повторы
Приборные ошибки
Приборные ошибки
Ошибки на гомополимерах
Падение качества прочтения к концу рида
Все ошибаются по-своему
Контроль качества прочтений
Загрязнение адаптерами
Strand bias
Ошибки выравнивания
Неоднозначность выравнивания
Картирование за пределы таргета
Перевыравнивание инделов
Ошибки интерпретации
Противоречивые базы данных
ClinVar
Такие противоречивые скоры
Такие противоречивые скоры
Фундаментальный недостаток знаний
18.46M
Category: programmingprogramming

Недостатки, ограничения и ошибки NGS

1. Недостатки, ограничения и ошибки NGS

Андрей Афанасьев

2.

3. Неисчерпывающие списки генов в наборах обогащения.

4. Пробоподготовка

миллион способов накосячить

5. Дубликаты

• ПЦР-дубликаты из
пробоподготовки
• Оптические дубликаты:
дважды прочитанный
секвенатором кластер

6. Потеря аллеля

7. Дыры в покрытии

8. Беспощадная химия

9. GC-контент

10. Повторы

11. Приборные ошибки

12. Приборные ошибки

454
Illumina
Ion torrent
PACBIO RSII
Процент ошибок (%)
~1
~0,1
~1
~10

13. Ошибки на гомополимерах

14. Падение качества прочтения к концу рида

• Kircher et al. Genome Biology 2009 10:R83

15. Все ошибаются по-своему

Ion Torrent
Гомополимеры
PacBio
Высокий процент ошибок
(зато случайный)
Illumina
Зависимость от GC-контента
Complete Genomics
Неравномерное покрытие

16. Контроль качества прочтений

17.

18. Загрязнение адаптерами

19. Strand bias

20. Ошибки выравнивания

21. Неоднозначность выравнивания

22. Картирование за пределы таргета

23. Перевыравнивание инделов

24. Ошибки интерпретации

25. Противоречивые базы данных

26. ClinVar

• As of May 4, 2015 (according to the NEJM report), ClinVar contains
172,055 variant submissions across 22,864 genes from 314
submitters—35 of which have deposited more than 50 genetic
variants with medical interpretation into ClinVar.
• More than 118,000 of the unique variants have clinical
interpretations, though 21% of those interpretations are clinical
question marks—variants of uncertain significance.
• Only 11% of the variants with clinical interpretations have been
submitted by more than one lab, the first step in arriving at a
consensus. For 17% of those, the interpretations do not agree.

27.

28. Такие противоречивые скоры

29. Такие противоречивые скоры

30. Фундаментальный недостаток знаний

English     Русский Rules