1/38

Школа «Науки о данных». Введение в молекулярную биологию

1.

Школа «Науки о данных»
Трек «Биоинформатика» 25-26 апреля

2.

Введение в молекулярную биологию
Молекулярная биология для компьютерщиков
за полтора часа
Мария Попцова
зав. лаборатории биоинформатики
факультет компьютерных наук

3. Объекты в биологии

• Биологический объект - это живой организм
• Все живые тела состоят из клеток
• Клетка – элементарная единица живого
• Все клетки имеют одинаковые принципы
организации

4. Клетка-город

Объект биологии
Клетка-город

5. Клетка как город

• Внешняя стена с воротами => мембрана с
каналами
• Кремль => ядро
• Библиотека => геном
• Библиотека находится в Кремле => геном
находится в ядре
• Роботы => белки
• В книгах библиотеки (геноме) содержатся
инструкции как делать роботов (белки)

6. Why do we need genome? The inner life of the cell

https://www.youtube.com/watch?v=wJyUtbn0O5Y

7. ЧТО ТАКОЕ ГЕНОМ?

• Для биолога
Ряд Нобелевских
• Для биоинформатика
премий 1950-1970

8. Геномы разных органзимов

9. Вторичная структура – альфа-спираль и бета-лист

Обитатели клетки-города
Нобелевская премия по химии 1954
Лайнус Полинг
Альфа-субъединица АТФ-синтетазы
Вторичная структура – альфа-спираль и бета-лист

10. Proteins are made of 20 amino acids

Over 100 amino
acids exist in
nature

11.

Белок - текст,
написанный на
алфавите
из 20 букв

12. Genome is made of DNA

13. DNA is made of 4 nucleotides

14. Chargaff’s rules


Chargaff’s rules
1st Chargaff’s rule
– А=Т and G=C in double-stranded
DNA
2nd Chargaff’s rule
– А=Т и G=C in single-stranded DNA
http://www.youtube.com/watch?v=HvJlnujmYcg
Human Genome:
A=30.9% and T=29.4%; G=19.9% and
C=19.8%

15. Good Quality DNA X-Ray images

• Морис Уилкинс и Розалинд Франклин
• .

16. Nobel Prize in 1962

Геном - текст,
написанный на
алфавите
из 4 букв

17. Расшифровать генетический код

18. Георгий Гамов

Бубновый код
- объясняет загадочное число 20.
- число различных ромбовых
комбинаций именно в такой модели
равно как раз двадцати.
Треугольный (комбинаторный)
Перекрывающиеся

19. Клуб РНК-галстуков

«Мы просто пили калифорнийское вино, и нам приходили идеи»
Георгий Антонович Гамов
Джордж Гамов, физик, ALA — аланин
Ричард Фейнман, физик, GLY- глицин
Джеймс Уотсон, биолог, PRO — пролин
Макс Дельбрюк, физик, TRP триптофан
Фрэнсис Крик, биолог, TYR – тиразин
Эрвин Чаргаф, биохимик, LYS – лизин
Francis Crick, Alexander Rich, George Gamow, James Watson, Melvin Calvin

20. Код без запятых

• Синтез белков происходит
не на ДНК, а на
посреднике в виде
молекулы РНК
• Гипотеза Крика об
адаптерных молекулах
• Проблема рамки
считывания и значащих и
незначащих кодонов
Френсис Крик

21. 1957, Francis Crick a talk at University College, London

стала известна
как Crick’s Central Dogma
или
Центральная догма молекулярной
эволюции
Francis Crick’s unpublished 1956 sketch of the central dogma. (Image: Wellcome Library,
London.)

22. Открытие РНК

• Об РНК знали с 1868 года, когда Фридрих
Мишер открыл нуклеиновые кислоты.
• 1961 - Две публикации в Nature
– announcing the isolation of messenger RNA
(mRNA)
– Theoretical Review François Jacob and Jacques
Monod about role of mRNA in gene regulation

23. V Международный биохимический конгресс

1961
Москва, 10-16 августа
Ниренберг М.В., Маттеи Г. // Тр. V Международ. биохим. конгресса. Симп.1. 1962.
С.211—226

24. Эксперимент Ниренберга

25. 1968 - Нобелевская премия по физиологии и медицине

Ниренберг, Хорана,
Холли

26. Центральная догма молекулярной биологии

Репликация
ДНК
Транскрипция
РНК
Трансляция
Белок

27. DNA replication

https://www.youtube.com/watch?v=4jtmOZaIvS0

28. Transcription and translation

https://www.youtube.com/watch?v=41_Ne5mS2ls

29.

Рождение технологий

30.

Метод секвенирования Сэнгера
1992 г
Нобелевская премия по химии 1980 г.
• 1977 год
Начал с получения полной
аминокислотной
последовательности инсулина в
1951-52
The Wellcome Trust Sanger Institute, 1992

31. Первый отсеквенированный геном

• 1995 г.
бактерия Haemophilus
influenzae –гемофильная
палочка или палочка
Пфейфера
5 Mb

32. Human Genome Project

• Started in 1990
• Finished 2001/2003
• Sanger Sequencing
3 Gb

33.

34. Next Generation Sequencing, or NextGenSeq, or NGS

35.

36.

37. NextGen Sequencing Revolution

To print is more expensive than to sequence
Human genome –
130 Volumes, double-sided,
4pt, ~ 43,000 chars per page

38. Next Generation Sequencing


DNA-seq
RNA-seq
Chip-Seq
MNase-Seq
Hi-C
Massive parallel sequencing
1 million to 43 billion short reads per instrument run
English     Русский Rules