[Перевод] Введение в геномику для программистов
|
|
Понедельник, 20 Мая 2019 г. 13:30
+ в цитатник
Об авторе. Энди Томасон — ведущий программист Genomics PLC. Он с 70-х годов занимается графическими системами, играми и компиляторами; специализация — производительность кода.
Гены: краткое введение
Геном человека состоит из двух копий примерно по 3 миллиарда пар оснований ДНК, для кодирования которых используются буквы A, C, G и T. Это около двух бит на каждую пару оснований:
3 000 000 000 x 2 x 2 / 8 = 1 500 000 000 или около 1,5 ГБ данных.
На самом деле эти копии очень похожи, и ДНК всех людей практически одинаков: от торговцев с Уолл-Стрит до австралийских аборигенов.
Существует ряд «референсных геномов», таких как
файлы Ensembl Fasta. Эталонные геномы помогают построить карту с конкретными характеристикам, которые присутствуют в ДНК человека, но не уникальны для конкретных людей.
Читать дальше -> https://habr.com/ru/post/452622/?utm_source=habrahabr&utm_medium=rss&utm_campaign=452622
Метки:
Машинное обучение
Научно-популярное
Биотехнологии
геномика
геном
ДНК
рекомбинация
биоинформатика
VCF
GWAS
инверсия Мура — Пенроуза
неравновесное сцепление
-
Запись понравилась
-
0
Процитировали
-
0
Сохранили
-