Случайны выбор дневника Раскрыть/свернуть полный список возможностей


Найдено 365 сообщений
Cообщения с меткой

геном - Самое интересное в блогах

Следующие 30  »
MelissaBer

Как редактирование генома изменит облик человечества

Среда, 13 Июля 2016 г. 08:25 (ссылка)

Сергей МСергей М





В начале февраля 2016 года стало известно, что правительство Великобритании разрешило ученым изменять ДНК человеческих эмбрионов в исследовательских целях с помощью системы CRISPR. Речь не идет о создании ГМО-людей, поскольку все модифицированные эмбрионы, полученные через экстракорпоральное оплодотворение, через 14 дней будут уничтожаться. Однако общественность сильно обеспокоилась. Например, директор национальной разведки США Джеймс Клэппер заявил, что потенциально технологии редактирования генома — это оружие массового поражения. Его пессимистический прогноз воплотили в новом сезоне сериала «Секретные материалы», где систему CRISPR использовали для глобального геноцида. Что же такое технология CRISPR, почему она вызывает столько ажиотажа среди ученых, опасений у общественности и что в действительности может дать человечеству?



Антивирусная защита



CRISPR — это иммунная система бактерий и архей, спасающая микроорганизмы от вирусов. Впервые она была обнаружена японскими учеными в конце 1980-х годов у бактерии Escherichia coli (кишечная палочка). Они заметили, что в геноме бактерии присутствуют повторяющиеся последовательности, разделенные спейсерами — уникальными участками. Однако какую роль все это выполняет, тогда выяснить не смогли. Схожую генетическую структуру-кассету нашли позднее у другого микроорганизма — археи Haloferax mediterranei, а затем и у многих других прокариот. Такие участки стали называть акронимом CRISPR, то есть Clustered Regularly Interspaced Short Palindromic Repeats. По-русски — «короткие палиндромные повторы, регулярно расположенные группами».



Спустя более десяти лет генетики установили, что рядом с CRISPR-кассетами располагаются гены, которые кодируют белки, названные Cas. Известные спейсеры сравнили с последовательностями ДНК из обширных баз геномных данных. Оказалось, что спейсеры очень похожи на участки геномов вирусов-бактериофагов, а также плазмид — кольцевых молекул ДНК, обычно встречающихся у бактерий.



Группа биоинформатиков под руководством Евгения Кунина из Национального центра биотехнологической информации предложила механизм работы CRISPR-кассет и ассоциированных с ними белков Cas. Вирус, проникший в клетку бактерии, обнаруживается комплексом белков Cas, несущих с собой последовательность спейсера. Если последняя совпадает с участком ДНК вируса (протоспейсером), то белки Cas разрезают чужеродную ДНК, предотвращая инфекцию. Позже ученые сумели внести в CRISPR-кассету бактерии спейсер с фрагментом генома бактериофага и наблюдали, как микроорганизм успешно справился с вирусом. Это послужило одним из доказательств предложенной гипотезы.



Спейсеры в CRISPR-кассетах — это шаблон для производства crРНК, которая и отправляется вместе с Cas-белками в атаку на вирус. Откуда же спейсеры берутся? Когда бактерия сталкивается с неизвестным вирусом, она начинает вырезать различные участки ДНК из своего и чужого генома и вставлять их в кассету. Конечно, большинство таких кусков оказываются бесполезными и даже вредными, однако тот, что помогает организму побороть инфекцию, остается в CRISPR и передается потомкам бактерии.

Читать далее...
Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
Stepan_Sikora

ИНТЕРЕСНЫЕ ФАКТЫ О ДНК

Понедельник, 18 Апреля 2016 г. 19:50 (ссылка)
fenixslovo.com/ru/society/science/10618

ДНК - это молекула, которая делает человека тем, кем он есть. Она несёт в себе генетические инструкции по развитию и функционированию каждого отдельно...
Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
ЖительЛеса

Ученые создали бактерию с самым коротким геномом

Четверг, 07 Апреля 2016 г. 12:27 (ссылка)

Биологи из Института Крейга Вентера и компании Synthetic Genomics создали синтетическую бактерию с самым коротким геномом, содержащим 473 гена. С результатами работы можно ознакомиться в последнем выпуске журнала Science, а кратко о них сообщает RNS.

Авторы работы использовали бактерию Mycoplasma mycoides (JCV-syn1.0), чей геном состоит из 901 гена. Ученые разделили генетический код на восемь частей, после чего составляли различные комбинации с целью проверить, насколько можно сократить геном, сохранив при этом возможность организма к самостоятельной жизни. Новый микроорганизм получил название JCV-syn3.0. При этом в геном входят 149 генов, роль которых остается неизвестной.

Ученые отмечают, что минимальный геном должен соответствовать нескольким критериям. Во-первых, организм должен сохранить способность к самостоятельному размножению. Во-вторых, он должен делать это со скоростью, достаточной для роста колонии и проведения эксперимента.

Источник: Gazeta.ru

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
PogrebnojAlexandroff

Научно-религиозный фанатизм

Пятница, 27 Февраля 2016 г. 02:03 (ссылка)

Генеалогия генов, при отсутствии генов, как и родословная со слов при отсутствии известных членов рода -- предков и даже самой семьи.


Хотели, как лучше,
но получили... -- как всегда.



И вновь о науке (как о религии): о биологии, о зоологии и поведении животных, об истории и археологии, о химии (биохимической), о генетике... -- о том, что некоторые вновь и так упорно пытаются связать с коленами родовыми в генеалогии, и что -- в какой-то период русской истории, попросту именовалось словом "родословная" (со слов писанная о роде фамильном и древнем, -- возможно).

Многие из нас (и из вас) слышали ни раз по радио или от выступающих по телевидению, как и читали в прессе, о неких гаплогруппах -- особенно, связанных с "древними" русами или славянами (украми, -- к примеру), еврейством и иными группами населения. Что такое "гаплогруппа" и/или "гаплотип" -- объяснять не буду: сами найдёте и прочтёте. Лишь поясню то, о чём не очень-то распространяются в статьях коммерческого характера и уклона -- для привлечения денег от наивного и доверчивого обывателя в бизнесы и лаборатории, -- для новых разработок и исследований генома человека (в области развития технологий по генной инженерии -- как ГМО, изобретения лекарственных препаратов и методов лечения, а также... -- биологического оружия "точечного наведения" по особенностям мутационных изменений в ДНК человека, проживающих на определённых территориях и закрепивших некие особенности биохимического характера регионов; не секрет и применение этих методов в слежке за гражданами и в раскрытии преступлений; части вашего генома будут внедрять в мышей, кроликов, морских свинок и обезьян, -- как и наоборот). А посему, вновь замечая о "генной генеалогии" (прям, -- масло масленое), или -- "геногенеалогии", -- в рамках изучения наших родовых, фамильных и родословных линий, -- растолкую и поясню, что наличие единой гаплогруппы (предлагаемой вам исследователями) совершенно не определяет и не означает ваше или моё с вами родство.

Где зарождалась та или иная гаплогруппа и/или предполагаемый гаплотип человека, в настоящее время, установить невозможно -- по причине отсутствия широкомасштабных исследований по данному вопросу и незначительного количества соответствующего историко-археологического материала для сравнительного анализа и изучений: не только не сохранилось большо́го количества древних захоронений, но и невозможно обнаружить белково-генетический материал в окаменелостях, как и -- многие находки не имеют точной датировки мест рождения или исхода и временно́го периода жизни -- в останках доисторических субъектов, а современные методы определения датировок -- условны и очень приблизительны.

Предполагать, что гаплогруппа (J, R1, G, E, I или N и т.д.) является неотъемлемой частью лишь одного исторического этноса или сообщества и нации, по меньшей мере глупо и безрассудно. Для примера, можно рассмотреть группу людей, объединившихся в военно-политический (религиозный) союз из некого альбиноса, негра, азиата, мутанта с голубыми глазами, карлика, великана, дрессированной до условной разумности обезьяны или гибрида, тучного до безобразия человека, очень худого дистрофика, умственно-отсталого или шизофреника, гермафродита, возможного инопланетянина или неизвестного теперь условно-внеземного существа, и ещё кого-нибудь (из 13-го колена)...

Что с ними будет через 10 000 лет? Сохранятся ли их гены? Нет...

За такой длинный, и -- в то же время, короткий промежуток времени в историческом развитии, они... -- вытеснят друг друга и/или сольются воедино... Станут чем-то средним: некой, беспородной дворняжкой усреднённых размеров, цвета и форм. Однако! Были ли первоначально взятые за пример субъекты "чистопородными" Аполлонами (эталонами, то-бишь)? Нет, -- конечно! Они также менялись в процессе развития и смешения иных -- более ранних субъектов, и... -- объектов (которыми питались и среди которых обитали). Ведь, согласитесь -- на человека (и животных) действует всё, что нас окружает и взаимодействует с нами.

Мы напитываемся химическими веществами вод, атмосферы, пищи... Даже камень или скала, рядом с жилищем, может изменить наш внутренний мир (и не только природной радиацией или неким составом породы). На нас воздействуют микроорганизмы, грибки, черви...

Мы меняемся даже от мысли: образа жизни, предпочтений, образов воображения и т.д. А тут 10 000 лет! Говорить о том, что J-гаплогруппа -- евреи, а R1 -- русские (или славяне), как и G -- грузины и т.д., -- просто, по-идиотски -- глупо. Кто-то из них может и евреи, русский или украинец, славянин, чеченец, дагестанец, грузин, казах или татарин и башкир, но -- лишь сейчас: в наше время и в наши дни. Однако, кем были их предки 2 000 и даже 1 000 лет назад -- не известно. И никогда уже известно не будет! Особенно это касается тех традиций, которые не сохраняли усопших в погребальных ямах -- под землёй и насыпными курганами.

Друиды закрепляли умерших на деревьях. Более тысячи лет европейской части развития, существовал обряд сжигания, а в Индии кремируют усопших до сих пор. Ранее, людей съедали (по частям и целиком) не только в Африке. Кто откуда приходил и куда уходил -- неизвестно.

Пеласги...

Жили себе за Уралом, и -- вдруг, сорвались с места всем селением (со всеми своими мутациями генов) и свалили в неизвестном направлении. Далеко ли они ушли в те времена? Этого нам тоже неизвестно. Но мы прекрасно знаем, что земли нашей планеты -- без особого труда, можно обойти несколько раз: за период жизни и взросления.

Гены конечно же (в целом) сохраняются, подменяясь и замещаясь -- на другие: возможно и соседские, а вот мутации... могут ведь и исчезнуть, как и появиться новые, или -- повторные (при схожести обстоятельств). И период таких изменений -- в каждом случае, может быть, совершенно различен. То, что мы имеем в крови, или -- в геноме нашем, сейчас -- не показатель исторических связей и развития сообществ. Это лишь констатация факта того, что мы накопили и имеем от предков (которых уже давно нет и кем они были -- неизвестно). Возможно, -- обезьяной, а возможно и -- Богом: лишившимся пары сотен нуклеотидов.

Нельзя узнать по генам родословную дальних предков ни славян, не евреев, ни кого иного -- пока не будут найдены и исследованы все живущие на Земле люди (и нелюди) во все исторические и доисторические периоды развития жизни -- до единого, возможного и невозможного субъекта. Да и могут ли быть родственниками, враги? -- изнасиловавшие девочку во времена войн и ожесточённых конфликтов не только прошлого, но и обозримого настоящего (происходящего совсем недавно и многим известного). Абортов-то в те времена небыло, как сейчас, да и множество приёмных детей в семьях было -- воспитанных, как родные. Вы, горе-исследователи и псевдо-учёные, хотите лишить их своей истории и родословной?

Рассказывая об некой традиции прошлого и связях в настоящем, при распространении информации и опираясь на гаплогруппу R1* -- как "русско-славянский" тип, или J* -- как еврейскую, вы все вдруг разом забыли, что именно на этих территориях жили древние хазары, русы с Днепра, урусы с Волги, булгары (не славяне), татары и другие так называемые некоторыми "азиаты" и/или "чёрные" кавказских гор, которые верой и правдой служили русским царям и были братьями, сёстрами, жёнами и мужьями, отцами и матерями, дедами союзных народов... А сохранившийся вид фараонов, с тем же геномом, как у русских -- азиатского типа (с узкими глазами, скуластыми чертами лица и несколько вытянутой головой).

На нашей памяти войны 20-го века и скорбные события 21-го... Но ведь могут наступить и новые времена, когда из-за всех этих идиотских глупостей современной коммерции в догматической и фанатичной уже не религии, а науке -- с делением на группы и типы по геному человека, в печах и на кострах инквизиции будут жечь не по форме носа и особенностей волосяного покрова с цветом немутированных в процессе эволюции глаз, а по надуманным гаплогруппам.

И самое забавное, на-последок... -- не верьте, когда вам будут твердить, оправдываясь и прикрываясь от правды, что это вымысел, наглая ложь или некая надуманная неправда "шизофреника" и фантазии... Вспомните о прослушке телефонов или о мониторинге вашего компьютера через интернет, спецслужбами и чиновниками -- о чём я ни раз упоминал на многих форумах и в передачах (до неких "громких" разоблачений). Вспомните о ваших правах на частную жизнь и собственность. Всё начинается с малого. И те, кто оправдывает противоправные действия чиновничьего аппарата власти -- в надежде на борьбу с неким терроризмом (в том числе и освободительного движения), первые будут истерично визжать в эфирах радио и телевидения, когда непредвиденные ими последствия коснутся их самих (что уже наблюдалось ни раз в истории) и их убеждения резко поменяют градус наклона с направлениями ветра (под носом, а возможна и за спиной).

Сначала борьба с врагами, а затем и с собственным народом... -- рабов у власти.
Комментарии (13)КомментироватьВ цитатник или сообщество
aramill_stells

Удревление истории человечества: новые факты

Суббота, 26 Сентября 2015 г. 10:41 (ссылка)


История человечества, оказывается, гораздо древнее, чем принято считать. Это смогли доказать немецкие ученые. А помогла им современная наука.





Дату рождения Homo sapien уточнили немецкие ученые, расшифровав информации ДНК костей его предка. Сенсационное открытие заставит ученых полностью переписать историю эволюции человека.

Читать далее...
Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_rss_hh_new

[Перевод] Поиск по геному с помощью Wolfram Language (Mathematica) и HadoopLink

Среда, 22 Июля 2015 г. 17:50 (ссылка)



Перевод поста Пола-Жана Летурно (Paul-Jean Letourneau) "Searching Genomes with Mathematica and HadoopLink".

Код, приведенный в статье, можно скачать здесь.
Примечание: этот пост написан как продолжение поста Большие массивы данных в Mathematica с HadoopLink.
Примечание переводчика: автор данной статьи под термином геном понимает всю совокупность генов некоторого структурного элемента живой материи. Это несколько отличается от стандартных определений, близких по смыслу, в которых подразумевается либо вся совокупность генов конкретного вида (Ridley, M. (2006). Genome. New York, NY: Harper Perennial), либо полный набор генетических инструкций, которые можно найти в клетке (http://www.genome.gov/Glossary/index.cfm?id=90). В данном посте будем пользоваться представлением автора.
В моём предыдущем посте я описал, как писать алгоритмы MapReduce (вики) в Mathematica с помощью пакета HadoopLink. Теперь давайте копнём немного глубже и напишем более серьёзный алгоритм MapReduce.



Я уже писал раньше о некоторых занятных возможностях в сфере геномики в Wolfram|Alpha. Если вам это интересно, вы даже можете осуществлять поиск по человеческому геному определённых последовательностей ДНК. Биологам часто требуется найти расположение фрагмента ДНК, которые они нашли в лаборатории, для определения того, какому животному принадлежит этого фрагмент, или из какой он хромосомы. Давайте используем HadoopLink для создания геномной поисковой системы!



Как и прежде, мы загружаем пакет HadoopLink:







И устанавливаем ссылку на главном узле Hadoop:







Чтобы проиллюстрировать идею, возьмём небольшой по размерам человеческий митохондриальный геном из GenomeData:







Сперва разделим геном на отдельные основания (A, Т, С, G):







Они будут нашими парами ключ-значение (k1, v1). Значения — начальные позиции каждого основания генома:



{k1, v1} = {основание, позиция}



То есть мы только что создали индекс для генома.



Экспортируем этот индекс в Hadoop Distributed File System (HDFS):







Для запросов мы будем использовать последовательность из 11 оснований, о которых мы знаем, что они содержатся в геноме:







Мы используем последовательность с большим количеством повторений в ней для того, чтобы усложнить задачу нашим алгоритмам.



Наш геномный поисковик на этот запрос должен вернуть позицию 515:







Теперь нам нужны mapper и reducer.



Как было сказано в первой частиmapper принимает пару ключ-значение (шаг 1), и выдаёт другую пару (шаг 2):







Mapper получает основание из индекса генома в качестве входного значения и выдаёт пары ключ-значение для каждого расположения в запросе, где встречаются индексы оснований (скоро вы узнаете почему):



(1) Ввод: {k1, v1} = {индекс основания, позиция в геноме}



GenomeSearchMapper



Ключ на выходе — положение в геноме, значение на выходе — положение в запросе:



(2) Вывод: {k2, v2} = {позиция в геноме, позиция в запросе}



Какая разница между позицией в геноме и позицией в запросе? Положение в запросе есть положение основания в запросе, в то время как положение в геноме есть положение в целом геноме.



К примеру, скажем, mapper получает пару ключ-значение с основанием A на позиции 517:







Позиции в запросе для основания А в запрашиваемой последовательности GCACACACACA есть 3, 5, 7, 9, и 11:







Вот эта последовательность с подсвеченными позициями:







Mapper имеет только одну пару ключ-значение с одной базой индексов вместе с запрашиваемой последовательностью. У него не имеется остальной части генома для сравнения, так что ему требуется найти все возможные способы выстраивания запроса с основанием A на позиции 517:







Здесь цвета соответствуют каждой A в запросе (по горизонтали) с их получающимися положениями в геноме (по вертикали). Возьмем, к примеру A в третьем основании в запросе (показано зеленым). Если его встроить с A на позиции 517, то запрашиваемая последовательность будет начинаться в геноме с позиции 515 (517 — 3 + 1 = 515) (также показано зеленым).



Точно так же, выделенное красным основание (пятое положение в запросе) заставит запрашиваемую последовательность выстраиваться, начиная с позиции 513 в геноме (также показано в красным). И то же самое для седьмой позиции в запросе с 511 позицией в геноме, (фиолетовый) девятой позиции в запросе с 509 позицией в геноме (оранжевый), одиннадцатой позиции в запросе с 507 позицией в геноме (коричневый).



Лишь одна из этих расстановок является правильной. В данном случае — для третьей позиции в запросе (зеленый цвет), которая позволяет запрашиваемой последовательности встроиться в геном. Но mapper этого не знает, и потому рассматривает все возможные совпадения.



Так так reducer собирает ключи, он соберёт и все основания, которые соответствуют одним и тем же позициям в геноме:



Ввод: {k2, {v2 …}} = {позиция в геноме, {позиции в запросе…}}



Теперь для данного положения в геноме reducer будет искать те случаи, когда значения формируют полную последовательность из позиций запросов:







Если reducer находит полное соответствие, он выдаёт положение генома:



Вывод: {k3, v3} = {запрашиваемая последовательность, положение в геноме}



Давайте теперь запросим у нашего геномного поисковика последовательность GCACACACACA:







(См. часть 1, где приводилось описание функции HadoopMapReduceJob).



И импортируем соответствия в геноме из HDFS:







Соответствующее положение в геноме — 515, и это правильный ответ! Наша геномная поисковая система работает!



Давайте теперь осуществим поиск с запросом, которому должны соответствовать два разных положения в геноме:







Этому запросу должны соответствовать позиции 10 и 2277:







Да, он нашел оба совпадения!



Теперь давайте отмасштабируем всё это для всего человеческого генома. Первым шагом является создание индексации, на этот раз для всего генома, а не только митохондриального. Чтобы это сделать, я скачал весь человеческий геном в виде текстовых файлов с государственного сервера и импортировал их в HDFS:











Получается по одному текстовому файлу на хромосому, содержащие необработанные последовательности хромосом:







Затем я применил MapReduce для создания пар ключ-значение в индексе на HDFS, который выглядит так:



[hs_ref_GRCh37.p13_alts.fa, 121] G

[hs_ref_GRCh37.p13_alts.fa, 122] A

[hs_ref_GRCh37.p13_alts.fa, 123] A

[hs_ref_GRCh37.p13_alts.fa, 124] T

[hs_ref_GRCh37.p13_alts.fa, 125] T

[hs_ref_GRCh37.p13_alts.fa, 126] C

[hs_ref_GRCh37.p13_alts.fa, 127] A

[hs_ref_GRCh37.p13_alts.fa, 128] G

[hs_ref_GRCh37.p13_alts.fa, 129] C

[hs_ref_GRCh37.p13_alts.fa, 130] T



Одно небольшое отличие от предыдущего примера в том, что ключ сейчас представляет собой {хромосома, позиция в геноме}, а значение — основание на этой позиции. Так что теперь хромосома будет в ключе. Я немного изменил mapper, чтобы он мог работать с новым представлением ключа:







Reducer остался без изменений.



Давайте запустим поиск для той же последовательности:







На этот раз мы получаем совпадения для всего генома:







И мы можем ещё улучшить алгоритм. Как насчёт поиска неточных соответствий вместо точных? Слегка поменяем reducer, указав то, насколько большая часть запроса должна совпадать:







Это не самый эффективный способ поиска в геноме, но он показывает, как легко писать прототипы алгоритмов на основе MapReduce и запускать их в Mathematica. Если вам интересны подробности, рекомендую посмотреть мои недавние сообщения. А на интересующие вопросы вам с радостью ответят в HadoopLink GitHub Repo!

Original source: habrahabr.ru (comments, light).

http://habrahabr.ru/post/263307/

Комментарии (0)КомментироватьВ цитатник или сообщество
стрелец_2012

Пётр Гаряев Генетический хаос.Население Земли хотят сократить до миллиарда. Мутации уже запущены.

Суббота, 18 Июля 2015 г. 19:29 (ссылка)


































Население Земли хотят сократить до миллиарда. Мутации уже запущены. Пётр Гаряев Кто заинтересован в том, чтобы многочисленные эксперименты с трансгенными клетками не доводились до широкой общественности? Крысы, которых кормили трансгенной соей, заболевали раком. Что будет с человеком, употребляющим в пищу то же самое? Если вводить не свойственный растению трансген, то возникает контекстный хаос. Искажённый белок получает функции, которые вызывают рак. Как мутировали бактерии-пожиратели нефти в Мексиканском заливе? Кому выгоден этот генетический хаос? Кто и для чего запустил на нашей планете цепную реакцию генных мутаций? Независимый русский учёный, доктор биологических наук, академик РАЕН и РАМНТ рассказывает нам о том, почему зомби-апокалипсис уже начался



http://концептуал.рф/



https://www.youtube.com/channel/UC1bt...



https://vk.com/collectedknowledge



http://засвободу.рф/

Метки:   Комментарии (3)КомментироватьВ цитатник или сообщество
rss_rss_hh_new

EPAM, собери мне геном

Понедельник, 04 Мая 2015 г. 11:42 (ссылка)

Если сравнивать человека с компьютером, то его тело – это hardware, а то, что вдыхает в него жизнь – software. И сегодня речь пойдёт о человеческом software – его геноме.



image



В настоящее время сложно кого-то удивить терминами «ген», «геном», «ДНК», настолько плотно они вошли в нашу повседневную жизнь. Все слышали о том, что геном человека был расшифрован, однако немногие из нас четко понимают значение этого научного прорыва для всего человечества. Исправление человеческих «слабостей», увеличение продолжительности жизни и нахождение все более эффективных способов борьбы с преступностью – все это становится возможно благодаря изучению наследственной информации, содержащейся в геноме человека.



Немного теории



Поскольку большинство из нас несколько подзабыло школьный курс биологии, предлагаем освежить в памяти основные понятия:



Дезоксирибонуклеиновая кислота, более известная, как ДНК, — высокополимерное природное соединение, содержащееся в ядрах клеток всех живых организмов, носитель генетической информации. ДНК состоит из 4 видов нуклеотидов. Основу нуклеотидов ДНК составляет сахар дезоксирибоза (одинаковый для всех нуклеотидов) и 4 типа азотистых оснований — аденин (A), тимин (T), гуанин (G) и цитозин ©. Именно последовательность нуклеотидов и определяет записанную в ДНК информацию. Отдельные участки ДНК соответствуют определенным генам.



Ген, в свою очередь, — это физическая (определенный участок ДНК) и функциональная (кодирует белок или рибонуклеиновые кислоты) единица наследственности. Важнейшее свойство генов — сочетание их высокой устойчивости в ряду поколений со способностью к наследуемым изменениям (мутациям), служащим основой изменчивости организмов, дающей материал для естественного отбора.



Рибонуклеиновые кислоты (РНК) — тип нуклеиновых кислот, которые состоят из 4 нуклеотидов, построенных на основе сахара рибозы и азотистых оснований – это аденин, гуанин, цитозин, урацил (A, C, G, U). Урацил (U) является полным аналогом тимина (T) в ДНК, так что для наших целей можно считать их идентичными. В клетках всех живых организмов РНК участвуют в реализации генетической информации. С находящихся в ДНК генов создается РНК-копия, которая либо функционирует сама по себе, либо служит матрицей для синтеза белка.



Что же такое геном? Геном – это ДНК, содержащаяся в гаплоидном наборе хромосом клетки определенного вида организма. В расширенном виде под геномом понимается вся наследственная система клетки.



Про 23 пары хромосом в геноме человека, думается, помнят все. Первоначально хромосомами назвали структуры из очень плотно свернутой нити, которая образуется в клетке в определенный момент в процессе деления, и видна в обычный оптический микроскоп. Хромосомой называют и саму нить ДНК в «расправленном» состоянии.



Рид — отдельное прочтение фрагмента ДНК. В свою очередь, локус – это местоположение определенного гена на генетической или цитологической карте хромосомы.



image



Геном и медицина



Про «расшифровку» генома человека так или иначе слышали все. К сожалению, сам термин «расшифровка» выбран неудачно, что постоянно вызывает вопросы. Правильно сказать, что геном человека был прочитан (секвенирован), т. е. получена полная последовательность нуклеотидов всех нитей ДНК.



Чтение ДНК — это сама по себе очень сложная техническая задача. Но даже после прочтения такой геном предстает нам в виде строки, состоящей из четырех букв (A, C, G, T), причем его длина может достигать нескольких миллиардов символов. При этом в ДНК нет знаков препинания, которые бы указывали на начало и конец генов и других функционально значимых элементов. Эта огромная по объему информация чем-то похожа на полный дамп памяти компьютера. А понять по этому дампу, как наш живой компьютер работает — отдельная, значительно более сложная задача.



Раньше для анализа были доступны только короткие кусочки последовательности ДНК — отдельные гены и их фрагменты. Благодаря полному секвенированию генома стало намного легче анализировать «текст» ДНК и искать в нем функциональные участки. За последние 10 лет ученые очень сильно продвинулись в этом направлении. Были обнаружены новые гены, мутантные формы которых приводят к раку, атеросклерозу, болезни Альцгеймера, сердечно-сосудистым заболеваниям. Предрасположенность человека к алкоголизму, наркомании, азартным играм, психическим заболеваниям и даже суициду имеет генетическую основу. Более того, склонность к поиску новых впечатлений, материнский инстинкт, агрессивность поведения, активность и раздражительность также находятся под жестким генетическим контролем! Конечно, не всякая заложенная в ДНК возможность будет реализована, но именно гены задают нам набор возможностей и рисков, на основе которых строится наша жизнь.



К слову, травмирующий опыт родителей может напрямую передаваться потомкам через так называемое эпигенетическое наследование. Страхи и стрессы предков значительно влияют на структуру и функцию нервной системы последующих поколений. И если вы непонятной причине боитесь собак, возможно кого-то из ваших предков когда-то покусали. Эта область еще изучена очень мало, но также активно развивается.



ДНК-тест позволяет обнаружить предрасположенность человека к тем или иным заболеваниям, в том числе, и обусловленным внешними причинами (вирусы, питание и т.д.), идентифицировать личность, установить отцовство, определить совместимость донора и реципиента при проведении трансплантации и многое другое.



Бывает и такое. В 2002 году американка Лидия Фэйрчайлд при разводе с мужем проходила процедуру анализа ДНК, которая показала, что она не является матерью двум её детям. В то время она уже была беременна третьим, пробы крови которого после рождения показали, что она не является матерью и ему. Дальнейшие исследования выявили, что Лидия — химера, то есть организм, обладающий двумя различными геномами.



Геном и биоинформатика



Полное секвенирование генома отдельного человека позволяет одномоментно получить полный текст ДНК и провести анализ сразу всех его генов вместо нескольких тысяч специализированных тестов на отдельные наследственные заболевания. Проект «Геном человека» потребовал 5 лет и несколько миллиардов долларов. Современные машины позволяют полностью секвенировать геном человека за 15-20 дней по цене около $1000/геном. Тогда почему же исследование геномов и геномная диагностика происходят не так быстро, как хотелось бы?



Дело в том, что ни один современный секвенатор не может прочесть всю нить ДНК от начала до конца. Для секвенирования ДНК случайным образом нарезают на короткие фрагменты, которые секвенатор затем параллельно читает в больших количествах. В результате получаются файлы размером в сотни гигабайт, в которых находится колоссальное количество коротких (150-300 нуклеотидов) прочтений.



Поскольку в одном биологическом образце много клеток, а ДНК фрагментируется случайно, прочитанные фрагменты будут многократно перекрываться.



Для получения нужного генома необходимо собрать этот паззл в полный текст. Это колоссальная вычислительная задача, и обработка таких файлов занимает продолжительное время. Все данные обрабатываются специальными геномными ассемблерами, которые и собирают максимально продолжительные по длине участки генома.



EPAM, собери мне геном



Расхожая истина, что время – деньги, верна и для геномных исследований. Расшифровка наследственного материала открывает фантастические возможности для медицины: от «ремонта» дефектных генов до нахождения тайны вечной молодости. И именно поэтому множество научных институтов и частных компаний прилагают невероятные усилия для ускорения процесса обработки генома.



Для обработки и анализа результатов сиквенса создано большое число программ. Однако производительность секвенаторов и объемы получаемой информации растут с такой скоростью, что разработчики часто не успевают оптимизировать свои программы для обработки все увеличивающегося количества данных. Возникает потребность адаптировать разработанные программы для параллельной работы, использования вычислительных кластеров и т.д.



Один из клиентов обратился к нам за автоматизацией процесса контроля качества сборки генома и сокращением вычислительного времени.



В данный момент мы оптимизируем различные процессы, чтобы минимизировать время и, соответственно, затраты. Работа идёт с небольшими утилитами, которые занимаются расчетом метрик — численных характеристик, по которым экспериментатор контролирует качество подготовки образца, проведения секвенирования и сборки генома. Метрики позволяют оценить тот файл, который выдается секвенатором: подходит он для дальнейшего анализа генома или же нужно провести еще один эксперимент.



Метрики и алгоритмы – оптимизация работы



Благодаря работе нашего отдела алгоритмов, время расчета одной метрики сократилось с 11 часов до 105 минут. Раньше четыре метрики серьезная машина обсчитывала за 25 часов. Мы, с помощью многопоточности и переработки алгоритмов, сократили это время в четыре раза. И это не предел.



Оптимизация метрик заключалась в поиске точек в коде для ветвления процесса вычислений. Все метрики разные по структуре, но одна общая черта у них есть: все они читают файл в формате .bam, в котором хранятся данные об отдельных прочтениях фрагментов ДНК (ридах).

Схема оптимизации проста: обработчики данных используют итератор, который читает из файла по одной записи (SAMRecord), и производят анализ информации с накоплением промежуточных результатов (статистики) в неких структурах данных.



Одна из оптимизированных метрик позволяет собирать статистику из .bam-файла, с помощью которой можно оценить, насколько качественно был проведен эксперимент. Чтобы отличить ошибку секвенирования от мутации, в статистике должно быть достаточно большое количество отдельных прочтений фрагментов ДНК (ридов). Очень большое покрытие говорит о том, что эксперимент можно было провести дешевле без потери качества. В итоге метрика выдает информацию о том, сколько выровненных оснований было отфильтровано из-за низкого качества.



В чем же состоит оптимизация? Первоначально алгоритм считал статистику для каждого месторасположения определенного гена (локуса), проходя по всем ридам, покрывающим эту позицию. Если рид состоял из 300 оснований (а это его стандартная длина), то алгоритм 300 раз считывал этот фрагмент ДНК, чтобы получить информацию о качестве его основания. Алгоритм, оптимизированный одним из наших специалистов, считывает данные о качестве всех оснований в тот момент, когда рид встречается первый раз, что позволяет избежать обращения к нему для каждого локуса. Информация об отфильтрованных основаниях накапливается в массиве-счетчике, который сдвигается по мере прохождения по геному. Таким образом, статистика по каждому прочтению собирается только один раз, что позволяет существенно ускорить процесс обработки данных.



Ещё одна метрика собирает статистику о дубликатах (т.е. идентичных ридах, совпадающих до заданного числа оснований). На основе этой статистики оценивается сложность библиотеки ридов. Слишком высокое количество дубликатов показывает, что эксперимент можно было провести дешевле. Низкая же сложность библиотеки говорит о том, что мы имеем дело с маленьким количеством прочтений, что может исказить точность результатов при дальнейшей работе с геномом.



Изначальный алгоритм разбивал риды на подмножества, объединяя их по первым n-элементам. Далее происходило сравнение прочтений фрагментов ДНК для каждого из них. Очевидно, что такой алгоритм работает крайне медленно (для больших подмножеств время растет экспоненциально). Оптимизацией в данном случае является использование модифицированного LSH-алгоритма (locality-sensitive hashing algorithm). Каждый рид разбивается на шинглы, то есть небольшие кусочки, включающие в себя несколько оснований и позицию начала этого кусочка в риде. Далее строится таблица, в которой хранится информация о том, в каких ридах встречается этот шингл. Затем с помощью случайных перестановок определяются похожие прочтения, которые сравниваются посимвольно. Использование данной оптимизации позволяет избежать огромного количества ненужных сравнений.



Многопоточность



Как уже говорилось выше, наши специалисты смогли значительно сократить время просчета метрик. Это стало возможно не только за счет переработки алгоритмов, но и с помощью многопоточности. Какие же изменения были сделаны?



Был создан отдельный поток для чтения записей из .bam-файла, который накапливает их в отдельном кольцевом буфере (bounded buffer). Как только буфер заполняется, он складывается в ограниченную очередь (bounded queue). И буфер, и очередь таких заполненных буферов ограничены из соображений конечного объёма выделяемой процессу оперативной памяти.



Другой поток (или несколько потоков для некоторых метрик) берет очередной полный буфер из этой очереди и использует его в качестве источника данных для итератора. Далее все действует так же, как и в первоначальной схеме.



Накопление результатов обработки записей из нескольких потоков требует применения новых структур данных для статистики метрик. Делается это для того, чтобы избежать состояния гонки (race condition). С этой целью мы создали дополнительные классы для накопления статистики и применяем атомарные операции (atomics).



Атомарные операции приводят к относительно высоким затратам на консолидацию промежуточных статистических данных из разных потоков для отдельных метрик. Для того, чтобы ускорить процесс обработки, записи были сделаны в виде блоков по несколько сотен в одном потоке.



Благодаря проведенным оптимизациям, время просчета метрик сократилось в несколько раз. Тем не менее, это не предел. Для отсортированных индексированных .bam-файлов возможен переход к параллельному чтению и обработке данных по отдельным хромосомам, что позволит ещё больше сократить время обработки данных генома.



Напоследок



О генетике и геноме можно говорить практически бесконечно, благо тема интересная и касается всех нас. Возможно, благодаря постоянной работе над автоматизацией обработки генома уже через пару лет его расшифровка и сборка будут занимать буквально несколько часов, а стоимость снизится настолько, что абсолютно каждый человек сможет позволить себе провести генный анализ. Фантастика? Вряд ли. Геномные технологии сейчас развиваются почти по закону Мура, производительность секвенаторов удваивается примерно каждые 2 года. Поэтому вполне вероятно, что за следующие 10-15 лет геномные технологии станут настолько же распространенными и привычными, как уже стали смартфоны и ноутбуки.



P.S. В силу ограниченного объема статья не претендует на строгую научную правильность в описании биологических терминов и процессов.

Original source: habrahabr.ru (comments, light).

http://habrahabr.ru/post/257215/

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
gadjorek

Это уДивиТельно.В человеческом геноме нашли чужеродную ДНК.+фильм.

Понедельник, 23 Марта 2015 г. 21:02 (ссылка)

Это цитата сообщения X-dranik Оригинальное сообщение

Это уДивиТельно.В человеческом геноме нашли чужеродную ДНК.+фильм.






В человеческом геноме нашли чужеродную ДНКСпециалистам Кембриджского университета удалось совершить открытие, возможно, проливающее свет на то, как наша планета обзавелась жизнью. Ученые обнаружили в человеческом геноме следы чужеродной дезоксирибонуклеиновой кислоты – всего сто сорок пять генов. По мнению западных журналистов, не исключено, что это открытие опровергнет дарвинизм.



Согласно предположению британских ученых, древнегреческий миф о Прометее может с относительной точностью описывать появление жизни на Земле. Как сын Иапета и Климены подарил человечеству огонь, так и представители внеземных цивилизаций могли преподнести нашей планете органическую жизнь. Интересно, что такая теория легла в основу научно-фантастической ленты «Прометей» 2012 года. Фильм рассказывает о группе ученых, которые отправляются в неизведанный уголок Вселенной, чтобы встретить наших создателей, после того, как на Земле обнаруживаются многочисленные наскальные рисунки с координатами далекой планеты.



Человечество уже давно имеет теорию о так называемом Древнем астронавте, который якобы пришел с небес, принеся на нашу планету жизнь и технологии. Упоминания Древнего астронавта можно найти в старейших религиозных писаниях. И вот теперь британские исследователи нашли у человека сто сорок пять неизвестных генов, которые были точно не унаследованы от предков.



Дарвинизм, тем не менее, с данной теорией никаких конфликтов не имеет. Он лишь доказывает, что все живые организмы, в том числе человек, постоянно эволюционируют, приспосабливаясь к новым условиям жизни на Земле. Откуда органическая материя взялась на нашей планете с самого начала, до сих пор остается полной загадкой. Можно лишь гадать, принес ее Древний астронавт или же это случилось как-то иначе.



http://esoreiter.ru/index.php?id=0315/21-03-2015-212725.html&dat=news&list=03.2015




Метки:   Комментарии (4)КомментироватьВ цитатник или сообщество
Галина_-_Галинка

Ученые нашли внутри генома человека послание к Богу

Четверг, 19 Марта 2015 г. 22:05 (ссылка)

1 (330x220, 16Kb)
В США исследователи из Гарвардского университета, заявили, что они нашли то, что, кажется, является посланием Бога, записанным внутри человеческого генома.
В малоисследованном разделе не кодирующих ДНК, команда ведущих генетиков обнаружила 22-словесный фрагмент с древнего арамейского языка, в котором Бог подтверждает свое существование и роль в создании жизни на Земле, пишет Еsoreiter.
Потрясающий вывод представляет почти неопровержимые доказательства существования Бога и его роли в создании процесса эволюции путем естественного отбора.
Послание было обнаружено, когда исследователи заметили странные математические модели, которые появляются в определенной части генома.
"Мы знали, что модели в природе не встречаются", – объяснил Чарльз Уотсон, ведущий ученый по проекту ", но мы не смогли придумать любое убедительное объяснение для них.
"Мы решили провести перекрестный анализ ссылок на паттерны с базой данных для языков", – объясняет он, "и мы были потрясены, обнаружив, что модели, найденные в ДНК, соответствуют древнему арамейскому языку".
Ошеломленная своим открытием, команда связалась с экспертами, знакомыми с арамейским языком, на котором Иисус Христос говорил в повседневной жизни.
Полностью декодированное сообщение гласит: "Здравствуйте, дети мои. Это Яхве, единый истинный Бог. Вы нашли тайну творения. Теперь поделитесь ею спокойно с миром". Яхве – библейское название иудео-христианского Бога.

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
Stepan_Sikora

Ученые нашли внутри генома человека послание к богу

Четверг, 19 Марта 2015 г. 13:50 (ссылка)
fenixslovo.com/ru/society/science/6712

В США исследователи из Гарвардского университета, заявили, что они нашли то, что, кажется, является посланием Бога, записанным внутри человеческого ге...
Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество

Следующие 30  »

<геном - Самое интересное в блогах

Страницы: [1] 2 3 ..
.. 10

LiveInternet.Ru Ссылки: на главную|почта|знакомства|одноклассники|фото|открытки|тесты|чат
О проекте: помощь|контакты|разместить рекламу|версия для pda