Data mining Pubmed и Pubchem — баз медицинской и биохимической информации
|
|
Вторник, 25 Сентября 2018 г. 00:44
+ в цитатник
PubMed представляет собой более чем 28 миллионов цитированний (абстрактов и названий) биомедицинской литературы из журналов наук о жизни, онлайн книг и MEDLINE. Также цитирование может включать в себя полный текст статей. Типичный запрос в Пабмед —
type 2 diabetes natural compound
Pubchem — база данных более 100 млн химический соединений и 236 млн веществ. Также в базе результаты биоактивности 1.25 млн соединений (например активность соединений против рака или ингибирования конкретного гена). На данный момент известно о 9 млн органических химических соединений (сложных веществ). Неорганических химических веществ может быть огромное количество — от 10**18
В этой статье я приведу примеры составления списка
генов ответственных за плохой прогноз по выживаемости от рака и
код поиска органических соединений и их номеров среди всех химических молекул базы ПабЧем. Никакого машинного обучения в этой статье не будет (машинное обучение понадобится в следующих статья по биомаркерам диабета, определения возраста человека по рнк-экспресии, скрининга противораковых веществ).
Читать дальше -> https://habr.com/post/424271/?utm_source=habrahabr&utm_medium=rss&utm_campaign=424271
Метки:
Программирование
Биотехнологии
Data Mining
биология
python
pubmed
pubchem
-
Запись понравилась
-
0
Процитировали
-
0
Сохранили
-