Как парсить PubMed
PubMed (Пабмед) − библиографическая база данных научных публикаций, в основном биологической и медицинской направленности. Более широко трактуется как совокупность всех библиографических баз данных NCBI (Национального Центра Биотех Информации), куда, наряду с собственно PubMed, входят такие базы данных как PubChem, Gene, PMC и другие.
Самая биомедиинская мякотка концентрируется в базе данных под названием «Medline». В ней ищут интерфейсы вышеназванных тематических баз данных.
Почему есть Medline и есть куча других баз данных? Потому что
- У каждой тематической базы данных есть свой специфический интерфейс заточенный под предметную область
- Наряду с Medline они норвежский русский aka рюссеношк: от норвежского å søke, искать. Удобнее произносить, нежели "производят поиск", либо неуклюжее "ищут" по дополнительным каталогам, которые содержат инфу по статьям, по тем или иным причинам не попавшим в Medline (неопубликованные, не биомед тематики и т.д. https://www.nlm.nih.gov/bsd/difference.html).
Но на самом деле, база данных то одна, и называется она «Medline». А PubMed, PubChem и иже с ними являются заточенными под предметную область интерфейсами поиска. Так-то оно.
Пабмед использует поисковый движок под названием Entrez.
Поиск публикаций
Поиск вручную
Искать статьи на Пабмеде можно вручную, через поисковую строку на сайте NCBI