Как парсить PubMed

PubMed (Пабмед) − библиографическая база данных научных публикаций, в основном биологической и медицинской направленности. Более широко трактуется как совокупность всех библиографических баз данных NCBI (Национального Центра Биотех Информации), куда, наряду с собственно PubMed, входят такие базы данных как PubChem, Gene, PMC и другие.

Самая биомедиинская мякотка концентрируется в базе данных под названием «Medline». В ней ищут интерфейсы вышеназванных тематических баз данных.

Почему есть Medline и есть куча других баз данных? Потому что

У каждой тематической базы данных есть свой специфический интерфейс заточенный под предметную область
Наряду с Medline они сёкают по дополнительным каталогам, которые содержат инфу по статьям, по тем или иным причинам не попавшим в Medline (неопубликованные, не биомед тематики и т.д. ^[1]).

У кого сколько
PubMed	более 30 млн. записей
Medline	более 26 млн. записей
PubMed Central (PMC)	более 5.2 млн. записей

Адреса

Entrez

Пабмед использует поисковый движок под названием Entrez.

Парсинг

Автоматический поиск происходит через обычные GET запросы. Для более 2 запросов в секунду требуется ключ.

Получение информации о публикации происходит в два этапа.

Вначале получают список статей, удовлетворяющим критериям поиска (совпадением с ключевыми словами в указанных частях). Подробнее: Получение id статей на PubMed
По известной id статьи шлют второй запрос на выдачу информации об этой статье. Сервер присылает данные в формате Medline

Ссылки

↑ https://www.nlm.nih.gov/bsd/difference.html

[1] ttps://www.nlm.nih.gov/bsd/difference.html

[1]

Как парсить PubMed

Содержание

Адреса

Entrez

Парсинг

Ссылки

Навигация

Как парсить PubMed

Адреса

Entrez

Парсинг

Ссылки

Навигация

Поиск