Как парсить PubMed: различия между версиями
Denis.s (обсуждение | вклад) Нет описания правки |
Denis.s (обсуждение | вклад) Нет описания правки |
||
Строка 26: | Строка 26: | ||
Пабмед использует поисковый движок под названием Entrez. | Пабмед использует поисковый движок под названием Entrez. | ||
== | ==Парсинг== | ||
Автоматический поиск происходит через обычные GET запросы. Для более 2 запросов в секунду требуется ключ. | |||
Получение информации о публикации происходит в два этапа. | |||
# Вначале получают список статей, удовлетворяющим критериям поиска (совпадением с ключевыми словами в указанных частях). Подробнее: [[Получение id статей на PubMed]] | |||
# По известной id статьи шлют второй запрос на выдачу информации об этой статье. Сервер присылает данные в [[MEDLINE_(формат_данных)|формате Medline]] | |||
==Ссылки== | ==Ссылки== | ||
<references /> | <references /> |
Версия от 10:33, 16 марта 2021
PubMed (Пабмед) − библиографическая база данных научных публикаций, в основном биологической и медицинской направленности. Более широко трактуется как совокупность всех библиографических баз данных NCBI (Национального Центра Биотех Информации), куда, наряду с собственно PubMed, входят такие базы данных как PubChem, Gene, PMC и другие.
Самая биомедиинская мякотка концентрируется в базе данных под названием «Medline». В ней ищут интерфейсы вышеназванных тематических баз данных.
Почему есть Medline и есть куча других баз данных? Потому что
- У каждой тематической базы данных есть свой специфический интерфейс заточенный под предметную область
- Наряду с Medline они сёкают по дополнительным каталогам, которые содержат инфу по статьям, по тем или иным причинам не попавшим в Medline (неопубликованные, не биомед тематики и т.д. [1]).
У кого сколько | |
---|---|
PubMed | более 30 млн. записей |
Medline | более 26 млн. записей |
PubMed Central (PMC) | более 5.2 млн. записей |
Адреса
Entrez
Пабмед использует поисковый движок под названием Entrez.
Парсинг
Автоматический поиск происходит через обычные GET запросы. Для более 2 запросов в секунду требуется ключ.
Получение информации о публикации происходит в два этапа.
- Вначале получают список статей, удовлетворяющим критериям поиска (совпадением с ключевыми словами в указанных частях). Подробнее: Получение id статей на PubMed
- По известной id статьи шлют второй запрос на выдачу информации об этой статье. Сервер присылает данные в формате Medline