Как парсить PubMed: различия между версиями
Denis.s (обсуждение | вклад) Нет описания правки |
Denis.s (обсуждение | вклад) |
||
(не показано 14 промежуточных версий этого же участника) | |||
Строка 1: | Строка 1: | ||
'''PubMed (Пабмед)''' − библиографическая база данных научных публикаций, в основном биологической и медицинской направленности. Более широко трактуется как совокупность всех библиографических баз данных NCBI (Национального Центра | '''PubMed (Пабмед)''' − библиографическая база данных научных публикаций, в основном биологической и медицинской направленности. Более широко трактуется как совокупность всех библиографических баз данных NCBI (Национального Центра Биотехнологической Информации), куда, наряду с собственно PubMed, входят такие базы данных как PubChem, Gene, PMC и другие. | ||
Самая | Самая биомедицинская мякотка концентрируется в базе данных под названием «Medline». В ней ищут интерфейсы вышеназванных тематических баз данных. | ||
Почему есть Medline и есть куча других баз данных? Потому что | Почему есть Medline и есть куча других баз данных? Потому что | ||
* У каждой тематической базы данных есть свой специфический интерфейс заточенный под предметную область | * У каждой тематической базы данных есть свой специфический интерфейс, заточенный под ее предметную область | ||
* Наряду с Medline они {{abbr|норвежский русский aka рюссеношк: от норвежского å søke, искать. Удобное слово|сёкают}} по дополнительным каталогам, которые содержат инфу по статьям, | * Наряду с Medline они также {{abbr|норвежский русский aka рюссеношк: от норвежского å søke, искать. Удобное слово|сёкают}} по дополнительным каталогам, которые содержат инфу по статьям, не попавшим в Medline (неопубликованные, не биомед тематики и т.д. <ref>https://www.nlm.nih.gov/bsd/difference.html</ref>). | ||
{|class="wikitable" | {|class="wikitable" | ||
!colspan="2"|У кого сколько | |||
|- | |||
|PubMed||более 30 млн. записей | |||
|- | |- | ||
| | |Medline||более 26 млн. записей | ||
|- | |- | ||
| | |PubMed Central (PMC)||более 5.2 млн. записей | ||
|} | |} | ||
==Адреса== | |||
* [https://pubmed.ncbi.nlm.nih.gov/ pubmed.ncbi.nlm.nih.gov − Пабмед аз из] | * [https://pubmed.ncbi.nlm.nih.gov/ pubmed.ncbi.nlm.nih.gov − Пабмед аз из] | ||
* [https://pubmed.ncbi.nlm.nih.gov/advanced/ Расширенный поиск] | * [https://pubmed.ncbi.nlm.nih.gov/advanced/ Расширенный поиск Пабмеда] | ||
* [https://www.ncbi.nlm.nih.gov/ Еще более расширенный поиск] | * [https://www.ncbi.nlm.nih.gov/ Еще более расширенный поиск NCBI] | ||
==Entrez== | |||
Пабмед использует поисковый движок под названием Entrez. | |||
== | ==Парсинг== | ||
Автоматический поиск происходит через обычные HTTP GET запросы. Для более чем 2 запросов в секунду требуется ключ. | |||
Получение информации о публикации происходит в два этапа. | |||
# Вначале получают список идентификаторов статей (PMID), удовлетворяющих критериям поиска (совпадение с ключевыми словами в указанных частях). Подробнее: [[Получение id статей на PubMed]] | |||
# По известной id статьи отправляют второй запрос на выдачу информации об этой статье. В ответ, сервер присылает данные в [[MEDLINE_(формат_данных)|формате Medline]] | |||
==Ссылки== | ==Ссылки== | ||
<references /> | <references /> |
Текущая версия от 10:56, 16 марта 2021
PubMed (Пабмед) − библиографическая база данных научных публикаций, в основном биологической и медицинской направленности. Более широко трактуется как совокупность всех библиографических баз данных NCBI (Национального Центра Биотехнологической Информации), куда, наряду с собственно PubMed, входят такие базы данных как PubChem, Gene, PMC и другие.
Самая биомедицинская мякотка концентрируется в базе данных под названием «Medline». В ней ищут интерфейсы вышеназванных тематических баз данных.
Почему есть Medline и есть куча других баз данных? Потому что
- У каждой тематической базы данных есть свой специфический интерфейс, заточенный под ее предметную область
- Наряду с Medline они также сёкают по дополнительным каталогам, которые содержат инфу по статьям, не попавшим в Medline (неопубликованные, не биомед тематики и т.д. [1]).
У кого сколько | |
---|---|
PubMed | более 30 млн. записей |
Medline | более 26 млн. записей |
PubMed Central (PMC) | более 5.2 млн. записей |
Адреса[править]
Entrez[править]
Пабмед использует поисковый движок под названием Entrez.
Парсинг[править]
Автоматический поиск происходит через обычные HTTP GET запросы. Для более чем 2 запросов в секунду требуется ключ.
Получение информации о публикации происходит в два этапа.
- Вначале получают список идентификаторов статей (PMID), удовлетворяющих критериям поиска (совпадение с ключевыми словами в указанных частях). Подробнее: Получение id статей на PubMed
- По известной id статьи отправляют второй запрос на выдачу информации об этой статье. В ответ, сервер присылает данные в формате Medline