Как парсить PubMed: различия между версиями

Материал из hpluswiki
Перейти к навигации Перейти к поиску
Нет описания правки
 
(не показано 16 промежуточных версий этого же участника)
Строка 1: Строка 1:
'''PubMed (Пабмед)''' − библиографическая база данных научных публикаций, в основном биологической и медицинской направленности. Более широко трактуется как совокупность всех библиографических баз данных NCBI (Национального Центра Биотех Информации), куда, наряду с собственно PubMed, входят такие базы данных как PubChem, Gene, PMC и другие.
'''PubMed (Пабмед)''' − библиографическая база данных научных публикаций, в основном биологической и медицинской направленности. Более широко трактуется как совокупность всех библиографических баз данных NCBI (Национального Центра Биотехнологической Информации), куда, наряду с собственно PubMed, входят такие базы данных как PubChem, Gene, PMC и другие.


Самая биомедиинская мякотка концентрируется в базе данных под названием «Medline». В ней ищут интерфейсы вышеназванных тематических баз данных.
Самая биомедицинская мякотка концентрируется в базе данных под названием «Medline». В ней ищут интерфейсы вышеназванных тематических баз данных.


Почему есть Medline и есть куча других баз данных? Потому что
Почему есть Medline и есть куча других баз данных? Потому что
* У каждой тематической базы данных есть свой специфический интерфейс заточенный под предметную область
* У каждой тематической базы данных есть свой специфический интерфейс, заточенный под ее предметную область
* Наряду с Medline они {{abbr|норвежский русский aka рюссеношк: от норвежского å søke, искать. Удобнее произносить, нежели "производят поиск", либо неуклюжее "ищут"|сёкают}} по дополнительным каталогам, которые содержат инфу по статьям, по тем или иным причинам не попавшим в Medline (неопубликованные, не биомед тематики и т.д. <ref>https://www.nlm.nih.gov/bsd/difference.html</ref>).
* Наряду с Medline они также {{abbr|норвежский русский aka рюссеношк: от норвежского å søke, искать. Удобное слово|сёкают}} по дополнительным каталогам, которые содержат инфу по статьям, не попавшим в Medline (неопубликованные, не биомед тематики и т.д. <ref>https://www.nlm.nih.gov/bsd/difference.html</ref>).


Но на самом деле, база данных то одна, и называется она «Medline». А PubMed, PubChem и иже с ними являются заточенными под предметную область интерфейсами поиска. Так-то оно.
{|class="wikitable"
!colspan="2"|У кого сколько
|-
|PubMed||более 30 млн. записей
|-
|Medline||более 26 млн. записей
|-
|PubMed Central (PMC)||более 5.2 млн. записей
|}


Пабмед использует поисковый движок под названием Entrez.
==Адреса==


* [https://pubmed.ncbi.nlm.nih.gov/ pubmed.ncbi.nlm.nih.gov − Пабмед аз из]
* [https://pubmed.ncbi.nlm.nih.gov/ pubmed.ncbi.nlm.nih.gov − Пабмед аз из]
* [https://pubmed.ncbi.nlm.nih.gov/advanced/ Расширенный поиск]
* [https://pubmed.ncbi.nlm.nih.gov/advanced/ Расширенный поиск Пабмеда]
* [https://www.ncbi.nlm.nih.gov/ Еще более расширенный поиск]
* [https://www.ncbi.nlm.nih.gov/ Еще более расширенный поиск NCBI]
 
==Entrez==
Пабмед использует поисковый движок под названием Entrez.


==Поиск публикаций==
==Парсинг==


===Поиск вручную===
Автоматический поиск происходит через обычные HTTP GET запросы. Для более чем 2 запросов в секунду требуется ключ.
Искать статьи на Пабмеде можно вручную, через [https://www.ncbi.nlm.nih.gov поисковую строку на сайте NCBI]


===Автоматизированный поиск===
Получение информации о публикации происходит в два этапа.
# Вначале получают список идентификаторов статей (PMID), удовлетворяющих критериям поиска (совпадение с ключевыми словами в указанных частях). Подробнее: [[Получение id статей на PubMed]]
# По известной id статьи отправляют второй запрос на выдачу информации об этой статье. В ответ, сервер присылает данные в [[MEDLINE_(формат_данных)|формате Medline]]


==Ссылки==
<references />
<references />

Текущая версия от 10:56, 16 марта 2021

PubMed (Пабмед) − библиографическая база данных научных публикаций, в основном биологической и медицинской направленности. Более широко трактуется как совокупность всех библиографических баз данных NCBI (Национального Центра Биотехнологической Информации), куда, наряду с собственно PubMed, входят такие базы данных как PubChem, Gene, PMC и другие.

Самая биомедицинская мякотка концентрируется в базе данных под названием «Medline». В ней ищут интерфейсы вышеназванных тематических баз данных.

Почему есть Medline и есть куча других баз данных? Потому что

  • У каждой тематической базы данных есть свой специфический интерфейс, заточенный под ее предметную область
  • Наряду с Medline они также сёкают по дополнительным каталогам, которые содержат инфу по статьям, не попавшим в Medline (неопубликованные, не биомед тематики и т.д. [1]).
У кого сколько
PubMed более 30 млн. записей
Medline более 26 млн. записей
PubMed Central (PMC) более 5.2 млн. записей

Адреса[править]

Entrez[править]

Пабмед использует поисковый движок под названием Entrez.

Парсинг[править]

Автоматический поиск происходит через обычные HTTP GET запросы. Для более чем 2 запросов в секунду требуется ключ.

Получение информации о публикации происходит в два этапа.

  1. Вначале получают список идентификаторов статей (PMID), удовлетворяющих критериям поиска (совпадение с ключевыми словами в указанных частях). Подробнее: Получение id статей на PubMed
  2. По известной id статьи отправляют второй запрос на выдачу информации об этой статье. В ответ, сервер присылает данные в формате Medline

Ссылки[править]