Как парсить PubMed: различия между версиями

774 байта добавлено ,  16 марта 2021
Нет описания правки
 
(не показано 14 промежуточных версий этого же участника)
Строка 1: Строка 1:
'''PubMed (Пабмед)''' − библиографическая база данных научных публикаций, в основном биологической и медицинской направленности. Более широко трактуется как совокупность всех библиографических баз данных NCBI (Национального Центра Биотех Информации), куда, наряду с собственно PubMed, входят такие базы данных как PubChem, Gene, PMC и другие.
'''PubMed (Пабмед)''' − библиографическая база данных научных публикаций, в основном биологической и медицинской направленности. Более широко трактуется как совокупность всех библиографических баз данных NCBI (Национального Центра Биотехнологической Информации), куда, наряду с собственно PubMed, входят такие базы данных как PubChem, Gene, PMC и другие.


Самая биомедиинская мякотка концентрируется в базе данных под названием «Medline». В ней ищут интерфейсы вышеназванных тематических баз данных.
Самая биомедицинская мякотка концентрируется в базе данных под названием «Medline». В ней ищут интерфейсы вышеназванных тематических баз данных.


Почему есть Medline и есть куча других баз данных? Потому что
Почему есть Medline и есть куча других баз данных? Потому что
* У каждой тематической базы данных есть свой специфический интерфейс заточенный под предметную область
* У каждой тематической базы данных есть свой специфический интерфейс, заточенный под ее предметную область
* Наряду с Medline они {{abbr|норвежский русский aka рюссеношк: от норвежского å søke, искать. Удобное слово|сёкают}} по дополнительным каталогам, которые содержат инфу по статьям, по тем или иным причинам не попавшим в Medline (неопубликованные, не биомед тематики и т.д. <ref>https://www.nlm.nih.gov/bsd/difference.html</ref>).
* Наряду с Medline они также {{abbr|норвежский русский aka рюссеношк: от норвежского å søke, искать. Удобное слово|сёкают}} по дополнительным каталогам, которые содержат инфу по статьям, не попавшим в Medline (неопубликованные, не биомед тематики и т.д. <ref>https://www.nlm.nih.gov/bsd/difference.html</ref>).
 
Пабмед использует поисковый движок под названием Entrez.


{|class="wikitable"
{|class="wikitable"
+Кто чего сколько содержит:
!colspan="2"|У кого сколько
|-
|PubMed||более 30 млн. записей
|-
|-
|PubMed||30 млн. записей  
|Medline||более 26 млн. записей  
|-
|-
|Medline||26 млн. записей  
|PubMed Central (PMC)||более 5.2 млн. записей  
|}
|}
==Адреса==


* [https://pubmed.ncbi.nlm.nih.gov/ pubmed.ncbi.nlm.nih.gov − Пабмед аз из]
* [https://pubmed.ncbi.nlm.nih.gov/ pubmed.ncbi.nlm.nih.gov − Пабмед аз из]
* [https://pubmed.ncbi.nlm.nih.gov/advanced/ Расширенный поиск]
* [https://pubmed.ncbi.nlm.nih.gov/advanced/ Расширенный поиск Пабмеда]
* [https://www.ncbi.nlm.nih.gov/ Еще более расширенный поиск]
* [https://www.ncbi.nlm.nih.gov/ Еще более расширенный поиск NCBI]
 
==Entrez==
Пабмед использует поисковый движок под названием Entrez.


==Поиск публикаций==
==Парсинг==


===Поиск вручную===
Автоматический поиск происходит через обычные HTTP GET запросы. Для более чем 2 запросов в секунду требуется ключ.
Искать статьи на Пабмеде можно вручную, через [https://www.ncbi.nlm.nih.gov поисковую строку на сайте NCBI]


===Автоматизированный поиск===
Получение информации о публикации происходит в два этапа.
# Вначале получают список идентификаторов статей (PMID), удовлетворяющих критериям поиска (совпадение с ключевыми словами в указанных частях). Подробнее: [[Получение id статей на PubMed]]
# По известной id статьи отправляют второй запрос на выдачу информации об этой статье. В ответ, сервер присылает данные в [[MEDLINE_(формат_данных)|формате Medline]]


==Ссылки==
==Ссылки==
<references />
<references />