1636
правок
Denis.s (обсуждение | вклад) м (Denis.s переименовал страницу Получение id статей на PubMed в Работа с базой данных PubMed) |
Denis.s (обсуждение | вклад) Нет описания правки |
||
Строка 1: | Строка 1: | ||
== Полный дамп пабмеда == | |||
* ftp://ftp.ncbi.nlm.nih.gov/pubmed/baseline − фтп архив для свободного скачивания по анонимному логину. В архиве около 50 Гб сжатых файлов вида <code>pubmed<year_when_dumped>n<index>xml.gz</code> содержат около 31 миллиона [[MEDLINE (формат данных)|medline]] записей. | |||
Файлы большие, могут биться при закачке. Поэтому рекомендуется после загрузки проверить контрольные суммы, скачав с сервера файлы .md5. В линуксе проверку по всему массиву файлов можно сделать например так: | |||
<syntaxhighlight lang="bash">md5sum -c pubmed21n*.xml.gz.md5</syntaxhighlight> | |||
==Получение id статей по запросу== | |||
Для получения списка айдишников статей по ключевому слову можно использовать get-запрос: | Для получения списка айдишников статей по ключевому слову можно использовать get-запрос: | ||