Работа с базой данных PubMed: различия между версиями

нет описания правки
Нет описания правки
Строка 1: Строка 1:
== Полный дамп пабмеда ==
* ftp://ftp.ncbi.nlm.nih.gov/pubmed/baseline − фтп архив для свободного скачивания по анонимному логину. В архиве около 50 Гб сжатых файлов вида <code>pubmed<year_when_dumped>n<index>xml.gz</code> содержат около 31 миллиона [[MEDLINE (формат данных)|medline]] записей.
Файлы большие, могут биться при закачке. Поэтому рекомендуется после загрузки проверить контрольные суммы, скачав с сервера файлы .md5. В линуксе проверку по всему массиву файлов можно сделать например так:
<syntaxhighlight lang="bash">md5sum -c pubmed21n*.xml.gz.md5</syntaxhighlight>
==Получение id статей по запросу==
Для получения списка айдишников статей по ключевому слову можно использовать get-запрос:
Для получения списка айдишников статей по ключевому слову можно использовать get-запрос: