Skip to content

Преобразовать таблицы из государственных докладов «О состоянии и использовании минерально-сырьевых ресурсов Российской Федерации» в открытые данные #22

@ivbeg

Description

@ivbeg

Цель

На портале Минприроды опубликованы государственные доклады http://www.mnr.gov.ru/regulatory/list.php?part=1257 в которых приведены цифры и таблицы с состоянием минирально-сырьевых ресурсов по территориям, городам и индикаторам

Необходимо проанализировать эти отчёты, спроектировать структуры данных и извлечь данные из докладов и выложить их как открытые данные.

Задача

  • выбрать язык программирования Python / R или иной, на выбор
  • проанализировать структуру докладов и описать её
  • написать парсер для докладов http://www.mnr.gov.ru/regulatory/list.php?part=1257
  • выгрузить все данные в формате CSV или JSON или XML
  • загрузить набор данных на github и на хаб открытых данных hubofdata.ru

Требования

  • открытый исходный код в Github под свободной лицензией
  • открытые данные под лицензией Creative Commons
  • загрузить данные на Хаб открытых данных https://hubofdata.ru

Пожелания

  • сделать описание к выгруженным данным. Структуры данных и набора целиком.

Оценки трудоёмкости

Ожидаемое время на задачу не более 3 недель

Вспомогательные материалы:

Вопросы

Вопросы можно писать на [email protected] или в комментариях к этой задаче

Metadata

Metadata

Assignees

No one assigned

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions