## Цель На портале Минприроды опубликованы государственные доклады http://www.mnr.gov.ru/docs/gosudarstvennye_doklady/o_sostoyanii_i_ispolzovanii_vodnykh_resursov_rossiyskoy_federatsii/ в которых приведены цифры и таблицы с состоянием водных ресурсов по территориям, городам и индикаторам Необходимо проанализировать эти отчёты, спроектировать структуры данных и извлечь данные из докладов и выложить их как открытые данные. ## Задача - выбрать язык программирования Python / R или иной, на выбор - проанализировать структуру докладов и описать её - написать парсер для докладов http://www.mnr.gov.ru/regulatory/list.php?part=1253 - выгрузить все данные в формате CSV или JSON или XML - загрузить набор данных на хаб открытых данных hubofdata.ru ## Требования - открытый исходный код в Github под свободной лицензией - открытые данные под лицензией Creative Commons ## Пожелания - сделать описание к выгруженным данным. Структуры данных и набора целиком. ## Оценки трудоёмкости Ожидаемое время на задачу не более 3 недель ## Вспомогательные материалы: - Каталог государственных докладов http://www.mnr.gov.ru/docs/gosudarstvennye_doklady/o_sostoyanii_i_ispolzovanii_vodnykh_resursov_rossiyskoy_federatsii/ ## Вопросы Вопросы можно писать на ibegtin@infoculture.ru или в комментариях к этой задаче