NNI (Neural Network Intelligence) 是一个轻量但强大的工具包,帮助用户自动的进行特征工程,神经网络架构搜索,超参调优以及模型压缩。
NNI 管理自动机器学习 (AutoML) 的 Experiment,调度运行由调优算法生成的 Trial 任务来找到最好的神经网络架构和/或超参,支持各种训练环境,如[本机](docs/zh_CN/TrainingService/LocalMode. md),[远程服务器](docs/zh_CN/TrainingService/RemoteMachineMode. md),[OpenPAI](docs/zh_CN/TrainingService/PaiMode. md),[Kubeflow](docs/zh_CN/TrainingService/KubeflowMode. md),[基于 K8S 的 FrameworkController(如,AKS 等)](docs/zh_CN/TrainingService/FrameworkControllerMode. md), [DLWorkspace](docs/zh_CN/TrainingService/DLTSMode. md) (又称 DLTS), AML (Azure Machine Learning) 以及其它环境。
- 想要在自己的代码、模型中试验不同的自动机器学习算法。
- 想要在不同的环境中加速运行自动机器学习。
- 想要更容易实现或试验新的自动机器学习算法的研究员或数据科学家,包括:超参调优算法,神经网络搜索算法以及模型压缩算法。
- 在机器学习平台中支持自动机器学习。
NNI 提供命令行工具以及友好的 WebUI 来管理训练的 Experiment。 通过可扩展的 API,可定制自动机器学习算法和训练平台。 为了方便新用户,NNI 内置了最新的自动机器学习算法,并为流行的训练平台提供了开箱即用的支持。
下表中,包含了 NNI 的功能,同时在不断地增添新功能,也非常希望您能贡献其中。
支持的框架和库 | 算法 | 训练平台 | |
内置 |
|
超参调优
|
|
参考 |
NNI 支持并在 Ubuntu >= 16.04, macOS >= 10.14.1, 和 Windows 10 >= 1809 通过了测试。 在 python 64-bit >= 3.6
的环境中,只需要运行 pip install
即可完成安装。
Linux 或 macOS
python3 -m pip install --upgrade nni
Windows
python -m pip install --upgrade nni
如果想试试最新代码,可参考从源代码安装 NNI。
Linux 和 macOS 下 NNI 系统需求参考这里 ,Windows 参考这里。
注意:
- 如果遇到任何权限问题,可添加
--user
在用户目录中安装 NNI。 - 目前,Windows 上的 NNI 支持本机,远程和 OpenPAI 模式。 强烈推荐使用 Anaconda 或 Miniconda 在 Windows 上安装 NNI。
- 如果遇到如
Segmentation fault
等错误参考常见问题。 Windows 上的 FAQ 参考在 Windows 上使用 NNI。
以下示例基于 TensorFlow 1.x 。确保运行环境中使用的的是 ** TensorFlow 1.x**。
-
通过克隆源代码下载示例。
git clone -b v1.8 https://github.com/Microsoft/nni.git
-
运行 MNIST 示例。
Linux 或 macOS
nnictl create --config nni/examples/trials/mnist-tfv1/config.yml
Windows
nnictl create --config nni\examples\trials\mnist-tfv1\config_windows.yml
-
在命令行中等待输出
INFO: Successfully started experiment!
。 此消息表明 Experiment 已成功启动。 通过命令行输出的Web UI url
来访问 Experiment 的界面。
INFO: Starting restful server...
INFO: Successfully started Restful server!
INFO: Setting local config...
INFO: Successfully set local config!
INFO: Starting experiment...
INFO: Successfully started experiment!
-----------------------------------------------------------------------
The experiment id is egchD4qy
The Web UI urls are: http://223.255.255.1:8080 http://127.0.0.1:8080
-----------------------------------------------------------------------
You can use these commands to get more information about the experiment
-----------------------------------------------------------------------
commands description
1. nnictl experiment show show the information of experiments
2. nnictl trial ls list all of trial jobs
3. nnictl top monitor the status of running experiments
4. nnictl log stderr show stderr log content
5. nnictl log stdout show stdout log content
6. nnictl stop stop an experiment
7. nnictl trial kill kill a trial job by id
8. nnictl --help get help information about nnictl
-----------------------------------------------------------------------
- 在浏览器中打开
Web UI url
,可看到下图的 Experiment 详细信息,以及所有的 Trial 任务。 查看这里的更多页面。
本项目欢迎任何贡献和建议。 大多数贡献都需要你同意参与者许可协议(CLA),来声明你有权,并实际上授予我们有权使用你的贡献。 有关详细信息,请访问 https://cla.microsoft.com。
当你提交拉取请求时,CLA机器人会自动检查你是否需要提供CLA,并修饰这个拉取请求(例如,标签、注释)。 只需要按照机器人提供的说明进行操作即可。 CLA 只需要同意一次,就能应用到所有的代码仓库上。
该项目采用了 Microsoft 开源行为准则 。 有关详细信息,请参阅常见问题解答,如有任何疑问或意见可联系 [email protected]。
熟悉贡献协议后,即可按照 NNI 开发人员教程,创建第一个 PR:
- 推荐新贡献者先从简单的问题开始:'good first issue' 或 'help-wanted'。
- NNI 开发环境安装教程
- 如何调试
- 如果有使用上的问题,可先查看常见问题解答。如果没能解决问题,可通过 Gitter 联系 NNI 开发团队或在 GitHub 上 报告问题。
- 自定义 Tuner
- 实现定制的训练平台
- 在 NNI 上实现新的 NAS Trainer
- 自定义 Advisor
经作者许可的一些 NNI 用法示例和相关文档。
-
- 在 NNI 中运行 ENAS
- NNI 中的自动特征工程
- 使用 NNI 的 矩阵分解超参调优
- scikit-nni 使用 NNI 为 scikit-learn 开发的超参搜索。
-
- 超参数优化的对比
- 神经网络结构搜索的对比
- 并行化顺序算法:TPE
- 使用 NNI 为 SVD 自动调参
- 使用 NNI 为 SPTAG 自动调参
- 使用 NNI 为 scikit-learn 查找超参
- 博客 - AutoML 工具(Advisor,NNI 与 Google Vizier)的对比 作者:@gaocegege - kubeflow/katib 的设计与实现的总结与分析章节
- 博客 - NNI 2019 新功能汇总 by @squirrelsc
- 在 GitHub 上提交问题。
- 在 Stack Overflow 上使用 nni 标签提问。
- 在 Gitter 中参与讨论。
加入聊天组:
Gitter | 微信 | |
---|---|---|
或 |
以探索先进技术和开放为目标,Microsoft Research (MSR) 还发布了一些相关的开源项目。
- OpenPAI:作为开源平台,提供了完整的 AI 模型训练和资源管理能力,能轻松扩展,并支持各种规模的私有部署、云和混合环境。
- FrameworkController:开源的通用 Kubernetes Pod 控制器,通过单个控制器来编排 Kubernetes 上所有类型的应用。
- MMdnn:一个完整、跨框架的解决方案,能够转换、可视化、诊断深度神经网络模型。 MMdnn 中的 "MM" 表示 model management(模型管理),而 "dnn" 是 deep neural network(深度神经网络)的缩写。
- SPTAG : Space Partition Tree And Graph (SPTAG) 是用于大规模向量的最近邻搜索场景的开源库。
我们鼓励研究人员和学生利用这些项目来加速 AI 开发和研究。
代码库遵循 MIT 许可协议