-
Notifications
You must be signed in to change notification settings - Fork 0
公开视频
该视频由南栖仙策发布,介绍了其开发的强化学习工业决策软件 REVIVE 1.0。REVIVE 是一款数据驱动的强化学习软件,专注于工业场景中的决策任务,旨在帮助企业优化生产效率、减少错误和降低成本,推动工业向智能化和可持续方向发展。视频中还展示了南栖仙策的其他相关教程和内容,包括 REVIVE SDK 的快速入门、基于 VS Code 的开发辅助插件、下载与安装指南,以及强化学习在不同场景中的应用案例。此外,视频还提及了强化学习在工业领域的最新研究和应用进展,适合对强化学习和工业智能化感兴趣的观众。
该视频是关于离线强化学习算法的应用。视频主要介绍了离线强化学习算法的核心概念、技术进展及其在实际场景中的应用案例。通过讲解离线强化学习的特点和优势,视频帮助观众理解如何在不与环境交互的情况下,利用历史数据进行策略优化。
本视频详细介绍了如何使用 REVIVE SDK 解决工业控制中的大滞后控制问题。通过数据驱动的强化学习(离线强化学习)开发工具包,视频首先讲解了大滞后控制的特性及其在工业中的挑战,接着展示了大滞后控制模拟器的工作原理、核心代码以及历史数据的采集方法。随后,视频逐步介绍了如何使用 REVIVE SDK,包括绘制决策流图、数据制作、定义专家函数、生成 yaml 和 npz 文件,并在虚拟环境中分别使用 BC 算法和 REVIVE 算法进行学习,展示了各自的分布直方图和 rollout 曲线图。此外,还定义了奖励函数并进行了策略训练,对比了 BC 算法和 REVIVE 算法在双环境中的控制效果,以及它们在真实环境中的表现。视频最后提供了 REVIVE SDK 的官方下载地址、帮助文档、技术交流 QQ 群和技术支持邮箱,方便观众进一步学习和交流。
本报告探讨了如何将强化学习从游戏环境拓展到工业领域,以提升生产力。
该视频提供了南栖仙策开发的 POLIXIR REVIVE SDK 的详细下载与安装指南。REVIVE SDK 是一款数据驱动的强化学习(离线强化学习)开发工具包,能够在不需要与环境进行额外交互的情况下,从历史数据中学习最优策略。此外,视频还介绍了 REVIVE SDK 的主要功能,包括将历史数据转化为强大的决策引擎,从有限的数据中获取最大效用的策略,并快速应用于不同行业和业务场景中的多步决策任务。该工具已在智能制造、智慧物流、工业控制和用户运营等多个行业中成功验证。
该视频详细介绍了基于 VS Code 的 POLIXIR REVIVE SDK 开发环境及其辅助插件的使用方法。视频首先对 REVIVE SDK 和 POLIXIR REVIVE Extension 进行了简要介绍,展示了其核心功能和应用场景。接着,视频逐步讲解了如何在 VS Code 中安装插件、注册并认证账号、检测开发环境、安装 SDK 以及快速启动训练任务。此外,还介绍了如何通过具体案例进行训练、设计决策流图、配置超参数文件、管理训练日志以及使用 TensorBoard 进行训练分析。最后,视频提供了 REVIVE SDK 的帮助中心、教学视频和反馈交流的链接,方便开发者进一步学习和交流。