Google发布开源强化学习框架

PingWest 品玩 8 月 28 日讯,据 VentureBeat 报道,强化学习是一种人工智能 ( AI ) 技术,它利用奖赏 ( 或惩罚 ) 来驱动代理朝着特定的目标前进。DeepMind 就是利用这种学习方式 AlphaGo。但是强化学习框架存在一些问题,比如需要花很多时间来掌握一个目标,而且总是不灵活,也不稳定。

针对真个问题,Google 提出一个替代方案:基于其机器学习库 TensorFlow 的开源强化学习框架。该强化学习框架基于灵活性、稳定性和重现性三个基本原则开发,目前已发布在GitHub 上。

除了该开源框架外,Google 还推出了一个网站,允许开发人员能快速将针对多个代理的培训运行进行可视化。它还提供经过训练的模型、原始统计日志和 TensorFlow 事件文件,用于与 TensorBoard 一起绘图,TensorBoard 是 Google 开发的用于 TensorFlow 程序的可视化工具套件。

更多精彩请关注我们的微信公众号:Pingwest 品玩

本文系转载自其它媒体或授权刊载,目的在于信息传递,并不代表本站赞同其观点和对其真实性负责,如有新闻稿件和图片作品的内容、版权以及其它问题的,请联系我们。