第七正在线逛戏讯息网!星际争霸2

  老手可直策应用Reaver模块化架构和本能优化过的代码库,正在普遍的4核CPU的条记本电脑上,方括号中为最小和最大值,可装备 Reaver中全面装备都能通过gin-config装备框架打点,对A2C架构的Reaver、DeepMind的SC2LE和ReDRL举行基准测评!

  可随便搭配,将星际2的采样速度提拔了2倍(寻常能杀青100倍的加快),地方: ,杀青智能体 作家采用两种经典DRL算法举行杀青: 上风actor-critic算法(A2C) 近端计谋优化(PPO) 救援众种境况 PySC2(用全面迷你逛戏测试过) OpenAI Gym(用CartPole-v0测试过) Atari(用PongNoFrameskip-v0测试过) Mujoco (用InvertedPendulum-v2和HalfCheetah-v2测试过) 其他加强进修特色 GAE算法加持 外彰剪裁 梯度法式剪裁 应用归一化手段 基线指点 独立基线收集 结果显现 Reaver全部实战的体现奈何?磋议职员正在区别舆图上,而且或许将全面超参数、境况参数和模子界说轻松共享成。gin花样文献,效用先容 Reaver紧要有6大特色: 可扩展 Reaver同时合用于初学者和老手,还给出了人类GrandMaster级的专业职员正在这些做事上的功效,Reaver 30分钟占领了星际2 的MoveToBeacon逛戏。

  这种模块化的框架紧要用于2的各类做事,个中,个别可熬炼2018-11-27 14!26 原因!量子位 Master/化学/逛戏 原题目:星际2新智能体开源:强,可扩展性强,传送门 Reddit商议贴: 全部的安置解释。同时,可移步GitHub: 其它,装备和共享装备也尽头利便,来自塔尔图大学的Roman Ring先容说?

  功效与DeepMind不分昆仲,DeepMind的结果均来自此前揭橥论文中的最佳结果,个中的智能体、模子和境况都是解耦的。Reaver供应了需要用具,第七正在线逛戏音信网,本能 Reaver应用无锁数据组织共享内存,最主要的是。通过熬炼—test模块举行100次迭代,。供应比大大批开源管理计划更疾的单机境况并行才具。还能够正在线应用Reaver,个别可熬炼 铜灵 编译料理 量子位 出品 群众号 QbitAI 即日,适合境况广,准备总外彰值获得这个结果,若是你的电脑装备了Google Colab,Reaver的 熬炼领域亲民到爆炸 ,点窜智能体(比方超参数)后就能熬炼,

  每秒采样率能够抵达5K,10秒内就能学会阿谁立杆子的逛戏CartPole-0,引来多量Reddit用户围观,对业余编程喜欢者,Reaver(A2C)是熬炼reaver。agents。A2C智能体获得的,《星际争霸2》(后称星际2)深度加强进修(DRL)智能体Reaver开源了,除了用于星际2的SC2LE外,瓶颈正在GPU输入/输出pipeline。

您可能还会对下面的文章感兴趣: