您好,欢迎光临书香门第!

书香门第

 找回密码
 注册

“阿尔法狗”再进化:“自学”3天高分赢过旧版

查看: 0|回复: 0
打印 上一主题 下一主题

[新闻娱乐] “阿尔法狗”再进化:“自学”3天高分赢过旧版 [复制链接]

Rank: 19Rank: 19Rank: 19Rank: 19Rank: 19Rank: 19

签到天数: 3091 天

[LV.Master]伴坛终老

金币
987916 枚
威望
1708 点
好评
1 点
爱心值
4 点
钻石
0 颗
贡献值
523 点
帖子
32843
精华
0

书评活动勋章 书香宝贝勋章 活动之星勋章 富翁勋章 发帖达人勋章 出勤勋章 猴 攻德无量 万受无疆 才子 佳人 十周年 签到勋章

鲜花(2708) 鸡蛋(0)
跳转到指定楼层
1#
发表于 2017-10-19 16:36:47 |只看该作者 |倒序浏览


      10月19日消息,谷歌旗下人工智能研究部门DeepMind发布了新版AlphaGo(阿尔法狗)软件,它可以完全靠自己学习围棋。这款名为AlphaGo Zero的系统可以通过自我对弈进行学习,它利用了一种名为强化学习的技术。在不断训练的过程中,这套系统开始靠自己的能力学会围棋中的一些高级概念。

      经过3天的训练后,这套系统已经可以击败AlphaGo Lee,也就是去年击败韩国顶尖棋手李世石的那套系统,而且比分高达100比0。经过40天训练后,它总计运行了大约2900万次自我对弈,使得AlphaGo Zero得以击败AlphaGo Master(今年早些时候击败世界冠军柯洁的系统),比分为89比11。

      结果表明,具体到不同技术的效果,人工智能在这一领域仍有很多学习的空间。AlphaGo Master使用了很多与AlphaGo Zero相同的开发技术,但它需要首先利用人类的数据进行训练,随后才切换成自我对弈。

      值得注意的是,虽然AlphaGo Zero在几周的训练期间学会了一些关键概念,但该系统学习的方法与人类有所不同。另外,AlphaGo Zero也比前几代系统更加节能,AlphaGo Lee需要使用几台机器和48个谷歌TPU机器学习加速芯片。其上一代AlphaGo Fan则要用到176个GPU芯片。AlphaGo Zero只需要使用一台配有4个TPU的机器即可。


===================

PS,新旧比赛结果100:0……人类要完……
鲜花(2708) 鸡蛋(0)

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 注册

回顶部