阿尔法狗再进化 展现出无师自通的学习能力

1评论 2017-10-19 15:56:00 来源:财经 作者:贺涛 弱市唯一赚钱方法曝光(干货)

【阿尔法狗再进化 展现出无师自通的学习能力】在自我训练40天后,AlphaGo Zero变得更为强大,超越了AlphaGo的前一版本“大师”,“大师”曾折服了围棋世界排名第一的柯洁。这是人工智能(AI)领域的一大步。北京时间10月19日凌晨1点,Nature杂志发表了这篇研究论文。

  在围棋上,AlphaGo Zero已经到达了人类从未涉足的知识疆域,人工智能进入无师自通的新时代。世界上最强大的围棋程序诞生了。对,又是AlphaGo干的。这款名叫AlphaGo Zero的新程序,在没有任何人类数据输入的情况下,经过短短三天的围棋自学,就以100比0的战绩打败了它的“前任”——在2016年击败世界冠军李世石的那款。

阿尔法狗再进化

  在自我训练40天后,AlphaGo Zero变得更为强大,超越了AlphaGo的前一版本“大师”,“大师”曾折服了围棋世界排名第一的柯洁。这是人工智能(AI)领域的一大步。北京时间10月19日凌晨1点,Nature杂志发表了这篇研究论文。

  算法的升级

  以往所有版本的AlphaGo,都是从利用人类棋手的数据培训开始。其特点是基于上百万种专业棋手的下棋步骤,通过“监督式学习”来掌握围棋。就像培养孩子一样,通过人类高手数据的“喂招”,加之不断地反馈,让AlphaGo成长。

  此外,也使用了基于自我对弈的增强学习。就是不给AlphaGo任何指导,只是告诉它围棋输赢的规则,让它自己下棋,并根据输赢的结果总结最优策略。

  AlphaGo的创造者、谷歌旗下的DeepMind公司没有止步于此,而是要探索一种能从零开始、以超人的水平学习复杂概念的算法。于是,AlphaGo Zero诞生了。

  AlphaGo Zero的学习从零开始,且单纯基于与自己的对弈,无需任何人类示例或干预。它仅用到一张神经网络,这张网络经过训练,专门预测程序自身的棋步和棋局的赢家,在每次自我对弈中进步。

  当年首款AlphaGo的训练过程长达几个月,用到多台机器和48个TPU(神经网络训练所需的专业芯片)。而AlphaGo Zero只使用了一台机器和4个TPU,对计算能力的要求降低了一个数量级,而棋力水准反而得到跃升。这表明,算法比所谓的计算能力或数据可用性更重要。

  延伸出新的知识边疆

  AlphaGo Zero还带来了更大的彩蛋。

  “它总结出一些人类目前尚未发现的东西,形成一些极具创意的新知识。” AlphaGo项目的主要负责人戴维·席尔瓦(David Silver)说。AlphaGo不仅在短时间内重新发现了人类经过上千年总结出来的所有围棋知识,如先在角落里落子,它还独创了自己的下法,有些下法甚至是人类从未触及的。

  中国科学院计算技术研究所研究员张云泉对《财经》记者分析,人类棋手为了降低计算需求和追求棋形之美,通过定式等手段对围棋下法进行了大量的简化和限制,从而错失了很多有效的下法,AlphaGo Zero代替人类探索了围棋世界的巨大的空间。

  这正是AlphaGo Zero惊人的地方。随着知识和数据的爆炸,人类已经没有能力学习和掌握所有的新知识并进行创造,而AlphaGo却做到了。作为人类的新知识的助手,去探索发现和总结目前人类能力无法到达的新的知识空间。

  “它可以延伸人类探索发现新知识边疆的能力!”张云泉说。这预示着机器学习将正式进入无师自通时代,一个新时代已经到来。

  需要明晰的是,这并不代表有了AlphaGo Zero,人类经验就没用了,人工智能已经超过人类智力。

  中国科学院自动化研究所复杂系统管理与控制国家重点实验室主任王飞跃认为,在所有“规则界定得非常清楚,而且规则中包含了所有信息”的任务中,机器或程序都应超过人类。正如汽车会跑得比人快,飞机会飞得比人高。围棋属于这个范畴。

  问题是,人工智能在应用中面临的更多挑战是那些规则不清,或者清楚但不包含所有信息的事情。在军事国防、社会经济,特别是日常生活中,大多数应用场景都属于此类,即使人为界定出来的规则可以简化复杂性,但无法确定所有信息。比如,交通规则无法杜绝交通拥堵和事故的发生。也就是说,在目前大多数应用场景下,人工智能还无法超越人类智力。

  成功要复制

  DeepMind公司的使命感很强,他们希望首先解决人工智能问题,然后用人工智能去解决一切其他问题。

  显然,研发出AlphaGo Zero不会让它仅坐在围棋王座上。

  最让戴维·席尔瓦惊喜的,也是它在现实世界里的应用前景。AlphaGo Zero在围棋这个复杂、高挑战的领域能够达到极高水平,意味着可以将它从围棋领域移植到其他领域,建立一种普遍算法,来着手解决对人类来说最棘手、影响最大的难题了。

  “最终,我们希望将这种算法上的突破,用于帮助解决现实世界各种的紧迫问题,如蛋白质折叠、设计新材料。如果我们能在这些问题上做出同样的进步,AlphaGo就有潜力推动人类的知识,并对我们的生活产生积极的影响。”DeepMind联合创始人兼首席执行官戴密斯·哈萨比斯(Demis Hassabis)说。

关键词阅读:阿尔法狗再进化

责任编辑:Robot RF13015
快来分享:
评论 已有 0 条评论
精彩推荐
刘强东案又刷屏!外媒曝光细节:女学生留床单当证据

2018-09-24 22:12:10来源:中国基金报

华尔街投行:2020年亚马逊股价再涨55%达到3000美元

2018-09-26 05:02:52来源:金融界网站

特朗普警告言论刺激市场 原油收涨布油再创四年新高

2018-09-26 04:26:16来源:金融界网站

静待美联储货币政策决议 美股收盘涨跌互现

2018-09-26 04:48:07来源:金融界网站

中国概念股周一收盘多数下跌 趣头条跌逾15%

2018-09-25 04:37:05来源:金融界网站

牛电科技提交招股书 大股东李一男间曾因内幕交易入狱

2018-09-26 06:48:29来源:中国基金报

中概股教育板块:你选新东方、好未来还是达内科技?

2018-06-14 05:13:33来源:金融界网站

富国银行:阿根廷央行行长辞职利空比索

2018-09-26 03:21:46来源:金融界网站

美国消费者信心指数暴涨至18年新高

2018-09-26 03:17:05来源:金融界网站

联储加息预期助力银行股再成上涨先锋 美股微幅高开

2018-09-25 21:34:18来源:金融界网站

钜派投资频爆雷风控何在 这家美股上市机构怎么了?

2018-07-19 14:09:40来源:GPLP

美股动荡 这七只潜力股有望实现大幅上涨!

2018-05-19 05:06:15来源:金融界网站

出海记:金融界带你一文读懂互联网家电开创者云米科技

2018-09-25 14:17:38来源:金融界网站

最新!京东4问4答性侵案:刘强东愿意配合调查

2018-09-07 22:52:14来源:中国基金报

2018年美国股市会崩溃吗?

2018-05-16 02:42:02来源:华尔街日报

美媒:趣店上市后股价坐过山车 商业模式遭媒体抨击

2017-10-25 22:43:19来源:华尔街日报

全球供应风险加剧推动 原油大幅收涨

2018-09-19 04:06:33来源:金融界网站

美国科技股泡沫破灭? 美股快到头了?

2018-07-30 17:29:40来源:券商中国

2018年这18只美股或将至少涨25%

2018-01-03 01:25:05来源:金融界网站

以史为鉴 美联储加息周期通常伴随着危机

2018-05-25 00:54:52来源:汇通网

加载更多

更多>> 以下为您的最近访问股
投资内参
全网|财经|股票|理财 24小时点击排行
研报评级

资金查询:

更多>>
股票简称投资评级最新价目标价
徐工机械买入4.09--
格力电器买入38.95--
上汽集团买入29.15--
伊利股份买入24.20--
实时热点