Facebook公布AI学习数据:1.6GB的儿童读物

1评论 2016-02-20 00:53:29 来源:金融界股票 游资亲授打板神技

Facebook公布的部分数据

Facebook公布的部分数据

  Facebook今天公布了用于训练人工智能软件的数据。Facebook的人工智能软件能理解儿童故事,并预测语句中缺漏的单词。

  这一数据集的大小超过1.6GB,是此前发表的一篇相关学术论文的附件。Facebook CEO马克·扎克伯格周四在Facebook上撰文,介绍了Facebook的这项研究。

  他表示:“对计算机来说,语言是最难理解的一类信息。对人类来说,猜测如何完成一个整句可能很简单,但对机器而言并非如此。以往,计算机可以预测简单的单词,例如‘on’或‘at’,以及‘run’和‘eat’等动词,但计算机无法预测类似‘BAll’、‘table’,以及人名等名词。”

  “在这项研究中,我们的团队教会计算机去分析语句的上下文,从而更准确地预测某些困难的单词,例如名词和人名。这通常是语句中最重要的部分。通过分析适当的上下文,计算机可以做出最准确的判断。这样的上下文不能太多也不能太少。我们将这称为‘金凤花原理’。”

  这一数据集来自“古登堡项目”中的图书,未来将被提供给学术研究机构以及其他公司的研究者。这将有助于优化应用的语言理解系统。

  与其他大型互联网公司类似,Facebook此前也曾开源部分人工智能软件的源代码。此外,该公司还分享了人工智能服务器的设计。通过公开数据集,Facebook又提供了更多工具,用于推进人工智能研究。

  雅虎近期公布了13TB的数据集,协助机器学习的研究。不过,这些数据只被提供给学术机构人员。

关键词阅读:Facebook 金凤花 儿童故事 儿童读物 AI

责任编辑:史文瑞 RF13549
快来分享:
评论 已有 0 条评论
资金流向马上开户

资金查询:

证券名称最新价格涨跌幅净流入金额(万)
中国软件85.2510.00%175281.57
东方财富18.506.69%141836.35
四维图新18.189.98%132397.93
同花顺146.9710.00%102486.52
全网|财经|股票|理财 24小时点击排行
研报评级

资金查询:

更多>>
股票简称投资评级最新价目标价
徐工机械买入4.09--
格力电器买入38.95--
上汽集团买入29.15--
伊利股份买入24.20--