传微软联手新闻集团旗下哈珀柯林斯 用海量图书数据训练AI模型
据知情人士透露,微软公司与新闻集团旗下的哈珀柯林斯出版公司达成协议,计划利用后者丰富的非小说类图书资源来训练其人工智能模型,以提升模型的质量和性能。这一合作仅限于使用精选的旧书进行模型训练,并不涉及创作新书,且作者有权选择是否参与。
具体而言,微软希望将哈珀柯林斯图书纳入其尚未公布的人工智能模型中,以拓展高质量文本来源,提高模型的准确性和专业知识提供能力。尽管微软拒绝置评,但哈珀柯林斯已证实了这一协议,并表示该协议将“允许有限使用精选的非小说类旧书来训练人工智能模型”。
同时,哈珀柯林斯强调,这一协议的范围有限,对尊重作者权利的模范产出有明确的限制,作者可以选择是否参与。
“我们的任务之一是为作者们创造机遇,让他们深思熟虑,同时确保他们作品的核心价值以及我们共同享有的收入和版税得到保护,”哈珀柯林斯表示。“这份协议范围有限,对那些尊重作者权益的杰出作品设定了明确的界限,它成功地实现了这一目标。”
据了解,科技公司一直在寻找更多高质量文本来源来训练人工智能模型,微软等公司也不例外。他们通过获得许可,使用从社交媒体网站到新闻文章的一系列数据,以使他们的程序更准确、更好地回答问题或提供特定主题的专业知识。
值得一提的是,新闻集团此前已与OpenAI签署协议,允许其使用旗下多家出版物的内容。微软也与多家出版商合作开展人工智能项目。
此外,今年早些时候,谷歌与Reddit达成了一项价值6000万美元的协议,使得这家搜索巨头能够利用大量的subreddits来训练其AI模型。
然而,一些出版商对人工智能公司未经许可引用内容的行为表示不满,并提起诉讼。例如,《纽约时报》起诉了OpenAI和微软,指控其侵犯版权。
综上所述,微软与哈珀柯林斯达成的协议标志着科技公司在寻求高质量文本来源以训练人工智能模型方面的又一重要进展。然而,如何在利用这些资源的同时尊重作者权利,仍是出版商和科技公司需要共同面对的挑战。

- 银行股迎来“黄金买点”?摩根大通预计下半年潜在涨幅高达15%,股息率4.3%成“香饽饽”
- 华润电力光伏组件开标均价提升,产业链涨价传导顺利景气度望修复
- 我国卫星互联网组网速度加快,发射间隔从早期1-2个月显著缩短至近期的3-5天
- 光伏胶膜部分企业上调报价,成本增加叠加供需改善涨价空间望打开
- 广东研究通过政府投资基金支持商业航天发展,助力商业航天快速发展
- 折叠屏手机正逐步从高端市场向主流消费群体渗透
- 创历史季度新高!二季度全球DRAM市场规模环比增长20%
- 重磅!上海加速推进AI+机器人应用,全国人形机器人运动会盛大开幕,机器人板块持续爆发!
- 重磅利好!个人养老金新增三大领取条件,开启多元化养老新时代,银行理财产品收益喜人!
- 重磅突破!我国卫星互联网组网速度创新高,广东打造太空旅游等多领域应用场景,商业航天迎来黄金发展期!
