▼
自从 OpenAI 的 ChatGPT 聊天机器人面世后,全球掀起“AI 热”,大大小小开发者努力从各网站寻找训练 的资料。最近 Reddit 用户akhudek发现 Reddit 更新 API 使用条款,如果以用户回复当成 训练资料须先取得同意。
Reddit 稍早更新 API 使用条款,明确规定 开发者需取得 Reddit 用户许可,才可使用训练机器学习(Machine Learning)或人工智慧模型(AI model)。
▲ Reddit 18 日更新的 API 使用条款(绿色底线处)。
Reddit 自 2005 年面世后经历 18 个寒暑,每日近 5,700 万人次拜访论坛,且话题天南地北,从化妆到电脑游戏,甚至量子力学也有专属社群。由于牵涉的话题之广,内容之深,使 Reddit 各种对话对 Google、 等人工智慧公司都是绝佳训练资料来源。Reddit 更新使用条款后,不再自动授权开发者使用 API 训练 AI。
Reddit 创办人兼行政总裁 Steve Huffman 接受 New York Times 采访时表示 ,Reddit 的语料库(Corpus)很有价值,没必要提供世界性大公司免费的语料库资料。Huffman 说 Reddit 的语料库之所以有价值,是因 Reddit 讨论比其他网站真实贴切:“Reddit 很多内容只能在心理治疗师、匿名戒酒会(Anonymous Alcoholics,AA)等互助小组听到。”
▲ Steven Huffman。(Source:Web Summit, CC BY 2.0, via Wikimedia Commons)
Huffman 重申 Reddit 仍会免费提供 API 给第三方 Reddit 应用程式开发者,但大型人工智慧模型公司需付费。新 API 使用条款将于 6 月 19 日生效。
- Reddit Wants to Get Paid for Helping to Teach Big A.I. Systems
- Reddit’s upcoming API changes will make AI companies pony up
(本文由 Unwire HK 授权转载;首图来源:Unsplash)
▼