从谷歌购买 Reddit 数据训练 AI 说开去

科技   科技   2024-03-02 22:04   广东  

◎ getgrass all over the world


就在这周,Reddit 与 Google 签署了一份价值每年 6000 万美元的长期合作协议,允许后者对 Reddit 用户内容进行访问以训练 AI 模型。Reddit 作为互联网上最大的、真实人类经验数据源之一,拥有独特且庞大的实时人类对话档案库,为搜索、AI 训练和研究提供了宝贵资源。🤦‍♂️


与之对应的,Tumblr 和 WordPress.com 的母公司 Automattic 正与 OpenAI 和 Midjourney 磋商出售用户帖子训练 AI 模型。Automattic 计划发布一个功能设置,允许用户退出与第三方的数据共享,同时他们已经抓取了 Tumblr 上 2014-2023 年发布的所有公开帖子。


类似于 Reddit 和 Tumblr 等内容平台,在广告之外,现在有了出售用户数据用于训练 AI 模型的新收入模式。更加重要的,它还是订阅制,可以持续产生收入。🦥


那我们作为个体怎么办呢?真就又成了人矿?🤔 我在 Google 和 perplexity 上搜了好半天,发现了一个有趣的新项目 — Wynd Network 。


这是一家关注去中心化人工智能领域的初创公司,其首席技术官表示:「我们希望使公共网数据更易于被开源 AI 项目访问,去中心化是唯一能够以兼顾道德和高效的方式实现这一目标的途径。」Wynd Network 在 6 月推出了去中心化的网络资源共享平台 Grass,目前还在测试阶段。🤡


重点讲讲这个 Grass,它的机制是用户将自己未使用的网络资源通过 Wynd Network 出售给公司、实验室等机构,Grass 的买家公司寻求未使用的网络资源来访问更多样化的 IP 地址,进行市场调查或执行网络抓取、训练 AI 等任务。用户通过 Grass 提供自己的闲置带宽资源,同时获得 Grass 赋予的积分,用户将能够每月通过出售带宽获得高达 30 美元的收入。


不管怎么说,这也算是对一种对开源 AI 模型世界数据层面的支持啦!🙋‍♂️

直接上手试试。Grass 目前仅开放了电脑端的 Chorme 插件账户,移动端将在之后陆续推出。进入Getgrass.io,通过邮箱注册账号,然后添加 Grass Extension 浏览器插件。
如果你遇到需要内测码才能注册,可以填写「WMn8Hz3pJSEm8in」试试看。

在插件界面登录之前注册的邮箱账号,显示「Connected」时表示连接成功,保持 wifi 连接状态,就可以持续产生 Grass 积分。需要注意的是,需要关闭 VPN 才能产生积分,用户的积分机制并不固定,受 IP 所处的地理位置和网络环境影响。
翻了不少关于 AI 数据收集的材料,Grass 是目前少数我觉得前景还不错的项目,但也怕发展成了 P2P 种子选手,这其中的数据安全问题,也有待进一步确认。所以,只建议大家尝鲜试试,作为产品设计或者技术架构设计的一点参考。

🤡 🤡

目前 Grass 只有网页端,后续会支持 Android 端,需要搭配浏览器插件使用。

欢迎试玩
https://app.getgrass.io
👆 长按打开 👆
以上,完。感谢阅读。
本文使用 Ulysses 写作, Medium Style 内置 HTML 主题排版。

相关阅读
ChatGPT Plus 和 Midjourney 账号
搞了个产品经理 AI 机器人,开放给大家



i 小声读书
一种简洁观点
 最新文章