你好啊,我是雨飞,见字如面。感谢阅读,期待我们下一次的相遇。
AI编程工具会收集我们的代码数据吗?这个问题确实值得我们谈论下,毕竟自己平时使用写个简单的代码没啥问题,要是在公司使用,或者比较重要的代码被窃取了,就会有潜在的风险。
为此,雨飞挖掘了国内外主流的几个AI编程工具,来看下具体的政策情况。
首先,就是使用最多的Cursor,地址:https://www.cursor.com/security#privacy-mode-guarantee
简单来说,Cursor 集成了 Claude、GPT 以及 Gemini 等多家服务,因此在我们请求的时候,代码数据会调用这几家的API,并发送到 Cursor 的服务器。
当然,Cursor 可以让我们选择开启隐私模式,在此模式下,代码数据就不会被保留,也不会被用于训练模型。但是在请求的时候,部分缓存数据还是会临时存放到 Cursor 的服务器中。
根据Cursor的隐私协议,在没有开启隐私模式下,Cursor是会收集相关的代码数据,并有可能进行训练的。
同样的,在Windsurf的协议中,也有可能会收集用户数据并用于提升模型质量。不同的是,对于付费用户来说,则不会使用他们的数据。
相比国外的AI编程工具,国内的工具在隐私上的说明会更加严格,应该和国内的编程工具都用的自家模型有关系。虽然我的模型效果不行,但是我会注重保护客户的隐私。
比如,阿里的通义灵码,就在协议中明确提到了,不会存储代码数据,但是会在特定条件下使用我们的聊天记录去训练模型。
百度的 Comate,说的比较直白,在模型推理的时候,需要把代码传递给模型,但是不会使用这部分代码去做后续的工作。
字节的 MarsCode,文档做的比较烂,不过也在官网上明确表明了,不会使用用户代码去做训练。
综上所述,所有的 AI 编程工具都是不会存储我们的代码,但是在一些特定的条件下仍然会对我们的信息进行训练,因此在使用的时候一定要注意。
就好比 Cursor 的隐私模式,默认是关闭的,要想开启的话,可以按照下面这个步骤去操作。打开 Cursor Settings,在 General 选项卡中往下滑动,就可以看到隐私模式了,将按钮打开就好了。
如果你觉得这篇文章对你有启发,欢迎点赞收藏转发下。目前运营了两个Cursor交流群,付费、免费的都有,有想一起交流学习的可以添加下方的微信,邀你一起学习。
❤️常驻小尾巴❤️
加微 1060687688,备注「公众号」,送你一份「AI工具与副业变现指南」