AI 搜索?4o语音?我们只要GPT-5!

2024-07-26 23:18   美国  

上钟!

昨天晚上发文有点晚,算是卡点发的,刚发完OpenAI就放出一款名为 SearchGPT 的 AI 搜索产品,利用 GPT-4 系列模型驱动,目前在内测据官方称目前只对 10000 名测试用户开放。要体验需要注册并等待邮件通知。Sam Altman 在 X 上展示了该产品,并表示此搜索方式将显著提升用户体验。

不过看拿到内测的推友测评,风评也不是很好,不过也提到是测试版本,Sam同时透露 GPT-4o 的语音功能将在下周向 Plus 会员推出 Alpha 版本。之前文章提到过这事,已经是第二次网友问到了!

有兴趣的读者朋友可以去等待排队。

内测申请链接:https://chatgpt.com/search

总的来说,近期头部们的脚步都开始放缓了,也更注重合规安全问题了,变得更内敛,但偶尔会出现让人眼前一亮的idea或者项目啦!这是一个有趣的现象!,逐渐迈向一个新纪元

每次都有人在下面问GPT-5什么时候发,根据之前透漏的模型等级能力来看,gpt-5的能力非常强大,随随便便吊打人类!在合规安全没确认好之前,OpenAI有也不敢发~

歪果仁做b端有优势,国内在c端(主要集中在游戏、教育、社交)目前国内最大的优势就是市场规模、产业集中度和场景配套,至于技术领先由于人员流动很快,OpenAI很难保证一直持续领先,因此技术领先通常保持在6~12个月之间。(不过说实话中国人出海创业素质真的吊打歪果仁,到哪都是卷!)

个人觉得找好自己的定位,别人卷就让别人卷去吧!试着把频率降下来!

......

1.今天智谱正式推出视频生成工具「清影」,让用户可以通过输入文字或图片,快速生成时长6秒、分辨率1440x960的高精度视频。清影的特点包括对风景、动物、科幻、人文历史等内容的优良表现,支持卡通、真实摄影、二次元动漫等风格,生成视频的类型包括文生视频和图生视频。
清影依托自研视频生成大模型CogVideoX,采用高效的三维变分自编码器结构和因果三维卷积技术,实现了推理速度的显著提升,并通过视频理解模型生成高质量描述文本,提高了模型的指令遵循度。读者朋友感兴趣可以直接在智谱清言的PC端和App上使用体验。(说实话今天本猫怒氪5rmb体验不是很好哈哈哈)
2.吃个瓜!Gen-3视频生成模型的Runway公司,近期被曝出在互联网上大量收集高质量视频资源,用于训练其AI模型。泄露的内部文件显示,Runway动员全公司员工,利用YouTube-DL等开源软件和代理IP地址,从YouTube、迪士尼、Netflix、索尼等平台,以及14个盗版网站上下载视频资源。
文件还列出详细的关键词和员工负责的任务,以搜集特定主题和风格的视频内容。(目前头部公司数据饥渴,保持定力抵御诱惑真的很难!)
3.OpenAI提出了一种提高模型安全性的新方法,通过基于规则的奖励(RBR)提高了AI模型的安全性,使其无需大量人工数据即可安全运行。RBR使用明确的规则评估模型输出,确保其符合安全标准。与人类反馈相比,RBR更高效,无需大量人工收集即可安全运行,并且可以快速更新规则以适应新的安全政策。
论文地址:https://cdn.openai.com/rule-based-rewards-for-language-model-safety.pdf
代码地址:https://github.com/openai/safety-rbr-code-and-data
4. Stable AI 更新两个新功能来扩展 Stable Assistant 的功能:
Inpaint:用新内容替换指定区域,生成无休止的迭代。
🫥擦除:删除指定区域中不需要的对象或瑕疵。
5.DeepSeek API 更新啦!包括 JSON Output、Function Calling、对话前缀续写(Beta)、8K 最长输出(Beta)和 FIM 补全(Beta)功能,增强了模型的交互和输出能力。用户可通过设置特定参数和使用 Beta 功能,利用这些新特性进行更灵活和高效的文本处理和内容生成。(具体可以参考官方API文档)
https://platform.deepseek.com/api-docs/zh-cn/
6.发现一款有意思的AI小工具,感兴趣可以去体验
体验链接:https://card.pomodiary.com/
今天晚上就先到这吧
......

彩虹之眼
彩虹之眼(Rainbow Eye)-神秘而强大的 AI 情报组织。
 最新文章