再度狙击Open AI:Google版Sora深夜秀肌肉 支持4K视频生成

科技   2024-12-17 22:30   上海  

数智世界风起云涌,互联网新旧迭代,AIGC蓬勃而出。前瞻钱瞻联合m360推出每日科技互联网前瞻,从更全面的视野、更广阔的视域,洞察行业跌宕起伏,在趋势前瞻中把握市场脉动,引领敏捷增长风向标!

今日核心看点:

1、李想疑评极越事件:创业者不要太把自己神话

2、小马智行CEO:2025年Robotaxi生产成本将会下降

3、小红书确定2025年商业化三大方向 产品基建全面提速

4、Kimi发布视觉思考模型k1 多项理科测试行业领先
5、ChatGPT搜索功能向全体用户开放 新增语音搜索服务
6、Google版Sora深夜秀肌肉 支持4K视频生成


李想疑评极越事件:
超大企业创造新业务成功率都低于10%

创业者不要太把自己神话

理想汽车创始人李想发布消息称:“任何一个大行业从0-1的创业初期阶段,我认为还是应该用比成熟大企业更低的成本、更高的效率、更深层的思考,去成为巨头们不太重视的细分领域的小天花板,并对用户有巨大的价值,先做到让一部分用户选择和信任。进入从1-10的阶段,再去补齐短板,扩大地盘。从0-1阶段最大的一个挑战是舆论会说你‘没出息’‘没野心’‘没战略’,然后拿出雷军这样的创业之神的极速增长案例来打击你。超大企业创造新业务的成功率都低于10%。”

李想表示,创业者不要太把自己神话,更不要把自己想象成创业之神的能力和号召力,反而应该绞尽脑汁、挖空心思、脚踏实地、亲力亲为的去完成从0-1,去创造不可替代的用户价值,这是大部分创业者的必经之路,也是大企业创造新业务的必经之路。

在李想看来,创业初期这个阶段,创业者的心力必然来自于身边人的成长(感性)和问题的解决(理性),这两种能量必须学会同时获得,任何单一的能量获取模式都无法支撑巨大的心力挑战。所以,亲自带队打仗、事情亲力亲为是必须的。

小马智行CEO:

2025年Robotaxi生产成本将会下降

近日,小马智行 CEO 彭军接受金融时报采访时表示,2025 年中国 Robotaxi 的生产成本将会下降。

彭军还表示,小马智行将在 2025 年将 Robotaxi 的数量从 250 辆增加至 1000 辆,扩大北上广深的服务范围。

目前小马智行超三分之二的营收来自无人驾驶服务,但彭军表示情况将很快改变,目前正进一步提升 Robotaxi 的生产以及降低其成本。今年内,小马智行已与北汽集团、广汽埃安达成合作,并将计划推出相关的 Robotaxi 车型。该计划将会使每辆 Robotaxi 的生产成本降低至 30 万元人民币。

此前,小马智行已于 11 月 27 日在纳斯达克挂牌上市,上市后该公司市值 45 亿美元。

小红书确定2025年商业化三大方向

产品基建全面提速

小红书商业化业务于近日明确了2025年三大方向: 

第一,行业上从聚焦消费品向满足多行业的需求扩展,重点向生活服务等线索行业突破;

第二,商业产品能力上,更多着力在种草投放之中的优化、种草的投后度量以及客户生意线索的直接交付等;

第三,生态上走向更大开放,未来将直接与更多平台、不同行业商家品牌、MCN机构等形成连接。 

一直以来,广告营销和交易(包括电商、本地生活等)都是小红书最核心的营收业务。广告营销在内部也被称为商业化业务,目前贡献了小红书的主要营收。 

Kimi发布视觉思考模型k1

多项理科测试行业领先 

12 月 16 日,Kimi 发布视觉思考模型 k1。k1 模型基于强化学习技术打造,原生支持端到端图像理解和思维链技术,并将能力扩展到数学之外的更多基础科学领域。在数学、物理、化学等基础科学学科的基准能力测试中,初代 k1 模型的表现超过了全球标杆模型 OpenAI o1、GPT-4o 以及 Claude 3.5 Sonnet。

Kimi 新模型发布即上线。k1 视觉思考模型已陆续上线最新版「Kimi 智能助手」的 Android 和 iPhone 手机 APP 以及网页版 kimi.com。在最新版手机 APP 或网页版 Kimi+ 页面找到「Kimi 视觉思考版」,即可拍照或传图体验。

「Kimi 视觉思考版」会完整呈现推理思维链 CoT,让用户不只看到答题结果,也能完整看到模型思索答案的全过程。

ChatGPT搜索功能向全体用户开放

新增语音搜索服务

OpenAI 在其 12 天发布会的第八天正式宣布,ChatGPT 搜索功能将从即日起向全体 ChatGPT 用户开放。该功能于今年 10 月底正式发布,此前仅向 ChatGPT Plus 和 Team 用户开放移动及网络端的付费搜索服务。

同时,OpenAI 还为用户提供了将 ChatGPT 搜索设为浏览器默认搜索引擎的便利选项。

值得注意的是,OpenAI 正在将 ChatGPT 搜索功能与高级语音模式相结合。这意味着,ChatGPT 现在能够以语音形式搜索网络,并以自然、流畅的对话方式回应用户的问题。例如,如果用户即将前往另一个城市度假,只需询问 ChatGPT 当地的天气情况,内置的搜索功能便能提供最新的天气信息。

Google版Sora深夜秀肌肉

支持4K视频生成

Google Deepmind 推出了新的视频模型 Veo 2 和 Imagen 3。

根据官方介绍,Veo 2 带来了多项重要突破:支持制作高达 4K 分辨率的视频;能够识别指令中的摄像机控制,例如广角、第一人称视角和无人机拍摄;能更真实地模拟物理现象和人类表情变化。

相比其他视频模型常见的「错误生成」问题(如多余手指或意外物体),Veo 2 显著降低了这类错误的出现频率,大幅提升了输出结果的真实度。

在安全性方面,所有由 Veo 2 生成的视频都会嵌入不可见的 SynthID 水印,便于识别其 AI 生成的属性。

Google Labs 的视频生成工具 VideoFX 已集成了 Veo 2 的新功能,同时扩大了用户访问范围。

不过,DeepMind 有意控制推广的速度,计划在明年将 Veo 2 的功能逐步引入 YouTube Shorts 等产品,以在扩展应用范围的同时确保模型质量和安全性。

与此同时,Imagen 3 也实现了重大突破。新版本不仅支持创作多种艺术风格(包括现实主义、幻想、肖像等),能够更精确地将文字描述转化为图像,以及生成更明亮、构图更协调的视觉作品。

此外,Google 还推出了名为 Whisk 的工具。该工具在技术层面整合了最新的 Imagen 3 模型与 Gemini 的视觉理解能力。Gemini 模型可以自动为图像生成详细描述,这些描述随后会作为输入传递给 Imagen 3。用户可以通过导入或创作图像,表达特定主题、场景和风格需求,并将这些元素融合重组,创作数字化产品。



点击阅读原文(http://wap.media360.vip/vip)
欢迎成为m360会员!
m360是每一位用户的超级连接器、前瞻中心及智库。
为您所面临的市场竞争和增长需求,提供整套支持系统。


媒介三六零
m360:科技x商业x媒介 咨询智库平台,致力于推动元宇宙WEB3.0时代,数智互联、商业艺术及媒体创新的融合增长,为行业提供科技、商业、文化、营销趋势风向标,用战略趋势前瞻与分析罗盘,以专业促前进。
 最新文章