写在前面
“【WeThinkIn老实人报】旨在挖掘AI行业的关键新闻和最新技术,同时Rocky会对其中的关键信息进行解读,力求让读者们能从容掌握AI科技潮流。
”
AIGC时代的《三年面试五年模拟》算法工程师求职面试秘籍独家资源:https://github.com/WeThinkIn/Interview-for-Algorithm-Engineer/tree/main
Rocky最新发布Stable Diffusion 3和FLUX.1系列模型的深入浅出全维度解析文章,点击链接直达干货知识:https://zhuanlan.zhihu.com/p/684068402
大家好,我是Rocky。
阅读Rocky创办的《WeThinkIn老实人报》,大家能够获得:
掌握AIGC、传统深度学习以及智能汽车这三个AI行业核心方向的最新进展,能在评论区抒发观点,共同学习交流。 找到让自己灵光一现的关键新闻和最新技术,这对我们的职业生涯非常重要。 理顺国内AI行业头条新闻、全球AI行业头条新闻、AI产业链融资新闻以及AI技术进展头条新闻四大板块,降低我们对未来下一个核心价值(OpenAI式公司和AIGC式技术)的错判率。
本文是《WeThinkIn老实人报》的第三十九期,Rocky本次梳理的周期为2024年12月9号-2024年12月22号。在本期中,Rocky会毫无保留地分享自己的核心观点,希望能给大家带来更多思考与感悟。
So,enjoy(与本文的BGM一起食用更佳哦):
正文开始
目录先行
读前大局观 国内AI行业头条新闻 全球AI行业头条新闻 AI产业链融资新闻 AI技术进展头条新闻
读前大局观
Rocky将工业&科技分为三个维度:
尖端工业&科技:包括新能源、AI、航空航天、军事工业、半导体、新药研发以及细分高精尖行业等。 中端工业&科技:包括汽车、高铁、大飞机、大轮船以及已经突破的曾被宣称是“尖端工业”的产业。 基础工业&科技:包括房地产、基建以及轻工业等基础制造业和基本生活用品业等。
我们目前的发展阶段,首先要解决的是中端工业&科技的市场占有率问题,需要占据全球市场的80%左右,并留下识大体顾大局的20%的海外公司共同成长,共享发展果实。
在基础工业&科技,目前主要是处在降本增效,持续优化的状态。基础工业&科技包含了人们的衣食住行,是跨周期的、市场巨大的产业,依旧有很多机会。
在尖端工业&科技方面,拿AI行业为例,我们目前主要是跟紧全球最新趋势,问题不大的。在AI行业的政策、资本、生产资料、认知等都飞速迭代的当下,国内AI行业的产品落地与弯道超车能力依旧非常强。 此外像新能源、航空航天、军事工业等领域,已经进入与全球伙伴合作的阶段,市场上留下的更多是识大体顾大局的海外合作伙伴。
国内AI行业头条新闻
AIGC产业新闻:
1、百度文小言将接入法律、票务、电商等AI服务化功能,预计覆盖30+行业。
2、蓝色光标与火山引擎达成深度合作,持续深化视频生成与智能体应用。
3、视觉中国与快手科技达成战略合作协议,将共同研发和部署AI多模态大模型。
4、智谱AI上线首款免费多模态模型GLM-4V-Flash,支持图像描述生成、视觉问答等。
5、云从科技携手正浩创新推出国内首个自研多模态智能客服平台,全球客户服务行业步入AI智能体新纪元。
6、阶跃星辰推出Step-1o千亿参数端到端语音大模型,据称是“国内首个千亿参数端到端语音大模型”。
7、腾讯云发布全新一代数据智能平台TCHouse-X,构建大模型时代的数据基础设施。
8、无问芯穹开源全球首款端侧全模态理解模型Megrez-3B-Omni,支持图像理解、音频理解、文本理解。
9、月之暗面旗下人工智能助手Kimi发布全新视觉思考模型k1,数理化测试成绩超OpenAI o1模型。
10、金山办公:即日起至明年1月22日,WPS AI将免费解锁AI生成PPT、AI风格克隆、AI滤镜和PPT模板四项功能。
11、比亚迪宣布成立先进技术研发中心,以加强在AI和大模型领域的投入。
12、微信公众号新增“作者朗读音色”功能:可生成作者音色全文音频。
13、360集团牵头成立大模型安全联盟,联合企业及学术院校等共筑国家AI安全防线。
14、字节跳动旗下火山引擎发布豆包视觉理解模型,多模态定价迈入“厘时代”。
Rocky观点:2024年下半年,以大模型为核心延伸到落地应用与商业化,大模型的发布数量明显减少了,迭代优化和存量厮杀尤为明显。在ToC、ToB两个方向上同时打响价格战,全面进入大模型你死我活厮杀的关键阶段。
新能源产业新闻:
1、华为与中国华能集团签署战略合作协议,华能-华为新能源联合创新实验室揭牌。
2、中国中化旗下中化新能源自主建设的首座出租车换电站在北京正式投入运营,88秒即可满电出发。
3、京东物流推出行业首个全类别标准认证碳足迹管理SaaS产品,助力降低社会物流成本。
4、雅迪电动两轮车全球累计销量超一亿台,成为全球新能源出行领域首个销量突破一亿台的品牌。
5、小米公司:2024小米「人车家全生态」合作伙伴大会将于12月27日在北京国家会议中心举行。
6、亿纬锂能60GWh超级储能工厂在荆门投产,成为华中地区产能最大、产业链条最长的锂电池生产基地。
7、美团无人机取得迪拜首张BVLOS无人机配送商业运营资质证书,迈出全球化运营第一步。
Rocky观点:新能源行业的发展所催生的电动车行业与新制造业,是跨周期的。加上互联网思维,相信可以和特斯拉一起形成合力,让最后存活下来的海外车企们更加识大体、顾大局。
传统深度学习&芯片产业新闻:
1、阿里云与西安市数据局签署数字经济发展合作协议,共同打造西安市政务云算力集群。
2、华为应用市场新增“鸿蒙升级”入口,支持升级HarmonyOS NEXT设备的机型可查看应用适配情况。
3、包钢集团与华为签署战略合作协议,将在稀土数字化、稀土供应等领域合作。
4、博世全球毫米波雷达累计出货量突破1亿件,博世中国本土累计出货量超3000万件。
5、中国石化建成石化领域全球首个数字孪生智能乙烯工厂,推动石化产业智能化生态建设。
6、小米自研系统Vela全面开放源代码:OpenVela项目已上线GitHub和Gitee,采用Apache 2.0协议。
互联网产业新闻:
1、百度电商生态大会将于12月19日在杭州举办,帮助所有电商人寻找乘风而起的新机遇。
2、小米REDMI K80系列手机10天销量突破100万台,刷新K系列最快破百万纪录。
3、小米智能生态:小米智能门锁累计出货突破700万件,品类线上销量连续三年全国第一。
4、毛戈平正式登陆港交所:成为“港股国货彩妆第一股”,总市值达248亿港元。
Rocky观点:“大家不必拘泥于AI行业,360行,只要持续深耕,行行都有出状元的机会。”
5、腾讯会议:自2025年1月起服务模式将逐步升级为免费版、专业版、商业版与企业版,额外提供教育版、教育加强版。
6、阿里巴巴:拟74亿元向雅戈尔集团等出售银泰100%股权,预计亏损约93亿元。
7、开放原子开源基金会:“2024开放原子开发者大会暨首届开源技术学术大会”将于12月20日至21日在武汉召开。
8、小红书举办2025年WILL商业大会:发布“AIPS人群资产模型”,并通过种草联盟打通淘宝、京东、唯品会三大电商平台数据。
商业基本面新闻:
1、世界权威科学期刊《自然》杂志公布2024年度十大人物榜单,两位中国科学家李春来、徐沪济上榜。
2、美国《科学》杂志公布2024年度十大科学突破评选结果,我国发现的最古老多细胞真核生物入选。
3、2024年度《世界品牌500强》发布:中国品牌入选数50个,位居全球第三。
全球AI行业头条新闻
AIGC产业新闻:
1、OpenAI宣布同专业媒体平台Future建立战略合作伙伴关系,后者拥有多家知名科技、游戏媒体。
2、Meta 发布AI模型Llama 3.3:拥有700亿参数,性能媲美4050亿参数的Llama 3.1。
3、微软面向美国地区Copilot Pro用户推出预览版Copilot Vision AI功能,开启AI网页浏览新时代。
4、谷歌领跑AI视频生成赛道:抢先OpenAI Sora推出Veo 2模型,可生成1080P高清视频。
5、Meta推出内部AI工具,以推动进军商业市场。
6、亚马逊AWS宣布推出Amazon Bedrock的多项创新功能,旨在利用高性能基础模型构建和扩展生成式人工智能应用程序。
7、OpenAI正式上线AI视频生成模型Sora,可生成分辨率高达1080p、时长20秒的高清视频。
8、Meta推出SPDL工具:突破训练AI模型数据效率瓶颈,吞吐量提升2-3倍。
9、谷歌正式发布Gemini 2.0,号称是谷歌迄今为止功能最强大的AI模型。
10、OpenAI宣布面向所有ChatGPT用户开放Canvas功能,重点提升用户写作和编码项目的效率。
11、LG发布EXAONE 3.5开源AI模型,同步推出面向LG员工的企业级AI智能体服务ChatEXAONE。
12、马斯克旗下xAI宣布开始向X平台所有用户免费推出新版Grok-2模型。
13、谷歌开始向旗下智能音箱推出Gemini AI新版语音助理,首批覆盖Nest Audio/第二代Mini。
14、OpenAI宣布向所有用户开放ChatGPT搜索功能,新增实时搜索和高级语音。
15、OpenAI开放满血o1模型API:成本暴降60%,附带高级视觉功能。
16、谷歌DeepMind团队发布FACTS Grounding基准,助力AI语言模型提升事实准确性。
17、Meta携手斯坦福大学推出全新AI模型系列Apollo,显著提升机器对视频的理解能力。
Rocky观点:全球的AIGC行业发展都非常迅速,我们需要紧跟AIGC行业的最新进展,将先进的技术工具化,同时思考关键产品的落地逻辑。
新能源产业新闻:
1、欧盟拨款46亿欧元用于推动净零排放技术、电动汽车动力电池制造和可再生氢能的发展。
2、亚马逊首次在美国外市场开展无人机配送,成功在意大利测试空中送货。
3、越南电动车商VinFast宣布将在越南国内建设第二座生产厂,旨在扩大产能。
4、通用汽车宣布其旗下Cruise自动驾驶汽车部门将退出无人驾驶出租车业务,Cruise将和通用汽车的技术团队合并。
5、亚马逊印度配送车队已部署超10000辆电动汽车,加速可持续发展。
6、特斯拉正式进军菲律宾:首个超级充电站上线,4个充电桩助力电动车发展。
传统深度学习&芯片产业新闻:
1、亚马逊停止开发AI推理芯片Inferentia,转而专注于用于训练AI模型的Trainium芯片。
2、英伟达和意大利初创公司iGenius将合作打造世界上最大的AI数据中心之一Colosseum。
3、Meta宣布将投资100亿美元在美国路易斯安那州建立全球最大的人工智能数据中心。
4、世界先进与恩智浦新加坡合资晶圆厂动土,预计2027年量产。
5、谷歌推出量子芯片“Willow”:破解30年重大难题,五分钟完成超算“10的25次方”年的计算。
6、苹果公司计划2025年推出自研的蓝牙+Wi-Fi组合芯片“Proxima”:旨在提升设备性能和能效,减少对博通的依赖。
7、夏普与日本电信巨头KDDI达成共识,力争2025年度全面启动由堺工厂改造的AI数据中心。
8、谷歌发布全新操作系统Android XR,三星头显首发搭载、明年上市。
9、IBM发布新一代光电共封装工艺,有望提高AI模型训练速度。
10、台积电首座日本晶圆厂计划年底大规模量产,2027年投产第二家工厂。
11、亚马逊云科技将在美俄亥俄州追加投资近100亿美元,扩建数据中心基础设施。
12、恩智浦半导体宣布以2.425亿美元全现金收购汽车互联技术公司Aviva Links。
互联网产业新闻:
1、苹果宣布将于2025年在沙特阿拉伯开设苹果在线商店,并在2026年开设首家苹果旗舰店。
2、诺基亚推出全球首款5G技术8K全景摄像机Nokia 360 Camera:支持防水抗震,面向工控市场。
3、三星Premiere 8K成为全球首款获得8K认证的投影仪,开启投影新纪元。
商业基本面新闻:
1、日本零售巨头伊藤洋华堂宣布将进行大规模裁员:计划到2026年2月前裁减约20%的员工,涉及人数达到1000人。
2、AMD首席执行官苏姿丰被《时代》杂志评为“2024年度CEO”。
AI产业链融资新闻
Rocky观点:《WeThinkIn老实人报》将从投资视角与长期主义出发,挖掘初创公司的势能与机会点。
1、马斯克的xAI获60亿美元,估值500亿美元
根据美国SEC公布的文件显示,马斯克旗下的大模型平台xAI获得了60亿美元融资,估值超500亿美元。
本轮融资比上一次的投资者更多,一共有97名,包括很多知名投资机构。
今年的5月27日,xAI就获得过红杉资本、国王控股、沙特王子-Bin Talal等投资的60亿美元,加上这一次一共是120亿美元,超过OpenAI成为今年大模型赛道融资最高,也是整个硅谷融资最高企业。xAI的核心团队由来自DeepMind、OpenAI、谷歌研究院、微软研究院、特斯拉等顶级科技公司的专家组成,这些成员的背景和丰富开发经验经验为xAI的发展打下了坚实的基础。
2、Liquid AI获2.5亿美元融资,创新液态大模型!
AI初创企业Liquid AI在官网宣布获得2.5亿美元A轮融资,估值23亿美元,本次由AMD领投。
Liquid AI推出的“液态大模型”(Liquid Foundation Models,LFM)与传统的Transformer架构有很大的不同,除了推理、计算资源较少之外,还打破了传统AI模仿人类大脑神经网络的设计思路。
LFM的设计灵感来源于秀丽隐杆线虫的神经结构,这是一种微小的生物,长度仅一毫米,却拥有异常高效的神经系统。所以,Liquid AI借鉴了它们的身体结构用在了大模型领域。
传统上,像ChatGPT这样的大模型依赖于复杂的Transformer架构,这需要大量的计算能力和数据来进行预训练,因此成本高昂且难以扩展。LFM能改变这一点,能以更低的成本实现更高的效率,减少了对大型数据中心的依赖。
Rocky观点:等过了2年、3年、5年甚至10年,再回过头来打开本期文章,看看里面的初创公司是飞速成长,还是已经消亡,就能体会到时间的意义。
AI技术进展头条新闻
Rocky观点:《WeThinkIn老实人报》将从工业界出发,以投资、CEO以及CTO视角挖掘技术发展的落地可能性与明星技术的潜力。
1、OpenAI正式发布Sora!
OpenAI正式发布了期待已久的产品——Sora Turbo。
与早期版本相比,Turbo的生成效率更快,能通过文本直接生成最多20秒1080P视频,这是目前全球生成时长最高的视频模型之一,同时支持文本+图片/视频,生成特定视频内容,使得模型的生成效果更加可控。
例如,我们想在一段普通的视频中加上梵高《星夜》的效果,只需要上传原视频然后用文本描述就能轻松实现。也就是说,即便我们不会使用AE、Nuke、C4D等专业视频软件,通过Sora也能为视频轻松添加特效了。
2、谷歌发布Veo 2,支持4K分辨率视频生成!
谷歌Deepmind发布了最新文生视频模型——Veo 2。
Veo 2可直接生成8秒4K视频,同时能根据用户对镜头类型、拍摄角度、电影效果等需求进行精准摄像头生成,包括低角度跟踪镜头、特写镜头等不同类型。
例如,18mm 镜头的广角效果、浅景深聚焦主体,这对于影视媒体制作人员来说帮助巨大。
此外,Veo 2具备很强的物理模拟效果,在动作一致性、光影处理、运动频率以及写真等方面非常优秀。
3、Sora等AI视频大模型的核心原理,核心基础知识,网络结构,经典应用场景,从0到1搭建使用AI视频大模型,从0到1训练自己的AI视频大模型,AI视频大模型性能测评,AI视频领域未来发展等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
Sora等AI视频大模型文章地址:https://zhuanlan.zhihu.com/p/706722494
4、Stable Diffusion 3和FLUX.1核心原理,核心基础知识,网络结构,从0到1搭建使用Stable Diffusion 3和FLUX.1进行AI绘画,从0到1上手使用Stable Diffusion 3和FLUX.1训练自己的AI绘画模型,Stable Diffusion 3和FLUX.1性能优化等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
Stable Diffusion 3和FLUX.1文章地址:https://zhuanlan.zhihu.com/p/684068402
5、Stable Diffusion XL核心基础知识,网络结构,从0到1搭建使用Stable Diffusion XL进行AI绘画,从0到1上手使用Stable Diffusion XL训练自己的AI绘画模型,AI绘画领域的未来发展等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
Stable Diffusion XL文章地址:https://zhuanlan.zhihu.com/p/643420260
6、Stable Diffusion 1.x-2.x核心原理,核心基础知识,网络结构,经典应用场景,从0到1搭建使用Stable Diffusion进行AI绘画,从0到1上手使用Stable Diffusion训练自己的AI绘画模型,Stable Diffusion性能优化等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
Stable Diffusion文章地址:https://zhuanlan.zhihu.com/p/632809634
7、ControlNet核心基础知识,核心网络结构,从0到1使用ControlNet进行AI绘画,从0到1训练自己的ControlNet模型,从0到1上手构建ControlNet商业变现应用等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
ControlNet文章地址:https://zhuanlan.zhihu.com/p/660924126
8、LoRA系列模型核心原理,核心基础知识,从0到1使用LoRA模型进行AI绘画,从0到1上手训练自己的LoRA模型,LoRA变体模型介绍,优质LoRA推荐等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
LoRA文章地址:https://zhuanlan.zhihu.com/p/639229126
9、Transformer核心基础知识,核心网络结构,AIGC时代的Transformer新内涵,各AI领域Transformer的应用落地,Transformer未来发展趋势等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
Transformer文章地址:https://zhuanlan.zhihu.com/p/709874399
10、最全面的AIGC面经《手把手教你成为AIGC算法工程师,斩获AIGC算法offer!(2024年版)》文章正式发布!
码字不易,欢迎大家多多点赞:
AIGC面经文章地址:https://zhuanlan.zhihu.com/p/651076114
11、50万字大汇总《“三年面试五年模拟”之算法工程师的求职面试“独孤九剑”秘籍》文章正式发布!
码字不易,欢迎大家多多点赞:
算法工程师三年面试五年模拟文章地址:https://zhuanlan.zhihu.com/p/545374303
《三年面试五年模拟》github项目地址(希望大家能多多star):https://github.com/WeThinkIn/Interview-for-Algorithm-Engineer
12、Stable Diffusion WebUI、ComfyUI、Fooocus三大主流AI绘画框架核心知识,从0到1搭建AI绘画框架,从0到1使用AI绘画框架的保姆级教程,深入浅出介绍AI绘画框架的各模块功能,深入浅出介绍AI绘画框架的高阶用法等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
AI绘画框架文章地址:https://zhuanlan.zhihu.com/p/673439761
13、GAN网络核心基础知识,网络架构,GAN经典变体模型,经典应用场景,GAN在AIGC时代的商业应用等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
GAN网络文章地址:https://zhuanlan.zhihu.com/p/663157306
推荐阅读
1、加入AIGCmagic社区知识星球
AIGCmagic社区知识星球不同于市面上其他的AI知识星球,AIGCmagic社区知识星球是国内首个以AIGC全栈技术与商业变现为主线的学习交流平台,涉及AI绘画、AI视频、大模型、AI多模态、数字人、全行业AIGC赋能等100+应用方向,内部包含海量学习资源、专业问答、前沿资讯、内推招聘、AI课程、AIGC模型、AIGC数据集和源码等。
那该如何加入星球呢?很简单,我们只需要扫下方的二维码即可。知识星球原价:299元/年,前200名限量活动价,终身优惠只需199元/年。大家只需要扫描下面的星球优惠卷即可享受初始居民的最大优惠:
2、《三年面试五年模拟》算法工程师面试秘籍
《三年面试五年模拟》面试秘籍旨在整理&挖掘AI算法工程师在实习/校招/社招时所需的干货知识点与面试方法,力求让读者在获得心仪offer的同时,增强技术基本面。
Rocky已经将《三年面试五年模拟》面试秘籍的完整版构建在Github上:https://github.com/WeThinkIn/Interview-for-Algorithm-Engineer/tree/main,欢迎大家star!
想要一起进行项目共建的朋友,欢迎点击链接加入项目团队:《三年面试五年模拟》版本更新白皮书,迎接AIGC时代
3、其他
《WeThinkIn老实人报》的第三十九期就完整展现在大家面前了,未来引领AI科技浪潮和变革的要素可能就在其中,每个给本文一键三连的朋友,一定会挖掘到属于自己的机会点!
最后,希望在AIGC时代中,大家能和Rocky一起,飞速成长!
Rocky将YOLOv1-v7全系列大解析文章也制作成相应的pdf版本,大家可以关注公众号WeThinkIn,并在后台 【精华干货】菜单或者回复关键词“YOLO” 进行取用。