写在前面
“【WeThinkIn老实人报】旨在挖掘AI行业的关键新闻和最新技术,同时Rocky会对其中的关键信息进行解读,力求让读者们能从容掌握AI科技潮流。
”
WeThinkIn最新福利放送:大家只需关注WeThinkIn公众号,后台回复“简历资源”,即可获取包含Rocky独家简历模版在内的60套精选的简历模板资源,希望能给大家在AIGC时代带来帮助。
AIGC时代的《三年面试五年模拟》算法工程师求职面试秘籍独家资源:https://github.com/WeThinkIn/Interview-for-Algorithm-Engineer/tree/main
Rocky最新发布Stable Diffusion 3和FLUX.1系列模型的深入浅出全维度解析文章,点击链接直达干货知识:https://zhuanlan.zhihu.com/p/684068402
大家好,我是Rocky。
阅读Rocky创办的《WeThinkIn老实人报》,大家能够获得:
掌握AIGC、传统深度学习以及智能汽车这三个AI行业核心方向的最新进展,能在评论区抒发观点,共同学习交流。 找到让自己灵光一现的关键新闻和最新技术,这对我们的职业生涯非常重要。 理顺国内AI行业头条新闻、全球AI行业头条新闻、AI产业链融资新闻以及AI技术进展头条新闻四大板块,降低我们对未来下一个核心价值(OpenAI式公司和AIGC式技术)的错判率。
本文是《WeThinkIn老实人报》的第三十五期,Rocky本次梳理的周期为2024年10月28号-2024年11月10号。在本期中,Rocky会毫无保留地分享自己的核心观点,希望能给大家带来更多思考与感悟。
So,enjoy(与本文的BGM一起食用更佳哦):
正文开始
目录先行
读前大局观 国内AI行业头条新闻 全球AI行业头条新闻 AI产业链融资新闻 AI技术进展头条新闻
读前大局观
Rocky将工业&科技分为三个维度:
尖端工业&科技:包括新能源、AI、航空航天、军事工业、半导体、新药研发以及细分高精尖行业等。 中端工业&科技:包括汽车、高铁、大飞机、大轮船以及已经突破的曾被宣称是“尖端工业”的产业。 基础工业&科技:包括房地产、基建以及轻工业等基础制造业和基本生活用品业等。
我们目前的发展阶段,首先要解决的是中端工业&科技的市场占有率问题,需要占据全球市场的80%左右,并留下识大体顾大局的20%的海外公司共同成长,共享发展果实。
在基础工业&科技,目前主要是处在降本增效,持续优化的状态。基础工业&科技包含了人们的衣食住行,是跨周期的、市场巨大的产业,依旧有很多机会。
在尖端工业&科技方面,拿AI行业为例,我们目前主要是跟紧全球最新趋势,问题不大的。在AI行业的政策、资本、生产资料、认知等都飞速迭代的当下,国内AI行业的产品落地与弯道超车能力依旧非常强。 此外像新能源、航空航天、军事工业等领域,已经进入与全球伙伴合作的阶段,市场上留下的更多是识大体顾大局的海外合作伙伴。
国内AI行业头条新闻
AIGC产业新闻:
1、科大讯飞发布星火大模型4.0 Turbo:七大能力全面超过GPT-4 Turbo,数学能力、代码能力超过GPT-4o。
2、快手:可灵AI用户突破360万,累计生成3700万个视频和超过一亿张图片,独立App即将上线。
Rocky观点:“快手确实通过可灵AI在AIGC时代中异军突起了。”
3、阿里巴巴国际站发布首个全流程AI产品,推出AI生意助手2.0。
4、OPPO与香港理工大学合作成立联合创新研究中心,深化AI影像领域产学研合作。
5、腾讯宣布推出业界参数规模最大、效果最好的开源MoE大语言模型Hunyuan-Large。
6、昆仑万维重磅发布天工AI高级搜索功能,做最懂金融投资、科研学术的AI搜索。
7、天地在线与大账房携手打造“财税有问必答”AI应用,共启财税智能化新篇章。
8、快手数字人直播助残基地项目在河北启动,AI大模型成为“数字助残”新路径。
9、腾讯混元宣布最新的MoE模型“混元Large“以及混元3D生成大模型“Hunyuan3D-1.0”正式开源。
10、阿里巴巴达摩院发布八观气象大模型:精度达1小时1公里,率先落地新能源场景。
Rocky观点:2024年下半年,以大模型为核心延伸到落地应用与商业化,大模型的发布数量明显减少了,迭代优化和存量厮杀尤为明显。在ToC、ToB两个方向上同时打响价格战,全面进入大模型你死我活厮杀的关键阶段。
新能源产业新闻:
1、宝马与奔驰共同推出的高端超充品牌“逸安启”正式发布,首批逸安启超充站开启运营。
2、智驾科技企业地平线正式登陆港交所:募资总额达54.07亿港元,成为今年港股最大科技IPO。
3、全球首个:小鹏汇天飞行汽车智造基地正式动工,规划年产能1万台。
4、华为智能电动DriveONE动力总成达成“百万发货”里程碑,向世界级新能源汽车Tier1供应商迈进。
Rocky观点:新能源行业的发展所催生的电动车行业与新制造业,是跨周期的。加上互联网思维,相信可以和特斯拉一起形成合力,让最后存活下来的海外车企们更加识大体、顾大局。
传统深度学习&芯片产业新闻:
1、千寻位置时空智能“全球通”服务正式商用,助力中国智能终端厂商出海。
2、英特尔宣布增资3亿美元扩容成都封装测试基地,以提高本土供应链水平。
3、百度地图纯血鸿蒙版App上架HarmonyOS NEXT版华为应用市场,支持路线查看、驾车导航等功能。
4、华为自研仓颉编程语言官网正式公开上线,首个公测版本开放下载。
5、戴尔在深圳成立AI智能解决方案中心,提供服务器、以太网与交换机等一系列软硬件基础设施。
6、小红书宣布成功将其业界最大的数据湖迁移至阿里云,历时一年、涉及1500人参与、迁移数据达500PB。
互联网产业新闻:
1、小米发布小米15系列手机、小米澎湃OS 2操作系统、小米SU7 Ultra量产版汽车等16款新品,展示“人车家全生态”战略成果。
2、中国移动宣布千兆宽带用户正式突破1亿,引领数字生活新篇章。
3、2024阿里巴巴全球数学竞赛获奖名单正式公布,共有86名选手获奖。
4、支付宝“碰一下”支付已在杭州全面上线,全市数万家门店接入这一支付服务。
商业基本面新闻:
1、中国商飞:截至目前C919大飞机已累计交付11架,载客70万人次。
2、中国船舶集团:第二艘国产大型邮轮正式命名为“爱达·花城号”,计划在2026年底交付。
Rocky观点:“中级工业&科技领域,必须占有全球80%左右的市场份额,才能促进持续发展。”
3、东航国产大飞机C919通航第6座城市:新增上海虹桥往返太原航线。
4、2024胡润百富榜发布,字节跳动创始人张一鸣以3500亿元的财富首次成为中国首富。
5、中国商飞亚太办事处在新加坡挂牌成立,国产大飞机出海迈出重要一步。
6、中国上市公司协会:前三季度全市场上市公司研发投入达1.10万亿元,同比增长3.9%。
7、神舟十八号载人飞船返回舱成功着陆,神舟十八号载人飞行任务取得圆满成功。
8、《财富》发布2024年最受赞赏的中国公司榜单:腾讯、阿里巴巴、字节跳动、阅文等9家互联网公司上榜。
全球AI行业头条新闻
AIGC产业新闻:
1、英国竞争与市场管理局宣布对谷歌母公司Alphabet与人工智能初创公司Anthropic的合作关系展开调查。
Rocky观点:“欧洲国家对美国公司的调查,并不是出于什么公平公正,就是为了扶持欧洲公司。”
2、英伟达CEO黄仁勋:英伟达已经将AI应用于芯片设计、软件编写和供应链管理等领域。
3、谷歌上线安全人工智能框架(SAIF)风险评估工具,填补AI安全空白。
4、Meta达成首笔AI新闻授权交易,旗下聊天机器人可使用路透社资源。
5、苹果智能(Apple Intelligence)正式在iPhone、iPad和Mac上线,同时发布搭载M4芯片和苹果智能的新款iMac。
6、越南企业集团Vingroup设立1.5亿美元基金,支持AI等领域初创企业。
7、谷歌扩展AI总结搜索结果功能至全球100多个市场,覆盖10亿月活用户。
8、IBM推出IBM Guardium数据安全中心,助力企业应对AI安全和量子安全。
9、AMD、亚马逊、谷歌等九大科技巨头联合成立超级加速器链接联盟(UALink),挑战英伟达AI数据中心互联领导地位。
10、微软与贝莱德集团联合推出一项规模达1000亿美元的人工智能基础设施基金。
11、OpenAI在其大模型产品ChatGPT中新增搜索功能,正面对抗谷歌、Perplexity。
12、苹果同意收购照片编辑应用开发商Pixelma,加强AI图像编辑能力。
13、迪士尼成立新的人工智能协调部门,探索人工智能、混合现实等新型技术的潜力。
14、谷歌推出安全分析AI工具Big Sleep,实战告捷抓出SQLite堆栈缓冲区下溢漏洞。
15、微软在英国启动生成式AI加速器计划,与英伟达、GitHub联手帮助初创公司成长。
16、SK电讯将建设人工智能基础设施,包括人工智能数据中心、GPU即服务和边缘人工智能。
17、Meta公司AR眼镜团队前负责人宣布加入OpenAI,负责机器人和消费硬件业务。
18、Python首次超越JavaScript成为GitHub上最受欢迎编程语言,AI成主要推动力。
19、Statcounter:微软Win11在Windows桌面平台市场份额突破35%。
Rocky观点:全球的AIGC行业发展都非常迅速,我们需要紧跟AIGC行业的最新进展,将先进的技术工具化,同时思考关键产品的落地逻辑。
新能源产业新闻:
1、特斯拉宣布2024年第三季度全球交付46.3万辆电动车,创季度交付新高。
2、丰田汽车与日本NTT合作开发自动驾驶软件,计划投入数千亿日元。
3、里程碑时刻,谷歌旗下Waymo无人驾驶出租车单周出行突破15万次。
4、韩国SK Innovation合并法人正式成立,将成亚太地区最大民营综合能源企业。
5、微软旗下首个“木材打造”数据中心在美国弗吉尼亚州开建,号称可减少35%碳排放量。
传统深度学习&芯片产业新闻:
1、英特尔计划进行超过280亿美元的初始投资,在俄亥俄州建设两家新的尖端芯片工厂。
2、LG化学在欧洲设立研发中心,计划扩大研发团队规模。
3、英飞凌宣布推出全球最薄硅功率晶圆,成为首家掌握20μm超薄功率半导体晶圆处理和加工技术的公司。
互联网产业新闻:
1、微软Teams正式上线Queues应用,旨在帮助企业更高效地处理客户来电、提升客户服务质量。
2、美国运营商AT&T宣布与康宁达成10亿美元光纤协议,以扩大高速互联网服务。
3、社交媒体平台Reddit成立近20年来首次实现盈利,日活用户近1亿。
Rocky观点:“AIGC时代的到来,Reddit成为AI技术交流平台,也是一大收益方。”
4、苹果公司将向卫星通讯公司Globalstar投资15亿美元,强化手机直连卫星布局。
商业基本面新闻:
1、全球首个开源AI标准发布,微软、谷歌、亚马逊、Meta、英特尔、三星等巨头制定。
2、巴菲特旗下伯克希尔-哈撒韦公司第三季度减持25%苹果股票,现金储备升至3252亿美元再创历史新高。
3、德国舍弗勒集团宣布计划在欧洲裁员约4700人,并关闭两家工厂。
4、德国汽车零部件巨头博世宣布将裁员7000人,以应对汽车行业变革。
5、法国轮胎制造商米其林计划关闭在法国本土两家工厂,影响约1250名工人。
AI产业链融资新闻
Rocky观点:《WeThinkIn老实人报》将从投资视角与长期主义出发,挖掘初创公司的势能与机会点。
1、Sierra AI获得1.75亿美元(约12亿元)融资!
Sierra AI获得1.75亿美元(约12亿元)融资,估值45亿美元(320亿元)。本次由Greenoaks、Thrive、ICONIQ等投资。
Sierra AI主要通过OpenAI的GPT-4o、o1等模型打造了一个对话式AI Agent平台,主要聚焦在客户服务领域,可以混合处理文本、语音自动执行超复杂工作流程。包括客服咨询、退订商单、订阅更新等。
简单来说,Sierra AI可以帮助企业打造“数字化员工”将很多重复、枯燥、无意义的业务流程实现自动化,从而实现降本增效。
2、AI Agent平台Interface获3000万美元融资,聚焦金融领域!
专注金融领域的AI Agent平台Interface.ai宣布完成3000万美元首次融资,由Avataar Venture Partners领投。
自成立以来Interface.ai已实现多个里程碑,包括收入达数千万美元,企业客户有1000多家,同时被《福布斯》评选为金融领域最具商业价值的初创AI企业。
通常金融机构拥有数百个系统和众多定制产品,这使得人工很难在短时间内快速完成所有业务流程。而Interface.ai开发的AI Agent产品Sphere,通过无缝整合文本、视觉元素、鼠标交互、音频和视频输入输出,提供了一个统一的自动化平台,能帮助员工自动完成特定的金融业务流程。
3、马斯克的xAI又洽谈新融资,估值超400亿美元!
华尔街日报消息,马斯克旗下的大模型平台xAI正在洽谈新一轮融资,估值超400亿美元。
如果新的融资成功,xAI的融资总额将仅次OpenAI,成为大模型赛道融资最高企业之一。
xAI成立于2023年7月12日,其主打产品是一个类ChatGPT的大模型Grok-1。
2024年5月27日, xAI在官网宣布获得60亿美元B轮融资,估值240亿美元。主要投资者包括Valor Equity Partners、红杉资本、国王控股、沙特王子-Bin Talal、Vy Capital等。
也就是说,刚过了5个月的时间xAI的估值便暴涨了160亿美元。xAI仅创立一年多的时间便能拿到如此高的融资,一方面得益于马斯克在全球的强大影响力,另一方面大模型赛道依然保持强劲的增长势头。
Rocky观点:等过了2年、3年、5年甚至10年,再回过头来打开本期文章,看看里面的初创公司是飞速成长,还是已经消亡,就能体会到时间的意义。
AI技术进展头条新闻
Rocky观点:《WeThinkIn老实人报》将从工业界出发,以投资、CEO以及CTO视角挖掘技术发展的落地可能性与明星技术的潜力。
1、腾讯开源史上参数最大专家混合模型:Hunyuan-Large!
腾讯开源的Hunyuan-Large是目前市面上最大基于 Transformer架构的专家混合(MoE)模型。一共有3890 亿参数,其中激活参数为 520 亿,具备处理长达256K上下文能力。
根据腾讯公开测试数据显示,Hunyuan-Large不仅超过了社交巨头Meta开源的最新、最大模型LLama3.1 - 405B,并且在激活参数数量显著减少的情况下,实现了高达3.2%的性能提升。在数学、日常推理、文本生成等方面非常优秀。
开源地址:https://github.com/Tencent/Tencent-Hunyuan-Large
huggingface地址:https://huggingface.co/tencent/Tencent-Hunyuan-Large
云开发平台地址:https://cloud.tencent.com/document/product/851/112032
2、ControlNet作者新作:IC-Light V2发布!
IC-Light可以通过AI技术精确控制图像中的光照效果。而此次的V2版本则是一系列基于FLUX的IC-Light型号,具有16通道VAE和原生高分辨率。
体验地址:https://huggingface.co/spaces/lllyasviel/iclight-v2
3、AI视频大模型CogVideoX v1.5开源!
CogVideoX v1.5将上线到清影,并与新推出的CogSound音效模型结合,「新清影」将提供以下特色服务:
质量提升:在图生视频的质量、美学表现、运动合理性以及复杂提示词语义理解方面能力显著增强。 超高清分辨率:支持生成 10s、4K、60 帧超高清视频。可变比例:支持任意比例,从而适应不同的播放场景。 多通道输出:同一指令/图片可以一次性生成 4 个视频。 带声效的 AI 视频:新清影可以生成与画面匹配的音效。
代码地址:https://github.com/thudm/cogvideo
模型地址:https://huggingface.co/THUDM/CogVideoX1.5-5B-SAT
4、Sora等AI视频大模型的核心原理,核心基础知识,网络结构,经典应用场景,从0到1搭建使用AI视频大模型,从0到1训练自己的AI视频大模型,AI视频大模型性能测评,AI视频领域未来发展等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
Sora等AI视频大模型文章地址:https://zhuanlan.zhihu.com/p/706722494
5、Stable Diffusion 3和FLUX.1核心原理,核心基础知识,网络结构,从0到1搭建使用Stable Diffusion 3和FLUX.1进行AI绘画,从0到1上手使用Stable Diffusion 3和FLUX.1训练自己的AI绘画模型,Stable Diffusion 3和FLUX.1性能优化等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
Stable Diffusion 3和FLUX.1文章地址:https://zhuanlan.zhihu.com/p/684068402
6、Stable Diffusion XL核心基础知识,网络结构,从0到1搭建使用Stable Diffusion XL进行AI绘画,从0到1上手使用Stable Diffusion XL训练自己的AI绘画模型,AI绘画领域的未来发展等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
Stable Diffusion XL文章地址:https://zhuanlan.zhihu.com/p/643420260
7、Stable Diffusion 1.x-2.x核心原理,核心基础知识,网络结构,经典应用场景,从0到1搭建使用Stable Diffusion进行AI绘画,从0到1上手使用Stable Diffusion训练自己的AI绘画模型,Stable Diffusion性能优化等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
Stable Diffusion文章地址:https://zhuanlan.zhihu.com/p/632809634
8、ControlNet核心基础知识,核心网络结构,从0到1使用ControlNet进行AI绘画,从0到1训练自己的ControlNet模型,从0到1上手构建ControlNet商业变现应用等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
ControlNet文章地址:https://zhuanlan.zhihu.com/p/660924126
9、LoRA系列模型核心原理,核心基础知识,从0到1使用LoRA模型进行AI绘画,从0到1上手训练自己的LoRA模型,LoRA变体模型介绍,优质LoRA推荐等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
LoRA文章地址:https://zhuanlan.zhihu.com/p/639229126
10、Transformer核心基础知识,核心网络结构,AIGC时代的Transformer新内涵,各AI领域Transformer的应用落地,Transformer未来发展趋势等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
Transformer文章地址:https://zhuanlan.zhihu.com/p/709874399
11、最全面的AIGC面经《手把手教你成为AIGC算法工程师,斩获AIGC算法offer!(2024年版)》文章正式发布!
码字不易,欢迎大家多多点赞:
AIGC面经文章地址:https://zhuanlan.zhihu.com/p/651076114
12、50万字大汇总《“三年面试五年模拟”之算法工程师的求职面试“独孤九剑”秘籍》文章正式发布!
码字不易,欢迎大家多多点赞:
算法工程师三年面试五年模拟文章地址:https://zhuanlan.zhihu.com/p/545374303
《三年面试五年模拟》github项目地址(希望大家能多多star):https://github.com/WeThinkIn/Interview-for-Algorithm-Engineer
13、Stable Diffusion WebUI、ComfyUI、Fooocus三大主流AI绘画框架核心知识,从0到1搭建AI绘画框架,从0到1使用AI绘画框架的保姆级教程,深入浅出介绍AI绘画框架的各模块功能,深入浅出介绍AI绘画框架的高阶用法等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
AI绘画框架文章地址:https://zhuanlan.zhihu.com/p/673439761
14、GAN网络核心基础知识,网络架构,GAN经典变体模型,经典应用场景,GAN在AIGC时代的商业应用等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
GAN网络文章地址:https://zhuanlan.zhihu.com/p/663157306
推荐阅读
1、加入AIGCmagic社区知识星球
AIGCmagic社区知识星球不同于市面上其他的AI知识星球,AIGCmagic社区知识星球是国内首个以AIGC全栈技术与商业变现为主线的学习交流平台,涉及AI绘画、AI视频、大模型、AI多模态、数字人、全行业AIGC赋能等100+应用方向,内部包含海量学习资源、专业问答、前沿资讯、内推招聘、AI课程、AIGC模型、AIGC数据集和源码等。
那该如何加入星球呢?很简单,我们只需要扫下方的二维码即可。知识星球原价:299元/年,前200名限量活动价,终身优惠只需199元/年。大家只需要扫描下面的星球优惠卷即可享受初始居民的最大优惠:
2、《三年面试五年模拟》算法工程师面试秘籍
《三年面试五年模拟》面试秘籍旨在整理&挖掘AI算法工程师在实习/校招/社招时所需的干货知识点与面试方法,力求让读者在获得心仪offer的同时,增强技术基本面。
Rocky已经将《三年面试五年模拟》面试秘籍的完整版构建在Github上:https://github.com/WeThinkIn/Interview-for-Algorithm-Engineer/tree/main,欢迎大家star!
想要一起进行项目共建的朋友,欢迎点击链接加入项目团队:《三年面试五年模拟》版本更新白皮书,迎接AIGC时代
3、其他
《WeThinkIn老实人报》的第三十一期就完整展现在大家面前了,未来引领AI科技浪潮和变革的要素可能就在其中,每个给本文一键三连的朋友,一定会挖掘到属于自己的机会点!
最后,希望在AIGC时代中,大家能和Rocky一起,飞速成长!
Rocky将YOLOv1-v7全系列大解析文章也制作成相应的pdf版本,大家可以关注公众号WeThinkIn,并在后台 【精华干货】菜单或者回复关键词“YOLO” 进行取用。