写在前面
“【WeThinkIn老实人报】旨在挖掘AI行业的关键新闻和最新技术,同时Rocky会对其中的关键信息进行解读,力求让读者们能从容掌握AI科技潮流。
”
WeThinkIn最新福利放送:大家只需关注WeThinkIn公众号,后台回复“简历资源”,即可获取包含Rocky独家简历模版在内的60套精选的简历模板资源,希望能给大家在AIGC时代带来帮助。
AIGC时代的《三年面试五年模拟》算法工程师求职面试秘籍独家资源:https://github.com/WeThinkIn/Interview-for-Algorithm-Engineer/tree/main
Rocky最新发布Stable Diffusion 3和FLUX.1系列模型的深入浅出全维度解析文章,点击链接直达干货知识:https://zhuanlan.zhihu.com/p/684068402
大家好,我是Rocky。
阅读Rocky创办的《WeThinkIn老实人报》,大家能够获得:
掌握AIGC、传统深度学习以及智能汽车这三个AI行业核心方向的最新进展,能在评论区抒发观点,共同学习交流。 找到让自己灵光一现的关键新闻和最新技术,这对我们的职业生涯非常重要。 理顺国内AI行业头条新闻、全球AI行业头条新闻、AI产业链融资新闻以及AI技术进展头条新闻四大板块,降低我们对未来下一个核心价值(OpenAI式公司和AIGC式技术)的错判率。
本文是《WeThinkIn老实人报》的第三十六期,Rocky本次梳理的周期为2024年11月11号-2024年11月24号。在本期中,Rocky会毫无保留地分享自己的核心观点,希望能给大家带来更多思考与感悟。
So,enjoy(与本文的BGM一起食用更佳哦):
正文开始
目录先行
读前大局观 国内AI行业头条新闻 全球AI行业头条新闻 AI产业链融资新闻 AI技术进展头条新闻
读前大局观
Rocky将工业&科技分为三个维度:
尖端工业&科技:包括新能源、AI、航空航天、军事工业、半导体、新药研发以及细分高精尖行业等。 中端工业&科技:包括汽车、高铁、大飞机、大轮船以及已经突破的曾被宣称是“尖端工业”的产业。 基础工业&科技:包括房地产、基建以及轻工业等基础制造业和基本生活用品业等。
我们目前的发展阶段,首先要解决的是中端工业&科技的市场占有率问题,需要占据全球市场的80%左右,并留下识大体顾大局的20%的海外公司共同成长,共享发展果实。
在基础工业&科技,目前主要是处在降本增效,持续优化的状态。基础工业&科技包含了人们的衣食住行,是跨周期的、市场巨大的产业,依旧有很多机会。
在尖端工业&科技方面,拿AI行业为例,我们目前主要是跟紧全球最新趋势,问题不大的。在AI行业的政策、资本、生产资料、认知等都飞速迭代的当下,国内AI行业的产品落地与弯道超车能力依旧非常强。 此外像新能源、航空航天、军事工业等领域,已经进入与全球伙伴合作的阶段,市场上留下的更多是识大体顾大局的海外合作伙伴。
国内AI行业头条新闻
AIGC产业新闻:
1、百度小度全新AI硬件产品将于11月12日发布,“AI新物种”开启智慧生活。
2、视觉中国与智谱达成战略合作,共同推动AI技术在视觉内容领域的创新应用。
3、字节跳动旗下AI内容平台即梦AI宣布自研视频生成模型Seaweed面向平台用户正式开放。
4、百度李彦宏:文心大模型日均调用量超15亿,半年增长至7.5倍。
5、阿里通义千问开源Qwen2.5-Coder全系列模型,号称代码能力追平GPT-4o。
6、字节跳动豆包大模型团队发布SeedEdit通用图像编辑模型,实现自然语言“一句话改图”新体验。
7、小度科技发布全新AI硬件产品小度AI眼镜:全球首款搭载中文大模型的原生AI眼镜,将于明年上半年上市。
8、阿里国际面向全球商家推出首个B2B AI搜索引擎Accio,正式入局AI搜索领域。
9、百度文库AI用户数累计超过2.3亿,AI功能累计使用次数超过28亿。
10、钉钉面向企业关键场景推出“精选AI助理”,首批已上线工单助理、Excel助理、法务助理等6大AI助理。
11、商汤科技:商汤星云发布新一代面向智慧园区场景的智能服务器AIS 4.0,新增视觉多模态大模型算法。
12、腾讯宣布旗下AI智能工作台ima正式上线,打通微信公众号文章生态。
13、月之暗面旗下Kimi发布新一代数学推理模型k0-math,数学能力对标OpenAI o1系列。
14、创梦天地与腾讯云在游戏AI领域达成战略合作,成立联合创新实验室。
Rocky观点:2024年下半年,以大模型为核心延伸到落地应用与商业化,大模型的发布数量明显减少了,迭代优化和存量厮杀尤为明显。在ToC、ToB两个方向上同时打响价格战,全面进入大模型你死我活厮杀的关键阶段。
新能源产业新闻:
1、亿航智能EH216-S在泰国首飞成功,无人驾驶eVTOL载人飞行新里程碑。
2、越秀资本与大家资产、老窖资本达成战略合作,共同发起设立规模20亿元的户用光伏基金。
3、DHL快递与小米集团签署合作协议,通过可持续航空燃料助力小米国际快件航空运输减排。
4、小米汽车:小米SU7第10万辆正式下线,仅用时230天,创下新车企10万辆最快下线纪录。
5、空中客车直升机中国新总部在横琴粤澳深度合作区正式开业,助力低空经济发展。
6、雷军:小米SU7本月预计交付超过2万辆,目前已提前完成全年10万辆交付目标。
7、海南省发改委、小鹏汇天达成合作,打造“飞行汽车应用示范岛。
8、宁德时代首次实现动力锂电池铁路运输。
9、小鹏汽车明年首推增程车,何小鹏:未来三年,中国新能源汽车行业将进入淘汰赛。
10、小马智行扩大ADS发行规模至2000万股,IPO总筹资增至4.52亿美元。
Rocky观点:新能源行业的发展所催生的电动车行业与新制造业,是跨周期的。加上互联网思维,相信可以和特斯拉一起形成合力,让最后存活下来的海外车企们更加识大体、顾大局。
传统深度学习&芯片产业新闻:
1、金蝶国际新加坡公司及新加坡数据中心正式落成,加速推进全球化战略。
2、印尼科技巨头GoTo与腾讯云和阿里云签署协议,促进印尼云基础设施和数字人才发展。
3、openEuler系累计装机量突破1000万,树立操作系统产业新里程碑。
4、华为(深圳)全球具身智能产业创新中心正式运营,首批16家企业“加盟”。
5、李子柒复出后再履新职,出任百度百科AI非遗馆荣誉馆长及产品共建人。
6、工信部:今年将发布400个第二批高水平5G工厂。
互联网产业新闻:
1、顺丰控股通过港交所上市聆讯,或成快递行业首家“A+H”股上市公司。
2、亚马逊全球开店亚太区首个创新中心在深圳正式启用,打造辐射亚太的跨境电商创新交流与孵化基地。
3、快手推出“快成长计划”,百亿流量及百万创作金扶持中小创作者。
4、联邦快递宣布启用在中国的第五个国际口岸操作中心,落户于青岛胶东国际机场。
5、腾讯发布三季度财报:微信及WeChat合并月活跃账户数13.82亿,QQ移动终端月活跃账户数5.62亿。
6、折叠屏手机鼻祖,柔宇科技正式宣告破产。
商业基本面新闻:
1、中铁快运:目前“高铁急送”业务拓展至全国182个主要城市,最快4小时门到门当日送达。
2、2024胡润慈善榜发布:韦尔股份创始人虞仁荣以53亿元捐赠额首次成为中国首善。
3、港澳通关再提速,全国首批“免出示证件”通道上线试运行。
全球AI行业头条新闻
AIGC产业新闻:
1、英国明年将立法防范AI风险,主要面向ChatGPT等“前沿模型”。
2、Meta开源小语言AI模型MobileLLM家族:适用智能手机、提供125M-1B版本。
3、谷歌面向Google Workspace用户推出Google Vids应用,可帮用户写脚本、剪片、找素材等。
4、AMD推出首个完全开放的10亿参数语言模型系列AMD OLMo,为开发者和研究人员提供强大的AI研究工具。
5、马斯克旗下社交平台X(原Twitter)新动向:正测试向用户免费开放AI聊天机器人Grok。
6、谷歌将为苹果iPhone推出独立的Gemini App,支持AI语音聊天。
7、谷歌DeepMind团队开源诺奖化学模型Alphafold3,推动AI变革生物领域。
8、微软Copilot下月将添新选项,AI聊天可选择关闭/启用网络搜索。
9、OpenAI联合创始人兼前总裁格雷格·布罗克曼宣布正式重返OpenAI。
10、OpenAI桌面版ChatGPT应用登陆微软Windows,支持拍照识别及语音交流。
11、OpenAI发布《学生使用ChatGPT写作指南》回应AI在教育领域争议,列出12种有效方法让学生合理使用ChatGPT。
12、欧盟发布《通用人工智能业务守则》初稿,目标为开发和使用通用人工智能(GPAI)模型设立监管框架。
13、苹果Apple Vision Pro正式登陆韩国和阿联酋市场,销售范围已扩展至12个国家和地区。
Rocky观点:全球的AIGC行业发展都非常迅速,我们需要紧跟AIGC行业的最新进展,将先进的技术工具化,同时思考关键产品的落地逻辑。
新能源产业新闻:
1、丰田汽车在墨西哥追加14.5亿美元投资,提升新款Tacoma皮卡及混动车型产量。
2、印度电动两轮车公司Ola Electric计划未来四个月内将门店数量由目前的约780家增至2000家,以扩大分销网络。
传统深度学习&芯片产业新闻:
1、日本存储芯片制造商铠侠据悉计划明年6月前在东京上市,目标市值超1万亿日元。
2、亚马逊计划在未来五年内向意大利数据中心业务投资13亿美元。
3、亚马逊宣布即将推出其最新研发的AI芯片,减少对英伟达依赖。
4、英伟达将与软银合作在日本建设AI基础设施,以加速日本机器人、汽车、医疗保健和电信行业发展。
5、诺基亚从美国创企Rapid手中收购全球最大API中心和市场,以寻求提振其5G和4G网络业务营收。
6、亚马逊宣布向研究人员免费开放Trainium AI算力,挑战英伟达霸主地位。
7、谷歌AI洪水预警系统扩至100个国家,将保护7亿高风险地区居民。
8、特斯拉据悉向SK海力士或三星采购HBM4芯片。
互联网产业新闻:
1、华纳兄弟探索流媒体平台HBO Max第三季度全球订阅用户增720万,创最大季度增长。
2、英伟达正式发布PC端Nvidia应用,旨在全面取代GeForce Experience应用。
3、苹果App Store Connect新增“精选提名”功能:开发者可申请推广其应用。
商业基本面新闻:
1、亚马逊创始人杰夫·贝索斯两天内出售近600万股亚马逊股票,套现12.3亿美元。
2、高盛集团将95位管理人员晋升为合伙人,规模为2010年以来之最。
3、AMD确认将在全球范围内裁员大约4%,以专注于“最大的增长机会”。
4、西门子计划在全球范围内裁员至多5000人,以应对工厂自动化业务的困境。
5、波音开始发布裁员通知:计划削减17000个工作岗位,占其全球员工总数的10%。
Rocky观点:“从上面的3-5条新闻来看,全球都进入了降本增效与谨慎待变的关键历史周期中。”
6、美国太空探索技术公司重型运载火箭“星舰”第六次试飞成功。
7、美国通用汽车宣布再裁员近千人。
8、美航天局分配月球货运任务,马斯克与贝索斯承接“月球快递”。
AI产业链融资新闻
Rocky观点:《WeThinkIn老实人报》将从投资视角与长期主义出发,挖掘初创公司的势能与机会点。
1、2024第三季度AI领域获得190亿美元融资,其中OpenAI获得最多!
根据全球著名商业分析平台Crunchbase最新数据显示,2024年第三季度全球风险投资达到 665 亿美元。
这与2023年第三季度的780 亿美元投资相比,同比下降15%。虽然投资额下降,但AI受到资本市场青睐仍是第三季度投资金额最高的领域,投资金额达到190亿美元,占总投资的28%。
其中,OpenAI以66亿美元的巨额融资,成为AI史上最大风险投资之一拉爆AI投资热度。
2、 Writer获2亿美元融资,目前估值19亿美元!
企业级生成式AI平台writer在官网宣布,获得2亿美元C轮融资,估值19亿美元。
本次由Premji Invest、Radical Ventures、Salesforce Ventures、Adobe Ventures、Citi Ventures、B Capital、IBM Ventures等知名投资机构联合投资。
目前,writer已经积累了数百家全球知名企业,包括富兰克林邓普顿、Kenvue、Lennar、保德信、高通、Salesforce、埃森哲、欧莱雅等,通过writer已经节省了数万小时的工作时间。
3、AI数字人平台11x,获5000万美元B轮融资!
AI数字人平台11x在官网宣布获得5000万美元B轮融资,这距离他们完成由Benchmark领投的2400万美元A轮融资仅一个多月。
Salesforce在1999年发明了基于云的软件,到了2024年,11x开始着手淘汰传统软件。他们认为,全球数十亿小时的时间被浪费在重复性工作上,这些任务消耗了我们的创造力和精力。
11x指出,世界充斥着渐进的、无用的软件,每家公司都背负着数十种工具,这些工具制造的问题比解决的问题还要多。知识工作者被降级为数据输入机器人,销售人员被束缚在机械任务上,而不是建立真正的关系——销售团队72%的时间都花在非销售活动上,这是一个巨大灾难。
11x希望通过AI数字人劳动力,来帮助人类处理日常大部分重复的工作,释放人类去专注于他们最擅长的事情:创造、创新和建立有意义的关系。
Rocky观点:等过了2年、3年、5年甚至10年,再回过头来打开本期文章,看看里面的初创公司是飞速成长,还是已经消亡,就能体会到时间的意义。
AI技术进展头条新闻
Rocky观点:《WeThinkIn老实人报》将从工业界出发,以投资、CEO以及CTO视角挖掘技术发展的落地可能性与明星技术的潜力。
1、阿里开源代码生成大模型Qwen2.5-Coder!
阿里巴巴开源了代码生成模型Qwen2.5-Coder,本次一共有0.5B、3B、14B和32B四个版本,适用于移动端、PC等不同开发环境。
根据阿里公布的测试数据显示,32B指令微调模型在 EvalPlus、LiveCodeBench、Spide和Bird-SQL的测试中,成为开源模型中性能排名第一,超过GPT-4o、Claude 3.5 Sonnet两款闭源模型。
综合能力和GPT-4o几乎一样,成为目前最强的开源代码模型。
开源地址:https://github.com/QwenLM/Qwen2.5-Coder
huggingface地址:https://huggingface.co/spaces/Qwen/Qwen2.5-Coder-Artifacts
在线demo地址:https://huggingface.co/spaces/Qwen/Qwen2.5-Coder-demo
2、微软开源多功能视觉模型Florence-2!
微软Azure AI 团队宣布开源视觉模型——Florence-2。
据悉,Florence-2是一个多功能视觉模型,可提供图像描述、目标检测、视觉定位、图像分割等。例如,上传一张风景照片,让其解读一下图片的内容;或者上传一张超市货架的照片,让其精准找出牛奶的所在位置。
目前Florence-2一共有230M和770M两个版本,在多个知名基准测试中零样本的表现非常出色高于同类模型。
开源地址:https://huggingface.co/microsoft/Florence-2-large
在线demo地址:https://huggingface.co/spaces/gokaygokay/Florence-2
3、 FLUX官方版发布ControlNet,四款工具一齐上线!
此次FLUX一共发布了这四款创意工具:
编辑工具fill,可以修改画面细节或扩展画面; 轮廓控制工具Canny,类似ControlNet; 景深控制工具Depth,类似ControlNet; 变换工具Redux,可改变人物动作、画面视角/风格。
这些工具分为dev和pro两个版本,dev版的代码和模型权重均已开放下载,pro版也通过API提供。
模型开源地址:
https://huggingface.co/black-forest-labs/FLUX.1-Depth-dev
https://huggingface.co/black-forest-labs/FLUX.1-Canny-dev
https://huggingface.co/black-forest-labs/FLUX.1-Depth-dev-lora
https://huggingface.co/black-forest-labs/FLUX.1-Canny-dev-lora
4、Sora等AI视频大模型的核心原理,核心基础知识,网络结构,经典应用场景,从0到1搭建使用AI视频大模型,从0到1训练自己的AI视频大模型,AI视频大模型性能测评,AI视频领域未来发展等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
Sora等AI视频大模型文章地址:https://zhuanlan.zhihu.com/p/706722494
5、Stable Diffusion 3和FLUX.1核心原理,核心基础知识,网络结构,从0到1搭建使用Stable Diffusion 3和FLUX.1进行AI绘画,从0到1上手使用Stable Diffusion 3和FLUX.1训练自己的AI绘画模型,Stable Diffusion 3和FLUX.1性能优化等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
Stable Diffusion 3和FLUX.1文章地址:https://zhuanlan.zhihu.com/p/684068402
6、Stable Diffusion XL核心基础知识,网络结构,从0到1搭建使用Stable Diffusion XL进行AI绘画,从0到1上手使用Stable Diffusion XL训练自己的AI绘画模型,AI绘画领域的未来发展等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
Stable Diffusion XL文章地址:https://zhuanlan.zhihu.com/p/643420260
7、Stable Diffusion 1.x-2.x核心原理,核心基础知识,网络结构,经典应用场景,从0到1搭建使用Stable Diffusion进行AI绘画,从0到1上手使用Stable Diffusion训练自己的AI绘画模型,Stable Diffusion性能优化等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
Stable Diffusion文章地址:https://zhuanlan.zhihu.com/p/632809634
8、ControlNet核心基础知识,核心网络结构,从0到1使用ControlNet进行AI绘画,从0到1训练自己的ControlNet模型,从0到1上手构建ControlNet商业变现应用等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
ControlNet文章地址:https://zhuanlan.zhihu.com/p/660924126
9、LoRA系列模型核心原理,核心基础知识,从0到1使用LoRA模型进行AI绘画,从0到1上手训练自己的LoRA模型,LoRA变体模型介绍,优质LoRA推荐等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
LoRA文章地址:https://zhuanlan.zhihu.com/p/639229126
10、Transformer核心基础知识,核心网络结构,AIGC时代的Transformer新内涵,各AI领域Transformer的应用落地,Transformer未来发展趋势等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
Transformer文章地址:https://zhuanlan.zhihu.com/p/709874399
11、最全面的AIGC面经《手把手教你成为AIGC算法工程师,斩获AIGC算法offer!(2024年版)》文章正式发布!
码字不易,欢迎大家多多点赞:
AIGC面经文章地址:https://zhuanlan.zhihu.com/p/651076114
12、50万字大汇总《“三年面试五年模拟”之算法工程师的求职面试“独孤九剑”秘籍》文章正式发布!
码字不易,欢迎大家多多点赞:
算法工程师三年面试五年模拟文章地址:https://zhuanlan.zhihu.com/p/545374303
《三年面试五年模拟》github项目地址(希望大家能多多star):https://github.com/WeThinkIn/Interview-for-Algorithm-Engineer
13、Stable Diffusion WebUI、ComfyUI、Fooocus三大主流AI绘画框架核心知识,从0到1搭建AI绘画框架,从0到1使用AI绘画框架的保姆级教程,深入浅出介绍AI绘画框架的各模块功能,深入浅出介绍AI绘画框架的高阶用法等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
AI绘画框架文章地址:https://zhuanlan.zhihu.com/p/673439761
14、GAN网络核心基础知识,网络架构,GAN经典变体模型,经典应用场景,GAN在AIGC时代的商业应用等全维度解析文章正式发布!
码字不易,欢迎大家多多点赞:
GAN网络文章地址:https://zhuanlan.zhihu.com/p/663157306
推荐阅读
1、加入AIGCmagic社区知识星球
AIGCmagic社区知识星球不同于市面上其他的AI知识星球,AIGCmagic社区知识星球是国内首个以AIGC全栈技术与商业变现为主线的学习交流平台,涉及AI绘画、AI视频、大模型、AI多模态、数字人、全行业AIGC赋能等100+应用方向,内部包含海量学习资源、专业问答、前沿资讯、内推招聘、AI课程、AIGC模型、AIGC数据集和源码等。
那该如何加入星球呢?很简单,我们只需要扫下方的二维码即可。知识星球原价:299元/年,前200名限量活动价,终身优惠只需199元/年。大家只需要扫描下面的星球优惠卷即可享受初始居民的最大优惠:
2、《三年面试五年模拟》算法工程师面试秘籍
《三年面试五年模拟》面试秘籍旨在整理&挖掘AI算法工程师在实习/校招/社招时所需的干货知识点与面试方法,力求让读者在获得心仪offer的同时,增强技术基本面。
Rocky已经将《三年面试五年模拟》面试秘籍的完整版构建在Github上:https://github.com/WeThinkIn/Interview-for-Algorithm-Engineer/tree/main,欢迎大家star!
想要一起进行项目共建的朋友,欢迎点击链接加入项目团队:《三年面试五年模拟》版本更新白皮书,迎接AIGC时代
3、其他
《WeThinkIn老实人报》的第三十一期就完整展现在大家面前了,未来引领AI科技浪潮和变革的要素可能就在其中,每个给本文一键三连的朋友,一定会挖掘到属于自己的机会点!
最后,希望在AIGC时代中,大家能和Rocky一起,飞速成长!
Rocky将YOLOv1-v7全系列大解析文章也制作成相应的pdf版本,大家可以关注公众号WeThinkIn,并在后台 【精华干货】菜单或者回复关键词“YOLO” 进行取用。