从关键新闻和最新技术看AI行业发展(第三十四期2024.10.14-10.27) |【WeThinkIn老实人报】

文摘   科技   2024-10-27 15:22   浙江  
近期文章回顾(更多热门文章请关注公众号与知乎Rocky Ding哦)

写在前面

【WeThinkIn老实人报】旨在挖掘AI行业的关键新闻和最新技术,同时Rocky会对其中的关键信息进行解读,力求让读者们能从容掌握AI科技潮流。

WeThinkIn最新福利放送:大家只需关注WeThinkIn公众号,后台回复“简历资源”,即可获取包含Rocky独家简历模版在内的60套精选的简历模板资源,希望能给大家在AIGC时代带来帮助。

AIGC时代的《三年面试五年模拟》算法工程师求职面试秘籍独家资源:https://github.com/WeThinkIn/Interview-for-Algorithm-Engineer/tree/main

Rocky最新发布Stable Diffusion 3和FLUX.1系列模型的深入浅出全维度解析文章,点击链接直达干货知识:https://zhuanlan.zhihu.com/p/684068402


大家好,我是Rocky。

阅读Rocky创办的《WeThinkIn老实人报》,大家能够获得:

  1. 掌握AIGC传统深度学习以及智能汽车这三个AI行业核心方向的最新进展,能在评论区抒发观点,共同学习交流。
  2. 找到让自己灵光一现的关键新闻和最新技术,这对我们的职业生涯非常重要。
  3. 理顺国内AI行业头条新闻全球AI行业头条新闻AI产业链融资新闻以及AI技术进展头条新闻四大板块,降低我们对未来下一个核心价值(OpenAI式公司和AIGC式技术)的错判率

本文是《WeThinkIn老实人报》的第三十四期,Rocky本次梳理的周期为2024年10月14号-2024年10月27号。在本期中,Rocky会毫无保留地分享自己的核心观点,希望能给大家带来更多思考与感悟。

So,enjoy(与本文的BGM一起食用更佳哦):

正文开始

目录先行

  1. 读前大局观
  2. 国内AI行业头条新闻
  3. 全球AI行业头条新闻
  4. AI产业链融资新闻
  5. AI技术进展头条新闻

读前大局观

Rocky将工业&科技分为三个维度:

  1. 尖端工业&科技:包括新能源、AI、航空航天、军事工业、半导体、新药研发以及细分高精尖行业等。
  2. 中端工业&科技:包括汽车、高铁、大飞机、大轮船以及已经突破的曾被宣称是“尖端工业”的产业。
  3. 基础工业&科技:包括房地产、基建以及轻工业等基础制造业和基本生活用品业等。

我们目前的发展阶段,首先要解决的是中端工业&科技的市场占有率问题,需要占据全球市场的80%左右,并留下识大体顾大局的20%的海外公司共同成长,共享发展果实。

在基础工业&科技,目前主要是处在降本增效,持续优化的状态。基础工业&科技包含了人们的衣食住行,是跨周期的、市场巨大的产业,依旧有很多机会。

在尖端工业&科技方面,拿AI行业为例,我们目前主要是跟紧全球最新趋势,问题不大的。在AI行业的政策、资本、生产资料、认知等都飞速迭代的当下,国内AI行业的产品落地与弯道超车能力依旧非常强。 此外像新能源、航空航天、军事工业等领域,已经进入与全球伙伴合作的阶段,市场上留下的更多是识大体顾大局的海外合作伙伴。

国内AI行业头条新闻

AIGC产业新闻:

1、月之暗面上线具备AI自主搜索能力的Kimi探索版,搜索量是普通版的10倍。

2、中国移动发布九天善智多模态基座大模型,并推出30款自研行业大模型。

3、腾讯与中国信通院签署人工智能业务合作协议,共促AI产业发展。

4、火山引擎发布大模型训练视频预处理方案,已应用于豆包视频生成模型。

5、中国海油联合科大讯飞、中国电信发布“海能”人工智能模型,赋能海洋能源行业焕新。

6、阿里国际发布首个大规模商用翻译大模型Marco:支持15种主流语言,面向全球用户开放使用。

7、百度智能云(海东市)人工智能基础数据产业基地正式启动,为百度智能云在青海省落地首个数据标注基地。

8、智源发布原生多模态世界模型Emu3,宣称实现图像、文本、视频大一统。

9、荣耀发布首个搭载智能体的个人化全场景AI操作系统MagicOS 9.0,并宣布YOYO助理正式升级为YOYO智能体。

Rocky观点:2024年下半年,以大模型为核心延伸到落地应用与商业化,大模型的发布数量明显减少了,迭代优化和存量厮杀尤为明显。在ToC、ToB两个方向上同时打响价格战,全面进入大模型你死我活厮杀的关键阶段。

新能源产业新闻:

1、特斯拉上海超级工厂第300万辆整车正式下线,其中1/3出口海外市场。

Rocky观点:“马斯克可以说是新周期中最识大体、顾大局的海外企业家,同时也足够灵活。”

2、优必选发布全新一代工业人形机器人Walker S1,已进入比亚迪工厂实训。

3、宁德时代香港研究院揭牌成立,将启动75个研发项目、招聘逾200位科研人员。

4、软通动力人形机器人总部落户无锡,并与江南大学等签约共建具身智能联合实验室。

5、苹果宣布捐助中国绿色碳汇基金会,为国家公园环境教育提供支持。

Rocky观点:“苹果可以说是部分识大体、顾大局。斗争中发展,斗争中合作,斗争中获得收益,是未来世界多极化的基本趋势。”

6、九号公司携手格林美开启两轮电动车行业首个锂电池回收项目,助力“以旧换新”。

7、美团无人机福田口岸航线正式开航,为国内首条设在口岸区域的常态化无人机配送航线。

Rocky观点:新能源行业的发展所催生的电动车行业与新制造业,是跨周期的。加上互联网思维,相信可以和特斯拉一起形成合力,让最后存活下来的海外车企们更加识大体、顾大局。

传统深度学习&芯片产业新闻:

1、华为发布鸿蒙原生应用开发者激励计划,冲刺HarmonyOS NEXT正式商用。

2、华为终端:原生鸿蒙之夜暨华为全场景新品发布会将于10月22日举办。

3、华为云综合性数字化贸易平台“开天跨境平台”发布,AI技术引领数字贸易新潮流。

4、OPPO ColorOS全球用户规模突破7亿,ColorOS小布助手月活用户数突破1.5亿。

5、Arm正式加入OpenCloudOS操作系统开源社区,推动国产开源生态发展。

6、华为原生鸿蒙系统HarmoryOS Next 5.0正式发布,已有超15000个鸿蒙原生应用和元服务上架。

7、华为终端:鸿蒙生态设备已超10亿台,鸿蒙操作系统在中国市场份额排名第二。

Rocky观点:“国产替代产业,是非常有价值的一环。”

8、蚂蚁集团旗下数据库厂商OceanBase首次全面披露商业、生态发展情况:客户数突破2000家,连续4年客户数增速超过100%。

互联网产业新闻:

1、vivo手机全球月活用户突破5亿,vivo平台开发者数量突破50万。

2、华为全球最大研发中心练秋湖研发中心迎来首批进驻员工,上海青浦定制公交开通。

3、京东物流与淘天集团达成合作:京东物流将全面接入淘宝天猫平台,平台商家将能够选择京东物流作为服务商。

4、BOSS直聘开展为期一个月的“虚假职位信息治理”专项行动,首期打击违规账号超2800个。

5、小米之家4000多家门店支持支付宝“碰一下”支付功能,提升购物新体验。

商业基本面新闻:

1、上海国投牵头徐汇资本、米哈游、商汤科技、哔哩哔哩等共同发起设立上海人工智能生态基金,基金规模100亿元。

2、全国工商联发布2024中国民营企业500强榜单,京东集团、阿里巴巴、恒力集团位列前三。

3、中国移动联合电子标准院及16家重点央企共同开展大模型评测体系建设工作,并发布《通用大模型评测标准》。

全球AI行业头条新闻

AIGC产业新闻:

1、微软发布全新医疗保健AI工具,助力提升医疗服务质量。

2、OpenAI发布实验性框架“Swarm”,以创建并协调人工智能代理网络。

3、Adobe推出全新AI视频生成器Firefly Video Model,完全使用授权内容进行训练。

4、埃隆·马斯克旗下社交媒体平台X更新隐私政策,将允许第三方合作者使用其数据训练人工智能模型。

5、OpenAI发布Windows版ChatGPT客户端:支持热键调用,暂仅限付费用户测试。

Rocky观点:“AIGC时代,OpenAI也会AI商业化绞尽脑汁。”

6、Meta宣布与好莱坞知名制片公司Blumhouse Productions合作,共同开发AI电影生成模型Movie Gen。

7、微软开源bitnet.cpp 1-bit LLM推理框架:不靠GPU可本地运行千亿参数AI模型,能耗最多降低82.2%。

8、谷歌将把Gemini应用程序团队并入DeepMind实验室,推进AI小组整合。

9、IBM发布面向企业的人工智能模型新版本,深化参与AI竞争。

10、Meta为WhatsApp即时通信软件引入AI机器人聊天记忆功能,可提供个人化推荐。

11、微软宣布基于Copilot Studio国际版创建自主智能体的功能将在下个月公开预览。

12、马斯克旗下人工智能初创公司xAI正式推出首款API,允许开发者将Grok集成到其他应用程序中。

13、IBM发布全新Granite 3.0系列AI模型,在学术和行业基准测试中可以持平或超越同等规模的模型。

14、微软和OpenAI将向媒体提供1000万美元资助,推动其使用AI工具。

15、高通宣布与谷歌达成多年战略合作,提供生成式AI数字座舱解决方案。

16、霍尼韦尔与谷歌达成协议,将生成式人工智能Gemini引入工业领域。

Rocky观点:全球的AIGC行业发展都非常迅速,我们需要紧跟AIGC行业的最新进展,将先进的技术工具化,同时思考关键产品的落地逻辑。

新能源产业新闻:

1、超过福特,通用汽车宣称已成为全美第二大电动汽车品牌。

2、亚马逊测试Whole Foods迷你机器人仓库,提升食品杂货市场份额。

3、LG新能源与福特汽车签署供应协议,为福特在欧洲的电动商用货车提供动力。

4、博世、Tenstorrent将合作建立标准化车用Chiplet平台,降低汽车芯片成本。

5、黑莓宣布其QNX软件系统已经在全球超2.55亿辆汽车上搭载,相比去年增加2000万辆。

6、丰田研究所与波士顿动力宣布合作,推进机器人大规模行为模型等研究。

传统深度学习&芯片产业新闻:

1、高通推出首个利用边缘AI变革网络连接的商用平台:高通A7 Elite专业联网平台。

2、AMD推出新款AI芯片,将与英伟达Blackwell展开竞争。

3、意法半导体与高通达成无线物联网战略合作,首批产品预计明年Q1供货。

4、英特尔和AMD共同组建x86生态系统咨询小组,将加速开发人员和客户的创新。

5、英特尔计划10月29日举办Partner Alliance BaseCamp活动,有望更新下一代酷睿Ultra Series 2移动和图形产品。

6、微软与韩国电信公司KT建立合作伙伴关系,未来五年内将投入2.4万亿韩元推动韩国人工智能、云服务和基础设施发展。

7、丰田汽车计划向日本半导体制造商Rapidus追加投资,为其在2027年前量产下一代半导体的计划提供资金支持。

8、高通骁龙8至尊版正式发布:搭载第二代自研Oryon CPU,整体功耗降低27%。

9、AMD宣布其首款基于Zen 5架构的X3D桌面处理器将于11月7日发售。

10、三星电子宣布全面退出LED业务,聚焦功率半导体和Micro LED领域。

Rocky观点:“三星在LED领域被彻底击败。击败别人,我们就能获得市场和利润。”

互联网产业新闻:

1、日均拦截1.5万条含恶意二维码邮件,微软称教育行业已成第3大网络攻击目标。

2、苹果发布新款iPad mini:搭载A17 Pro芯片,支持Apple Intelligence,起售价499美元。

3、沃尔格林联合博姿宣布优化业务布局计划,计划未来三年内关闭约1200家门店。

商业基本面新闻:

1、美国《福布斯》杂志公布2024福布斯最佳雇主榜,微软、Alphabet、三星电子前三。

2、波音公司计划裁员约10%:涉及1.7万人,新机型777X首次交付推迟至2026年。

3、因消费者支出持续减弱超出预期,7-Eleven将关闭北美地区400余家门店。

4、贝莱德管理的资产规模达到创纪录的11.48万亿美元。

5、2024年诺贝尔经济学奖揭晓,达龙·阿西莫格鲁、西蒙·约翰逊和詹姆斯·A·罗宾逊三位美国学者获奖。

6、迪士尼任命前摩根士丹利CEO James P. Gorman为其新任董事长,自2025年1月2日起生效。

AI产业链融资新闻

Rocky观点:《WeThinkIn老实人报》将从投资视角与长期主义出发,挖掘初创公司的势能与机会点。

1. AI搜索平台Perplexity正洽谈5亿美元融资,估值80亿美元

华尔街日报消息,基于生成式AI搜索平台Perplexity正洽谈新一轮5亿美元融资,估值暴涨至80亿美元。

在过去的一年时间,Perplexity已经完成了三轮融资,即便按照硅谷的标准,这也是一个异常快速的融资步伐,估值更是呈火箭式暴涨:今年1月,该公司的估值为5.2亿美元,夏天估值已增长至30亿美元,而这一次继续翻倍。

目前Perplexity通过向消费者销售高级订阅来赚钱,每天搜索引擎使用频率为1500万左右。最近还推出了面向企业客户的企业版,该版本可以搜索他们的内部文件,并且很快将开始销售广告,扩大其收入来源。

但Perplexity因使用未经许可的数据生成AI搜索结果而受到众多网络出版商的批评。《纽约时报》最近向Perplexity发送了一份停止搜索通知,要求其不要搜索其内容。

2. AI采购平台Zip获1.9亿美元,估值22亿美元

AI采购协作平台ZipHQ在官网宣布,获得新一轮1.9亿美元融资,估值达到22亿美元。新的笔资金将用于技术研发、开发以AI为驱动的采购解决方案,并推动公司的全球市场扩张。

公开资料显示ZipHQ成立于2020年,主要提供AI采购平台,旨在通过简化和自动化采购流程,帮助企业提高效率。该平台通过整合企业资源规划和供应商管理工具等现有业务系统,管理整个采购生命周期,从采购申请到付款的每一个环节。

Zip的联合创始人兼首席执行官Rujul Zaparde表示,企业在应对复杂的审批流程、处理安全风险和手动输入数据方面浪费了数十亿美元和无数工时。Zip已经证明了可以解决这些问题,为客户节省了数十亿美元和数千小时的时间。这轮融资的成功,无疑将为ZipHQ带来更多的发展机遇,助力其在全球范围内进一步扩大影响力。

3. Waymo获得创立以来最大一轮的56亿美元融资

Alphabet 旗下的自动驾驶子公司Waymo刚刚完成一轮56亿美元的C轮超额认购融资,以进一步扩大其无人驾驶出租车服务。这是该公司迄今为止筹集的最大一轮融资。

这是 Waymo 的第二轮外部融资,也是自 2020 年 22.5 亿美元 B 轮融资(最终增至 32 亿美元)以来的首轮融资。

这家自动驾驶汽车公司表示,将利用这笔资金向新城市扩张,并进一步开发其自动驾驶能力。

Rocky观点:等过了2年、3年、5年甚至10年,再回过头来打开本期文章,看看里面的初创公司是飞速成长,还是已经消亡,就能体会到时间的意义。

AI技术进展头条新闻

Rocky观点:《WeThinkIn老实人报》将从工业界出发,以投资、CEO以及CTO视角挖掘技术发展的落地可能性与明星技术的潜力。

1、英伟达重磅开源超强大模型--Nemotron!

英伟达(Nvidia)开源了超强大模型——Llama-3.1-Nemotron-70B-Instruct。

根据测试数据显示,这个模型已经击败GPT-4o、GPT-4turbo、Gemma-2、Gemini-1.5、Claude-3.5 sonnet等140多个开闭源模型,仅次于OpenAI发布的最新模型o1。

开源地址:https://huggingface.co/nvidia/Llama-3.1-Nemotron-70B-Reward

数据集地址:https://huggingface.co/datasets/nvidia/HelpSteer2

在线demo地址:https://huggingface.co/chat/

2、Stable Diffusion 3.5重磅开源,文生图模型霸主归来!

著名大模型开源平台Stability AI,开源了超强文生图模型——Stable Diffusion 3.5。

Stable Diffusion 3.5一共有Large、Large Turbo和Medium三个版本,可根据不同的商业环境提供高度定制功能,同时对这些模型进行了大幅度优化可在消费级GPU就能轻松推理运行。

开源地址:https://huggingface.co/stabilityai

Github地址:https://github.com/Stability-AI/sd3.5

3、来自非自回归模型的反击?全新文生图基座模型Meissonic:1B文生图Non-AR新范式,专为消费级显卡设计!

Meissonic,一个基于非自回归掩码图像建模(MIM)的新型文本到图像(T2I)模型,Meissonic通过一系列技术创新,如增强型Transformer架构、先进的位置编码和动态采样条件,以及特征压缩层,实现了在图像质量和生成效率上的显著提升。

论文地址:https://arxiv.org/abs/2410.08261

GitHub地址:https://github.com/viiika/Meissonic

Huggingface模型地址:https://huggingface.co/MeissonFlow/Meissonic

4、SANA:线性扩散模型+文生图+高分辨率+从头训练,能够生成高达4K分辨率的高质量图像!

SANA通过32倍压缩率的AutoEncoder、线性注意力机制、Decoder-only的文本编码器以及高效的训练和采样方法,实现了在计算效率和图像质量上的显著提升。sana能够快速生成高达4K分辨率的高质量图像,并且可以在笔记本电脑的GPU上运行。

论文地址:http://arxiv.org/pdf/2410.10629

项目主页:http://nvlabs.github.io/Sana/

5、Sora等AI视频大模型的核心原理,核心基础知识,网络结构,经典应用场景,从0到1搭建使用AI视频大模型,从0到1训练自己的AI视频大模型,AI视频大模型性能测评,AI视频领域未来发展等全维度解析文章正式发布!

码字不易,欢迎大家多多点赞:

Sora等AI视频大模型文章地址:https://zhuanlan.zhihu.com/p/706722494

6、Stable Diffusion 3和FLUX.1核心原理,核心基础知识,网络结构,从0到1搭建使用Stable Diffusion 3和FLUX.1进行AI绘画,从0到1上手使用Stable Diffusion 3和FLUX.1训练自己的AI绘画模型,Stable Diffusion 3和FLUX.1性能优化等全维度解析文章正式发布!

码字不易,欢迎大家多多点赞:

Stable Diffusion 3和FLUX.1文章地址:https://zhuanlan.zhihu.com/p/684068402

7、Stable Diffusion XL核心基础知识,网络结构,从0到1搭建使用Stable Diffusion XL进行AI绘画,从0到1上手使用Stable Diffusion XL训练自己的AI绘画模型,AI绘画领域的未来发展等全维度解析文章正式发布!

码字不易,欢迎大家多多点赞:

Stable Diffusion XL文章地址:https://zhuanlan.zhihu.com/p/643420260

8、Stable Diffusion 1.x-2.x核心原理,核心基础知识,网络结构,经典应用场景,从0到1搭建使用Stable Diffusion进行AI绘画,从0到1上手使用Stable Diffusion训练自己的AI绘画模型,Stable Diffusion性能优化等全维度解析文章正式发布!

码字不易,欢迎大家多多点赞:

Stable Diffusion文章地址:https://zhuanlan.zhihu.com/p/632809634

9、ControlNet核心基础知识,核心网络结构,从0到1使用ControlNet进行AI绘画,从0到1训练自己的ControlNet模型,从0到1上手构建ControlNet商业变现应用等全维度解析文章正式发布!

码字不易,欢迎大家多多点赞:

ControlNet文章地址:https://zhuanlan.zhihu.com/p/660924126

10、LoRA系列模型核心原理,核心基础知识,从0到1使用LoRA模型进行AI绘画,从0到1上手训练自己的LoRA模型,LoRA变体模型介绍,优质LoRA推荐等全维度解析文章正式发布!

码字不易,欢迎大家多多点赞:

LoRA文章地址:https://zhuanlan.zhihu.com/p/639229126

11、Transformer核心基础知识,核心网络结构,AIGC时代的Transformer新内涵,各AI领域Transformer的应用落地,Transformer未来发展趋势等全维度解析文章正式发布!

码字不易,欢迎大家多多点赞:

Transformer文章地址:https://zhuanlan.zhihu.com/p/709874399

12、最全面的AIGC面经《手把手教你成为AIGC算法工程师,斩获AIGC算法offer!(2024年版)》文章正式发布!

码字不易,欢迎大家多多点赞:

AIGC面经文章地址:https://zhuanlan.zhihu.com/p/651076114

13、50万字大汇总《“三年面试五年模拟”之算法工程师的求职面试“独孤九剑”秘籍》文章正式发布!

码字不易,欢迎大家多多点赞:

算法工程师三年面试五年模拟文章地址:https://zhuanlan.zhihu.com/p/545374303

《三年面试五年模拟》github项目地址(希望大家能多多star):https://github.com/WeThinkIn/Interview-for-Algorithm-Engineer

14、Stable Diffusion WebUI、ComfyUI、Fooocus三大主流AI绘画框架核心知识,从0到1搭建AI绘画框架,从0到1使用AI绘画框架的保姆级教程,深入浅出介绍AI绘画框架的各模块功能,深入浅出介绍AI绘画框架的高阶用法等全维度解析文章正式发布!

码字不易,欢迎大家多多点赞:

AI绘画框架文章地址:https://zhuanlan.zhihu.com/p/673439761

15、GAN网络核心基础知识,网络架构,GAN经典变体模型,经典应用场景,GAN在AIGC时代的商业应用等全维度解析文章正式发布!

码字不易,欢迎大家多多点赞:

GAN网络文章地址:https://zhuanlan.zhihu.com/p/663157306

推荐阅读

1、加入AIGCmagic社区知识星球

AIGCmagic社区知识星球不同于市面上其他的AI知识星球,AIGCmagic社区知识星球是国内首个以AIGC全栈技术与商业变现为主线的学习交流平台,涉及AI绘画、AI视频、大模型、AI多模态、数字人、全行业AIGC赋能等100+应用方向,内部包含海量学习资源、专业问答、前沿资讯、内推招聘、AI课程、AIGC模型、AIGC数据集和源码等

那该如何加入星球呢?很简单,我们只需要扫下方的二维码即可。知识星球原价:299元/年,前200名限量活动价,终身优惠只需199元/年。大家只需要扫描下面的星球优惠卷即可享受初始居民的最大优惠:

2、《三年面试五年模拟》算法工程师面试秘籍

《三年面试五年模拟》面试秘籍旨在整理&挖掘AI算法工程师在实习/校招/社招时所需的干货知识点与面试方法,力求让读者在获得心仪offer的同时,增强技术基本面。

Rocky已经将《三年面试五年模拟》面试秘籍的完整版构建在Github上:https://github.com/WeThinkIn/Interview-for-Algorithm-Engineer/tree/main,欢迎大家star!

《三年面试五年模拟》面试秘籍的内容框架

想要一起进行项目共建的朋友,欢迎点击链接加入项目团队:《三年面试五年模拟》版本更新白皮书,迎接AIGC时代

3、其他

《WeThinkIn老实人报》的第三十四期就完整展现在大家面前了,未来引领AI科技浪潮和变革的要素可能就在其中,每个给本文一键三连的朋友,一定会挖掘到属于自己的机会点!

最后,希望在AIGC时代中,大家能和Rocky一起,飞速成长!

Rocky将YOLOv1-v7全系列大解析文章也制作成相应的pdf版本,大家可以关注公众号WeThinkIn,并在后台 【精华干货】菜单或者回复关键词“YOLO” 进行取用。

WeThinkIn
Rocky相信人工智能,数据科学,商业逻辑,金融工具,终身成长,以及顺应时代的潮流会赋予我们超能力。
 最新文章