首页
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
更多
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
公众号
人工智能大讲堂
周期
2024年11月
2024年10月
2024年09月
2024年08月
2024年07月
2024年06月
2024年05月
2024年04月
2024年03月
2024年02月
2024年01月
2023年12月
2023年11月
2023年10月
2023年09月
2023年08月
2023年07月
2023年06月
2023年05月
2023年04月
2023年03月
2023年02月
2023年01月
2022年12月
2022年11月
2022年10月
2022年09月
2022年08月
2022年07月
2022年06月
2022年05月
2022年04月
2022年03月
2022年02月
2022年01月
2021年12月
2021年11月
2021年10月
2021年09月
2021年08月
2021年07月
2021年06月
2021年05月
2021年04月
2021年03月
2021年02月
2021年01月
2020年12月
2020年11月
2020年10月
2020年09月
2020年08月
2020年07月
2020年06月
2020年05月
2020年04月
2020年03月
2020年02月
2020年01月
共找到
19
条记录
什么是梯度累积?
文摘
2024-11-20 10:00
辽宁
在内存资源有限的条件下,我们通常推荐使用小批次数据训练神经网络。然而,有一种称为梯度累积的技术,可以在逻辑上增加批量大小,而无需显式地增加批量大小。很困惑是吧?让我来解释一 ...
1.一站到底NLP大模型专栏开讲了
文摘
2024-11-19 09:07
辽宁
这是一个讲自然语言处理方法的专栏,作为开篇,有必要先交代清楚语言的重要性。语言对于人类来说,就像是一个最熟悉的陌生人,熟悉到忽略它的存在。语言字面意义上是沟通、交流的工具, ...
训练大模型时,显存都哪去了?
文摘
2024-11-18 09:12
辽宁
GPT-2(XL)有15亿个参数,使用16位精度,一个参数占用2个字节的内存,因此这些参数大约占用3GB的内存。按照如下超参数设置:优化器 → Adam批量大小 → 32变 ...
什么是混合精度训练?
文摘
2024-11-17 10:43
辽宁
深度学习框架在使用数据类型时通常非常保守。例如,在PyTorch中,模型参数默认的数据类型通常是64位或32位。当然,这么做是为了确保在表示信息时能够获得更好的精度。但对大 ...
什么是Gradient Checkpointing?
文摘
2024-11-16 10:02
辽宁
神经网络主要有两种内存使用方式:1.模型权重(这是固定的内存使用)。2.训练过程(这是动态的内存使用)。训练过程又有两种方式:a. 在前向传播过程中,计算并存储所有层的激活 ...
什么是主动学习?
文摘
2024-11-15 09:10
辽宁
如果数据是无标签的,我们很难构建一个监督学习系统。使用无监督技术是一种可行的解决方案,但它们能完成的任务类型有限。另一种可能的方法,是依赖自监督学习。自监督学习是指我们有一 ...
迁移学习、微调、多任务、联邦学习
文摘
2024-11-14 09:55
辽宁
大多数机器学习模型都是独立训练的,然而,通过某种方式实现模型之间的交互也许能带来很大的性能提升。1#)迁移学习迁移学习最佳应用场景:● 目标任务的数据较少。● 但一个相关任 ...
4种常用的多GPU训练策略
文摘
2024-11-13 09:12
辽宁
默认情况下,即使有多块 GPU 可用,深度学习模型通常也只使用单块 GPU 进行训练。一种理想的做法(特别是在大数据环境中)是将训练工作负载分布在多块 GPU 上。下图展示 ...
生产环境测试模型的4种方法
文摘
2024-11-13 09:12
辽宁
尽管在本地(通过验证集和测试集)对机器学习模型进行了严格测试,但立即用新模型替换旧模型仍不是一个好想法。一种更可靠的策略是在生产环境中测试模型(基于真实的实时数据)。虽然这 ...
Kmeans和高斯混合模型有什么区别?
文摘
2024-11-12 08:33
辽宁
通过前面的学习,我们知道Kmeans是基于质心的聚类方法,高斯混合模型则可以看作是一种基于概率分布的聚类方法。那它们之间有什么区别呢?其实,高斯混合模型可以看作是Kmean ...
聚类算法的评估指标
文摘
2024-11-11 09:08
辽宁
在监督学习中,通过比较模型预测结果与实际标签之间的差异来评估模型的性能。但像聚类这种无监督学习任务,没有数据标签,如何衡量聚类的效果呢?因为很多聚类数据都是高维的,所以没办 ...
t-SNE vs SNE 有什么区别?
文摘
2024-11-08 09:11
辽宁
t-SNE算法是SNE的改进版本,都是用于降维的。SNE(非t-SNE)的核心思想是:步骤1)对于高维数据中的每个点(x),将该点到所有其他点(y)的欧几里得距离转换为条件 ...
可别把PCA完全看作是一个可视化工具
文摘
2024-11-07 12:53
辽宁
PCA本质上是一种降维技术。然而,有时人们使用PCA来可视化高维数据集。这是通过将给定的数据投影到二维空间并进行可视化实现的。虽然这看起来是一个合理的做法,但这里有一个经常 ...
PCA中方差的效用
文摘
2024-11-07 12:53
辽宁
PCA的核心目标是保留原始数据的最大方差,同时减少维度。其原理是,如果我们保留了方差,就能够保留最多的信息。但是为什么?许多人难以直观理解使用“方差”的动机。换句话说:为什 ...
标签平滑也是一种正则化技术
文摘
2024-11-06 09:24
辽宁
对于一个多分类数据集,其中两个数据标签概率质量函数如下:所有概率质量都属于其中某一类别,其它类别都为0。这样做会过度激励模型以相当高的置信度学习每个样本的真实类别,这可能会 ...
小心one-hot编码的虚拟变量陷阱!
文摘
2024-11-06 09:24
辽宁
one-hot编码可能给数据带来大问题。当使用one-hot编码类别数据时,不知不觉间,我们给数据引入一个问题:多重共线性。当可以通过两个或更多特征预测另一个特征时,就会出 ...
决策树训练完后应该认真检查一下
文摘
2024-11-05 09:23
辽宁
如果可视化决策树的决策规则(在每个节点评估的条件),会发现它们总是与特征轴垂直,如图所示。换句话说,每棵决策树逐步根据这些垂直边界对特征空间进行划分,以分割数据。当然,这本 ...
线性回归中,为什么使用均方误差损失函数?
文摘
2024-11-04 09:08
辽宁
在线性回归中,通常使用均方误差作为损失函数。但你知道为什么用它吗?要知道,很多函数都能衡量预测值和真实值之间的不同,在所有候选者中,均方误差有什么特殊之处吗?据我所知,很多 ...
为什么说“kernel trick”是一种“trick”?
文摘
2024-11-01 09:05
辽宁
在很多机器学习算法中都能看到核函数的身影,例如,支持向量机(SVM)、核主成分分析(Kernel PCA)等。这里的核函数能够在某个其他特征空间(通常是高维的)中计算点积, ...
人工智能大讲堂
专注人工智能数学原理和应用
分类
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
原创标签
时事
社会
财经
军事
教育
体育
科技
汽车
科学
房产
搞笑
综艺
明星
音乐
动漫
游戏
时尚
健康
旅游
美食
生活
摄影
宠物
职场
育儿
情感
小说
曲艺
文化
历史
三农
文学
娱乐
电影
视频
图片
新闻
宗教
电视剧
纪录片
广告创意
壁纸头像
心灵鸡汤
星座命理
教育培训
艺术文化
金融财经
健康医疗
美妆时尚
餐饮美食
母婴育儿
社会新闻
工业农业
时事政治
星座占卜
幽默笑话
独立短篇
连载作品
文化历史
科技互联网
发布位置
广东
北京
山东
江苏
河南
浙江
山西
福建
河北
上海
四川
陕西
湖南
安徽
湖北
内蒙古
江西
云南
广西
甘肃
辽宁
黑龙江
贵州
新疆
重庆
吉林
天津
海南
青海
宁夏
西藏
香港
澳门
台湾
美国
加拿大
澳大利亚
日本
新加坡
英国
西班牙
新西兰
韩国
泰国
法国
德国
意大利
缅甸
菲律宾
马来西亚
越南
荷兰
柬埔寨
俄罗斯
巴西
智利
卢森堡
芬兰
瑞典
比利时
瑞士
土耳其
斐济
挪威
朝鲜
尼日利亚
阿根廷
匈牙利
爱尔兰
印度
老挝
葡萄牙
乌克兰
印度尼西亚
哈萨克斯坦
塔吉克斯坦
希腊
南非
蒙古
奥地利
肯尼亚
加纳
丹麦
津巴布韦
埃及
坦桑尼亚
捷克
阿联酋
安哥拉
热门文章
新消息?辅警与协警转编!在政策的推动下能免试直接入编,这到底怎么回事?
被包装的“干细胞”
丝舞云泽上,乐鸣青山中!杭州未来国际演艺中心概念性方案出炉!
离开广州,我去了和台湾一水之隔的小岛
形式主义的最大危害:底层人在屎上雕花,管理者在屁中寻香
智商真的特别高的三个星座
杨植麟还没有解开月之暗面的局
放任血糖飙升的中国人,正在透支自己的身体
网红打卡正在毁掉中国景区
明日小雪:气血最容易堵的日子,多吃这4种食物,越吃越通
《小巷人家》:黄玲与庄超英的婚姻,让我们看清,男人没钱、没文化、没本事,都不可怕,最可怕的是这样的…
继续下降!25考研最新报考人数公布!
姐姐心疼弟弟没房,承诺赠送房子给弟弟住,4年后弟弟把房子1400万卖了,姐姐不同意决定撤销赠予,结果弟弟把姐姐告上了法庭
能穿、能住,还能装骨灰,它真是人类的好朋友
离开位置,你是谁?(深刻)
压力还在
头像|小众发光头像-能量体
星座揭秘|12星座男生谁最恋爱脑?
内娱小生们,难上桌
钟睒睒炮轰张一鸣
何炅酒局上被富婆x骚扰?宋茜给大佬生孩子?陈晓被彻底拿捏住?性感花以陪酒为荣?异域女现任追求过疯爽?
中央下放低空管制权,地方疯狂竞争数万亿新风口
前暗区突围制作人孙一鸣加入新厂商,带队突破大厂射击包围圈
一个男人做了这件事,说明已经不在乎你了:3个字
明天亮相,广东两将无缘!“郭”家队的小考来了!
男人不再爱一个人的时候,这3句话,就会常挂在嘴边
95小花交锋,内娱古偶还灵吗?
《白夜破晓》时隔七年回归,原汁原味儿的续作有多“顶”?
抓人了!又抓人了!
王者首位70%胜率法师!新赛季补位将多加两颗星!裴擒虎FMVP皮肤上线时间确定!
显瘦10斤的冬季搭配,太实用了!
甲状腺癌观察文献塌房,问题出在哪里?
北京楼市:世纪城砸惨了
孩子的性格究竟是随爹还是随妈?儿科专家:娘胎里就决定了,后期很难改变
三四十岁发生心梗,多数是因为这种原因!
被落下的民生银行
福冈总决赛首日半程报,国乒3人一轮游,达科:林高远开局很紧张
市委办、政府办、组织部,女生怎么选?
政府官宣:全面清理清退县乡机关编外人员!
这人还问?我觉得必换!实况足球手游国服本周心仪积分&响彻世界&西甲前场简析!
唐霜专栏 | Phoebe Philo的难题
小雪将至,这菜使劲吃!大补命门又活血,一补肾、二祛寒湿,还是天然“青霉素”!
悲剧!又一个强硬派上台了
多只医药股被险资举牌!“牛散”钟格、魏巍等出手,已锁定这些新目标?
400亿蒸发,特变电工,摊牌了!
女星在节目中喝到断片??网友辣评:替她尴尬...
一触即发!三连涨,钢价跌的全要涨回来?
价格暴涨10倍,这款“中国神药”在美国卖到脱销,江苏小伙靠它年入4000多万!
“脆皮打工人”对健康的欲望 ,催生“护腰神器”月销破亿?
首开卖4.5亿后又将加推,海口这个巨无霸盘强得可怕!
知名品牌涉嫌添加禁用原料!儿童面霜选不对,毁容还影响娃发育,快自查
一家E轮独角兽宣布倒闭
十二生肖11月21日运程
分手后再睡一次,这算体面分手吗?
90后博士创业,最热时18家VC追着投
确诊往往已是重症,超 9700 万中国人还不知道自己病了
潜龙19—150MW(潜龙高手的羞涩回忆:被“美女”吧友骗入坑?!)
又开始玄学炒股了
要打核战?普京宣布!
智算中心太“多”,大模型不够用了 | 钛媒体深度
有些正史,让人不寒而栗
政见不同的人如何谈恋爱以及为何总是女的在思考这个问题 | 随机波动150
终于!勇士!杨瀚森!
村党支部书记2024年度工作总结
为什么有的人做什么事情都只敢偷偷摸摸?
2024.11.20 稀土永磁原材料·废料价格
这件事,我不信还有考研人不做!!
600个小区!海口22所优质小学,学区房价曝光!
一轮游回家,国乒淘汰第1人!23岁新人输韩国崩溃,给机会你不争气啊
不穿内裤竟有这种好处?但真的没必要🤣