大厂11种主流 Attention 魔改

科技 2024-10-10 13:50 北京

现在搞人工智能，真是离不开注意力机制。

发论文，模型里没点魔改Attention都不好意思叫创新。

面试算法岗，简单的让你讲讲几种注意力，或者让你手撕个注意力函数、MQA算法之类的。

所以各位小伙伴，尤其是在校生们，还是要打好Attention的基础。这里也分享一些资料：包括缩放点积注意力、多头注意力、交叉注意力、空间注意力、通道注意力等在内的11种主流注意力机制112个创新研究，最新更新到24年9月

这些可以说是目前学术界有关attention最前沿的资料了。并且每篇论文都有对应的代码，可以自己手撕复现，非常方便。

11种主流注意力机制112个创新研究paper+代码，想要的扫码领取⬇️

扫码领112个11种主流注意力机制

创新研究paper和代码

缩放点积注意力

5.Sep.2024—LMLT:Low-to-high Multi-Level Vision Transformer for Image Super-Resolution
4.Sep.2024—MobileUNETR:A Lightweight End-To-End Hybrid Vision Transformer For Efficient Medical Image Segmentation
4.Sep.2024—More is More Addition Bias in Large Language Models
4.Sep.2024—LongLLaVA:Scaling Multi-modal LLMs to 1000 Images Efficiently via Hybrid Architecture

......

扫码领112个11种主流注意力机制

创新研究paper和代码

多头注意力

4.Sep.2024—Multi-Head Attention Residual Unfolded Network for Model-Based Pansharpening
30.Aug.2024—From Text to Emotion: Unveiling the Emotion Annotation Capabilities of LLMs
25.Jun.2024—Temporal-Channel Modeling in Multi-head Self-Attention for Synthetic Speech Detection
14.May.2024—Improving Transformers with Dynamically Composable Multi-Head Attention

......

扫码领112个11种主流注意力机制

创新研究paper和代码

步幅注意力

25.Aug.2024—Vision-Language and Large Language Model Performance in Gastroenterology: GPT, Claude, Llama, Phi, Mistral, Gemma, and Quantized Models
21.Aug.2024—Unlocking Adversarial Suffix Optimization Without Affirmative Phrases: Efficient Black-box Jailbreaking via LLM as Optimizer
16.Aug.2024—Fine-tuning LLMs for Autonomous Spacecraft Control: A Case Study Using Kerbal Space Program
15.Aug.2024—FuseChat Knowledge Fusion of Chat Models

......

扫码领112个11种主流注意力机制

创新研究paper和代码

Python数据科学

以Python为核心语言，专攻于「数据科学」领域，文章涵盖数据分析，数据挖掘，机器学习等干货内容，分享大量数据挖掘实战项目分析和讲解，以及海量的学习资源。

最新文章

快速学会登上nature的热门算法，LSTM！

被导师放养，后果可能很严重。。。

245个目标检测开源项目合集，建议收藏！

评分卡模型变量分箱体系（Python实操）

不是，现在都流行用Kaggle写论文了吗？

如何丝滑地，做风控策略收紧？

如何快速进阶风控策略和模型？

吴恩达：每个AI从业者都应该关注Agent！

大厂风控策略是如何做收紧的？

上海交大ACM班，俞勇教授团队第4本重磅新作出版啦！

从0到1，如何快速进阶风控策略和模型？

被导师放养，后果可能很严重。。。

“对比Excel学，Python可视化” 终于来了！

贷中行为变量衍生体系

如何快速进阶风控策略和模型？

大行授信额度策略是如何设计的？

如何搭建自己的风控策略体系？

大厂风控模型是如何设计的？

245个目标检测开源项目合集，建议收藏！

风控策略、模型岗，如何实现弯道超车？

被导师放养，后果可能很严重。。。

新版2024企业级BI平台白皮书（附下载）

大行的贷中行为变量是如何加工的？

大行的授信额度框架是如何设计的？

论文神器：82个“即插即用”的模型插件！

大行的额度策略设计和测算全流程

大厂11种主流 Attention 魔改

《100天风控专家》限时优惠，最后26个名额！

大厂的额度策略效果是如何测算的？

《100天风控专家》国庆优惠活动

风控策略&模型3️⃣群，开放加入！

大行风控的 ”策略+模型“ 是如何做的？

大行的额度收入测算是如何做的？

大厂风控的 “置换策略” 是如何设计的？

如何搭建自己的风控策略体系？

KAN 2.0 架构18个应用项目合集

yyds！时序+LLM大模型新玩法

损益测算：风控中 “IRR” 如何快速计算？

这本 “深度学习” 神书终于面世！

大行的额度策略是如何设计的？

多模态融合，顶会超神了！

交通时空大数据：车辆轨迹数据分析、挖掘与可视化（Python代码）

如何搭建自己的风控策略体系？

LSTM又火了！最新52个创新思路+全部开源代码！

零售消费数据分析案例：七秒易购供应链管理全流程解析（附下载）

大厂风控策略是如何做收紧的？

最近爆火的全中文LLM教程，实战企业落地项目

10万字、近20家企业智能分析决策合集

信贷风控中的置入置出策略是什么？

基于Python的23种经典设计模式实战（超全）！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉