面试大厂被怼：怎么连 Attention 都不会？

教育 2024-10-09 12:10 安徽

现在搞人工智能，真是离不开注意力机制。

发论文，模型里没点魔改Attention都不好意思叫创新。

面试算法岗，简单的让你讲讲几种注意力，或者让你手撕个注意力函数、MQA算法之类的。

所以各位小伙伴，尤其是在校生们，还是要打好Attention的基础。这里也分享一些资料：包括缩放点积注意力、多头注意力、交叉注意力、空间注意力、通道注意力等在内的11种主流注意力机制112个创新研究，最新更新到24年9月

这些可以说是目前学术界有关attention最前沿的资料了。并且每篇论文都有对应的代码，可以自己手撕复现，非常方便。

11种主流注意力机制112个创新研究paper+代码，想要的扫码领取⬇️

扫码领112个11种主流注意力机制

创新研究paper和代码

缩放点积注意力

5.Sep.2024—LMLT:Low-to-high Multi-Level Vision Transformer for Image Super-Resolution
4.Sep.2024—MobileUNETR:A Lightweight End-To-End Hybrid Vision Transformer For Efficient Medical Image Segmentation
4.Sep.2024—More is More Addition Bias in Large Language Models
4.Sep.2024—LongLLaVA:Scaling Multi-modal LLMs to 1000 Images Efficiently via Hybrid Architecture

......

扫码领112个11种主流注意力机制

创新研究paper和代码

多头注意力

4.Sep.2024—Multi-Head Attention Residual Unfolded Network for Model-Based Pansharpening
30.Aug.2024—From Text to Emotion: Unveiling the Emotion Annotation Capabilities of LLMs
25.Jun.2024—Temporal-Channel Modeling in Multi-head Self-Attention for Synthetic Speech Detection
14.May.2024—Improving Transformers with Dynamically Composable Multi-Head Attention

......

扫码领112个11种主流注意力机制

创新研究paper和代码

步幅注意力

25.Aug.2024—Vision-Language and Large Language Model Performance in Gastroenterology: GPT, Claude, Llama, Phi, Mistral, Gemma, and Quantized Models
21.Aug.2024—Unlocking Adversarial Suffix Optimization Without Affirmative Phrases: Efficient Black-box Jailbreaking via LLM as Optimizer
16.Aug.2024—Fine-tuning LLMs for Autonomous Spacecraft Control: A Case Study Using Kerbal Space Program
15.Aug.2024—FuseChat Knowledge Fusion of Chat Models

......

扫码领112个11种主流注意力机制

创新研究paper和代码

http://mp.weixin.qq.com/s?__biz=MzUzNjA0MTE4NA==&mid=2247500064&idx=1&sn=6341713e1bb4e90db03984329a7b56a1

深度学习专栏

终于等到你！欢迎来到人工智能、机器学习、深度学习干货集中营！

最新文章

211大学教授、博导，落马！

ChatGPT 4o 国内直接使用！

11月，终于迈过了6w这道坎！

被导师放养，后果可能很严重。。。

年薪 80w，真的可以入局了！

福建女子因男友不会唱国歌怀疑其为间谍，当即举报至相关部门…

导师放养，怒发顶会！

刚刚 GPT o1-preview 彻底开放了！

今年顶会这情况。。。大家还是提前做准备吧！

奇书！大模型经典著作《大语言模型基础与前沿》.pdf

又一院士被“除名”！院士终生制，没了？

刚刚，被 GPT-4o 价格劝退了！

245 个目标检测开源项目合集，建议收藏！

高校女教师被丈夫举报出轨学生，学校发布情况通报！

导师放养，怒发顶会！

刚刚 GPT o1-preview 彻底开放了！

王者归来！GPT-o1彻底爆了！

LSTM 彻底爆了！

从零开始搭建机器学习开发环境：PyCharm与Anaconda教程

NeurIPS'24大模型LoRA超级变体！仅需参数0.4%达微调效率巅峰！

这可能是中国最“恨”地铁的高校，甚至写了篇论文反对地铁经过...

刚刚，被 GPT-4o 价格劝退了！

28个注意力机制模块，轻松涨点发Paper