VLRLab团队受字节跳动安全与数据部门邀请，进行基于大模型的多模态风险内容识别的汇报

文摘 2024-10-28 21:38 湖北

Defend-Monkey

2024年10月28日，VLRLab团队受字节跳动安全与数据部门邀请，进行基于大模型的多模态风险内容识别的汇报，分享者为团队iPad本科生管海粟，字节跳动安全与数据部门百余名员工一同参与本次会议。

会议内容

在本次会议中，团队介绍了风险识别的背景知识。随着科技的不断发展，AI多人换脸、语音人脸伪造、短信网页诈骗等诈骗案件频出，严重危害公民安全，检测风险信息已经刻不容缓。目前风险信息可以分为图像伪造，音频伪造和文本网页诈骗三类。其中的图像伪造主要可以分为传统伪造和AIGC伪造两种方法。而目前的检测技术大多基于图像特征，边缘噪声等方式来实现检测，但是只能针对固定的伪造方式，泛化能力不足。而音频伪造主要分为文本语音转换，语音到语音的转换，情感伪造，场景伪造以及部分语音伪造这五个方式，而检测技术同样依赖于伪造数据的生成方式，同样具有较弱的泛化性。而关于文本网页诈骗需要生成更好的可解释性语句来提高检测的可信度。

为此我们团队构建了基于多模态风险内容识别框架defend-monkey，对于输入的图像、语音、纯文本或者是富含文字信息的图片，模型能根据不同的 instruction给出相应的判断，并输出判断理由。

研究方法

具体而言，多模态大模型的整体框架如下图所示。对于图像输入，我们会进行一个输入，首先图片会通过vision encoder提取图片特征，并使用 SegForgery分割模型提取图片的mask图，并输出包含伪造区域定位信息的 position token，最后将这两部分token 与人为构造的instruction进行contact操作再输入大模型。对于语音输入，首先使用专有的语音分割模型细致地分割出语音的篡改部分，再将分割的结果，语音转成的文本的信息以及相应的instruction一同输入大模型，使得大模型能给出相应的分析。对于文本信息输入，也进行类似的操作，将文本信息转换为对应的 text token，再contact 对应的instruction，最后我们模型可以统一地对这整个信息进行整合，并输出结果。

本次汇报还介绍了模型的实验结果和一些实际例子。其中，在图像伪造和音频伪造识别任务上，Defend-monkey在众多公开数据集上都取得了最优的结果。在文本网页诈骗识别中，Defend-monkey检测的结果也优于GPT-4o mini。

实际使用中，模型不仅会判断各种输入是否存在伪造风险，还会给出判断的理由。

VLRLab

通讯｜匡嚞玢

审核｜罗琪頔

VLRLab学习屋

发布华中科技大学VLRLab实验室的新闻资讯与动态

最新文章

武汉大学提出Hi-SAM，一种利用SAM进行多层次文本分割的统一模型。

北京大学提出了一种实时端到端检测器，名为RT-DETR

字节跳动提出LLaVA-NeXT-Interleave：一种面向多图像、视频和三维任务的多模态大模型方法

北京大学提出了一种高效的3D内容生成方法DreamGaussian

历史性突破！VLRlab大四学生团队首次在“挑战杯”揭榜挂帅专项赛斩获“擂主”

UCSD提出一种新的图像表示，它使用扩散模型促进输入图像的空间编辑。

就在明天！CSIG优博论坛将于11月3日在华中科技大学举办

华为提出EWEK-QA，一种高效通用的QA系统。

VLRLab团队受字节跳动安全与数据部门邀请，进行基于大模型的多模态风险内容识别的汇报

清华大学提出视觉语言模型CogAgent，专注于GUI的理解与导航。

VLRLab团队iPad本科生获ECCV 2024水下目标识别竞赛全球冠军

华南理工&华科提出一种Bridge text spotting方法，解决了两阶段方法中的错误累积和次优性能问题，同时保持模块化。

MIT提出了一种异构预训练Transformer模型

VLRLab团队研究生成果获ECCV2024首届数据集蒸馏竞赛亚军

VLRLab团队4篇论文入选人工智能领域国际顶会NeurIPS 2024

上海交通大学提出了一种有效的位置森林Transformer: PosFormer，用于手写数学表达式识别。(米兰）

VLRLab团队iPad本科生论文被PRCV 2024接收

复旦大学提出OccLLaMA，一种occ-language-action生成世界模型。

国科大提出Math-PUMA，一种三阶段的专注于渐进向上的多模态对齐方法。

VLRLab团队iPad本科生论文被Nature旗下期刊《Scientific Data》接收

甲骨文单字辅助破译数据集HUST-OBC

高质量甲骨文文字演变数据集EVOBC

前沿论文分享20240716

前沿论文分享20240708

任意粒度感知！IPad本科生发表顶级会议论文

VLRLab团队7篇论文入选计算机视觉国际顶会ECCV 2024

前沿论文分享20240702

前沿论文分享20240626

前沿论文分享20240618

前沿论文分享20240611

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉