腾讯研究院AI速递 20240820

学术   2024-08-20 00:01   广东  

生成式AI

一、  Faiss向量数据库测《三体》全集,国产AI加速卡性能提升7倍

1. Faiss是一个高效的向量相似性搜索和聚类库,支持大规模数据处理,可用于图像检索、推荐系统等;

2. 海光DCU加速卡提供了显著的性能提升,使Faiss在处理《三体》全集的文本相似度搜索时性能提高了7倍;

3. 测试环境部署在Ubuntu系统上,使用了海光Z100L加速卡,通过官方镜像和开发者社区资源进行环境配置和Faiss库安装.

https://mp.weixin.qq.com/s/tRYJipmY_5FqLwR8AOekug

二、  Flux大火,新LoRA模型Half_illustration 让照片秒变艺术大片

1. Half_illustration基于Flux.1的LoRA模型,能将描述的场景转化为既真实又梦幻的艺术图片;

2. 模型结合摄影与插画元素,通过用户描述加入动态元素如烟雾、火焰,增强视觉冲击力;

3. 提供API接口,与Diffusers库兼容,方便开发者快速生成和集成图像处理功能.

https://mp.weixin.qq.com/s/te8jkQQ1I6ZFKCikhizfyQ

三、  微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学

1. 微软团队开发的AgentInstruct智能体框架能自动创建大量多样化的合成数据,用于模型训练;

2. 使用AgentInstruct后训练的Orca-3模型在多个基准测试中性能显著提升,特别是在数学方面提高了168%;

3. AgentInstruct通过生成式教学方法,减少了模型幻觉,提高了数据生成的质量和多样性.

https://mp.weixin.qq.com/s/lLfMgsRtYRfONL4PPxvEoA

四、  Melodisco AI 版云音乐,收录 30 万首 AI 歌曲的开源AI 播放器

1. Melodisco是一个开源AI音乐播放器,已收录30万首AI生成的歌曲;

2. 支持音乐生成、歌曲排行榜、随机播放、歌曲管理等功能,具备多样化的播放器组件;

3. 提供服务端渲染和SEO优化,集成Stripe支付系统支持在线购买.

https://mp.weixin.qq.com/s/V5z5Rn2f4ZuueEOnYcqrGQ

五、  昆仑万维推出全球首款 AI 短剧平台 SkyReels,「一人一剧」时代

1. 昆仑万维推出SkyReels,全球首个集成视频大模型与3D大模型的AI短剧平台,实现从剧本生成到视频合成的完整短剧制作流程;

2. SkyReels平台通过自研技术如SkyScript剧本大模型和StoryboardGen分镜大模型,提高剧本和分镜的质量与效率,支持一键生成分镜和角色;

3. 结合AI 3D引擎与视频大模型的WorldEngine,SkyReels能生成高质量、一致性强的视频内容,支持1080P 60帧视频输出,显著提升短剧制作的可控性和专业度.

https://mp.weixin.qq.com/s/4w5eOquY6p2Z7pXIUuKf9w

六、  Consensus,又一家AI学术搜索完成1150万美元 A 轮融资

1. Consensus完成1150万美元A轮融资,由Union Square Ventures领投,专注于构建学术研究和健康主题的AI搜索引擎;

2. 利用20种不同的AI系统,包括OpenAI的GPT-4进行文本摘要,提供从可信学术出版物中总结文件的功能;

3. 该平台拥有400,000名月活跃用户,目前年化收入预计为150万美元,主要用户群体为学生和专业人士.

https://mp.weixin.qq.com/s/6zmpzv-S2HcWXzUpYiWowg

七、  国内机构研发次季节AI大模型「伏羲」,突破「可预报性沙漠」

1. 「伏羲」次季节气候预测大模型由上智院、复旦大学和中国气象局联合研发,成功超越欧洲中期天气预报中心的S2S模式,首次发表于《Nature Communications》;

2. 模型集成了海气相互作用和热带大气季节内振荡(MJO),并通过智能扰动生成模块在隐空间中刻画气候系统的演变概率,提升了预测精度;

3. 「伏羲」实现了对MJO的预测技巧达到36天,显著提升了全球降水预测能力,尤其在长江中下游等热带外地区表现突出.

https://mp.weixin.qq.com/s/Vme50jwwgV0DI-vu3vtgQQ

八、  智源千万级指令微调数据集 Infinity-Instruct ,完成新一轮迭代

1. 智源研究院推出的Infinity-Instruct数据集包含千万级指令,用于微调语言模型,提高对话模型性能;

2. 经过Infinity-Instruct数据集微调的Llama3.1-70B模型性能接近GPT-4,显示出显著的对话能力提升;

3. 数据集包括基础指令和对话指令,支持模型在真实对话场景中的应用,已在多个评测榜单上显示出优越性能.

https://mp.weixin.qq.com/s/CWW3Lr_iQrTr9Zr9nTh4ig

前沿科技

九、  Figure CEO转发,中国人形机器人Astribot S1弹琴泡茶打咏春

1. 国产人形机器人Astribot S1展示多样化技能,包括弹琴、泡功夫茶、烹饪华夫饼,以及练习咏春拳;

2. Astribot S1采用人形上半身和轮式底盘设计,具备高度模块化和自由度,能够执行精细操作和复杂任务规划;

3. 机器人通过自主学习和实时数据处理提升操作精度和环境适应性,预计将在北京世界机器人大会上公开展示.

https://mp.weixin.qq.com/s/k81NE3bOxEIVw_3-eJY-Kg

报告观点

十、  腾讯科技:“泡沫恐慌”蔓延,AI泡沫是否会重演互联网泡沫

1. AI行业目前存在泡沫风险,近期美股科技股大跌,市值蒸发显著,尤其是AI领域的公司;

2. 尽管存在泡沫,但AI技术的长期潜力和影响被广泛认可,大型科技公司如英伟达、苹果等继续投资AI,显示对其未来的信心;

3. 投资者和市场对AI的期待可能过高,导致资本过度流入,但AI技术的发展和应用仍在持续,其潜在的经济效益和生产力提升效果预期巨大.

https://mp.weixin.qq.com/s/d-VOmeoyYN2c1cUnGEN7Jg

👇订阅下方合集,获取每日推送

腾讯研究院
腾讯公司设立的社会科学研究机构,依托腾讯公司多元的产品、丰富的案例和海量的数据,围绕产业发展的焦点问题,通过开放合作的研究平台,汇集各界智慧,共同推动互联网产业健康、有序的发展,致力于成为现代科技与社会人文交叉汇聚的研究平台。\x0d\x0a
 最新文章