Flux：Midjourney的新图像模型挑战者

文摘科技 2024-08-04 10:54 美国

文｜庞德公

编辑｜郭嘉

--->更多内容，请移步“鲁班秘笈”！！<---

Black Forest Labs是一家由前Stability.ai开发人员创立的AI初创公司，旨在为图像和视频创建尖端的生成式 AI 模型。这家初创公司声称，其第一个模型系列Flux.1为文本到图像的生成设定新的标准。

Black Forest Labs总部位于德国弗莱堡，由AI研究人员和开发人员组成，他们曾在Stability.ai从事Stable Diffusion和其他生成式 AI 模型的工作。团队在今年春季从Stability.ai离开，到目前为止已经筹集了3100万美元的种子资金。本轮融资由Andreessen Horowitz领投，天使投资人包括Brendan Iribe、Michael Ovitz、Garry Tan、Timo Aila和Vladlen Koltun。General Catalyst 和 MätchVC 也进行了投资。这家初创公司的创始人过往有令人印象深刻的成就，在VQGAN、潜在扩散、稳定扩散XL、稳定视频扩散等领域的创新做出贡献。

Black Forest Labs发布了Flux.1文本到图像的生成模型套件。这些模型“在图像细节、提示一致性、风格多样性和场景的复杂性方面都达到了最新的水准”。从语言中可以看出这家公司对于领头羊的位置信心十足。Flux迄今为止最大的SOTA开源文本到图像模型，由Black Forest Labs开发，Flux 以令人印象深刻的12B参数突破了创造力和性能的界限。

例如输入“一个戴着墨镜、身穿夏威夷衬衫的大土豆躺在沙滩巾上，周围环绕着色彩缤纷的沙滩球和人字拖。附近水果在打沙滩排球。在背景中，一座灯塔沙雕矗立在一辆带有巨大圆锥体的冰淇淋车旁边，为快乐的海滩游客提供美食。这个场景捕捉到了有趣、俏皮的夏日氛围，附近有海浪拍打的声音。”

所有 Flux.1 型号都支持多种纵横比和分辨率，范围从 0.1 到 2.0 百万像素。根据Black Forest Labs的数据，Flux.1 [pro]和[dev]在视觉质量、提示跟踪、大小/宽高比可变性、排版和输出多功能性方面优于Midjourney v6.0、DALL-E 3 （HD）和SD3-Ultra等流行型号。

Flux.1 [schnell]（意为“快速”）被“吹捧”为最先进的快速模型，性能优于同类竞争对手，甚至优于一些非蒸馏模型，如 Midjourney。<小编试了一下，它对于细节的捕获还是很赞的，可能受限于训练样本，有些单词它没有办法很直接的联想和生成。比如输入一个卡通的小孩参加2024年的巴黎奥运会，下图为输出产物。>

目前，Flux.1 有三种变体：

Flux.1 [pro]这是一款旗舰型号，旨在提供最先进的性能以及卓越的图像质量、细节和多样性。它非常适合需要顶级结果的专业应用，可是通过fal.ai进行商业使用。
Flux.1 [dev] FLUX.1 [dev] 是pro 型的蒸馏变体<链接回放>，可用于非商业用途。它提供相似的质量和响应能力，是研究和开发的理想选择。
Flux.1 [schnell]该模型针对速度进行了优化，非常适合本地开发和个人项目。它遵从Apache 2.0的许可，确保了开发的易访问性和灵活性。

鲁班号导读火热上线!!

------>敬请移步“鲁班秘笈”！<------

http://mp.weixin.qq.com/s?__biz=MzkzNDM4MDQyMg==&mid=2247486776&idx=1&sn=87f982afd5ae1bf0b4c381b7353861d6

鲁班模锤

基于开源技术生态，跟踪与普及人工智能、隐私计算、区块链以及数据空间的最新技术。着力于数据治理自动化，依托语料库构建数据可信流通方案，为所有企业提供平等的数据增益服务。

最新文章

神经网络与2024诺贝尔物理奖

利用语料来透析（“哲学思考”） “数字孪生” 上

WordLlama：在消费级GPU上奔跑的“瘦子”

AI新思考：“浴火重生”的草莓模型

Apple发布iPhone16和Apple Intelligence

突发：Runway删库跑路，备受瞩目的Stable Diffusion v1.5不见了！

优雅谈大模型：白话ZeRO 下

Jamba前生今世：1.5开源来袭

AI架构系列：去其形而留其意

ViT篇外：NVIDIA Llama-3.1-Minitron 4B

FlashAttention3：再次深度挖掘硬件潜力

Grok 2携AI图片生成重生

TorchChat：Ollama的潜在对手

优雅谈大模型：Python编程篇

AIGC中数据治理的“科林格里奇困境”

泡沫还是机遇？复盘18个月的AI装备竞赛

三个臭皮匠与一个诸葛亮：覆盖率与正确率的博弈

NiFi ：1 初识这把“十年一剑”的利器

Flux：Midjourney的新图像模型挑战者

Apple在Swift中引入同态加密

Meta再下一城：SAM 2

“年轻的”IMO选手：扫荡“围棋”后，开始扫荡“数学”

新版PyTorch：AI任务加速与Intel GPU集成

优雅谈大模型：白话ZeRO 上

Llama 3.1和xAI的超集群加速AI军备竞赛

LLama3.1 405B即将来袭：开源首次超越GPT-4o

优雅谈大模型：“System2”与“System 1”

本周当之无愧：小模型周

百万专家小专家：“N个小皮匠”？！

SpreadsheetLLM：微软对Excel编码的“摊膀伏”

LLM基础模型系列：Prefix-Tuning

FlashAttention3：“苗条”的就是比较好！

数据跨境法案：美国篇下

MobileLLM：“苗条”的模型比较好！

白话无人驾驶：2 运动规划

白话无人驾驶：1风暴来袭

优雅谈大模型：白话向量数据库

RWKV: 与Transformer和Mamba掰掰手腕的小家碧玉

LLM基础模型系列：Prompt-Tuning

LLM基础模型系列：Fine-Tuning总览

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉