你只需要上传一张图片,然后框选出参考主体,然后加上提示词,点击生成,很快一个相同人物的不同场景视频就生成了,并且这是完全免费的。这对于不会使用comfyUI 的朋友来说简直太方便了,并且该模型支持商业使用,赶快试试吧!
1. 神秘模型“小熊猫”爆火,排名超越 FLUX 和 Midjourney
近日,一款名为“red_panda”的新型图文生成模型迅速走红,其性能超越了 Flux、Midjourney 等知名模型,以 79% 的胜率和每 7 秒生成一张图像的速度引起广泛关注。该模型的来源成谜,引发众多猜测,很有可能来自中国厂商。
OpenAI 近日推出了 ChatGPT 的新功能,允许用户快速搜索历史聊天记录,极大提升了信息检索效率。这一更新对写作、教育、金融和医疗等行业尤其有益,帮助用户构建个性化的聊天资料库。新功能将分阶段向不同用户群体推出,免费用户将于下月获得访问权限。
微软公司宣布开源 OmniParser,是一款解析和识别屏幕上可交互图标的 AI 工具。该工具并不需要依赖额外的上下文数据,可以理解更复杂的图形用户界面。OmniParser 结合可交互区域检测模型、图标描述模型和 OCR 模块等,不需要 HTML 标签或视图层次结构等显式基础数据,能够在桌面、移动设备和网页等上跨平台工作,提高用户界面的解析准确性。
4. 智源联合高校开源 Video-XL,打破长视频理解极限
Video-XL 是一款专为高效的小时级视频理解而设计的超长视觉语言模型,利用“视觉上下文潜在摘要”技术将长视频内容压缩成精简形式,提高效率并保留关键信息。在多个长视频理解基准测试中表现出色,效率和效果平衡。应用前景广阔,可用于电影摘要、监控异常检测和广告植入识别。
5. 苹果 iOS18.2 确认于 12 月推送,将为 Siri 植入 ChatGPT