大家好,我是章北海
之前折腾机器学习周刊,没坚持下来,定期出内容太难了。
但是日常看到很多不错的项目、文章和工具,还是很想记录、分享。
以后不定期发布
1、OminiControl
来自新加坡国立大学的研究团队提出了一种全新的框架 ——OminiControl,该框架能在生成图片时,可以更轻松地控制生成的结果,比如通过提供一些图片信息(边缘线稿、深度图或者某个物体的图片)来指导模型,生成更符合要求的图像。
一句话:只要提供素材图,利用OminiControl就能将素材图中的主题融入到生成的图片中。
🧬code: https://github.com/Yuanshi9815/OminiControl
📄paper: https://arxiv.org/abs/2411.15098
🍇runpod: https://github.com/camenduru/ominicontrol-tost
🍊jupyter : https://github.com/camenduru/ominicontrol-jupyter
🥪tost: https://tost.ai
2、背景移除工具-RMBG-2.0
RMBG-2.0 支持处理各种类型的图像,一键移除背景,效果不错且处理速度很快,非常适合电商、广告等应用场景。
🚀在线使用:https://huggingface.co/spaces/briaai/BRIA-RMBG-2.0
⏬模型下载:https://huggingface.co/briaai/RMBG-2.0
模型开源,但不可商用。
3、Cursor "编程私教" prompt
❝“AI 代码工具就像无弦吉他,懂一些音律会玩得更像样些。”
看到一篇文章,作者介绍了来自油管 @realmckaywrigley 的"私教" prompt,这个"私教" prompt 会指导 AI:
为代码添加清晰的注释说明 解释每个关键概念和使用原因 提供学习建议和改进方向 在你提出疑问时深入浅出地解答
📝文中作者介绍了该 prompt 的使用方法:https://www.ermian.site/blogs/cursor-as-coding-tutor
4、下载管理开源神器
一款功能强大的文件上传/下载管理开源神器:File Centipede。支持几乎所有常见的协议,如 HTTPS、BT/磁力链接、FTP、WebDAV、m3u8 等,还内置了许多实用的辅助功能。此外,还提供了浏览器插件,可抓取网站上的音频和视频,甚至加密的视频。
🔥GitHub:https://github.com/filecxx/FileCentipede
随便聊聊
两个小新闻
1 一些Sora的alpha版艺术家们把 OpenAI 的内测接口直接打包到 huggingface 上,给所有人用。
项目 README 中,艺术家们对 OpenAI 发起了嘲讽技
❝“我们向世界分享这一切,希望OpenAI能变得更加开放、更加友好对待艺术家,并超越公关噱头来真正支持艺术发展。”
但是可惜的是,仅 3 小时后,这个接口即被关闭。
2 是华为发布 Mate 70 系列,起售价 5499 元。Mate X6 为折叠屏版,起售价 12999 元。
尊界 S800 开启预订,意向金 2 万元,预计售价 100-150 万元。
余承东在微博上发文称,“发布会刚结束,一看手机,有朋友直接微信转账了 6 万给我,要订 3 台尊界!朋友们,要订车快去华为商城,转账给我不能收啊!”
现在真没动力换手机了,都好贵啊。我的备用机是红米,用了4年了,依然康健。