周期
共找到 244 条记录
科技   2024-12-17 00:02   浙江  
Kandinsky 4.0:一个全面的视频生成方案,包括从文本到视频、图像到视频以及视频到音频的生成能力,以其快速生成视频和高清画质为特色,为创意视频制作提供强大支持。参考 ...
科技   2024-12-17 00:02   浙江  
ComfyUI-MVAdapter:一款让图片生成更便捷的工具,能够直接在ComfyUI界面中从文本提示或单张图片生成多视图一致的图像。参考文献:[1] http://gi ...
科技   2024-12-17 00:02   浙江  
ComfyUI TRELLIS:3D资产生成工具,能够根据不同的输入提示生成多种格式的3D模型,如辐射场、3D高斯和网格。参考文献:[1] http://github.co ...
科技   2024-12-17 00:02   浙江  
Yet Another Language Model:一个用C++/CUDA实现的大型语言模型(LLM)推理工具,不依赖额外的库,除了用于输入输出。参考文献:[1] htt ...
科技   2024-12-17 00:02   浙江  
Even Demo:一个演示应用程序,用于展示与智能眼镜配合的功能,包括 Even AI、图片传输和文本传输等。参考文献:[1] http://github.com/eve ...
科技   2024-12-16 00:00   浙江  
微软发布了一个文档(包括word、excel、ppt、pdf、HTML 、声音图像等)转Markdown的工具:MarkItDown。参考文献:[1] https://gi ...
科技   2024-12-16 00:00   浙江  
本书还没有完全写完,部分章节可阅读。书中讨论了LLMs的能力,探讨了工程师和技术产品经理在构建LLM应用时可能遇到的关键限制和实施问题。通过Python示例和开源解决方案, ...
科技   2024-12-16 00:00   浙江  
加州大学伯克利分校Aditya Guntuboyina教授在2022年秋季学期为高级概率论课程STAT 201A准备的完整讲义。内容涵盖了概率论的基础知识、解释、规则以及在 ...
科技   2024-12-16 00:00   浙江  
Meta 也出了一款相当出色的换衣模型:Leffa。以前这类模型的方法,经常会让细节“跑偏”,比如让衣服的纹理变糊。为了解决这个问题,Meta 发明了一种 “导航系统”(L ...
科技   2024-12-15 00:00   浙江  
DeepSeek-VL2:DeepSeek的先进视觉语言模型,在多模态理解方面取得了显著进展,特别是在视觉问题回答、光学字符识别、文档 / 表格 / 图表理解和视觉定位等任 ...
科技   2024-12-15 00:00   浙江  
Meta刚刚又开源了一个用于视频水印的模型:Meta Video Seal,可以在视频中添加肉眼不可见的水印。植入的水印具有防篡改性,可以抵抗模糊、裁剪以及压缩算法等,可以 ...
科技   2024-12-15 00:00   浙江  
AI Safeguard联合卡内基梅隆和斯坦福最新开源的一款轻量级的多模态模型:Ivy-VL。3B参数,在多个基准测试中超过了PaliGemma 3B 、 Moondrea ...
科技   2024-12-15 00:00   浙江  
文章介绍了如何通过实现和训练感知器来模拟逻辑运算符 AND、OR 和 NOT,同时阐述了感知器在处理非线性可分的问题(如 XOR)时的局限性,以及如何通过多层感知器网络、激 ...
科技   2024-12-14 00:00   浙江  
ChatTTSPlus:聊天文本转语音工具,让语音合成更快速、支持声音克隆和移动部署,提升语音交互体验。参考文献:[1] http://github.com/warmsha ...
科技   2024-12-14 00:00   浙江  
Runway Act one 开源平替出现。HelloMeme:可以通过一张静态照片+一个视频作为输入,生成一个表情和动作都跟原视频一致视频。它能让参考图片上的人“动起来” ...
科技   2024-12-14 00:00   浙江  
微软的Phi-4出来了,14B参数,擅长复杂推理,尤其擅长数学,在数学竞赛问题上超过了Gemini Pro 1.5。目前已在Azure AI Foundry上提供,下周在H ...
科技   2024-12-14 00:00   浙江  
一本在线的免费机器学习电子书,适合深入了解机器学习的原理。参考文献:[1] 访问:http://dafriedman97.github.io/mlbook/content/ ...
科技   2024-12-14 00:00   浙江  
主要是针对C++和汇编语言在Windows、Linux、BSD和Mac OS X操作系统下的优化技巧。页面提供了一系列关于软件优化的资源,包括优化手册、向量类库、目标文件转 ...
科技   2024-12-14 00:00   浙江  
浙大、快手等的多相机视频生成系统:SynCamMaster,可以从不同视角同步生成视频内容,并保持多个视角下视频内容的一致性。参考文献:[1] 项目:https://jia ...
科技   2024-12-14 00:00   浙江  
OpenAuth:一个通用的、基于标准的认证服务提供商,适用于各种应用程序,包括Web应用、移动应用、单页应用、API或第三方客户端,以其灵活性、自托管、标准遵循和可定制性 ...
NLP工程化
专注于对话系统领域的技术分享,重点写《Dify应用操作和源码剖析》专栏。
 热门文章