周期
共找到 15 条记录
职场   2024-11-22 18:14   北京  
今年剩下一个多月时间要做的第三件事情是把自己的3D互动项目真正的离线化,包括ASR、大模型、TTS、嘴形同步、声音克隆、语音实时监听等全部离线部署,再接入多模态的聊天功能, ...
职场   2024-11-21 11:44   北京  
不再需要繁琐的 FBX 传输:Blender Auto Setup 提供了将最新版本的 Blender 与 Reallusion 的 Character Creator、i ...
职场   2024-11-21 11:44   北京  
首个集成了OpenAI Realtime API和RTC能力的实时多模态AI agent:TEN-Agent,具备天气查询、网络搜索、视觉识别、RAG能力,适合智能客服、实 ...
职场   2024-11-20 14:49   北京  
给自己的数字人项目找配套的场景一直以来追求的一个方向,昨天看到国外一个开源的能量塔的炫酷效果,然后就拿过来了,哈哈哈。源码地址:https://github.com/ota ...
职场   2024-11-20 14:49   北京  
塑造 2025 年的设计趋势2025 年,技术与创意的融合将继续重塑数字格局。以下是今年影响网络的最重要的趋势的精选。1. 讲述故事的网站我注意到,网站不再只是静态页面,而 ...
职场   2024-11-19 17:11   北京  
这是今年完成的第二个事情,就是将我的3D数字人互动项目跟之前的GIS、数字孪生的完美整合。经过了一段时间的技术沉淀,终于可以将数字人和数字孪生项目整合起来了。这也是我一直坚 ...
职场   2024-11-18 18:04   北京  
今年一直处于忙碌状态,所以公众号更新的都是AI相关的,具体开发的项目很少,好在今年还有1个多月,把之前想处理的事情收一下尾。我要做的第一件事情就是这个我叫它“数字人工坊”的 ...
职场   2024-11-18 18:04   北京  
Ultravox 是一种新型的多模态 LLM,它可以理解文本和人类语音,而无需单独的音频语音识别 (ASR) 阶段。在AudioLM、SeamlessM4T、Gazelle ...
职场   2024-11-15 17:33   北京  
我又喜新厌旧了,用了很长一段时间的cursor和Bolt,给别人各种推荐它两的好处之后,又喜欢上了这个叫Windsurf Editor的AI代码编辑器。喜欢它的原因就是可以 ...
职场   2024-11-14 15:30   北京  
上次写了一篇关于《TANGO :开源的Heygen?支持面部、唇形同步和肢体运动视频》的介绍文章,本来就是想记录一下这个开源模型的,后来看到一家做数字人的公司写的文案比较好 ...
职场   2024-11-13 17:00   北京  
弧线飞来飞去的弧线是最重要的组成部分。每条弧线都代表实时下达的订单,它们从商家飞向买家所在地。这些可以定义为具有 4 个控制点的贝塞尔曲线。每个点都是一个三维矢量。P0:位 ...
职场   2024-11-13 17:00   北京  
这是一名16岁少年用cursor和v0用三个小时构建的一个应用上传一张人物照片,然后随意输入文字,跳转文字的位置、尺寸等即可。代码:https://github.com/R ...
职场   2024-11-12 17:09   北京  
今天又发现一个很好用的3D模型流体粒子化组件FlowFieldParticles,所谓流体化,就是当鼠标放上去的时候可以像水一样流动。然后将自己的数字人放进去试试效果。特点 ...
职场   2024-11-12 17:09   北京  
风格化的龙卷风使用threejs+shaders源码地址:https://github.com/otanodesignco/stylized-tornado体验地址:htt ...
职场   2024-11-11 18:18   北京  
实时语音交互数字人,支持端到端语音方案(GLM-4-Voice - THG)和级联方案(ASR-LLM-TTS-THG)。可自定义形象与音色,支持音色克隆,首包延迟低至3s ...
前端程序设计
专注前端最前沿技术,数据可视化,web3d。偶尔插播生活和艺术。
 热门文章