开发在线协同文档编辑器,分享几点我的思考

科技   2024-12-12 09:02   重庆  

hi, 大家好, 我是徐小夕. 


一周没有写文章, 这段时间也一直在思考和攻克我们做的文档编辑器flowmix/docx的技术难题. 好在经过数个夜晚的奋战, 我们终于取得了突破性的进展, 接下来我就和大家分享一下我们在设计多模态文档编辑器过程中的一些思考和经验, 以及未来 flowmix/docx 多模态文档编辑器的一些发展规划.

为了让大家更高效的阅读这篇文章, 我整理了一下文章大纲:

  • flowmix/docx文档编辑器最近的一些更新复盘

  • 下一代在线文档编辑器的设计架构思考

  • 如何通过文档引擎, 赋能企业数字化价值

  • AI时代, 如何构建企业数智化知识管理系统

  • 多模态文档编辑器的未来展望

今天的内容也是我在做文档产品以及和客户沟通反馈的一些探索和思考,相信大家看完这篇文章, 对多模态文档编辑器会有一个更全面的认知.

一. flowmix/docx多模态文档编辑器最近的更新

更新了几个我觉得还比较有价值的功能, 比如:

1. 支持docx / pdf 大文件解析能力(文档导入能力)

可以看到我们上传一个超大的docx 或者 PDF文件, flowmix/docx文档编辑器会帮我们解析并自动分页, 这样就可以保证大文档解析的性能得到了进一步提高. 

我测试了一个300页面的docx文件, 解析体验还是非常不错的. 

当然这个功能也花了我不少时间, 来设计和优化解析性能, 甚至用了LRU算法, 好在终于实现了大文件解析能力.

体验地址: http://flowmix.turntip.cn/docx

2. 多人协同方案优化

flowmix/docx文档编辑器最近上线了多人协同版本, 目前支持的特点有:

1. 编辑同一段文档时, 支持增量更新内容

2. 不同用户会显示不同颜色的光标, 并在编辑时会在编辑位置显示虚线外框

3. 添加内容时会全量更新; 删除, 修改, 和交换内容顺序, 都支持增量更新

体验地址: http://flowmix.turntip.cn/docx-crop

3. 文档的图片组件支持自由拖拽

确实, 为了实现这个功能, 我们也花了很多精力, 几乎原生的方式实现了图片在文档的自由拖拽功能.

4. 文档的字体样式和字体大小支持自定义

为了进一步cover住传统的富文本编辑器, 这块功能我们也做了实现, 这样我们在编写文档时就能更细节的控制文本内容, 打造“好看”的文档.

当然还有很多功能细节的优化, 大家可以在我们编辑器演示地址体验, 这里就不一一列举了.

二. 下一代在线文档编辑器架构设计的思考

其实多模态这个话题已经说了很久, 尤其在AI领域如日中天, 很多AI厂商都在研究多模态的AI生成能力. 同样在文档领域, 我觉得也有多模态这个概念, 这一点其实Notion做到比较好了, 设计的思想也比较先进.

那什么是多模态文档编辑器呢?

我觉得就是把除了传统富文本编辑器以图文内容展示为主的模式, 做进一步升级, 支持多种形态, 比如网页场景的音视频, 思维导图, 业务组态, 可视化图表等, 都支持在文档中展示, 实现 all in one 的文档价值链路.

目前很多传统桌面端软件也都在不断的云端化, 比如设计平台, IDE, 工业软件等, 都在从电脑搬到“云端”, 进而实现智能网联的万物互联生态.

所以在思考设计一款多模态文档编辑时, 我们需要思考整个编辑器的数据协议通用性和插件化能力, 我经过大量实践和思考, 设计了 flowmix/docx 的技术架构:

可以发现其实文档编辑器的底层设计很重要, 一个就是文档数据规范, 这个涉及到后面产品迭代和整合第三方生态的通用性的问题, 所以 flowmix/docx 采用的是类似于零代码平台的 json schema 数据结构, 这样的设计未来可以很轻松的实现数据协议层的转换, 并能最大限度的集成WEB组件.

文档类产品很难脱离老牌的word文档, 所以在底层我们设计了解析算法, 来实现对基础docx文件的解析, 并能在 flowmix/docx 中实时编辑.

对于技术群体, 其实对Markdown的解析和导入导出也非常有必要, 因为编写技术文档公认的使用MD格式语法是效率最高的,  所以在底层数据转换上, 我么也支持了解析Markdown文件和实时转化MD语法的能力, 帮助研发人员使用MD语法快速编写文档:

所谓的底层基础决定上层建筑, 正因为我们设计的 flowmix/docx 这层底层模式, 保证了在文档应用层, 我们提供了更友好的开放能力, 支持自定义各种内容组件:

我们目前也实现了30多个文档组件和功能插件, 后续还会进行扩展符合企业业务管理的能力插件:

所以大家对文档管理项目有需求的, 也可以参考flowmix/docx的这套设计架构体系.

三. 如何通过文档引擎, 赋能企业数字化价值

文档引擎其实是链接企业知识资产和业务能力的桥梁, 而多模态能力, 便是这个桥梁的核心支柱. 这一点其实国内飞书文档和钉钉文档做的是比较好的.

试想一下, 如果在一个文档里, 可以嵌入企业内部的一个数据报表, 数据还是实时同步的, 那是不是这个文档就拥有了业务属性? 而且是一个很常用的业务功能:

这对于PM或者销售汇报工作, 企业周报等场景, 是一个非常不错的切入点.

甚至我们能在文档里嵌入一个自定义表单, 来收集用户对某一项决策的建议, 文档管理者可以在文档后台看到数据并统计建议, 这将极大的缩短我们的工作链路(传统的做法是不是还需要在群里咨询意见或者用第三方表单平台来搭建, 然后在统计)

还有很多的企业协同管理的场景, 其实一个文档, 就能帮你搞定. 这也是我投入时间精力做这件事的价值所在. 好在我们基于自研的多模态文档编辑器flowmix/docx, 实现了一个基本满足企业知识管理和业务管理的Saas平台, 供大家使用和体验:

大家感兴趣可以免费使用, 目前开放中.

使用地址: http://orange.turntip.cn

四. AI时代, 如何构建企业数智化知识管理系统

我一直觉得AI技术的发展是为了自动化时代的进一步到来. 所以在设计文档技术选型时, 其实有考虑过如何和AI更好的融入, 所以可以发现flowmix/docx的文档数据采用结构化的JSON进行存储, 因为它可被AI高效学习, 并能批量化生成内容.

其实我们可以融合多模态文档编辑器做很多事情, 我设计了一个应用场景的内容, 大家可以参考一下:

其实我自己也在思考如何去更深度的把文档和企业业务系统做打通, 并基于这套设计体系, 低成本的和AI做集成, 实现批量化和智能化的内容生成, 目前已经有一些实践了,比如我们橙子轻文档的模版, 其实大多都是通过AI生成的:

其实底层还是依赖我们的数据解析算法, 把AI生成的文本转换成flowmix/docx支持的格式. 后面我们会继续挖掘企业管理的更多能力, 比如甘特图, 多维表格等, 大家有好的场景和建议也欢迎随时留言区交流反馈.

五. 多模态文档编辑器的未来展望

其实设计flowmix/docx 多模态文档编辑器的唯一的目标就是帮助企业更低成本的拥有专业级的多模态文档解决方案, 从而赋能整个企业的知识资产管理.

目前flowmix/docx已经实现了如下核心能力的研发:

同时提供了更灵活的二次开发模式:

在技术实现上, 为了兼顾不同客户的技术需求, 我们也提供了ReactVue3两个版本:

后续我们会推出更多能力, 帮助客户实现更有价值的文档即服务的产品, 目前的规划和服务体系如下:

欢迎加入我们的生态,共建一个更加智能的知识管理系统.

文档地址http://flowmix.turntip.cn/docx

最新进展我会定期同步在flowmix视界公众号中, 大家感兴趣可以关注一下:

如果大家有好的建议也欢迎随时交流反馈~

往期精彩:

分享10款开源工作流+思维导图项目
安利一款支持多人协同的多模态文档编辑器
又做了一款新产品!多模态文档Saas平台

趣谈前端
徐小夕【知乎专栏作家】掘金签约作者,定期分享前端工程化,可视化,企业实战项目知识,深度复盘企业中经常遇到的500+技术问题解决方案。【关注趣谈前端,前端路上不迷茫】
 最新文章