开发在线协同文档编辑器,应该考虑哪些重要的点?

科技   2024-12-16 09:30   广东  

前言

大家好,我是林三心,用最通俗易懂的话讲最难的知识点是我的座右铭,基础是进阶的前提是我的初心~

这段时间 flowmix/docx团队 全身心地投入到 flowmix/docx 文档编辑器的技术难题探讨与解决中。历经数夜的努力,我们终于迎来了重大突破。现在,我想与大家探讨我们在打造多模态文档编辑器过程中的深入思考和实践经验,并分享 flowmix/docx 多模态文档编辑器未来的发展规划



为了让大家更高效的阅读这篇文章, 我整理了一下文章大纲:

  • flowmix/docx文档编辑器最近的一些更新复盘
  • 下一代在线文档编辑器的设计架构思考
  • 如何通过文档引擎, 赋能企业数字化价值
  • AI时代, 如何构建企业数智化知识管理系统
  • 多模态文档编辑器的未来展望

今天的内容也是flowmix/docx团队在做文档产品以及和客户沟通反馈的一些探索和思考,相信大家看完这篇文章, 对多模态文档编辑器会有一个更全面的认知

flowmix/docx 最近的更新点

支持 docx/pdf 大文件解析能力(导入)


当我们尝试上传一个庞大的 docx 或 PDF 文件至 flowmix/docx 文档编辑器时,它会自动为我们解析并完成分页工作,从而显著提升了处理大型文档的性能

我亲自测试了一个包含 300页 的 docx 文件,其解析速度和体验都令人相当满意

为了实现这一功能,我投入了大量的时间和精力来设计和优化解析性能,甚至采用了LRU算法。幸运的是,经过不懈努力,我们最终成功地增强了对大文件的解析能力

体验地址: http://flowmix.turntip.cn/docx

多人协同方案优化


近期,flowmix/docx 文档编辑器推出了多人协同版本,具备以下特色功能:

  • 首先,在同时编辑同一篇文档时,系统能够实现内容的增量更新;
  • 其次,不同用户的编辑光标将以不同颜色显示,并在编辑位置呈现虚线外框,以便于区分;
  • 最后,在添加内容时会进行全面更新,而在删除、修改或调整内容顺序时,则支持增量更新方式

体验地址: http://flowmix.turntip.cn/docx-crop

文档的图片组件支持自由拖拽


为了实现这个功能, flowmix/docx团队 也花了很多精力, 几乎原生的方式实现了图片在文档的自由拖拽功能.

文档的字体样式和字体大小支持自定义

为了更好地兼容传统富文本编辑器的功能,我们在这部分也进行了实现。这样一来,大家在编写文档时就能对文本内容进行更精细的控制,从而制作出更具吸引力的“好看”文档

当然,还有许多功能细节方面我们都进行了优化。您可以通过访问我们的编辑器演示地址进行亲身体验,这里就不再逐一说明了

下一代在线文档编辑器架构设计的思考

多模态这个议题已然成为了热门讨论,尤其在AI产业中备受瞩目,众多AI企业纷纷致力于研究多模态AI生成技术。同样地,在文档领域,我认为也存在多模态的概念,这方面Notion表现得尤为出色,其设计理念颇具前瞻性

那么,何谓多模态文档编辑器呢?

在我看来,它是在传统富文本编辑器以图文为主的基础上进行升级,拓展至更多元的表现形式,诸如网页中的音视频、思维导图、业务组态以及可视化图表等,都能在文档中得以呈现,从而构建起一个 all in one 的完整文档价值链条

目前很多传统桌面端软件也都在不断的云端化, 比如设计平台, IDE, 工业软件等, 都在从电脑搬到“云端”, 进而实现智能网联的万物互联生态

所以在思考设计一款多模态文档编辑时, 我们需要思考整个编辑器的数据协议通用性和插件化能力, 我经过大量实践和思考, 设计了 flowmix/docx 的技术架构:

实际上,文档编辑器的底层架构设计尤为关键。其中,文档数据规范便是一个重要方面,这关系到后续产品升级以及与第三方生态整合的兼容性问题。因此,flowmix/docx 采用了类似零代码平台的 json schema 数据结构,这种设计便于未来轻松实现数据协议转换,并能最大限度地集成WEB组件

由于文档类产品难以完全摆脱传统的word文档,我们在底层设计了专门的解析算法,以便实现对基础docx文件的解析,并能在 flowmix/docx 中进行实时编辑。

对于技术群体而言,Markdown的解析与导入导出功能同样不可或缺,因为使用MD格式语法编写技术文档被认为是最高效的方式。因此,在底层数据转换层面,我们也提供了对 Markdown 文件的解析以及实时转化MD语法的能力,从而助力研发人员利用MD语法迅速编写文档



所谓的底层基础决定上层建筑, 正因为我们设计的 flowmix/docx 这层底层模式, 保证了在文档应用层, 我们提供了更友好的开放能力, 支持自定义各种内容组件:

flowmix/docx 目前也实现了30多个文档组件和功能插件, 后续还会进行扩展符合企业业务管理的能力插件:

所以大家对文档管理项目有需求的, 也可以参考 flowmix/docx 的这套设计架构体系

通过文档引擎, 赋能企业数字化价值

文档引擎实际上充当着连接企业知识资产与业务能力的纽带,而多模态功能正是这一纽带的关键支撑。在这方面,国内的飞书文档和钉钉文档表现得相当出色

设想一下,若在一个文档中能够嵌入企业内部的实时数据报表,那么这份文档是否就具备了业务特性呢?而且,这还是一项非常实用的业务功能

这对于项目经理或销售汇报、企业周报等各类场景而言,无疑提供了一个极佳的工具。更进一步,我们甚至可以在文档中嵌入自定义表单,用以征集用户对某一决策的意见或建议。文档的管理者则能在后台轻松查看并统计这些数据,如此一来,极大地简化了工作流程。相较于传统的做法——要么在群里逐一询问意见,要么借助第三方表单平台搭建并再进行统计——这种方式无疑更加高效便捷

还有很多的企业协同管理的场景, 其实一个文档, 就能帮你搞定. 这也是我投入时间精力做这件事的价值所在. 好在我们基于自研的多模态文档编辑器 flowmix/docx, 实现了一个基本满足企业知识管理和业务管理的Saas平台, 供大家使用和体验:



大家感兴趣可以免费使用, 目前开放中

使用地址: http://orange.turntip.cn

AI时代, 如何构建企业数智化知识管理系统

我一直认为AI技术的演进旨在推动自动化时代的全面到来。正因如此,在进行文档技术选型时,我深入思考了如何更好地将AI融入其中。因此,你会发现 flowmix/docx 的文档数据采用了结构化的 JSON 格式进行存储,这是因为 JSON 格式能被AI高效学习和处理,并能实现内容的批量生成。

实际上,我们能够通过融合多模态文档编辑器来探索诸多可能性。为此,我设计了一个应用场景,供大家参考:

其实我自己也在思考如何去更深度的把文档和企业业务系统做打通, 并基于这套设计体系, 低成本的和AI做集成, 实现批量化和智能化的内容生成, 目前已经有一些实践了,比如我们橙子轻文档的模版, 其实大多都是通过AI生成的:


其实底层还是依赖我们的数据解析算法, 把AI生成的文本转换成 flowmix/docx 支持的格式. 后面我们会继续挖掘企业管理的更多能力, 比如甘特图, 多维表格等, 大家有好的场景和建议也欢迎随时留言区交流反馈

多模态文档编辑器的未来展望

其实设计 flowmix/docx 多模态文档编辑器的唯一的目标就是帮助企业更低成本的拥有专业级的多模态文档解决方案, 从而赋能整个企业的知识资产管理.目前 flowmix/docx 已经实现了如下核心能力的研发:

同时提供了更灵活的二次开发模式:

在技术实现上, 为了兼顾不同客户的技术需求, 我们也提供了 React 和 Vue3 两个版本:

后续我们会推出更多能力, 帮助客户实现更有价值的文档即服务的产品, 目前的规划和服务体系如下:

文档地址: http://flowmix.turntip.cn/docx

前端之神
一位前端小菜鸡,写过400多篇原创文章,全网有6w+个前端朋友,梦想是成为”前端之神“~
 最新文章