Html2OpenXml:HTML转化为OpenXml的.Net库,轻松实现Html转为Word。

科技   2024-09-28 11:38   福建  
推荐一个开源库,轻松实现HTML转化为OpenXml。
 

01

项目简介

Html2OpenXml 是一个开源.Net库,旨在将简单或复杂的HTML内容转换为OpenXml组件。
该项目始于2009年,最初是为了将用户评论转换为Word文档而设计的
随着时间的推移,Html2OpenXml 不断发展和完善,现在已经成为处理HTML到OpenXml转换的强大工具。
 

02

项目核心功能

HTML转OpenXml:该库能够将HTML文档(包括简单的文本、图像、表格等)转换为OpenXml格式的组件,进而可以被Microsoft Word等应用程序识别和处理。
.Net支持版本:Html2OpenXml 支持.Net Framework 4.6.2、.NET Standard 2.0 和 .NET 8,确保了在不同.Net环境下的兼容性。
依赖:该库依赖于DocumentFormat.OpenXml和AngleSharp这两个包,分别用于处理OpenXml文档和HTML解析。

03

支持Html标签

常规标签:如<a>, <h1>-<h6>, <b>, <i>, <u>, <s>, <del>, <ins>, <em>, <strike>, <strong>等。
图像和图表:<img>, <figcaption>, <svg>。
表格相关:<table>, <td>, <tr>, <th>, <tbody>, <thead>, <tfoot>, <caption>, <col>。
其他常用标签:如<div>, <span>, <p>, <ul>, <ol>, <li>, <q>, <blockquote>, <article>, <aside>, <section>等。
需要注意的是,标签的样式属性style是支持的,但JavaScript (<script>), CSS样式(<style>), <meta>标签、注释、按钮和输入控件等HTML元素在转换过程中会被忽略。

04

使用示例

该项目有着详细的开发文档,并且项目中也提供示例。
开发文档:
https://github.com/onizet/html2openxml/wiki

Html转为Word示例截图
Html代码

转换后的Word截图
从截图可以看出Html标签、样式等都可以正常转换过来。
 

05

项目地址

https://github.com/onizet/html2openxml
- End -

推荐阅读

2个零基础入门框架教程!

一个C#开源工具库,集成了超过1000个扩展方法
Sep:一个低内存、高性能的CSV文件读写操作.Net开源库
Boxed:包含多个.Net项目模板,涵盖了ASP.NET Core API、GraphQL等。
Atata:一个基于 Selenium的C#自动化测试Web框架

回复“888”,免费领取.NetCore视频教程

点击下方公众号卡片,关注我

编程乐趣
专注分享.NET和.NET Core编程知识、有趣热门的开源项目。
 最新文章