项目简介
在线批量导出微信公众号文章,支持内嵌的音视频导出,无需搭建任何环境,可100%还原文章样式,支持私有部署。
特性
搜索公众号,支持关键字和biz搜索
搜索公众号内文章(根据文章标题搜索)
导出 html 格式(打包了图片和样式文件,能够保证100%还原文章样式)
批量导出 html 格式(zip打包)
缓存文章列表数据,减少接口请求次数 (关键字搜索的文章不会进入缓存)
支持文章过滤,包括作者、标题、发布时间、原创标识、所属合集等
支持合集下载
支持内嵌的音视频下载
支持图片分享消息
支持视频分享消息
支持导出评论、阅读量等数据 (需要获取目标公众号的key)
支持订阅机制,根据指定规则自动下载文章
🚀 私有部署
Warning
由于项目目前还没有进入稳定状态,所以如果进行了私有部署,请随时关注该项目的最新更新,特别是代理部分的变化,后续将会修改使用策略。
或者你可以修改config/index.ts
中的AVAILABLE_PROXY_LIST
变量,完全使用自己搭建的节点。
另外,目前只有部署到 Deno Deploy 的文档,如果需要部署到其他平台,请在 Issue 中说明。
💡 原理
在公众号后台写文章时支持搜索其他公众号的文章功能,以此来实现抓取指定公众号所有文章的目的。
🌎 关于代理池
数据的下载采用代理池的思路,以便解决跨域、防盗链、加速等一系列问题。
目前有以下代理节点:
https://vproxy-01.deno.dev
https://vproxy-02.deno.dev
https://vproxy-03.deno.dev (本月额度已用完,刷新时间: 2024-11-02 at 19:59:12)
https://vproxy-04.deno.dev (本月额度已用完,刷新时间: 2024-11-02 at 19:59:12)
https://vproxy-05.deno.dev (本月额度已用完,刷新时间: 2024-11-08 at 12:22:38)
https://vproxy-06.deno.dev (本月额度已用完,刷新时间: 2024-11-08 at 12:22:38)
https://vproxy-07.deno.dev
https://vproxy-08.deno.dev
https://vproxy-09.deno.dev
https://vproxy-10.deno.dev
https://vproxy-11.deno.dev
https://vproxy-12.deno.dev
https://vproxy-13.deno.dev
https://vproxy-14.deno.dev
https://vproxy-15.deno.dev
https://vproxy-16.deno.dev
https://vproxy-01.jooooock.workers.dev
https://vproxy-02.jooooock.workers.dev
以上节点都是部署在 Deno Deploy / Cloudflare Workers 上面的免费账户中,算是白嫖了这些托管平台的流量。
目前这些节点都是公开的,后续打算加入签名验证机制,防止被恶意盗刷。
关于导出其他格式
本项目暂不支持除html
格式之外的其他格式,很大一部分原因是样式很难保真。如果需要其他格式,可以寻找其他格式转换工具。
常见问题
请参考 faq 文档,如果遇到其他使用问题,欢迎在 Issue 中说明。
❤️ 感谢
感谢 Deno Deploy、Cloudflare Workers 提供免费托管服务
感谢 WeChat_Article 项目提供原理思路
关于后续更新计划
后续会区分出 免费版 和 Pro版,区别如下:
免费版
所有现有功能
所有现有的代理节点
现有功能的bug修复
Pro版
阅读量、评论数据导出
订阅自动下载服务
更多专用代理节点
目前只是有这个计划,并没有开始实施。对于之前有赞赏行为的用户,可提供优惠政策。
📝 许可
MIT
项目链接
https://github.com/jooooock/wechat-article-exporter
扫码加入技术交流群,备注「开发语言-城市-昵称」
合作请注明
关注「GitHubStore」公众号