Word / DOCX 概览
Word / DOCX 以 OOXML 结构包方式处理文档,保留修订、批注、嵌套表格与多级编号等复杂元素。
目标是精确修改而不产生格式漂移,兼容 Word、Google Docs 与 LibreOffice。
工作原理
1步骤 1 - 解析 OOXML
将 .docx 视为包含多个 XML 的 ZIP,加载 document.xml、styles.xml 与 numbering.xml。
2步骤 2 - 保持结构
追踪 run、段落、样式与编号关系,避免布局漂移。
3步骤 3 - 精准编辑
在不破坏元数据与修订记录的前提下修改指定内容。
4步骤 4 - 兼容校验
保持样式与编号稳定,确保跨平台一致性。
核心功能
样式保留
优先使用命名样式,保持文档整洁一致。
审阅流程支持
保留修订、批注与审阅包装。
高级编号
管理 abstractNum 与段落属性,确保列表缩进正确。
分节控制
按分节管理页边距、方向与页眉页脚。
兼容性审计
减少 Word、Google Docs 与 LibreOffice 之间的布局漂移。
环境要求
- 无需虚拟机。
- 仅本地环境运行,不需要外部 API Key。
使用场景
法律与商务审阅
在保留修订与批注的情况下精确替换内容。
自动化文档生成
从模板生成高保真报告并保持格式稳定。
格式清理
修复编号错误、页边距不一致与杂乱格式。
安装方式
npx clawhub@latest install word-docx在终端运行命令,或点击页面顶部安装按钮一键完成。
常见问题
支持 .doc 老格式吗?
不支持,仅支持 .docx(OOXML)。
修订会丢失吗?
不会,除非你明确选择接受或移除修订。
页眉页脚中的图片能保留吗?
可以,保持关联关系与媒体资源。
列表与项目符号如何处理?
通过 abstractNum 与 num 引用管理,确保编号一致。
目录和页码会自动更新吗?
字段会在打开或打印时更新,技能也可在写入时触发更新。
如何保留或移除修订与批注?
修订内容保存在 XML 中,可选择接受/拒绝修订并移除批注范围。