这是一个使用 Go 语言开发的工具,用于将 EPUB 电子书的内容从简体、繁体的相互转换。
-
安装依赖:
go mod tidy
-
编译:
go build
-
运行:
./epub-converter -i input.epub -o output.epub -r t2s
-i
: 指定输入的 EPUB 文件路径。-o
: 指定输出的 EPUB 文件路径。-r
: 指定转换规则 (默认为t2s
)。支持的规则包括:- 's2t':简体中文到繁体中文
- 't2s':繁体中文转换为简体中文
- 's2tw': 简体中文转繁体中文 (台湾标准)
- 'tw2s':繁体中文(台湾标准)转换为简体中文
- 's2hk':简体中文到繁体中文(香港标准)
- 'hk2s':繁体中文(香港标准)转换为简体中文
- 's2twp':简体中文转繁体中文(台湾标准),带有台湾成语
- 'tw2sp':繁体中文(台湾标准)到简体中文,带有中国大陆成语
- 't2tw':繁体中文(OpenCC 标准)到台湾标准
- 't2hk':繁体中文 (OpenCC 标准) 至 香港标准
该工具的主要步骤如下:
- 解压 EPUB 文件。
- 遍历解压后的文件,找到 HTML、XHTML 和 OPF 文件。
- 将 HTML 和 XHTML 文件中的文本内容进行繁体到简体的转换。
- 将 OPF 文件中的标题、描述和作者等元数据进行繁体到简体的转换。
- 将转换后的文件重新打包成 EPUB 文件。
- 该工具目前仅支持转换 HTML、XHTML 和 OPF 文件中的文本内容。
- 该工具使用
github.com/liuzl/gocc
库进行繁简转换,该库使用 Unicode 数据库进行转换。 - 如果遇到转换错误,请检查 EPUB 文件的结构是否正确,或者尝试使用其他 EPUB 阅读器打开该文件。
欢迎提出问题和改进建议,也欢迎提交 Pull Request。
本项目使用 MIT 许可证。