Skip to content

资治通鉴,文言文/白话文对照文本,便于阅读。数据建模、可视化进行中。文白对照阅读:https://jy0284.github.io/zizhitongjian/

License

Notifications You must be signed in to change notification settings

yjcui/zizhitongjian

This branch is 6 commits behind JY0284/zizhitongjian:main.

Folders and files

NameName
Last commit message
Last commit date

Latest commit

3ed5bb3 · Aug 1, 2024

History

22 Commits
Aug 1, 2024
Jul 31, 2024
Jul 30, 2023
Aug 1, 2024
Aug 1, 2024
Aug 1, 2024
Jul 24, 2024
Aug 1, 2024
Jul 17, 2024
Jul 31, 2024
Jul 31, 2024

Repository files navigation

资治通鉴-文白对照-文本数据

文白对照阅读

阅读书籍点击

简介

项目地址:zizhitongjian

这个仓库是有关资治通鉴-文白对照的可供人类和机器阅读阅读并进行相关数据研究的项目。

本项目中的文本格式按照原书的进行整理,chapters目录下按照[0-9]+_资治通鉴卷名.md进行分别存储:

chapters
├── 001_资治通鉴第一卷(周纪).md
├── 002_资治通鉴第二卷(周纪).md
├── 003_资治通鉴第三卷(周纪).md
...

每一卷的内容格式如下(*表示在部分卷中可能不存在的内容):

[卷名]*

[时间原文]
[时间译文]

[空白][空白][原文]
[空白][空白][译文]

[空白][空白][原文]
[空白][空白][译文]

[时间原文]
[时间译文]

[空白][空白][原文]
[空白][空白][译文]

项目进展

项目在持续更新,目前任务列表完成情况如下:

  • 文本内容获取
  • 格式化卷名,便于排序及查询
  • 时间数据的译文格式保持和原文格式统一
  • 去除不符合文白对照格式的空行、空格,使用统一的换行格式
  • 文本内容程序化校对,定位残缺和错误内容
  • 文本数据结构化,便于利用数据分析工具和可视化工具进行处理
  • ...

数据预处理的部分源码及说明在本项目的*.ipynb中存档及更新。

参与贡献

  1. 请在issue中提供任何意见建议,不限于文本内容、文本格式、数据结构、数据分析、数据可视化等任何主题;
  2. 文本中有[todo]的地方为分析过程中发现的内容残缺的部分,可以参与校对和修复:D

相关资源

  1. http://www.ziyexing.com/files-5/zizhitongjian/zizhitongjian_index.htm
  2. https://ctext.org/wiki.pl?if=gb&res=548761&remap=gb
  3. 卷28译文可参考:http://www.ziyexing.com/files-4/yywj-157.htm

Star History

Star History Chart

About

资治通鉴,文言文/白话文对照文本,便于阅读。数据建模、可视化进行中。文白对照阅读:https://jy0284.github.io/zizhitongjian/

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 88.7%
  • Python 11.3%