资治通鉴-文白对照-文本数据

文白对照阅读

简介

这个仓库是有关资治通鉴-文白对照的可供人类和机器阅读阅读并进行相关数据研究的项目。

本项目中的文本格式按照原书的卷进行整理，chapters目录下按照[0-9]+_资治通鉴卷名.md进行分别存储：

chapters
├── 001_资治通鉴第一卷(周纪).md
├── 002_资治通鉴第二卷(周纪).md
├── 003_资治通鉴第三卷(周纪).md
...

每一卷的内容格式如下（*表示在部分卷中可能不存在的内容）：

[卷名]*

[时间原文]
[时间译文]

[空白][空白][原文]
[空白][空白][译文]

[空白][空白][原文]
[空白][空白][译文]

[时间原文]
[时间译文]

[空白][空白][原文]
[空白][空白][译文]

结构化数据

结构化数据已由model.py生成，其中的数据结构及生成过程可见于model.py。结构化数据保存于data.json（结构化数据文件）。数据读取和使用样例请见data_usage_demo_visualization.ipynb（结构化数据使用样例）。

抛砖引玉——资治通鉴数据应用样例（壹）：AI辅助理解可视化

正在进行中。（结构化数据使用样例）

项目进展

项目在持续更新，目前任务列表完成情况如下：

数据预处理的部分源码及说明在本项目的*.ipynb中存档及更新。

如果有任何感兴趣的、想要这个项目做的，请随时、尽情建议！

参与贡献

请随时、尽情在issue中提供任何意见建议，不限于文本内容、文本格式、数据结构、数据分析、数据可视化等任何主题；
文本中有[todo]的地方为分析过程中发现的内容残缺的部分，可以参与校对和修复:D

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
.github/workflows		.github/workflows
chapters		chapters
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
SUMMARY.md		SUMMARY.md
appendix.md		appendix.md
book.toml		book.toml
book_data_clean_prepare.ipynb		book_data_clean_prepare.ipynb
data.json		data.json
data_usage_demo_visualization.ipynb		data_usage_demo_visualization.ipynb
model.py		model.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

资治通鉴-文白对照-文本数据

文白对照阅读

简介

结构化数据

抛砖引玉——资治通鉴数据应用样例（壹）：AI辅助理解可视化

项目进展

参与贡献

相关资源

Star History

About

Releases

Packages

Languages

License

JY0284/zizhitongjian

Folders and files

Latest commit

History

Repository files navigation

资治通鉴-文白对照-文本数据

文白对照阅读

简介

结构化数据

抛砖引玉——资治通鉴数据应用样例（壹）：AI辅助理解可视化

项目进展

参与贡献

相关资源

Star History

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages