diff --git a/.gitignore b/.gitignore
index 3469f78..eadcc98 100644
--- a/.gitignore
+++ b/.gitignore
@@ -12,4 +12,5 @@
# Project-local glide cache, RE: https://github.com/Masterminds/glide/issues/736
.glide/
-.DS_Store
\ No newline at end of file
+.DS_Store
+tmp/
diff --git a/Makefile b/Makefile
index e69de29..4c00444 100644
--- a/Makefile
+++ b/Makefile
@@ -0,0 +1,9 @@
+update\:data:
+ # Fetch to update data from https://github.com/BYVoid/OpenCC
+ mkdir -p ./tmp && rm -Rf tmp/OpenCC-master
+ wget https://github.com/BYVoid/OpenCC/archive/refs/heads/master.zip -O tmp/opencc.zip
+ unzip tmp/opencc.zip -d tmp/
+ sh ./merge-data.sh
+test:
+ sh ./merge-data.sh
+ go test ./...
\ No newline at end of file
diff --git a/README.md b/README.md
index bff2ab6..13f542b 100644
--- a/README.md
+++ b/README.md
@@ -60,6 +60,17 @@ func main() {
- `tw2t.json` Traditional Chinese (Taiwan standard) to Traditional Chinese 臺灣正體到繁體(OpenCC 標準)
- `s2hk-finance.json` 针对香港市场金融数据,做了特殊补充。
+## Development Guides
+
+- dictionary - 用来同步 OpenCC 官方的字典,请勿改动,这个文件夹应该是靠命令来生成的。
+- addition-dictionary - 用来存放此项目提前修复的字典,执行 `make update:data` 的时候,会把这里的内容补充到 dictionary 里面。
+
+采用 `make update:data` 命令可以从 OpenCC 官方仓库更新词典。
+
+```bash
+$ make update:data
+```
+
## Benchmarks
See [benchmark_test.go](https://github.com/longbridgeapp/opencc/tree/master/tests/benchmark_test.go)
diff --git a/addition-dictionary/STCharacters.txt b/addition-dictionary/STCharacters.txt
new file mode 100644
index 0000000..162f533
--- /dev/null
+++ b/addition-dictionary/STCharacters.txt
@@ -0,0 +1 @@
+厘 厘
diff --git a/addition-dictionary/STPhrases.txt b/addition-dictionary/STPhrases.txt
new file mode 100644
index 0000000..e67eb19
--- /dev/null
+++ b/addition-dictionary/STPhrases.txt
@@ -0,0 +1,7 @@
+高峰 高峰
+什么 什麼
+讲下 講吓
+回流 回流
+迴流 回流
+公厘 公厘
+厘米 厘米
diff --git a/config/hk2s.json b/config/hk2s.json
index c1257f8..cf0e9b9 100644
--- a/config/hk2s.json
+++ b/config/hk2s.json
@@ -7,36 +7,27 @@
"file": "TSPhrases.ocd2"
}
},
- "conversion_chain": [
- {
- "dict": {
- "type": "group",
- "dicts": [
- {
- "type": "ocd2",
- "file": "HKVariantsRevPhrases.ocd2"
- },
- {
- "type": "ocd2",
- "file": "HKVariantsRev.ocd2"
- }
- ]
- }
- },
- {
- "dict": {
- "type": "group",
- "dicts": [
- {
- "type": "ocd2",
- "file": "TSPhrases.ocd2"
- },
- {
- "type": "ocd2",
- "file": "TSCharacters.ocd2"
- }
- ]
- }
+ "conversion_chain": [{
+ "dict": {
+ "type": "group",
+ "dicts": [{
+ "type": "ocd2",
+ "file": "HKVariantsRevPhrases.ocd2"
+ }, {
+ "type": "ocd2",
+ "file": "HKVariantsRev.ocd2"
+ }]
+ }
+ }, {
+ "dict": {
+ "type": "group",
+ "dicts": [{
+ "type": "ocd2",
+ "file": "TSPhrases.ocd2"
+ }, {
+ "type": "ocd2",
+ "file": "TSCharacters.ocd2"
+ }]
}
- ]
+ }]
}
diff --git a/config/s2hk.json b/config/s2hk.json
index 91623a3..fcaa017 100644
--- a/config/s2hk.json
+++ b/config/s2hk.json
@@ -7,27 +7,21 @@
"file": "STPhrases.ocd2"
}
},
- "conversion_chain": [
- {
- "dict": {
- "type": "group",
- "dicts": [
- {
- "type": "ocd2",
- "file": "STPhrases.ocd2"
- },
- {
- "type": "ocd2",
- "file": "STCharacters.ocd2"
- }
- ]
- }
- },
- {
- "dict": {
+ "conversion_chain": [{
+ "dict": {
+ "type": "group",
+ "dicts": [{
+ "type": "ocd2",
+ "file": "STPhrases.ocd2"
+ }, {
"type": "ocd2",
- "file": "HKVariants.ocd2"
- }
+ "file": "STCharacters.ocd2"
+ }]
+ }
+ }, {
+ "dict": {
+ "type": "ocd2",
+ "file": "HKVariants.ocd2"
}
- ]
+ }]
}
diff --git a/config/s2twp.json b/config/s2twp.json
index d8fd266..2f36e93 100644
--- a/config/s2twp.json
+++ b/config/s2twp.json
@@ -7,33 +7,26 @@
"file": "STPhrases.ocd2"
}
},
- "conversion_chain": [
- {
- "dict": {
- "type": "group",
- "dicts": [
- {
- "type": "ocd2",
- "file": "STPhrases.ocd2"
- },
- {
- "type": "ocd2",
- "file": "STCharacters.ocd2"
- }
- ]
- }
- },
- {
- "dict": {
+ "conversion_chain": [{
+ "dict": {
+ "type": "group",
+ "dicts": [{
"type": "ocd2",
- "file": "TWPhrases.ocd2"
- }
- },
- {
- "dict": {
+ "file": "STPhrases.ocd2"
+ }, {
"type": "ocd2",
- "file": "TWVariants.ocd2"
- }
+ "file": "STCharacters.ocd2"
+ }]
+ }
+ }, {
+ "dict": {
+ "type": "ocd2",
+ "file": "TWPhrases.ocd2"
+ }
+ }, {
+ "dict": {
+ "type": "ocd2",
+ "file": "TWVariants.ocd2"
}
- ]
+ }]
}
diff --git a/dictionary/HKPhrasesFinance.txt b/dictionary/HKPhrasesFinance.txt
index 4b7efe5..b3d55fe 100644
--- a/dictionary/HKPhrasesFinance.txt
+++ b/dictionary/HKPhrasesFinance.txt
@@ -81,4 +81,5 @@
除權日 除淨日
摘牌 除牌
追加保證金通知 追收孖展
-被迫倉 被挾倉
\ No newline at end of file
+被迫倉 被挾倉
+高峰 高峰
\ No newline at end of file
diff --git a/dictionary/JPVariants.txt b/dictionary/JPVariants.txt
index 6ed3b92..3a8468b 100644
--- a/dictionary/JPVariants.txt
+++ b/dictionary/JPVariants.txt
@@ -158,7 +158,7 @@
淨 浄
淺 浅
渴 渇
-溌 潑
+潑 溌
溪 渓
溫 温
溼 湿
@@ -216,7 +216,7 @@
穗 穂
穩 穏
穰 穣
-竃 竈
+竈 竃
竊 窃
粹 粋
糉 粽
@@ -229,7 +229,7 @@
縣 県
縱 縦
總 総
-繋 繫
+繫 繋
繡 繍
繩 縄
繪 絵
@@ -312,7 +312,7 @@
鄉 郷
酢 醋
醉 酔
-醗 醱
+醱 醗
醫 医
醬 醤
釀 醸
diff --git a/dictionary/STCharacters.txt b/dictionary/STCharacters.txt
index 5339753..54edeaa 100644
--- a/dictionary/STCharacters.txt
+++ b/dictionary/STCharacters.txt
@@ -342,7 +342,7 @@
厍 厙
厐 龎
厕 廁
-厘 厘
+厘 釐 厘
厢 廂
厣 厴
厦 廈
@@ -455,7 +455,7 @@
坚 堅
坛 壇 罈
坜 壢
-坝 壩
+坝 壩 垻
坞 塢
坟 墳
坠 墜
@@ -952,6 +952,7 @@
汉 漢
汤 湯
汹 洶
+沄 澐
沈 沈 瀋
沟 溝
没 沒
@@ -3863,29 +3864,118 @@
𫢸 僤
𫧃 𣍐
𫧮 𪋿
+𫫇 噁
𫬐 㘔
+𫭟 塸
+𫭢 埨
+𫭼 𡑍
𫮃 墠
𫰛 娙
+𫵷 㠣
𫶇 嵽
𫷷 廞
𫸩 彄
𬀩 暐
+𬀪 晛
+𬂩 梜
+𬃊 櫍
+𬇕 澫
+𬇙 浿
+𬇹 漍
+𬉼 熰
+𬊈 燖
+𬊤 燀
+𬍛 瓅
+𬍡 璗
+𬍤 璕
+𬒈 礐
+𬒗 𥗽
+𬕂 篢
+𬘓 紃
+𬘘 紞
+𬘡 絪
+𬘩 綎
+𬘫 綄
+𬘬 綪
+𬘭 綝
+𬘯 綧
+𬙂 縯
+𬙊 纆
+𬙋 纕
+𬜬 蔄
+𬜯 䓣
+𬞟 蘋
+𬟁 虉
+𬟽 蝀
+𬣙 訏
+𬣞 詝
+𬣡 諓
+𬣳 詪
+𬤇 諲
+𬤊 諟
+𬤝 譓
+𬨂 軝
+𬨎 輶
+𬩽 鄩
+𬪩 醲
+𬬩 釴
𬬭 錀
+𬬮 鋹
+𬬱 釿
+𬬸 鉥
+𬬹 鉮
𬬻 鑪
+𬬿 鉊
+𬭁 鉧
𬭊 𨧀
+𬭎 鋐
+𬭚 錞
𬭛 𨨏
+𬭤 鍭
+𬭩 鎓
+𬭬 鏏
𬭭 鏚
+𬭯 䥕
𬭳 𨭎
𬭶 𨭆
+𬭸 鏻
+𬭼 鐩
+𬮱 闉
+𬮿 隑
+𬯀 隮
+𬯎 隤
+𬱖 頔
+𬱟 頠
+𬳵 駓
+𬳶 駉
+𬳽 駪
+𬳿 駼
+𬴂 騑
+𬴃 騞
+𬴊 驎
𬶋 鮈
𬶍 鮀
𬶏 鮠
+𬶐 鮡
𬶟 鯻
+𬶠 鰊
+𬶨 鱀
+𬶭 鰶
+𬶮 鱚
+𬷕 鵏
+𬸘 鶠
+𬸚 鸑
+𬸣 鶱
+𬸦 鷟
𬸪 鷭
𬸯 鷿
+𬹼 齘
+𬺈 齮
+𬺓 齼
𰬸 繐
𰰨 菕
𰶎 譅
𰾄 鋂
𰾭 鑀
𱊜 𪈼
+厘 厘
diff --git a/dictionary/STPhrases.txt b/dictionary/STPhrases.txt
index 13bdc37..d89074e 100644
--- a/dictionary/STPhrases.txt
+++ b/dictionary/STPhrases.txt
@@ -32,6 +32,7 @@
一前一后 一前一後
一力承当 一力承當
一卷 一卷
+一厘一毫 一釐一毫
一厢情愿 一廂情願
一去不回 一去不回
一去不复 一去不復
@@ -293,6 +294,7 @@
七余 七餘
七八下里 七八下裏
七出 七出
+七出戏 七齣戲
七出祁山 七出祁山
七分钟 七分鐘
七划 七劃
@@ -695,6 +697,7 @@
三冬 三冬
三冬两夏 三冬兩夏
三准 三準
+三出戏 三齣戲
三出祁山 三出祁山
三分钟 三分鐘
三只 三隻
@@ -1056,7 +1059,7 @@
不可胜言 不可勝言
不可胜计 不可勝計
不可胜记 不可勝記
-不吃烟火食 不吃煙火食
+不吃烟火食 不喫煙火食
不合 不合
不合体统 不合體統
不合作 不合作
@@ -1129,10 +1132,11 @@
不尽道理 不盡道理
不屑于 不屑於
不属于 不屬於
+不差毫厘 不差毫釐
不差毫发 不差毫髮
不干 不幹 不乾
不干不净 不乾不淨
-不干不淨吃了没病 不乾不淨吃了沒病
+不干不淨吃了没病 不乾不淨喫了沒病
不干了 不幹了
不干事 不幹事
不干他 不干他
@@ -1586,6 +1590,7 @@
东欧集团 東歐集團
东海捞针 東海撈針
东涂西抹 東塗西抹
+东涌 東涌
东淨里的砖儿 東淨裏的磚兒
东游 東遊
东窗事发 東窗事發
@@ -2219,7 +2224,7 @@
乌滋别克 烏滋別克
乌滋别克斯坦 烏滋別克斯坦
乌烟瘴气 烏煙瘴氣
-乌狗吃食白狗当灾 烏狗吃食白狗當災
+乌狗吃食白狗当灾 烏狗喫食白狗當災
乌苏 烏蘇
乌苏市 烏蘇市
乌苏拉 烏蘇拉
@@ -2295,6 +2300,7 @@
九亿五千万 九億五千萬
九余 九餘
九冬 九冬
+九出戏 九齣戲
九出祁山 九出祁山
九分钟 九分鐘
九划 九劃
@@ -3423,7 +3429,7 @@
亿多只 億多隻
亿天后 億天後
什不闲 什不閒
-什么 甚麼
+什么 什麼
什叶派 什葉派
什里店 什里店
什锦炒面 什錦炒麪
@@ -3946,7 +3952,7 @@
似松实紧 似鬆實緊
佃租制度 佃租制度
但云 但云
-但得一片橘皮吃且莫忘了洞庭湖 但得一片橘皮吃且莫忘了洞庭湖
+但得一片橘皮吃且莫忘了洞庭湖 但得一片橘皮喫且莫忘了洞庭湖
但愿 但願
但愿如此 但願如此
但曲 但曲
@@ -4370,7 +4376,7 @@
侵蚀基准 侵蝕基準
便了 便了
便于 便於
-便吃干 便吃乾
+便吃干 便喫乾
便宜不过当家 便宜不過當家
便当 便當
便当店 便當店
@@ -5488,7 +5494,7 @@
党外 黨外
党外人士 黨外人士
党太尉 党太尉
-党太尉吃匾食 党太尉吃匾食
+党太尉吃匾食 党太尉喫匾食
党委 黨委
党委书记 黨委書記
党委会 黨委會
@@ -5657,6 +5663,7 @@
全面禁止核试验条约 全面禁止核試驗條約
全面规划 全面規劃
全面进行 全面進行
+兩出戏 兩齣戲
八万 八萬
八万一千 八萬一千
八万四千法门 八萬四千法門
@@ -5668,6 +5675,7 @@
八余 八餘
八克 八克
八军团 八軍團
+八出戏 八齣戲
八出祁山 八出祁山
八十天环游地球 八十天環遊地球
八十种好 八十種好
@@ -5736,6 +5744,7 @@
公制单位 公制單位
公升 公升
公历 公曆
+公厘 公釐
公合 公合
公同 公同
公同共有 公同共有
@@ -5786,6 +5795,7 @@
六余 六餘
六冲 六沖
六出奇计 六出奇計
+六出戏 六齣戲
六出祁山 六出祁山
六厂 六廠
六发 六發
@@ -7323,7 +7333,7 @@
出宰 出宰
出家 出家
出家人 出家人
-出家人吃八方 出家人吃八方
+出家人吃八方 出家人喫八方
出将入相 出將入相
出小恭 出小恭
出尔反尔 出爾反爾
@@ -7363,7 +7373,7 @@
出恭 出恭
出息 出息
出意外 出意外
-出戏 齣戲
+出戏 出戏 齣戲
出战 出戰
出户 出戶
出手 出手
@@ -7703,6 +7713,8 @@
分半钟 分半鐘
分占 分佔
分厂 分廠
+分厘卡 分釐卡
+分厘毫丝 分釐毫絲
分发 分發
分发到 分發到
分发区 分發區
@@ -7789,7 +7801,7 @@
切当 切當
切菜板 切菜板
切除术 切除術
-切面 切面
+切面 切面 切麵
切骨之仇 切骨之仇
刊了 刊了
刊出 刊出
@@ -9036,7 +9048,7 @@
北向 北向
北周 北周
北回 北迴
-北回归线 北回歸線
+北回归线 北迴歸線
北回线 北迴線
北回铁路 北迴鐵路
北岳 北嶽
@@ -9763,7 +9775,7 @@
南向 南向
南回 南迴
南回公路 南迴公路
-南回归线 南回歸線
+南回归线 南迴歸線
南回线 南迴線
南回铁路 南迴鐵路
南宫适 南宮适
@@ -10465,7 +10477,17 @@
厌恶感 厭惡感
厌食症 厭食症
厓谷 厓谷
+厘出 釐出
+厘升 釐升
+厘定 釐定
+厘改 釐改
+厘整 釐整
+厘正 釐正
厘清 釐清
+厘米 釐米
+厘订 釐訂
+厘金 厘金
+厘革 釐革
厚朴 厚朴
厚板 厚板
厚纸板 厚紙板
@@ -11579,6 +11601,7 @@
口出恶言 口出惡言
口出秽言 口出穢言
口占 口占
+口吃 口吃
口布 口布
口干 口乾
口干舌燥 口乾舌燥
@@ -11708,7 +11731,7 @@
只可在 只可在
只可意会不可言传 只可意會不可言傳
只叹 只嘆
-只吃 只吃
+只吃 只喫
只合 只合
只含 只含
只听 只聽
@@ -12695,59 +12718,60 @@
吁气 吁氣
吁求 籲求
吁请 籲請
-吃一顿挨一顿 吃一頓挨一頓
-吃不了 吃不了
-吃不出 吃不出
-吃不出来 吃不出來
-吃了 吃了
-吃了定心丸 吃了定心丸
-吃了秤砣 吃了秤砣
-吃了蜜蜂儿屎似的 吃了蜜蜂兒屎似的
-吃了饭 吃了飯
-吃亏上当 吃虧上當
-吃亏就是占便宜 吃虧就是佔便宜
-吃人一个蛋恩情无法断 吃人一個蛋恩情無法斷
-吃人虫 吃人蟲
-吃伤了 吃傷了
-吃几碗干饭 吃幾碗乾飯
-吃出 吃出
-吃合家欢 吃合家歡
-吃后悔药 吃後悔藥
-吃回头草 吃回頭草
-吃地面 吃地面
-吃姜 吃薑
-吃完面 吃完麪
-吃尽 吃盡
-吃尽当光 吃盡當光
-吃干了 吃乾了
-吃干醋 吃乾醋
-吃得了 吃得了
-吃得出 吃得出
-吃得出来 吃得出來
-吃挂络儿 吃掛絡兒
-吃敲才 吃敲才
-吃板刀面 吃板刀麪
-吃枪药 吃槍藥
-吃烟 吃煙
-吃药 吃藥
-吃药前 吃藥前
-吃药后 吃藥後
-吃药时 吃藥時
-吃豆干 吃豆乾
-吃辣面 吃辣麪
-吃过面 吃過麪
-吃里扒外 吃裏扒外
-吃里爬外 吃裏爬外
-吃钉板 吃釘板
-吃错药 吃錯藥
-吃闲话 吃閒話
-吃闲饭 吃閒飯
-吃面 吃麪
-吃饭傢伙 吃飯傢伙
-吃饭别忘了种谷人 吃飯別忘了種穀人
-吃饭家伙 吃飯家伙
-吃饱了饭撑的 吃飽了飯撐的
-吃饱没事干 吃飽沒事幹
+吃一顿挨一顿 喫一頓挨一頓
+吃不了 喫不了
+吃不出 喫不出
+吃不出来 喫不出來
+吃了 喫了
+吃了定心丸 喫了定心丸
+吃了秤砣 喫了秤砣
+吃了蜜蜂儿屎似的 喫了蜜蜂兒屎似的
+吃了饭 喫了飯
+吃亏上当 喫虧上當
+吃亏就是占便宜 喫虧就是佔便宜
+吃亏的是乖占便宜的是呆 喫虧的是乖占便宜的是呆
+吃人一个蛋恩情无法断 喫人一個蛋恩情無法斷
+吃人虫 喫人蟲
+吃伤了 喫傷了
+吃几碗干饭 喫幾碗乾飯
+吃出 喫出
+吃合家欢 喫合家歡
+吃后悔药 喫後悔藥
+吃回头草 喫回頭草
+吃地面 喫地面
+吃姜 喫薑
+吃完面 喫完麪
+吃尽 喫盡
+吃尽当光 喫盡當光
+吃干了 喫乾了
+吃干醋 喫乾醋
+吃得了 喫得了
+吃得出 喫得出
+吃得出来 喫得出來
+吃挂络儿 喫掛絡兒
+吃敲才 喫敲才
+吃板刀面 喫板刀麪
+吃枪药 喫槍藥
+吃烟 喫煙
+吃药 喫藥
+吃药前 喫藥前
+吃药后 喫藥後
+吃药时 喫藥時
+吃豆干 喫豆乾
+吃辣面 喫辣麪
+吃过面 喫過麪
+吃里扒外 喫裏扒外
+吃里爬外 喫裏爬外
+吃钉板 喫釘板
+吃错药 喫錯藥
+吃闲话 喫閒話
+吃闲饭 喫閒飯
+吃面 喫麪
+吃饭傢伙 喫飯傢伙
+吃饭别忘了种谷人 喫飯別忘了種穀人
+吃饭家伙 喫飯家伙
+吃饱了饭撑的 喫飽了飯撐的
+吃饱没事干 喫飽沒事幹
各不相同 各不相同
各个 各個
各个击破 各個擊破
@@ -12869,8 +12893,8 @@
合口味 合口味
合口呼 合口呼
合叶 合葉
-合吃 合吃
-合吃族 合吃族
+合吃 合喫
+合吃族 合喫族
合合 合合
合同 合同
合同各方 合同各方
@@ -13384,8 +13408,8 @@
同参 同參
同右 同右
同号 同號
-同吃 同吃
-同吃同住 同吃同住
+同吃 同喫
+同吃同住 同喫同住
同名 同名
同名之累 同名之累
同名同姓 同名同姓
@@ -14651,7 +14675,6 @@
周村 周村
周村区 周村區
周杰 周杰
-高峰 高峰
周杰伦 周杰倫
周柏臣 周柏臣
周某 周某
@@ -15248,7 +15271,6 @@
喧哄 喧鬨
喧哗 喧譁
喧噪 喧噪
-喫亏的是乖占便宜的是呆 喫虧的是乖占便宜的是呆
喷云吐雾 噴雲吐霧
喷云嗳雾 噴雲噯霧
喷出 噴出
@@ -15523,11 +15545,11 @@
回府 回府
回廊 迴廊
回弹 回彈
-回归 回歸
-回归年 回歸年
-回归潮 回歸潮
-回归热 回歸熱
-回归线 回歸線
+回归 迴歸
+回归年 迴歸年
+回归潮 迴歸潮
+回归热 迴歸熱
+回归线 迴歸線
回形夹 迴形夾
回得 回得
回得去 回得去
@@ -15604,7 +15626,7 @@
回民区 回民區
回水 回水
回波 回波
-回流 回流
+回流 迴流
回清倒影 迴清倒影
回温 回溫
回港 回港
@@ -16596,7 +16618,6 @@
复习考 複習考
复书 復書
复交 復交
-复亩珍 複畝珍
复仇 復仇
复仇者 復仇者
复仇记 復仇記
@@ -17059,7 +17080,7 @@
多发病 多發病
多只 多隻
多台 多臺
-多吃多占 多吃多佔
+多吃多占 多喫多佔
多向 多向
多哈回合 多哈回合
多回 多回
@@ -17347,7 +17368,7 @@
大核 大核
大梁 大梁 大樑
大楼监控系统 大樓監控系統
-大欖涌 大欖涌
+大榄涌 大欖涌
大欲 大欲
大武仑 大武崙
大气团 大氣團
@@ -17403,9 +17424,9 @@
大获 大獲
大获全胜 大獲全勝
大虫 大蟲
-大虫不吃伏肉 大蟲不吃伏肉
+大虫不吃伏肉 大蟲不喫伏肉
大虫口里倒涎 大蟲口裏倒涎
-大虫吃小虫 大蟲吃小蟲
+大虫吃小虫 大蟲喫小蟲
大虫头上做窠 大蟲頭上做窠
大蜡 大蜡
大衍历 大衍曆
@@ -17609,8 +17630,9 @@
央浼营干 央浼營幹
夯土建筑 夯土建築
夯干 夯幹
-失之毫厘差之千里 失之毫厘差之千里
-失之毫厘差以千里 失之毫厘差以千里
+失之毫厘 失之毫釐
+失之毫厘差之千里 失之毫釐差之千里
+失之毫厘差以千里 失之毫釐差以千里
失之毫厘谬以千里 失之毫厘謬以千里
失于 失於
失体面 失體面
@@ -19122,7 +19144,7 @@
就出 就出
就出去 就出去
就出来 就出來
-就吃干 就吃乾
+就吃干 就喫乾
就回 就回
就回去 就回去
就回来 就回來
@@ -19558,6 +19580,7 @@
崩症 崩症
嵌岩 嵌巖
嵚埼历落 嶔埼歷落
+嵫厘 嵫釐
嶰谷 嶰谷
嶽云 嶽雲
巅崖峻谷 巔崖峻谷
@@ -19687,7 +19710,9 @@
巫山云雨 巫山雲雨
巫术 巫術
差之千里 差之千里
+差之毫厘 差之毫釐
差于 差於
+差以毫厘 差以毫釐
差价 差價
差别 差別
差别待遇 差別待遇
@@ -19695,6 +19720,7 @@
差发 差發
差多了 差多了
差恶 差惡
+差若豪厘 差若豪釐
己丑 己丑
己出 己出
己所不欲 己所不欲
@@ -19990,7 +20016,6 @@
布气 布氣
布水 布水
布法罗 布法羅
-布洒器 布灑器
布洛克 布洛克
布洛斯顿 布洛斯頓
布洛沙德 布洛沙德
@@ -20009,7 +20034,6 @@
布瑞斯特 布瑞斯特
布瑞特 布瑞特
布瑞顿 布瑞頓
-布用填 布用填
布疋 布疋
布疑阵 佈疑陣
布痕瓦尔德 布痕瓦爾德
@@ -20348,7 +20372,7 @@
干乔 乾喬
干买卖 幹買賣
干了 幹了 乾了
-干了什么 幹了甚麼
+干了什么 幹了什麼
干了杯 乾了杯
干了这一杯 乾了這一杯
干了这一瓶 乾了這一瓶
@@ -20360,12 +20384,12 @@
干云蔽日 乾雲蔽日
干井 乾井
干些 幹些
-干些什么 幹些甚麼
+干些什么 幹些什麼
干产 乾產
干亲 乾親
干人 幹人
干什 幹什
-干什么 幹甚麼
+干什么 幹什麼
干他 幹他 干他
干仗 幹仗
干任何 幹任何
@@ -20772,7 +20796,7 @@
平复帖 平復帖
平复起来 平復起來
平头并进 平頭並進
-平安里 平安裏
+平安里 平安里
平定准噶尔回部得胜图 平定準噶爾回部得勝圖
平平当当 平平當當
平康里 平康里
@@ -21279,6 +21303,7 @@
廪膳秀才 廩膳秀才
延伸出 延伸出
延修 延修
+延厘 延釐
延发 延發
延后 延後
延地里 延地裏
@@ -21457,7 +21482,7 @@
弄盏传杯 弄盞傳杯
弄粉调朱 弄粉調朱
弄脏 弄髒
-弄面吃 弄麪吃
+弄面吃 弄麪喫
弄鬼吊猴 弄鬼弔猴
弈秋 弈秋
弊帚千金 弊帚千金
@@ -22790,7 +22815,7 @@
快出来 快出來
快升 快升
快去快回 快去快回
-快吃干 快吃乾
+快吃干 快喫乾
快向 快向
快回 快回
快回到 快回到
@@ -23435,7 +23460,7 @@
想尽办法 想盡辦法
想尽方法 想盡方法
想干 想幹
-想干什么 想幹甚麼
+想干什么 想幹什麼
想当然 想當然
想当然耳 想當然耳
想录 想錄
@@ -23830,7 +23855,7 @@
手铲 手鏟
手链 手鍊 手鏈
手面 手面
-手面赚吃 手面賺吃
+手面赚吃 手面賺喫
才上到 纔上到
才上去 纔上去
才上来 纔上來
@@ -25039,6 +25064,7 @@
抽出去 抽出去
抽出来 抽出來
抽出空 抽出空
+抽厘 抽釐
抽后腿 抽後腿
抽咽 抽咽
抽回 抽回
@@ -27750,7 +27776,7 @@
早知今日悔不当初 早知今日悔不當初
早秋 早秋
早自修 早自修
-早起的鸟儿有虫吃 早起的鳥兒有蟲吃
+早起的鸟儿有虫吃 早起的鳥兒有蟲喫
旭日东升 旭日東昇
旭日初升 旭日初昇
旱干 旱乾
@@ -28184,7 +28210,7 @@
暗号 暗號
暗号灯 暗號燈
暗叹 暗歎
-暗吃一惊 暗吃一驚
+暗吃一惊 暗喫一驚
暗合 暗合
暗含 暗含
暗喜 暗喜
@@ -29540,7 +29566,6 @@
杰里森 傑里森
杰里科 傑里科
杰里米 傑里米
-東涌 東涌
杳无人烟 杳無人煙
松一下 鬆一下
松一些 鬆一些
@@ -29923,6 +29948,7 @@
构筑工事 構築工事
构筑物 構築物
析出 析出
+析毫剖厘 析毫剖釐
枕借 枕藉
枕岩漱流 枕巖漱流
枕席 枕蓆
@@ -31038,7 +31064,7 @@
武器系统 武器系統
武器级别材料 武器級別材料
武坛 武壇
-武大郎吃毒药 武大郎吃毒藥
+武大郎吃毒药 武大郎喫毒藥
武当 武當
武当山 武當山
武当派 武當派
@@ -31287,6 +31313,11 @@
毫仑目 毫侖目
毫克 毫克
毫升 毫升
+毫厘 毫釐
+毫厘不差 毫釐不差
+毫厘不爽 毫釐不爽
+毫厘之差 毫釐之差
+毫厘千里 毫釐千里
毫发 毫髮
毫发不差 毫髮不差
毫发不爽 毫髮不爽
@@ -31830,7 +31861,7 @@
沙里淘金 沙裏淘金
沙雕 沙雕
沙雕赛 沙雕賽
-沙魚涌 沙魚涌
+沙鱼涌 沙魚涌
沟谷 溝谷
没个出豁 沒個出豁
没个好结果 沒個好結果
@@ -34588,7 +34619,7 @@
猝发 猝發
猢狲入布袋 猢猻入布袋
猥当大任 猥當大任
-猪八戒吃人参果 豬八戒吃人參果
+猪八戒吃人参果 豬八戒喫人參果
猪只 豬隻
猪肉干 豬肉乾
猪肝面 豬肝麪
@@ -35826,7 +35857,6 @@
相须为命 相須爲命
相须而行 相須而行
盼了 盼了
-盼既示复 盼既示覆
盾板 盾板
省个 省個
省了 省了
@@ -36415,6 +36445,7 @@
祖国光复会 祖國光復會
祛痰药 祛痰藥
祛蠹除奸 祛蠹除奸
+祝厘 祝釐
祝发 祝髮
祝年丰 祝年豐
祝愿 祝願
@@ -36585,6 +36616,7 @@
离题万里 離題萬里
离鸾别凤 離鸞別鳳
禽困复车 禽困覆車
+禽滑厘 禽滑釐
禽舍 禽舍
禾虫 禾蟲
禾谷 禾穀
@@ -36981,7 +37013,7 @@
稔恶不悛 稔惡不悛
稠云 稠雲
稳占 穩佔
-稳吃三注 穩吃三注
+稳吃三注 穩喫三注
稳坐钓鱼台 穩坐釣魚臺
稳定物价 穩定物價
稳当 穩當
@@ -37538,7 +37570,6 @@
算出去 算出去
算出来 算出來
算历 算曆
-算发 算髮
算得了 算得了
算术 算術
算术和 算術和
@@ -37619,6 +37650,7 @@
米利托 米利托
米制 米制
米卤蛋 米滷蛋
+米厘米突 米釐米突
米德尔伯里 米德爾伯裏
米格式战斗机 米格式戰鬥機
米纳谷 米納谷
@@ -39259,6 +39291,7 @@
肿瘤切除术 腫瘤切除術
胁制 脅制
胃出血 胃出血
+胃口 胃口
胃脏 胃臟
胃药 胃藥
胃药片 胃藥片
@@ -39413,8 +39446,8 @@
胡厮哄 胡廝哄
胡厮混 胡廝混
胡厮缠 胡廝纏
-胡吃海喝 胡吃海喝
-胡吃闷睡 胡吃悶睡
+胡吃海喝 胡喫海喝
+胡吃闷睡 胡喫悶睡
胡同 衚衕
胡吣 胡唚
胡吹 胡吹
@@ -41625,7 +41658,7 @@
虫儿 蟲兒
虫出 蟲出
虫卵 蟲卵
-虫吃牙 蟲吃牙
+虫吃牙 蟲喫牙
虫声 蟲聲
虫媒病毒 蟲媒病毒
虫媒花 蟲媒花
@@ -41683,6 +41716,7 @@
蚕种 蠶種
蚕豆症 蠶豆症
蚜虫 蚜蟲
+蚝涌 蠔涌
蚵仔面线 蚵仔麪線
蛀虫 蛀蟲
蛆虫 蛆蟲
@@ -41827,7 +41861,6 @@
蟾彩 蟾彩
蠁干 蠁幹
蠓虫 蠓蟲
-蠔涌 蠔涌
蠕虫 蠕蟲
蠕虫形 蠕蟲形
蠢虫 蠢蟲
@@ -42530,7 +42563,7 @@
角膜移植术 角膜移植術
角色冲突 角色衝突
角色扮演游戏 角色扮演遊戲
-角落发 角落發
+角落 角落
角落里 角落裏
角谷猜想 角谷猜想
角里 角里
@@ -43288,6 +43321,7 @@
象箸玉杯 象箸玉杯
象鼻虫 象鼻蟲
豪华游 豪華遊
+豪厘千里 豪釐千里
豪情万丈 豪情萬丈
豪情壮志 豪情壯志
豪情逸致 豪情逸致
@@ -45039,7 +45073,7 @@
邢台市 邢臺市
那个 那個
那个人 那個人
-那个猫儿不吃腥 那個貓兒不吃腥
+那个猫儿不吃腥 那個貓兒不喫腥
那个耗子不偷油 那個耗子不偷油
那么 那麼
那么干 那麼幹
@@ -45191,7 +45225,7 @@
部发 部發
部曲 部曲
部胡林 部胡林
-部落发 部落發
+部落 部落
部落同盟 部落同盟
郭勇志 郭勇志
郭台成 郭臺成
@@ -48541,7 +48575,6 @@
魔板 魔板
魔表 魔錶
魔赛克 魔賽克
-鰂魚涌 鰂魚涌
鱼丸粗面 魚丸粗麪
鱼台 魚臺
鱼台县 魚臺縣
@@ -48570,6 +48603,7 @@
鲇鱼 鮎魚
鲋鱼困涸辙难待西江水 鮒魚困涸轍難待西江水
鲍德里亚 鮑德里亞
+鲗鱼涌 鰂魚涌
鲜于 鮮于
鲜彩 鮮彩
鲜明个性 鮮明個性
@@ -49011,4 +49045,10 @@
龚胜 龔勝
龟卜 龜卜
龟鉴 龜鑑
+高峰 高峰
+什么 什麼
讲下 講吓
+回流 回流
+迴流 回流
+公厘 公厘
+厘米 厘米
diff --git a/dictionary/TSCharacters.txt b/dictionary/TSCharacters.txt
index 5dc2b2b..a236514 100644
--- a/dictionary/TSCharacters.txt
+++ b/dictionary/TSCharacters.txt
@@ -23,6 +23,7 @@
㞞 𪨊
㟺 𪩇
㠏 㟆
+㠣 𫵷
㢗 𪪑
㢝 𢋈
㥮 㤘
@@ -88,6 +89,7 @@
䍽 𦍠
䎙 𫅭
䎱 䎬
+䓣 𬜯
䕤 𫟕
䕳 𦰴
䖅 𫟑
@@ -120,6 +122,7 @@
䥄 𫠀
䥇 䦂
䥑 鿏
+䥕 𬭯
䥗 𫔋
䥩 𨱖
䥯 𫔆
@@ -247,6 +250,7 @@
僑 侨
僕 仆
僞 伪
+僤 𫢸
僥 侥
僨 偾
僱 雇
@@ -290,7 +294,7 @@
刪 删
剄 刭
則 则
-剋 克
+剋 克 剋
剎 刹
剗 刬
剛 刚
@@ -389,7 +393,7 @@
嘸 呒
嘺 𪡀
嘽 啴
-噁 恶
+噁 恶 𫫇
噅 𠯠
噓 嘘
噚 㖊
@@ -439,7 +443,9 @@
圖 图
團 团
圞 𪢮
+垻 坝
埡 垭
+埨 𫭢
埬 𪣆
埰 采
執 执
@@ -460,10 +466,12 @@
塢 坞
塤 埙
塵 尘
+塸 𫭟
塹 堑
塿 𪣻
墊 垫
墜 坠
+墠 𫮃
墮 堕
墰 坛
墲 𪢸
@@ -506,6 +514,7 @@
妝 妆
姍 姗
姦 奸
+娙 𫰛
娛 娱
婁 娄
婡 𫝫
@@ -590,6 +599,7 @@
嵐 岚
嵗 岁
嵼 𡶴
+嵽 𫶇
嵾 㟥
嶁 嵝
嶄 崭
@@ -643,6 +653,7 @@
廕 荫
廚 厨
廝 厮
+廞 𫷷
廟 庙
廠 厂
廡 庑
@@ -658,6 +669,7 @@
張 张
強 强
彃 𪪼
+彄 𫸩
彆 别
彈 弹
彌 弥
@@ -865,9 +877,11 @@
昇 升
時 时
晉 晋
+晛 𬀪
晝 昼
暈 晕
暉 晖
+暐 𬀩
暘 旸
暢 畅
暫 暂
@@ -897,6 +911,7 @@
梔 栀
梖 𪱷
梘 枧
+梜 𬂩
條 条
梟 枭
梲 棁
@@ -974,6 +989,7 @@
檻 槛
櫃 柜
櫅 𪲎
+櫍 𬃊
櫓 橹
櫚 榈
櫛 栉
@@ -1050,6 +1066,7 @@
洩 泄
洶 汹
浹 浃
+浿 𬇙
涇 泾
涗 涚
涼 凉
@@ -1096,6 +1113,7 @@
滿 满
漁 渔
漊 溇
+漍 𬇹
漚 沤
漢 汉
漣 涟
@@ -1127,6 +1145,7 @@
澤 泽
澦 滪
澩 泶
+澫 𬇕
澬 𫞚
澮 浍
澱 淀
@@ -1206,13 +1225,16 @@
熗 炝
熚 𤇹
熡 𤋏
+熰 𬉼
熱 热
熲 颎
熾 炽
+燀 𬊤
燁 烨
燈 灯
燉 炖
燒 烧
+燖 𬊈
燙 烫
燜 焖
營 营
@@ -1292,6 +1314,8 @@
瑽 𪻐
璉 琏
璊 𫞩
+璕 𬍤
+璗 𬍡
璝 𪻺
璡 琎
璣 玑
@@ -1306,6 +1330,7 @@
璾 𫞦
璿 璇
瓄 𪻨
+瓅 𬍛
瓊 琼
瓏 珑
瓔 璎
@@ -1424,6 +1449,7 @@
礄 硚
礆 硷
礎 础
+礐 𬒈
礒 𥐟
礙 碍
礦 矿
@@ -1494,6 +1520,7 @@
篔 筼
篘 𥬠
篠 筿
+篢 𬕂
篤 笃
篩 筛
篳 筚
@@ -1540,6 +1567,7 @@
糾 纠
紀 纪
紂 纣
+紃 𬘓
約 约
紅 红
紆 纡
@@ -1560,6 +1588,7 @@
紛 纷
紜 纭
紝 纴
+紞 𬘘
紟 𫄛
紡 纺
紬 䌷
@@ -1594,6 +1623,7 @@
給 给
絧 𫄡
絨 绒
+絪 𬘡
絰 绖
統 统
絲 丝
@@ -1604,24 +1634,29 @@
綀 𦈌
綁 绑
綃 绡
+綄 𬘫
綆 绠
綇 𦈋
綈 绨
綉 绣
綋 𫟄
綌 绤
+綎 𬘩
綏 绥
綐 䌼
綑 捆
經 经
綖 𫄧
綜 综
+綝 𬘭
綞 缍
綟 𫄫
綠 绿
綡 𫟅
綢 绸
綣 绻
+綧 𬘯
+綪 𬘬
綫 线
綬 绶
維 维
@@ -1695,6 +1730,7 @@
縬 𦈚
縭 缡
縮 缩
+縯 𬙂
縰 𫄳
縱 纵
縲 缧
@@ -1744,6 +1780,7 @@
繾 缱
繿 䍀
纁 𫄸
+纆 𬙊
纇 颣
纈 缬
纊 纩
@@ -1752,6 +1789,7 @@
纏 缠
纓 缨
纔 才
+纕 𬙋
纖 纤
纗 𫄹
纘 缵
@@ -1887,6 +1925,7 @@
蓯 苁
蓴 莼
蓽 荜
+蔄 𬜬
蔔 卜
蔘 参
蔞 蒌
@@ -1944,7 +1983,7 @@
蘆 芦
蘇 苏
蘊 蕴
-蘋 苹 蘋
+蘋 苹 𬞟
蘚 藓
蘞 蔹
蘟 𦻕
@@ -1953,6 +1992,7 @@
蘺 蓠
蘿 萝
虆 蔂
+虉 𬟁
處 处
虛 虚
虜 虏
@@ -1962,6 +2002,7 @@
蛺 蛱
蛻 蜕
蜆 蚬
+蝀 𬟽
蝕 蚀
蝟 猬
蝦 虾
@@ -2076,6 +2117,7 @@
訊 讯
訌 讧
討 讨
+訏 𬣙
訐 讦
訑 𫍙
訒 讱
@@ -2117,6 +2159,7 @@
詗 诇
詘 诎
詛 诅
+詝 𬣞
詞 词
詠 咏
詡 诩
@@ -2124,6 +2167,7 @@
詣 诣
試 试
詩 诗
+詪 𬣳
詫 诧
詬 诟
詭 诡
@@ -2180,12 +2224,14 @@
諏 诹
諑 诼
諒 谅
+諓 𬣡
論 论
諗 谂
諛 谀
諜 谍
諝 谞
諞 谝
+諟 𬤊
諡 谥
諢 诨
諣 𫍩
@@ -2199,6 +2245,7 @@
諯 𫍱
諰 𫍰
諱 讳
+諲 𬤇
諳 谙
諴 𫍯
諶 谌
@@ -2246,6 +2293,7 @@
譎 谲
譏 讥
譑 𫍤
+譓 𬤝
譖 谮
識 识
譙 谯
@@ -2418,6 +2466,7 @@
軗 𨐅
軛 轭
軜 𫐇
+軝 𬨂
軟 软
軤 轷
軨 𫐉
@@ -2461,6 +2510,7 @@
輮 𫐓
輯 辑
輳 辏
+輶 𬨎
輷 𫐒
輸 输
輻 辐
@@ -2529,6 +2579,7 @@
鄖 郧
鄟 𫑘
鄧 邓
+鄩 𬩽
鄭 郑
鄰 邻
鄲 郸
@@ -2547,6 +2598,7 @@
醫 医
醬 酱
醱 酦
+醲 𬪩
醶 𫑷
釀 酿
釁 衅
@@ -2572,11 +2624,13 @@
釩 钒
釲 𫟳
釳 𨰿
+釴 𬬩
釵 钗
釷 钍
釹 钕
釺 钎
釾 䥺
+釿 𬬱
鈀 钯
鈁 钫
鈃 钘
@@ -2623,6 +2677,7 @@
鉆 钻
鉈 铊
鉉 铉
+鉊 𬬿
鉋 铇
鉍 铋
鉑 铂
@@ -2636,9 +2691,12 @@
鉠 𫓭
鉢 钵
鉤 钩
+鉥 𬬸
鉦 钲
+鉧 𬭁
鉬 钼
鉭 钽
+鉮 𬬹
鉳 锫
鉶 铏
鉷 𫟹
@@ -2688,6 +2746,7 @@
鋉 𨱈
鋌 铤
鋏 铗
+鋐 𬭎
鋒 锋
鋗 𫓶
鋙 铻
@@ -2708,6 +2767,7 @@
鋱 铽
鋶 锍
鋸 锯
+鋹 𬬮
鋼 钢
錀 𬬭
錁 锞
@@ -2726,6 +2786,7 @@
錛 锛
錜 𫓻
錝 𫓽
+錞 𬭚
錟 锬
錠 锭
錡 锜
@@ -2766,6 +2827,7 @@
鍥 锲
鍩 锘
鍬 锹
+鍭 𬭤
鍮 𨱎
鍰 锾
鍵 键
@@ -2780,6 +2842,7 @@
鎊 镑
鎌 镰
鎍 𫔅
+鎓 𬭩
鎔 镕
鎖 锁
鎘 镉
@@ -2814,6 +2877,7 @@
鏉 𨱒
鏌 镆
鏍 镙
+鏏 𬭬
鏐 镠
鏑 镝
鏗 铿
@@ -2834,6 +2898,7 @@
鏷 镤
鏹 镪
鏺 䥽
+鏻 𬭸
鏽 锈
鏾 𫔌
鐃 铙
@@ -2856,6 +2921,7 @@
鐦 锎
鐧 锏
鐨 镄
+鐩 𬭼
鐪 𫓺
鐫 镌
鐮 镰
@@ -2940,6 +3006,7 @@
闆 板
闇 暗
闈 闱
+闉 𬮱
闊 阔
闋 阕
闌 阑
@@ -2970,10 +3037,13 @@
隉 陧
隊 队
階 阶
+隑 𬮿
隕 陨
際 际
+隤 𬯎
隨 随
險 险
+隮 𬯀
隯 陦
隱 隐
隴 陇
@@ -3044,9 +3114,11 @@
頑 顽
頒 颁
頓 顿
+頔 𬱖
頗 颇
領 领
頜 颌
+頠 𬱟
頡 颉
頤 颐
頦 颏
@@ -3195,11 +3267,13 @@
馼 𫘜
駁 驳
駃 𫘝
+駉 𬳶
駊 𫘟
駎 𩧨
駐 驻
駑 驽
駒 驹
+駓 𬳵
駔 驵
駕 驾
駘 骀
@@ -3214,6 +3288,7 @@
駤 𫘠
駧 𩧲
駩 𩧴
+駪 𬳽
駫 𫘡
駭 骇
駰 骃
@@ -3221,6 +3296,7 @@
駶 𩧺
駸 骎
駻 𫘣
+駼 𬳿
駿 骏
騁 骋
騂 骍
@@ -3233,12 +3309,14 @@
騍 骒
騎 骑
騏 骐
+騑 𬴂
騔 𩨀
騖 骛
騙 骗
騚 𩨊
騜 𫘩
騝 𩨃
+騞 𬴃
騟 𩨈
騠 𫘨
騤 骙
@@ -3267,6 +3345,7 @@
驋 𩧯
驌 骕
驍 骁
+驎 𬴊
驏 骣
驓 𫘯
驕 骄
@@ -3317,11 +3396,13 @@
魷 鱿
魺 鲄
魽 𫠐
+鮀 𬶍
鮁 鲅
鮃 鲆
鮄 𫚒
鮅 𫚑
鮆 𫚖
+鮈 𬶋
鮊 鲌
鮋 鲉
鮍 鲏
@@ -3335,6 +3416,8 @@
鮝 鲞
鮞 鲕
鮟 𩽾
+鮠 𬶏
+鮡 𬶐
鮣 䲟
鮤 𫚓
鮦 鲖
@@ -3378,6 +3461,7 @@
鯴 鲺
鯶 𩽼
鯷 鳀
+鯻 𬶟
鯽 鲫
鯾 𫚣
鯿 鳊
@@ -3387,6 +3471,7 @@
鰆 䲠
鰈 鲽
鰉 鳇
+鰊 𬶠
鰋 𫚢
鰌 䲡
鰍 鳅
@@ -3414,6 +3499,7 @@
鰲 鳌
鰳 鳓
鰵 鳘
+鰶 𬶭
鰷 鲦
鰹 鲣
鰺 鲹
@@ -3421,6 +3507,7 @@
鰼 鳛
鰽 𫚧
鰾 鳔
+鱀 𬶨
鱂 鳉
鱄 𫚋
鱅 鳙
@@ -3434,6 +3521,7 @@
鱖 鳜
鱗 鳞
鱘 鲟
+鱚 𬶮
鱝 鲼
鱟 鲎
鱠 鲙
@@ -3495,6 +3583,7 @@
鵂 鸺
鵃 鸼
鵊 𫛥
+鵏 𬷕
鵐 鹀
鵑 鹃
鵒 鹆
@@ -3527,6 +3616,7 @@
鶗 𫛸
鶘 鹕
鶚 鹗
+鶠 𬸘
鶡 鹖
鶥 鹛
鶦 𫛷
@@ -3536,6 +3626,7 @@
鶭 𫛯
鶯 莺
鶰 𫛫
+鶱 𬸣
鶲 鹟
鶴 鹤
鶹 鹠
@@ -3557,6 +3648,7 @@
鷗 鸥
鷙 鸷
鷚 鹨
+鷟 𬸦
鷣 𫜃
鷤 𫛴
鷥 鸶
@@ -3564,6 +3656,7 @@
鷨 𪉊
鷩 𫜁
鷫 鹔
+鷭 𬸪
鷯 鹩
鷲 鹫
鷳 鹇
@@ -3580,6 +3673,7 @@
鸋 𫛢
鸌 鹱
鸏 鹲
+鸑 𬸚
鸕 鸬
鸗 𫛟
鸘 鹴
@@ -3629,6 +3723,7 @@
齔 龀
齕 龁
齗 龂
+齘 𬹼
齙 龅
齜 龇
齟 龃
@@ -3641,12 +3736,14 @@
齪 龊
齬 龉
齭 𫜭
+齮 𬺈
齯 𫠜
齰 𫜬
齲 龋
齴 𫜮
齶 腭
齷 龌
+齼 𬺓
齾 𫜰
龍 龙
龎 厐
@@ -3678,6 +3775,7 @@
𡄣 𠵸
𡅏 𠲥
𡅯 𪢖
+𡑍 𫭼
𡑭 𡋗
𡓁 𪤄
𡓾 𡋀
@@ -3757,6 +3855,7 @@
𥖅 𥐯
𥖲 𪿞
𥗇 𪿵
+𥗽 𬒗
𥜐 𫀓
𥜰 𫀌
𥞵 𥞦
diff --git a/dictionary/TSPhrases.txt b/dictionary/TSPhrases.txt
index dee9754..06e6596 100644
--- a/dictionary/TSPhrases.txt
+++ b/dictionary/TSPhrases.txt
@@ -29,6 +29,7 @@
乾隆 乾隆
乾隆年間 乾隆年间
乾隆皇帝 乾隆皇帝
+二噁英 二𫫇英
以免藉口 以免借口
以功覆過 以功复过
侔德覆載 侔德复载
@@ -131,7 +132,6 @@
申覆 申复
畢昇 毕昇
發覆 发复
-盼既示覆 盼既示复
瞭如 了如
瞭如指掌 了如指掌
瞭望 瞭望
diff --git a/dictionary/TWPhrasesIT.txt b/dictionary/TWPhrasesIT.txt
new file mode 100644
index 0000000..8960ce8
--- /dev/null
+++ b/dictionary/TWPhrasesIT.txt
@@ -0,0 +1,388 @@
+PN結 PN接面
+SQL注入 SQL隱碼攻擊
+SQL注入攻擊 SQL隱碼攻擊
+U盤 隨身碟
+三極管 三極體
+下拉列表 下拉選單
+並行計算 平行計算
+中間件 中介軟體
+串口 串列埠
+串行 序列
+串行端口 串列埠
+主引導記錄 主開機記錄
+主板 主機板
+二極管 二極體
+互聯網 網際網路
+交互 互動
+交互式 互動式
+人工智能 人工智慧
+代碼 程式碼 代碼
+代碼頁 內碼表
+以太網 乙太網
+任務欄 工作列
+任務管理器 工作管理員
+仿真 模擬
+位圖 點陣圖
+低級 低階 低級
+便攜式 行動式 攜帶型
+保存 儲存
+信噪比 訊雜比
+信息 資訊
+信息安全 資訊保安
+信息技術 資訊科技
+信息論 資訊理論
+信號 訊號 信號
+信道 通道
+傳感 感測
+像素 畫素
+僞代碼 虛擬碼
+優先級 優先順序
+優化 最佳化
+元數據 後設資料
+元編程 超程式設計
+光標 游標
+光盤 光碟
+光驅 光碟機
+免提 擴音
+內存 記憶體
+內核 核心
+內置 內建
+內聯函數 行內函數
+全局 全域性
+全角 全形
+兼容 相容
+冒泡排序 氣泡排序
+函數 函式
+函數式編程 函數語言程式設計
+刀片服務器 刀鋒伺服器
+分佈式 分散式
+分區 分割槽
+分辨率 解析度
+刷新 重新整理
+刻錄 燒錄
+前綴 字首
+剪切 剪下
+剪貼板 剪貼簿
+創建 建立
+加載 載入
+半角 半形
+博客 部落格
+卸載 解除安裝
+原代碼 原始碼
+參數 引數
+參數表 參數列
+句柄 控制代碼
+可視化 視覺化
+呼出 撥出
+呼叫轉移 來電轉駁
+命令式編程 指令式程式設計
+命令行 命令列
+命名空間 名稱空間
+哈希 雜湊
+單片機 微控制器
+回調 回撥
+固件 韌體
+圖像 影象
+圖庫 相簿
+圖標 圖示
+在線 線上
+地址 地址 位址
+地址欄 位址列
+城域網 都會網路
+堆棧 堆疊
+場效應管 場效電晶體
+壁紙 桌布 壁紙
+外置 外接
+外鍵 外來鍵
+多任務 多工
+多態 多型
+多線程 多執行緒
+字庫 字型檔
+字段 欄位
+字符 字元
+字符串 字串
+字符集 字符集
+字節 位元組
+字體 字型
+存儲 儲存
+存盤 存檔
+宏 宏 巨集
+宏內核 單核心
+寄存器 暫存器
+密鑰 金鑰
+實例 例項 實例
+實模式 真實模式
+審覈 稽覈
+寫保護 防寫
+寬帶 寬頻
+尋址 定址
+對話框 對話方塊
+對象 物件 對象
+導入 匯入
+導出 匯出
+局域網 區域網
+局部 區域性
+屏幕 螢幕
+屏蔽 遮蔽
+嵌套 巢狀
+布爾 布林
+帶寬 頻寬
+引導程序 載入程式
+彙編 彙編 組譯
+彙編語言 組合語言
+後綴 字尾
+循環 迴圈 循環
+性價比 價效比
+性能 效能
+截取 擷取
+截屏 截圖
+打印 列印
+打印機 印表機
+打開 開啟 打開
+批量 批次
+拋出 丟擲
+拷貝 複製
+持久性 永續性
+指針 指標
+捲積 摺積
+掃描儀 掃描器
+掛斷 結束通話
+採樣 取樣
+採樣率 取樣率
+接口 介面
+控件 控制元件
+插件 外掛
+搜索 搜尋
+操作數 運算元
+操作符 運算子
+操作系統 作業系統
+擴展 擴充套件
+擴展名 副檔名
+支持 支援
+支持者 支持者
+散列 雜湊
+數字 數字 數位
+數字印刷 數位印刷
+數字電子 數位電子
+數字電路 數位電路
+數據 資料
+數據倉庫 資料倉儲
+數據報 資料包
+數據庫 資料庫
+數據挖掘 資料探勘
+數據源 資料來源
+數組 陣列
+文件 檔案
+文件名 檔名
+文件夾 資料夾
+文件擴展名 副檔名
+文字處理 文書處理
+文本 文字
+文檔 文件
+映射 對映
+時分多址 分時多重進接
+時分複用 分時多工
+時鐘頻率 時脈頻率
+晶閘管 閘流體
+晶體管 電晶體
+智能 智慧
+最終用戶 終端使用者
+有損壓縮 有失真壓縮
+服務器 伺服器
+本地代碼 原生代碼
+析構函數 解構函式
+枚舉 列舉
+查找 查詢
+查看 檢視
+桌面型 桌上型
+構造函數 建構函式
+標識符 識別符號
+模塊 模組
+模擬 模擬 類比
+模擬電子 類比電子
+模擬電路 類比電路
+權限 許可權
+正則表達式 正規表示式
+死機 宕機
+殺毒 防毒
+比特 位元
+比特幣 比特幣
+比特率 位元率
+波分複用 波長分波多工
+消息 訊息 消息
+添加 新增
+源代碼 原始碼
+源文件 原始檔
+源碼 原始碼
+溢出 溢位
+滾動條 捲軸
+演示文稿 簡報
+激光 鐳射
+激活 啟用
+無損壓縮 無失真壓縮
+物理內存 實體記憶體
+物理地址 實體地址
+狀態欄 狀態列
+用戶 使用者
+用戶名 使用者名稱
+界面 介面
+異步 非同步
+登錄 登入
+發佈 釋出
+發送 傳送
+盤片 碟片
+盤符 磁碟機代號
+目標代碼 目的碼
+相冊 相簿
+矢量 向量
+知識產權 智慧財產權
+短信 簡訊
+硬件 硬體
+硬盤 硬碟
+碼分多址 分碼多重進接
+碼率 位元速率
+磁盤 磁碟
+磁道 磁軌
+社區 社羣 社區
+移動硬盤 行動硬碟
+移動網絡 行動網路
+移動資料 行動資料
+移動通信 行動通訊
+移動電話 行動電話
+程序 程式
+程序員 程式設計師
+空分多址 分空間多重進接
+空分複用 空間多工
+窗口 視窗
+端口 埠
+筆記本電腦 膝上型電腦
+算子 運算元
+算法 演算法
+範式 正規化
+粘貼 貼上 粘貼
+紅心大戰 傷心小棧
+組件 元件
+綁定 繫結
+網上鄰居 網路上的芳鄰
+網卡 網絡卡
+網吧 網咖
+網絡 網路
+網關 閘道器
+線程 執行緒
+編程 程式設計
+編程語言 程式語言
+緩存 快取
+縮略圖 縮圖
+縮進 縮排
+總線 匯流排
+缺省 預設
+聯繫 聯絡
+聯繫歷史 通話記錄
+聲卡 音效卡
+聲明 宣告
+脫機 離線
+腳本 指令碼
+自動轉屏 自動旋轉螢幕
+臺式機 桌上型電腦
+航天飛機 太空梭
+芯片 晶片
+花屏 破圖
+菜單 選單 菜單
+萬維網 全球資訊網
+藍屏 藍色畫面
+藍牙 藍芽
+虛函數 虛擬函式
+虛擬機 虛擬機器
+虛擬機器 虛擬機器
+表達式 表示式 運算式
+複印 影印
+複選按鈕 覈取按鈕
+複選框 覈取方塊
+視圖 檢視
+視頻 影片 視訊
+視頻會議 視訊會議
+視頻通話 視訊通話
+解釋器 直譯器
+觸摸 觸控
+觸摸屏 觸控式螢幕
+計算機安全 電腦保安
+計算機科學 電腦科學
+訪問 訪問 存取
+設備 裝置
+設置 設定
+註冊機 序號產生器
+註冊表 登錄檔
+註銷 登出
+調制 調變
+調度 排程
+調用 呼叫
+調色板 調色盤
+調製解調器 數據機
+調試 除錯 偵錯
+調試器 偵錯程式
+變量 變數
+軟件 軟體
+軟驅 軟碟機
+轉義字符 跳脫字元
+通信 通訊
+通訊卡 通話卡
+通配符 萬用字元
+連接 連線
+連接器 聯結器
+進制 進位制
+進程 程序 進程
+運算符 運算子
+運行 執行
+過程式編程 程序式程式設計
+遞歸 遞迴
+遠程 遠端
+適配器 介面卡
+邏輯門 邏輯閘
+重命名 重新命名
+重裝 重灌
+重載 過載
+金屬氧化物半導體 金氧半導體
+錄像 錄影
+鏈接 連結
+鏈表 連結串列
+鏡像 映象
+門戶網站 入口網站
+門電路 閘電路
+閃存 快閃記憶體
+關係數據庫 關聯式資料庫
+隊列 佇列
+集成 整合
+集成電路 積體電路
+集羣 叢集
+雲存儲 雲端儲存
+雲計算 雲端計算
+面向對象 物件導向
+面向過程 程序導向
+音頻 音訊
+頁眉 頁首
+頁腳 頁尾
+項目 專案
+預處理器 前處理器
+頭文件 標頭檔案
+頻分多址 分頻多重進接
+頻分複用 分頻多工
+類型 型別
+類模板 類别範本
+顯像管 映象管
+顯卡 顯示卡
+顯存 視訊記憶體
+飛行模式 飛航模式
+首席信息官 資訊長
+首席執行官 執行長
+首席技術官 技術長
+首席運營官 營運長
+高性能計算 高效能運算
+高清 高畫質
+高端 高階 進階
+高級 高階 進階 高級
+高速緩存 快取記憶體
+黑客 駭客
+默認 預設
+默認值 預設值
+點擊 點選
+鼠標 滑鼠
diff --git a/dictionary/TWPhrasesName.txt b/dictionary/TWPhrasesName.txt
new file mode 100644
index 0000000..6437a55
--- /dev/null
+++ b/dictionary/TWPhrasesName.txt
@@ -0,0 +1,84 @@
+乍得 查德
+也門 葉門
+仙童半導體 快捷半導體
+伯利茲 貝里斯
+佛得角 維德角
+傅里葉 傅立葉
+克羅地亞 克羅埃西亞
+列支敦士登 列支敦斯登
+利比里亞 賴比瑞亞
+加納 迦納
+加蓬 加彭
+博茨瓦納 波札那
+卡塔爾 卡達
+危地馬拉 瓜地馬拉
+厄瓜多爾 厄瓜多
+厄立特里亞 厄利垂亞
+吉布堤 吉布地
+哈薩克斯坦 哈薩克
+哥斯達黎加 哥斯大黎加
+喫茶小舖 喫茶小舖
+圖瓦盧 吐瓦魯
+土庫曼斯坦 土庫曼
+圭亞那 蓋亞那
+坦桑尼亞 坦尚尼亞
+埃塞俄比亞 衣索比亞
+基里巴斯 吉里巴斯
+塔吉克斯坦 塔吉克
+塞拉利昂 獅子山
+塞浦路斯 塞普勒斯
+塞舌爾 塞席爾
+多米尼加 多明尼加
+安提瓜和巴布達 安地卡及巴布達
+尼日利亞 奈及利亞
+尼日爾 尼日
+岡比亞 甘比亞
+巴巴多斯 巴貝多
+巴布亞新幾內亞 巴布亞紐幾內亞
+布基納法索 布吉納法索
+布隆迪 蒲隆地
+帕勞 帛琉
+幾內亞比紹 幾內亞比索
+意大利 義大利
+所羅門羣島 索羅門羣島
+文萊 汶萊
+斯威士蘭 史瓦濟蘭
+斯洛文尼亞 斯洛維尼亞
+新西蘭 紐西蘭
+格林納達 格瑞那達
+格魯吉亞 喬治亞
+歐拉 尤拉
+毛里塔尼亞 茅利塔尼亞
+毛里求斯 模里西斯
+沙特阿拉伯 沙烏地阿拉伯
+波斯尼亞黑塞哥維那 波士尼亞赫塞哥維納
+津巴布韋 辛巴威
+洪都拉斯 宏都拉斯
+溫納圖萬 那杜
+烏茲別克斯坦 烏茲別克
+特立尼達和多巴哥 千里達及托巴哥
+瑙魯 諾魯
+瓦努阿圖 萬那杜
+盧旺達 盧安達
+科摩羅 葛摩
+科特迪瓦 象牙海岸
+突尼斯 突尼西亞
+純喫茶 純喫茶
+索馬里 索馬利亞
+老撾 寮國
+聖基茨和尼維斯 聖克里斯多福及尼維斯
+聖文森特和格林納丁斯 聖文森及格瑞那丁
+聖盧西亞 聖露西亞
+聖馬力諾 聖馬利諾
+肯尼亞 肯亞
+莫桑比克 莫三比克
+萊索托 賴索托
+萬象 永珍
+蘇里南 蘇利南
+貝寧 貝南
+贊比亞 尚比亞
+阿塞拜疆 亞塞拜然
+阿拉伯聯合酋長國 阿拉伯聯合大公國
+香農 夏農
+馬爾代夫 馬爾地夫
+馬里共和國 馬利共和國
diff --git a/dictionary/TWPhrasesOther.txt b/dictionary/TWPhrasesOther.txt
new file mode 100644
index 0000000..22b3b89
--- /dev/null
+++ b/dictionary/TWPhrasesOther.txt
@@ -0,0 +1,37 @@
+元音 母音
+冰棍 冰棒
+出租車 計程車
+咖喱 咖哩
+塑料 塑膠
+奔馳 賓士
+奶酪 乳酪
+幾率 機率
+方便麪 泡麵 速食麵
+李彥宏 李彥宏
+概率 機率
+海內存知己 海內存知己
+涼菜 冷盤
+的士 計程車
+砹 砈
+硅 矽
+程序不正義 程序不正義
+程序正義 程序正義
+空氣淨化器 空氣清淨機
+納米 奈米
+自行車 腳踏車
+詞組 片語
+蹦極 高空彈跳
+輔音 子音
+通過 透過 通過
+酰 醯
+鈁 鍅
+鈈 鈽
+錇 鉳
+鍀 鎝
+鎄 鑀
+鎇 鋂
+鎿 錼
+鐦 鉲
+鑥 鎦
+黃宏 黃宏
+借記卡 簽帳金融卡
diff --git a/merge-data.sh b/merge-data.sh
new file mode 100755
index 0000000..aab7a7a
--- /dev/null
+++ b/merge-data.sh
@@ -0,0 +1,11 @@
+# Merge addition-dictionary/*.txt into dictionary/*.txt
+cp -r tmp/OpenCC-master/data/dictionary/* dictionary/
+cp -r tmp/OpenCC-master/data/config/* config/
+git diff dictionary/
+
+for x in addition-dictionary/*.txt; do
+ target="dictionary/$(basename $x .txt).txt"
+ echo "Merging $x to $target"
+
+ cat $x >> $target
+done
\ No newline at end of file
diff --git a/opencc_test.go b/opencc_test.go
index 1402f64..a580d32 100644
--- a/opencc_test.go
+++ b/opencc_test.go
@@ -1,6 +1,7 @@
package opencc
import (
+ "fmt"
"testing"
)
@@ -27,9 +28,20 @@ func TestConvert_s2t(t *testing.T) {
`香菸(英語:Cigarette),為菸草製品的一種。記憶體是一種很常見及常用的電腦輸入裝置。`: `香菸(英語:Cigarette),為菸草製品的一種。記憶體是一種很常見及常用的電腦輸入裝置。`,
`乾隆爷是谁的干爷爷?乾爷爷吗?`: `乾隆爺是誰的幹爺爺?乾爺爺嗎?`,
`2021 年汽车零部件板块市值涨幅跑输乘用车板块,估值相对滞涨,主要由于市场对零部件行业存两大担忧:大宗商品、运费上涨致利润承压;全球芯片紧缺致下游排产低于预期。`: `2021 年汽車零部件板塊市值漲幅跑輸乘用車板塊,估值相對滯漲,主要由於市場對零部件行業存兩大擔憂:大宗商品、運費上漲致利潤承壓;全球芯片緊缺致下游排產低於預期。`,
+ `高峰`: `高峰`,
+ `什麼`: `什麼`,
+ `讲下`: `講吓`,
+ `抬头`: `抬頭`,
+ `回流`: `回流`,
+ `1 厘 2 厘钱`: `1 厘 2 厘錢`,
+ `公厘`: `公厘`,
+ `厘米`: `厘米`,
}
- s2t, _ := New("s2t")
+ s2t, err := New("s2t")
+ if err != nil {
+ panic(fmt.Sprintf("Init s2t failed %s", err))
+ }
assertCases(t, s2t, cases)
}
@@ -38,12 +50,28 @@ func TestConvert_s2hk_finance(t *testing.T) {
cases := map[string]string{
"保证金": "按金",
"保證金": "按金",
+ `佣金`: `佣金`,
"募集資金": "籌集資金",
"套利交易": "對沖",
"下周开始公开配售": "下週開始公開招股",
}
- s2hk, _ := New("s2hk-finance")
+ s2hk, err := New("s2hk-finance")
+ if err != nil {
+ panic(fmt.Sprintf("Init s2hk-finance failed %s", err))
+ }
assertCases(t, s2hk, cases)
}
+
+// Special hotfix in this project
+func TestSelfSpecialHotfix(t *testing.T) {
+ cc, _ := New("s2hk")
+
+ cases := map[string]string{
+ "来自于汇丰,以及汇丰银行,汇入的款项": "來自於滙豐,以及滙豐銀行,匯入的款項",
+ "汇业银行集团": "滙業銀行集團",
+ }
+
+ assertCases(t, cc, cases)
+}
diff --git a/tests/fixtures/html-raw.txt b/tests/fixtures/html-raw.txt
index 66e0bc6..32ffdbb 100644
--- a/tests/fixtures/html-raw.txt
+++ b/tests/fixtures/html-raw.txt
@@ -53,9 +53,4 @@
数据来源:Wind、海豚投研
长期视角下,按 DCF 模型估值,基于未来五年收入复合增速 14%,归母净利润复合增速 23.3%,折现率 10.55%,以及永续增长率 3.0%,对应华住价位大致 69 美元,较当前仍有充分空间(仅供参考,不做建议)。
数据来源:海豚投研测算
短期来看,受疫情反复,开店放缓节奏,2021 年上半年华住净开酒店数量同比、环比均有放缓趋势,同时公司在第二季度财报中也下调今年全年收入增长指引,短期股价仍可能面对悲观情绪上的杀跌。
-不过,海豚君鉴于公司中长期基本面稳健,依旧看好华住作为中国酒店龙头在结构升级、连锁提升背景下的成长机会。
后续,海豚君还会持续跟进华住的业绩表现,敬请关注。
-高峰
-佣金
-什么
-1 厘
-讲下
+不过,海豚君鉴于公司中长期基本面稳健,依旧看好华住作为中国酒店龙头在结构升级、连锁提升背景下的成长机会。
后续,海豚君还会持续跟进华住的业绩表现,敬请关注。
\ No newline at end of file
diff --git a/tests/fixtures/html-s2hk-finance.txt b/tests/fixtures/html-s2hk-finance.txt
index 25dbc5a..806e5e4 100644
--- a/tests/fixtures/html-s2hk-finance.txt
+++ b/tests/fixtures/html-s2hk-finance.txt
@@ -1,4 +1,4 @@
-本文為海豚投研原創文章,未經授權,不得轉載;建議感興趣的用户添加微信號“dolphinR123”加入海豚投研圈,一起切磋全球資產投資觀點!
在上篇《華住集團(上):酒店界“國貨崛起”》中,海豚君梳理了華住集團加盟為主的商業模式、當前中國酒店連鎖化率的情況以及華住集團的多品牌矩陣戰略,公司中長期依靠下沉市場 + 併購/存量改造做中高端升級 + 軟品牌吸收非標擴大市佔率。
在本篇文章中,海豚君主要來解決以下問題:
1、華住會員模式是如何實現高效運作的?
2、落到投資上,華住是國內市佔率第二大酒店集團(第一名為錦江酒店),但説到總市值,華住已把第二名遠遠甩在後面,當前市場給予估值標準是甚麼?
會員體系構網絡,自有流量廣積糧 做酒店生意,店面房間要提前盤下來裝修好,前置的固定成本高,只有在客人不斷入駐的入駐的情況下,才能大幅攤薄固定投入,提高經營槓桿。
+本文為海豚投研原創文章,未經授權,不得轉載;建議感興趣的用户添加微信號“dolphinR123”加入海豚投研圈,一起切磋全球資產投資觀點!
在上篇《華住集團(上):酒店界“國貨崛起”》中,海豚君梳理了華住集團加盟為主的商業模式、當前中國酒店連鎖化率的情況以及華住集團的多品牌矩陣戰略,公司中長期依靠下沉市場 + 併購/存量改造做中高端升級 + 軟品牌吸收非標擴大市佔率。
在本篇文章中,海豚君主要來解決以下問題:
1、華住會員模式是如何實現高效運作的?
2、落到投資上,華住是國內市佔率第二大酒店集團(第一名為錦江酒店),但説到總市值,華住已把第二名遠遠甩在後面,當前市場給予估值標準是什麼?
會員體系構網絡,自有流量廣積糧 做酒店生意,店面房間要提前盤下來裝修好,前置的固定成本高,只有在客人不斷入駐的入駐的情況下,才能大幅攤薄固定投入,提高經營槓桿。
而就是本身又屬“本地位置異地客流”的生意,除了極少數的 Walk-in 客流和小比例的本地熟人生意,絕大多數客流還是要靠外地人的出行住宿,異地客源的穩定集中獲客至關重要,酒店天然電商化訴求更強。
簡單來説,酒店後端是精細化和數字化經營持續產生的降本增效,而前端則是一個異地流量生意,收入端的提升更容易帶來經營槓桿的釋放,因此獲客來源的研究至關重要。
在吸引異地客流上,相比與實物電商商家到現在才逐步注意到“流量產權”問題,想要建立自己的私域流量,避免被公域流量反覆收割。
@@ -53,9 +53,4 @@
數據來源:Wind、海豚投研
長期視角下,按 DCF 模型估值,基於未來五年收入複合增速 14%,歸母淨利潤複合增速 23.3%,折現率 10.55%,以及永續增長率 3.0%,對應華住價位大致 69 美元,較當前仍有充分空間(僅供參考,不做建議)。
數據來源:海豚投研測算
短期來看,受疫情反覆,開店放緩節奏,2021 年上半年華住淨開酒店數量同比、環比均有放緩趨勢,同時公司在第二季度財報中也下調今年全年收入增長指引,短期股價仍可能面對悲觀情緒上的殺跌。
-不過,海豚君鑑於公司中長期基本因素穩健,依舊看好華住作為中國酒店龍頭在結構升級、連鎖提升背景下的成長機會。
後續,海豚君還會持續跟進華住的業績表現,敬請關注。
-高峰
-佣金
-甚麼
-1 厘
-講吓
+不過,海豚君鑑於公司中長期基本因素穩健,依舊看好華住作為中國酒店龍頭在結構升級、連鎖提升背景下的成長機會。
後續,海豚君還會持續跟進華住的業績表現,敬請關注。
\ No newline at end of file
diff --git a/tests/fixtures/html-s2t.txt b/tests/fixtures/html-s2t.txt
index ec2993e..0b15d33 100644
--- a/tests/fixtures/html-s2t.txt
+++ b/tests/fixtures/html-s2t.txt
@@ -1,4 +1,4 @@
-本文爲海豚投研原創文章,未經授權,不得轉載;建議感興趣的用戶添加微信號“dolphinR123”加入海豚投研圈,一起切磋全球資產投資觀點!
在上篇《華住集團(上):酒店界“國貨崛起”》中,海豚君梳理了華住集團加盟爲主的商業模式、當前中國酒店連鎖化率的情況以及華住集團的多品牌矩陣戰略,公司中長期依靠下沉市場 + 併購/存量改造做中高端升級 + 軟品牌吸收非標擴大市佔率。
在本篇文章中,海豚君主要來解決以下問題:
1、華住會員模式是如何實現高效運作的?
2、落到投資上,華住是國內市佔率第二大酒店集團(第一名爲錦江酒店),但說到總市值,華住已把第二名遠遠甩在後面,當前市場給予估值標準是甚麼?
會員體系構網絡,自有流量廣積糧 做酒店生意,店面房間要提前盤下來裝修好,前置的固定成本高,只有在客人不斷入駐的入駐的情況下,才能大幅攤薄固定投入,提高經營槓桿。
+本文爲海豚投研原創文章,未經授權,不得轉載;建議感興趣的用戶添加微信號“dolphinR123”加入海豚投研圈,一起切磋全球資產投資觀點!
在上篇《華住集團(上):酒店界“國貨崛起”》中,海豚君梳理了華住集團加盟爲主的商業模式、當前中國酒店連鎖化率的情況以及華住集團的多品牌矩陣戰略,公司中長期依靠下沉市場 + 併購/存量改造做中高端升級 + 軟品牌吸收非標擴大市佔率。
在本篇文章中,海豚君主要來解決以下問題:
1、華住會員模式是如何實現高效運作的?
2、落到投資上,華住是國內市佔率第二大酒店集團(第一名爲錦江酒店),但說到總市值,華住已把第二名遠遠甩在後面,當前市場給予估值標準是什麼?
會員體系構網絡,自有流量廣積糧 做酒店生意,店面房間要提前盤下來裝修好,前置的固定成本高,只有在客人不斷入駐的入駐的情況下,才能大幅攤薄固定投入,提高經營槓桿。
而就是本身又屬“本地位置異地客流”的生意,除了極少數的 Walk-in 客流和小比例的本地熟人生意,絕大多數客流還是要靠外地人的出行住宿,異地客源的穩定集中獲客至關重要,酒店天然電商化訴求更強。
簡單來說,酒店後端是精細化和數字化經營持續產生的降本增效,而前端則是一個異地流量生意,收入端的提升更容易帶來經營槓桿的釋放,因此獲客來源的研究至關重要。
在吸引異地客流上,相比與實物電商商家到現在才逐步注意到“流量產權”問題,想要建立自己的私域流量,避免被公域流量反覆收割。
@@ -53,9 +53,4 @@
數據來源:Wind、海豚投研
長期視角下,按 DCF 模型估值,基於未來五年收入複合增速 14%,歸母淨利潤複合增速 23.3%,折現率 10.55%,以及永續增長率 3.0%,對應華住價位大致 69 美元,較當前仍有充分空間(僅供參考,不做建議)。
數據來源:海豚投研測算
短期來看,受疫情反覆,開店放緩節奏,2021 年上半年華住淨開酒店數量同比、環比均有放緩趨勢,同時公司在第二季度財報中也下調今年全年收入增長指引,短期股價仍可能面對悲觀情緒上的殺跌。
-不過,海豚君鑑於公司中長期基本面穩健,依舊看好華住作爲中國酒店龍頭在結構升級、連鎖提升背景下的成長機會。
後續,海豚君還會持續跟進華住的業績表現,敬請關注。
-高峰
-佣金
-甚麼
-1 厘
-講吓
+不過,海豚君鑑於公司中長期基本面穩健,依舊看好華住作爲中國酒店龍頭在結構升級、連鎖提升背景下的成長機會。
後續,海豚君還會持續跟進華住的業績表現,敬請關注。
\ No newline at end of file
diff --git a/tests/s2t_test.go b/tests/s2t_test.go
index b1001a0..ddb5f18 100644
--- a/tests/s2t_test.go
+++ b/tests/s2t_test.go
@@ -58,25 +58,3 @@ func TestFinance_s2hk_finance(t *testing.T) {
}
}
-
-func assertCases(t *testing.T, cases map[string]string) {
- t.Helper()
- cc, _ := opencc.New("s2hk")
-
- for raw, expected := range cases {
- out, _ := cc.Convert(raw)
- if strings.TrimSpace(expected) != strings.TrimSpace(out) {
- t.Errorf("expected %s, got %s", expected, out)
- }
- }
-}
-
-// Special hotfix in this project
-func TestSelfSpecialHotfix(t *testing.T) {
- cases := map[string]string{
- "来自于汇丰,以及汇丰银行,汇入的款项": "來自於滙豐,以及滙豐銀行,匯入的款項",
- "汇业银行集团": "滙業銀行集團",
- }
-
- assertCases(t, cases)
-}