diff --git a/.gitignore b/.gitignore index 3469f78..eadcc98 100644 --- a/.gitignore +++ b/.gitignore @@ -12,4 +12,5 @@ # Project-local glide cache, RE: https://github.com/Masterminds/glide/issues/736 .glide/ -.DS_Store \ No newline at end of file +.DS_Store +tmp/ diff --git a/Makefile b/Makefile index e69de29..4c00444 100644 --- a/Makefile +++ b/Makefile @@ -0,0 +1,9 @@ +update\:data: + # Fetch to update data from https://github.com/BYVoid/OpenCC + mkdir -p ./tmp && rm -Rf tmp/OpenCC-master + wget https://github.com/BYVoid/OpenCC/archive/refs/heads/master.zip -O tmp/opencc.zip + unzip tmp/opencc.zip -d tmp/ + sh ./merge-data.sh +test: + sh ./merge-data.sh + go test ./... \ No newline at end of file diff --git a/README.md b/README.md index bff2ab6..13f542b 100644 --- a/README.md +++ b/README.md @@ -60,6 +60,17 @@ func main() { - `tw2t.json` Traditional Chinese (Taiwan standard) to Traditional Chinese 臺灣正體到繁體(OpenCC 標準) - `s2hk-finance.json` 针对香港市场金融数据,做了特殊补充。 +## Development Guides + +- dictionary - 用来同步 OpenCC 官方的字典,请勿改动,这个文件夹应该是靠命令来生成的。 +- addition-dictionary - 用来存放此项目提前修复的字典,执行 `make update:data` 的时候,会把这里的内容补充到 dictionary 里面。 + +采用 `make update:data` 命令可以从 OpenCC 官方仓库更新词典。 + +```bash +$ make update:data +``` + ## Benchmarks See [benchmark_test.go](https://github.com/longbridgeapp/opencc/tree/master/tests/benchmark_test.go) diff --git a/addition-dictionary/STCharacters.txt b/addition-dictionary/STCharacters.txt new file mode 100644 index 0000000..162f533 --- /dev/null +++ b/addition-dictionary/STCharacters.txt @@ -0,0 +1 @@ +厘 厘 diff --git a/addition-dictionary/STPhrases.txt b/addition-dictionary/STPhrases.txt new file mode 100644 index 0000000..e67eb19 --- /dev/null +++ b/addition-dictionary/STPhrases.txt @@ -0,0 +1,7 @@ +高峰 高峰 +什么 什麼 +讲下 講吓 +回流 回流 +迴流 回流 +公厘 公厘 +厘米 厘米 diff --git a/config/hk2s.json b/config/hk2s.json index c1257f8..cf0e9b9 100644 --- a/config/hk2s.json +++ b/config/hk2s.json @@ -7,36 +7,27 @@ "file": "TSPhrases.ocd2" } }, - "conversion_chain": [ - { - "dict": { - "type": "group", - "dicts": [ - { - "type": "ocd2", - "file": "HKVariantsRevPhrases.ocd2" - }, - { - "type": "ocd2", - "file": "HKVariantsRev.ocd2" - } - ] - } - }, - { - "dict": { - "type": "group", - "dicts": [ - { - "type": "ocd2", - "file": "TSPhrases.ocd2" - }, - { - "type": "ocd2", - "file": "TSCharacters.ocd2" - } - ] - } + "conversion_chain": [{ + "dict": { + "type": "group", + "dicts": [{ + "type": "ocd2", + "file": "HKVariantsRevPhrases.ocd2" + }, { + "type": "ocd2", + "file": "HKVariantsRev.ocd2" + }] + } + }, { + "dict": { + "type": "group", + "dicts": [{ + "type": "ocd2", + "file": "TSPhrases.ocd2" + }, { + "type": "ocd2", + "file": "TSCharacters.ocd2" + }] } - ] + }] } diff --git a/config/s2hk.json b/config/s2hk.json index 91623a3..fcaa017 100644 --- a/config/s2hk.json +++ b/config/s2hk.json @@ -7,27 +7,21 @@ "file": "STPhrases.ocd2" } }, - "conversion_chain": [ - { - "dict": { - "type": "group", - "dicts": [ - { - "type": "ocd2", - "file": "STPhrases.ocd2" - }, - { - "type": "ocd2", - "file": "STCharacters.ocd2" - } - ] - } - }, - { - "dict": { + "conversion_chain": [{ + "dict": { + "type": "group", + "dicts": [{ + "type": "ocd2", + "file": "STPhrases.ocd2" + }, { "type": "ocd2", - "file": "HKVariants.ocd2" - } + "file": "STCharacters.ocd2" + }] + } + }, { + "dict": { + "type": "ocd2", + "file": "HKVariants.ocd2" } - ] + }] } diff --git a/config/s2twp.json b/config/s2twp.json index d8fd266..2f36e93 100644 --- a/config/s2twp.json +++ b/config/s2twp.json @@ -7,33 +7,26 @@ "file": "STPhrases.ocd2" } }, - "conversion_chain": [ - { - "dict": { - "type": "group", - "dicts": [ - { - "type": "ocd2", - "file": "STPhrases.ocd2" - }, - { - "type": "ocd2", - "file": "STCharacters.ocd2" - } - ] - } - }, - { - "dict": { + "conversion_chain": [{ + "dict": { + "type": "group", + "dicts": [{ "type": "ocd2", - "file": "TWPhrases.ocd2" - } - }, - { - "dict": { + "file": "STPhrases.ocd2" + }, { "type": "ocd2", - "file": "TWVariants.ocd2" - } + "file": "STCharacters.ocd2" + }] + } + }, { + "dict": { + "type": "ocd2", + "file": "TWPhrases.ocd2" + } + }, { + "dict": { + "type": "ocd2", + "file": "TWVariants.ocd2" } - ] + }] } diff --git a/dictionary/HKPhrasesFinance.txt b/dictionary/HKPhrasesFinance.txt index 4b7efe5..b3d55fe 100644 --- a/dictionary/HKPhrasesFinance.txt +++ b/dictionary/HKPhrasesFinance.txt @@ -81,4 +81,5 @@ 除權日 除淨日 摘牌 除牌 追加保證金通知 追收孖展 -被迫倉 被挾倉 \ No newline at end of file +被迫倉 被挾倉 +高峰 高峰 \ No newline at end of file diff --git a/dictionary/JPVariants.txt b/dictionary/JPVariants.txt index 6ed3b92..3a8468b 100644 --- a/dictionary/JPVariants.txt +++ b/dictionary/JPVariants.txt @@ -158,7 +158,7 @@ 淨 浄 淺 浅 渴 渇 -溌 潑 +潑 溌 溪 渓 溫 温 溼 湿 @@ -216,7 +216,7 @@ 穗 穂 穩 穏 穰 穣 -竃 竈 +竈 竃 竊 窃 粹 粋 糉 粽 @@ -229,7 +229,7 @@ 縣 県 縱 縦 總 総 -繋 繫 +繫 繋 繡 繍 繩 縄 繪 絵 @@ -312,7 +312,7 @@ 鄉 郷 酢 醋 醉 酔 -醗 醱 +醱 醗 醫 医 醬 醤 釀 醸 diff --git a/dictionary/STCharacters.txt b/dictionary/STCharacters.txt index 5339753..54edeaa 100644 --- a/dictionary/STCharacters.txt +++ b/dictionary/STCharacters.txt @@ -342,7 +342,7 @@ 厍 厙 厐 龎 厕 廁 -厘 厘 +厘 釐 厘 厢 廂 厣 厴 厦 廈 @@ -455,7 +455,7 @@ 坚 堅 坛 壇 罈 坜 壢 -坝 壩 +坝 壩 垻 坞 塢 坟 墳 坠 墜 @@ -952,6 +952,7 @@ 汉 漢 汤 湯 汹 洶 +沄 澐 沈 沈 瀋 沟 溝 没 沒 @@ -3863,29 +3864,118 @@ 𫢸 僤 𫧃 𣍐 𫧮 𪋿 +𫫇 噁 𫬐 㘔 +𫭟 塸 +𫭢 埨 +𫭼 𡑍 𫮃 墠 𫰛 娙 +𫵷 㠣 𫶇 嵽 𫷷 廞 𫸩 彄 𬀩 暐 +𬀪 晛 +𬂩 梜 +𬃊 櫍 +𬇕 澫 +𬇙 浿 +𬇹 漍 +𬉼 熰 +𬊈 燖 +𬊤 燀 +𬍛 瓅 +𬍡 璗 +𬍤 璕 +𬒈 礐 +𬒗 𥗽 +𬕂 篢 +𬘓 紃 +𬘘 紞 +𬘡 絪 +𬘩 綎 +𬘫 綄 +𬘬 綪 +𬘭 綝 +𬘯 綧 +𬙂 縯 +𬙊 纆 +𬙋 纕 +𬜬 蔄 +𬜯 䓣 +𬞟 蘋 +𬟁 虉 +𬟽 蝀 +𬣙 訏 +𬣞 詝 +𬣡 諓 +𬣳 詪 +𬤇 諲 +𬤊 諟 +𬤝 譓 +𬨂 軝 +𬨎 輶 +𬩽 鄩 +𬪩 醲 +𬬩 釴 𬬭 錀 +𬬮 鋹 +𬬱 釿 +𬬸 鉥 +𬬹 鉮 𬬻 鑪 +𬬿 鉊 +𬭁 鉧 𬭊 𨧀 +𬭎 鋐 +𬭚 錞 𬭛 𨨏 +𬭤 鍭 +𬭩 鎓 +𬭬 鏏 𬭭 鏚 +𬭯 䥕 𬭳 𨭎 𬭶 𨭆 +𬭸 鏻 +𬭼 鐩 +𬮱 闉 +𬮿 隑 +𬯀 隮 +𬯎 隤 +𬱖 頔 +𬱟 頠 +𬳵 駓 +𬳶 駉 +𬳽 駪 +𬳿 駼 +𬴂 騑 +𬴃 騞 +𬴊 驎 𬶋 鮈 𬶍 鮀 𬶏 鮠 +𬶐 鮡 𬶟 鯻 +𬶠 鰊 +𬶨 鱀 +𬶭 鰶 +𬶮 鱚 +𬷕 鵏 +𬸘 鶠 +𬸚 鸑 +𬸣 鶱 +𬸦 鷟 𬸪 鷭 𬸯 鷿 +𬹼 齘 +𬺈 齮 +𬺓 齼 𰬸 繐 𰰨 菕 𰶎 譅 𰾄 鋂 𰾭 鑀 𱊜 𪈼 +厘 厘 diff --git a/dictionary/STPhrases.txt b/dictionary/STPhrases.txt index 13bdc37..d89074e 100644 --- a/dictionary/STPhrases.txt +++ b/dictionary/STPhrases.txt @@ -32,6 +32,7 @@ 一前一后 一前一後 一力承当 一力承當 一卷 一卷 +一厘一毫 一釐一毫 一厢情愿 一廂情願 一去不回 一去不回 一去不复 一去不復 @@ -293,6 +294,7 @@ 七余 七餘 七八下里 七八下裏 七出 七出 +七出戏 七齣戲 七出祁山 七出祁山 七分钟 七分鐘 七划 七劃 @@ -695,6 +697,7 @@ 三冬 三冬 三冬两夏 三冬兩夏 三准 三準 +三出戏 三齣戲 三出祁山 三出祁山 三分钟 三分鐘 三只 三隻 @@ -1056,7 +1059,7 @@ 不可胜言 不可勝言 不可胜计 不可勝計 不可胜记 不可勝記 -不吃烟火食 不吃煙火食 +不吃烟火食 不喫煙火食 不合 不合 不合体统 不合體統 不合作 不合作 @@ -1129,10 +1132,11 @@ 不尽道理 不盡道理 不屑于 不屑於 不属于 不屬於 +不差毫厘 不差毫釐 不差毫发 不差毫髮 不干 不幹 不乾 不干不净 不乾不淨 -不干不淨吃了没病 不乾不淨吃了沒病 +不干不淨吃了没病 不乾不淨喫了沒病 不干了 不幹了 不干事 不幹事 不干他 不干他 @@ -1586,6 +1590,7 @@ 东欧集团 東歐集團 东海捞针 東海撈針 东涂西抹 東塗西抹 +东涌 東涌 东淨里的砖儿 東淨裏的磚兒 东游 東遊 东窗事发 東窗事發 @@ -2219,7 +2224,7 @@ 乌滋别克 烏滋別克 乌滋别克斯坦 烏滋別克斯坦 乌烟瘴气 烏煙瘴氣 -乌狗吃食白狗当灾 烏狗吃食白狗當災 +乌狗吃食白狗当灾 烏狗喫食白狗當災 乌苏 烏蘇 乌苏市 烏蘇市 乌苏拉 烏蘇拉 @@ -2295,6 +2300,7 @@ 九亿五千万 九億五千萬 九余 九餘 九冬 九冬 +九出戏 九齣戲 九出祁山 九出祁山 九分钟 九分鐘 九划 九劃 @@ -3423,7 +3429,7 @@ 亿多只 億多隻 亿天后 億天後 什不闲 什不閒 -什么 甚麼 +什么 什麼 什叶派 什葉派 什里店 什里店 什锦炒面 什錦炒麪 @@ -3946,7 +3952,7 @@ 似松实紧 似鬆實緊 佃租制度 佃租制度 但云 但云 -但得一片橘皮吃且莫忘了洞庭湖 但得一片橘皮吃且莫忘了洞庭湖 +但得一片橘皮吃且莫忘了洞庭湖 但得一片橘皮喫且莫忘了洞庭湖 但愿 但願 但愿如此 但願如此 但曲 但曲 @@ -4370,7 +4376,7 @@ 侵蚀基准 侵蝕基準 便了 便了 便于 便於 -便吃干 便吃乾 +便吃干 便喫乾 便宜不过当家 便宜不過當家 便当 便當 便当店 便當店 @@ -5488,7 +5494,7 @@ 党外 黨外 党外人士 黨外人士 党太尉 党太尉 -党太尉吃匾食 党太尉吃匾食 +党太尉吃匾食 党太尉喫匾食 党委 黨委 党委书记 黨委書記 党委会 黨委會 @@ -5657,6 +5663,7 @@ 全面禁止核试验条约 全面禁止核試驗條約 全面规划 全面規劃 全面进行 全面進行 +兩出戏 兩齣戲 八万 八萬 八万一千 八萬一千 八万四千法门 八萬四千法門 @@ -5668,6 +5675,7 @@ 八余 八餘 八克 八克 八军团 八軍團 +八出戏 八齣戲 八出祁山 八出祁山 八十天环游地球 八十天環遊地球 八十种好 八十種好 @@ -5736,6 +5744,7 @@ 公制单位 公制單位 公升 公升 公历 公曆 +公厘 公釐 公合 公合 公同 公同 公同共有 公同共有 @@ -5786,6 +5795,7 @@ 六余 六餘 六冲 六沖 六出奇计 六出奇計 +六出戏 六齣戲 六出祁山 六出祁山 六厂 六廠 六发 六發 @@ -7323,7 +7333,7 @@ 出宰 出宰 出家 出家 出家人 出家人 -出家人吃八方 出家人吃八方 +出家人吃八方 出家人喫八方 出将入相 出將入相 出小恭 出小恭 出尔反尔 出爾反爾 @@ -7363,7 +7373,7 @@ 出恭 出恭 出息 出息 出意外 出意外 -出戏 齣戲 +出戏 出戏 齣戲 出战 出戰 出户 出戶 出手 出手 @@ -7703,6 +7713,8 @@ 分半钟 分半鐘 分占 分佔 分厂 分廠 +分厘卡 分釐卡 +分厘毫丝 分釐毫絲 分发 分發 分发到 分發到 分发区 分發區 @@ -7789,7 +7801,7 @@ 切当 切當 切菜板 切菜板 切除术 切除術 -切面 切面 +切面 切面 切麵 切骨之仇 切骨之仇 刊了 刊了 刊出 刊出 @@ -9036,7 +9048,7 @@ 北向 北向 北周 北周 北回 北迴 -北回归线 北回歸線 +北回归线 北迴歸線 北回线 北迴線 北回铁路 北迴鐵路 北岳 北嶽 @@ -9763,7 +9775,7 @@ 南向 南向 南回 南迴 南回公路 南迴公路 -南回归线 南回歸線 +南回归线 南迴歸線 南回线 南迴線 南回铁路 南迴鐵路 南宫适 南宮适 @@ -10465,7 +10477,17 @@ 厌恶感 厭惡感 厌食症 厭食症 厓谷 厓谷 +厘出 釐出 +厘升 釐升 +厘定 釐定 +厘改 釐改 +厘整 釐整 +厘正 釐正 厘清 釐清 +厘米 釐米 +厘订 釐訂 +厘金 厘金 +厘革 釐革 厚朴 厚朴 厚板 厚板 厚纸板 厚紙板 @@ -11579,6 +11601,7 @@ 口出恶言 口出惡言 口出秽言 口出穢言 口占 口占 +口吃 口吃 口布 口布 口干 口乾 口干舌燥 口乾舌燥 @@ -11708,7 +11731,7 @@ 只可在 只可在 只可意会不可言传 只可意會不可言傳 只叹 只嘆 -只吃 只吃 +只吃 只喫 只合 只合 只含 只含 只听 只聽 @@ -12695,59 +12718,60 @@ 吁气 吁氣 吁求 籲求 吁请 籲請 -吃一顿挨一顿 吃一頓挨一頓 -吃不了 吃不了 -吃不出 吃不出 -吃不出来 吃不出來 -吃了 吃了 -吃了定心丸 吃了定心丸 -吃了秤砣 吃了秤砣 -吃了蜜蜂儿屎似的 吃了蜜蜂兒屎似的 -吃了饭 吃了飯 -吃亏上当 吃虧上當 -吃亏就是占便宜 吃虧就是佔便宜 -吃人一个蛋恩情无法断 吃人一個蛋恩情無法斷 -吃人虫 吃人蟲 -吃伤了 吃傷了 -吃几碗干饭 吃幾碗乾飯 -吃出 吃出 -吃合家欢 吃合家歡 -吃后悔药 吃後悔藥 -吃回头草 吃回頭草 -吃地面 吃地面 -吃姜 吃薑 -吃完面 吃完麪 -吃尽 吃盡 -吃尽当光 吃盡當光 -吃干了 吃乾了 -吃干醋 吃乾醋 -吃得了 吃得了 -吃得出 吃得出 -吃得出来 吃得出來 -吃挂络儿 吃掛絡兒 -吃敲才 吃敲才 -吃板刀面 吃板刀麪 -吃枪药 吃槍藥 -吃烟 吃煙 -吃药 吃藥 -吃药前 吃藥前 -吃药后 吃藥後 -吃药时 吃藥時 -吃豆干 吃豆乾 -吃辣面 吃辣麪 -吃过面 吃過麪 -吃里扒外 吃裏扒外 -吃里爬外 吃裏爬外 -吃钉板 吃釘板 -吃错药 吃錯藥 -吃闲话 吃閒話 -吃闲饭 吃閒飯 -吃面 吃麪 -吃饭傢伙 吃飯傢伙 -吃饭别忘了种谷人 吃飯別忘了種穀人 -吃饭家伙 吃飯家伙 -吃饱了饭撑的 吃飽了飯撐的 -吃饱没事干 吃飽沒事幹 +吃一顿挨一顿 喫一頓挨一頓 +吃不了 喫不了 +吃不出 喫不出 +吃不出来 喫不出來 +吃了 喫了 +吃了定心丸 喫了定心丸 +吃了秤砣 喫了秤砣 +吃了蜜蜂儿屎似的 喫了蜜蜂兒屎似的 +吃了饭 喫了飯 +吃亏上当 喫虧上當 +吃亏就是占便宜 喫虧就是佔便宜 +吃亏的是乖占便宜的是呆 喫虧的是乖占便宜的是呆 +吃人一个蛋恩情无法断 喫人一個蛋恩情無法斷 +吃人虫 喫人蟲 +吃伤了 喫傷了 +吃几碗干饭 喫幾碗乾飯 +吃出 喫出 +吃合家欢 喫合家歡 +吃后悔药 喫後悔藥 +吃回头草 喫回頭草 +吃地面 喫地面 +吃姜 喫薑 +吃完面 喫完麪 +吃尽 喫盡 +吃尽当光 喫盡當光 +吃干了 喫乾了 +吃干醋 喫乾醋 +吃得了 喫得了 +吃得出 喫得出 +吃得出来 喫得出來 +吃挂络儿 喫掛絡兒 +吃敲才 喫敲才 +吃板刀面 喫板刀麪 +吃枪药 喫槍藥 +吃烟 喫煙 +吃药 喫藥 +吃药前 喫藥前 +吃药后 喫藥後 +吃药时 喫藥時 +吃豆干 喫豆乾 +吃辣面 喫辣麪 +吃过面 喫過麪 +吃里扒外 喫裏扒外 +吃里爬外 喫裏爬外 +吃钉板 喫釘板 +吃错药 喫錯藥 +吃闲话 喫閒話 +吃闲饭 喫閒飯 +吃面 喫麪 +吃饭傢伙 喫飯傢伙 +吃饭别忘了种谷人 喫飯別忘了種穀人 +吃饭家伙 喫飯家伙 +吃饱了饭撑的 喫飽了飯撐的 +吃饱没事干 喫飽沒事幹 各不相同 各不相同 各个 各個 各个击破 各個擊破 @@ -12869,8 +12893,8 @@ 合口味 合口味 合口呼 合口呼 合叶 合葉 -合吃 合吃 -合吃族 合吃族 +合吃 合喫 +合吃族 合喫族 合合 合合 合同 合同 合同各方 合同各方 @@ -13384,8 +13408,8 @@ 同参 同參 同右 同右 同号 同號 -同吃 同吃 -同吃同住 同吃同住 +同吃 同喫 +同吃同住 同喫同住 同名 同名 同名之累 同名之累 同名同姓 同名同姓 @@ -14651,7 +14675,6 @@ 周村 周村 周村区 周村區 周杰 周杰 -高峰 高峰 周杰伦 周杰倫 周柏臣 周柏臣 周某 周某 @@ -15248,7 +15271,6 @@ 喧哄 喧鬨 喧哗 喧譁 喧噪 喧噪 -喫亏的是乖占便宜的是呆 喫虧的是乖占便宜的是呆 喷云吐雾 噴雲吐霧 喷云嗳雾 噴雲噯霧 喷出 噴出 @@ -15523,11 +15545,11 @@ 回府 回府 回廊 迴廊 回弹 回彈 -回归 回歸 -回归年 回歸年 -回归潮 回歸潮 -回归热 回歸熱 -回归线 回歸線 +回归 迴歸 +回归年 迴歸年 +回归潮 迴歸潮 +回归热 迴歸熱 +回归线 迴歸線 回形夹 迴形夾 回得 回得 回得去 回得去 @@ -15604,7 +15626,7 @@ 回民区 回民區 回水 回水 回波 回波 -回流 回流 +回流 迴流 回清倒影 迴清倒影 回温 回溫 回港 回港 @@ -16596,7 +16618,6 @@ 复习考 複習考 复书 復書 复交 復交 -复亩珍 複畝珍 复仇 復仇 复仇者 復仇者 复仇记 復仇記 @@ -17059,7 +17080,7 @@ 多发病 多發病 多只 多隻 多台 多臺 -多吃多占 多吃多佔 +多吃多占 多喫多佔 多向 多向 多哈回合 多哈回合 多回 多回 @@ -17347,7 +17368,7 @@ 大核 大核 大梁 大梁 大樑 大楼监控系统 大樓監控系統 -大欖涌 大欖涌 +大榄涌 大欖涌 大欲 大欲 大武仑 大武崙 大气团 大氣團 @@ -17403,9 +17424,9 @@ 大获 大獲 大获全胜 大獲全勝 大虫 大蟲 -大虫不吃伏肉 大蟲不吃伏肉 +大虫不吃伏肉 大蟲不喫伏肉 大虫口里倒涎 大蟲口裏倒涎 -大虫吃小虫 大蟲吃小蟲 +大虫吃小虫 大蟲喫小蟲 大虫头上做窠 大蟲頭上做窠 大蜡 大蜡 大衍历 大衍曆 @@ -17609,8 +17630,9 @@ 央浼营干 央浼營幹 夯土建筑 夯土建築 夯干 夯幹 -失之毫厘差之千里 失之毫厘差之千里 -失之毫厘差以千里 失之毫厘差以千里 +失之毫厘 失之毫釐 +失之毫厘差之千里 失之毫釐差之千里 +失之毫厘差以千里 失之毫釐差以千里 失之毫厘谬以千里 失之毫厘謬以千里 失于 失於 失体面 失體面 @@ -19122,7 +19144,7 @@ 就出 就出 就出去 就出去 就出来 就出來 -就吃干 就吃乾 +就吃干 就喫乾 就回 就回 就回去 就回去 就回来 就回來 @@ -19558,6 +19580,7 @@ 崩症 崩症 嵌岩 嵌巖 嵚埼历落 嶔埼歷落 +嵫厘 嵫釐 嶰谷 嶰谷 嶽云 嶽雲 巅崖峻谷 巔崖峻谷 @@ -19687,7 +19710,9 @@ 巫山云雨 巫山雲雨 巫术 巫術 差之千里 差之千里 +差之毫厘 差之毫釐 差于 差於 +差以毫厘 差以毫釐 差价 差價 差别 差別 差别待遇 差別待遇 @@ -19695,6 +19720,7 @@ 差发 差發 差多了 差多了 差恶 差惡 +差若豪厘 差若豪釐 己丑 己丑 己出 己出 己所不欲 己所不欲 @@ -19990,7 +20016,6 @@ 布气 布氣 布水 布水 布法罗 布法羅 -布洒器 布灑器 布洛克 布洛克 布洛斯顿 布洛斯頓 布洛沙德 布洛沙德 @@ -20009,7 +20034,6 @@ 布瑞斯特 布瑞斯特 布瑞特 布瑞特 布瑞顿 布瑞頓 -布用填 布用填 布疋 布疋 布疑阵 佈疑陣 布痕瓦尔德 布痕瓦爾德 @@ -20348,7 +20372,7 @@ 干乔 乾喬 干买卖 幹買賣 干了 幹了 乾了 -干了什么 幹了甚麼 +干了什么 幹了什麼 干了杯 乾了杯 干了这一杯 乾了這一杯 干了这一瓶 乾了這一瓶 @@ -20360,12 +20384,12 @@ 干云蔽日 乾雲蔽日 干井 乾井 干些 幹些 -干些什么 幹些甚麼 +干些什么 幹些什麼 干产 乾產 干亲 乾親 干人 幹人 干什 幹什 -干什么 幹甚麼 +干什么 幹什麼 干他 幹他 干他 干仗 幹仗 干任何 幹任何 @@ -20772,7 +20796,7 @@ 平复帖 平復帖 平复起来 平復起來 平头并进 平頭並進 -平安里 平安裏 +平安里 平安里 平定准噶尔回部得胜图 平定準噶爾回部得勝圖 平平当当 平平當當 平康里 平康里 @@ -21279,6 +21303,7 @@ 廪膳秀才 廩膳秀才 延伸出 延伸出 延修 延修 +延厘 延釐 延发 延發 延后 延後 延地里 延地裏 @@ -21457,7 +21482,7 @@ 弄盏传杯 弄盞傳杯 弄粉调朱 弄粉調朱 弄脏 弄髒 -弄面吃 弄麪吃 +弄面吃 弄麪喫 弄鬼吊猴 弄鬼弔猴 弈秋 弈秋 弊帚千金 弊帚千金 @@ -22790,7 +22815,7 @@ 快出来 快出來 快升 快升 快去快回 快去快回 -快吃干 快吃乾 +快吃干 快喫乾 快向 快向 快回 快回 快回到 快回到 @@ -23435,7 +23460,7 @@ 想尽办法 想盡辦法 想尽方法 想盡方法 想干 想幹 -想干什么 想幹甚麼 +想干什么 想幹什麼 想当然 想當然 想当然耳 想當然耳 想录 想錄 @@ -23830,7 +23855,7 @@ 手铲 手鏟 手链 手鍊 手鏈 手面 手面 -手面赚吃 手面賺吃 +手面赚吃 手面賺喫 才上到 纔上到 才上去 纔上去 才上来 纔上來 @@ -25039,6 +25064,7 @@ 抽出去 抽出去 抽出来 抽出來 抽出空 抽出空 +抽厘 抽釐 抽后腿 抽後腿 抽咽 抽咽 抽回 抽回 @@ -27750,7 +27776,7 @@ 早知今日悔不当初 早知今日悔不當初 早秋 早秋 早自修 早自修 -早起的鸟儿有虫吃 早起的鳥兒有蟲吃 +早起的鸟儿有虫吃 早起的鳥兒有蟲喫 旭日东升 旭日東昇 旭日初升 旭日初昇 旱干 旱乾 @@ -28184,7 +28210,7 @@ 暗号 暗號 暗号灯 暗號燈 暗叹 暗歎 -暗吃一惊 暗吃一驚 +暗吃一惊 暗喫一驚 暗合 暗合 暗含 暗含 暗喜 暗喜 @@ -29540,7 +29566,6 @@ 杰里森 傑里森 杰里科 傑里科 杰里米 傑里米 -東涌 東涌 杳无人烟 杳無人煙 松一下 鬆一下 松一些 鬆一些 @@ -29923,6 +29948,7 @@ 构筑工事 構築工事 构筑物 構築物 析出 析出 +析毫剖厘 析毫剖釐 枕借 枕藉 枕岩漱流 枕巖漱流 枕席 枕蓆 @@ -31038,7 +31064,7 @@ 武器系统 武器系統 武器级别材料 武器級別材料 武坛 武壇 -武大郎吃毒药 武大郎吃毒藥 +武大郎吃毒药 武大郎喫毒藥 武当 武當 武当山 武當山 武当派 武當派 @@ -31287,6 +31313,11 @@ 毫仑目 毫侖目 毫克 毫克 毫升 毫升 +毫厘 毫釐 +毫厘不差 毫釐不差 +毫厘不爽 毫釐不爽 +毫厘之差 毫釐之差 +毫厘千里 毫釐千里 毫发 毫髮 毫发不差 毫髮不差 毫发不爽 毫髮不爽 @@ -31830,7 +31861,7 @@ 沙里淘金 沙裏淘金 沙雕 沙雕 沙雕赛 沙雕賽 -沙魚涌 沙魚涌 +沙鱼涌 沙魚涌 沟谷 溝谷 没个出豁 沒個出豁 没个好结果 沒個好結果 @@ -34588,7 +34619,7 @@ 猝发 猝發 猢狲入布袋 猢猻入布袋 猥当大任 猥當大任 -猪八戒吃人参果 豬八戒吃人參果 +猪八戒吃人参果 豬八戒喫人參果 猪只 豬隻 猪肉干 豬肉乾 猪肝面 豬肝麪 @@ -35826,7 +35857,6 @@ 相须为命 相須爲命 相须而行 相須而行 盼了 盼了 -盼既示复 盼既示覆 盾板 盾板 省个 省個 省了 省了 @@ -36415,6 +36445,7 @@ 祖国光复会 祖國光復會 祛痰药 祛痰藥 祛蠹除奸 祛蠹除奸 +祝厘 祝釐 祝发 祝髮 祝年丰 祝年豐 祝愿 祝願 @@ -36585,6 +36616,7 @@ 离题万里 離題萬里 离鸾别凤 離鸞別鳳 禽困复车 禽困覆車 +禽滑厘 禽滑釐 禽舍 禽舍 禾虫 禾蟲 禾谷 禾穀 @@ -36981,7 +37013,7 @@ 稔恶不悛 稔惡不悛 稠云 稠雲 稳占 穩佔 -稳吃三注 穩吃三注 +稳吃三注 穩喫三注 稳坐钓鱼台 穩坐釣魚臺 稳定物价 穩定物價 稳当 穩當 @@ -37538,7 +37570,6 @@ 算出去 算出去 算出来 算出來 算历 算曆 -算发 算髮 算得了 算得了 算术 算術 算术和 算術和 @@ -37619,6 +37650,7 @@ 米利托 米利托 米制 米制 米卤蛋 米滷蛋 +米厘米突 米釐米突 米德尔伯里 米德爾伯裏 米格式战斗机 米格式戰鬥機 米纳谷 米納谷 @@ -39259,6 +39291,7 @@ 肿瘤切除术 腫瘤切除術 胁制 脅制 胃出血 胃出血 +胃口 胃口 胃脏 胃臟 胃药 胃藥 胃药片 胃藥片 @@ -39413,8 +39446,8 @@ 胡厮哄 胡廝哄 胡厮混 胡廝混 胡厮缠 胡廝纏 -胡吃海喝 胡吃海喝 -胡吃闷睡 胡吃悶睡 +胡吃海喝 胡喫海喝 +胡吃闷睡 胡喫悶睡 胡同 衚衕 胡吣 胡唚 胡吹 胡吹 @@ -41625,7 +41658,7 @@ 虫儿 蟲兒 虫出 蟲出 虫卵 蟲卵 -虫吃牙 蟲吃牙 +虫吃牙 蟲喫牙 虫声 蟲聲 虫媒病毒 蟲媒病毒 虫媒花 蟲媒花 @@ -41683,6 +41716,7 @@ 蚕种 蠶種 蚕豆症 蠶豆症 蚜虫 蚜蟲 +蚝涌 蠔涌 蚵仔面线 蚵仔麪線 蛀虫 蛀蟲 蛆虫 蛆蟲 @@ -41827,7 +41861,6 @@ 蟾彩 蟾彩 蠁干 蠁幹 蠓虫 蠓蟲 -蠔涌 蠔涌 蠕虫 蠕蟲 蠕虫形 蠕蟲形 蠢虫 蠢蟲 @@ -42530,7 +42563,7 @@ 角膜移植术 角膜移植術 角色冲突 角色衝突 角色扮演游戏 角色扮演遊戲 -角落发 角落發 +角落 角落 角落里 角落裏 角谷猜想 角谷猜想 角里 角里 @@ -43288,6 +43321,7 @@ 象箸玉杯 象箸玉杯 象鼻虫 象鼻蟲 豪华游 豪華遊 +豪厘千里 豪釐千里 豪情万丈 豪情萬丈 豪情壮志 豪情壯志 豪情逸致 豪情逸致 @@ -45039,7 +45073,7 @@ 邢台市 邢臺市 那个 那個 那个人 那個人 -那个猫儿不吃腥 那個貓兒不吃腥 +那个猫儿不吃腥 那個貓兒不喫腥 那个耗子不偷油 那個耗子不偷油 那么 那麼 那么干 那麼幹 @@ -45191,7 +45225,7 @@ 部发 部發 部曲 部曲 部胡林 部胡林 -部落发 部落發 +部落 部落 部落同盟 部落同盟 郭勇志 郭勇志 郭台成 郭臺成 @@ -48541,7 +48575,6 @@ 魔板 魔板 魔表 魔錶 魔赛克 魔賽克 -鰂魚涌 鰂魚涌 鱼丸粗面 魚丸粗麪 鱼台 魚臺 鱼台县 魚臺縣 @@ -48570,6 +48603,7 @@ 鲇鱼 鮎魚 鲋鱼困涸辙难待西江水 鮒魚困涸轍難待西江水 鲍德里亚 鮑德里亞 +鲗鱼涌 鰂魚涌 鲜于 鮮于 鲜彩 鮮彩 鲜明个性 鮮明個性 @@ -49011,4 +49045,10 @@ 龚胜 龔勝 龟卜 龜卜 龟鉴 龜鑑 +高峰 高峰 +什么 什麼 讲下 講吓 +回流 回流 +迴流 回流 +公厘 公厘 +厘米 厘米 diff --git a/dictionary/TSCharacters.txt b/dictionary/TSCharacters.txt index 5dc2b2b..a236514 100644 --- a/dictionary/TSCharacters.txt +++ b/dictionary/TSCharacters.txt @@ -23,6 +23,7 @@ 㞞 𪨊 㟺 𪩇 㠏 㟆 +㠣 𫵷 㢗 𪪑 㢝 𢋈 㥮 㤘 @@ -88,6 +89,7 @@ 䍽 𦍠 䎙 𫅭 䎱 䎬 +䓣 𬜯 䕤 𫟕 䕳 𦰴 䖅 𫟑 @@ -120,6 +122,7 @@ 䥄 𫠀 䥇 䦂 䥑 鿏 +䥕 𬭯 䥗 𫔋 䥩 𨱖 䥯 𫔆 @@ -247,6 +250,7 @@ 僑 侨 僕 仆 僞 伪 +僤 𫢸 僥 侥 僨 偾 僱 雇 @@ -290,7 +294,7 @@ 刪 删 剄 刭 則 则 -剋 克 +剋 克 剋 剎 刹 剗 刬 剛 刚 @@ -389,7 +393,7 @@ 嘸 呒 嘺 𪡀 嘽 啴 -噁 恶 +噁 恶 𫫇 噅 𠯠 噓 嘘 噚 㖊 @@ -439,7 +443,9 @@ 圖 图 團 团 圞 𪢮 +垻 坝 埡 垭 +埨 𫭢 埬 𪣆 埰 采 執 执 @@ -460,10 +466,12 @@ 塢 坞 塤 埙 塵 尘 +塸 𫭟 塹 堑 塿 𪣻 墊 垫 墜 坠 +墠 𫮃 墮 堕 墰 坛 墲 𪢸 @@ -506,6 +514,7 @@ 妝 妆 姍 姗 姦 奸 +娙 𫰛 娛 娱 婁 娄 婡 𫝫 @@ -590,6 +599,7 @@ 嵐 岚 嵗 岁 嵼 𡶴 +嵽 𫶇 嵾 㟥 嶁 嵝 嶄 崭 @@ -643,6 +653,7 @@ 廕 荫 廚 厨 廝 厮 +廞 𫷷 廟 庙 廠 厂 廡 庑 @@ -658,6 +669,7 @@ 張 张 強 强 彃 𪪼 +彄 𫸩 彆 别 彈 弹 彌 弥 @@ -865,9 +877,11 @@ 昇 升 時 时 晉 晋 +晛 𬀪 晝 昼 暈 晕 暉 晖 +暐 𬀩 暘 旸 暢 畅 暫 暂 @@ -897,6 +911,7 @@ 梔 栀 梖 𪱷 梘 枧 +梜 𬂩 條 条 梟 枭 梲 棁 @@ -974,6 +989,7 @@ 檻 槛 櫃 柜 櫅 𪲎 +櫍 𬃊 櫓 橹 櫚 榈 櫛 栉 @@ -1050,6 +1066,7 @@ 洩 泄 洶 汹 浹 浃 +浿 𬇙 涇 泾 涗 涚 涼 凉 @@ -1096,6 +1113,7 @@ 滿 满 漁 渔 漊 溇 +漍 𬇹 漚 沤 漢 汉 漣 涟 @@ -1127,6 +1145,7 @@ 澤 泽 澦 滪 澩 泶 +澫 𬇕 澬 𫞚 澮 浍 澱 淀 @@ -1206,13 +1225,16 @@ 熗 炝 熚 𤇹 熡 𤋏 +熰 𬉼 熱 热 熲 颎 熾 炽 +燀 𬊤 燁 烨 燈 灯 燉 炖 燒 烧 +燖 𬊈 燙 烫 燜 焖 營 营 @@ -1292,6 +1314,8 @@ 瑽 𪻐 璉 琏 璊 𫞩 +璕 𬍤 +璗 𬍡 璝 𪻺 璡 琎 璣 玑 @@ -1306,6 +1330,7 @@ 璾 𫞦 璿 璇 瓄 𪻨 +瓅 𬍛 瓊 琼 瓏 珑 瓔 璎 @@ -1424,6 +1449,7 @@ 礄 硚 礆 硷 礎 础 +礐 𬒈 礒 𥐟 礙 碍 礦 矿 @@ -1494,6 +1520,7 @@ 篔 筼 篘 𥬠 篠 筿 +篢 𬕂 篤 笃 篩 筛 篳 筚 @@ -1540,6 +1567,7 @@ 糾 纠 紀 纪 紂 纣 +紃 𬘓 約 约 紅 红 紆 纡 @@ -1560,6 +1588,7 @@ 紛 纷 紜 纭 紝 纴 +紞 𬘘 紟 𫄛 紡 纺 紬 䌷 @@ -1594,6 +1623,7 @@ 給 给 絧 𫄡 絨 绒 +絪 𬘡 絰 绖 統 统 絲 丝 @@ -1604,24 +1634,29 @@ 綀 𦈌 綁 绑 綃 绡 +綄 𬘫 綆 绠 綇 𦈋 綈 绨 綉 绣 綋 𫟄 綌 绤 +綎 𬘩 綏 绥 綐 䌼 綑 捆 經 经 綖 𫄧 綜 综 +綝 𬘭 綞 缍 綟 𫄫 綠 绿 綡 𫟅 綢 绸 綣 绻 +綧 𬘯 +綪 𬘬 綫 线 綬 绶 維 维 @@ -1695,6 +1730,7 @@ 縬 𦈚 縭 缡 縮 缩 +縯 𬙂 縰 𫄳 縱 纵 縲 缧 @@ -1744,6 +1780,7 @@ 繾 缱 繿 䍀 纁 𫄸 +纆 𬙊 纇 颣 纈 缬 纊 纩 @@ -1752,6 +1789,7 @@ 纏 缠 纓 缨 纔 才 +纕 𬙋 纖 纤 纗 𫄹 纘 缵 @@ -1887,6 +1925,7 @@ 蓯 苁 蓴 莼 蓽 荜 +蔄 𬜬 蔔 卜 蔘 参 蔞 蒌 @@ -1944,7 +1983,7 @@ 蘆 芦 蘇 苏 蘊 蕴 -蘋 苹 蘋 +蘋 苹 𬞟 蘚 藓 蘞 蔹 蘟 𦻕 @@ -1953,6 +1992,7 @@ 蘺 蓠 蘿 萝 虆 蔂 +虉 𬟁 處 处 虛 虚 虜 虏 @@ -1962,6 +2002,7 @@ 蛺 蛱 蛻 蜕 蜆 蚬 +蝀 𬟽 蝕 蚀 蝟 猬 蝦 虾 @@ -2076,6 +2117,7 @@ 訊 讯 訌 讧 討 讨 +訏 𬣙 訐 讦 訑 𫍙 訒 讱 @@ -2117,6 +2159,7 @@ 詗 诇 詘 诎 詛 诅 +詝 𬣞 詞 词 詠 咏 詡 诩 @@ -2124,6 +2167,7 @@ 詣 诣 試 试 詩 诗 +詪 𬣳 詫 诧 詬 诟 詭 诡 @@ -2180,12 +2224,14 @@ 諏 诹 諑 诼 諒 谅 +諓 𬣡 論 论 諗 谂 諛 谀 諜 谍 諝 谞 諞 谝 +諟 𬤊 諡 谥 諢 诨 諣 𫍩 @@ -2199,6 +2245,7 @@ 諯 𫍱 諰 𫍰 諱 讳 +諲 𬤇 諳 谙 諴 𫍯 諶 谌 @@ -2246,6 +2293,7 @@ 譎 谲 譏 讥 譑 𫍤 +譓 𬤝 譖 谮 識 识 譙 谯 @@ -2418,6 +2466,7 @@ 軗 𨐅 軛 轭 軜 𫐇 +軝 𬨂 軟 软 軤 轷 軨 𫐉 @@ -2461,6 +2510,7 @@ 輮 𫐓 輯 辑 輳 辏 +輶 𬨎 輷 𫐒 輸 输 輻 辐 @@ -2529,6 +2579,7 @@ 鄖 郧 鄟 𫑘 鄧 邓 +鄩 𬩽 鄭 郑 鄰 邻 鄲 郸 @@ -2547,6 +2598,7 @@ 醫 医 醬 酱 醱 酦 +醲 𬪩 醶 𫑷 釀 酿 釁 衅 @@ -2572,11 +2624,13 @@ 釩 钒 釲 𫟳 釳 𨰿 +釴 𬬩 釵 钗 釷 钍 釹 钕 釺 钎 釾 䥺 +釿 𬬱 鈀 钯 鈁 钫 鈃 钘 @@ -2623,6 +2677,7 @@ 鉆 钻 鉈 铊 鉉 铉 +鉊 𬬿 鉋 铇 鉍 铋 鉑 铂 @@ -2636,9 +2691,12 @@ 鉠 𫓭 鉢 钵 鉤 钩 +鉥 𬬸 鉦 钲 +鉧 𬭁 鉬 钼 鉭 钽 +鉮 𬬹 鉳 锫 鉶 铏 鉷 𫟹 @@ -2688,6 +2746,7 @@ 鋉 𨱈 鋌 铤 鋏 铗 +鋐 𬭎 鋒 锋 鋗 𫓶 鋙 铻 @@ -2708,6 +2767,7 @@ 鋱 铽 鋶 锍 鋸 锯 +鋹 𬬮 鋼 钢 錀 𬬭 錁 锞 @@ -2726,6 +2786,7 @@ 錛 锛 錜 𫓻 錝 𫓽 +錞 𬭚 錟 锬 錠 锭 錡 锜 @@ -2766,6 +2827,7 @@ 鍥 锲 鍩 锘 鍬 锹 +鍭 𬭤 鍮 𨱎 鍰 锾 鍵 键 @@ -2780,6 +2842,7 @@ 鎊 镑 鎌 镰 鎍 𫔅 +鎓 𬭩 鎔 镕 鎖 锁 鎘 镉 @@ -2814,6 +2877,7 @@ 鏉 𨱒 鏌 镆 鏍 镙 +鏏 𬭬 鏐 镠 鏑 镝 鏗 铿 @@ -2834,6 +2898,7 @@ 鏷 镤 鏹 镪 鏺 䥽 +鏻 𬭸 鏽 锈 鏾 𫔌 鐃 铙 @@ -2856,6 +2921,7 @@ 鐦 锎 鐧 锏 鐨 镄 +鐩 𬭼 鐪 𫓺 鐫 镌 鐮 镰 @@ -2940,6 +3006,7 @@ 闆 板 闇 暗 闈 闱 +闉 𬮱 闊 阔 闋 阕 闌 阑 @@ -2970,10 +3037,13 @@ 隉 陧 隊 队 階 阶 +隑 𬮿 隕 陨 際 际 +隤 𬯎 隨 随 險 险 +隮 𬯀 隯 陦 隱 隐 隴 陇 @@ -3044,9 +3114,11 @@ 頑 顽 頒 颁 頓 顿 +頔 𬱖 頗 颇 領 领 頜 颌 +頠 𬱟 頡 颉 頤 颐 頦 颏 @@ -3195,11 +3267,13 @@ 馼 𫘜 駁 驳 駃 𫘝 +駉 𬳶 駊 𫘟 駎 𩧨 駐 驻 駑 驽 駒 驹 +駓 𬳵 駔 驵 駕 驾 駘 骀 @@ -3214,6 +3288,7 @@ 駤 𫘠 駧 𩧲 駩 𩧴 +駪 𬳽 駫 𫘡 駭 骇 駰 骃 @@ -3221,6 +3296,7 @@ 駶 𩧺 駸 骎 駻 𫘣 +駼 𬳿 駿 骏 騁 骋 騂 骍 @@ -3233,12 +3309,14 @@ 騍 骒 騎 骑 騏 骐 +騑 𬴂 騔 𩨀 騖 骛 騙 骗 騚 𩨊 騜 𫘩 騝 𩨃 +騞 𬴃 騟 𩨈 騠 𫘨 騤 骙 @@ -3267,6 +3345,7 @@ 驋 𩧯 驌 骕 驍 骁 +驎 𬴊 驏 骣 驓 𫘯 驕 骄 @@ -3317,11 +3396,13 @@ 魷 鱿 魺 鲄 魽 𫠐 +鮀 𬶍 鮁 鲅 鮃 鲆 鮄 𫚒 鮅 𫚑 鮆 𫚖 +鮈 𬶋 鮊 鲌 鮋 鲉 鮍 鲏 @@ -3335,6 +3416,8 @@ 鮝 鲞 鮞 鲕 鮟 𩽾 +鮠 𬶏 +鮡 𬶐 鮣 䲟 鮤 𫚓 鮦 鲖 @@ -3378,6 +3461,7 @@ 鯴 鲺 鯶 𩽼 鯷 鳀 +鯻 𬶟 鯽 鲫 鯾 𫚣 鯿 鳊 @@ -3387,6 +3471,7 @@ 鰆 䲠 鰈 鲽 鰉 鳇 +鰊 𬶠 鰋 𫚢 鰌 䲡 鰍 鳅 @@ -3414,6 +3499,7 @@ 鰲 鳌 鰳 鳓 鰵 鳘 +鰶 𬶭 鰷 鲦 鰹 鲣 鰺 鲹 @@ -3421,6 +3507,7 @@ 鰼 鳛 鰽 𫚧 鰾 鳔 +鱀 𬶨 鱂 鳉 鱄 𫚋 鱅 鳙 @@ -3434,6 +3521,7 @@ 鱖 鳜 鱗 鳞 鱘 鲟 +鱚 𬶮 鱝 鲼 鱟 鲎 鱠 鲙 @@ -3495,6 +3583,7 @@ 鵂 鸺 鵃 鸼 鵊 𫛥 +鵏 𬷕 鵐 鹀 鵑 鹃 鵒 鹆 @@ -3527,6 +3616,7 @@ 鶗 𫛸 鶘 鹕 鶚 鹗 +鶠 𬸘 鶡 鹖 鶥 鹛 鶦 𫛷 @@ -3536,6 +3626,7 @@ 鶭 𫛯 鶯 莺 鶰 𫛫 +鶱 𬸣 鶲 鹟 鶴 鹤 鶹 鹠 @@ -3557,6 +3648,7 @@ 鷗 鸥 鷙 鸷 鷚 鹨 +鷟 𬸦 鷣 𫜃 鷤 𫛴 鷥 鸶 @@ -3564,6 +3656,7 @@ 鷨 𪉊 鷩 𫜁 鷫 鹔 +鷭 𬸪 鷯 鹩 鷲 鹫 鷳 鹇 @@ -3580,6 +3673,7 @@ 鸋 𫛢 鸌 鹱 鸏 鹲 +鸑 𬸚 鸕 鸬 鸗 𫛟 鸘 鹴 @@ -3629,6 +3723,7 @@ 齔 龀 齕 龁 齗 龂 +齘 𬹼 齙 龅 齜 龇 齟 龃 @@ -3641,12 +3736,14 @@ 齪 龊 齬 龉 齭 𫜭 +齮 𬺈 齯 𫠜 齰 𫜬 齲 龋 齴 𫜮 齶 腭 齷 龌 +齼 𬺓 齾 𫜰 龍 龙 龎 厐 @@ -3678,6 +3775,7 @@ 𡄣 𠵸 𡅏 𠲥 𡅯 𪢖 +𡑍 𫭼 𡑭 𡋗 𡓁 𪤄 𡓾 𡋀 @@ -3757,6 +3855,7 @@ 𥖅 𥐯 𥖲 𪿞 𥗇 𪿵 +𥗽 𬒗 𥜐 𫀓 𥜰 𫀌 𥞵 𥞦 diff --git a/dictionary/TSPhrases.txt b/dictionary/TSPhrases.txt index dee9754..06e6596 100644 --- a/dictionary/TSPhrases.txt +++ b/dictionary/TSPhrases.txt @@ -29,6 +29,7 @@ 乾隆 乾隆 乾隆年間 乾隆年间 乾隆皇帝 乾隆皇帝 +二噁英 二𫫇英 以免藉口 以免借口 以功覆過 以功复过 侔德覆載 侔德复载 @@ -131,7 +132,6 @@ 申覆 申复 畢昇 毕昇 發覆 发复 -盼既示覆 盼既示复 瞭如 了如 瞭如指掌 了如指掌 瞭望 瞭望 diff --git a/dictionary/TWPhrasesIT.txt b/dictionary/TWPhrasesIT.txt new file mode 100644 index 0000000..8960ce8 --- /dev/null +++ b/dictionary/TWPhrasesIT.txt @@ -0,0 +1,388 @@ +PN結 PN接面 +SQL注入 SQL隱碼攻擊 +SQL注入攻擊 SQL隱碼攻擊 +U盤 隨身碟 +三極管 三極體 +下拉列表 下拉選單 +並行計算 平行計算 +中間件 中介軟體 +串口 串列埠 +串行 序列 +串行端口 串列埠 +主引導記錄 主開機記錄 +主板 主機板 +二極管 二極體 +互聯網 網際網路 +交互 互動 +交互式 互動式 +人工智能 人工智慧 +代碼 程式碼 代碼 +代碼頁 內碼表 +以太網 乙太網 +任務欄 工作列 +任務管理器 工作管理員 +仿真 模擬 +位圖 點陣圖 +低級 低階 低級 +便攜式 行動式 攜帶型 +保存 儲存 +信噪比 訊雜比 +信息 資訊 +信息安全 資訊保安 +信息技術 資訊科技 +信息論 資訊理論 +信號 訊號 信號 +信道 通道 +傳感 感測 +像素 畫素 +僞代碼 虛擬碼 +優先級 優先順序 +優化 最佳化 +元數據 後設資料 +元編程 超程式設計 +光標 游標 +光盤 光碟 +光驅 光碟機 +免提 擴音 +內存 記憶體 +內核 核心 +內置 內建 +內聯函數 行內函數 +全局 全域性 +全角 全形 +兼容 相容 +冒泡排序 氣泡排序 +函數 函式 +函數式編程 函數語言程式設計 +刀片服務器 刀鋒伺服器 +分佈式 分散式 +分區 分割槽 +分辨率 解析度 +刷新 重新整理 +刻錄 燒錄 +前綴 字首 +剪切 剪下 +剪貼板 剪貼簿 +創建 建立 +加載 載入 +半角 半形 +博客 部落格 +卸載 解除安裝 +原代碼 原始碼 +參數 引數 +參數表 參數列 +句柄 控制代碼 +可視化 視覺化 +呼出 撥出 +呼叫轉移 來電轉駁 +命令式編程 指令式程式設計 +命令行 命令列 +命名空間 名稱空間 +哈希 雜湊 +單片機 微控制器 +回調 回撥 +固件 韌體 +圖像 影象 +圖庫 相簿 +圖標 圖示 +在線 線上 +地址 地址 位址 +地址欄 位址列 +城域網 都會網路 +堆棧 堆疊 +場效應管 場效電晶體 +壁紙 桌布 壁紙 +外置 外接 +外鍵 外來鍵 +多任務 多工 +多態 多型 +多線程 多執行緒 +字庫 字型檔 +字段 欄位 +字符 字元 +字符串 字串 +字符集 字符集 +字節 位元組 +字體 字型 +存儲 儲存 +存盤 存檔 +宏 宏 巨集 +宏內核 單核心 +寄存器 暫存器 +密鑰 金鑰 +實例 例項 實例 +實模式 真實模式 +審覈 稽覈 +寫保護 防寫 +寬帶 寬頻 +尋址 定址 +對話框 對話方塊 +對象 物件 對象 +導入 匯入 +導出 匯出 +局域網 區域網 +局部 區域性 +屏幕 螢幕 +屏蔽 遮蔽 +嵌套 巢狀 +布爾 布林 +帶寬 頻寬 +引導程序 載入程式 +彙編 彙編 組譯 +彙編語言 組合語言 +後綴 字尾 +循環 迴圈 循環 +性價比 價效比 +性能 效能 +截取 擷取 +截屏 截圖 +打印 列印 +打印機 印表機 +打開 開啟 打開 +批量 批次 +拋出 丟擲 +拷貝 複製 +持久性 永續性 +指針 指標 +捲積 摺積 +掃描儀 掃描器 +掛斷 結束通話 +採樣 取樣 +採樣率 取樣率 +接口 介面 +控件 控制元件 +插件 外掛 +搜索 搜尋 +操作數 運算元 +操作符 運算子 +操作系統 作業系統 +擴展 擴充套件 +擴展名 副檔名 +支持 支援 +支持者 支持者 +散列 雜湊 +數字 數字 數位 +數字印刷 數位印刷 +數字電子 數位電子 +數字電路 數位電路 +數據 資料 +數據倉庫 資料倉儲 +數據報 資料包 +數據庫 資料庫 +數據挖掘 資料探勘 +數據源 資料來源 +數組 陣列 +文件 檔案 +文件名 檔名 +文件夾 資料夾 +文件擴展名 副檔名 +文字處理 文書處理 +文本 文字 +文檔 文件 +映射 對映 +時分多址 分時多重進接 +時分複用 分時多工 +時鐘頻率 時脈頻率 +晶閘管 閘流體 +晶體管 電晶體 +智能 智慧 +最終用戶 終端使用者 +有損壓縮 有失真壓縮 +服務器 伺服器 +本地代碼 原生代碼 +析構函數 解構函式 +枚舉 列舉 +查找 查詢 +查看 檢視 +桌面型 桌上型 +構造函數 建構函式 +標識符 識別符號 +模塊 模組 +模擬 模擬 類比 +模擬電子 類比電子 +模擬電路 類比電路 +權限 許可權 +正則表達式 正規表示式 +死機 宕機 +殺毒 防毒 +比特 位元 +比特幣 比特幣 +比特率 位元率 +波分複用 波長分波多工 +消息 訊息 消息 +添加 新增 +源代碼 原始碼 +源文件 原始檔 +源碼 原始碼 +溢出 溢位 +滾動條 捲軸 +演示文稿 簡報 +激光 鐳射 +激活 啟用 +無損壓縮 無失真壓縮 +物理內存 實體記憶體 +物理地址 實體地址 +狀態欄 狀態列 +用戶 使用者 +用戶名 使用者名稱 +界面 介面 +異步 非同步 +登錄 登入 +發佈 釋出 +發送 傳送 +盤片 碟片 +盤符 磁碟機代號 +目標代碼 目的碼 +相冊 相簿 +矢量 向量 +知識產權 智慧財產權 +短信 簡訊 +硬件 硬體 +硬盤 硬碟 +碼分多址 分碼多重進接 +碼率 位元速率 +磁盤 磁碟 +磁道 磁軌 +社區 社羣 社區 +移動硬盤 行動硬碟 +移動網絡 行動網路 +移動資料 行動資料 +移動通信 行動通訊 +移動電話 行動電話 +程序 程式 +程序員 程式設計師 +空分多址 分空間多重進接 +空分複用 空間多工 +窗口 視窗 +端口 埠 +筆記本電腦 膝上型電腦 +算子 運算元 +算法 演算法 +範式 正規化 +粘貼 貼上 粘貼 +紅心大戰 傷心小棧 +組件 元件 +綁定 繫結 +網上鄰居 網路上的芳鄰 +網卡 網絡卡 +網吧 網咖 +網絡 網路 +網關 閘道器 +線程 執行緒 +編程 程式設計 +編程語言 程式語言 +緩存 快取 +縮略圖 縮圖 +縮進 縮排 +總線 匯流排 +缺省 預設 +聯繫 聯絡 +聯繫歷史 通話記錄 +聲卡 音效卡 +聲明 宣告 +脫機 離線 +腳本 指令碼 +自動轉屏 自動旋轉螢幕 +臺式機 桌上型電腦 +航天飛機 太空梭 +芯片 晶片 +花屏 破圖 +菜單 選單 菜單 +萬維網 全球資訊網 +藍屏 藍色畫面 +藍牙 藍芽 +虛函數 虛擬函式 +虛擬機 虛擬機器 +虛擬機器 虛擬機器 +表達式 表示式 運算式 +複印 影印 +複選按鈕 覈取按鈕 +複選框 覈取方塊 +視圖 檢視 +視頻 影片 視訊 +視頻會議 視訊會議 +視頻通話 視訊通話 +解釋器 直譯器 +觸摸 觸控 +觸摸屏 觸控式螢幕 +計算機安全 電腦保安 +計算機科學 電腦科學 +訪問 訪問 存取 +設備 裝置 +設置 設定 +註冊機 序號產生器 +註冊表 登錄檔 +註銷 登出 +調制 調變 +調度 排程 +調用 呼叫 +調色板 調色盤 +調製解調器 數據機 +調試 除錯 偵錯 +調試器 偵錯程式 +變量 變數 +軟件 軟體 +軟驅 軟碟機 +轉義字符 跳脫字元 +通信 通訊 +通訊卡 通話卡 +通配符 萬用字元 +連接 連線 +連接器 聯結器 +進制 進位制 +進程 程序 進程 +運算符 運算子 +運行 執行 +過程式編程 程序式程式設計 +遞歸 遞迴 +遠程 遠端 +適配器 介面卡 +邏輯門 邏輯閘 +重命名 重新命名 +重裝 重灌 +重載 過載 +金屬氧化物半導體 金氧半導體 +錄像 錄影 +鏈接 連結 +鏈表 連結串列 +鏡像 映象 +門戶網站 入口網站 +門電路 閘電路 +閃存 快閃記憶體 +關係數據庫 關聯式資料庫 +隊列 佇列 +集成 整合 +集成電路 積體電路 +集羣 叢集 +雲存儲 雲端儲存 +雲計算 雲端計算 +面向對象 物件導向 +面向過程 程序導向 +音頻 音訊 +頁眉 頁首 +頁腳 頁尾 +項目 專案 +預處理器 前處理器 +頭文件 標頭檔案 +頻分多址 分頻多重進接 +頻分複用 分頻多工 +類型 型別 +類模板 類别範本 +顯像管 映象管 +顯卡 顯示卡 +顯存 視訊記憶體 +飛行模式 飛航模式 +首席信息官 資訊長 +首席執行官 執行長 +首席技術官 技術長 +首席運營官 營運長 +高性能計算 高效能運算 +高清 高畫質 +高端 高階 進階 +高級 高階 進階 高級 +高速緩存 快取記憶體 +黑客 駭客 +默認 預設 +默認值 預設值 +點擊 點選 +鼠標 滑鼠 diff --git a/dictionary/TWPhrasesName.txt b/dictionary/TWPhrasesName.txt new file mode 100644 index 0000000..6437a55 --- /dev/null +++ b/dictionary/TWPhrasesName.txt @@ -0,0 +1,84 @@ +乍得 查德 +也門 葉門 +仙童半導體 快捷半導體 +伯利茲 貝里斯 +佛得角 維德角 +傅里葉 傅立葉 +克羅地亞 克羅埃西亞 +列支敦士登 列支敦斯登 +利比里亞 賴比瑞亞 +加納 迦納 +加蓬 加彭 +博茨瓦納 波札那 +卡塔爾 卡達 +危地馬拉 瓜地馬拉 +厄瓜多爾 厄瓜多 +厄立特里亞 厄利垂亞 +吉布堤 吉布地 +哈薩克斯坦 哈薩克 +哥斯達黎加 哥斯大黎加 +喫茶小舖 喫茶小舖 +圖瓦盧 吐瓦魯 +土庫曼斯坦 土庫曼 +圭亞那 蓋亞那 +坦桑尼亞 坦尚尼亞 +埃塞俄比亞 衣索比亞 +基里巴斯 吉里巴斯 +塔吉克斯坦 塔吉克 +塞拉利昂 獅子山 +塞浦路斯 塞普勒斯 +塞舌爾 塞席爾 +多米尼加 多明尼加 +安提瓜和巴布達 安地卡及巴布達 +尼日利亞 奈及利亞 +尼日爾 尼日 +岡比亞 甘比亞 +巴巴多斯 巴貝多 +巴布亞新幾內亞 巴布亞紐幾內亞 +布基納法索 布吉納法索 +布隆迪 蒲隆地 +帕勞 帛琉 +幾內亞比紹 幾內亞比索 +意大利 義大利 +所羅門羣島 索羅門羣島 +文萊 汶萊 +斯威士蘭 史瓦濟蘭 +斯洛文尼亞 斯洛維尼亞 +新西蘭 紐西蘭 +格林納達 格瑞那達 +格魯吉亞 喬治亞 +歐拉 尤拉 +毛里塔尼亞 茅利塔尼亞 +毛里求斯 模里西斯 +沙特阿拉伯 沙烏地阿拉伯 +波斯尼亞黑塞哥維那 波士尼亞赫塞哥維納 +津巴布韋 辛巴威 +洪都拉斯 宏都拉斯 +溫納圖萬 那杜 +烏茲別克斯坦 烏茲別克 +特立尼達和多巴哥 千里達及托巴哥 +瑙魯 諾魯 +瓦努阿圖 萬那杜 +盧旺達 盧安達 +科摩羅 葛摩 +科特迪瓦 象牙海岸 +突尼斯 突尼西亞 +純喫茶 純喫茶 +索馬里 索馬利亞 +老撾 寮國 +聖基茨和尼維斯 聖克里斯多福及尼維斯 +聖文森特和格林納丁斯 聖文森及格瑞那丁 +聖盧西亞 聖露西亞 +聖馬力諾 聖馬利諾 +肯尼亞 肯亞 +莫桑比克 莫三比克 +萊索托 賴索托 +萬象 永珍 +蘇里南 蘇利南 +貝寧 貝南 +贊比亞 尚比亞 +阿塞拜疆 亞塞拜然 +阿拉伯聯合酋長國 阿拉伯聯合大公國 +香農 夏農 +馬爾代夫 馬爾地夫 +馬里共和國 馬利共和國 diff --git a/dictionary/TWPhrasesOther.txt b/dictionary/TWPhrasesOther.txt new file mode 100644 index 0000000..22b3b89 --- /dev/null +++ b/dictionary/TWPhrasesOther.txt @@ -0,0 +1,37 @@ +元音 母音 +冰棍 冰棒 +出租車 計程車 +咖喱 咖哩 +塑料 塑膠 +奔馳 賓士 +奶酪 乳酪 +幾率 機率 +方便麪 泡麵 速食麵 +李彥宏 李彥宏 +概率 機率 +海內存知己 海內存知己 +涼菜 冷盤 +的士 計程車 +砹 砈 +硅 矽 +程序不正義 程序不正義 +程序正義 程序正義 +空氣淨化器 空氣清淨機 +納米 奈米 +自行車 腳踏車 +詞組 片語 +蹦極 高空彈跳 +輔音 子音 +通過 透過 通過 +酰 醯 +鈁 鍅 +鈈 鈽 +錇 鉳 +鍀 鎝 +鎄 鑀 +鎇 鋂 +鎿 錼 +鐦 鉲 +鑥 鎦 +黃宏 黃宏 +借記卡 簽帳金融卡 diff --git a/merge-data.sh b/merge-data.sh new file mode 100755 index 0000000..aab7a7a --- /dev/null +++ b/merge-data.sh @@ -0,0 +1,11 @@ +# Merge addition-dictionary/*.txt into dictionary/*.txt +cp -r tmp/OpenCC-master/data/dictionary/* dictionary/ +cp -r tmp/OpenCC-master/data/config/* config/ +git diff dictionary/ + +for x in addition-dictionary/*.txt; do + target="dictionary/$(basename $x .txt).txt" + echo "Merging $x to $target" + + cat $x >> $target +done \ No newline at end of file diff --git a/opencc_test.go b/opencc_test.go index 1402f64..a580d32 100644 --- a/opencc_test.go +++ b/opencc_test.go @@ -1,6 +1,7 @@ package opencc import ( + "fmt" "testing" ) @@ -27,9 +28,20 @@ func TestConvert_s2t(t *testing.T) { `香菸(英語:Cigarette),為菸草製品的一種。記憶體是一種很常見及常用的電腦輸入裝置。`: `香菸(英語:Cigarette),為菸草製品的一種。記憶體是一種很常見及常用的電腦輸入裝置。`, `乾隆爷是谁的干爷爷?乾爷爷吗?`: `乾隆爺是誰的幹爺爺?乾爺爺嗎?`, `2021 年汽车零部件板块市值涨幅跑输乘用车板块,估值相对滞涨,主要由于市场对零部件行业存两大担忧:大宗商品、运费上涨致利润承压;全球芯片紧缺致下游排产低于预期。`: `2021 年汽車零部件板塊市值漲幅跑輸乘用車板塊,估值相對滯漲,主要由於市場對零部件行業存兩大擔憂:大宗商品、運費上漲致利潤承壓;全球芯片緊缺致下游排產低於預期。`, + `高峰`: `高峰`, + `什麼`: `什麼`, + `讲下`: `講吓`, + `抬头`: `抬頭`, + `回流`: `回流`, + `1 厘 2 厘钱`: `1 厘 2 厘錢`, + `公厘`: `公厘`, + `厘米`: `厘米`, } - s2t, _ := New("s2t") + s2t, err := New("s2t") + if err != nil { + panic(fmt.Sprintf("Init s2t failed %s", err)) + } assertCases(t, s2t, cases) } @@ -38,12 +50,28 @@ func TestConvert_s2hk_finance(t *testing.T) { cases := map[string]string{ "保证金": "按金", "保證金": "按金", + `佣金`: `佣金`, "募集資金": "籌集資金", "套利交易": "對沖", "下周开始公开配售": "下週開始公開招股", } - s2hk, _ := New("s2hk-finance") + s2hk, err := New("s2hk-finance") + if err != nil { + panic(fmt.Sprintf("Init s2hk-finance failed %s", err)) + } assertCases(t, s2hk, cases) } + +// Special hotfix in this project +func TestSelfSpecialHotfix(t *testing.T) { + cc, _ := New("s2hk") + + cases := map[string]string{ + "来自于汇丰,以及汇丰银行,汇入的款项": "來自於滙豐,以及滙豐銀行,匯入的款項", + "汇业银行集团": "滙業銀行集團", + } + + assertCases(t, cc, cases) +} diff --git a/tests/fixtures/html-raw.txt b/tests/fixtures/html-raw.txt index 66e0bc6..32ffdbb 100644 --- a/tests/fixtures/html-raw.txt +++ b/tests/fixtures/html-raw.txt @@ -53,9 +53,4 @@

数据来源:Wind、海豚投研

长期视角下,按 DCF 模型估值,基于未来五年收入复合增速 14%,归母净利润复合增速 23.3%,折现率 10.55%,以及永续增长率 3.0%,对应华住价位大致 69 美元,较当前仍有充分空间(仅供参考,不做建议)。

表格描述已自动生成

数据来源:海豚投研测算

短期来看,受疫情反复,开店放缓节奏,2021 年上半年华住净开酒店数量同比、环比均有放缓趋势,同时公司在第二季度财报中也下调今年全年收入增长指引,短期股价仍可能面对悲观情绪上的杀跌。

-

不过,海豚君鉴于公司中长期基本面稳健,依旧看好华住作为中国酒店龙头在结构升级、连锁提升背景下的成长机会。

后续,海豚君还会持续跟进华住的业绩表现,敬请关注。

-

高峰

-

佣金

-

什么

-

1 厘

-

讲下

+

不过,海豚君鉴于公司中长期基本面稳健,依旧看好华住作为中国酒店龙头在结构升级、连锁提升背景下的成长机会。

后续,海豚君还会持续跟进华住的业绩表现,敬请关注。

\ No newline at end of file diff --git a/tests/fixtures/html-s2hk-finance.txt b/tests/fixtures/html-s2hk-finance.txt index 25dbc5a..806e5e4 100644 --- a/tests/fixtures/html-s2hk-finance.txt +++ b/tests/fixtures/html-s2hk-finance.txt @@ -1,4 +1,4 @@ -
文本描述已自動生成

本文為海豚投研原創文章,未經授權,不得轉載;建議感興趣的用户添加微信號“dolphinR123”加入海豚投研圈,一起切磋全球資產投資觀點!

在上篇《華住集團(上):酒店界“國貨崛起”》中,海豚君梳理了華住集團加盟為主的商業模式、當前中國酒店連鎖化率的情況以及華住集團的多品牌矩陣戰略,公司中長期依靠下沉市場 + 併購/存量改造做中高端升級 + 軟品牌吸收非標擴大市佔率。

在本篇文章中,海豚君主要來解決以下問題:

1、華住會員模式是如何實現高效運作的?

2、落到投資上,華住是國內市佔率第二大酒店集團(第一名為錦江酒店),但説到總市值,華住已把第二名遠遠甩在後面,當前市場給予估值標準是甚麼?

  1. 會員體系構網絡,自有流量廣積糧

做酒店生意,店面房間要提前盤下來裝修好,前置的固定成本高,只有在客人不斷入駐的入駐的情況下,才能大幅攤薄固定投入,提高經營槓桿。

+
文本描述已自動生成

本文為海豚投研原創文章,未經授權,不得轉載;建議感興趣的用户添加微信號“dolphinR123”加入海豚投研圈,一起切磋全球資產投資觀點!

在上篇《華住集團(上):酒店界“國貨崛起”》中,海豚君梳理了華住集團加盟為主的商業模式、當前中國酒店連鎖化率的情況以及華住集團的多品牌矩陣戰略,公司中長期依靠下沉市場 + 併購/存量改造做中高端升級 + 軟品牌吸收非標擴大市佔率。

在本篇文章中,海豚君主要來解決以下問題:

1、華住會員模式是如何實現高效運作的?

2、落到投資上,華住是國內市佔率第二大酒店集團(第一名為錦江酒店),但説到總市值,華住已把第二名遠遠甩在後面,當前市場給予估值標準是什麼?

  1. 會員體系構網絡,自有流量廣積糧

做酒店生意,店面房間要提前盤下來裝修好,前置的固定成本高,只有在客人不斷入駐的入駐的情況下,才能大幅攤薄固定投入,提高經營槓桿。

而就是本身又屬“本地位置異地客流”的生意,除了極少數的 Walk-in 客流和小比例的本地熟人生意,絕大多數客流還是要靠外地人的出行住宿,異地客源的穩定集中獲客至關重要,酒店天然電商化訴求更強。

簡單來説,酒店後端是精細化和數字化經營持續產生的降本增效,而前端則是一個異地流量生意,收入端的提升更容易帶來經營槓桿的釋放,因此獲客來源的研究至關重要。

在吸引異地客流上,相比與實物電商商家到現在才逐步注意到“流量產權”問題,想要建立自己的私域流量,避免被公域流量反覆收割。

@@ -53,9 +53,4 @@

數據來源:Wind、海豚投研

長期視角下,按 DCF 模型估值,基於未來五年收入複合增速 14%,歸母淨利潤複合增速 23.3%,折現率 10.55%,以及永續增長率 3.0%,對應華住價位大致 69 美元,較當前仍有充分空間(僅供參考,不做建議)。

表格描述已自動生成

數據來源:海豚投研測算

短期來看,受疫情反覆,開店放緩節奏,2021 年上半年華住淨開酒店數量同比、環比均有放緩趨勢,同時公司在第二季度財報中也下調今年全年收入增長指引,短期股價仍可能面對悲觀情緒上的殺跌。

-

不過,海豚君鑑於公司中長期基本因素穩健,依舊看好華住作為中國酒店龍頭在結構升級、連鎖提升背景下的成長機會。

後續,海豚君還會持續跟進華住的業績表現,敬請關注。

-

高峰

-

佣金

-

甚麼

-

1 厘

-

講吓

+

不過,海豚君鑑於公司中長期基本因素穩健,依舊看好華住作為中國酒店龍頭在結構升級、連鎖提升背景下的成長機會。

後續,海豚君還會持續跟進華住的業績表現,敬請關注。

\ No newline at end of file diff --git a/tests/fixtures/html-s2t.txt b/tests/fixtures/html-s2t.txt index ec2993e..0b15d33 100644 --- a/tests/fixtures/html-s2t.txt +++ b/tests/fixtures/html-s2t.txt @@ -1,4 +1,4 @@ -
文本描述已自動生成

本文爲海豚投研原創文章,未經授權,不得轉載;建議感興趣的用戶添加微信號“dolphinR123”加入海豚投研圈,一起切磋全球資產投資觀點!

在上篇《華住集團(上):酒店界“國貨崛起”》中,海豚君梳理了華住集團加盟爲主的商業模式、當前中國酒店連鎖化率的情況以及華住集團的多品牌矩陣戰略,公司中長期依靠下沉市場 + 併購/存量改造做中高端升級 + 軟品牌吸收非標擴大市佔率。

在本篇文章中,海豚君主要來解決以下問題:

1、華住會員模式是如何實現高效運作的?

2、落到投資上,華住是國內市佔率第二大酒店集團(第一名爲錦江酒店),但說到總市值,華住已把第二名遠遠甩在後面,當前市場給予估值標準是甚麼?

  1. 會員體系構網絡,自有流量廣積糧

做酒店生意,店面房間要提前盤下來裝修好,前置的固定成本高,只有在客人不斷入駐的入駐的情況下,才能大幅攤薄固定投入,提高經營槓桿。

+
文本描述已自動生成

本文爲海豚投研原創文章,未經授權,不得轉載;建議感興趣的用戶添加微信號“dolphinR123”加入海豚投研圈,一起切磋全球資產投資觀點!

在上篇《華住集團(上):酒店界“國貨崛起”》中,海豚君梳理了華住集團加盟爲主的商業模式、當前中國酒店連鎖化率的情況以及華住集團的多品牌矩陣戰略,公司中長期依靠下沉市場 + 併購/存量改造做中高端升級 + 軟品牌吸收非標擴大市佔率。

在本篇文章中,海豚君主要來解決以下問題:

1、華住會員模式是如何實現高效運作的?

2、落到投資上,華住是國內市佔率第二大酒店集團(第一名爲錦江酒店),但說到總市值,華住已把第二名遠遠甩在後面,當前市場給予估值標準是什麼?

  1. 會員體系構網絡,自有流量廣積糧

做酒店生意,店面房間要提前盤下來裝修好,前置的固定成本高,只有在客人不斷入駐的入駐的情況下,才能大幅攤薄固定投入,提高經營槓桿。

而就是本身又屬“本地位置異地客流”的生意,除了極少數的 Walk-in 客流和小比例的本地熟人生意,絕大多數客流還是要靠外地人的出行住宿,異地客源的穩定集中獲客至關重要,酒店天然電商化訴求更強。

簡單來說,酒店後端是精細化和數字化經營持續產生的降本增效,而前端則是一個異地流量生意,收入端的提升更容易帶來經營槓桿的釋放,因此獲客來源的研究至關重要。

在吸引異地客流上,相比與實物電商商家到現在才逐步注意到“流量產權”問題,想要建立自己的私域流量,避免被公域流量反覆收割。

@@ -53,9 +53,4 @@

數據來源:Wind、海豚投研

長期視角下,按 DCF 模型估值,基於未來五年收入複合增速 14%,歸母淨利潤複合增速 23.3%,折現率 10.55%,以及永續增長率 3.0%,對應華住價位大致 69 美元,較當前仍有充分空間(僅供參考,不做建議)。

表格描述已自動生成

數據來源:海豚投研測算

短期來看,受疫情反覆,開店放緩節奏,2021 年上半年華住淨開酒店數量同比、環比均有放緩趨勢,同時公司在第二季度財報中也下調今年全年收入增長指引,短期股價仍可能面對悲觀情緒上的殺跌。

-

不過,海豚君鑑於公司中長期基本面穩健,依舊看好華住作爲中國酒店龍頭在結構升級、連鎖提升背景下的成長機會。

後續,海豚君還會持續跟進華住的業績表現,敬請關注。

-

高峰

-

佣金

-

甚麼

-

1 厘

-

講吓

+

不過,海豚君鑑於公司中長期基本面穩健,依舊看好華住作爲中國酒店龍頭在結構升級、連鎖提升背景下的成長機會。

後續,海豚君還會持續跟進華住的業績表現,敬請關注。

\ No newline at end of file diff --git a/tests/s2t_test.go b/tests/s2t_test.go index b1001a0..ddb5f18 100644 --- a/tests/s2t_test.go +++ b/tests/s2t_test.go @@ -58,25 +58,3 @@ func TestFinance_s2hk_finance(t *testing.T) { } } - -func assertCases(t *testing.T, cases map[string]string) { - t.Helper() - cc, _ := opencc.New("s2hk") - - for raw, expected := range cases { - out, _ := cc.Convert(raw) - if strings.TrimSpace(expected) != strings.TrimSpace(out) { - t.Errorf("expected %s, got %s", expected, out) - } - } -} - -// Special hotfix in this project -func TestSelfSpecialHotfix(t *testing.T) { - cases := map[string]string{ - "来自于汇丰,以及汇丰银行,汇入的款项": "來自於滙豐,以及滙豐銀行,匯入的款項", - "汇业银行集团": "滙業銀行集團", - } - - assertCases(t, cases) -}