-
Notifications
You must be signed in to change notification settings - Fork 3
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
「することが可能」の類似表現 #7
Comments
#7 の一部に対処しました. - "することを可能" - "することをできる" の検出を - "すること[助詞]可能" - "すること[助詞]できる" に拡充しました. またREADMEも修正しました. #6 と同様にtechnological-book-corpus-jaを使った[比較結果](https://gist.github.com/shirayu/0507909cb8b5f3b689d46fcd29b489e4)も添付します.
残りは
の対応です. また合わせて読点の挿入にも対応できればと思います.
「不」や「、」の挿入を既存のルールの記述に微修正することで対応できればよいのですが,なにか良い方法は無いでしょうか? |
方法としては2種類ありますね。
どっちがいいかはちょっと悩みどころですね。 Tokenベースの正規表現のようなDSLって確立されてない印象なんですよね。 |
ありがとうございます. |
まあ、おそらく最終的には前者のパターンで実装することにはなる気はしています。 そういえば、正規表現で大雑把にマッチ + Tokenベースで厳密チェック という趣旨のものを以前書いてたのを思い出しました。(これは辞書で表現するというよりは、コードでマッチングを書いていく方向かな) |
ひとまず,マッチしない場合はskipできるような仕組みを入れました |
「することが可能」の冗長性は,
等でも同様にあります.
現在は
ことが{可能, できる}
にマッチしますが,こと + { が,は,も } + { できる,出来る,可能,不可能}
にマッチするように拡充できると考えます.昔書いた論文を思い出したのでissueとして立てます.
「こと」を含む可能形は https://hayashibe.jp/publications/NL224.pdf のp.3の
表2
参照The text was updated successfully, but these errors were encountered: