読者です 読者をやめる 読者になる 読者になる

Screaming Loud

研究・プログラミングなど気づいたことをメモをしています

KNPの係り受け関係について

KNPを使ったときのまとめをメモ

%juman | knp -tab # こっちがdefault
%juman | knp -tab -dpnd

'-dpnd'を付けたときの係り受け先の見方が分からなかったのでメモ.
'-dpnd'をつけた場合,格関係の解析*1
を行わない.

係り受け関係の見方

KNP独自の基本句という形式で番号が先頭から割り振られる.
今回の例文では
「太郎は:0,次郎と:1,花子の:2,和:3,英:4,辞書を:5,奪った:6,あとで:7,服を:8,投げた:9」と割り振られる.('-print-num'オプションをつけると番号が表示される.)

  • '*'が付いている行が文節情報
  • '+'が付いている行が基本句情報

今回は基本句に関してみていく.

解析結果

例として「太郎は次郎と花子の和英辞書を奪ったあとで服を投げた」という変な文を解析してみました.
その「和英辞書を奪った」の解析結果を抜き出しました.

-tab -dpnd
* 4D <ヲ><助詞><体言><係:ヲ格><区切:0-0><格要素><連用要素><正規化代表表記:和/わ+英/えい+辞書/じしょ><主辞代表表記:辞書/じしょ>
+ 4D <文節内><係:文節内><体言><一文字漢字><名詞項候補><先行詞候補><正規化代表表記:和/わ>
和 わ 和 名詞 6 普通名詞 1 * 0 * 0 "代表表記:和/わ 漢字読み:音 カテゴリ:抽象物"
<代表表記:和/わ><漢字読み:音><カテゴリ:抽象物><正規化代表表記:和/わ><漢字><かな漢字><名詞相当語><自立><内容語><タグ単位始><文節始>
+ 5D <文節内><係:文節内><地名><体言><一文字漢字><名詞項候補><先行詞候補><SM-場所><正規化代表表記:英/えい>
英 えい 英 名詞 6 地名 4 * 0 * 0 "代表表記:英/えい 地名:国:略称:英国"
<代表表記:英/えい><地名:国:略称:英国><正規化代表表記:英/えい><漢字><かな漢字><名詞相当語><自立><複合←><内容語><タグ単位始><固有キー>
+ 6D <ヲ><助詞><体言><係:ヲ格><区切:0-0><格要素><連用要素><名詞項候補><先行詞候補><正規化代表表記:辞書/じしょ><Wikipediaエントリ:和英辞書><Wikipediaリダイレクト:和英辞典>
辞書 じしょ 辞書 名詞 6 普通名詞 1 * 0 * 0 "代表表記:辞書/じしょ カテゴリ:抽象物 ドメイン:教育・学習"
<代表表記:辞書/じしょ><カテゴリ:抽象物><ドメイン:教育・学習><正規化代表表記:辞書/じしょ><Wikipediaエントリ:和英辞書:6-8><Wikipediaリダイレクト:和英辞典:6-8><漢字><かな
漢字><名詞相当語><自立><複合←><内容語><タグ単位始><文節主辞>
を を を 助詞 9 格助詞 1 * 0 * 0 NIL <かな漢字><ひらがな><付属>
* 5D <時制-過去><連体修飾><用言:動><係:連格><レベル:B><区切:0-5><ID:(動詞連体形副名)><連体節><動態述語><正規化代表表記:奪う/うばう><主辞代表表記:奪う/うばう>
+ 7D <時制-過去><連体修飾><用言:動><係:連格><レベル:B><区切:0-5><ID:(動詞連体形副名)><連体節><動態述語><正規化代表表記:奪う/うばう><用言代表表記:奪う/うばう>
奪った うばった 奪う 動詞 2 * 0 子音動詞ワ行 12 タ形 10 "代表表記:奪う/うばう 反義:動詞:与える/あたえる"
<代表表記:奪う/うばう><反義:動詞:与える/あたえる><正規化代表表記:奪う/うばう><かな漢字><活用語><自立><内容語><タグ単位始><文節始><文節主辞>
  • Dが通常の係り受け
  • Pが並列構造

となっている.
例えば,「辞書を」は'+6D'になっている.
よって6の「奪った」に係っていることがわかる.

*1:格解析:「キリンと象,どっちが鼻が長い?」などのように格が省略された時,格解析を行っていないと上手く評価できないらしい