Freepal: A Large Collection of Deep Lexico-Syntactic Patterns for Relation Extraction

テキストマイニング 自然言語処理

目的

コーパス中の一文に現れた二つの名詞の関係を抽出する。

手法

現れた二つの名詞 A, B について、

実装

http://free-pal.appspot.com/#show で公開されてる。

の二つがある。 前者は、なんかサーバーのエラーで動かなかった。 後者は、freebaseにある関係から、 その関係はどんなパターンで抽出できるかを列挙してくれる。

例えば、 education.field_of_study.students_majoring..education.education.specialization は、

とかパターンが19個出てきて、 各々に、 Counts, Entropy, Confidence が情報として付いてる。