語や文の類似度を求める
概念体系と概念類似度を計算
Aya辞書は、約40万概念からなるEDR辞書※1に約15万の新概念を追加した約55万概念からなる電子辞書です。これらの概念は概念体系木中にシソーラスのように上位下位概念関係で木構造になっています(正しくは、概念は複数の上位概念を持つ多重継承を許しているので束になります)。2つの概念の類似性は、このシソーラス上でどの程度近くに存在するかをもとに図の概念類似度として計算できます。この概念をAyaでは語意として用いるので、2つの語意の類似性を概念類似度として0から1の間の数値として求められます。
※1:EDRは、9年間の国家的プロジェクトにより開発された電子辞書で、国立研究開発法人情報通信研究機構が管理している。
文節の役割を表わす深層格
係り受け関係の役割を表わす35種の深層格日本語の文では、文末の文節以外の各文節は他のどれか文節に掛っています(依存しています)。この際、係り側文節が“動作主体”や“原因”...
続きを読む文の意味的な類似度を計算
文の意味的な類似度を計算2文に対して、それぞれの文が表す意味の類似度を、それぞれの意味グラフ間で、語意の類似度が閾値(例:0.8)以上の文節ペア(例:「答えを」と「解を」...
続きを読む