自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
論文
ウェブコーパスと検索システムを利用した推量副詞とモダリティ形式の遠隔共起抽出と日本語教育への応用
Srdanović IrenaHodošček BorBekeš Andrej仁科 喜久子
著者情報
ジャーナル フリー

2009 年 16 巻 4 号 p. 4_29-4_46

詳細
抄録

日本語におけるモダリティ形式および推量副詞と文末モダリティ形式との共起についての体系的な研究は自然言語処理の分野において不十分である.さらに,このような情報は日本語教育の分野においても十分カバーされていない.本稿では,コーパス検索ツール Sketch Engine (SkE) を利用した日本語の推量副詞とモダリティ形式の遠隔共起の抽出を可能にすることとその日本語教育,特に日本語学習辞典への応用の可能性を示すことを目的とする.そのためにまず,複数のコーパスを分析した結果として,モダリティ形式とそのバリエーションの網羅的なリストを作成した.このモダリティ形式は ChaSen でどのように形態素解析されているかを調査し,各モダリティ形式の様々な形態素を新しいモダリティのタグとしてまとめることによって,ChaSen で形態素解析されている JpWaC という大規模ウェブコーパスから抽出した 2 千万語のサンプルへタグの再付与を行った.最後に,新しくタグ付けされたコーパスをコーパス検索ツール SkE に載せ,「文法関係ファイル」の内容を変更することで,推量副詞と文末モダリティの共起の抽出を可能にした.抽出された共起の結果は 93% 以上の精度で高く評価された.得られた結果は言語資源を利用しての日本語教育への応用の一例として,日本語教育における辞書編集をはじめ様々な教育資源の作成のために,あるいは教室における直接的に利用可能となることを示した.

著者関連情報
© 2009 言語処理学会
前の記事 次の記事
feedback
Top