音声対話文における助詞落ち・倒置の分析と解析手法

書誌事項

タイトル別名
  • An Analysis and Parsing Method of the Omission of Post - Position and Inversion on Japanese Spoken Sentence in Dialog
  • 人工知能

この論文をさがす

抄録

音声対話における発話文は 言い淀み 言い直し 間投詞 助詞の省略 倒置などの話し言葉特有の特徴を持つため これまでの書き言葉に対する自然言語の解析手法をそのまま適用するには問題がある・本論文では解析において まず問題と通る名詞文節の助詞落ちと倒置について 実際の音声対話文約1 800文を分析し その結果をもとに解析手法を提案する.音声対話文では 名詞文節の約4%の助詞が省略されていた.省略される助詞は「が を に は」など述部に係る場合に必須格の機能を持つものが80%を占めていた.係り先の性質としては 述部に係る助詞落ち名詞文節の99%が最も近くの述部に係る.また 文頭にある助詞落ち名詞文節は「は」が省略される可能性が高く(68%) 遠くに係る可能性を持っているまた 係り関係(格)については 述部の格構造の簡単な意味制約によって 90%が推定できることが分かった.倒置に関しては 述部に係る文節が倒置される場合が94%を占めており 倒置された句が1つ前の文節に係る場合が91%であった.また 倒置された句の直前の文節は必ず終止形で終わっていることが分かった.以上の分析を反映したヒューりスティックスを助詞落ちに関して5つ 倒置に関して2つ提案した.語彙が700の小規模な実験タスクで評価した結果 助詞落ち 倒趣共に約90%の例を正しく解析できることが分かった.

収録刊行物

被引用文献 (20)*注記

もっと見る

参考文献 (11)*注記

もっと見る

キーワード

詳細情報 詳細情報について

  • CRID
    1050282812864602496
  • NII論文ID
    110002723414
  • NII書誌ID
    AN00116647
  • ISSN
    18827764
  • Web Site
    http://id.nii.ac.jp/1001/00014608/
  • 本文言語コード
    ja
  • 資料種別
    journal article
  • データソース種別
    • IRDB
    • CiNii Articles

問題の指摘

ページトップへ