Presentation is loading. Please wait.

Presentation is loading. Please wait.

ピボット言語を介したフレーズベース統 計的機械翻訳を用いた対訳辞書の構築 綱川 隆司 1 岡崎 直観 1 辻井 潤一 1,2 1 東京大学大学院情報理工学系研究科コンピュータ科学専攻 辻井研究室 2 School of Computer Science, University of Manchester.

Similar presentations


Presentation on theme: "ピボット言語を介したフレーズベース統 計的機械翻訳を用いた対訳辞書の構築 綱川 隆司 1 岡崎 直観 1 辻井 潤一 1,2 1 東京大学大学院情報理工学系研究科コンピュータ科学専攻 辻井研究室 2 School of Computer Science, University of Manchester."— Presentation transcript:

1 ピボット言語を介したフレーズベース統 計的機械翻訳を用いた対訳辞書の構築 綱川 隆司 1 岡崎 直観 1 辻井 潤一 1,2 1 東京大学大学院情報理工学系研究科コンピュータ科学専攻 辻井研究室 2 School of Computer Science, University of Manchester / National Centre for Text Mining, UK

2 モチベーション 英語とその他の言語の2言語間の対訳辞書は, 英語以外の2言語間の対訳辞書に比べ資源が豊 富  英語を中間言語(ピボット言語)として英語以 外の2言語の単語を結びつけることで,既存の 対訳辞書に比べより多くの対訳項目の獲得が期 待できる 辞書の英語項目によって単純に結びつけるだけ でなく,統計的機械翻訳を用いて可能な限り結 びつける

3 対訳辞書のマージ ChineseEnglish 代谢综合症 metabolic syndrome 道恩综合症 Down’s syndrome 抗体缺乏 综合症 antibody-deficiency syndrome JapaneseEnglish 代謝異常 metabolic disorder ダウン症候群 Down’s syndrome メタボリック metabolic シンドローム syndrome 抗体欠乏 antibody deficiency ChineseJapanese 道恩综合症 ダウン 症候群 単純な辞書マッチング では1対訳しか 獲得できない

4 対訳辞書のマージ ChineseEnglish 代谢综合症 metabolic syndrome 道恩综合症 Down’s syndrome 抗体缺乏 综合症 antibody-deficiency syndrome JapaneseEnglish 代謝異常 metabolic disorder ダウン症候群 Down’s syndrome メタボリック metabolic シンドローム syndrome 抗体欠乏 antibody deficiency ChineseJapanese 道恩综合症 ダウン 症候群 代谢综合症 メタボリッ クシンド ローム 代谢综合症代謝症候群 抗体缺乏 综合症 抗体欠乏 症候群

5 フレームワーク 中英 対訳辞書 中英 対訳辞書 日英 対訳辞書 日英 対訳辞書 単語アライン メント・対訳 フレーズ対抽 出 中英対訳 フレーズ対 (確率付 き) 中英対訳 フレーズ対 (確率付 き) 日英対訳 フレーズ対 (確率付 き) 日英対訳 フレーズ対 (確率付 き) マージした 日中対訳 フレーズ対 (確率付き) マージした 日中対訳 フレーズ対 (確率付き) フレーズ ベース 統計的 機械翻訳 中英辞書の 日本語訳 中英辞書の 日本語訳 同一の英語を持つフ レーズ対の併合・確率 の再計算 その他の特徴等 代谢综合症 メタボリック シンドローム p( メタボリック | 代谢 )=0.35 p( シンドローム | 综合 症 )=0.50


Download ppt "ピボット言語を介したフレーズベース統 計的機械翻訳を用いた対訳辞書の構築 綱川 隆司 1 岡崎 直観 1 辻井 潤一 1,2 1 東京大学大学院情報理工学系研究科コンピュータ科学専攻 辻井研究室 2 School of Computer Science, University of Manchester."

Similar presentations


Ads by Google