Presentation is loading. Please wait.

Presentation is loading. Please wait.

Automatic Language Acquisition, an Interactive Approach † Robert J. Martin † 大西昇 ‡ 山村毅 † 名古屋大学 ‡ 愛知県立大学.

Similar presentations


Presentation on theme: "Automatic Language Acquisition, an Interactive Approach † Robert J. Martin † 大西昇 ‡ 山村毅 † 名古屋大学 ‡ 愛知県立大学."— Presentation transcript:

1 Automatic Language Acquisition, an Interactive Approach † Robert J. Martin † 大西昇 ‡ 山村毅 † 名古屋大学 ‡ 愛知県立大学

2 発表内容 Lingquest システムの紹介 背景:  人間が作るモデル  従来の自動獲得 提案  インタラクティブ・アプローチの概念  設計  Use Case ( 例 ) まとめ

3 Lingquest System というのは … 自動的な自然言語獲得ツール

4 Lingquest System というのは … 自動的な自然言語獲得ツール 特定の言語、ドメインに依存しない

5 Lingquest System というのは … 自動的な自然言語獲得ツール 特定の言語、ドメインに依存しない 結果として得られるモデルは再利用、共 用できる、  例: J - POP ?

6 Lingquest System というのは … 自動的な自然言語獲得ツール 特定の言語、ドメインに依存しない 結果として得られるモデルは再利用、共 用できる、  例: J - POP =英語 + 日本語

7 Lingquest System というのは … 自動的な自然言語獲得ツール 特定の言語、ドメインに依存しない 結果として得られるモデルは再利用、共 用できる ある言語定理でモデルを実現するツール だけではなく、基本の言語定理、モデル 等で始まり、インタラクティブ実験で適 応なモデル, 定理とモデルを作る方法を発 見するものである

8 背景 言語学者 も必要 時間 かかる 整備も 必要 効率が悪い 人間が作ったモデル

9 目的 効率のよい自動獲得方法を開発

10 関連研究 統計的な方法 (Deligne & Bimbot) + 簡単、効率がよい - 局所極大 (EM 元 ), sparse data インタラクティブな方法 (J. Riloff) + 局所極大問題のような問題に成功できる - まだ人間に依存する 帰納的方法 (R. Mooney) + 人間に読みやすいルール( symbolic), 見ていない データに強い, 新しいルールを推論できる

11 提案 自動獲得方法を 組み合わせる 自動獲得方法を 組み合わせる 統計的な 方法 統計的な 方法 インタラクティブ な方法 インタラクティブ な方法 帰納的 方法 帰納的 方法 + 人間より 効率がよい + 人間より 効率がよい - 局所極大、 sparse data 等 - 局所極大、 sparse data 等 + 統計問題 に成功 + 統計問題 に成功 - また人間から モデルの問題 - また人間から モデルの問題 + 新しい ルールを 自動的に 作れる + 新しい ルールを 自動的に 作れる

12 提案(続き) 人間が作ったモデ ル + 深い ( 抽象パターン認 識 ), 信用性が高い - 遅い, 効率が悪い, 整 備しにくい コンピュータが作っ たモデル + 速い, 順応で整備が やすい - 浅い ( 表層認識のみ ), データの限界 人間が フィードバック を与える フィードバック を利用し、 ルールを帰納 統計的に パターン を求める

13 設計 3成分システム:  Learner: 学習方法を使い、データを変化出 来るモデルを出す: Data  Learner  Model  Model: モデルを使い、データの変化をユー ザに出力する: Data  Model  Data’  Meta-Learner: ユーザのフィードバックを利 用し、新しい学習方法を推論する: Data’’ + Model’’  Meta-Learner  Learner

14 人間が作る方法 Data Model 入力 出力 A t-1 ? t A t-1 B t ? A t-1  B t

15 人間が作る方法 Data Model 入力 出力 A t-1 ? t A t-1 B t A t-1  B t

16 自動獲得 Data Model 入力 出力 A t-1 ? t A t-1 B t A t-1  B t Learner A t-1 B t ? t-1  ? t ?

17 Meta-Learning (メタ学習) Data Model 入力 出力 A t-1 ? t A t-1 B t A t-1  B t Learner A t-1 B t ? t-1  ? t C t-1 D t C t-1  D t ? Meta- Learner ????????

18 設計 (Behavior) Hybrid, Interactive Bootstrapping: 1. 自動獲得を利用して簡単なモデルを作る 2. ユーザのモデルとデータのフィードバッ クを受ける。 3 a. フィードバックで変形されたモデル ( 強 い ), データ ( 弱い ) を用いて1に戻る 3b. ユーザのフィードバックを利用して帰納 的に新モデル, 学習方法を作ったら1に戻 る

19 Lingquest: Use Case 1. Model Alpha = Learner Alpha (Data J ) = {…, で, は, な, い,…} 2. Model μ- gram = Learner EM (Rep J = Model Alpha (Data J )): = {…, で, は, な, い, ない, はない,…} 3. Model μ- gram (“ ではない ”) = [ で ][ はない ] 4. User corrects: 1. Strong : Model μ- gram = {…, で, は, な, い, ない, では … } 2. Weak : Rep J = [ では ][ ない ]

20 Lingquest: Use Case( 続き ) 5a. Lingquest がユーザのフィードバックで モデル、 Representation を評価し直して 2に戻る 5b. 類似行列、 feature selection 等で新しい変 形を帰納的に探す e.g.- [ で ][ もない ]  [ でも ][ ない ] 2に戻る

21 まとめ コンピュータの計算能力と人間の知的能 力で協力する、 Lingquest というシステム を提案した 情報工学の Contribution :  人間がモデルを作る方法より効率がいい  自動獲得システムの問題はいくつかを解決す る( EM 局所極大や浅いモデルなど)  簡単にユーザがコンピュータの結果を直すだ けではなく、インタラクションで学ぶ方法を 開発する


Download ppt "Automatic Language Acquisition, an Interactive Approach † Robert J. Martin † 大西昇 ‡ 山村毅 † 名古屋大学 ‡ 愛知県立大学."

Similar presentations


Ads by Google