Automatic Language Acquisition, an Interactive Approach † Robert J. Martin † 大西昇 ‡ 山村毅 † 名古屋大学 ‡ 愛知県立大学.

Automatic Language Acquisition, an Interactive Approach † Robert J. Martin † 大西昇 ‡ 山村毅 † 名古屋大学 ‡ 愛知県立大学

発表内容 Lingquest システムの紹介背景：  人間が作るモデル  従来の自動獲得提案  インタラクティブ・アプローチの概念  設計  Use Case ( 例 ) まとめ

Lingquest System というのは … 自動的な自然言語獲得ツール

Lingquest System というのは … 自動的な自然言語獲得ツール特定の言語、ドメインに依存しない

Lingquest System というのは … 自動的な自然言語獲得ツール特定の言語、ドメインに依存しない結果として得られるモデルは再利用、共用できる、  例： J － POP ？

Lingquest System というのは … 自動的な自然言語獲得ツール特定の言語、ドメインに依存しない結果として得られるモデルは再利用、共用できる、  例： J － POP ＝英語 + 日本語

Lingquest System というのは … 自動的な自然言語獲得ツール特定の言語、ドメインに依存しない結果として得られるモデルは再利用、共用できるある言語定理でモデルを実現するツールだけではなく、基本の言語定理、モデル等で始まり、インタラクティブ実験で適応なモデル, 定理とモデルを作る方法を発見するものである

背景言語学者も必要時間かかる整備も必要効率が悪い人間が作ったモデル

目的効率のよい自動獲得方法を開発

関連研究統計的な方法 (Deligne & Bimbot) + 簡単、効率がよい - 局所極大 (EM 元 ), sparse data インタラクティブな方法 (J. Riloff) + 局所極大問題のような問題に成功できる - まだ人間に依存する帰納的方法 (R. Mooney) + 人間に読みやすいルール（ symbolic), 見ていないデータに強い, 新しいルールを推論できる

提案自動獲得方法を組み合わせる自動獲得方法を組み合わせる統計的な方法統計的な方法インタラクティブな方法インタラクティブな方法帰納的方法帰納的方法 + 人間より効率がよい + 人間より効率がよい - 局所極大、 sparse data 等 - 局所極大、 sparse data 等 + 統計問題に成功 + 統計問題に成功 - また人間からモデルの問題 - また人間からモデルの問題 + 新しいルールを自動的に作れる + 新しいルールを自動的に作れる

提案（続き）人間が作ったモデル + 深い ( 抽象パターン認識 ), 信用性が高い - 遅い, 効率が悪い, 整備しにくいコンピュータが作ったモデル + 速い, 順応で整備がやすい - 浅い ( 表層認識のみ ), データの限界人間がフィードバックを与えるフィードバックを利用し、ルールを帰納統計的にパターンを求める

設計３成分システム：  Learner: 学習方法を使い、データを変化出来るモデルを出す： Data  Learner  Model  Model: モデルを使い、データの変化をユーザに出力する： Data  Model  Data’  Meta-Learner: ユーザのフィードバックを利用し、新しい学習方法を推論する： Data’’ + Model’’  Meta-Learner  Learner

人間が作る方法 Data Model 入力出力 A t-1 ? t A t-1 B t ? A t-1  B t

人間が作る方法 Data Model 入力出力 A t-1 ? t A t-1 B t A t-1  B t

自動獲得 Data Model 入力出力 A t-1 ? t A t-1 B t A t-1  B t Learner A t-1 B t ? t-1  ? t ?

Meta-Learning （メタ学習） Data Model 入力出力 A t-1 ? t A t-1 B t A t-1  B t Learner A t-1 B t ? t-1  ? t C t-1 D t C t-1  D t ? Meta- Learner ????????

設計 (Behavior) Hybrid, Interactive Bootstrapping: 1. 自動獲得を利用して簡単なモデルを作る 2. ユーザのモデルとデータのフィードバックを受ける。３ a. フィードバックで変形されたモデル ( 強い ), データ ( 弱い ) を用いて１に戻る 3b. ユーザのフィードバックを利用して帰納的に新モデル, 学習方法を作ったら１に戻る

Lingquest: Use Case 1. Model Alpha = Learner Alpha (Data J ) = {…, で, は, な, い,…} 2. Model μ- gram = Learner EM (Rep J = Model Alpha (Data J )): = {…, で, は, な, い, ない, はない,…} 3. Model μ- gram (“ ではない ”) = [ で ][ はない ] 4. User corrects: 1. Strong : Model μ- gram = {…, で, は, な, い, ない, では … ｝ 2. Weak : Rep J = [ では ][ ない ]

Lingquest: Use Case( 続き ) 5a. Lingquest がユーザのフィードバックでモデル、 Representation を評価し直して２に戻る 5b. 類似行列、 feature selection 等で新しい変形を帰納的に探す e.g.- [ で ][ もない ]  [ でも ][ ない ] ２に戻る

まとめコンピュータの計算能力と人間の知的能力で協力する、 Lingquest というシステムを提案した情報工学の Contribution ：  人間がモデルを作る方法より効率がいい  自動獲得システムの問題はいくつかを解決する（ EM 局所極大や浅いモデルなど）  簡単にユーザがコンピュータの結果を直すだけではなく、インタラクションで学ぶ方法を開発する

Automatic Language Acquisition, an Interactive Approach † Robert J. Martin † 大西昇 ‡ 山村毅 † 名古屋大学 ‡ 愛知県立大学.

Similar presentations

Presentation on theme: "Automatic Language Acquisition, an Interactive Approach † Robert J. Martin † 大西昇 ‡ 山村毅 † 名古屋大学 ‡ 愛知県立大学."— Presentation transcript:

Similar presentations

About project

Feedback

Log in

Auth with social network:

Automatic Language Acquisition, an Interactive Approach † Robert J. Martin † 大西昇 ‡ 山村毅 † 名古屋大学 ‡ 愛知県立大学.

Similar presentations

Presentation on theme: "Automatic Language Acquisition, an Interactive Approach † Robert J. Martin † 大西昇 ‡ 山村毅 † 名古屋大学 ‡ 愛知県立大学."— Presentation transcript:

Similar presentations

About project

Feedback