Automatic Language Acquisition, an Interactive Approach † Robert J. Martin † 大西昇 ‡ 山村毅 † 名古屋大学 ‡ 愛知県立大学.

Slides:



Advertisements
Similar presentations
物理演算を利用したビデオエフェクタの 作成 浅野益弘. 研究内容 経緯 NiVE ( Nico Visual Effects )用のエフェ クトプラグインの作成 本プラグインにより動画作成にかかる 時間と手間の短縮と省力化を目指す.
Advertisements

東京工科大学 コンピュータサイエンス 亀田弘之
1 7.時間限定チューリングマシンと クラス P. 2 7 -1.入力サイズ チューリングマシンの入力記号 の長さ を 入力サイズという。 名称:合成数の問題 インスタンス:整数n 問:nは合成数か? 通常は、入力サイズとしてはもっとも短い表現での 長さが利用される。 例えば、次のような合成数の問題における入力サイズは、
卒研 中間発表 9/13 甲斐 広大. 研究内容 『 Web ショップにおける Web デザイン』 Web ショップにおける Web デザインを研究するこ とで Web デザインについての関心を深めたくこの 研究をしようと思う。
7.n次の行列式   一般的な(n次の)行列式の定義には、数学的な概念がいろいろ必要である。まずそれらを順に見ていく。
9.線形写像.
3.多項式計算アルゴリズム べき乗の計算 多項式の計算.
時間的に変化する信号. 普通の正弦波 は豊富な情報を含んでいません これだけではラジオのような複雑な情報 を送れない 振幅 a あるいは角速度 ω を時間的に変化 させて情報を送る.
麻雀ゲーム 和島研究室 ソ 小林巧人
5.連立一次方程式.
相関.
音当て Game 時田 大樹 飛山 雄太郎. 作品の目的 入力として、スイッチを押すと音がスピー カーから流れ、スイッチを離すと、音が止 まる仕組みとなっている。
ノイズ. 雑音とも呼ばれる。(音でなくても、雑 音という) 入力データに含まれる、本来ほしくない 成分.
青森大学 5 号館の 模型の設計と製作 ソ 小山 内 拓真
広告付き価格サービ ス 小園一正. はじめに 世の中には様々な表現方法の広告があり ます。その中でも私たち学生にとって身 近にあるものを広告媒体として取り入れ られている。 価格サービス(無料配布のルーズリー フ)を体験したことにより興味を惹かれ るきっかけとなった。主な目的は、これ.
素数判定法 2011/6/20.
フーリエ係数の性質. どこまで足す? 理想的には無限大であるが、実際に はそれは出来ない これをフーリエ解析してみる.
地球温暖化と 天候の関係性 ~温暖化は天候のせいなのではないのか~. 目的課題 地球温暖化現象 ただの気象条件によるものではないのか? 地球温暖化現象に天候は関係しているの か?
1章 行列と行列式.
本宮市立白岩小学校. 1 はじめに 2 家庭学習プログラム開発の視点 ① 先行学習(予習)を生かした 確かな学力を形成する授業づく り ② 家庭との連携を図った家庭学習の習慣化.
プログラミングⅠ( 1 組) 第 9 回
フーリエ級数. 一般的な波はこのように表せる a,b をフーリエ級数とい う 比率:
Excelによる積分.
1 6.低次の行列式とその応用. 2 行列式とは 行列式とは、正方行列の特徴を表す一つのスカ ラーである。すなわち、行列式は正方行列からスカ ラーに写す写像の一種とみなすこともできる。 正方行列 スカラー(実数) の行列に対する行列式を、 次の行列式という。 行列 の行列式を とも表す。 行列式と行列の記号.
計算のスピードアップ コンピュータでも、sin、cosの計算は大変です 足し算、引き算、掛け算、割り算は早いです
線形符号(10章).
1 0章 数学基礎. 2 ( 定義)集合 集合については、 3セメスタ開講の「離散数学」で詳しく扱う。 集合 大学では、高校より厳密に議論を行う。そのために、議論の 対象を明確にする必要がある。 ある “ もの ” (基本的な対象、概念)の集まりを、 集合という。 集合に含まれる “ もの ” を、集合の要素または元という。
複素数.
1 0章 数学基礎. 2 ( 定義)集合 集合については、 3セメスタ開講の「離散数学」で詳しく扱う。 集合 大学では、高校より厳密に議論を行う。そのために、議論の 対象を明確にする必要がある。 ある “ もの ” (基本的な対象、概念)の集まりを、 集合という。 集合に含まれる “ もの ” を、集合の要素または元という。
人工知能特論II 第7回 二宮 崇.
信号測定. 正弦波 多くの場合正弦波は 0V の上下で振動する しかし、これでは AD 変換器に入れら れないので、オフ セットを調整して データを取った.
1 9.線形写像. 2 ここでは、行列の積によって、写像を 定義できることをみていく。 また、行列の積によって定義される写 像の性質を調べていく。
通信路(7章).
3.プッシュダウンオートマトンと 文脈自由文法
6.符号化法(6章).
ビット. 十進数と二進数 十進数  0から9までの数字を使って 0、1、2、3、4、5、6、7、8、9、 10、11、12 と数える 二進数  0と1を使って 0、1、10、11、100、101、11 0、111 と数える.
研究会 “Harmonies and Surprises on the Lattice” 地域社会と連携した大学教育と 研究プロセスの類似性 ~松本大学での帰納的教育手法の展開~ 報告者: Matsumoto University 松本大学/松本大学松商短期大学部 Hiroyuki Sumiyoshi.
平成22年度 第4回 Let’s Enjoy English 平成22年度 第4回 Let’s Enjoy English 期日:平成22年10月30日 場所:旭川市立北光小学校 基調提言.
3.正方行列(単位行列、逆行列、対称行列、交代行列)
学習者の意欲を高める音読指導の 一時例 1 Speak を使った 音読指導 鈴木政浩(西武文理大学)
名古屋工業大学 電気電子工学科 岩波・岡本研究室 野々村嘉人
論理回路 第1回. 今日の内容 論理回路とは? 本講義の位置づけ,達成目標 講義スケジュールと内容 受講時の注意事項 成績の評価方法.
Bar-TOP における光の 群速度伝播の解析 名古屋大学 高エネルギー物理研究室 松石 武 (Matsuishi Takeru)
伝わるスライド 中野研究室 M2 石川 雅 信. どのようなスライドを作れば良 いか 伝えたいこと.
Three-Year Course Orientation International Course.
データベース入門 日進高等学校 情報化推進委員会. 表計算ソフトとの比較 表計算ソフト (Excel) データベース ( Access ) 編集 二人目はデータの編集が ロックされる 複数の人が同時にデータ を 編集できる 信頼性 ファイルの数だけ データが存在する データは一つ データ処理 自由.
C言語応用 構造体.
実装の流れと 今後のスケジュール 03k0014 岸原 大祐. システム概要 天気データをもとに、前向き推論をし ていき、親の代わりに子供に服装、持 ち物、気をつけることなどを教える。
3.多項式計算アルゴリズム べき乗の計算 多項式の計算.
倫理リテラシーとは 倫理問題について判断を誤らないために 法律、決まりなどについての知識 いろいろな視点から見る習慣
Li 系化合物の結晶育成と電気的性質の測定 - LabVIEW を用いた計測制御システムの開発 - 矢萩研究室 ソ 佐藤 蓉子
1 中野研究室 4 年ゼミのイロハ 斉藤(修士 2 年) ( 2009 年 ”4 年ゼミのイロハ ” を参考に作りました)
移動エージェントプログラムの 動作表示のためのアニメーション言 語 名古屋大学情報工学コース 坂部研究室 高岸 健.
プログラミングⅠ( 2 組) 第 1 回 / pLB1.pptx.
「ネット社会の歩き方」レッスンキット プレゼンテーション資料集 15. チャットで個人情報は 言わない プレゼンテーション資料 著作権は独立行政法人情報処理推進機構( IPA )及び経済産業省に帰属します。
8.任意のデータ構造 (グラフの表現とアルゴリズム)
第14回 プログラムの意味論と検証(3) 不動点意味論 担当:犬塚
実験5 規則波 C0XXXX 石黒 ○○ C0XXXX 杉浦 ○○ C0XXXX 大杉 ○○ C0XXXX 高柳 ○○ C0XXXX 岡田 ○○ C0XXXX 藤江 ○○ C0XXXX 尾形 ○○ C0XXXX 足立 ○○
ことばとコンピュータ 2007 年度 1 学期 第 1 回. 2 ことばとコンピュータ 授業科目名:言語情報処理論 授業題目名:ことばとコンピュータ 履修コード: 5067 教室: 323 一学期開講 授業の進め方 – 基本的に講義中心ですすめ,時々コンピュー タを使う.
オセロの思考アルゴリズムについて 1103072 岩間 隆浩.
図書館における 個人対応検索システム                03k1001 赤塚 拓巳.
小島 肇  Windows ではアンチウイルスソフトウェアは 必須だが、「入れれば安心」というものでは ない  Mac, Linux における費用対効果はかなり低い  現時点ではマルウェアは流行っていないから  Windows を併用している場合は別.
音の変化を視覚化する サウンドプレイヤーの作成
プログラミングの基礎知識 プログラミングの手順と重要概念 アルゴリズム. プログラミングの手順 コーディング エディタなどでコードを記述 コンパイル・インタープリタ 実行可能な形に翻訳 デバッグ(虫取り、不具合の調整) 完成!
Self-efficacy(自己効力感)について
本文. 考えながら読みましょ う 「いろいろなこと」( 3 行目)は何で すか 「①電話料金はコンビニで支払いをしていま す。いつでも払えますから、便利です。」 「②夕食はコンビニで買います。お弁当やお かずがいろいろありますから。」今、若者に 人気のあるコンビニは、いろいろなことをす るのに非常に便利な場所になった。
東北大学 情報科学研究科 システム情報科学専攻 TOKUYAMA Lab. 1 左順序付き柔軟ラベリングの実 装 Implementation of Left-part ordered Flexible Labeling 東北大学大学院 情報科学研究科 ◎小池 敦 徳山 豪.
2015/11/19. To foster Historical Thinking Skill by Creating Story Necessary Relationships and Elements of Characters In historical learning, historical.
英語勉強会 名手⇒詫間 2015/10/22. 原文 This study says acquiring motor skills support system. There is how to acquire moor skills that coach advises learner. Motor.
地球儀と様々な地図. 1 球体としての地球 こうした現象はあることをイ メージすると理解できる。
Presentation transcript:

Automatic Language Acquisition, an Interactive Approach † Robert J. Martin † 大西昇 ‡ 山村毅 † 名古屋大学 ‡ 愛知県立大学

発表内容 Lingquest システムの紹介 背景:  人間が作るモデル  従来の自動獲得 提案  インタラクティブ・アプローチの概念  設計  Use Case ( 例 ) まとめ

Lingquest System というのは … 自動的な自然言語獲得ツール

Lingquest System というのは … 自動的な自然言語獲得ツール 特定の言語、ドメインに依存しない

Lingquest System というのは … 自動的な自然言語獲得ツール 特定の言語、ドメインに依存しない 結果として得られるモデルは再利用、共 用できる、  例: J - POP ?

Lingquest System というのは … 自動的な自然言語獲得ツール 特定の言語、ドメインに依存しない 結果として得られるモデルは再利用、共 用できる、  例: J - POP =英語 + 日本語

Lingquest System というのは … 自動的な自然言語獲得ツール 特定の言語、ドメインに依存しない 結果として得られるモデルは再利用、共 用できる ある言語定理でモデルを実現するツール だけではなく、基本の言語定理、モデル 等で始まり、インタラクティブ実験で適 応なモデル, 定理とモデルを作る方法を発 見するものである

背景 言語学者 も必要 時間 かかる 整備も 必要 効率が悪い 人間が作ったモデル

目的 効率のよい自動獲得方法を開発

関連研究 統計的な方法 (Deligne & Bimbot) + 簡単、効率がよい - 局所極大 (EM 元 ), sparse data インタラクティブな方法 (J. Riloff) + 局所極大問題のような問題に成功できる - まだ人間に依存する 帰納的方法 (R. Mooney) + 人間に読みやすいルール( symbolic), 見ていない データに強い, 新しいルールを推論できる

提案 自動獲得方法を 組み合わせる 自動獲得方法を 組み合わせる 統計的な 方法 統計的な 方法 インタラクティブ な方法 インタラクティブ な方法 帰納的 方法 帰納的 方法 + 人間より 効率がよい + 人間より 効率がよい - 局所極大、 sparse data 等 - 局所極大、 sparse data 等 + 統計問題 に成功 + 統計問題 に成功 - また人間から モデルの問題 - また人間から モデルの問題 + 新しい ルールを 自動的に 作れる + 新しい ルールを 自動的に 作れる

提案(続き) 人間が作ったモデ ル + 深い ( 抽象パターン認 識 ), 信用性が高い - 遅い, 効率が悪い, 整 備しにくい コンピュータが作っ たモデル + 速い, 順応で整備が やすい - 浅い ( 表層認識のみ ), データの限界 人間が フィードバック を与える フィードバック を利用し、 ルールを帰納 統計的に パターン を求める

設計 3成分システム:  Learner: 学習方法を使い、データを変化出 来るモデルを出す: Data  Learner  Model  Model: モデルを使い、データの変化をユー ザに出力する: Data  Model  Data’  Meta-Learner: ユーザのフィードバックを利 用し、新しい学習方法を推論する: Data’’ + Model’’  Meta-Learner  Learner

人間が作る方法 Data Model 入力 出力 A t-1 ? t A t-1 B t ? A t-1  B t

人間が作る方法 Data Model 入力 出力 A t-1 ? t A t-1 B t A t-1  B t

自動獲得 Data Model 入力 出力 A t-1 ? t A t-1 B t A t-1  B t Learner A t-1 B t ? t-1  ? t ?

Meta-Learning (メタ学習) Data Model 入力 出力 A t-1 ? t A t-1 B t A t-1  B t Learner A t-1 B t ? t-1  ? t C t-1 D t C t-1  D t ? Meta- Learner ????????

設計 (Behavior) Hybrid, Interactive Bootstrapping: 1. 自動獲得を利用して簡単なモデルを作る 2. ユーザのモデルとデータのフィードバッ クを受ける。 3 a. フィードバックで変形されたモデル ( 強 い ), データ ( 弱い ) を用いて1に戻る 3b. ユーザのフィードバックを利用して帰納 的に新モデル, 学習方法を作ったら1に戻 る

Lingquest: Use Case 1. Model Alpha = Learner Alpha (Data J ) = {…, で, は, な, い,…} 2. Model μ- gram = Learner EM (Rep J = Model Alpha (Data J )): = {…, で, は, な, い, ない, はない,…} 3. Model μ- gram (“ ではない ”) = [ で ][ はない ] 4. User corrects: 1. Strong : Model μ- gram = {…, で, は, な, い, ない, では … } 2. Weak : Rep J = [ では ][ ない ]

Lingquest: Use Case( 続き ) 5a. Lingquest がユーザのフィードバックで モデル、 Representation を評価し直して 2に戻る 5b. 類似行列、 feature selection 等で新しい変 形を帰納的に探す e.g.- [ で ][ もない ]  [ でも ][ ない ] 2に戻る

まとめ コンピュータの計算能力と人間の知的能 力で協力する、 Lingquest というシステム を提案した 情報工学の Contribution :  人間がモデルを作る方法より効率がいい  自動獲得システムの問題はいくつかを解決す る( EM 局所極大や浅いモデルなど)  簡単にユーザがコンピュータの結果を直すだ けではなく、インタラクションで学ぶ方法を 開発する