Improving Statistical Machine Translation Accuracy Using Bilingual Lexicon Extraction with Paraphrases Chenhui Chu, Toshiaki Nakazawa, Sadao Kurohashi.

Slides:



Advertisements
Similar presentations
Iterative Bilingual Lexicon Extraction from Comparable Corpora Using Topic Model and Context Based Methods Chenhui Chu, Toshiaki Nakazawa, Sadao Kurohashi.
Advertisements

Lecture Fifteen: Seminar: Hot Issues discussion. Hot issues Discussion Based on the knowledge learned in the previous lectures and discussion , the students.
Office of the Government Chief Information Officer Commerce & Economic Development Bureau Hong Kong SAR Government Mr. Jeremy Godfrey Government Chief.
第三章 导游工作 第一节 导游工作的性质 导游工作的性质 第二节 导游工作的价值 导游工作的价值 第三节 导游工作的特点 导游工作的特点 第四节 导游职业准则 导游职业准则.
第四章 犯罪概念与犯罪构成. 第一节 犯罪概念 一、犯罪概念的类型  (一)犯罪的形式概念  (二)犯罪的实质概念  (三)犯罪的混合概念.
1 、下雨露天菜场蔬菜降价,苹果遭雹灾减少,价 格高于往年。 2 、冬季皮衣卖出好价钱,夏季打折出售;同一种 西瓜刚上市每斤卖到几元,大量上市后只卖几角。 3 、羽绒服在东北卖出高价,在海南降价也少有人 买;沿海地区海鲜价格便宜,内陆省份得付出高价。 4 、石油输出国组织宣布减产原油,世界油价上涨;
石化的 IT 大挑战 洛阳石化工程公司. 石化公司简介 中国石化集团洛阳石油化工工程公司,是国内能源化 工领域集技术专利商与工程承包商于一体的高科技企 业。拥有中国综合设计甲级资质,为国家首批业务涵 盖 21 个行业的工程咨询企业之一,拥有工程总承包、 工程设计、工程监理、工程咨询和环境影响评价等甲.
HistCite 结果分析示例 罗昭锋. By:SC 可能原因:文献年度过窄,少有相互引用.
——发酵床将改善猪的人生 金佳源农牧科技有限公司 将带您走进猪的艺术人生。 你有车 有房有 床吗? ??? 亲爱的, 嫁给我吧! 首先,我要宝马车 接送; 其次,我要住五星 级猪圈; 当然,最重要的 是 —— 舒服干净的发酵床!!!
学习第六课的目标 : 1 、掌握各种投资方式的特点。 2 、能设计一套家庭投资或贷款投资 的最佳方案。 1)储蓄存款(便捷的投资) 2)股票(高风险高收入的投资) 3)债券(稳健的投资) 4)保险(规避风险的投资)
第四章 失业 答业是社会的一种普遍现象,也是社会关注的焦点,在计划经济条件下, 失业是隐性的,在市场经济条件下,失业是显性的,本章主要介绍失业 的基本理论。 第一节 失业的类型和自然失业率 一、失业的类型两种典型的失业理论 1 .古典失业理论,供求失衡引起失业。 2 .凯恩斯失业理论,消费不足引起失业。
第三章 刑法的效力范围 刑法的效力范围,也称刑法的适用范围,是指刑法在什么时间、 什么空间及对什么人具有效力。它不仅涉及国家主权,而且涉 及国际关系、民族关系以及新旧法律关系,是任何国家的刑法 在具体适用前所必须解决的原则性问题。只有正确解决了刑法 的效力范围,才有可能准确、有效地适用刑法,打击犯罪,保.
第一节 过渡时期与党在过 渡时期的总路线 一、过渡时期的社会性质与 主要任务 进 入 进 入 二、党在过渡时期的总路线 进 入 进 入.
国际经济法学 5. § 5 国际经济法的主体 主体 主体与客体( subject and object ) 是用以说明人的实践活动和认识 活动的一对哲学范畴。主体是实 践活动和认识活动的承担者;客 体是主体实践活动和认识活动指 向的对象。
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第三十八讲 ) 离散数学. 第八章 格与布尔代数 §8.1 引 言 在第一章中我们介绍了关于集 合的理论。如果将 ρ ( S )看做 是集合 S 的所有子集组成的集合, 于是, ρ ( S )中两个集合的并 集 A ∪ B ,两个集合的交集.
第三部分 行政行为 第一节 行政行为的概述 一、行政行为的概念、特征和内容 (一)行政行为的概念(比较)(比较) (二)行政行为的特征行政行为的特征 (三)行政行为的内容行政行为的内容 二、行政行为的效力行政行为的效力 三、行政行为的分类.行政行为的分类. 四、行政行为成立与合法要件 (一). 行政行为成立要件.
第二部分 行政法律关系主体 第一节 行政主体 一、行政主体 (一)行政主体的概念 cc (二)行政主体资格含义及构成要件 CASE1CASE1\CASE2CASE2 (三)行政主体的职权和职责 1 、行政职权的概念及内容 2 、行政职权的特点 3 、行政职责.
刑法总论 第一章 刑法概述. 第一节 刑法的概念和性质  一、刑法的概念  刑法是规定犯罪、刑事责任和刑罚的法律。  具体地说,刑法就是掌握政权的阶级即统 治阶级,为了本阶级政治上的统治和经济 上的利益,根据自己的意志,规定哪些行 为是犯罪和应负刑事责任,并对犯罪人处 以何种刑罚处罚的法律。
第十章 企业价值评估 第一节 企业价值评估及其特点 企业价值评估及其特点 第二节 企业价值评估的范围界定 第三节 转型经济与企业价值评估 第四节 收益法在企业价值评估中的应用 第五节 市场法和成本法在企业价值评估中的应用.
聚合物在生物高分子分离中的应用 王延梅 中国科学技术大学高分子科学与工程系 Tel
绪 论 一、药物分析性质与任务 二、国家药品标准 三、药品质量管理规范 四、课程的要求. 药 品 用于预防、治疗、诊断人的疾病, 有目的地调节人的生理机能并规定有适应 症或者功能主治、用法用量的物质, 是广大人民群众防病治病、保护健康必不 可少的特殊商品。 《中华人民共和国药品管理法》 性质与任务.
组织卖淫罪. ( 一 ) 概念 以招募、雇用、强迫、引诱、容留等 手段,控制多人从事卖淫的行为。
深圳市国泰安信息技术有限公司 GTA Information Technology Co.,Ltd. 证券公司 仿真模拟交易平台.
量子化学 第四章 角动量与自旋 (Angular momentum and spin) 4.1 动量算符 4.2 角动量阶梯算符方法
第四章 行业分析 合肥工业大学人文经济学院. 主要内容 行业划分的方法 行业的一般特征分析 行业投资的选择.
成本突变情况下的闭环供应链协调 周密 东南大学系统工程研究所. Outline 引言 1 模型假设 2 正常情况 & 成本突变 3 数值仿真 4 结论 5.
US Federal Reserve Cuts Economic Growth Forecast PRESENTERS: 陈燕钦 叶玉萍
1. 在自然环境的基础上,因人类开发利用不当 而加速的土壤质量和生产力下降的现象和过 程。 2. 土壤数量的减少和质量的降低。 Chap.18 土壤退化与土壤质量 §1 土壤退化的概念.
报告人:黄磊 缓冲溶液的积分缓冲容量. 缓冲指数的概念是 Vanslyke 在 1922 年提出 的,意义是当缓冲溶液改变一个单位时需 加入酸碱物质的量 即 这里的缓冲指数指的是微分缓冲容量,是 加酸碱物质的量随着 pH 值的变化率 1 ,微分缓冲容量.
Department of Mathematics 第二章 解析函数 第一节 解析函数的概念 与 C-R 条件 第二节 初等解析函数 第三节 初等多值函数.
Alignment by Bilingual Generation and Monolingual Derivation Toshiaki Nakazawa and Sadao Kurohashi Kyoto University.
Machine translation Context-based approach Lucia Otoyo.
Unit 3 Basic Theories of BOP (How are the imbalances of BOP adjusted when they occur in a country?)
Query Rewriting Using Monolingual Statistical Machine Translation Stefan Riezler Yi Liu Google 2010 Association for Computational Linguistics.
An Integrated Approach for Arabic-English Named Entity Translation Hany Hassan IBM Cairo Technology Development Center Jeffrey Sorensen IBM T.J. Watson.
经济法律关系 经济关系 经济法法律关系 主体 决策主体、 经济管理主体、 生产经营主体、 消费主体、监督主体 国家机关、法人、 自然人、非法人机构、 农村承包户、个体经 营户、合伙组织 以及法人的分支机构 客体 经济行为、物、 货币、有价证券、 科学技术成果 内容 经济权利、经济义务.
高等教育出版社 第 9 章 其他税类 一、资源税 二、城镇土地使用税 第一节 资源税类. 高等教育出版社 第一节 资源税类 一、资源税 ( 一 ) 资源税的概念和特点 1. 资源税的概念 目前我国开征的资源税是以部分自然资源为课税对象,对在我国境内开采应税 矿产品及生产盐的单位和个人,就其应税产品销售数量或自用数量为计税依据而征.
Language Knowledge Engineering Lab. Kyoto University NTCIR-10 PatentMT, Japan, Jun , 2013 Description of KYOTO EBMT System in PatentMT at NTCIR-10.
Iterative Bilingual Lexicon Extraction from Comparable Corpora with Topical and Contextual Knowledge Chenhui Chu, Toshiaki Nakazawa, Sadao Kurohashi Graduate.
适用场景 应用背景 1 、企业使用电商平台作为前 台销售门户, NC 作为后台管 理软件; 2 、后台从商城平台自动定时 下载,快速导入到 NC 形成销 售订单,并按 ERP 业务规则 进行校验及触发后续流程; 3 、提高订单传递的及时性、 准确性、规范性,减少工作量, 降低出错率;
Accurate Parallel Fragment Extraction from Quasi-Comparable Corpora using Alignment Model and Translation Lexicon Chenhui Chu, Toshiaki Nakazawa, Sadao.
法律加油站 —— 养老金余额能否继承? 2015 年 02 月 13 日 合规宣 [2015]02 号.
1 How Money Matters: An Illustration Interest Rates, Money Supply, and Credit Flows Change Federal Reserve Acts Aggregate Demand for Goods and Services.
Chapter 7: The Marketing Mix & Product Promotion.
凤凰县文化旅游经济开发区 工业加工体验园简介 园区招商办公室 二零一五年八月. 张家界荷花机场 铜仁 · 凤凰机场 常德桃花源机场 凤凰文化旅游经济开发区 湘西机场 ( 在建 ) 怀化芷江机场 区位交通 机场方面.
Unit 8 marketing & Text & Exercises Unit 8 marketing & Text & Exercises.
Chinese Word Segmentation Adaptation for Statistical Machine Translation Hailong Cao, Masao Utiyama and Eiichiro Sumita Language Translation Group NICT&ATR.
Cache-based Document-level Statistical Machine Translation Prepared for I 2 R Reading Group Gongzhengxian 10 OCT 2011.
表单自定义 “ 表单自定义 ” 功能是用于制作表单的 工具,用数飞 OA 提供的表单自定义 功能能够快速制作出内容丰富、格 式规范、美观的表单。
7 生产费用在完工产品与在产 品之间分配的核算. 2 第七章 生产费用在完工产品与在产品之 间的分配  知识点 :  理解在产品的概念  掌握生产费用在完工产品与在产品之间的分 配.
A non-contiguous Tree Sequence Alignment-based Model for Statistical Machine Translation Jun Sun ┼, Min Zhang ╪, Chew Lim Tan ┼ ┼╪
力的合成 力的合成 一、力的合成 二、力的平行四边形 上一页下一页 目 录 退 出. 一、力的合成 O. O. 1. 合力与分力 我们常常用 一个力来代替几个力。如果这个 力单独作用在物体上的效果与原 来几个力共同作用在物体上的效 果完全一样,那么,这一个力就 叫做那几个力的合力,而那几个 力就是这个力的分力。
Improving Named Entity Translation Combining Phonetic and Semantic Similarities Fei Huang, Stephan Vogel, Alex Waibel Language Technologies Institute School.
WELCOME TO SHANGHAI FUDAN-VANKE EXPERIMENTAL PRIVATE SCHOOL C Program (SVKS) 欢迎家长来校参观.
Unit 3 English Around the World Topic 1 English is widely spoken throughout the world. Section D.
个体 精子 卵细胞 父亲 受精卵 母亲 人类生活史 问题:人类产生配子(精、卵 细胞)是不是有丝分裂?
Multi-level Bootstrapping for Extracting Parallel Sentence from a Quasi-Comparable Corpus Pascale Fung and Percy Cheung Human Language Technology Center,
算得清写的准 —— 物业费公示报告的编写 讲师:朱芸 物业费的 构成? 哪些是管 理人员工 资呢? 哪些算工程费 用? 怎样才能核 算的清楚呢?
Chapter 12 The Demand for Real Money Balances and Market Equilibrium.
画杨桃 河南省南阳市油田第五小学 张俊生. 叮嘱 审视 严肃 半晌 熟悉 相似 教诲 和颜悦色 叮嘱 1 .嘱咐,嘱托。 2 .托,托付。 父亲对我要求很严,经常叮 嘱我: “ 你看见一件东西,是什么 样的,就画成什么样,不要想当 然,画走了样。 ”
Statistical Machine Translation Part II: Word Alignments and EM Alex Fraser Institute for Natural Language Processing University of Stuttgart
八. 真核生物的转录 ㈠ 特点 ① 转录单元为单顺反子( single cistron ),每 个蛋白质基因都有自身的启动子,从而造成在功能 上相关而又独立的基因之间具有更复杂的调控系统。 ② RNA 聚合酶的高度分工,由 3 种不同的酶催化转 录不同的 RNA 。 ③ 需要基本转录因子与转录调控因子的参与,这.
Section A Period 2 (3a- 3c). panda It’s big and fat. It’s quiet and gentle. It’s black and white. What is it?
第二节 财政的基本特征 第二节 财政的基本特征 一、财政分配以政府为主体 二、财政分配一般具有强制性 三、财政分配一般具有无偿性 第一章 财政概论 四、财政分配一般具有非营利性.
一、中国梦与中国特色社会主义道路创新 中国梦即实现中华民族的伟大复兴 中国梦的实现路径是中国道路 中国特色社会主义道路的科学表述 中国特色社会主义道路的形成 是对新中国成 立 60 年成功经 验的总结 是对中国近代 170 年以来历 史经验的总结 是对五千年中 华优秀文化文 化的总结.
广告注意的基本理论 壹 叁 广告注意策略的误区 贰 内容与形式:影响注意的广告要素 1 肆 广告注意的创意原则 Contents 广告注意的原理与策略.
Unit 2 Text A International Trade Theories. International trade takes place within the framework of agreements worked out by countries in the World Trade.
Review Class Six. Chapter 14  Here we have discussed the two-good model, and we have learned how to use this model to solve the optimal problem facing.
新旧 “ 四大件 ” 分别指什么?为什么会有如此 大的变化? 一、衣食住行的变迁 改革开放以来,人们的衣、食、住、 行等方面发生了前所未有的变化。
劳动力市场.
Presentation transcript:

Improving Statistical Machine Translation Accuracy Using Bilingual Lexicon Extraction with Paraphrases Chenhui Chu, Toshiaki Nakazawa, Sadao Kurohashi Graduate School of Informatics, Kyoto University PACLIC2014 (2014/12/12)

Statistical Machine Translation (SMT) [Brown+ 1993] Zh: #1:今年,这种主导作用依然非常突出。 #2: (国际)巴西国家风险指数下降。 ... #1: This year, the leading role played by this sector remains strong. #2: (International) Brazil 's risk index drops. ... En: Translation model Input: 人类共有二十三对染色体。 Output: Humans have a total of 23 pairs of chromosomes. Magic. In corpus based machine translation, because translation knowledge is acquired from parallel corpora, the quality and quantity of parallel corpora are crucial. Parallel corpora are sentence-aligned bilingual texts. This shows an example of a Chinese-Japanese parallel corpus. From this parallel corpus, we train a translation model, and conduct translation. However, except for a few language pairs and domains, parallel corpora remain a scarce resource. Language model Decoder Rapid development of MT systems for different language pairs and domains is possible, once parallel corpora are available

Scarceness of Parallel Corpora Limitations in previous studies for parallel corpora construction Richness of languages There are about 7,000 languages in the world, and it is difficult to construct for every language pair Domain diversity Construct in every domain is not an easy task, even for the language pairs that have rich resources

Problems Caused by Scarceness of Parallel Corpora The coverage problem Scarceness makes the coverage of the translation model low, leading to high out of vocabulary (OOV) word rates [Callison-Burch+ 2006] It also occurs when the domain shifts [Irvine+ 2013] The accuracy problem (Focus of this study) The quality of the translation model correlates with the quality and quantity of parallel corpora, and scarceness makes it inaccurate [Irvine+ 2013]

Phrase-based SMT [Koehn+ 2003] Source sentences f1 ||| e1 ||| φ(f1|e1) lex(f1|e1) … f2 ||| e2 ||| φ(f2|e2) lex(f2|e2) … f3 ||| e3 ||| φ(f3|e3) lex(f3|e3) … ・ Phrase table Parallel corpus Word alignment Decoder Translations Examples of word alignment have been shown in the fragment extraction part

Accuracy Problem of Phrase-based SMT φ(f|e) lex(f|e) φ(e|f) lex(e|f) Alignment 失业 人数 unemployment figures 0.3 0.0037 0.0769 0.0018 0-0 1-1 number of unemployed 0.1333 0.0188 0.1025 0.0041 1-0 1-1 0-2 . unemployment was 0.3333 0.0015 0.0256 6.8e-06 0-1 1-1 1-2 unemployment and bringing 1 0.0029 5.4e-07 0-0 1-0 ※ φ(f|e) and φ(e|f): inverse and direct phrase translation probabilities ※ lex(f|e) and lex(e|f): inverse and direct lexical weightings Caused by sparseness of the parallel corpora Word alignment errors Translation probability overestimations for rare word and phrase pairs

BLE-based comparable feature estimation Improving Accuracy Using Bilingual Lexicon Extraction (BLE) [Klementiev+ 2012] Phrase table f1 ||| e1 ||| φ(f1|e1) lex(f1|e1) … F1(f1,e1) F2(f1,e1) … f2 ||| e2 ||| φ(f2|e2) lex(f2|e2) … F1(f2,e2) F2(f2,e2) … f3 ||| e3 ||| φ(f3|e3) lex(f3|e3) … F1(f3,e3) F2(f3,e3) … ・ ・ ・ ・ ・ ・ Parallel corpus BLE-based comparable feature estimation Comparable corpora are for more available than parallel corpora Comparable corpora

Bilingual Lexicon Extraction (BLE) Zh: ... 市场经济,又称自由市场经济,是一种经济体系,在这种体系下产品和服务的生产及销售完全由自由市场的自由价格机制所引导,而不是像计划经济一般由国家所引导。市场经济也被用作资本主义的同义词,但是绝大多数的社会主义国家也实行了市场经济。 ... A market economy is an economy in which decisions regarding investment, production and distribution are based on supply and demand, and prices of goods and services are determined in a free price system. The major defining characteristic of a market economy is that decisions on En: ※ Example of comparable texts describing “market economy” from Wikipedia (Bilingual lexicons are linked with bleu lines).

BLE-based Comparable Feature Estimation (1/2) Contextual similarity: similarity between context vectors [Rapp+ 1999] …一定 成绩 , 经济 增长 失业 人数 减少 人民 生活… 失业人数: <上涨:0,经济:1.21,衰退: 0・・・> (projection via a seed dictionary) 失业人数: <rising: 0, economic: 1.21, recession: 0・・・> Sim=1.4e-06 unemployment figures: <rising: 2.37, economic: 0, recession: 3.94・・・> The similarity is unreliable because of the sparseness of the vectors!

BLE-based Comparable Feature Estimation (2/2) Topical similarity: similarity between topical occurrence vectors estimated from Wikipedia Temporal similarity: similarity between temporal occurrence vectors estimated from temporal information associated news articles 失业人数: <Topic1: 3, Topic2: 0, Topic3: 0・・・> Sim=1e-07 unemployment figures: <Topic1: 0, Topic2: 1, Topic3: 0・・・> BiLDA can be used! 失业人数: <Date1: 0, Date2: 0, Date3: 2・・・> Sim=0.1942 unemployment figures: <Date1: 1, Date2: 0, Date3: 6・・・>

Solutions of the Data Sparse Problem for Contextual Similarity Smoothing a word’s context vector with its nearest distributional neighbors [Pekar+ 2006] Nearest distributional neighbors can have different meanings and introduce noise Not phrasal level Using synonym sets in WordNet to smooth a word’s context vector [Andrade+ 2013] WordNet is not available for all languages

Paraphrases A paraphrase is a restatement of the meaning of a text or passage using other words. -Wikipedia Category Examples Lexical (synonym) grant ||| subsidy, 10/17/01 ||| 17/10/2001 One-To-Many deleting ||| the deletion, surpluses ||| the excess Phrasal china-u.s. and ||| sino-us and Syntactic we [MD,1] solve [NP,2] ||| we [MD,1] resolve [NP,2] # Category and examples are from The Paraphrase Database (PPDB) [Ganitkevitch+ 2013] # Paraphrase also can be on sentence and paragraph level

Paraphrase Extraction Extract from parallel corpora [Bannard+ 2005] Extract from monolingual corpora based on distributional similarity [Marton+ 2009] 人数 整体 就业 及 失业 人数 the overall employment and unemployment figures number of unemployed ( not seasonally adjusted ) 失业 人数 ( 不经 季节 性 调整 )

Paraphrases for SMT (1/2) Unknown word or phrase paraphrasing to improve the coverage [Callison-Burch+ 2006]

Paraphrases for SMT (2/2) Paraphrase lattice and lattice decoding [Du+ 2010] Incorporate as additional training data [Pal+ 2014], which may improve both the coverage and accuracy

Proposed Method Phrase table BLE-based comparable feature estimation f1 ||| e1 ||| φ(f1|e1) lex(f1|e1) … F1(f1,e1) F2(f1,e1) … f2 ||| e2 ||| φ(f2|e2) lex(f2|e2) … F1(f2,e2) F2(f2,e2) … f3 ||| e3 ||| φ(f3|e3) lex(f3|e3) … F1(f3,e3) F2(f3,e3) … ・ ・ ・ ・ ・ ・ f1 ||| f2 ||| p(f1|f2) f1 ||| f3 ||| p(f1|f3) ・ ・ ・ Paraphrase e1 ||| e2 ||| p(e1|e2) e1 ||| e3 ||| p(e1|e3) BLE-based comparable feature estimation (Vector smoothing with paraphrases) Parallel corpus BLE-based comparable feature estimation Comparable corpora

Paraphrase Overlap Different from synonyms, paraphrases may overlap It is necessary to consider overlap when using paraphrases for vector smoothing Overlapped paraphrases’ context, topical and temporal occurrence vectors contain overlapped information so many years ||| many years first thing ||| first thing that mass media , ||| media , # Examples from the paraphrases extracted from Zh-En NIST data

Context vector Smoothing with Paraphrases x and xi may overlap Combined vector n: a set of paraphrases for phrase x Frequency Phrase x’s vector Paraphrase probability Paraphrase’s vector unemployment figures: <rising: 2.37, economic: 0, recession: 3.94・・・> Smoothing unemployment figures: <rising: 0.03, economic: 0.06, recession: 0.04・・・> Note that smoothing is done for both source and target vectors

Topical and Temporal Occurrence Vector Smoothing with Paraphrases Combined vector n: a set of paraphrases for phrase x x and xi may overlap Phrase x’s vector Paraphrase probability Paraphrase’s vector unemployment figures: <Topic1: 0, Topic2: 1, Topic3: 0・・・> Smoothing unemployment figures: <Topic1: 0.12, Topic2: 1.27, Topic3: 0.05・・・>

Dataset Parallel corpus: Zh-En NIST (991k sentences) (contextual similarity) Comparable corpora: Zh-En Wikipedia (248k article pairs) (topical similarity) Zh & En Gigaword 5.0 (temporal similarity) Seed dictionary: Zh-En NIST translation lexicon (82k entries)

MT Experimental Settings Training: Zh-En NIST parallel corpus (991k sentences) Tuning and testing: NIST MT02 (878 sentences with 4 references) and NIST MT03 (919 sentences with 4 references) Decoder: MOSES [Koehn+ 2007] (Zh to En translation) Language model: 5-gram LM trained with SRILM on the En side of the parallel corpus Compared MT performance by appending the comparable features to a baseline system

MT Results † †‡ †‡ BLEU-4 ‡ ※ Baseline: does not use comparable features ※ +Contextual, +Topical, +Temporal and +All: append contextual, topical and temporal features respectively and all the three types of features ※ “†” and “‡” denote that the result is significantly better than Baseline and Klementiev+ respectively at p < 0.05

Examples of Comparable Feature Scores Contextual Topical Temporal 失业人数 unemployment figures 1.4e-06 1e-07 0.1942 number of unemployed 0.0144 0.0236 . unemployment was 0.0107 0.0709 unemployment and bringing ※ Estimated by [Klementiev+ 2012] f e Contextual Topical Temporal 失业人数 unemployment figures 0.0749 0.5434 0.4307 number of unemployed 0.0522 0.1907 0.5983 . unemployment was 0.0050 0.0117 0.0967 unemployment and bringing 5.1e-05 1e-07 0.0073 ※ Estimated by our proposed method

Conclusion We improved SMT accuracy using BLE with paraphrases to estimate comparable features from comparable corpora Future Work Generate paraphrases from external parallel corpora and monolingual corpora Apply our method other SMT models