作者:科恩,宗成庆,张霄军 日期:2014-09-05 09:16:57
PhilippKoehn所著的《统计机器翻译》是介绍统计机器翻译理论和方法的教材。全书分三部分(共11章),分别讨论基础知识、核心方法和前沿研究。全书首先简要介绍语言学和概率论基础知识,然后全面讨论各种经典统计机器翻译模型和系统实现方法,最后深入探讨统计翻译领域的最新进展和研究热点。对核心方法的论述按照统计机器翻译模型发展的过程逐步展开:基于词的模型、基于短语的模型和基于句法树的模型。从技术实现的角度,本书还介绍了统计翻译模型的参数训练方法、语言模型和参数平滑方法、解码算法和译文自动评测方法及系统整合方法等。《统计机器翻译》是统计机器翻译和自然语言处理课程的理想教材,适合研究生和本科生教学使用,也是所有对机器翻译技术和系统有兴趣的研究者、开发者和使用者的指南性读物。同时,本书还可作为人工智能、语言学等相关专业的辅助读物。
目录:
第1章 绪论 1.1 概述 1.1.1 第1章:绪论 1.1.2 第2章:词、句子和语料 1.1.3 第3章:概率论 1.1.4 第4章:基于词的翻译模型 1.1.5 第5第1章绪论1.1概述1.1.1第1章:绪论1.1.2第2章:词、句子和语料1.1.3第3章:概率论1.1.4第4章:基于词的翻译模型1.1.5第5章:基于短语的翻译模型1.1.6第6章:解码1.1.7第7章:语言模型1.1.8第8章:评测1.1.9第9章:判别式训练1.1.10第10章:整合语言学信息1.1.11第11章:基于树的翻译模型1.2机器翻译简史1.2.1肇始1.2.2ALPAC报告及其后果1.2.3首批商用系统1.2.4基于中间语系统的研究1.2.5数据驱动方法1.2.6目前的开发商1.2.7技术现状1.3应用1.3.1全自动高质量机器翻译1.3.2要旨翻译1.3.3集成语音技术1.3.4手持设备中的翻译1.3.5后编辑1.3.6译者的工具1.4可用资源1.4.1工具1.4.2语料1.4.3评测竞赛1.5小结1.5.1核心概念1.5.2延伸阅读1.6习题第2章词、句子和语料2.1词2.1.1词例化2.1.2词的分布2.1.3词性2.1.4形态学2.1.5词汇语义学2.2句子2.2.1句子结构2.2.2语法理论2.2.3句子结构的翻译2.2.4语篇2.3语料2.3.1文本的类型2.3.2获取平行语料2.3.3句子对齐2.4小结2.4.1核心概念2.4.2延伸阅读2.4.3习题第3章概率论3.1概率分布估计3.1.1估计分析3.1.2常见概率分布3.1.3基于统计的概率估计3.2概率分布计算3.2.1形式定义3.2.2联合概率分布3.2.3条件概率分布3.2.4贝叶斯法则3.2.5插值3.3概率分布的特性3.3.1均值和方差3.3.2期望和方差3.3.3熵3.3.4互信息3.4小结3.4.1核心概念3.4.2延伸阅读3.4.3习题第二部分核心方法第4章基于词的翻译模型4.1基于词的机器翻译4.1.1词汇翻译4.1.2数据统计4.1.3估计概率分布4.1.4对齐4.1.5IBM模型14.2学习词汇翻译模型4.2.1语料不完备问题4.2.2期望最大化算法4.2.3IBM模型1中的期望最大化算法4.2.4困惑度4.3确保流畅的输出4.3.1流利译文的经验证据4.3.2语言模型4.3.3噪声信道模型4.4更高级的IBM模型4.4.1IBM模型24.4.2IBM模型34.4.3训练模型3:采样对齐空间4.4.4IBM模型44.4.5IBM模型54.5词对齐4.5.1词对齐任务4.5.2词对齐质量评估4.5.3基于IBM模型的词对齐4.6小结4.6.1核心概念4.6.2延伸阅读4.6.3习题第5章基于短语的翻译模型5.1标准模型5.1.1基于短语的翻译模型提出的动因5.1.2数学定义5.2学习短语翻译表5.2.1从词对齐中抽取短语5.2.2一致性定义5.2.3短语抽取算法5.2.4应用实例5.2.5短语翻译概率估计5.3翻译模型的扩展5.3.1对数线性模型5.3.2双向翻译概率5.3.3词汇化加权5.3.4词语惩罚5.3.5短语惩罚5.3.6作为分类问题的短语翻译5.4调序模型的扩展5.4.1调序限制5.4.2词汇化调序5.5基于短语模型的期望最大化训练5.5.1短语对齐的联合模型5.5.2对齐空间的复杂度5.5.3模型训练5.6小结5.6.1核心概念5.6.2延伸阅读5.6.3习题第6章解码6.1翻译过程6.1.1翻译一个句子6.1.2计算句子的翻译概率6.2柱搜索6.2.1翻译选项6.2.2通过假设扩展的解码过程6.2.3计算复杂度6.2.4翻译假设重组6.2.5栈解码6.2.6直方图剪枝和阈值剪枝6.2.7调序限制6.3未来代价估计6.3.1不同的翻译困难6.3.2翻译选项的未来代价估计6.3.3任意输入跨度的未来代价估计6.3.4在搜索中使用未来代价6.4其他解码算法6.4.1基于覆盖栈的柱搜索算法6.4.2A*搜索算法6.4.3贪婪爬山解码6.4.4有限状态转换机解码6.5小结6.5.1核心概念6.5.2延伸阅读6.5.3习题第7章语言模型7.1n元文法语言模型7.1.1马尔可夫链7.1.2估计7.1.3困惑度7.2计数平滑7.2.1加1平滑法7.2.2删除估计平滑法7.2.3古德图灵平滑法7.2.4评估7.3插值和后备7.3.1插值7.3.2递归插值7.3.3后备7.3.4预测词的差异性7.3.5历史的差异性7.3.6修正的Kneser-Ney平滑算法7.3.7评估7.4控制语言模型的大小7.4.1不同的n元文法的数目7.4.2在磁盘上进行估计7.4.3高效的数据结构7.4.4减小词汇表规模7.4.5抽取相关的n元文法7.4.6根据需要加载n元文法7.5小结7.5.1核心概念7.5.2延伸阅读7.5.3习题第8章评测8.1人工评测8.1.1流利度和忠实度8.1.2评测目的8.1.3其他评测标准8.2自动评测8.2.1准确率和召回率8.2.2词错误率8.2.3BLEU:一个双语评测的替代指标8.2.4METEOR8.2.5关于评测的争论8.2.6评测指标的评测8.2.7自动评测不足的证据8.3假设检验8.3.1计算置信区间8.3.2成对比较8.3.3自举重采样8.4面向任务的评测8.4.1后编辑的代价8.4.2内容理解测试8.5小结8.5.1核心概念8.5.2延伸阅读8.5.3习题第三部分前沿研究第9章判别式训练9.1寻找候选译文9.1.1搜索图9.1.2词格9.1.3n-best列表9.2判别式方法的原理9.2.1译文的特征表示9.2.2标注译文的正确性9.2.3监督学习9.2.4最大熵9.3参数调节9.3.1实验设置9.3.2Powell搜索方法9.3.3单纯型算法9.4大规模判别式训练9.4.1训练问题9.4.2目标函数9.4.3梯度下降9.4.4感知机9.4.5正则化9.5后验方法与系统融合9.5.1最小贝叶斯风险9.5.2置信度估计9.5.3系统融合9.6小结9.6.1核心概念9.6.2延伸阅读9.6.3习题第10章整合语言学信息10.1直译10.1.1数字和名字10.1.2名字翻译10.1.3直译的有限状态方法10.1.4资源10.1.5反向直译与翻译10.2形态学10.2.1词素10.2.2简化丰富的形态变化10.2.3翻译形态丰富的语言10.2.4单词拆分10.3句法重构10.3.1基于输入语言句法的调序10.3.2学习调序规则10.3.3基于词性标记的调序10.3.4基于句法树的调序10.3.5预留选择10.4句法特征10.4.1方法论10.4.2数的一致性10.4.3一致性10.4.4句法分析概率10.5因子化翻译模型10.5.1因子化翻译的分解10.5.2因子化模型训练10.5.3模块的融合10.5.4高效解码10.6小结10.6.1核心概念10.6.2延伸阅读10.6.3习题第11章基于树的翻译模型11.1同步文法11.1.1短语结构语法11.1.2同步短语结构语法11.1.3同步树替换文法11.2同步文法的学习11.2.1层次短语模型的学习11.2.2句法翻译规则的学习11.2.3规则的简化11.2.4文法规则的打分11.3基于句法分析算法的解码11.3.1线图分析11.3.2核心算法11.3.3线图的组织11.3.4假设重组11.3.5栈剪枝11.3.6文法规则的使用11.3.7立方剪枝11.3.8文法二叉化11.3.9外向代价估计11.4小结11.4.1核心概念11.4.2延伸阅读11.4.3习题参考文献索引