计算机辅助翻译的学习不能局限于某一个计算机辅助翻译软件的操作,而应倾向于“知识侧重论”,倾向于理解该软件设计的脉络和原理,对软件设计背后的基本概念和基本原则的理解,是计算机辅助翻译学习的基本要求。
《计算机辅助翻译基础》分为基础知识、翻译与信息科学、文档格式处理的自动化、术语管理与翻译、翻译记忆库、翻译记忆库等章节,旨在能让读者提供高效的、高质量的翻译服务。
《论语·卫灵公》中有云:“工欲善其事,必先利其器”。这句话为人们所熟知,其道理也很简单:要想把事情做好,工具必须好使,如此才能事半功倍。计算机辅助翻译的出现、发展和流行,与“工欲善其事,必先利其器”的思想是一脉相承的。计算机辅助翻译学习和研究的主要目标,就是借助信息技术来优化人工翻译过程,以提供更好、更快的翻译服务。无论是翻译专业(或语言专业)的学生,还是翻译工作者,提供高效、优质的翻译服务是他们的共同愿望,当然也深知“工欲善其事,必先利其器”的道理。由是,经过业界诸多专家、学者近十年的倡导和推广,熟悉计算机辅助翻译技术的人员越来越多,计算机辅助翻译技术应用领域也越来越广,这是一个可喜的现象。
然而也应该看到,计算机辅助翻译技术的推广面临越来越大的阻力。这种阻力来自于两个方面。首要的方面是机器翻译的高速发展。基于深度学习的机器翻译技术在过去几年里发展迅猛。一些研究表明,在一些特定的领域(如新闻)中,机器翻译的译文水平已经达到甚至超过了人工翻译。由此而产生的疑问是:如果机器已经可以完成翻译任务,翻译过程不再需要人的参与,自然也就不再需要计算机辅助的人工翻译,那么还有必要学习计算机辅助翻译工具吗?
另一方面的阻力是计算机辅助翻译学习的难度。虽然计算机辅助翻译已经为越来越多的人所知晓,然而其仍然是一个陌生且令人望而却步的领域,如山上云雾中的亭台楼阁,依稀可见,却难以看得清楚,难以真正了解。导致这一现象的原因有很多。其中主要的原因是这一领域的学习内容、学习方法与语言学习的课程大相径庭。语言学习课程包括各种语言技能训练课程、文化知识课程、语言文学理论课程等,强调记忆、联想、宏观理论推导和思辨。然而,计算机辅助翻译是信息技术和工具的运用,侧重翻译过程中问题的解决。这些问题,如标点符号的准确使用、格式的标准化、术语翻译的一致性、翻译记忆库的制作等,大多具体、琐碎、相互关联。因此,语言课程中的各种学习方法难以有效迁移到计算机辅助翻译的学习之中。另一个重要原因是,对于大多数语言专业的学生而言,计算机的运作如同黑匣子一般。计算机辅助翻译涉及各种信息技术专业知识,如文字编码、文件格式与转换、数据库操作、软件界面交互,甚至算法等,计算机操作中严谨的逻辑推理、烦琐的操作步骤以及复杂的参数设置都令人无所适从。
如上所述,一方面,技术的发展使得计算机辅助翻译技术的学习看起来似乎已经不再需要;另一方面.计算机辅助翻译技术难以掌握。那么,为什么还需要学习计算机辅助翻译技术呢?我们认为,上述对计算机辅助翻译技术及其应用的理解是不全面的。当前基于深度学习的机器翻译技术,如同其他基于深度学习的人工智能技术一样,必须满足丰富数据和知识、完全信息、确定性信息、静态、单领域和单任务的要求。机器翻译的成功依赖于超大规模的平行语料库数据,其性能也受到单一领域的局限,难以跨领域移植。更为重要的是,语言作为人类的交际工具,具有明显的创造性、动态性和不确定性特征。这些特征都是当前基于深度学习的人工智能技术无法解决的。从这个角度看,机器翻译的应用必然受到数据规模、语言动态性和创造性的局限。高级别的人工翻译具有其不可替代性。翻译行业仍然需要依赖于人工翻译提供服务,机器翻译也需要依赖于人工翻译提供数据。
此外,计算机辅助翻译技术与机器翻译技术两者并非两种“井水不犯河水”的技术。相反,许多计算机辅助翻译技术都是以机器翻译技术为基础,两者在本质上都是自然语言处理技术的应用。如同机器翻译一样,计算机辅助翻译的最主要应用,就是拓展翻译工作者的信息处理能力,提高翻译服务的质量和效率。译后编辑模式的发展,就是结合计算机辅助翻译技术与机器翻译技术,应对不同场景需求,提升翻译效率和质量的例证。
因此,我们认为,在人工智能快速发展的时代,计算机辅助翻译技术的学习不是没有必要了,反而是变得更为重要、更为紧迫了。机器翻译技术的进步对翻译工作人员提出了更高的要求。面对机器翻译的挑战,翻译工作者应积极了解机器翻译和自然语言处理技术,积极将相关技术应用于翻译实践,运用相关技术拓展自身的信息处理能力,如此才有可能立于不败之地。
唐旭日,博士,华中科技大学外语学院翻译系主任,副教授。研究方向为计算语言学,涉及命名实体识别、隐喻计算、词义演化计算、构式聚类、语义韵、计算机辅助翻译等。主持国家社科基金研究项目一项,教育部自主创新项目一项,校级自主创新及湖北省教育厅社科项目多项,并作为主要成员参与国家863高新技术、国家自然科学基金以及国家社科基金等多项重量课题,在World Wide Web、International Journal of Corpus Linguistics、Natural Language Engineering、 Corpus Linguistics and Linguistic Theory、《武汉大学学报(信息科学版)》、《中文信息学报》、《当代语言学》、COLING等非常不错刊物和学术会议上发表论文20多篇,出版教材一部。
第一章 基础知识
1.1 字符编码
1.1.1 ASCII编码
1.1.2 汉字编码
1.1.3 Unicode编码
1.1.4 UTF-8编码
1.2 自然语言处理技术
1.2.1 语言及其定义
1.2.2 自然语言处理技术
第二章 翻译与信息科学
2.1 传统翻译过程及其局限性
2.1.1 微观层面的局限性
2.1.2 宏观层面的局限性
2.2 信息技术与翻译
2.2.1 信息技术与翻译主体
2.2.2 信息技术与翻译过程
2.2.3 信息技术与翻译效率提升
2.3 历史与未来
2.3.1 计算机辅助翻译的历史
2.3.2 计算机辅助翻译的未来
2.4 计算机辅助翻译研究框架
第三章 文档格式处理的自动化
3.1 文档格式与翻译
3.2 文档格式自动化的原理
3.2.1 可译字串与不可译字串
3.2.2 文件格式的自动化
3.3 SDL Trados Studio与版面格式自动化
3.3.1 软件格式支持类型
3.3.2 翻译单个文档
3.3.3 可译字串抽取
3.3.4 不可译字串的显示与处理
3.3.5 源语言替换
第四章 术语管理与翻译
4.1 术语的确认
4.1.1 术语的定义
4.1.2 术语的表现形式
4.2 自动术语抽取
4.2.1 候选术语生成
4.2.2 术语识别原理
4.2.3 术语抽取实验
4.3 术语数据库的构建
4.3.1 术语知识微观描述框架
4.3.2 术语库的构建
4.3.3 术语更新
4.4 术语数据库的使用
4.5 术语管理策略
第五章 翻译记忆库
5.1 什么是翻译记忆库
5.2 翻译记忆库的应用模式
5.2.1 SDL Trados Studio中的预翻译模式
5.2.2 SDL Trados Studio中的句段模式
5.2.3 匹配率计算
5.3 翻译记忆库的构建
5.3.1 语料对齐算法
5.3.2 语料对齐工具及其使用
5.3.3 语段边界划分与翻译单位
5.4 翻译记忆库的组织与维护
5.5 翻译记忆库应用的优势与劣势
5.5.1 翻译效率方面的优势与劣势
5.5.2 翻译质量上的优势与劣势
第六章 翻译质量保证
6.1 翻译质量保证
6.2 翻译质量检测及其工具
6.2.1 翻译质量检测的原则
6.2.2 翻译质量检测工具
6.2.3 SDL Trados Studio 2015的翻译质量验证工具
6.3 翻译质量管理体系
6.3.1 《翻译服务译文质量要求》
6.3.2 《翻译质量量度》
6.3.3 《翻译质量保证标准指南》
6.3.4 《欧洲质量标准:EN一15038》与ISO17100
6.3.5 动态质量框架
第七章 翻译记忆库
7.1 本地化与翻译
7.2 软件交互界面翻译
7.3 Passolo与交互界面翻译
7.4 软件交互界面翻译原则
7.4.1 一般性原则
7.4.2 术语翻译规范
7.4.3 格式规范
7.4.4 不翻译内容
7.4.5 地名
第八章 译后编辑
8.1 定义、历史与前景
8.2 神经机器翻译
8.3 自动译后编辑
8.3.1 理据
8.3.2 自动译后编辑技术
8.4 翻译质量评估与翻译质量预测
8.4.1 翻译质量评估
8.4.2 翻译质量预测
8.5 人工译后编辑
8.5.1 译后编辑工作量指标
8.5.2 MT错误分类及其对译后编辑工作量的影响
8.6 译后编辑行为模式
第九章 正则表达式
9.1 什么是正则表达式
9.2 正则表达式的使用
9.3 正则表达式的结构与功能
9.3.1 与行的起始、结束相关的模块单元
9.3.2 字符类型组相关单元
9.3.3 搭配相关模块单元
9.3.4 词语的多种形式与译文的一致性
9.3.5 词语的重复
9.3.6 翻译赘余
9.3.7 字符的转义
9.3.8 正则表达式注意事项
9.4 常用正则表达式对应表
附录Ⅰ SDL Trados Studio 2015支持的文件类型
附录Ⅱ 质量检测工具调查
参考文献