知识与资讯
翻译行业
 
构建高效开放的翻译业务管理系统
发布时间:2011-8-30 13:53:00||  点击:2731次||  文章分类:翻译行业||  发布人:翻译家(Fanyijia.com)



 
 
作者:马睿
 

【内容提要】
翻译工作的信息化既是大批量翻译任务和翻译企业形成的推动力量,也是翻译产业化的必由之路,因此成为目前翻译企业占领市场份额的核心竞争力所在。作为中国成立最早、最先走向翻译服务市场的翻译企业,中国对外翻译出版公司近几年集中人力和财力资源,大力推进了公司翻译业务的信息化建设。本文系统地论述了中译公司在将信息技术应用于翻译业务管理方面的思路和实践,就中译公司在计算机辅助翻译、翻译工作站系统、翻译项目管理等方面的总体思路和具体实施做了较为深入详细的介绍。

【关键字】

翻译信息化、计算机辅助翻译、基于实例的语料库、翻译资源数据库、翻译工作站、翻译项目管理

【正文】

信息化——翻译产业化的必由之路和翻译企业的核心竞争力

随着全球化程度的不断加深、中国对外开放程度的不断深入、各行业对外交流与合作的愈加频繁和信息本地化需求日益增加,给中国的翻译服务商带来了前所未有的市场机遇,使得翻译作为中国的新兴产业以飞快地速度初步成长起来。面对如此巨大的市场潜力和相当丰厚的利润空间(统计数字为35-45%),近年来各类翻译企业纷纷抢占先机,争取市场份额。有些实力较强的翻译服务企业具有一定的专业化程度和较大的业务吞吐量,同时展开各类行业协作,在相当程度上推进了中国的翻译产业化进程。但从世界范围来看,中国的翻译市场化进程已经落后,翻译市场缺乏自律性,在宏观和微观上均存在着大量混乱状态和明显缺陷。这一局面为中国的翻译服务业带来了巨大隐患——面对国际大资本的强大冲击,没有足够的资本、缺乏先进的经验积累和完善市场体系的中国翻译服务业将无法应对挑战。因此,翻译产业化就成为中国翻译服务界的一个重要命题和共同任务。翻译产业化的实现途径很多,包括翻译队伍的组建、从业人员准入条件的途径等等,其中一个重要途径就是翻译信息化,即广泛利用计算机、辅助翻译软件、互联网、各类文字检索工具、语音输入工具等信息时代的手段实现翻译工作的现代化。

翻译信息化的研究和实践工作由来已久,其中最为典型和广为人知的,就要算是机器翻译的研究了。进入90年代以后,计算机和网络技术的广泛应用和这类企业的迅猛发展加速了全球化进程,给翻译带来了巨大的商机。跨国公司在全球市场上出售其产品时,往往需要将整套的操作手册译成多种语言,这些翻译的数量巨大,超出了单纯的人工劳动可以完成的范围,且必须具备术语一致性和翻译的连贯性,其本身既对机器翻译和计算机辅助翻译的深入研究和实用性提出了新的要求,又成为后者不可轻视的巨大市场。从这个意义上说,翻译产业化本身就与信息技术有着密不可分的关系,信息化技术的发展在相当大的程度上推动了大型翻译市场的形成,成为大型翻译服务企业存在的理由。

另一方面,信息化技术在翻译工作中的应用大大提高了翻译的劳动生产率,在相当程度上转变了翻译的劳动生产方式,因而成为翻译产业化中起决定作用的一个重要因素。虽然由于汉语语言的特点,目前与汉语有关的机器翻译研究成果还不能令人满意,但信息化技术确已从各个方面深入到我国的翻译企业中。从翻译过程中使用的文字处理技术、语音输入技术、各类电子辞典、术语库和语料库、计算机辅助翻译工具和全文检索工具,到整个翻译企业范围的远程翻译、术语和语料数据的维护和管理、项目数据记录和管理、远程项目管理、在线翻译和客户在线进度查询,都从各个方面以前所未有的广度和深度提高了翻译的劳动生产率,改善了翻译成品的质量和翻译项目的管理水平,实现了翻译劳动生产方式的巨大转变。正是从这个意义上,说翻译业务和项目管理的信息化程度是翻译服务企业的核心竞争力所在,实不为过。

一、                 中译公司的翻译信息化建设思路

作为中国最早成立、最先走向翻译服务市场的翻译服务企业,中国对外翻译出版公司(以下简称“中译公司”)近年来充分认识到信息化建设对于企业生存和发展的必要性和重要性,并在自身人才和资源实力的基础上,逐步地、系统地开展了符合本企业特色的翻译信息化建设。在这方面,中译公司恪守围绕自身资源优势、业务优先,信息化建设首先要为业务服务的原则,避免了国内机器翻译和自然语言处理技术研究中存在的脱离实际的弊端。一方面以基于实例的语料库为基础,建立翻译工作站(Translation Workbench),在整个公司建立起先进的项目管理流程,实现公司业务发展与信息化建设同步。另一方面,建立高效开放的翻译业务管理平台,对各类信息技术发展成果、计算机辅助翻译研究成果和商业化产品均不排斥,从而最大限度地利用最新的技术发展,为公司业务服务,是中译公司翻译信息化建设的基本思路。

如前所述,机器翻译研究由来已久[1],历来有两大派别,一是基于规则的机器翻译系统,二是基于语料的机器翻译系统[2]。而在基于语料的机器翻译系统中,又分为基于统计的机器翻译系统和基于实例的机器翻译系统两种。基于规则的机器翻译系统更突出各语种语言学规则的研究,而由于汉语本身的特点及其与西语语言的差异[3],这一研究方向要想获得实用性强的商业化成果,还需要相当长时间的努力。中译公司认为,目前的计算机辅助翻译技术已经在相当程度上(还须必要的人工审核)能够做到句子、段落乃至短语一级的对齐,且已能够实现实例匹配检索,按匹配度的大小对相似译文进行排列。这是我们建立基于实例的语料库的技术条件。另一方面,中译公司在建设基于实例的语料库方面有着无与伦比的资源优势,即中译公司在其30多年的翻译服务中,特别是在为联合国系统提供服务的过程中,积累了大量对应工整的、高质量的多语种翻译资源,这些翻译资源大多具有明显的机构和学科特色,只需经过简单的加工审核,便可立即转化为可用的实例翻译语料库,并在对其进行分类维护的基础上投入业务中使用,像雪球一样越滚越大。正是基于这两点,中译公司在建设语料库和翻译业务系统的过程中,翻译资源数据库建库的理论基础就是基于实例的语料库建设和维护管理。

另外,在系统构建思路方面,近年来汉语语言服务提供机构已大多放弃了智能机器翻译的道路,转而采取计算机辅助翻译技术和建设“翻译工作站”的思路。翻译工作站构想起源于20世纪90年代,是将各种以计算机为基础的翻译设施加以集成,包括多语种文字处理技术、收发电子信息、OCR文字识别工具、术语管理软件、文字索引和集列工具以及最重要的,“翻译记忆库”技术。自90年代以来,计算机和网络技术又有了很大的发展,因此可用技术的范围又进一步拓展,加入了全文检索技术、语音输入技术和网络信息收集和查询引擎等。显然,在翻译工作中引入项目机制,将这些技术高度集成并应用于项目中,配以与项目组并行的支持队伍进行技术支持和数据支持,再对项目进行现代化、集约化的管理控制,无疑能够将翻译工作站的工作范围延展到公司领域,在整个组织内建设一个高度集成的翻译业务管理系统。中译公司的翻译业务管理系统具有其自身的特点:它是一个以本公司30多年翻译业务中积累的大量多语种对译的翻译资源为基础、并服务于翻译业务的系统,而非基于机器翻译和自然语言处理技术研究并服务于研究的系统;它是一个集成各类现成的工具和技术、追求公司成本效益的系统;它是一个强调以人为主、以计算机为辅、免去翻译重复劳动而突出翻译工作的创造性的系统;它是一个引入项目机制、强调企业整体协作和支持的、突出现代化企业管理水平的系统;它是一个可吸收各种符合统一业界标准的新技术、对任何一种信息技术和工具都不排斥,只要符合需要便大胆“拿来”、将其纳入本企业业务管理流程的开放的系统。

二、                 中译公司多语种翻译资源数据库及其应用系统

在以上两点建设思路,即基于工整的、高质量的实例翻译对建设语料库、并以该语料库为核心采取“翻译工作站”建设途径的理论指导下,中译公司于2004年成立了专门的数据中心,开始了“多语种翻译资源数据库及其应用系统项目”的建设工作。该项目采取数据中心策划监控,项目建设外包的方式,共分六期,目前一期项目已开始分批交接使用,可望在2006年6月下旬开始试运行,8月底正式投入使用。值得一提的是,在项目建设的前期,公司数据中心和公司领导对国内外最先进的计算机辅助翻译和数据库技术和工具进行了考察,先后前往加拿大翻译署、纽约联合国总部、国际货币基金组织和世界银行、联合国日内瓦办事处、维也纳办事处和巴黎教科文组织考察了术语数据库、翻译语料库、为经认证用户提供的在线词汇资源的建设和应用,以及计算机辅助翻译和各类信息技术在这些机构的使用情况,并建立了数据交流和合作机制,为今后中译公司与这些客户和合作伙伴开展数据交流和共享铺平了道路。

中译公司多语种翻译资源数据库及其应用系统的建设构想的依据有以下几点:一是中译公司对翻译工作的工作流特点的分析和理解;二是中译公司30多年来为各类客户和客户群提供翻译服务所积累的对应工整的多语种翻译语料资源,由于中译公司拥有相当一部分长期稳定的客户群,如国际组织、驻华机构、国内政府机关、企业、法律、金融、医药卫生等等,其所积累的翻译语料和术语具有一定的机构特征或分属于某一学科类别,完全可以进行分类管理和维护,同时客户群的长期稳定性也使得这些语料库和术语库建成即可立即投入使用,且在相当程度上保证了使用效率。试想,如果一个翻译资源数据库中保存的是从某些文学作品如《红楼梦》或莎士比亚戏剧中抽取的语料,则该语料库建成后的使用范围相当有限,其在翻译企业中使用效率也必然是极低的;三是中译公司根据自身30多年的翻译服务提供经验,并结合当前翻译产业化对翻译服务提供商提出的要求,定制开发出符合自身特点的项目管理流程,这一项目管理流程突出以人(客户-译者)为本,以数据库为依托,深入流程中的每一个环节、贯穿项目始终的原则,其对于翻译服务提供质量和效率的作用绝不亚于翻译资源库的建设。以下笔者将就以上第一和第三点进行较为详细的论述。

任何一个翻译工作站、机器辅助翻译系统和此类模型系统的设计,其前提都是对翻译工作的过程及其特点进行认真细化的分析,中译公司自然也不例外。对于任何一个翻译项目而言,其最基本的工作模式无非由以下几个环节组成:
 


在传统的工作模式下,以上的前四个环节都是依靠译者独立手工完成的,前四个环节结束即意味着翻译工作的结束,没有后续的数据回收和管理维护环节,从而导致了大量宝贵的翻译资源的流失,后来的翻译人员不得不在前人已经耕耘过的土地上再次开垦。而当前通用的计算机辅助翻译系统中,计算机所参与的环节包括资料收集(建立数据库和网上资源收集)、资料加工(术语库和语料库的建库)、知识处理、数据交换、文字处理等等。中译公司在对翻译工作环节进行分析的基础上,对这一通用的计算机辅助翻译系统加以专业分工和细化,使计算机、数据库和网络技术能够最大程度地为翻译工作服务。

资料收集。资料收集包括两种:一是从当前客户以前所作的项目中收集对译语料和术语,二是通过互联网搜索引擎和传统渠道收集背景资料,将其加工成为可用的语料和术语。在此,中译公司突出了大型翻译服务企业的优势,成立了专门的数据中心,为译者提供数据支持和服务。中译公司数据中心的术语编辑多具有一定的学科背景和中高级以上的翻译资质,一方面,这些术语编辑要对我们以往积累的翻译资源和每天业务产生的翻译原件和成品进行审核和加工,分类录入到多语种翻译资源数据库中。另一方面,数据中心还将在翻译部收到大型紧急项目时,临时抽调术语编辑为这些项目整理语料和术语,并广泛收集数据,将传统的纸版词典扫描识别,按设定的格式入库,将在互联网上搜索到的单语资料加工成单语语料录入到背景资源库中,并进行索引和关键词标注。专门成立一个部门,由高质量的术语编辑进行资料收集和入库工作,是中译公司对翻译过程进行细化专业分工的一个重要举措。目前虽然项目建设尚未完成,但由术语编辑为翻译项目提供数据支持的做法已在全公司开展起来,并受到了翻译部门的大力欢迎。

原文分析。翻译工作中的原文分析环节主要是由译者进行的,译者根据术语编辑提供的数据支持,在参考资料的辅助下进行原文分析。但在中译公司的系统构想中,还将在整个项目过程中引入原文预处理和查重环节,尽量减少翻译工作中的重复劳动,不仅能够最大限度地发挥翻译工作者的创造性,还能够在相当大地程度上提高翻译企业的工作效率(可提高25%以上)。

原文翻译。翻译过程是整个工作流的核心环节,到目前为止,这是翻译工作中最不可为机器所替代的,但在中译公司的开放的翻译工作站系统中,通过各种计算机和网络技术的使用,原文翻译的效率可以大大提高(30%)。首先,计算机辅助翻译工具的使用。在中译公司的多语种翻译资源数据库及其应用系统中,计算机辅助翻译工具的使用具有重要地位。当前的计算机辅助翻译产品均支持翻译记忆交换标准(Translation Memory Exchange,简称TMX),从而方便了翻译记忆产品之间的数据交换。上文提到,多语种翻译资源数据库及其应用系统是一个开放的系统,其最主要的特征就是,语料库和术语库采用通用架构和标准SQL语言,可以方便地转换成各种数据库结构,挂在各类计算机辅助翻译软件产品上使用。除了可以方便地使用术语库和语料库以外,使用计算机辅助翻译软件的另一个好处就是其大多支持多种常用的文档格式(DOC、RTF、HTML、SGML、PPT、FM、MIF等),不需要对翻译结果进行重新排版[4]。中译公司的翻译工作站系统还广泛吸收了各种其他具有提高效率的辅助作用的技术,如全文检索技术和语音输入技术等。引入项目机制后,翻译人员可在翻译过程中随时向项目组长发出问题请求,这些问题及其解答都将在整个项目组共享并在一个数据库中记录下来,保证了翻译项目的整体质量和项目资源的共享和保存,也是提高效率的一大举措。

译文审校。在整个翻译工作流程中,译文审校可谓计算机参与最少的一个部分。许多审校认为,在计算机辅助翻译工具所提供的断句后的界面上进行译文审校不利于对译文全局性的把握,且在这一环节,各种辅助工具对于提高效率的作用也确实不明显。然而,根据中译公司30多年的翻译服务经验,翻译工作的特点要求其质量控制主要集中在前端,如果前期的组稿和数据支持等工作没有做好、翻译质量太差的话,选派再优秀的审校有时也无济于事,时效性很强,客户催得很紧的大型项目尤其如此。所以,引入项目机制,在翻译项目的前端加强管理和质量控制,也可以大大提高译文审校的效率。

数据全程管理。翻译项目结束时,数据中心的术语编辑将对翻译原件和成品件进行回收,过滤客户相关信息后,分别对其进行整理入库。数据管理在中译公司的翻译工作站系统中占据核心地位,因为就当前翻译术语库和语料库的使用而言,使用效率的高低从根本上取决于这些术语库和语料库的分类管理。无庸讳言,当前使用语料库和术语库的计算机辅助翻译技术应用最多的领域就是本地化,而在社科领域的应用不多,效果也极不明显。对于不同类型的项目,翻译数据使用的效率有着很大的区别。由于科学技术类翻译本身涉及很多外来词汇,且很少存在文化差异,所以翻译数据在这一领域的使用效率应该是最高的。引入项目机制,建立一个数据库对项目信息进行记录和管理,并在其与翻译资源数据库之间建立关联,是中译公司提高翻译资源数据库使用效率的一个重要思路。换句话说,在中译公司的多语种翻译资源数据库中,所有的翻译记忆库、语料库和术语库都是按照一定的学科类别、机构来源、客户来源等属性严格分类管理的,前面提到的(单语)背景资源库也将建立起关键词索引并将其与特定项目建立关联,这是当前计算机辅助翻译研究和实践领域的一个共同的思路。北京大学计算语言所即于近年来专门展开了“面向新闻领域的汉英机器翻译系统”和“面向中文学术专著的机器辅助翻译系统”等研究和双语平行语料库的构建[5]。中译公司的翻译业务涉及自然科学和社会科学的各个领域,在我们看来,一个高效开放的翻译工作站系统完全可以面向任何领域,同时中译公司又拥有大量涉及各个领域的高质量的翻译数据资源,使我们完全有条件搭建一个多语种翻译资源数据库,但在这个庞大的多语种数据库中进行分语种、分学科、分机构、分项目的多级分类管理,是该数据库使用效率的最根本保证。

项目管理。从全球范围来看,项目和项目管理概念的引入既是翻译产业化提出的要求,又在很大程度上推进了翻译的产业化进程。Celia Rico Pérez博士在其题为“翻译和项目管理”的文章中指出,全球化趋势以及信息和网络技术的发展使得翻译产业不得不引入新的项目管理技巧,只有这样,翻译产业才能处理以往不可想象的翻译业务量、应对日益紧张的交付日程、满足更为严格的客户需求并整合分散在全球各地的“翻译生产队伍”[6]。所谓项目组,是指翻译企业中专门为某一“具有一定时间性”、“独一无二”的翻译项目组成的协作团队,其不仅包括翻译和审校队伍,还包括前台客户服务、后台数据支持、外包服务和技术审核等。项目组的组长则需要负责协调、日程安排、项目进度跟踪、客户联络、预算控制和资源调配等任务。我们把一个翻译项目的生命周期用下图表示:
 


翻译项目的生命周期


在没有引入项目概念之前,翻译工作的任务只包括上图中的第四部分,即“译、审、校”,最多再加上前台的接单和少量的硬件支持,但这样的任务处理过程谈不上团队协作,也就始终无法摆脱作坊式的劳动作业。从上图可以看出,一个翻译项目在真正的翻译任务前添加了“计划”和“基础支持”,在翻译任务结束后添加了“项目收尾”,从而更加严格充分地进行质量控制,同时整个项目生命周期离不开一个操作环境,而在这个操作环境中,信息、网络技术和计算机辅助翻译技术有着核心的地位,前两者使得全球客户拓展、全球资源整合成为可能,使翻译项目的实施方式真正做到“全球资源调配,组织中心协调”,而后者除了提供后台支持外,还是翻译质量控制的重要因素。

目前通用的计算机辅助翻译软件能够为翻译项目提供相对集成的计算机环境,例如SDLX软件就提供翻译记忆、术语库和项目分析等机制,能够在一定程度上改善翻译过程的人机协作方式[7]。但是,就一个翻译企业,特别是像中译公司这样具有30多年历史的大型翻译企业来说,只有量身定制符合企业文化和企业习惯的项目管理和质量控制流程,才能真正在保证项目质量和时效的同时做到以人为本。整个2005年,中译公司为配合ISO 9001的认证工作认真总结了30多年的翻译服务提供经验,进一步完善了翻译项目版本管理、进度跟踪、突发事件(如人员变更、工作交接、硬件坏损等)应对措施、数据支持与数据回收和质量检查记录、客户反馈处理等流程。这些流程都将在“多语种翻译资源数据库及其应用系统项目”中以电子化形式体现并备份在数据库中。同时,中译公司多年的经验表明,动态维护一个大规模、高质量、全球范围的译者库对于翻译质量控制有着核心的重要作用,因此该系统还将在一个数据库中动态保存和管理全球译者资源信息,使之真正成为一个整合客户资源和译者资源的数字化翻译平台。

参考文献

1.1.         柏晓静、常宝宝、詹卫东,构建大规模的汉英双语平行语料库,见黄河燕主编,《2002全国机器翻译研讨会文集:机器翻译研究进展》,北京:电子工业出版社,2002年
2.          柏晓静、俞士汶,面向中文学术专著的机器辅助翻译研究,见《中国翻译》,2006年第2期
3.          常宝宝、柏晓静,北京大学汉英双语平行语料库标记规范,见《汉语语言与计算学报(新加坡)》,2003年第2期
4.          冯志伟,《机器翻译研究》,北京:中国对外翻译出版公司,2004年12月
5.          Hutchins, John. “The development and Use of Machine Translation Systems and Computer-based Translation Tools”. Available at    http://www.foreignword.com/Technology/art/Hutchins/hutchins99.htm.
6.           Pérez, Celia Rico, “Translation and Project Management”. Available at   http://accurapid.com/journal/22project.htm (October 2002).
7.           石东、郭洁,翻译经济——期待产业化,见《瞭望》新闻周刊,2003年11月24日第47期
8.           俞士汶、段慧明、朱学锋、张化瑞,综合型语言知识库的建设与应用,见《中文信息学报》,2004年第5期
9.          中央编译局翻译服务部,《翻译市场浅析》,见中国译协网,网址:http://www.tac-online.org.cn/fyhy/txt/2005-06/26/content_79902.htm


--------------------------------------------------------------------------------

[1]由于本段主要谈及几种语料库建设方法的历史,而这些语料库建设的最初目的就是为了进行机器翻译系统建设的,因此本段沿用了“机器翻译系统”一词。事实上,下文将指出,中译公司早已放弃了“机器翻译”的思路,而采取了计算机辅助翻译和翻译工作站的建设思路。
[2]冯志伟:《机器翻译研究》,中国对外翻译出版公司2004年版。P35-52页。
[3]从机器翻译来看,汉语有五大明显不同于印欧语言的特点:汉语缺乏印欧语言那样丰富的形态;汉语的语素、单词和词组之间的界限模糊;汉语的此类和它们的语法成分之间没有明确的一一对应关系;汉语的句子成分和语义关系之间没有明确的意义对应关系;以及,汉语书面语没有分词连写,使得自动切词成为汉语自动分析的一个特殊问题。以上这五大特点都是在进行汉语自动分析并探讨汉语机器翻译的过程中所需解决的问题和难题。冯志伟,P660-672页。
[4]冯志伟,p65。
[5]“面向中文学术专著的机器辅助翻译研究”,《中国翻译》2006年第二期。
[6] “Translation and Project Management”,http://accurapid.com/journal/22project.htm (October 2002).
[7] “面向中文学术专著的机器辅助翻译研究”,《中国翻译》2006年第二期,P79 。
 
 



  更多文章