语言研究专题

• 
• 
• 
• 


文化专题

• 
• 
• 
• 


 翻译研究专题

• 
• 
• 
• 

 

    非学术区

 

 

   语言·文化·翻译

 首 页语言研究资源 |文化研究资源 |翻译研究资源 |教学资源| 关于本站
翻译研究专题>>

 

局部对应英汉网络语料及其辅助翻译功能

贺文照 (嘉兴学院 外国语学院 浙江 嘉兴 314001

摘  要:局部对应英汉网络语料是指因特网上以汉语为主,夹杂着数量不等英语的双语文本资源。本文探讨了局部对应英汉网络语料的概念、特征、双语词典功能的实现以及运用过程应该注意的一些问题。

关键词:网络;局部对应的英汉双语网络语料;双语词典

Partial Parallel Texts of English and Chinese on the Net and Their Application in Assisting Translation

Abstracts:Partial parallel texts of English and Chinese on the net refers to the text resources mainly in Chinese with its partial equivalence in English. The author attempts to explore the definition of partial parallel texts of English and Chinese on the net, their characteristics and relevant issues concerning their application in assisting translation.

Key Words: net; partial parallel texts of English and Chinese;  bilingual dictionary

语言文化研究  语言文化翻译  

词典是翻译过程中不可缺少的辅助工具。

因特网出现以后,在词典编纂,词典的载体,以至于词典使用的观念等方面都发生了极大的变化(高永伟等 2000 秦明等 2003,张铁文 2004章宜华 2004)。网络上丰富的词典资源,迅捷的查询速度,便利的复制方式都是传统方式无法比拟的。这种变化无论对词典编纂这还是读者来说都带来了福音。尽管如此,在笔者的教学和翻译实践中,笔者感到,无论是传统的纸质词典,还是电子词典,甚至更为便捷的网络词典,都难以完全满足自己求助于词典释疑、解惑的需求。

在利用因特网搜索引擎检索信息过程中,笔者偶然发现,在浩如烟海的网络资源中蕴含着丰富的英汉双语文本资源。运用现有的免费搜索引擎,笔者轻而易举检索到内容相关,彼此相邻的双语信息,并将这些信息用于辅助翻译以及英语教学,解决了笔者不少实际问题。比如,笔者曾碰到“peer-reviewed”一词,笔者虽然知道组成该词的两个成份独立成词时的意思,但是,二者组合起来成为合成词后意思是否就等于二者之和呢?显然,这个假设需要验证。笔者查遍所有能够找到的纸质词典,电子词典和网络词典,均未果。笔者将peer-reviewed 和该词可能的意思“同……”同时输入Google。在返回的结果中,peer-reviewed出现的地方有相应的汉语上下文,笔者很快确定peer-reviewed汉语意思是“经过同行评价的刊物”,“经同侪审查的”。又例,SUV是什么意思(笔者学生最近提问并说可能是指一中车)?采用类似的方法,通过Google笔者很快得到结果“SUV是‘Sports Utility Vehicle’的简称,即运动型多功能车,又俗称休闲越野车,是由皮卡底盘上发展而来的四轮驱动厢式车,起源于上世纪80年代的美国。”

为揭示这一途径的理论意义和实用价值,笔者展开了深入的探索。   ★本文来自语言文化翻译 

一、局部对应英汉网络语料的概念

其实,国内早已经有人开始运用网络语料在翻译中帮助选词,辅助翻译了。柯飞(2002)和杨承淑(2002)分别提到用互联网搜索引擎在网上检索某些词汇,作翻译前的准备,或者将检索结果用来证实自己在翻译过程中对某些选词的猜想。朱明炬等(2003)探讨了运用搜索引擎的检索功能来统计有关词的使用频率,借以验证,筛选词汇,辅助翻译。张景详(2003)报告了使用因特网搜索引擎查找书名、人名翻译的方法。倪传斌等(2003)则对指出了朱明炬的文章中直接使用搜索引擎中可能存在的问题。可见,网络文本资源在翻译领域的运用讨论已经悄然兴起,只不过还没有人明确提出网络语料这个概念而已。鉴于网络文本毕竟不同于经过精心创建的语料库,将网络称为“语料库”(朱明炬等2003)显然不够慎重。笔者认为,为避免误解,我们暂且称网络文本资源为网络语料,以区别于经过平衡性处理、深度加工以及配备专业检索软件包的语料库。  ★本文来自语言文化翻译 

本文所探讨的局部对应英汉网络语料指因特网上以汉语为主,夹杂着数量不等英语的双语文本资源。在特定的文本内部,英汉两种文字之间局部存在着某种对应关系,常常表现为三种形式:比较规则的对齐段落(或篇章),或是一一对应的词汇表,或者是部分、局部之间的解释(或者者互译关系)。请看以下示例:

1.汉英词汇对照表

... 动迁户 households to be relocated.

·东突"恐怖分子 East Turkistan terrorist.

·豆腐渣"工程 jerry-built project.

·渡假外交 holiday-making diplomacy.

·独立董事 independent director.

·独立关税区 separate customs territory. ...

2. 汉语文本中的英语夹注

他认为教学活动(padagogic action)是一种运用符号暴力(symbolic violence)进行教学沟通的过程,孩子的学业成绩如何,主要看这个沟通过程的效果如何,而决定沟通效果的主要是受业者与沟通过程相关联的社会特征和学业特征(文化资本)。所有教育过程的特殊产品是造成与孩子在家庭中获得的文化习念(habitus)相区隔的、由主文化之任意专横(cultural arbitrary)所支配的新习念。

以上两例中的局部对应英汉网络语料本身只是一种自然的语料而已,里面的双语信息完全是作者在特定的语境条件下为一般阅读者的需要而设的。如果我们利用搜索引擎能检索定位到以上文本中英汉双语交叉的地方,无论是以英语为目标查询语言,还是以汉语为目标查询语言,我们都能很快确定检索目标词的对应词。查询例1中的词表中的词时其方法之直观自不用说,即便在是例2中,透过文本上下文我们也很容易确定“symbolic violence”的汉语意思是“符号暴力”。局部对应英汉网络语料其潜在的双语词典功能是显而易见的。笔者的经验证明,在翻译一些新词以及专业术语时其辅助翻译的作用尤为突出。

二、局部对应英汉网络语料覆盖的广度和深度

因为网络语料不是一本或者几本形态固定的词典,所以,我们关心的一个问题是网络语料所覆盖词汇的范围。另一个问题的是网络语料查询某一专业词汇的效果如何。这便是我们在本部分试图回答的问题。

下面笔者将根据自己的检索经验,试图对网络英汉混合双语语料覆盖面作一个大致的分类。

1)专业术语,有心理学,法律,教育,语言学等多方面的专业词汇。如,心理分析(psycho-analysis),潜意识(Sub-Conscious),程序法(procedure law),侵权责任(right infringement responsibility),以学生为中心(student-centred),宽银幕版(Wide Screen),纳米技术(Nano Technology),音位(phoneme),机器翻译(machine translation),语料库(corpus)等

2)汉语时尚新词英译,如,跨世纪人才(the cross-century talent),下岗职工(Laid-off Workers),打白条(issue IOU擦边球(edge ball touch ball),小康社会(well-off society),下岗工人(laid off workers),以德治国( to govern the country with moral)等等;

3)新引进的文化内容,如电影名称,游戏,计算机产品、技术等外来名称。如,Colors Of The Wind《风中奇缘》(电影),A Clockwork Orange 发条橙(电影), Final Fantasy III 《最终幻想III》(游戏), Bowling(保龄),Stream(流媒体),Broad Band(宽带), ScreenShot (屏幕抓取程序)Scanner (扫描仪),Digital signature and identity authentication(数字签名与身份认证技术研究)

4)外来专有名词,包括地名和人名等。中途岛(Midway Islands),欧盟(European Union),独联体(Commonwealth of Independent States),贝多芬(Beethoven),尼克松(Nixson),贝克汉姆 David Beckham),迈克·尔.杰克逊(Michael Jackson)。

根据笔者的经验,网络英汉双语语料较为常见的一般为汉语新词英译、专业术语、西方地名人名、新引进的娱乐、技术等名称。而一般的通用词汇比较少见。

为了更加准确地了解对应英汉网络语料的查询效果,笔者根据手头所占有的传统词典资料,选取语言学(沈家煊 2000),信息技术(刘相东等 2000),医学(陈育红等 2001),财会(张烨等 2002)以及法律(程逸群 1999)5个专业词汇若干,利用搜索引擎进行检索老进行验证。验证词汇通过随机的方式从传统词典中某个页码段之间的词目进行抽取。检索结果如下表:

 

词汇专业领域

检索词数

返回结果

命中率

语言学

54

43

76.3%

信息技术

53

48

90.6%

医学

63

59

93.7%

财会

57

45

78.9%

法律

75

46

61.3%

 

检索结果令人兴奋。用肯定的眼光的来看,网络语料即便只解决了我们的部分问题,也是值得探讨的。况且,笔者一般使用网络语料的辅助翻译功能往往是在使用传统双语词典未果的情况下进行的,而结果却出乎意料。因此,我们应该充分肯定局部对应英汉网络语料的实用价值。

当然,我们也注意到,网络语料对不同的专业领域的词语的反馈比率也不一样,这说明网络语料的覆盖面并非无所不包,应有尽有。★本文来自语言文化翻译 

三、局部对应英汉网络语料辅助翻译方法的实现方法

网络语料并非是为了词典功能而设计创建的,它本身仅仅是一种自然的语料。互联网也不是一个结构化的数据库,因此,网络语料的检索无法达到电子词典或者是专业结构化数据库检索那样精确。本文采用的检索方法基于一般的信息检索。在众多的搜索引擎中,我们选择了Google,这是因为Google不但支持多种语言搜索,而且在同一次检索请求中,Google还可以同时完成两种语言以上的搜索(Google 2004)。

当我们要查询一个词或词组时,将该词或者词组以及其目的语可能的对译词或者相关词的部分拼写,或者有关背景关键词输入Google的检索框进行检索。如果有符合条件的网页,结果页面上会显示符合条件的检索结果数,自动摘录每一项检索结果中检索词所出现的上下文,检索词被突出显示出来,便于检索者一目了然地搜寻自己检索的目标。多数情况下,仅凭结果页上的摘录便可以找到要检索的内容。倘若摘录的上下文不足以判断检索结果是否符合检索要求,还可以点击摘录前面的地址链接,进入检索词出现的网页,在更大的语境中去判断。这非常类似于语料库的索引工作。★本文来自语言文化翻译 

下面我们来看几种查询的技巧:

1)      预测查询结果的一部分,将预测出来的部分和原语词/词组当做关键词检索

  (A)需要查“三个代表”, 我们知道“一国两制”之类带有数字的具有中国特色的词语译成英语时也有相应的数字,于是用<三个代表 three>*,反馈的结果中有“Three Represents”。

  (B)“Proliferation Security Initiative”是一个什么样的机构,还是组织?其中有一个security,常用词义为“安全”,就用<Proliferation Security Initiative 安全>进行搜索,结果为“防扩散安全倡议”。

  (C)“Key Stage 2”是什么意思?采用<Stage 2 阶段 > 查询方知道这是指英国教育的不同阶段,57岁为第一学段(Key Stage 1),711岁为第二学段(Key Stage 2),中学有两个学段:1114岁为第三学段(Key Stage 3),1416岁为第四学段(Key Stage 4)。

2)      利用掌握的背景帮助查询

  (A)“Hays Office”出现在一篇跟电影有关的文章,但是,身边的词典上都没有,于是笔者认为这个词很可能会出现在以电影为背景的网页上,采用<Hays Office  电影>查询,得到网页上是的解释是“Hays Office 海斯办公室威尔海斯主持美国电影协会(MOTION PICTURE ASSOCIATION OF AMERICA)时,协会的俗称。”既有解释又有背景,可谓全面。(B)笔者在查阅计算机文献时遇到“bigram 一词。笔者查遍《金山词霸》(2003版),微软的Encarta Dictionary tools, 英汉大词典 (陆谷孙主编),Webster's Ninth New Collegiate Dictionary,均没有查到该词的意思,但是通过Google< bigram 计算机>,很容易查到它的汉语意思是“2元语法(bigram)”,“二元模型(Bigram)”,“双连字串(Bigram”,“二元组合(bigram)”,“二元接续(bigram)”。本文来自语言文化翻译

3)先猜测可以音译词的部分,利用猜测的部分和原语词/词组当做关键词检索。

  (A)张景详(2003)用“Trial-and-Error”的方法查“保罗·德尔沃”(经本人验证不是张文中的“保罗·德而沃”),比较烦琐。保罗是西方基督教国家非常普遍的名字,拼为Paul错不到哪儿去,于是<保罗·德尔沃 Paul>查询,反馈很多网页上“保罗·德尔沃”为Paul Delvaux,而且透过自动摘录的上下文我们知道这就是我们要找的比利时画家的名字,而不是别的发音相似的人名。

  (B)欲查“斯大林格勒”的英文拼写,但是某纸质词典上只有“斯大林”(Stalin),“斯大林格勒”的英文拼写肯定少不了“Stalin”,于是用<斯大林格勒 Stalin>,结果我们很快得到结果为Stalingrad

  (C)“Nabokov”这个名字如何译?猜想首音节“na-”一般译为“纳”,用< Nabokov  >,结果我们发现一般中国人将这位俄裔美籍大师的姓译为“纳波科夫”或者“纳博科夫”。

4)有时候也可以利用目标词的中可能出现的一个字母帮助查询。

  (A)有人问“母系社会”怎么译,还说记得是以V开头,本以为这是件容易的事情。使用<v 母系氏族社会>查询,却没有结果。后来想起来,拉丁语的“母亲”一词以m开头,于是转变策略用<母系氏族社会 M>,马上查到,“母系氏族社会”为 matriarchal clan society”。

这里总结的网络语料双语词典的实现方法实际上只是一种原则和策略。要达到成功检索的目的,需要熟悉搜索引擎的检索技巧,具备灵活运用这些技巧的应变能力。这是由网络语料非结构化特征所决定的。利用网络语料来查询和辅助翻译的过程实际上是一个假设和验证假设的过程。

四、局部对应英汉网络语料辅助翻译的前景和问题

随着中国对外开放和对外交往的进一步深化,本文描述的局部对应英汉网络语料有不断增加的趋势。目前,使用检索网络语料的搜索引擎是免费的,因而局部对应英汉网络语料是一个值得我们注意的文本资源。

以上通过描述局部对应英汉网络语料,对局部对应英汉网络语料的考查,以及通过其辅助翻译功能实现方法,我们可以得出结论,局部对应英汉网络语料具有一定的双语词典潜能,巧妙运用免费的搜索引擎,可以发挥其在外语学习、教学以及翻译中的辅助作用。有很多新词,纸质印刷词典或者电子词典可能来不及收录,也有一些模块化的结构可能词典编撰者觉得不适合收入词典中,对于网络语料来说,则没有这些条条框框的限制,只要语境需要,相应的双语信息就有可能出现在上下文中。又由于少了正统词典面临的束缚,网络双语语料也正好发挥其自身的优势,对正统双语词典起着一定的补充和辅助作用。

从准确性和权威性的角度来看,网络双语语料的双语词典功能不能和传统的纸质印刷双语词典相比,也不能和新兴的电子词典和在线词典相比。但是,网络语料变化更新快,时效性强,而且涉及的面广,这是任何双语词典也无法涵盖的。借助搜索引擎,可以分别查询英语和汉语对译词或者解释,从而对外语学习者的理解,英语写作,翻译实践都有一定的辅助作用。同时,词典编撰者也不妨采用本文所推荐的方法,为双语词典的编纂收集素材。

但是,我们也应该注意,网络语料毕竟没有经专家编审。网络上的表达鱼龙混杂,在采用之前,有必要核实其可信性。

最后一点需要注意的是,网络语料用于辅助翻译的适用对象问题。用搜索引擎来检索英汉词汇的对译词或者释义,不同于传统词典的检索,传统的检索只要输入检索词就等着出结果,能否检索到需要的信息就看词典是否已经收入了相关的词。使用本文推荐的方法,除了需要使用者具有一定的英语水平外,还需要掌握一定的检索技巧,同时相应的预测能力、辨别能力、甄选的能力和修正能力也是成功检索的必要条件。这种检索类似于高水平外语学习者和译者验证自己的假设和猜想。因而笔者初步认为,本方法适于高水平的英语学习者,英语教师,有丰富经验、需要资料辅助的翻译人员,不太适于英语初学者以及不通英语者。

本文来自语言文化翻译

注释:

*这里的以及后面的“< >”代表搜索引擎的输入框。关键词之间需要空格。如要过滤掉不符合条件的结果,使搜索结果更加准确,可以用Google 支持的phrase-search,即一个词组作关键词时,将它放在两个半角引号之间。如<“共和国的领袖们”> <共和国的领袖们>更加准确,因为很多不符和词组要求的结果被过滤掉了。

本文来自语言文化翻译 

参考文献

[1]高永伟、李洁.因特网与词典编纂[J]. 辞书研究, 2000, (4).

[2]秦明、吴家玲 试论在线辞书的局限性[J]. 辞书研究, 2003, (02)

[3]张铁文. 词典编纂的利器——互联网[J]. 辞书研究,2004, (1).

[4]章宜华. 计算词典学与新型词典[M]. 上海:上海辞书出版社,2004.

[5]柯飞. 双语库:翻译研究新途径[J]. 外语与外语教学,2002(9)

[6]杨承淑.口译教学的数位化和网路化http://www.itbi.edu.tw/1-9-1.asp 2002

[7][10]朱明炬、谢少华. 充分利用搜索引擎,准确地英译词语[J]. 上海科技翻译, 2003,(1).

[8][16]张景详. 语言多态性与因特网辅助翻译[J]. 中国科技翻译, 2003, (2).

[9]倪传斌等. 论利用互联网搜索引擎协助翻译的科学性和可行性—一兼与朱明炬先生商榷[J]. 上海科技翻译,2003, (4).

[11]沈家煊(). 现代语言学词典[M] 北京:商务印书馆, 200012月出版. P172-179

[12]刘相东等(译). 英汉双解信息技术词典[M]. 北京:外语教学与研究出版社,2000年,P248 p233-239

[13]陈育红等(译). 英汉双解医学词典[M]. 北京:外语教学与研究出版社,2001年。P321-326

[14]张烨等(). 英汉双解财会词典[M]. 北京:外语教学与研究出版社,2002. P130-141

[15]程逸群. 英汉-汉英双向法律词典[M]. 北京:中国政法大学出版社,1999年。P146-147,

Google. (2004). http://www.google.com/

 本文载于《嘉兴学院学报》2006年第1期。

Copyrights © 2002 语言·文化·翻译 All rights reserved