当前位置在: 首页 > 创作研究
创作研究    
面向科普翻译的语料库建设与研究:应用及展望(下)
新闻来源:中国科普作家协会     作者:郭鸿杰 、卢静     发表时间:2022-11-09     阅读次数:    


三、语料库在科普翻译中的应用

如前文所述,语料库为科普翻译研究提供了一个新视角,引起了科普翻译研究范式的变化,拓展了科普翻译研究的深度和广度。下文将从科普语言特征、翻译共性、翻译策略、翻译应用四个方面介绍基于语料库的科普翻译研究现状和未来前景。

首先,译语语料库海量的数据有助于高效准确地获取一些语言特征的计量结果,在宏观层面,包括词单(word list)、关键词单(keyword list)、词频分布(frequency profile)、词频谱(frequency spectra)、平均词长(mean word length)、词串(cluster)、词覆盖率(coverage)、词汇密度(density)、平均句长(mean sentence length)等;在微观层面,可以分析主题语气词、量词、固定习语、句型、语用、隐喻、篇章等内容。科普读物为吸引大众读者,常常比科技文本写得更为生动有趣,通俗易读,从而让读者享受这种知性的乐趣。通过语料库可以容易地捕捉到这些语言特征。比如,“摹声词”在科普读物中的出现频率是十分高的[18],略举几例如下:

They can snapwhistlehumvibrateboomand whine.

(羽毛)能发出啪嚓声、哨笛声、嗡嗡声、颤动声、隆隆声与刺耳的尖锐声。(《羽的奇迹》)

Tigers did not purr at all but instead emitted “a peculiar short snuffleaccompanied by the closure of the eyelids” when happy.

老虎完全不会发出呼噜声,不过开心的时候,会用鼻子发出“一种特别的短嗤声,然后阖上双眼”。(《动物也疯狂》)

Sooner or laterthere will be real human hardwaregreat whirringclicking cabinets intelligent enough to read magazines and voteable to think rings around the rest of us.

迟早有一天,会出现真正与人一样的硬件,出现一些嗡嗡叫、嘁哩咔嚓响的聪明的大盒子,能读杂志,能参加选举,脑瓜转得极快,快得我们没法比。(《细胞生命的礼赞》)

大自然的神秘奇妙时时让我们叹为观止。诸如“摹声词”之类的语言,生动贴切,能够帮助读者享受到阅读之趣,感受到语言之美。徐彬、郭红梅也提出,阅读、翻译当代科普书籍,我们会越来越感觉许多一流的科普作品也是一流的科学散文作品[3]。

其次,翻译语言早就引起了学者的研究兴趣。学界一般持两种观点。一种观点认为翻译文本是一种可预测的语言变体(variety),这归因于受翻译为媒介的间接语言接触的影响。这种变体常被称为“第三码”(third code)[19]。莫娜·贝克(Mona Baker)提到,在分析译本语言时完全可以把源语抛开进行分析,并在此基础上提出了翻译共性假设(translation universals),即相对于源语和目标语原创语言,译文具有显化(explicitation)、简化(simplification)、消歧(disambiguation)、规范化(normalization)等特征[20]。另外一种观点认为翻译语言偏离目标语规则,被标签为“翻译腔”,这是一种消极的语言观。事实上,基于语料库的翻译语言计量分析结果有助于客观地呈现这种“第三码”的共性特征,而非一种“蝴蝶标本式”的感性认识。譬如,分析翻译语言特征的一个重要参数为词覆盖率,即在词频表中按次序选择一定数量的单词,计算这些单词在总语料中所占的比例[21]。ECPCPS中前50个常用词的覆盖率统计结果显示,中国大陆译本均高于中国台湾译本。由此推测,中国台湾译本用词更富于变化。在此基础上,我们将基于译本的相关数据与汉语原创文本比较,结果见图1。其中,原创文本的数据参照了彭临桂有关两岸小说译本词汇覆盖率的数据[22]。

依上图,4条折线呈现出三个分布趋势:第一,无论是中国大陆译本,还是中国台湾译本,小说译本的词汇覆盖率显著高于科普译本,可见科普文本的词汇变化更大;第二,词汇覆盖率的地域差异在小说文本中差异更加显著,科普文本的词汇覆盖率特征比较稳定;第三,相似之处是,两种文体词汇覆盖率的差异在前300个常用词最显著,随着词频的减少,差距越来越小。

再其次,基于语料库的研究还有助于从语素、词语、习语、隐喻等多个层面分析科普翻译的策略和技巧。比如,一词多译是科普中常见的翻译策略。海量的自然语言例证能更清楚地显示该词或词语丰富的语义特征。下文将以语料库中出现的development一词为例来说明:

Alsothe rise or origination of anything by natural developmentas distinguished from its production by a specific act.

或者任何事物经由自然演变的增长或初生,有别于经由特定作为而产生。(《从达尔文到爱因斯坦》)

One of the principal benefits of the development of human intelligence is our ability to understand the true nature and import of dreams.

理解梦一般的生活实质和含蓄的意思对了解人类智力进化是很有好处的。(《伊甸飞龙》)

On the other handthe sun of Naples might be conducive to learning something about the biochemistry of the embryonic development of marine animals.

另一方面,那不勒斯的阳光倒可能有助于学习海洋动物胚胎发育生物化学。(《双螺旋》)

These plants are threatened by lumberinggrazingand development.

这些植物受到砍伐、放牧和开发的威胁。(《花朵的秘密生命》)

The development of a flower is one of the things we understand least about plants.

花的成长是我们对植物最不了解的部分之一。(《花朵的秘密生命》)

Drug development will change in two dramatic ways.

药物的研制工作将在两方面彻底改观。(《细胞叛逆者:癌症的起源》)

由此,不同主题内容下的代表性例句,为分析一词多译现象提供了重要参照。此外,语料库还会提供影响一词多译的其他语言因素或非语言因素。

一般说来,人们在理解抽象艰深的新理论或新概念时,常常会提取已存的认知基模做映射(mapping)。此类以一种具体熟悉的概念结构来构造另一种陌生抽象概念的现象被称作隐喻(metaphor)。事实上,为吸引读者注意并增进对新概念的理解,科普文本经常使用隐喻。隐喻对形成科学观念的重要性亦逐渐受到重视,隐喻翻译研究也成了科普翻译的重要话题。比如,以科普文本中英文植物词或植物结构习语及其汉译为例,基于ECPCPS的研究结果显示,英汉植物词语义的异同可大致分为重叠、错位和空缺三种情况,在此基础上,其翻译策略可归纳为直译、意译、替换三种手段等,详见以下各例:

He recalled a child in Memphis who was an excellent studentgot influenzaand became‘a vegetable’.

他回想起孟菲斯的一个孩子,曾是一名优秀的学生,患上流感之后却变成了植物人。(《大流感》,直译法)

Health inspectors were looking for cases among civilians“to nip the epidemic in the bud”.

卫生检查员正在寻找平民病例以便将流行病扼杀在摇篮中。(《大流感》,替换法)

But numbers do not fall ripe into our lapssomeone has to find and fetch them; far easiersome feelnot to bother.

有用处的数字绝不会凭空而降,一定要有人去发现、获得,但是有些人认为,别自找麻烦会比较好。(《如何用数字唬人》,意译法)

英汉科普平行语料库不仅为我们提供了有关英译汉策略的数据支撑,而且其丰富的科普英语语料亦对汉译英实践提供了重要参考依据。譬如,以汉语成语的英译为例,中文为母语的译者可能十分熟悉汉语成语,但不一定有能力将其译成地道的英文;而英文为母语的译者往往只能在成语字典找到直译、历史典故或是冗长的解释[23]。如果从回译(back translation)的视角来看,英汉平行语料库的逆向搜索功能则在某种程度能够弥补这种翻译的缺憾。比如,以生死攸关这个成语为例,我们通过检索汉语译文,会发现其对应的英语表达方式灵活多样,结果见表3所示。

生死攸关的英语对应形式包括单词、习语、短语、复合词等,而且语法功能也不完全能对号入座,包括名词(短语)、表语性形容词、描绘性形容词等。显而易见,英语表达灵活,追求变化,不拘泥于某一固定结构。所以,双语平行语料以及英语源语语料无疑对提高中译英质量具有一定的启发意义和参考价值。

最后,从翻译应用来看,科普翻译语料库的价值主要体现在机助翻译、机器翻译、检索平台三个方面。加工好的句对齐语料除了用于构建平行语料库或检索平台外,还可以用作翻译记忆库(translation memeory),协助人机翻译。ECPCPS语料库主要分为五大子库,即自然科学库、生命医学库、地球环保库、技术发明库、科技教育库。每个子库下又分为若干小类。例如,自然科学包括化学能源、数学统计、物理机械、宇宙航空、信息智能等,这样可以确保语料内容丰富,包罗万象,从而在借助Trados等机辅翻译工具进行人机协同翻译时,就可以根据翻译的题材调取各个主题内容下的翻译记忆库。因此,无论从主题相关性,还是储存的高质量句对齐语料来看,都会大大提升翻译效率。

人工智能时代下数智技术应用日益广泛是科普翻译无法回避的现实,机器翻译已经承担了译者以前大量重复枯燥的劳动。因此,机器学习或深度学习模型的应用,将为科普翻译提供另一种新视野,即呈现出更为细腻的数字信息,进而帮助识别大数据科普语料库框架下科普翻译的语义内涵。而基于高质量精准翻译语料,借助于深度神经网络机器翻译模型,可以训练机器翻译的深度和精准度。

目前,我们已经根据英汉科普平行语料库,开发了网络共享检索平台(SUFE-Corpus),为科普翻译爱好者或者译者提供浏览、检索、统计等各项功能,深化智能化、专业性、共享型资源建设,如图2所示。

此外,科技术语是科普语篇进行叙述和描写的重要手段[24]。在技术层面,语料库通过提取科普术语,建立术语库,规范术语译名,有助于训练机器翻译,推动双语科普术语库的构建,将实现术语查询、归类、对照、统计等功能;在语言层面上,基于对比短语学的理论框架[25],分析双语术语在构词理据、形式结构、功能关系、搭配句法、隐喻认知层面的异同,以及通用词汇和科技术语的转换机制;在翻译层面上,探讨术语翻译策略选择的国际化与民族化、术语译名的规范化和本地化等。

在翻译教育背景下,语料库建设亦与翻译教学存在天然契合。众所周知,可比语料库(comparable corpus)已经应用于翻译教学。相比之下,平行语料库应用于翻译培训的潜力尚未开发。事实上,越来越多的学者提出,平行语料库可以应用于开发翻译教学案例库,辅助教材编写、词典编纂等,从而解决资源短板和时效瓶颈等问题。另外,基于语料库的定量研究结果对于翻译质量评估亦具有重要的借鉴意义。

四、结语

数智时代下的双语语料库建设在数字人文基础建设中大有作为。构建一个动态性、多维度、多层次的科普翻译语料库有助于把科普翻译置于一个大历史背景中去观照,从而有助于准确把握科普翻译与时代背景、意识形态、地域文化、译者主体等社会因素之间的互动关系。这不仅有助于科普翻译学科体系的建设,而且也有助于激发科普翻译研究的多学科交叉与多元化突破。基于语料库的科普翻译研究方兴未艾,将来可以在以下几个方面继续探索,如研发语料标注系统(如翻译策略的标注、句法系统的标注等)、术语抽取、机器翻译训练的效率,科普翻译在个别语言中呈现出何种异质性,在跨语言中又呈现何种同一性,原创语言和翻译语言的隐喻性表达差异,如何将可比语料库和平行语料库结合并更有效地应用于以译者为中心的翻译教学模式,以及基于语料库的翻译质量评估等方面。此外,科普翻译语言会对科普原创语言乃至现代汉语的词汇、构词,甚至句法带来什么样的影响等话题,也仍有十分广阔的研究空间。

参考文献

[1] SHAKAS H. Translation Quality Assessment of Popular Science ArticlesCorpus Study of the Scientific American and its Arabic Version[J].Ttrans-kom20092(1)42-62.

[2] 潘震泽.自然科学书籍的翻译[R]. 2001翻译工作坊研讨会,2001.

[3] 徐彬,郭红梅.科普翻译的挑战[J].上海翻译,2010(4)45-49.

[4] 廖七一.翻译研究的趋势与中国译学的现代化[J]. 中国外语,2006(2)6-8.

[5] 郭鸿杰,周芹芹,管新潮.英汉科普平行语料库的创建和研究[J].外语与翻译,2015(04)38-434.

[6]HOUSE J.Covert Translation:Popular Science[EB/OL].(2011-06-30)[2022-06-26].

http://hdl.handle.net/11022/0000-0007-BFF1-2.

[7]MERAKCHI KROGERS M. The Translation of Culturally Bound Metaphors in the Genre of Popular Science Article:A Corpus-based Case Study from Scientific American Translated into Arabic[J]. Intercultural Pragmatics201310(2)341-372.

[8]MUSACCHIO M TZORZI V. Scientific Controversies and Popular Science in Translation RewritingTransediting or Transcreation? [J]. Lingue e Linguaggi201929481-507.

[9]PEARSON J. Using Parallel Texts in the Translator Training Environment[C]//ZANETTIN FBERNARDINI SSTEWART D. Corpora in Translator Education. ManchesterRoutledge2003.

[10] PAPADOUDI D. Conceptual Metaphor in English Popular Technology and Greek Translation[D]. ManchesterThe University of Manchester2010.

[11] MATSIRA M. Extracting Terms from an English-Greek Popular Science Parallel Corpus for Translation Teaching Purposes[D]. BirminghamUniversity of Birmingham2008.

[12] CHEN W. Explicitation through the Use of Connectives in Translated ChineseA Corpus-based Study[D]. ManchesterThe University of Manchester2006.

[13] 郭鸿杰等.英汉科普平行语料库 [DB].上海:上海财经大学,2018.

[14] 王克非.英汉 / 汉英语句对应的语料库考察[J]. 外语教学与研究,2003(6)410-416481.

[15] 管新潮,胡开宝,张冠男.英汉医学平行语料库的创建与初始应用研究[J].当代外语研究,2011(9)36-4161.

[16] 郭鸿杰等.英汉财经平行语料库 [DB].上海:上海财经大学,2022.

[17]LAVIOSA S. Corpus-based Translation Studies[M]. Amsterdam & New YorkRodopi2002.

[18] 郭鸿杰,宋丹.基于语料库的英汉对比与翻译 [M].上海:复旦大学出版社,2020.

[19]FRAWLEY W. Prolegomenon to a Theory of Translation[C]//FRAWLEY W. TranslationLiteraryLinguistic and Philosophical Perspectives. London & TorontoAssociated University Presses1984.

[20] BAKER M. Corpora in Translation StudiesAn Overview and Some Suggestions for Future Research [J]. Target19957(2)223-245.

[21] 杨惠中.语料库语言学导论[M].上海:上海外语教育出版社,2002.

[22] 彭临桂.语料库翻译研究:两岸小说译文语言分析 [D].台北:台湾师范大学翻译研究所,2009.

[23]PELLATT VLIU E T. Thinking Chinese TranslationA Course in Translation MethodChinese to English [M]. New YorkRoutledge2010.

[24] 杨信彰.英语科技语篇和科普语篇中的词汇语法 [J].外语教学,2011(4)18-21100.

[25] 卫乃兴.基于语料库的对比短语学研究[J].外国语,2011(4)32-42.

(作者简介:郭鸿杰,上海财经大学外国语学院教授,研究方向为语料库语言学、科普翻译、英汉语言对比与翻译等。文章选摘自《科普创作评论》2022年第3期


 
上一篇:面向科普翻译的语料库建设与研究:应用及展望(上)
下一篇:叙事医学作品编创规律探析——以《医述:重症监护室里的故事》为例

宁ICP备2021001770号-1   宁公网安备64010402001042号

宁夏科普作家协会  (www.nxkpzx.cn)@2020-2022 All Rights Reserved

地址:宁夏银川市兴庆区凤凰北街172号  邮编: 750001 电话: 0951-6851830  Email: nxkpzx0951@126.com