这几年参加学术活动,主持人会介绍说,我译了几十部译著。到底几十部,从来没认真统计过,更不用说字数了。不完全统计,加上凭感觉,到2020有60部左右,字数应该有1000万字了。其实译过的数量还远不止这些。有译了未出的好几部,如《真理之剑》这部玄幻小说,一本就50万字;有译了忘记的,尤其是报刊文章,全都未统计,估计也有三四百万字了。这几天因为填写表格,统计了最近几年的,就扒拉一下豆瓣和我的笔记,凑了凑,其实已经超过80部了。其中最多的种类,一是科普,二是文史。

我做翻译时用到的技术:几个基本概念

计算机辅助翻译 (Computer-Aided Translation, CAT)

计算机辅助翻译是指译员利用专门的软件工具(如 SDL Trados, memoQ 等)来提高翻译效率和准确性的过程。其核心功能包括翻译记忆库 (TM) 和术语库。这种软件能够自动识别并提取之前翻译过的重复或相似句子,确保译文风格和专业术语的一致性。需要注意的是,CAT 工具并不具备自动翻译的功能,也不会取代人类,而是通过“人机协作”让译员从重复性劳动中解放出来,是目前专业翻译行业的标准工作方式。在其发展的早期,常被和机器翻译混淆。

机器翻译 (Machine Translation, MT)

机器翻译是指利用计算机算法将一种自然语言自动转换为另一种自然语言的技术,全程无需人工干预。从早期的基于规则的翻译、基于统计的翻译(SMT),发展到近年来主流的神经机器翻译 (NMT)。其翻译速度极快,能够处理海量文本。虽然它在处理长难句或文学修辞时可能欠缺精准度,但在获取信息大意和处理简单文本方面具有不可替代的效率优势。

大语言模型 (Large Language Model, LLM)

大语言模型(如 GPT-4, Claude, Gemini 等)是基于深度学习(特别是 Transformer 架构)并在海量文本数据上训练而成的人工智能模型。与传统翻译技术不同,LLM 不仅能进行语言转换,还具备强大的上下文理解、推理和文本生成能力。在翻译领域,LLM 能够根据用户指定的语气、风格或特定场景要求进行“翻译+润色”,提供比传统机器翻译更自然、更具文学性或专业性的译文。

我的翻译流程

了解了基本的概念之后,我就从我个人的经历开始讲一下翻译技术和图书翻译是如何结合起来的。我把从零开始这一点称为“CAT应用的前传”。那时,我还没有真正用到专业的CAT工具。

大约是在1999年的时候,山东大学的李绍明教授邀请我合译《宇宙为家》(At Home in the Universe)。这本书是湖南科技引进的一本严肃的科普书,内容是论证生物进化何以能在地球上发生,并最终产生了复杂的高智能生物。作者用来解释这一过程得以发生的关键理论,是复杂性理论。

翻译这本书的时候,计算机辅助翻译技术还没有得到普通人的关注,虽然其雏形已经出现。

基本技术

做这个翻译工作的时候,我首先要考虑的,就是如何对照原文进行翻译。如果是把纸质的原文文件放在电脑桌上,工作的时候就需要不断底在低头看稿和抬头看屏幕两个动作之间切换,而且目光需要反复地在纸质稿和文字编辑器中的文本中定位,找当前处理内容的位置,这些动作也会额外耗费时间。

经过一段时间的摸索,我找到了一些解决的方案。

首先,我决定翻译的时候不看纸质稿,而是把它扫描到电脑中,通过OCR识别,转换为Word文件。翻译的时候,我就直接在这个Word文件的最后开始追加汉语译文。而之所以采取在Word文档最后开始追加汉语译文,而不是基于现有的原文文档,在每一段的后面添加,是考虑到那样的话,最后定稿的时候还要逐段删除原文,操作繁琐——虽然很简单,却是枯燥的重复性劳动。用自动化的操作,又会担心误删除,于是便放弃了这种做法。

我恰好知道,Word有拆分编辑窗口的功能。在Word文档最后开始追加汉语译文,就可以把当前Word编辑的文件窗口拆分为两半。注意,这和后来出现的并排显示是不一样的操作。并排显示是将同时打开的Word文件分别放置在显示器的左右半屏,而窗口拆分,则是针对当前打开的单一文件的操作。把编辑窗口拆分成上下平行的两个区域,就可以分别在上半和下半窗口中显示同一个文件的两个位置的内容。

利用这种显示方式,我就可以只在一个Word文件中工作——上半屏窗口显示原文内容,下半屏窗口显示最末尾的汉语译文编辑区的内容,上下两半的内容可以分别滚动。比起并排显示,这种拆分窗口的做法更方便一些,因为同时打开的,只有一个单一的文档,而且,Word的菜单和功能按钮只显示一套。要知道,那时的显示器区域很小,分辨率是1024 X 768,同时打开两个文件并排显示就太拥挤了。

优化流程

接下来的翻译过程,也是一个不断优化软件应用的过程。

我在翻译实践之中,遇到了最主要的障碍,就是电脑启动得太慢。1999年时,典型配置的电脑的启动可能需要三分钟左右,就是说,从按下电源到Windows装载完毕要三分钟。

在这之后,我还需要运行Word,也需要大约一分钟的时间。那时的硬盘转速很慢,就连打开一个大一点的文件,都需要读取几十秒钟的时间。而再去打开翻译辅助用的电子词典,又有二三十秒过去了。

上述事情做完,我海需要在Word文档中进行定位——找到上一次编辑停止时的位置。因为我翻译的是《宇宙为家》这本书的后半部,所以,这个定位的过程也要费一些时间。

总的算起来,从我按下开机键,到能真正开始工作,耗时非常可观。我意识到,这样的翻译流程必须进行优化。我希望的结果,是将上面所说的开机之后的操作,全部让电脑自动完成。这一流程自动化,可以用下面的图来表示:

图 1 翻译第一本书的每日电脑操作流程
  1. 电脑开机
  2. 装载Windows
  3. 运行Word以及电子辞典
  4. 打开翻译项目文件
  5. 拆分窗口
  6. 在上下窗口定位编辑位置

通过上述6个步骤,才算设置好了翻译的“工作面” (workspace),一切就绪,只等我开始思考并开始打字录入。

经过一段时间的摸索,我发现整个这个流程,就是从按下电脑电源开关到铺开工作面,所有的这些操作步骤都可以交给电脑自动去完成。

这是要借助一些电脑操作的技巧才能实现的。好在我那时已经有了比较好的电脑应用基础,经过摸索,参考Word的帮助文件以及当时电脑报刊上的技术文章,我编辑好了几个Word宏(类似程序脚本的东西),实现了步骤1-6的全自动化。从那之后,每天早上一起床,我会先把电脑电源按下,然后去做其他的事情(洗漱、早餐等),等来到电脑前坐下的时候,工作面已经铺开,我可以直接进入翻译的工作流(图)。

因为第一次翻译科普类的书,里面很多的科学术语,包括生物进化相关的,地质学相关的这些术语,有些词也不是看过两三遍就能记得住的,所以呢,慢慢地,我又摸索出一个办法,遇到那些很难的词的时候,可以进行术语的注释。那时候我记得采用的是Word的替换功能,把比较难的词像Cambrian,寒武纪替换为Cambrian(寒武纪)。这样一来呢,就等于随着我翻译的进展,整个英文部分就变成了带难词注释的英文版本,这样一来,翻译的进程就得到了一定程度的加快。

在这个CAT应用的前传中,我虽然还没有开始使用专门的CAT软件,但是通过巧妙地组合电脑上的各种工具,优化流程,已经能够最大程度地减少翻译工作的准备时间,使得我每天都能够非常顺利地进入到工作的状态。整本书翻译下来,所节省的时间也是十分可观的。

这里面所体现的一个关乎电脑应用效率的原则,就是:

使用电脑工作的时候,尽量让电脑去等人,而不要让人去等电脑。

这张图显示的就是那个翻译项目所完成并最终的文件,不过英文内容在交稿的时候已经删掉了。这就是使用了Word的窗口拆分功能所获得的显示效果,通过这样的拆分,可以实现上下窗口分别观看同一文档的不同位置,如果上面观看的是英文部分,下面就可以在这里录入汉语。审稿的时候也可以这样显示,这样就可以对照原文,对译文进行审稿。

图 2 拆分显示Word文档

 

我记得交稿之后过了一段时间,编辑联系我说,徐老师,我们基本上完成排版了,基本定稿了,你能不能帮我们做一个索引(index)。因为他们说,在那时他们用的中文的排版系统里,好像还不能够自动做索引——我并不太了解具体的情形,而编辑其实可能也不了解,因为排版工作是印刷厂负责的,编辑好像也并不关心这样的技术细节。

而把英文的索引翻译成汉语,索引词条的翻译并不太难,只是有点繁琐(在没有使用CAT工具的情况下)。索引的关键,其实是页码问题。大家要知道,英文翻译成中文之后,它的页码都发生了变化,所以不能继续用英文原版书里的页码。对此,那时候人们也没有摸索出比较好的省事的方法。大家可能注意到,最近一些年来,在一些翻译的图书里面,出版社就采用了一种变通的方法:正文页上,除了在页眉或是页脚那里显示正式的中文版的页码之外,出版社会在书的两边合适的位置附上对应的英文原版内容的页码(因此位置不固定),在书的最后,直接附上原来的Index,基本上不再翻译;即使是翻译了Index的条目,也是直接保留原始的页码。

图 3 Word的索引功能

必须说,这只是一个变通之法,算不上多么好的解决方案。

当年,编辑交给我这个问题之后,我就摸索一下Word的索引功能,结果发现,做起来并不难。要想在Word中做索引,最便利的方法就是先给软件提供一个用两层关系(主索引词+附属索引词)的表格。让Word自动拿这个表格对全文进行检索,把需要索引的词标注出来,然后Word就能自动生成一份索引,后面的页码就是它自动标注的那些索引词当前所在的页码。

此时,大家可能会问:译者手头的Word稿,跟出版社那边排出来的稿子的页面是不一样的,这样一来,译者做的索引的页码也是不一样的,那还有什么用呢?

其实这也不难解决。当时,我让编辑把清样寄过来,而在我手头的Word文件上,我通过手工添加分页符,全方位模拟了清样的分页情况,也就是说,清样上一页文字结束,换页了,我在Word中也加入手工分页符。清样是大32开,我的电脑文件仍然用A4幅面,这样就不会遇到清样的某一页内容还未结束,而我手头的文件却排不开这些文字的情况。

做完这个工作,再进行索引,就能很方便地针对这本几十万字的书稿做出索引了。

不过,不知道出于什么原因,最终出版的书并没有加上索引。这也是很多图书引进之后的一个遗憾。

翻译第一本书技术上的得与失

第一本翻译下来,我有哪些收获呢?

1. 翻译图书所需的电脑技术。

比方说图书扫描和文字识别。在1990年代末,这还是一种不大为人所知的技术——其实已经很成熟了。它对我的首部书的翻译起到了很大的帮助作用。因为如果没有这个技术,在翻译的时候,译者就需要反复地重复两个工作:低头看稿,然后抬头翻译。

要是那么做,译者就需要在原文文稿和译文文稿之间反复地做目光定位的工作:你要看到原文在哪里,同时还要调动短时记忆力,记住刚才读到的内容,思考如何把它转换形成目标语的文字,同时抬起头,看向屏幕,把脑子里的文字录下来。

而使用了扫描识别,把文稿转换成电脑上的文档,这样就能在一个统一的界面里去工作,可以有效地缩短目光进行定位时的移动距离,从而有效地减轻大脑短时记忆的负担——你可以随时看到原文,且更方便的看到原文,这样,要记的东西就少了许多。

2.文档管理意识。

另外一个收获就是,通过实际的图书翻译工作,我掌握了更高级的文档管理的一些技巧。比如,如何通过各种级别的标题管理长篇文档。图2显示了我提交的文档,有一个很好的大纲。有了这种“活”的文档大纲,管理文档的时候就非常方便。

正是通过图书翻译工作,我逐渐熟悉了这样的文档管理技术,并且把它应用到自己写书、写论文的实践中,感受到了极大的便利,慢慢地进入了结构化文档写作的殿堂。

3.工作流程的优化

通过这份翻译工作,我学习并熟悉了Word中宏的制作,这进一步提升了工作效率。

当时的一个典型的操作就是,每次做完当天的翻译工作,我都会运行一个宏,自动地记录下英文进行到哪个位置了,以及中文编辑到哪个位置了(通过宏来调用Word的书签功能)。做了这样的记录,下一次打开文档的时候,再运行另外一个宏,就可以自动查找到这两个位置。如此一来,打开文档后,我就不用手工转动鼠标滚轮反复地前后翻找。

再来说说“失”的问题。

我第一次完全在电脑上做这本严肃的科学书翻译,把大部分精力放在了文本的理解上,所以在文件管理方面的设计并不完善。

比方说,那时我缺乏版本意识,对翻译的过程也缺乏记录。

大家想,在电脑上录入译稿,又在电脑上进行修改,这种工作和在纸上书写做翻译是完全不一样的。通过书写的方式做翻译,可以留下比较完整的手稿记录。而在电脑上,编辑过程中删除的文字就彻底消失了,增加的文字也看不出来是后来加上的。不像在纸上那样会随时写了再涂掉,做翻译初稿的时候,在电脑上的打字,除了最终保留的,一切都是无痕的。

此外,在电脑上,每一句译文的形成过程,跟在纸面上相比,也会出现比较大的不同,这一点,很多亲历过两个时代的译者都有切身的体验。有过几年甚至十几年手写译稿的经历,后来又转换到电脑文字处理的人,会发现,在纸上书写的时代,译者往往倾向于把每一句话考虑得相对更成熟一些再落笔,这样可以避免写完了之后又大面积涂改。但是,在电脑上却无需考虑这一点,因为在电脑上“涂改”太容易了,译者可以很容易的把录入的文字从一个位置——比方说从句子的开头——搬到中间,或者搬到结尾。

所以,转到电脑上之后,译者可能更愿意试错,先把一个不成熟的句子录入下来,然后,通过剪切的手段迅速地对句子进行新的组织安排,这是我个人第一次完全在电脑上做一本书的翻译时所感觉到的一个明显的不同。

但是由于缺乏经验,也缺乏提前的设计,我记得《宇宙为家》这本书从初稿到最终的修改后的提交版,基本上就是在一个Word中完全做下来的,只是最后稿子基本成熟后,我才打印了一份,在打印稿上作了一些修改。但是,那时候的修改已经属于后期的修改了,前面的一些翻译过程信息就随着数字化文档的编辑而消失在赛博宇宙中了。

我查了一下我电脑上的文档记录,我的外接硬盘上还留着当年的文件(图5 《宇宙为家》翻译过程文档)。大家看到,这个文件夹里有扫描的英文版文件,有翻译好的中文版文件,以及我写的译后记。另外,就是当年所参考的其他书,如《自私的基因》等。总体上,这个文稿记录是比较零散的,而且缺乏组织性,所有文件都混杂在一层文件夹中。

再补充一点,就是那时候也还没有明确地去想是否存在专门的CAT技术这样的话题。这方面,要等到下一本书的时候,我才突然“开窍”了。

图5 《宇宙为家》翻译过程文档

 

后续

大家要是觉得《这些年,这些书》这个专题不错,请记得给这篇文章充电转发。下一次我聊聊《宇宙为家》这本书的翻译过程。

 

附:这些年翻译出版的书

1. 《AI众神时代》,2025……

2. 《科学的价值》,北京:中国科学技术出版社,计划2026出版……

3. 《宇宙简史》,北京:中国科学技术出版社,计划2026出版……

4. 《震撼物理学史的10天》,北京:中国科学技术出版社,2024

5. 《乐高传》,浙江教育出版社,2024年(2/2)

6. 《血染开普敦:布尔战争史》,北京:社科文献出版社,2024年。

7. 《亚当夏娃日记》(1/2)译林出版社,2024,即将出版。

8. 《燕子号和亚马逊号》(1/3)译林出版社,2024,即将出版。

9. 《翻转思维:将问题转变为机会的艺术》(2/2)人民邮电出版社,2024-4,59.80元

10. 《现在:时间的物理学》,长沙:湖南科技出版社,2022年。(独译,30万字)

11. 《感恩的力量》,北京:中信出版集团,2022年。(1/2,12万字)

12. 《绝对成交》,北京:北京联合出版公司,2022年。(1/2,22万字)

13. 《心智训练》,北京:化学工业出版社,2022年。(1/2,9.8万字)

14. 《即时记忆》,北京:化学工业出版社,2022年。(2/2,9.6万字)

15. 《史蒂芬·霍金:友谊和物理学的回忆》,长沙:湖南科技出版社,2021年。(独译,16.8万字)

16. 《我们为什么长这样》,长沙:湖南科技出版社,2021年。(独译,27万字)

17. 《爱因斯坦的骰子和薛定谔的猫》,长沙:湖南科技出版社,2021年。(独译,24万字)

18. 《警报解除》,北京:中信出版集团,2021年。(1/2,45万字)

19. 《中国汉画像石粹编(中英文)》,济南:山东电子音像出版社,2021年。第五届中国出版政府奖提名奖(独译,45万字)

20. 《量子通史》,北京:中信出版社,2020年。(1/2,35万字)

21. 《燃烧的大洋:1941—1942,从突袭珍珠港到中途岛战役》,北京:中信出版社,2020年。(1/3,60万字)

22. 《征服的怒潮:1942—1944,从瓜岛战役到菲律宾海战役》,北京:中信出版社,2020年。(1/3,60万字)

23. 《世界史的故事:从北宋灭亡到君士坦丁堡陷落》,北京:中信出版社,2020年。(1/3,72万字)

24. 《组织人》,北京:中信出版社,2020年。(1/3,万字)

25. 《世界史的故事:从文明诞生到罗马帝国崛起》,北京:中信出版社,2019年。(1/3,68万字)

26. 《世界史的故事:从三国鼎立到诺曼征服》,北京:中信出版社,2019年。(1/3,60万字)

27. 《牧羊犬鲍勃》,济南:泰山出版社,2019年。(1/2,14万字)

28. 《大历史 : 从宇宙大爆炸到我们人类的未来,138亿年的非凡旅程》,北京:中信出版社,2019年。(1/3,35万字)

29. 《暮光之劫》,北京:中信出版社,2019年。(1/2,32万字)

30. 《未来公司》,北京:中信出版社,2018年。(1/2,16万字)

31. 《巧克力战争》,南京: 译林出版社,2018年。(1/2,15万字)

32. 《宇宙传记》,长沙:湖南科技出版社,2018年。(1/2,17万字)

33. 《宇航员地球生活指南》,长沙:湖南科技出版社,2017年。(独译,20万字)

34. 《大历史,小世界:从大爆炸到你》,北京:中信出版社,2017年。(1/3,23万字)

35. 《极简科学史 : 人类探索世界和自我的2500年》,北京:中信出版社,2016年。(1/2,26万字)


36. 《少年福尔摩斯.5,毒蛇吻》南昌:二十一世纪出版社,2016年。(1/2,18万字)

37. 《少年福尔摩斯.7,冷石人》南昌:二十一世纪出版社,2016年。(1/2,16万字)

38. 《汤姆·索亚历险记》,北京:新疆青少年出版社,2015年。(独译,10万字)

39. 《支付战争:互联网金融创世纪》(1/2),北京:中信出版集团,2015年

40. 《神秘的陌生人(雷梦拉系列)》(2/2)新蕾出版社,2014

41. 《穿睡衣的消防员(雷梦拉系列)》(2/2)新蕾出版社,2014

42. 《勇敢的一年级(雷梦拉系列)》(2/2)新蕾出版社,2014

43. 《小淘气交朋友(雷梦拉系列)》(2/2)新蕾出版社,2014

44. 《天生的幻想家(雷梦拉系列)》(2/2)新蕾出版社,2014

45. 《苏菲的航海日志》,南昌:二十一世纪出版社,2014年。(10万字)

46. 《蠕虫:第一次数字世界大战》,北京:国防工业出版社,2013年。(16万字)

47. 《城堡密室》,南昌:二十一世纪出版社,2013年

48. 《荒山怪声》,南昌:二十一世纪出版社,2013年

49. 《救命的数学》,长沙:湖南科技出版社,2012年。(独译,18.8万字)

50. 《艺术宇宙》,长沙:湖南科技出版社,2010年。(独译,28万字)

51. 《链接:网络新科学》,长沙:湖南科技出版社,2007年。(独译,28万字)

52. 《爱因斯坦的宇宙》,长沙:湖南科技出版社,2006年。

53. 《当泡利遇上荣格:心灵、物质和共时性》, 长沙:湖南科技出版社,2014年

54. 《伟大的音乐家》,电子工业出版社,2011年

55. 《素描精义:图形的表现与表达》,山东画报出版社,2007年

56. 《美国儿科学会实用喂养指南(第2版)》,北京科学技术出版社,2017年

57. 《化学的奥秘》中译出版社,2020

58. 《警报解除》,中信出版社,2020

59. 《感恩的力量:300人争相观看的幸福课》中信出版集团,2022

60. 《科学与宗教》山东人民出版社,2009-1,32.00元

61. 《方程式之美:隐藏在万事万物背后的数学公式》化学工业出版社,2021-10,59.8

62. 《心智训练:从理性思考到睿智行动》,化学工业出版社,2022

63. 《震撼物理学史的十天 : 物理学家如何改变日常生活》,徐彬,宋爽,中国科学技术出版社,2024

64. 《文明的五个纪元:以五个文明划分世界历史》,山东画报出版社,2004-02

65. 《听亚当斯讲历史》北京大学出版社

66. 《恐怖大雪人 : 淘气包亨利》少年儿童出版社,2010年7月

67. 《宇宙为家》,(2/2)长沙:湖南科技出版社,2011年

68. 《鲸和海豚》电子工业出版社,2015

69. 《我懂你 : 如何运用“第六感”提高洞察力》(2/2)湖南科学技术出版社,2017

70. 《DK微观世界大百科》(2/2)电子工业出版社,2016

71. 《汤姆•索亚历险记 : 世界著名淘气包总动员》新疆青少年出版社,2015

72. 《教学方法:应用认知科学促进学生学习》(3/3)华东师范大学出版社,2006

73. 《中国》中国旅游出版社,2011

74. 《艺术大师的油画技法》,徐彬,史洁;化学工业出版社,2023

75. 《艺术大师的水彩画技法》,徐彬,史洁;化学工业出版社,2023

76. 《孤独星球》系列之《南非》《希腊》等多部

77. 《美国国家地理》系列之《南非》《德国》等多部

 

 

1
0