Google 是一家极度看重算法、充满工程师文化的公司,Google认为翻译是一个数学和统计学方面的问题,也许你会为此而感到好奇。最近, Google 总部的 Google Translate 团队正迅速扩张,新招了数名德国计算机科学家,但却没有招收一名语言学家。Google Translate Google Translate 部门主管 Franz Josef Och 同样也是德国计算机科学家出身,他不但并不精通语言学,甚至并不擅长语言学习。他认为,机器翻译的关键在对数学、统计和编程方面的擅长。
Google Translate 团队并不会去模仿人工翻译的方式,这就是他们没有去开发字典、定义语法结构和规则的原因。事实上,语法规则对目前的计算机来说仍然难以掌控。Google 更着重于以 大数据 和统计的方式入手,翻译系统会不断地调整翻译结果的相关性并自我学习如何处理数十亿的文字。通过这种方式,计算机最终能不断优化翻译结果。 用 大数据 方式做翻译的一个好处是,翻译系统会随着数据的积累而不断地改善。Google Translate 目前已经支持 71 种语言的互译,去年用户的使用次数已经达到 2 亿次。
此外,索引全球网页的 Google 还能够依靠互联网上已经存在的翻译内容改善自己的翻译系统。
尽管如此,依赖算法的翻译系统仍然远远无法做到像人工翻译那么精准。句法、语调、歧义都是自动翻译软件很难处理的问题。Google Translate 的翻译结果仍然只能帮助人们对陌生语言进行大致上的理解,有时候得到的翻译结果很难让人通顺地阅读下来。 |
|