news center

破解机器翻译代码

破解机器翻译代码

作者:帅撂  时间:2017-11-01 10:07:15  人气:

通过Jacob Aron AUTOMATIC翻译服务看起来很神奇输入一些外国文本,你会立即获得一个不错的英文版本 - 除非你的文本恰好是波斯语,普什图语或任何其他广泛使用的语言,计算机目前无法翻译这是因为机器翻译技术依赖于分析用两种不同语言编写的相同文本的统计属性 - 例如西班牙语 - 英语词典 “你有普通语言对的并行数据,如法语 - 英语,但对于罕见或不常见的语言对,很难找到双语来源,”南加州大学Marina Del Rey的计算机科学家Sujith Ravi解释道,尝试一种解决问题的新方法 Ravi和他的同事Kevin Knight将翻译视为一个加密问题,好像外国文本只是用高级密码编写的英文他们的软件通过根据文本中出现的次数估计外来词与英语单词匹配的概率来破解代码 - 经常出现的单词更可能意味着“the”或“a”而不是“antidisestablishmentarianism”为了确保翻译有意义,该对使用另一个软件来评估出来的英语质量这反过来又调整了翻译软件中使用的概率他们在一系列短语中对系统进行了测试,例如“去年”和“第四季度”,试图将西班牙语等价物翻译成英语,以及两种语言中存在的一些电影字幕由此产生的翻译 - 众所周知的,令人困惑的“单语”翻译 - 与标准计算机翻译技术相比评价很高但是,模型是否可以从这么短的短语中扩展到处理更长,更复杂的文本还有待观察马里兰州巴尔的摩市约翰霍普金斯大学的Chris Callison-Burch表示,Ravi和Knight的方法“非常有前景”,但补充说它还没有证明自己他的团队也在研究避免并行数据的翻译软件他们的版本抓取在线文本并比较来自不同语言的不同文本 - 例如,一系列西班牙语博客文章和英语新闻报道例如,2004年和2011年印度洋和日本事件之后的“海啸”一词飙升,西班牙语maremoto的同等词也是如此,这表明它们的意思相同 Ravi和Knight也在探索单语方法如何帮助我们破解久违的语言或未知的密码(参见“机器与生肖杀手”)但是最终未知的舌头呢 - 他们的方法可以翻译外星语吗 “完全,”拉维说 “你也可以想到破译海豚说话”单语翻译也可以帮助士兵或援助工作者在语言不熟悉的国家迅速作出反应;例如,回应印度尼西亚的爆炸事件或海地的地震不过,不要期待谷歌翻译升级牛津大学的机器翻译研究员Phil Blunsom说:“他们正在努力做一些非常雄心勃勃的事情” “这不会是你很快就会在商业系统中出现的问题”旧金山连环杀手在20世纪60年代后期发出的编码信息一直困扰着密码分析师,但Ravi和Knight的翻译模型可能有助于破解密码十二生肖杀手的代码用奇怪的符号替换字母,有时在同一个字母上使用多个符号,这使得解密变得非常困难前三个消息是手工解码的,将它们显示为单个消息的一部分,