QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 1115|回复: 0
打印 上一主题 下一主题

谷歌为通用翻译器引入大数据

[复制链接]
字体大小: 正常 放大
迷途        

552

主题

7

听众

651

积分

  • TA的每日心情
    开心
    2014-6-7 09:00
  • 签到天数: 7 天

    [LV.3]偶尔看看II

    网络挑战赛参赛者

    自我介绍
    数学中国
    跳转到指定楼层
    1#
    发表于 2014-5-10 16:07 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta


            谷歌翻译以能够快速粗略地将网页或短文本翻译成另外一种语言而著称。但是有专家称,该服务的核心技术的下一步规划是研发出一种类似于“星际迷航”中的通用翻译器。



            在这方面谷歌并不是孤军奋战。显然,Facebook和微软等公司也都有相同的雄心壮志:创建一些能够消除语言障碍的服务。这是一个切实可行的目标还是天方夜谭?它们的代价是什么呢?



            机器翻译已经以这种或那种形式发展了数十年时间,但是它们与人工翻译相比仍然存在很大的差距。许多具有机器翻译功能的软件涉及定义不同语言的语法和词典,以及死板而晦涩的程序。



            在Franz Och的指导下,谷歌的解决方案是用一种纯统计法解决方案替代上述方案。与老式算法所驱动的方案相比,以查阅大量平行数据的方式——例如,各种公共文本的英语和法语翻译——能够生成更出色的翻译。语料库或平行文本库越大,翻译效果也就越好。(存储和处理能力在过年二十年中的提升也提供了帮助。)



            如果谷歌的计划是从零开始创建一种属于自己的技术,那么Facebook的策略似乎是引入谷歌的技术。在8月份,Facebook选择了Mobile Technologies公司所开发的语言翻译软件。对此,Facebook的产品管理总监称“这是一项对公司长期产品路线图的投资”。在Mobile Technologies公司的产品当中有一款名为Jibbigo的应用,该应用能够翻译语音。



            从这两个独立的项目,我们能够很容易地发现一个共同点:公司拥有大量可供他们使用的语言数据。谷歌和微软都有自己的搜索引擎,它们可以实时对网页进行搜索;Facebook则拥有大量的用户文字聊天记录。所有的这些构成了一个庞大的数据,这些数据可以作为翻译语料库。



            迄今为止,一个最大的未知问题是:如果谷歌、Facebook和微软等公司计划使用实时对话来生成一个用于翻译的语料库,那么这些数据是否会进行匿名化处理,甚至是否有这种可能性。创建一个选择加入程序,让人们有选择地将他们的谈话加入语料库中似乎是一个最好的解决方案。但是对于他们之前的行为,似乎不太可能写入到服务条款协议之中。



    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2024-4-29 22:46 , Processed in 0.273780 second(s), 53 queries .

    回顶部