首页 > 编程知识 正文

阿里达摩院 官网(阿里达摩院成果)

时间:2023-05-04 05:08:32 阅读:1143 作者:3903

近年来,直播电商遍地开花,但大多是国内的中文直播。想买国外电商主播推荐的产品,不会说这种语言怎么办?

阿里巴巴(以下简称“阿里”)已经克服了这个问题。全球速卖通是全球海外消费者的电子商务平台。和淘宝一样,全球速卖通也是面向所有终端消费者的,但不同的是,全球速卖通是面向全球200多个国家和地区的电商平台。

“数亿美元带货”电商直播也让跨境电商卖家对这种模式兴奋不已。然而,由于不同国家和地区的语言、文化和消费习惯不同,要在全球速卖通直播,语言、物流、支付和技术都是非常复杂的系统,其中语言是最迫切需要解决的问题。

近日,阿里达马研究院与全球速卖通推出AI直播翻译,可同时将中文翻译成英文、俄文和西班牙文。据悉,这是全球首个启用AI实时翻译的电商直播。中国商人只需点击一次中文广播,就可以覆盖全球英语、西班牙语和俄语地区的十多亿人口。

两年前,

“被迫” 研发的翻译引擎

,全球速卖通开始探索直播。但与淘宝直播不同的是,高峰时期涌入直播间的用户来自19个国家,说着不同的语言。当时没有多个实时翻译,要么全部用英语直播,要么某个语言区域的用户用某个语言直播,比如法语或西班牙语。

根据全球速卖通官方直播总监介绍的棒球,大部分有实力的商家都会邀请外国主播,而中小商家要么放弃,要么默默直播,要么用中式英语直播。数据显示,近90%的全球速卖通商家来自中国,82%的中国商家因语言困难放弃跨境直播。

与淘宝直播相比,全球速卖通直播更像一个婴儿。她需要强大的“营养”才能快速成长。营养学是一种实时翻译工具,可以实现多种翻译和多功能。

全球速卖通在研发Multi-Translation之前就尝试过现成的翻译引擎,但对于直播间的翻译输出脚本,即使是质量最好的翻译引擎也不合格。当时邀请了俄语和西班牙语用户参与评价,他们的评价完全无法理解。

经过对全球速卖通的调研,发现这些翻译引擎无法使用海外直播的原因之一是常规同声传译有专业的无线电设备来保证翻译的准确性。但是电商直播环境非常嘈杂,很多商家直接在摊位开始直播,很难保证良好的收音效果。

其次,常规的同传词库是固定的,经过有效的训练可以保证翻译工具的准确性。但是电商直播产品数量超过1亿,而且每天都在变化,翻译工具没有办法快速学习。而且主播来自不同的地方,有的还说方言。而且有些主播语速很快,会大大增加翻译难度。以上原因使得全球速卖通不得不发展自己的发动机。

没有训练集,商家自己 “造”

随后,全球速卖通花了7个月时间开发了汉英翻译引擎,该引擎于2020年5月上线。线上商家的开播率已经达到65%,今年“828促销”期间,90%的线上直播房间都使用了这个功能。

但是,还是有缺点。即使中英文翻译能力达到极限,直播间也只有30%的用户能听懂主播说的话,因为AE是一个跨全球的平台,直播间里有各种各样的用户,英文用户占比最高的是30%。因此,引入多汉翻译的功能迫在眉睫。

两个月后,中英文翻译多功能化,上线后用户体验大幅提升,部分门店销量增长了3倍。当时很多商家直播间的购买转化率都高于达人直播。在发现它之后,一些实况转播者和爱

研发过程中也有很多困难。首先是跨团队协作。研发。d队分布在美国、中国和新加坡。此外,60多个研发;d人员几乎从未见过面。如何让他们快速建立信任,并将其推倒是一个大问题。

第二个是训练集的集合。跨境直播服务全球罕见,市场上也没有可直接复用的现有训练集。好在阿里本身有很强的商业生态,很多商家都在积极帮助收集训练集。

三是并发方位点。如果你只做一个翻译,就完全没有压力了。但是每天有几千个直播,翻译好几种语言,需要几千个翻译,所以服务器的并发压力非常大。后来,阿里巴巴云改造了这一点,让服务器可以承受。

第四个问题是自动显示。多翻译、多功能可以自动识别用户类型,显示相应的语言。比如可以识别你是中国人,从而显示主播用中文说了什么。之前我们看到同声传译效果是在PC端,但是移动端非常复杂,所以研发;d人员在其中做了大量适应性工作。

自研更高效算法模型,可

“听懂” 主播口音

达摩院研发的统一多语言多领域融合模型,可把上百个语言,以及每个语言的多个领域压缩到一个神经网络模型中进行翻译,且翻译质量不变。据达摩院畅快的悟空介绍,达摩院 AI 翻译技术已创下多项业界第一,日均调用量超过 13 亿次,累计 3000 亿单词,可提供 214 种语言的高质量翻译。

据速卖通直播实时翻译产品负责人hldfn介绍,速卖通上有上亿件商品、数百亿个商品相关的专业名词,对直播实时翻译技术的要求极高,需要克服口音不标准、直播环境复杂、商品专业名词多、新品新词更迭快等问题。

主要负责该难题的是阿里达摩院自然语言处理实验室的研究员brdxss,他表示为解决 AI 听不清、听不懂的问题,达摩院研发出更高效的语音算法模型,它不仅能在嘈杂环境中 “听清” 直播内容,还能 “听懂” 主播的口音。通过将多领域的知识融入翻译模型,该算法模型还能举一反三,无需重新训练便能快速学习不同场景里不断更迭的专业名词。

现在,速卖通平台支持 18 种语言,可以保证设计出来的频道和商品定位,能够符合当地文化,这种 “入乡随俗” 主要体现在以下三方面。

心有灵犀。速卖通上有大量多元的商品,除了给它们做分类,还得容易被搜到。因此平台得根据用户输入的词,马上就能获悉他的搜索目的。在多语言混合下,这种挑战会更大。以 “Case” 为例,它具有箱子和案子的双重意思,用户输入该词语时,到底想买什么,就需要结合具体情景。此外,同样的词在不同语言里的意思也不同,例如 “Basket” 在英语里有 “篮子” 的意思,在法语里还有 “球鞋” 的意思。

可面对数以亿计的商品搜索,全程由人工解决会很慢。为此,速卖通采用人工智能来解决,当然人工智能的初步训练是由算法工程师来解决。训练结束后,速卖通最终可做到无论用户输入什么,都能根据他前后搜索的词语,来知晓其购买意图。

了如指掌。速卖通希望用户能对商品了如指掌,因此商品标题需要承载很多内容。比如,这个商品是什么?怎么找到?为什么买?但是一些商家的标题,有的没有标点符号,标题手法上也没有特别规则。这一问题也可被人工智能解决,它会给标题加上标点符号,并可整理成当地用户熟悉的表达方式。

深信不疑。速卖通是跨境平台,很多商家位于海外,商品需要飘洋过海才能到用户手中。所以,用户对平台信用、商家信用和商品质量都有很高要求。而购买前想知道商品到底好不好?就只能通过用户评价去了解。但是用户评价非常多,涉及的语言种类也非常多。另外,用户会用各种不规范的语言来评价,比如 “Very gooooood” 这样的短语,有的评价还会用到表情符号。而采用 “多到多” 翻译引擎,上述问题也可得到解决。

由于疫情原因,2020 年很多此前从未涉足直播的商家,如中国山区的果农也开始直播卖货。有了速卖通,无论是江西赣南的脐橙、还是河北枣强的貂皮都可以走向全球各地。同样,中国用户也可以买到此前只有靠代购才能买到的产品。科技惠及的从来不只是某一个国家的用户,而是全世界。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。