这些内容领域的AI公司如何迈进“第二曲线”?|AI最佳掘金案例榜


科技界当红IP兼KOL凯文·凯利曾经说过,未来二三十年,人工智能将会广泛存在于人类生活中的方方面面,“人工智能+X”将会成为企业的创业趋势。2017年被称为AI人工智能的元年,两年间各行各业涌现出大量的“人工智能+X”型创业企业。

AI人工智能以超越想象以外的速度,穿透生活,触摸行业的脉搏,消融山与山之间的壁垒和边界。信息、数据的存在形态由固态、限定变得流动、不定。“科技本身是一种生命体”,抛开人工智能创造的思维、思考,能否真正优于生命体的感知、认知。“万里蹀躞,以此为归”。推动AI内容的落地生根,回归技术本位,才是AI浪潮下的“必然”结果。

近日,雷锋网揭晓的AI最佳掘金案例年度榜单中,搜狗同传、图普科技、网易云易盾、影谱科技、品友互动成为AI+内容领域中的翘楚。企业发展的成长速度拥有两条曲线,“第一曲线”处于发展初期,是均速、缓慢的,增长到一定阶段会停止、下降。达到“第二曲线”后,企业发展呈指数级增长。

这五家AI+内容公司,无一例外,没有停滞于已有现状。面对“变革”,不仅知晓趋势,更找了到迈入“第二曲线”、实现“二次增长”的钥匙。

最佳机器翻译奖:搜狗同传

2016年诞生,2016年首次亮相乌镇互联网大会。精准、及时的实时翻译给行业留下了极为深刻的印象。2016年至2018年,两年多的时间,搜狗同传已经成为国内、国际各种会议的“标配”,支持过GMIC大会、TechCrunch国际创新峰会、2018 CNCC中国计算机大会、2018中国网球公开赛、2018世界物联网博览会、GATIC、数博会、世界电信和信息大会等等百余场会议。

搜狗同传具备听、译、改三种功能,根据用户发音、语音短剧、语音识别、文本断句完成机器翻译功能。传统机器翻译,将流程分为对齐模型、分层模型等,再将不同模型串联起来,不同环节的模型上下游影响甚密,连带关系较强。与传统的机器翻译不同,搜狗叠加了语音识别和机器翻译的技术。将神经网络精简为五层,低于谷歌的GNMT八层结构。采用端到端神经网络翻译技术,通过循环神经网络生成最终结果。即将多个模型融合统一为一个模型,直接将影射文本输出为文字。

搜狗同传在语音识别方面,采用CLDNN+CTC结合的声学模型和RNNLM语言模型,将通过语音断句后的片段,经过声学模型、语言模型转化成文本。文本断句处理在语音识别和翻译之间,以规则、模型两种方法进行语句划分和标点,平滑去掉无意义的词语。

语音断句方面,基于能量检测和DNN模型的方法,叠加后处理平滑算法,对语音信号进行语音、静音判断。从而,跳过静音片段处理提高解码效率,语音片段分割为多句并行识别,提高语音识别效率。保证识别输出结果更加通顺、流畅,符合正常的发言习惯。

机器翻译方面,采用双向 GRU 技术构建编码端的结构,attention 机制。添加命名实体标注模型(NER)和神经网络实体翻译器、多模型集成(ensemble)、重打分/重排序(rescore or rerank)、网络层正则化(layer normalization)等机器学习模块提高翻译质量。

搜狗同传在算法和数据领域的双重积累,可以流畅纪录、较好时别词语和句子的停顿,输出翻译内容。

返回产品中心