追一科技刘云峰:今年是NLP技术大年,要做全栈的AI公司

作者 匿名 发布时间 2019-12-02 17:31:10

"上个月我在南京的旅行和住宿上花了多少钱?"

"上周五我在信用卡上花了多少钱?"

……

聊天机器人可以立即给你上述问题的答案。

为了使机器能够阅读我们的语言并输出我们能理解的答案,这个过程需要自然语言处理技术的支持。换句话说,nlp作为机器和人之间的翻译,在许多人工智能应用中起着关键作用。

与流行的计算机视觉、语音识别等技术相比,研究自然语言处理的初创公司相对较少。追赶一项技术是中国第一家从事自然语言处理技术和深入学习的人工智能公司。李开复曾公开表示,“追赶一项技术是中国乃至世界上最好的nlp公司之一。”

就在最近,由大通一号科技赞助的第一届中国nl2sql挑战赛在南京结束。世界上1457支球队中有5支争夺最终冠军。在此期间,MG采访了大通一号技术的联合创始人首席技术官刘云峰,讨论了nlp技术的当前发展和应用,以及大通一号技术在nlp技术浪潮中的作用。

照片|首席技术官刘云峰,大通一号科技的联合创始人和首席技术官

通常,我们将人工智能分为两部分:“感知”和“认知”。其中,计算机视觉和语音识别属于感知,而自然语言处理是认知的重要组成部分。从这个角度来看,nlp的研究比计算机视觉甚至语音技术更难通过上一层楼梯来完成。

然而,自然语言处理的发展早于计算机视觉,甚至语言理解。早在20世纪50年代,电子计算机的出现就带来了许多自然语言处理任务,其中最典型的是机器翻译。我们最熟悉的nlp应用是网络搜索,它从大量文本中搜索和提取自然语言信息。

随着大数据和深度学习技术的应用,自然语言处理进入了一个新的阶段。用刘云峰的话说,“以前我们只需要机器来理解人类语言,但现在自然语言理解是期望机器像人类一样具有一定的常识和思维推理能力,这比以前预期的要高得多。”

相应地,nlp创业的技术门槛自然很高,这正是追求一种技术的主要优势之一。

大通一号科技的三个主要创始团队来自腾讯。创始人兼首席执行官吴越是腾讯teg业务集团搜索部门的前任主管,曾主持腾讯分布式文件系统、大数据集群、大网络搜索引擎推荐引擎等重要项目的建设。Cto刘云峰在腾讯从事搜索技术、自然语言处理和机器学习的研究已有十年,在nlp领域拥有丰富的技术和实践经验。

大通一科技成立之初,就从智能客户服务开始。例如,通过大通一科技(Chase One Technology)的人工智能技术解决方案,可以用“正常语言”直接与客服机器人沟通,比如询问账单、帮助订票、寻找最近的美味餐厅等。

经过三年的发展,他们构建了智能语义和算法平台等人工智能技术堆栈,打造了一系列知识驱动的数字员工产品,包括智能客户服务、数字采集、数据质量检查、岗位培训、用户档案、反洗钱分析、警情分析等。

目前,大通一号(Chase One Technology)的智能服务解决方案,从客户服务机器人到人机协作,也已经应用于招商银行信用卡、中国移动、万达、携程等企业。

在与企业客户打交道的过程中,大通一科技(Chase One Technology)发现许多企业客户的知识和数据都是以数据库的形式存储的。问题随之而来。自然语言到结构化查询语句(nl2sql)是对一些交互是否可以基于数据库解决的问题的回答。

目前,学习nl2sql的企业很少。刘云峰说,在年初nl2sql挑战赛之前,除了微软,中国正在追求一项技术。

因此,为了打开这种新兴垂直技术的天花板,他们发起了nl2sql挑战。在竞争的同一时期,大通一科技还发布了业界首个大规模的中文数据集,包括4,870个表格数据、近50,000个标签数据和相应的sql语句。

照片|第一届中国nl2sql挑战赛最终网站

从比赛开始时的60%准确率到重播结束时最高的92%准确率,刘云峰也非常惊讶。“这个结果甚至比维基百科更好,维基百科在类似数据中难度更低。这表明我们在基础技术的研发方面已经赶上甚至超过了国外同行的技术水平。”

不过,他也表示,虽然这次发布的数据集涵盖了10多个行业,具有一定的泛化能力,但要真正实现技术的落地,还有很多工程工作要做,比如行业是否有这样的数据积累、数据表的复杂性和文本的模糊性等。,都需要针对垂直行业进一步优化。

谈到主办此次比赛的初衷,刘云峰表示,“从人工智能的发展规律来看,如果一项技术有特殊的技术挑战,它将加速其产业化登陆,比如视野中的imagenet。这些公开测试集或挑战出现的时间正是这项技术从论文走向产业化的关键。”

刘云峰还强调,从技术成熟度的角度来看,该行业已经解决了许多基本的nlp问题。今年将是nlp的新年,但是从着陆到现场将会有一两年的延迟。“然后nlp将进入技术成熟的爆炸阶段,并能够解决一些更复杂的任务。”

“互动”是大通科技产品的核心方向。除了早期的文本和语音互动,刘云峰在采访中透露,蔡斯一号正在制作“多模态互动数字人类产品”,这是一款不同于阅读虚拟锚等机器人的互动产品。它包括语音技术、自然语言处理和视觉三大领域的技术,并具有自我进化的能力。它可以对数据知识进行分类、分析、总结和学习。

“这个虚拟图像的表达和身体运动将与演讲的内容相匹配,这可以实现实时对话和交互。”

刘云峰认为,“未来负责人的人工智能公司必须是整个堆栈中的人工智能公司”换句话说,每个人工智能公司不仅应该有自己的核心和最佳方向,还应该熟知其他技术。

因此,除了nlp之外,大通一号科技(Chase One Technology)还在扩大其语音和视觉团队,构建语义、语音和多模态等人工智能技术的闭环。

目前,他们已经实现了语音技术的闭环。与普通语音识别相比,Catch-One更加关注语音交互领域的模糊性,提高了上下文场景中语音识别的准确性。在视觉方面,追赶技术也更加注重交互所需的视觉理解,例如用户的手势识别指令。

上面提到的“数字人类”产品是在三种主要技术中追求一种技术的“大师”:声音、视觉和自然语言处理。

最后,关于nlp的大规模商业化,刘云峰认为,为了解决公司化和国有化的问题,企业服务的特点是有许多定制化的要求。因此,有必要实现“配置即定制”,实现“paas”产品,增强产品化能力和与合作伙伴的粘性,更有效地解决企业需求。

哪里有语言,哪里就有nlp工作的地方。正如刘云峰所说,在过去的两年里,nlp在语言模型等基本能力上取得了一些突破。下一步需要改进的是商业场景中技术着陆的工程问题。

从论文到工业应用,技术的传输链正在加速。要赶上科技,我们需要做的是解决垂直领域的知识问题,并在技术应用爆发前做好准备。

欲了解更多高质量的内容,请继续关注镁客户网络~

时时彩信誉平台 江西快三投注 贵州11选5投注 中国竞彩网

相关文章
© Copyright 2018-2019 33westmusic.com 培山新闻 Inc. All Rights Reserved.