2024.04.18 16:21
我和我的“土匪”兄弟搞了个机器人大脑
文章来源:斯贝瑞品牌官网
斯贝瑞,年度,CBERI,斯贝瑞,斯贝瑞奖,品牌经济网,品牌经济学,中国品牌经济研究院,品牌研究院,希鸥网,希欧,我和我的“土匪”兄弟搞了个机器人大脑
氖星 彭军辉
某日,我跟我的一个认识了很多年的准同行借钱,他理都没理我。他们是海归团队,创业做客服机器人不久就拿到了巨额投资。然后一路ABC轮投资拿了个不停。跟他们比,我忽然觉得我们就好像“土匪”队伍,要钱没钱,要装备没装备,要背景没背景,要资源没资源,衣衫褴褛,士气低落。
仔细一想,我们其实并不是“土匪”部队。我们有理想,有目标,有创新。也许我们才是真正的未来。上面这家海龟团队最后卖给了一家大公司。参加创业黑马的培训班才知道创业有所谓天派和地派。上面那位海龟团队就是天派,我们就是地派。像百度李彦宏就是天派创业者。而马云马化腾刘强东都是典型地派创业者。创业本身就是九死一生的事情。不管天派还是地派成功率都很低。但具体到我们这个行业,我则一直认为最后胜出的一定是我们地派创业者。我们公司也几次遇到过被并购的机会,都被我拒绝了。我认为我们现在的价值远远没被看到。
本文最初提到的那位我的准同行一直问我,你咋不参加竞赛,你咋不发表论文。

先说说我是哪个行业吧!
很多人认为我们是做自然语言处理的。但我对这个界定一直不认可。作为一个学科分类把我们归入自然语言处理并没有错。但很多人对自然语言处理的认知有问题,他们几乎把自然语言处理和搜索当成了一回事。(这个也正常。)我们实际上是做语义理解的,它和搜索是完全不同的两个事情。搜索处理的是文本,而语义理解处理的是语义。大家在使用语音识别产品时会发现它在处理同音字时短板明显。使用语音合成软件时就会发现它处理不了多音字。这都是搜索技术的缺陷导致的。如果是在理解语义的基础上进行语音识别和语音合成,就不会存在同音字和多音字问题了。对语义的理解是离不开语境和上下文的。搜索技术是处理不好语境和上下文的。语义理解和搜索的差别比大象和蚂蚁还大。主流用搜索技术做语义理解,他们不严格分析句子结构,甚至不处理否定词和虚词。他们说他们也处理语义,我一直不认可。连否定都分不清,能叫处理语义?但老师都是这么教的,大咖们的论文都是这么写的,大公司的技术都用的这,所以公众的认知也就被定义了。几乎所有人都认为用搜索技术做语义理解是对的。
而我们走了另一条路,我们严格分析句子结构,从语言学角度分析语义。我们技术前前后后研发了20年了。“彩虹都有什么颜色”“彩虹的颜色有几种”“为什么说彩虹的颜色有七种”这几句话用主流技术分不清它们语义的差别;用我们语义理解技术就可以。20年技术研发,就好比在深山里苦修一样。我们孤立无援,我们资源有限常常吃了上顿没下顿,我们甚至经常被当成“土匪”被主流围剿,我们经常人手不够还经常流失人才。我们算法是我独创的,经过将近二十年的潜心研发,我发明了用句子主干表示单句语义的技术。句子主干能在表示语义相似性的同时表示语义的差异性。在自然语言处理这个领域,我开创了句子主干表示语义的句子语义理解技术这个新门类,而我们只是一家非常非常小的创业公司,得不到认可。
我们虽然也是自然语言处理行业,但我们是非主流。业界根本不知道我们的存在。我去哪里发论文呢?我去参加什么竞赛呢?这个社会能容得下我这样的“民科”和“草根大师”吗?我定义了语义理解的四个标准“差异性”“同一性”“模糊性”“一致性”,这还不是行业标准。这个行业没有权威的官方测试标准。图灵测试只是一种主观测试,不是科学测试。
那我们就没有机会了吗?其实有巨大的机会!
最早我想做个全拼输入法,用户输入拼音,机器根据语法规则自动计算出拼音代表的汉字。后来看到了问答机器人这个产品,我想我要做的输入法其实就是一种问答机器人。由于资金有限,输入法没开发出来,我们只开发出来了问答机器人。一开始我们也想不清楚问答机器人能干啥,以为它只能陪聊。2011年第一次拿到投资,当时应用方向、盈利模式等等也都没想清楚。后来苹果发布了siri,很多人以为我们是模仿siri的。我们当时也不懂。后来一堆模仿siri的公司冒了出来。其中只有少数幸运儿拿到了投资。但没过几年,他们中的绝大多数都因为找不到盈利方法又没有资本持续输血关门大吉了。我们当时讨论过怎么盈利的问题,也开始发展了一部分客服机器人客户,但并没有从客服机器人业务上赚到钱。我们的客服机器人客户都不愿意付费,但却还在持续使用。加上客户本来也不多,我们也没觉得客服机器人市场能做起来。后来在展会上看到了智齿客服,再后来又发展出来了很多客服机器人公司,客服机器人市场越做越大了。其实就算当时客服机器人市场能做起来,我也不会选择进入客服机器人行业。我在内心模模糊糊知道我要做的不是客服机器人,我的初心是让机器变得更聪明。这个公司坚持了一年多,我就被投资人从公司赶了出来,因为公司赚不到钱。
2012年回到老家,我一直在思考我们为什么会失败。我认为还是我们算法有问题,我们连分词都分不对,也没法准确理解用户输入的语义,更做不到准确回答。于是我便开始研究怎么准确分词怎么准确理解句子语义。我的算法代码一遍遍更新,一次次推倒重来,不知不觉竟然花了4年时间。
2016年我再次拿到了投资,重新开始了。我们计划为智能硬件解决语义理解准确的问题。然而,干了一年多并没有找到真正的用户。2017年我又一次离开了自己一手创办的企业。
2012年的时候我们就想到了做一款语音交互的玩具,但是当时找不到合作伙伴,我们又不懂硬件怎么做,这个事情就一直停留在想法阶段。2015年前后,语音交互的智能硬件突然爆发了。2016年我们算法虽然升级了语义理解更准确了,对产品和市场的认知也越来越清晰了,但始终没做好销售,没赚到钱。我发现我们应用于智能硬件或者说玩具就会存在一个明显短板就是内容。音乐电影资源是要收费的,百科知识内容庞杂。我们根本没法生产出多到能满足用户需求的知识,我们只是个小公司。2016-2017年其实也不是一无所获,这两年我想清楚了我们要去哪里?
2017年年底,我又创办了一家公司,做的事情还是为智能硬件提高语义理解能力。渐渐地我理解到机器人是和计算机、手机完全不同的产品,具备智能、能主动服务是机器人的本质。后来我提出了机器人大脑应该像安卓系统一样开放,提出了机器人生态包含系统、内容、本体三个模块的理念,提出了机器人的交互应当以用户为中心的理念,提出了机器人更适合链接服务的理念。
经过三年不断努力,我们在商用机器人大脑方面做得越来越完善了,逐步得到了市场认可;但家用机器人始终没有成功。总结发现绊倒我们的依然是内容这块短板。我们在内容上成功的只有垃圾分类知识库。我们垃圾分类宣传员机器人能理解“啤酒瓶是什么垃圾”“打碎了的啤酒瓶是什么垃圾”“啤酒瓶里还有酒是什么垃圾”“桌子上的啤酒瓶是什么垃圾”“啤酒瓶放在桌子上是什么垃圾”这一组句子基本是同一个意思。而儿童教育、闲聊等等问答知识我们始终没积累起来。

这几年总算想明白我想要的东西是个啥了?
我想做的就是个机器人大脑,它相当于机器人的人机交互系统,它具备思辨能力,能理解用户的各种自然语言表达,能主动为人服务。它本身可以做客服机器人,也能做智能硬件的语音交互系统。我也明白了为啥我们商用机器人能做得稍微好点了。商用机器人本质就是实体客服机器人,他们不需要闲聊,只就特定内容交互。而我们做不好儿童玩具的对话系统和家用机器人的对话系统就是因为我们在内容上的短板一时无法补齐。我们经过二十年积累了算法优势,但内容上的短板只能用资金和人力去解决。我们语义理解准确的优势只有在客服机器人上才能体现出来。前阵子有个客户试用了我们系统惊呼他“从遇到过这么强大的客服机器人系统”,当时我都有种受宠若惊的感觉。后来联想到一些客服机器人厂商确实是用分类和关键字解决问题我也就理解我们用户的感受了。
有个客户说他们用了某大公司的产品,用户说“结婚证怎么办”,他们机器人回答的是“离婚证怎么办”的答案。我们有个客户找我们定制开发炒菜机器人的对话系统。他们其实找了行业内很多厂商了。目前我们的系统已经基本能交付了。这个炒菜机器人大脑的难度一是要处理口语和用户的多种表达,二是要处理多轮对话,三是处理否定。这三点把绝大多数自然语言处理厂家都难倒了。口语是自然语言的特点。用户日常的表达非常不规范,都要能处理。“给我来个西红柿炒鸡蛋””我想吃西红柿炒蛋““做个番茄炒蛋好吗””西红柿鸡蛋“都是一个意思。理解语义的相似性是不够的,在理解语义差异性的基础上理解语义相似性才有价值。比如“车前草是什么”“解释下什么是车前草”“告诉我车前草是什么植物”“名词解释车前草”“车前草是什么物种”“车前草是什么中药”这组句子里,有一句话和其他句子的语义不一样。如果只处理关键字,可能会认为这几句话语义都不一样,或者认为它们都有语义相似性。绝大多数我们的同行和准同行只能做单轮对话。能做多轮对话的就只能做天气预报这种简单领域的多轮对话,这个拿正则表达式就能实现。否定处理其实是很难的。“我不吃辣的炖排骨””我要吃炖排骨不要辣”是两种否定,意思也不一样。
做机器人大脑不仅仅是一个技术门槛很高的事情,也是个大工程。语义理解是机器人大脑的底层技术,连语义理解准确都做不到怎们能做好机器人大脑呢?做好语义理解,只是让机器人具备了智能;机器人还需要学习大量的知识才能为用户提供服务。
我相信用于语音交互的机器人大脑一定有美好的未来,我们氖星智能未来一定是谷歌微软级别的公司。但创业十年几乎没赚到什么钱。即便拿了几次投资,我们依然在很多时候吃了上顿没下顿。还好最近接了一些客服机器人定制开发的项目,让我看到了盈利希望。(在此顺便感谢我的几位投资人。)
眼下我们缺内容的短板很难补齐。如果通过客服机器人积累资金和实力,然后不断完善我们机器人大脑,积累内容,我们一定会发展得越来越好。

文章来源:斯贝瑞品牌官网
风险提示及免责条款
[温馨提示] 文章来源于斯贝瑞品牌官网,转载注明原文出处,此文观点与查生意无关,理性阅读,版权属于原作者若无意侵犯媒体或个人知识产权,请联系我们,本站将在第一时间删掉 ,查生意仅提供信息存储空间服务。


