Chatbot基本概念

Python015

Chatbot基本概念,第1张

Chatbot 基于NLP技术,是一种人机交互方案。与传统APP交互不同,Chatbot以对话为主要形式。Chatbot的重要性,在 交互未来 中有介绍。本文主要讲Chatbot的基本概念。

1.澄清

Chatbot这个名字有点水分。翻译是聊天机器人,但它不是机器人。当你听到一个东西是机器人,就会拿出逗猫那套,各种玩它,逗她,下意识认为它是不同于你的东西。有种「你她」对立的感觉。Chatbot不是「她」,而是一种交互方式。帮助用户,将用户意图,转化为机器可以理解的内容,从而实现某个事情。叫chat-interaction更恰当些。

2.对话管理(Dialog Management)

对话是chatbot的核心。每一次对话,都是一次交互。当用户说出一句话,chatbot需要将这句话包含的信息,组成机器可以理解的内容。然后,根据一定的策略,给出一个反馈——回复一句话。这个过程就叫对话管理。

平常对话,不止一轮。多轮对话中,每句话信息不同,需要添加新信息,更新已有信息,这个叫对话状态管理(Dialog State Tracking,DST)。语言中信息,复杂且多变,DST通常需要复杂又灵活的数据结构。DST是对话管理的第一核心。

对话策略(Policy)要解决的是,如何根据用户的话中信息,得到恰当的回复。当前大量chatbot的策略,是基于写死的规则,是一大堆「if-else」的组合。也有一些团队,在用强化学习,实现智能化规则。

3.意图

意图这个词,人可以看懂,和机器的联系就很远,有点反机器。为什么?因为这个词,是产品经理想出来的。

用户说完一句话,chatbot需要理解这句话。这个理解的首要点在于,搞清楚这句话背后,用户想要什么功能。功能也就是意图。在传统APP里面,功能都在界面上,用户可以看可以摸。现在情况变化,没有功能界面,用户只能用语言表达想做什么,chatbot要去「猜测」这句话是哪个页面,什么功能。「猜测」准确极其重要,否则就驴头不对马嘴,画风诡异。

最简单的意图理解,是分类问题。对话轮数变多,还要考虑上下文,经典NLU文本分类算法可能不够,需要引入更多算法(如RNN)。

4.实体(或槽)

刚才说,理解一句话,意图是首要。然后呢,就是识别与意图有关的实体。实体(Entity)这个词,脸书,谷歌和微软的chatbot服务在用。亚马逊,百度,则用的是槽(slot)这个概念。能对应就好。

意图对应功能,实体则对应完成功能所需的参数。比如,用户说,「我要打个电话」。「打电话」就是意图(功能)。打电话应该怎么做?用户还要选择「什么时间」打电话,打给「谁」,打「视频电话」还是「语音」。时间、谁、方式三个就是「打电话」这个意图关联的实体。画过APP交互的知道,这个页面要怎么来,不同的是,现在要用一句句对话来实现。

又比如,「我想去河边钓鱼」。「钓鱼」就是意图。这次实体就比较复杂了。「钓具」,「天气」,河边在「哪」,怎么去的「路线」,「出发时间」都和意图相关。不过,如果用传统APP,要同时用到很多APP,而且容易乱,此时,chatbot式交互就非常有价值。

实体识别,是词的提取和匹配问题,最近几年已发展成熟。chatbot需要应对的是,随时切换的意图,以及可能错综复杂的实体关系,这需要经验和洞见。

5.场景(chatbot的应用)

上边钓鱼的例子,实体里面有「钓具」、「路线」等,实际它们本身也可成为意图。这时,钓鱼就成为一个场景(Story),它是一堆互相关联意图的结合体。

在场景这一层,基于Chatbot的应用,与传统APP已经没什么区别。理论上,Chatbot应用可以做的,APP也可以,它们是竞争关系。谁体验更好、成本更低很重要。对于chatbot,在场景生产的效率上,比APP交互远高,简直就是工业与农业的区别。想想,对chatbot真是充满期待。

推荐电影:

Her

钢铁侠

黑客帝国

很多人对这个可能不懂,其实chatgpt就是度娘的高级形式,举例:我们有什么不懂的,就会在百度搜索栏里输入问题,然后就会出现和这个问题相关的很多内容,但这时候看到内容很分散很杂,我们需要看好几个内容然后通过大脑总结形成最终的答案,而chatgpt就是把这些分散的内容总结了一下,不再需要通过我们的大脑总结,总结内容可以通过语音图像文字呈现。

人工智能要做这些事件需要有图像语音视频动画等的转换能力,总结就需要AI芯片算力等,总结需要有内容就需要很大的数据库,这就是chatgpt涉及的各个方向。

chatbot和chatgpt的区别就是,chatgpt是度娘,问他什么问题都可以回答,但不一定非常细致,而chatbot是专业的人工智能,目前的应用都是为企业服务的,比如你问一个东方财富软件功能问题,chatgpt不一定能够回答你,而chatbot就可以回答,主要是因为他们数据库内容的问题,chatbot可以做到内容的即时跟新,而chatgpt却不可能,面太广了,做不到专业。

内容是需要基础数据库的,这就涉及到文化政治倾向问题,你放哪些内容到数据库,人工智能就会怎么回答你,所以意识形态的差异就会导致欧美不用我们的产品,我们不用欧美的产品。

chatgpt和chatbot在技术上是没有多大区别,chatbot也可以升级到语音视频动画图像,目前国内的chatbot因为是专业领域,所以都有固定的答案,不需要很强大的AI,最终区别chatgpt需要更大的数据库和算力,仅此而已!

分享至

微信

朋友圈

微博

郑重声明:用户在财富号/股吧/博客社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!

全部评论 (4)

最新

陆日升

来自:广东

赞一个专业分析

02-11 13:49

回复

0

抄牛牛

来自:广东

最近很多人在争论AIGC哪个是最正宗的问题,其实答案是没有争议的,哪个公司能利用AIGC创造最大的社会价值,哪个公司就正宗的。很显然,思维要点在于哪人公司可以利用AI打造产业经营模式闭环的问题。 无疑OPENAI公司是引爆了chatgpt的社会热点,让在家误以为,谁跟open AI公司有关系,谁最像他谁就有是AI最正宗的公司,是这样的吗?也末必吧。 回到刚才讲的标准的问题,谁能利用AI打造产业经营闭环创造最大的社会价值呢? 我的回答是,昆仑万维和萤石网络,这个文章我主要说的是昆仑万维。 所以,思路是很清晰了,昆仑万维打造了适应AI产业经营模式的闭环,能创造最大的社会价值,所以昆仑万维才最正宗。而不是去比较谁的服务器谁牛逼,谁模型参数多谁牛逼。这就像你有小孩经常考90分所以你认为你儿子将来能当总统一样。大家不要陷入这种思维误区。 AI的本质是什么,是让机器变得聪明,让机器变聪明是为了让机器能完成更复杂的工作。哪些行业的机器在现在的科技水平下能能体现最大的AI+效益的行业才是好行业。 所以刚才的问题的等价变换成,哪个行业能利用AI最快提升生产效率。 无疑,答案还是昆仑万维和萤石网络。 AI+行业的模式是:数据+人+物 所以核心的是,人的平台+数的平台+物的平=流量平台+大数据 人的平台:腾迅 META 等 物的平台:物联网平台(小米,萤石网络,华为) 数据平台:云服务 当然,最重要的那个要素其实是那个+,是规模化应用场景。 只有规模化的应用场景,真是社会真正需要的。 打造了规模化应用场景的,是昆仑成维,是萤石网络(不看好小米是因为那个+没有做好) 即便是如日中天的Open AI公司,他想好了他的经营模式了吗?靠回答问题赚钱吗? 在考虑这个问题的时侯,我突然明白,为什么昆仑万维已经在这个问题上深思熟虑很久了。因为昆仑万维在研究天工模型的时侯,也是几年前了。不像其它友商,赶鸭子上架硬蹭概念的感觉。 想明白了这件事,我们就想明白了很多事情,比如,其实原理模型并不是那么重要,是价值含量最低的要素,所以昆仑万维很聪明的出来说,我们要开源模型原型。 其实,AIGC也并不是我们想象的那么聪明,AIGC其实是按照我们设定好的路径去处理数据。 同时,模型也并不见得是参数越多越智能,而是找到性价比最好的应用场景。在没有找到规模化的应用场景盈利之前,不要说利好GPU什么的话出来。我不会花一万块钱的电费问AIGC晚上吃10块钱的盖浇饭好呢,还是10块钱的泡面好呢。 现实就是这样,很多AI公司都没有找到能触发良性循环的盈利应用场景。所以大批AI公司一直在亏钱,解决不了碎片化应用拼成规模化应用的场景问题。 但是,不好意思,昆仑万维和萤石网络解决了这个问题。 他们的打法是同构的,都是在垂直细分里发力,然后整合成大的应用场景。 换句话说,选择应用场景颗粒度的问题,在多大层面打造统一标准,又在多小细分层面打造专有模式。统一标准和专有技术的组合拿捏平衡,才创造出了独有的经营模式,最富于创新力的经营模式闭环。 萤石网络的通用技术上,我的视频技术算法有优势, 我的终端接入量也有优势(虽然还比不上小米),专有技术上,我在摄像头里增加AI识别火灾模块,识别老人跌到模式,识别鱼缸变脏模块。叠加起来就变成了萤石网络独有的竟争力。 昆仑万维也是如此,收购欧朋浏览器,把头条模式复制到欧州非洲,打造元宇宙游戏社区,打造在线音乐平台。组合在一起就是有特色的垂直流量矩阵。是未来最有前景的流量平台。再加上AI赋能,这本身就是天然成熟的应用场景,AI天然就能直接赋能的。 所以,核心还是经营模式的问题,能赢利且能良性循环迭代的经营模式闭环才最重要。新时代的大树总是从小树苗开始的,如果你仅仅因为他小认为他没有实力这个错误就太大了。比如,昆仑万维的模型参数确实没有 openAI公司的多,但确实昆仑万维已经把AI技术用在游戏研发当中,确实又降了很多成本了。确实脚踏实地的接地气了。 所以我认为,我对AIGC的理解还算到位的,纯逻辑推导来说。 转钱的格律诗

02-11 12:11

回复

2

慢慢挣钱1314 其实不管是投入还是成果,百度阿里字节华为腾讯都是国内的龙头,人工智能最重要的是算法,应用需要软件配合,百度阿里腾讯字节会发展很快,因为他们有现成的平台,用户基础好,最终联网万物智能大概率需要华为的鸿蒙系统,这是产业升级,子系统会诞生很多伟大的公司,专业的事还得专业的公司做

股友vU49YJ

来自:天津

02-11 11:05

回复

0

写评论 ...