小程序关键词搜索不到怎么办?
想必很多人的朋友圈都被微信小程序刷过屏,毕竟作为微信平台的产物,小程序的功能获得了广大用户的信任,但是最近有朋友反映小程序关键词搜索不到,这到底是怎么回事呢?有什么方法可以解决?
比如下面,简直惨不忍睹,如果不是提前知道完整全名,几乎搜不出来。
于是,犀利的网友开始吐槽:
对于一个APP重度使用者来说,小程序意味着一早上起来就解英格玛密码
然而细心的读者朋友可能又发现了,搜索「京东」能出来「京东购物」、搜索「滴滴」能出来「滴滴出行DiDi」、搜索「携程」能出来「携程酒店机票火车票」,这又是为何?
想要解决小程序关键词搜索不到的问题,这里就涉及到了一个「中文分词」技术和「模糊匹配」技术了,微信小程序商店介绍得比较详细。
中文分词技术
我们知道,在英文的行文中,单词之间有空格作为自然分界符,比如下面这句:
I am very handsome !
可以轻松地分成 i 、am 、very、handsome 四个单词。
而中文只是字、句和段能通过明显的分界符来简单划界,唯独词没有一个形式上的分界符。
比如这一句广告语:
南京市长江大桥欢迎您!
你可以理解为:南京,市长,江大桥,欢迎,您 ;
也可以理解为:南京市,长江大桥,欢迎,你;
这样不同的分词方法得到的结果就截然不同。
现代汉语的基本表达单元虽然为“词”,且以双字或者多字词居多,但由于人们认识水平的不同,对词和短语的边界很难去区,比如:
“对随地吐痰者给予处罚”
“随地吐痰者”本身是一个词还是一个短语,不同的人会有不同的标准,同样的“海上”“酒厂”等等,即使是同一个人也可能做出不同判断,如果汉语真的要分词书写,必然会出现混乱,难度很大
中文分词 (Chinese Word Segmentation) 指的是将一个汉字序列切分成一个一个单独的词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。和英文相比,中文分词难得多得多!
然而这并难不倒程序员们
目前的分词算法可分为三大类:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法
字符匹配
又叫做机械分词方法,它是按照一定的策略将待分析的汉字串与一个“充分大的”机器词典中的词条进行配,若在词典中找到某个字符串,则匹配成功(识别出一个词)。
这是种常用的分词法,小程序字符串匹配的分词方法,又分为3种分词方法。
同样以“不知道你在说什么”为例,不同的匹配法有不同的结果:
用正向最大匹配法,也就是把一个词从左至右来分词,就是:“不知道,你,在,说什么”。
用反向最大匹配法:也反向最大匹配法就是从右至左,就会分成:“不,知道,你在,说,什么”
用最短路径分词法:也就是说一段话里面要求切出的词数是最少的,就会分成:“不知道,你在,说什么”,这就是最短路径分词法,分出来就只有3个词了。
用双向最大匹配法:如果关键词前后组合内容被认为粘*相差不大,而搜索结果中也同时包含这两组词的话,进行正反向同时进行分词匹配。
简单来说,就是正着拆、反着拆、简单拆,和来来回回拆,总之各种体位来一遍。
理解法
人工智能兴起,于是这种新的方式开始流行,理解分词方法是通过让计算机模拟人对句子的理解,达到识别词的效果。
其基本思想就是在分词的同时进行句法、语义分析,利用句法信息和语义信息来处理歧义现象。
它通常包括三个部分:分词子系统、句法语义子系统、总控部分。在总控部分的协调下,分词子系统可以获得有关词、句子等的句法和语义信息来对分词歧义进行判断,即它模拟了人对句子的理解过程。这种分词方法需要使用大量的语言知识和信息。
由于汉语语言知识的笼统、复杂*,难以将各种语言信息组织成机器可直接读取的形式,因此目前基于理解的分词系统还处在试验阶段。
目前 Siri 、微软小冰等等都充分运用了人工智能来尝试“理解”人的语句,另外三角兽为锤子手机提供的 “Bigbang”分词功能、科大讯飞的语音输入法等我们常见的功能在分词原理上都有运用该方法。
按照上文中的方法,小程序关键词搜索不到这个问题应该能够顺利解决的,只有解决了这个问题,你所开发的小程序才能更快地被人知道,从而实现小程序推广。
微信小程序关键词配置怎么操作?
究竟微信小程序怎么添加搜索关键词?
微信小程序关键词搜索的作用是什么?
下一篇:微信抽签小程序怎么制作?
