APP推广合作
联系“鸟哥笔记小乔”
基础功能理解:搜索功能的设计理解
2021-04-01 15:16:22

搜索功能是许多产品的核心,例如电商搜索、内容搜索等等。面对如何进行搜索功能设计,确实是个看似简单实则深奥的问题。不管不顾,随后画一个条形框、正方体,他们就是搜索框和搜索图标就能代表一个搜索模块。若要仔细研磨,各种用户交互问题,各类逻辑,那他们也是一个搜索系统。这一切都取决于你,产品设计师如何设计。

设计一个搜索功能我们需要从用户体验和功能实现两方面出发。用户体验包含了样式UI设计、交互设计。囊括起来说就是用户搜索前、搜索中以及搜索后用户对我们的功能的感知。而功能实现则是聚焦用户对问题的输入,和我们结果的输出(结果匹配度)。由此我将分成搜索的设计和搜索的逻辑两部分进行说明。

一、搜索的设计

先从可感知的样式来说。我们按照用户路径地图来理解用户使用功能时的具体步骤:

用户使用产品 - 有疑问需要搜索解决 - 看见搜索功能 - 点击搜索功能(展开输入框) - 输入问题 - 点击确认等到结果反馈 - 翻阅搜索结果 - 选择结果进行查阅。

按照上述路径,我们可以将用户使用搜索功能的场景分为三部分:搜索前、搜索中、搜素后。同时根据应用场景的不同,还需区分移动端和PC端。

搜索前

首先,我需要申明我对于搜索核心的定义,那就是搜索功能核心在于解决用户的疑问,给予用户满意的答案。因此我们在设计的时候,需要带入场景假想我们就是用户,我们在迫切需要解决问题的时候,我们会是什么样的心里活,烦躁?渴望?又或是兴奋?。建立了同理心后才是功能的设计。

所以在搜索功能设计的时候,对面用户迫切的心情,我们合理设计搜索功能。在用户使用产品产生疑问的时候,我们要根据当前场景进行选择放大、缩小搜索对于用户的感官。在越容易产生疑问的地方选择使用输入框搜索作为设计方案,而在不容产生问题的地方还是可以选择搜索图标作为解决方案。

and

这两个解决方案是十分常见的,但我们需要注意,除开样式的差异在选择使用输入框作为搜索样式的时候,大多人都偏爱在输入框上做文字引导,这种文字引导有引导使用文案和推荐搜素文案两种。这样做不是一定需要的,因为我确实没准确的数据告诉你,做了和没做在数据层次带来的效果是什么。所以这是需要你自己自行选择的。

搜索中

用户点击搜索功能输入问题这段时间,我们看作搜索中。在这里有两种设计方式。分别是当前页面直接进行搜索和进入搜索独立页面。其中,当前页面直接进行搜索,在pc端较为常见,因为pc页面有大面积区域可使用,可以尽情展示内容所以常见。

另外一种采用搜索独立页面在移动手机端常见,因受限于手机屏幕大小,在不跳转页面直接搜索的情况下我们可展示的内容过于受限。而采用了新页面承载搜索,那就可以提供更多的功能和内容。

在这里我们可以通过后台管理功能,尽情的增加热门搜索的内容。同时在用户输入内容后,我们对输入内容进行联想展示,方便用户选择他想搜索的实际内容,提高搜索的易用性和便捷性。

但是产品设计师们需要注意的是。联想展示内容不易过多,控制在7个词条左右就行,过多词条会干扰用户阅读。展示内容需要有独立一套逻辑支撑,需要明确告知研发,为什么显示这些内容?这些内容排序依据是什么等。(这里后面部分会介绍说明)

同理,从提高搜索的易用性和便捷性这个目的出发,我们可以收录用户近期历史搜索,以便用户再次搜索相同问题。至于历史记录每次展示几个,可参考7+-2法则控制数量。(一般人的短时记忆容量约为7个加减2个,即5--9之间。可以理解为7加减2个组块。)

搜索后

搜索结果的展示在移动端上一般是双排和单排展示。双排能够展示更多的搜索结果。单排能对搜索结果展示更多的信息。到这里基本对于搜索功能的原型就没有问题,下面开始说说搜索功能的逻辑部分。

二、搜索的逻辑

先说结论:看似简单的搜索其实并不只是由简单的sql(数据操作语言)进行全数据库搜索,里面还涉及对用户搜索问题的、分词、纠错、预测、召回以及排序排序。

分词

分词很好理解,就是当用户输入问题后,对输入的文字进行拆分,就叫分词。分词核心在于分词法以及特性字词典库。

同时分词也叫NLP(自然语言处理分析)算是AI人工智能的一个分支,毕竟你需要让人工智能理解你说的是什么,学的是什么,不然就成人工智障了。那么搜索是按照什么方式进行分词的了?其实分词的方式很像小时候查字典。

1、逐词匹配

我们理解为一个人给你一句话,这时你需要将他们分成两两相对或三三相对的词条,但是你并不知道如何那几个相邻的字能够组成字条。那么索性你直接拿着这句话去翻新欢词典,从头到尾翻一次,发现没有符合的时候,就删除最后一个字,在去翻词典。以至于将词典中的所有词按由长到短的顺序在文章中逐字搜索,直至文章结束。

这种方式你可以想象下,如果是人是不是很崩溃。就算是电脑在进行,因为需要重复的查询,也会造成效率低下,等半天才分词成功。

2、正向最大匹配法

最大正向匹配会按照我们的阅读习惯,从左到右进行匹配,而其中的最大的含义就是当出现多个匹配词条时,以字数最多的词条为准。比如匹配野生动物园这个词条有两个匹配,一个是野生动物图案,另一个是动物园。那我们以野生动物园为最终匹配。按照这个思路我们再说明。

有个用户搜索:“成都动物园在哪里”。

这个时候进行第一次词典查询,按在最大的词“成都动物园在哪里”进行查询,发现没有匹配。

进行第二次查询,这次查询“成都动物园在哪”,同样没发现匹配。

进行第三次查询,这次是“成都动物园在”,还是发现没有匹配的。

第四匹配的时候,这次匹配“成都动物园”,结果在词条里面检索到了。我们保留结果是“成都动物园”。随后便去除“成都动物园”变成“在哪里”重新开始检索。这样根据我们的词典进行分词,我们可以得到结果:“成都动物园”“在”“哪里”。这就是正向最大匹配。

3、逆向最大匹配法

大致逻辑和正向匹配相同,唯一的区别在于它是从右到左,每次减去开头的字。还是以“成都动物园在哪里”为例。

第一次词典查询,按在最大的词“成都动物园在哪里”进行查询,发现没有匹配。

进行第二次查询,这次查询“都动物园在哪里”,同样没发现匹配。

进行第三次查询,这次是“动物园在哪里”,还是发现没有匹配的。

.......

最后在第七次查询我们得到“哪里”,随后便去除“哪里”对““都动物园在”进行检索。当同样的逻辑缩减到“在”后,还是没有相对应的词典,那么将“在”也单独剔出,开始检索“成都动物园”。这样第一次检索就成功检索出来,得到结果“哪里”“在”“成都动物园”这样的分词。因为是反向其实结果和正向结果相同。

4、双向匹配

这种匹配法是为了更加准确的分词出现,把正向和反向两种算法都切一遍,然后根据词条颗粒度来进行选择。分词的词条越长越好,非词典词和单字词越少越好的原则,选出这里面最合适的进行匹配。例如:

非词典内的词:正向匹配(1)> 反向匹配(0) 选择反向

词典内的单字:正向匹配(2)=  反向匹配(2) 持平不做选择

总分词数量:正向匹配(3)<  反向匹配(2)选择反向

词意纠错

词意纠错也是搜索里重要的一环节,在搜索的时候,打错字说错话是很常见场景(语言搜索)。并且因为文字和语言是情感交流的渠道,中文汉字会因为声调的不同有着不同的含义。同时一词多义,通假字等也是十分头疼的事情。

这词意纠错也可以按照查字典来理解,只是查询的字典是特殊字典里面的内容包含了情感,拼音还有声调相关的内容。抽象点的描述,我们在看见“康帅傅”的时候大脑会把“康帅傅”自动纠错成“康师傅”,这就有点自动纠错的味道。

1、拼音纠错

当输入的汉字存在错误时,系统需要及时联系上下文进行解析,可以将汉字转换成拼音,通过同拼音进行识别,比如“如何吧大象放入病象”,把他们未能分词成功单独留下的汉字转化成拼音“如何“”ba“”大象“”放入“”bing“”xiang”在查询字典进行处理。

2、模型算法

这部分高于繁琐,想了解的可自行搜索:SVM、Maxent等

类目预测

用户使用搜索功能在于得到解答,所以我们需要理解用户搜索内容的含义。比如用户搜索苹果的时候,她搜索的是吃的苹果还是苹果手机了。一个吃一个用这两个答案是风马牛不相及的,所以预测类目会对用户搜索结果影响很大。

做类目预测有几个方法:

1、人工配置

通过后端埋点日志搜集最近热门的搜索词,对这些搜索词进行指定配置,这样就可以保证当用户搜索苹果的时候出来的是苹果手机,而不是真的苹果。这样也是最简单有效的方法,但麻烦在需要安排人长期维护。

2、类目相关性

通过对搜索词进行算法计算,从搜索词的重要性、类目数、类目出现次数、搜索词出现次数等进行计算。

代表性tf-dc算法。

结果排序

搜索结果的排序也是十分头疼的事情,比如搜索苹果手机,出现的结果是10万+条商品信息,那么谁排第一这就成了一个问题。因此我们要从权重出发进行权重排序。(商品少也可以按照最新更新时间排序,主要看个人)。

1、词频:对搜索对query进行分词处理,在进行预测类目后对高词频内容优先展示

2、用户标签:符合用户标签喜好的商品进行加权,优先排序

3、时间段:对当前时段营业(客服在线)进行加权

4、销量、好评率:同理这就不说了

5、商品时效:对新更新商品进行加权,可用于互冲旧商品销量、好评的加

6、付费:竞价广告、付费升权等

‍-END-

谢金钟
分享到朋友圈
收藏
收藏
评分

综合评分:

我的评分
Xinstall 15天会员特权
Xinstall是专业的数据分析服务商,帮企业追踪渠道安装来源、裂变拉新统计、广告流量指导等,广泛应用于广告效果统计、APP地推与CPS/CPA归属统计等方面。
20羽毛
立即兑换
一书一课30天会员体验卡
领30天VIP会员,110+门职场大课,250+本精读好书免费学!助你提升职场力!
20羽毛
立即兑换
顺丰同城急送全国通用20元优惠券
顺丰同城急送是顺丰推出的平均1小时送全城的即时快送服务,专业安全,准时送达!
30羽毛
立即兑换
谢金钟
谢金钟
发表文章8
确认要消耗 0羽毛购买
基础功能理解:搜索功能的设计理解吗?
考虑一下
很遗憾,羽毛不足
我知道了

我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。


一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
    1)反对宪法所确定的基本原则;
    2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
    3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
    4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
    5)煽动民族仇恨、民族歧视,破坏民族团结;
    6)破坏国家宗教政策,宣扬邪教和封建迷信;
    7)散布谣言,扰乱社会秩序,破坏社会稳定;
    8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
    9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
    10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
    11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
    12)危害未成年人身心健康的;
    13)含有法律、行政法规禁止的其他内容;


2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
    1)轻蔑:贬低、轻视他人及其劳动成果;
    2)诽谤:捏造、散布虚假事实,损害他人名誉;
    3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
    4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
    5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
    6)谩骂:以不文明的语言对他人进行负面评价;
    7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
    8)威胁:许诺以不良的后果来迫使他人服从自己的意志;


3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
    1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
    2)单个帐号多次发布包含垃圾广告的内容;
    3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
    4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
    5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
    6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
    7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
    8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。


4. 色情低俗信息,主要表现为:
    1)包含自己或他人性经验的细节描述或露骨的感受描述;
    2)涉及色情段子、两性笑话的低俗内容;
    3)配图、头图中包含庸俗或挑逗性图片的内容;
    4)带有性暗示、性挑逗等易使人产生性联想;
    5)展现血腥、惊悚、残忍等致人身心不适;
    6)炒作绯闻、丑闻、劣迹等;
    7)宣扬低俗、庸俗、媚俗内容。


5. 不实信息,主要表现为:
    1)可能存在事实性错误或者造谣等内容;
    2)存在事实夸大、伪造虚假经历等误导他人的内容;
    3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。


6. 传播封建迷信,主要表现为:
    1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
    2)求推荐算命看相大师;
    3)针对具体风水等问题进行求助或咨询;
    4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;


7. 文章标题党,主要表现为:
    1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
    2)内容与标题之间存在严重不实或者原意扭曲;
    3)使用夸张标题,内容与标题严重不符的。


8.「饭圈」乱象行为,主要表现为:
    1)诱导未成年人应援集资、高额消费、投票打榜
    2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
    3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
    4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
    5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序


9. 其他危害行为或内容,主要表现为:
    1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
    2)不当评述自然灾害、重大事故等灾难的;
    3)美化、粉饰侵略战争行为的;
    4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。


二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。


三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)

我知道了
恭喜你~答对了
+5羽毛
下一次认真读哦
成功推荐给其他人
+ 10羽毛
评论成功且进入审核!审核通过后,您将获得10羽毛的奖励。分享本文章给好友阅读最高再得15羽毛~
(羽毛可至 "羽毛精选" 兑换礼品)
好友微信扫一扫
复制链接