搜索产品众多,有哪些需要注意的问题?除了技术,我们还需要知道什么?搜索本身是一个相对技术性的东西。小白产品如果想学习搜索的产品知识,荷兰电话号码列表 会发现各大论坛搜索相关的内容主要是技术性的。就算买了几本搜索相关的书,大部分都是在讲搜索引擎的原理。如果没有办法开始学习,上手会更加困难。那么对于搜索新手来说,我们应该如何设计搜索引擎呢?搜索路径:输入搜索词-抓取数据-分析用户搜索意图-识别意图并回忆内容-结果集sorting.1。抓取数据搜索引擎:在全网抓取尽可能完整的数据,供搜索引擎查询使用。垂直搜索引擎:荷兰电话号码列表 这些数据95%以上是平台自建的,不需要去其他平台抓取数据。比如淘宝、美团都是平台自己维护的数据。
平台需要做的是让数据尽可能的准确和真实。如果为卖衣服的产品输入的信息都是关于卖鞋的,那么引擎再好,也无法识别这个“衣服”。 2.分析用户搜索意图:分词、文字处理、文字识别1。分词:分词,词组分词1)分词,荷兰电话号码列表 即把用户输入的词分成单个词,每个词只要与搜索域匹配就可以被搜索到。这种分词简单,易于开发,适用于spu和类别较少的平台。但是这种分词方法有个缺点,就是搜索结果不准。比如我要搜索“小金锁”的掩码,在可以调用搜索字段。荷兰电话号码列表 真实案例是搜索结果显示“金色小米手机人脸解锁”。 ”电话极其尴尬。2)Phrase Participle这种分词方法需要根据自己的平台准备一个分词词库(如果没有找到开源词库),分词引擎进行分词和基于搜索比如你要搜索“小金锁”,分词库包含“金锁”和“小金锁”,
那么你搜索的词会分为“小”、“金锁” ,“小金锁”,则搜索域中间有“金小米手机人脸解锁”的sku不会被搜索,因为“金锁”和“小金锁”这两个词不匹配。荷兰电话号码列表 有些垂直类别需要搭建自己的平台分词库,比如电商平台,可以从品类名、地名、品牌名、店铺名等方面搭建一个基础的分词库。提供一个思路供大家思考,应该怎么做下一个?2。文字处理类用户的搜索词千奇百怪,无法避免相同的搜索结果,每个人的搜索词都不一样。但是,荷兰电话号码列表 为了保证无论用户输入什么搜索词,都能成为想要的结果。这时候就需要同义词、同义词、错别字、阻塞词介入。1)同义词因为结果集是一个并集,所以无论搜索同义词中的哪个词,用户都会得到相同的结果。当词库是建,尽量保证词库的真实性和准确性。