電商類產(chǎn)品搜索功能如何優(yōu)化?
注:搜索功能對于電商類產(chǎn)品而言尤為重要,當用戶帶著明確的目的去搜索自己需要的產(chǎn)品時,卻沒有得到他想要的結(jié)果,這在很大程度上直接影響了用戶對于產(chǎn)品的體驗。本文作者結(jié)合自己的經(jīng)驗,來探討關(guān)于電商類產(chǎn)品搜索功能應如何優(yōu)化。
在講主題之前想跟大家分享一下前些時間聽到梁寧產(chǎn)品 30 講里對用戶畫像的描述,里面有提到一組經(jīng)典的用戶畫像大明、笨笨和小閑:大明呢對應的是對自己需求有明確認知的用戶,腦子很清楚自己想要的是什么;笨笨則是對自己的需求只有模糊大概的方向,不清晰;至于小閑,想必大家也能猜得出來,主要是閑來無事就是想打發(fā)時間的用戶類型。
為什么要跟大家分享這一組用戶畫像呢?
當然是和我文章內(nèi)容有關(guān)咯。筆者就職于一家toB的saas公司,入職不久就被安排負責公司還沒有正式上線的采購模塊搜索功能的優(yōu)化。
接著上一段說,B端采購產(chǎn)品面對的用戶顯而易見都是大明,他們都是帶著明確的目標進行采購的,正是因為目標明確。所以在三種用戶類型中,大明最依賴于搜索,他們的需求也是最簡單的——快速找到自己想要的東西,價格實惠。因此搜索好不好直接影響到產(chǎn)品能否滿足用戶的需求。
一、面對的問題
第三方api接口質(zhì)量差
因為是小公司的緣故,一開始搭建采購平臺時接入的是某電商采購,但對方所提供的搜索接口質(zhì)量太差、分詞不準、召回率低或者召回數(shù)據(jù)量過大等等。打個比方:讓你叫個周杰倫回來,要么周杰、杰倫、周杰倫都回來了,要么沒人回,要么叫回的無關(guān)人員多的你都應付不過來了,簡而言之就是問題多過對策。
自建搜索缺人缺資源
第三方的搜索接口太差,于是在我來公司之前,公司就已經(jīng)做出了自己的搜索功能,但是人力物力有限,沒有過剩的資源,再加上公司業(yè)務戰(zhàn)線太長只能顧著拼命往前線趕,都無法顧忌這個路上的大坑,結(jié)果做了個爛尾的搜索。
雖然分詞詞庫基于ik開源詞庫搭建,分詞有了稍許改善,召回率也有了保障,但是分詞結(jié)果依舊不精準,無法實現(xiàn)語義識別,根本不能滿足大明用戶的基本需求。
還是拿周杰倫舉例:不僅來了周杰、杰倫和周杰倫,甚至還來了同名的阿貓阿狗,我入職之后缺人缺資源的狀況依舊沒有絲毫改變,真的是光桿司令。
二、老板的期望
不管做任何行業(yè)任何職業(yè),老板都是一個躲不開繞不過的存在。做產(chǎn)品更是如此,因為很多小公司的老板就基本干著產(chǎn)品的活兒,所以跟你產(chǎn)品意見不合那就是家常便飯。
對于公司產(chǎn)品搜索功能,我們老板的期望還是比較謙虛的,僅次于國內(nèi)知名電商平臺的搜索體驗就好了,不要 100 分, 99 分就行了。我的天,這真的是讓我咬牙切齒了。
就我個人的體驗來說,公司采購的搜索功能基本也就是個40、 50 分不及格的樣子,加上公司沒有專業(yè)做過搜索的產(chǎn)品,而我也是個新人,技術(shù)資源支持也不足,所以就算有心殺賊也無力回天。
問題總是接二連三的,罵人也是要罵的,但是事兒總得去做,畢竟總得跟老板表個態(tài),就算面對不可能完成的任務,也必須抱著不破樓蘭終不還的決心。
冷靜思考一下:自己面對的問題主要集中在幾個方面:搜索接口、分詞、語義識別這三個方面。
基于這幾點,通過幾次產(chǎn)品技術(shù)的討論會議,也算是確定了現(xiàn)階段可以實施的優(yōu)化方案如下:
三、優(yōu)化的方案
1. 優(yōu)化ik分詞詞庫
大部分電商平臺都是通過分詞來提高商品的召回率以及相關(guān)度的排序,而分詞詞庫則是保證分詞準確的關(guān)鍵。上文里周杰倫的例子,正式因為分詞詞庫里存在周杰、杰倫這些無效詞,才使得會召回他們。
而ik詞庫分為基礎(chǔ)詞庫、擴展詞庫和stopword,分詞是根據(jù)基礎(chǔ)詞庫里的詞來分,擴展詞庫則是對基礎(chǔ)詞庫的補充,而stopword里的詞就是被過濾掉的詞,因此優(yōu)化ik詞庫采用三步走戰(zhàn)略。
首先是清洗基礎(chǔ)詞庫的無效字詞,以非名詞和相關(guān)度過低的字詞為主;
其次是補充擴展詞庫,畢竟ik詞庫是只是個詞庫,沒辦法自動更新,與時俱進,它有周杰倫不一定有蔡徐坤,所以需要我們自己去新增;
最后就是增加stopword,這個網(wǎng)上搜索一下就有了,ik自帶的stopword量很少,通過補充,可以有效地過濾掉一些不必的分詞結(jié)果。
2. 關(guān)鍵詞綁定類目來輔助語義識別
語義識別就是,讓系統(tǒng)去召回周杰倫,系統(tǒng)知道周杰倫是男明星,而不會給你召回同名的其他人。而目前我們公司的能力,是無法從技術(shù)層面去實現(xiàn)搜索的語義識別,只會去全部召回匹配到標題名稱里包含搜索關(guān)鍵詞的商品。
為此只能通過人工的方式去將關(guān)鍵詞和類目進行關(guān)聯(lián),相當于給關(guān)鍵詞打了標簽,找周杰倫只會在男明星的類目下去召回,保證了搜索結(jié)果的相關(guān)度。
小結(jié)
搜索功能的優(yōu)化除了這些還有索引、排序等等,以上的優(yōu)化方案都是基于我們公司的實際情況來說,也是為了滿足大明用戶的基本需求(可以搜到想要的東西)為出發(fā)點,雖然這些舉措對搜索功能的優(yōu)化起到一定的作用,但是最好的解決辦法還是找到一個靠譜的接口或者是一個靠譜的分詞詞庫。