<pre id="co8k0"><cite id="co8k0"></cite></pre><strike id="co8k0"></strike>
  • <acronym id="co8k0"><cite id="co8k0"></cite></acronym>
  • <nav id="co8k0"></nav>
    <input id="co8k0"><em id="co8k0"></em></input>
  • 內(nèi)容社區(qū)行業(yè)搜索最佳實(shí)踐:如何準(zhǔn)確理解用戶搜索意圖?

      簡介:社區(qū)內(nèi)容通常包括UGC和PGC。由于關(guān)鍵詞和內(nèi)容多樣性豐富、用詞規(guī)范程度參差不齊,搜索引擎需要對關(guān)鍵詞和內(nèi)容進(jìn)行智能語義分析,識別出用戶真正的查詢意圖,找到最全面最相關(guān)的結(jié)果滿足用戶需求。本文將詳細(xì)介紹如何通過“開放搜索(OpenSearch)內(nèi)容增強(qiáng)版”在社區(qū)論壇場景的應(yīng)用,提升用戶搜索體驗,帶來更多的業(yè)務(wù)轉(zhuǎn)化

      社區(qū)的核心是用戶,用戶進(jìn)入社區(qū)的主要目的是為了消費(fèi)內(nèi)容。內(nèi)容可以是廣義的圖文、音頻、視頻,也可以是通過社區(qū)找到解決問題的方法。優(yōu)質(zhì)的內(nèi)容能提升用戶的活躍度,為平臺帶來流量與時長,實(shí)現(xiàn)用戶增長和留存,獲得更多業(yè)務(wù)機(jī)會和收益。

      "搜索"作為社區(qū)直接獲取內(nèi)容的最有效途徑,每個社區(qū)都在不斷解決下面的搜索效果問題:

      如何準(zhǔn)確理解用戶的搜索意圖,返回最匹配的結(jié)果?

      如何通過內(nèi)容傳播的差異化,個性化來提升用戶的搜索體驗,增強(qiáng)社區(qū)歸屬感和忠誠度?

      如何在社區(qū)里不同領(lǐng)域,不同垂類,不同頻道間的內(nèi)容召回中實(shí)現(xiàn)交互和連接?

      如何實(shí)現(xiàn)非商業(yè)化內(nèi)容與商業(yè)化內(nèi)容更好的融合與發(fā)展?

      本文將帶著以上幾個思考,為大家解析內(nèi)容社區(qū)行業(yè)搜索特點(diǎn)和挑戰(zhàn),以及介紹阿里云智能開放搜索-內(nèi)容社區(qū)行業(yè)增強(qiáng)版的解決方案和應(yīng)用實(shí)踐。

      內(nèi)容行業(yè)搜索業(yè)務(wù)需求

      ? 更多的曝光機(jī)會——無結(jié)果率低;

      ? 更好的搜索質(zhì)量——搜索相關(guān)性高,更高質(zhì)量的排序;

      ? 更豐富的業(yè)務(wù)特征——結(jié)合業(yè)務(wù)特性調(diào)整搜索結(jié)果;

      ? 更全面的配套功能——智能糾錯、熱搜、底紋、下拉提示等配套能力;

      ? 更低的擁有成本——相較自建搜索引擎更低的開發(fā)、資源、運(yùn)維成本;

      ? 更便捷的開發(fā)使用——上線周期短,降低搜索引擎開發(fā)、效果調(diào)優(yōu)難度;

      ? 用戶搜索意圖指向性強(qiáng)——主搜聚集多個頻道內(nèi)容,搜索結(jié)果相關(guān)性要求更加精準(zhǔn);

      以某論壇社區(qū)為例,產(chǎn)品線覆蓋多個平臺,包含網(wǎng)頁、APP、小程序等形式,同時業(yè)務(wù)上區(qū)分多個頻道。隨著業(yè)務(wù)的發(fā)展,首頁綜合搜索(后簡稱“主搜”)的流量越來越大,各種付費(fèi)、引流業(yè)務(wù)接入,對搜索流量的運(yùn)營變得更加重要,對主搜的業(yè)務(wù)訴求越來越多,需要聚合多個頻道的內(nèi)容,同時搜索結(jié)果相關(guān)性要求更加精準(zhǔn),在考慮文本相關(guān)性的前提下,要加入更多的商業(yè)因素考慮。

      成熟的搜索引擎涉及離線模塊、在線模塊、查詢理解服務(wù)、算法平臺等系統(tǒng),所需大量開發(fā)、算法調(diào)優(yōu)以及持續(xù)的復(fù)雜運(yùn)維工作,由于人力有限,自建搜索系統(tǒng)很難滿足業(yè)務(wù)需求。

      常見搜索業(yè)務(wù)場景

      文章搜索

      博文、問答、心得分享等內(nèi)容搜索

      精品內(nèi)容、熱帖發(fā)現(xiàn)

      付費(fèi)資源引流

      標(biāo)簽分類過濾、篩選

    (配圖來自阿里云開發(fā)者社區(qū))

      話題搜索

      熱門活動、話題互動

      PGC、UGC

      熱搜、底紋、下拉提示等搜索引導(dǎo)

      個性化、時效性

    (配圖來自阿里云開發(fā)者社區(qū))開放搜索內(nèi)容社區(qū)增強(qiáng)版

      方案架構(gòu)

      功能介紹

      內(nèi)容行業(yè)增強(qiáng)版基于阿里巴巴最新算法功能,貼合不同垂類內(nèi)容搜索場景的痛點(diǎn)和需求,提供了內(nèi)容行業(yè)專屬的智能語義理解能力、向量召回、排序算法,為內(nèi)容行業(yè)的搜索性能和效果準(zhǔn)確性提供雙重保障,并有效的解決了超大詞庫數(shù)據(jù)導(dǎo)致的搜索延遲高、資源消耗大、搜索無結(jié)果率高等行業(yè)重難點(diǎn)問題。針對內(nèi)容行業(yè),開放搜索還提供了向量模型,以實(shí)現(xiàn)向量召回及多路搜索,提高查詢準(zhǔn)確率,并提供多模態(tài)搜索解決方案。

      通用版VS內(nèi)容行業(yè)增強(qiáng)版

      1.功能差異

      2.查詢分析效果對比

      行業(yè)增強(qiáng)版較通用版相比在查詢分析功能上做出了更深入的優(yōu)化,不僅在通用版的基礎(chǔ)上更新了常見bad case,而且針對內(nèi)容行業(yè)集各家之所長,豐富已有詞庫。

      分詞:(以空格分詞)

      拼寫糾錯:

      內(nèi)容行業(yè)向量召回

      針對內(nèi)容行業(yè)的垂類行業(yè)數(shù)據(jù)分布提供高質(zhì)量的向量召回模型,保證長尾query,包含錯別字query,依賴同義詞改寫召回query的召回效果

      向量召回

      CTR預(yù)估模型-個性化搜索效果

      1.基于Seq行為建模,實(shí)現(xiàn)個性化搜索

      例如:用戶連續(xù)搜索:“面試”,“Java”兩個詞和用戶只搜索“Java”的結(jié)果是有差異的,實(shí)現(xiàn)個性化召回,針對性滿足不同用戶的搜索需求,提示用戶搜索體驗。

      2.深度排序模型DeepRanking

      模型參數(shù)規(guī)??梢赃_(dá)到1000億級別,保障更優(yōu)搜索效果,且模型訓(xùn)練、使用成本低,遠(yuǎn)低于自研人力+機(jī)器+研發(fā)支持所用成本。

      3.深度召回模型集合阿里云達(dá)摩院的NLP能力,提升搜索效果,降低無結(jié)果率

      針對用戶和數(shù)據(jù)特點(diǎn),結(jié)合阿里巴巴長期技術(shù)積累,深度定制模型結(jié)構(gòu),做到Make for you的特有深度模型結(jié)構(gòu)。

      增強(qiáng)版接入流程

      輕松接入,快速上手,一鍵式接入行業(yè)模板,可根據(jù)自身業(yè)務(wù)自定義選擇功能,并滿足非技術(shù)人員業(yè)務(wù)干預(yù)調(diào)優(yōu)與數(shù)字化運(yùn)營需求; 點(diǎn)擊體驗交互式demo

      表結(jié)構(gòu)設(shè)計

      詳情可參考應(yīng)用結(jié)構(gòu)--->創(chuàng)建多表join。

      數(shù)據(jù)接入

      開放搜索支持用戶通過數(shù)據(jù)源將數(shù)據(jù)接入搜索,也支持無數(shù)據(jù)源,通過API/SDK/控制臺上傳文件的方式導(dǎo)入數(shù)據(jù)詳情如下:

      RDS數(shù)據(jù)源配置

      MaxCompute(原ODPS)數(shù)據(jù)源配置

      POLARDB數(shù)據(jù)源配置

      API/SDK數(shù)據(jù)導(dǎo)入

      內(nèi)容社區(qū)行業(yè)模板配置

      功能選擇,垂類選擇“IT”行業(yè)為例,模板功能可自行勾選(默認(rèn)全選)

      其中模板功能包括:查詢分析(IT詞權(quán)重、IT同義詞包、文本向量化等)、排序策略(多路搜索、文本相關(guān)性、向量相關(guān)性)、下拉提示。

      搜索測試

      1.如需使用“IT向量索引”搜索,需要先配置查詢分析-文本向量化功能,并添加對應(yīng)的IT向量索引

      2.在搜索測試中進(jìn)行測試:

      效果定制服務(wù)

      如果有深度召回、排序效果調(diào)優(yōu)、個性化搜索需求,開放搜索團(tuán)隊專家支持效果定制服務(wù),可填寫咨詢問卷:阿里云登錄 - 歡迎登錄阿里云,安全穩(wěn)定的云計算服務(wù)平臺

      案例實(shí)踐

      某技術(shù)社區(qū)作為中文IT內(nèi)容社區(qū),致力于為中國軟件開發(fā)者提供知識傳播、在線學(xué)習(xí)、職業(yè)發(fā)展等全生命周期服務(wù),旗下包括多款產(chǎn)品。

      自開始接觸阿里云開放搜索產(chǎn)品,在一年的時間里陸續(xù)接入PC端、移動端的多個平臺,覆蓋首頁搜索、博客、下載、問答等細(xì)分業(yè)務(wù)的頻道搜索。通過開放搜索,為旗下產(chǎn)品的用戶提供高質(zhì)量的搜索服務(wù),并通過搜索能力的優(yōu)化帶來更多的業(yè)務(wù)轉(zhuǎn)化,提升整體業(yè)務(wù)收入。

      對比基于開源自建的服務(wù)CTR提升超過80%

      后續(xù)算法專家通過深度定制模型不斷幫客戶調(diào)優(yōu),每曝光用戶帶來點(diǎn)擊次數(shù)提升16.7%,Item-CTR提升11.8%,效果還在持續(xù)提升中;

    來源:阿里云云棲號

    IT時代網(wǎng)(關(guān)注微信公眾號ITtime2000,定時推送,互動有福利驚喜)所有原創(chuàng)文章版權(quán)所有,未經(jīng)授權(quán),轉(zhuǎn)載必究。
    創(chuàng)客100創(chuàng)投基金成立于2015年,直通硅谷,專注于TMT領(lǐng)域早期項目投資。LP均來自政府、互聯(lián)網(wǎng)IT、傳媒知名企業(yè)和個人。創(chuàng)客100創(chuàng)投基金對IT、通信、互聯(lián)網(wǎng)、IP等有著自己獨(dú)特眼光和豐富的資源。決策快、投資快是創(chuàng)客100基金最顯著的特點(diǎn)。

    相關(guān)文章
    內(nèi)容社區(qū)行業(yè)搜索最佳實(shí)踐:如何準(zhǔn)確理解用戶搜索意圖?

    精彩評論