頻道欄目
首頁 > 資訊 > 微信公眾平臺開發 > 正文

為什么你搜不到想要的小程序?【附帶最全小程序名單】

17-01-10        來源:[db:作者]  
收藏   我要投稿

為什么你搜不到想要的小程序?【附帶最全小程序名單】。想必各位的朋友圈已經被微信小程序刷屏了。

然而細心的觀眾可能發現了一些問題

小程序名字怎么都奇奇怪怪的?

自己怎么也搜不到想要的小程序

比如下面,簡直慘不忍睹,如果不是提前知道完整全名,幾乎搜不出來。

于是,犀利的網友開始吐槽:

對于一個APP重度使用者來說,小程序意味著一早上起來就解英格瑪密碼

然而細心的讀者朋友可能又發現了,搜索「京東」能出來「京東購物」、搜索「滴滴」能出來「滴滴出行DiDi」、搜索「攜程」能出來「攜程酒店機票火車票」,這又是為何?

這里就涉及到了一個「中文分詞」技術和「模糊匹配」技術了。(對技術科普沒興趣的可直接跳過,后面有小程序名單和商店 )

中文分詞技術

我們知道,在英文的行文中,單詞之間有空格作為自然分界符,比如下面這句:

I am very handsome !

可以輕松地分成 i 、am 、very、handsome 四個單詞。

而中文只是字、句和段能通過明顯的分界符來簡單劃界,唯獨詞沒有一個形式上的分界符。

比如這一句廣告語:

南京市長江大橋歡迎您!

你可以理解為:南京,市長,江大橋,歡迎,您 ;

也可以理解為:南京市,長江大橋,歡迎,你;

這樣不同的分詞方法得到的結果就截然不同。

現代漢語的基本表達單元雖然為“詞”,且以雙字或者多字詞居多,但由于人們認識水平的不同,對詞和短語的邊界很難去區,比如:

“對隨地吐痰者給予處罰”

“隨地吐痰者”本身是一個詞還是一個短語,不同的人會有不同的標準,同樣的“海上”“酒廠”等等,即使是同一個人也可能做出不同判斷,如果漢語真的要分詞書寫,必然會出現混亂,難度很大

中文分詞 (Chinese Word Segmentation) 指的是將一個漢字序列切分成一個一個單獨的詞。分詞就是將連續的字序列按照一定的規范重新組合成詞序列的過程。和英文相比,中文分詞難得多得多!
[page]

然而這并難不倒程序員們

目前的分詞算法可分為三大類:基于字符串匹配的分詞方法、基于理解的分詞方法和基于統計的分詞方法

字符匹配

又叫做機械分詞方法,它是按照一定的策略將待分析的漢字串與一個“充分大的”機器詞典中的詞條進行配,若在詞典中找到某個字符串,則匹配成功(識別出一個詞)。

這是種常用的分詞法,字符串匹配的分詞方法,又分為3種分詞方法。

同樣以“不知道你在說什么”為例,不同的匹配法有不同的結果:

正向最大匹配法,也就是把一個詞從左至右來分詞,就是:“不知道,你,在,說什么”。

反向最大匹配法:也反向最大匹配法就是從右至左,就會分成:“不,知道,你在,說,什么”

最短路徑分詞法:也就是說一段話里面要求切出的詞數是最少的,就會分成:“不知道,你在,說什么”,這就是最短路徑分詞法,分出來就只有3個詞了。

雙向最大匹配法:如果關鍵詞前后組合內容被認為粘性相差不大,而搜索結果中也同時包含這兩組詞的話,進行正反向同時進行分詞匹配。

    簡單來說,就是正著拆、反著拆、簡單拆,和來來回回拆,總之各種體位來一遍。

    理解法

    人工智能興起,于是這種新的方式開始流行,理解分詞方法是通過讓計算機模擬人對句子的理解,達到識別詞的效果。

    其基本思想就是在分詞的同時進行句法、語義分析,利用句法信息和語義信息來處理歧義現象。

    它通常包括三個部分:分詞子系統、句法語義子系統、總控部分。在總控部分的協調下,分詞子系統可以獲得有關詞、句子等的句法和語義信息來對分詞歧義進行判斷,即它模擬了人對句子的理解過程。這種分詞方法需要使用大量的語言知識和信息。

    由于漢語語言知識的籠統、復雜性,難以將各種語言信息組織成機器可直接讀取的形式,因此目前基于理解的分詞系統還處在試驗階段。

    目前 Siri 、微軟小冰等等都充分運用了人工智能來嘗試“理解”人的語句,另外三角獸為錘子手機提供的 “Bigbang”分詞功能、科大訊飛的語音輸入法等我們常見的功能在分詞原理上都有運用該方法。

    統計分詞法

    根據詞組的統計,就會發現兩個相鄰的字出現的頻率最多,那么這個詞就很重要。就可以作為用戶提供字符串中的分隔符,這樣來分詞。

    比如,“我的,你的,許多的,這里,這一,那里”等等,這些詞出現的比較多,就從這些詞里面分開來。

    無論用何種方法,分出來的“詞”,一般進入預先錄入好的“詞典”(詞庫、數據庫)中進行匹配,比如“南京市長江大橋歡迎您”,

    可以切分輸出:南京市/長江/大橋/歡迎/您

    也可切分輸出 :南京 /市長/江大橋/歡迎/您

    通常情況下,搜索“長江”就可以搜出來這句話,但如果詞庫中有”張大橋”這個人名,則也可以通過“張大橋”也可以檢索出來。

    科普完畢,回到話題本身

    1. 為什么小程序的名字都“怪怪”的?

    為什么「滴滴」非要叫「滴滴出行DiDi」?

    為什么好奇心日報非要叫「Qdaily」?

    為什么「餓了么」非要叫「餓了么外賣服務」?

      難道是故意想讓用戶搜不到她們?瞎扯!怎么可能會有這種奇怪的想法……

      真正的原因,據「京東購物」小程序的一個開發者分析,是因為小程序和公眾號在同一套體系之下,而公眾號原本就不允許名字重復。這也就可以完美解釋為什么小程序的名字看起來奇奇怪怪的了,因為好名字已經都讓公眾號起了。

      2. 為什么搜不出來我要的小程序?

      既然小程序和公眾號在同一體系下,而公眾號搜索是支持模糊匹配的,想必小程序肯定是支持模糊匹配的,而且滴滴、京東、美的等許多公司小程序都是可以只通過品牌名檢索出來的,因此必定是支持模糊搜索的。

      一位小程序開發者告訴雷鋒網,在提交小程序的時候,開發者是可以自己填寫關鍵詞的,但是最后這些關鍵詞通不通過,可能需要微信方面來審核。

      至此可以得出結論,小程序是支持模糊匹配的,至于為什么有的可以通過品牌名搜得出來,有的卻搜不出來,唯一的解釋只能是「餓了么」、「好奇心日報」這些詞并沒有被添加到檢索的詞庫中,也許是開發者忘了添加,也許是沒提交了沒有通過審核,原因不得而知。

      但小程序上線第一天,即使是出現這樣的情況也是無可厚非,正如和菜頭所言:

      既然搜不到,那我如何找到想要的應用?

      既然小程序本身目前并沒有提供完整的模糊搜索,那么如果在這期間你想要找到想要的應用,唯一的辦法就是提前知道小程序的全名了,宅客頻道整理了目前較新的“微信小程序大全”以及流傳較廣的“小程序商店”,可以幫助大家找到自己心儀的小程序。

      相關TAG標簽
      上一篇:臺積電:絕大多數7nm客戶都會轉向6nm_IT新聞_博客園
      下一篇:最后一頁
      相關文章
      圖文推薦

      關于我們 | 聯系我們 | 廣告服務 | 投資合作 | 版權申明 | 在線幫助 | 網站地圖 | 作品發布 | Vip技術培訓 | 舉報中心

      版權所有: 紅黑聯盟--致力于做實用的IT技術學習網站

      美女MM131爽爽爽毛片