“雅虎搜索功能發(fā)生了巨大變化。”
韓國雅虎(代表李承一)的搜索功能發(fā)生了巨大變化。與1個(gè)月前相比,韓語網(wǎng)頁的搜索功能明顯好轉(zhuǎn)。
雅虎服務(wù)發(fā)生了什么變化?
最近幾年來,雅虎總部一直致力于開發(fā)搜索技術(shù),并于2月推出了YST(Yahoo! Search Technology)自己的搜索引擎。隨著國內(nèi)網(wǎng)站使用該技術(shù),搜索功能大幅上升。
與雅虎總部在網(wǎng)頁搜索中使用“Google”不同,韓國雅虎一直使用國內(nèi)企業(yè)的搜索引擎。但該韓語搜索引擎動(dòng)輒搜索出“沙悟凈”一樣的結(jié)果,令用戶大傷腦筋。
例如,如果搜索“說唱”神童——柳太平洋的名字,就會(huì)搜索出1萬多篇文章,其中,排在第一的是法務(wù)法人太平洋的某律師。
如此,之所以首先搜索出與要搜索的單詞全然沒有關(guān)系的資料,是因?yàn)轫n語復(fù)合名詞處理技術(shù)存在問題。把“柳太平洋”的單詞誤認(rèn)為復(fù)合名詞,分成“柳”和“太平洋”搜索的結(jié)果。
韓國雅虎主張,YST的功能不但超過國內(nèi)的搜索技術(shù),還比“Google”優(yōu)秀。果真如此嗎?
搜索網(wǎng)站企業(yè)對(duì)比較功能的資料敏感。雖然沒有正式的排名,但只要從用戶角度出發(fā)進(jìn)行簡單的測試,就能區(qū)分好壞。即,在不同的網(wǎng)站輸入同一個(gè)單詞,比較搜索結(jié)果的件數(shù)和正確性以及相關(guān)度。
例如,如果搜索70年代流行歌曲《火樹》歌詞中的“你是否知道”的部分,只有首先介紹包含該句子的網(wǎng)頁,才能視為相關(guān)度較高。
而且還要測試把多個(gè)單詞當(dāng)作一個(gè)單詞搜索的句文搜索功能。作為句文搜索符號(hào),使用“大引號(hào)”。如果比較結(jié)果,就能看出韓國雅虎的改進(jìn)。
韓國雅虎搜索事業(yè)部長崔亨禹(音譯)表示:“自從引進(jìn)新搜索引擎后,搜索的數(shù)據(jù)庫(DB)量、順序技術(shù)、韓語處理技術(shù)、刪除垃圾網(wǎng)頁等功能大幅上升。”