
使用傳統網頁搜尋器,瀏覽100個搜尋結果,從中獲取自己需要的資訊,以血肉之軀到底需要花費多長時間?
AI的話,短短幾十秒時間就能完成,甚至歸納出結構清晰、有條有理的內容;而人類,甚至根本不可能一個接一個地去瀏覽100個結果一一當然,大多數時候其實也不需要瀏覽這麼多結果就能得到答案。而對於AI來說,閱讀100個結果,只是消耗token而已,儘管100個搜尋結果所耗的token也並不少。
生成式人工智能,無論吟詩作對、寫歌畫圖,創作能力驚艷了世人,但仍停留在模仿人類的階段。沒有宮崎駿,就不會有吉卜力風格。但在網頁資料搜集這一項,AI確實已經打敗人類。
進入2025年以來,DeepSeek、OpenAI、Google、Perplexity、xAI先後發佈了各自的深度搜尋(deepsearch)功能。不久前,華爾街日報有位專欄作家撰文,說他已經不再使用傳統的網頁搜尋,而是以AI搜尋網頁作為代替,因為它能找到更相關的結果並作出歸納,提高了工作效率。相反,傳統的網頁搜尋器,因為網頁過度的SEO,使得搜尋結果變得愈來愈垃圾,尤其是中文網頁還充斥著大量干擾資訊的內容農場。
deepsearch的工作方式,是先從提問中提取不同的關鍵詞並以不同的組合搜尋網頁,找到相關網頁後擷取內容作出分析,如此反覆多次,最後生成完整的研究報告一一在這個過程中,AI會自問自答,以求尋得最準確相關的答案。在deepsearch出現之前,以擴充功能出現的RAG(檢索增強生成)賦予了AI類似的能力。借助RAG,不僅可以搜尋網頁作為AI的資料庫,最普遍的用法還是餵給它由自己搭建的資料庫,填補AI本身資料的不足,降低AI幻覺。
直到現在,deepsearch作為各大AI的殺手鐗,依然只能在原生介面中使用,無法通過api調用。當你在一些類似cherry studio、open webui的軟件中,通過調用api來使用AI模型時,網頁搜尋功能依然是通過RAG的方式來實現的。它雖然沒有原生的deepsearch強大,而且需要搭配負責語義結構的嵌入模型,及調用一些免費或收費的search api,有一定的使用門檻,但通常可以自己控制搜尋結果的數目,以免浪費token。
說真的,AI搜尋網頁,一旦用過,就很難回頭了。



