所謂大語言模型,英文簡稱LLM(Large Language Model),指的就是一種使用大量語言文本,通過智能數據訓練,得出人們所需要的文本的計算機模型。
比較經典的LLM,有美國的OpenAI、Gemini、Claude、中國的DeepSeek、豆包、千問等等。
在LLM大規(guī)模流行開以后,公眾被其近似于人類語言的輸出模式所震撼,甚至試圖把一切決策都交給LLM,認為大語言模型這種人工智能(AI,Artificial Intellgence)會顛覆整個世界。
但是很快,大家又發(fā)現,LLM其實沒法代替人類的思考。在諸如“我家到洗車店50米,所以我應該開車去還是走路去”這樣的問題中,許多LLM都翻了車。
原因很簡單,LLM其實本質上并不會思考這個世界,而是通過整理人類現有的大量語言文本,推理出近似的答案。這就是AI專家李飛飛所說的“AI沒有感知現實世界的能力”。順便多說一句,因為同樣的原因,當面對迎面飛來的一塊鐵皮和一輛汽車時,智能駕駛模型往往也很難分辨哪個威脅更大。
由于根本沒有人會在互聯(lián)網上問“我家到洗車店50米,所以我應該開車去還是走路去”這樣的蠢問題,同時會有不少文本描述“50米是一個近距離”以及“對于近距離走路比開車方便”,加上LLM其實根本不了解這個世界,所以許多LLM在這個看似愚蠢的問題上都翻了車,表示你應該走著去。
不管LLM帶來了多大的沖擊,以及這種沖擊究竟能持續(xù)多久,但是在互聯(lián)網商業(yè)世界中,一個不可否認的事實是:LLM的出現和普及,很可能會極大沖擊傳統(tǒng)搜索引擎的生意。
原因很簡單,相對于傳統(tǒng)的搜索引擎,LLM的效率實在是太高了。當我們只是簡單搜索特定內容,而不是要求LLM進行邏輯思考時,會發(fā)現大語言模型比搜索引擎好用很多。
比如,如果我們想知道“巴塞爾協(xié)議對資本充足率的要求”,而不是“巴塞爾協(xié)議對資本充足率的要求是否合理”,就會發(fā)現,大語言模型簡直是效率小能手。它能迅速給出你所需要的數字(我們往往會記不住其中一些細節(jié)),而且如果你需要的話,它還能給出這些數字的網絡出處,以便你自己手動核實。
但是,對于傳統(tǒng)搜索引擎來說,你需要做的是手動輸入需要搜索的內容,然后在給出的網頁里一條條去看。一般來說,你需要點開至少四、五個網站,看上七、八屏幕的文字,才能找到自己需要的內容。這個效率,比LLM低了可不止一點半點。
需要指出的是,由于LLM會出現的一些錯誤(比如眾所周知的大語言模型被原始數據污染),所以LLM得出的結論,其準確性并不如自己在搜索引擎上一個個瀏覽網頁以后得到的結果。
也就是說,LLM更適合模糊知道答案的詢問者,而不是一無所知的詢問者。比如我在詢問“明朝皇帝的平均壽命是多少歲”時,我模糊知道這個數字應該在35到50之間,這時候如果LLM給出一個60或者70的答案,我會知道它又犯錯了。
而如果對明朝歷史完全沒有了解,那么LLM一旦給出離譜的答案,就會給帶到溝里去(比如認為因為只有50米的距離所以就應該走著去洗車,而不是開車去)。
也就是說,LLM在降低了一定的精確度的同時,極高地提高了搜索的效率。由于精確度略有降低,因此對有一定知識儲備的詢問者來說,使用LLM會比什么都不知道的小白更加方便,因為他可以判斷答案是否大致正確。
我的好友張一云將這種現象比喻為搜索界的馬太效應:有知識儲備的研究者,會因為大語言模型迅速變得更強。他們和小白之間的差距,會因為LLM而變得更大。
在LLM極大地提高了搜索工作的效率以后,傳統(tǒng)的搜索引擎變得相形見絀。而傳統(tǒng)搜索引擎業(yè)務所依賴的廣告生意,也會因為流量涌向LLM,而受到明顯壓制。
從這次大語言模型對傳統(tǒng)搜索引擎行業(yè)帶來的巨大沖擊,我們可以發(fā)現互聯(lián)網的變化之快,也可以從中理解為什么極其重視長期眼光的沃倫·巴菲特,即使身處互聯(lián)網最發(fā)達的美國,也極少,或者說沒有投資過互聯(lián)網行業(yè)的公司(他投資過的蘋果公司只能說和互聯(lián)網行業(yè)略有搭邊)。
要知道,曾幾何時,搜索引擎行業(yè)被認為是互聯(lián)網行業(yè)中最好的商業(yè)模式。當一個搜索引擎被越多人使用的時候,它的規(guī)模就越大;規(guī)模越大,就越會有網站愿意接入搜索引擎,越多的公司愿意給它廣告費;隨著公司脈絡的延伸,就會有越多的用戶使用搜索引擎。
于是,在幾乎各個市場上,我們都可以看到,在LLM流行以前,頭部搜索引擎公司幾乎壟斷了搜索市場。這種優(yōu)勢一度被認為是無可撼動的(包括我在早年的分析中也錯誤地這樣認為,人總是難免會犯錯),是“城頭變幻大王旗”的互聯(lián)網行業(yè)中,為數不多的中流砥柱。
但是,隨著LLM的流行,搜索引擎公司的護城河正在被快速侵入。這種變化之迅速、沖擊力之廣,在傳統(tǒng)行業(yè)中很難出現。比如,我們難以想象,一種新的飲品會立刻顛覆中國人對茶葉的喜好、或者歐洲人對咖啡的執(zhí)著。而這次大語言模型對搜索引擎帶來的巨大挑戰(zhàn),也就給我們上了一堂生動的商業(yè)分析課:永遠不要低估互聯(lián)網行業(yè)中的變化與挑戰(zhàn)。
(作者陳嘉禾,系九圜青泉科技首席投資官)
(本文內容僅代表作者個人觀點)