所謂大語言模型,英文簡(jiǎn)稱LLM(Large Language Model),指的就是一種使用大量語言文本,通過智能數(shù)據(jù)訓(xùn)練,得出人們所需要的文本的計(jì)算機(jī)模型。
比較經(jīng)典的LLM,有美國的OpenAI、Gemini、Claude、中國的DeepSeek、豆包、千問等等。
在LLM大規(guī)模流行開以后,公眾被其近似于人類語言的輸出模式所震撼,甚至試圖把一切決策都交給LLM,認(rèn)為大語言模型這種人工智能(AI,Artificial Intellgence)會(huì)顛覆整個(gè)世界。
但是很快,大家又發(fā)現(xiàn),LLM其實(shí)沒法代替人類的思考。在諸如“我家到洗車店50米,所以我應(yīng)該開車去還是走路去”這樣的問題中,許多LLM都翻了車。
原因很簡(jiǎn)單,LLM其實(shí)本質(zhì)上并不會(huì)思考這個(gè)世界,而是通過整理人類現(xiàn)有的大量語言文本,推理出近似的答案。這就是AI專家李飛飛所說的“AI沒有感知現(xiàn)實(shí)世界的能力”。順便多說一句,因?yàn)橥瑯拥脑?,?dāng)面對(duì)迎面飛來的一塊鐵皮和一輛汽車時(shí),智能駕駛模型往往也很難分辨哪個(gè)威脅更大。
由于根本沒有人會(huì)在互聯(lián)網(wǎng)上問“我家到洗車店50米,所以我應(yīng)該開車去還是走路去”這樣的蠢問題,同時(shí)會(huì)有不少文本描述“50米是一個(gè)近距離”以及“對(duì)于近距離走路比開車方便”,加上LLM其實(shí)根本不了解這個(gè)世界,所以許多LLM在這個(gè)看似愚蠢的問題上都翻了車,表示你應(yīng)該走著去。
不管LLM帶來了多大的沖擊,以及這種沖擊究竟能持續(xù)多久,但是在互聯(lián)網(wǎng)商業(yè)世界中,一個(gè)不可否認(rèn)的事實(shí)是:LLM的出現(xiàn)和普及,很可能會(huì)極大沖擊傳統(tǒng)搜索引擎的生意。
原因很簡(jiǎn)單,相對(duì)于傳統(tǒng)的搜索引擎,LLM的效率實(shí)在是太高了。當(dāng)我們只是簡(jiǎn)單搜索特定內(nèi)容,而不是要求LLM進(jìn)行邏輯思考時(shí),會(huì)發(fā)現(xiàn)大語言模型比搜索引擎好用很多。
比如,如果我們想知道“巴塞爾協(xié)議對(duì)資本充足率的要求”,而不是“巴塞爾協(xié)議對(duì)資本充足率的要求是否合理”,就會(huì)發(fā)現(xiàn),大語言模型簡(jiǎn)直是效率小能手。它能迅速給出你所需要的數(shù)字(我們往往會(huì)記不住其中一些細(xì)節(jié)),而且如果你需要的話,它還能給出這些數(shù)字的網(wǎng)絡(luò)出處,以便你自己手動(dòng)核實(shí)。
但是,對(duì)于傳統(tǒng)搜索引擎來說,你需要做的是手動(dòng)輸入需要搜索的內(nèi)容,然后在給出的網(wǎng)頁里一條條去看。一般來說,你需要點(diǎn)開至少四、五個(gè)網(wǎng)站,看上七、八屏幕的文字,才能找到自己需要的內(nèi)容。這個(gè)效率,比LLM低了可不止一點(diǎn)半點(diǎn)。
需要指出的是,由于LLM會(huì)出現(xiàn)的一些錯(cuò)誤(比如眾所周知的大語言模型被原始數(shù)據(jù)污染),所以LLM得出的結(jié)論,其準(zhǔn)確性并不如自己在搜索引擎上一個(gè)個(gè)瀏覽網(wǎng)頁以后得到的結(jié)果。
也就是說,LLM更適合模糊知道答案的詢問者,而不是一無所知的詢問者。比如我在詢問“明朝皇帝的平均壽命是多少歲”時(shí),我模糊知道這個(gè)數(shù)字應(yīng)該在35到50之間,這時(shí)候如果LLM給出一個(gè)60或者70的答案,我會(huì)知道它又犯錯(cuò)了。
而如果對(duì)明朝歷史完全沒有了解,那么LLM一旦給出離譜的答案,就會(huì)給帶到溝里去(比如認(rèn)為因?yàn)橹挥?0米的距離所以就應(yīng)該走著去洗車,而不是開車去)。
也就是說,LLM在降低了一定的精確度的同時(shí),極高地提高了搜索的效率。由于精確度略有降低,因此對(duì)有一定知識(shí)儲(chǔ)備的詢問者來說,使用LLM會(huì)比什么都不知道的小白更加方便,因?yàn)樗梢耘袛啻鸢甘欠翊笾抡_。
我的好友張一云將這種現(xiàn)象比喻為搜索界的馬太效應(yīng):有知識(shí)儲(chǔ)備的研究者,會(huì)因?yàn)榇笳Z言模型迅速變得更強(qiáng)。他們和小白之間的差距,會(huì)因?yàn)長(zhǎng)LM而變得更大。
在LLM極大地提高了搜索工作的效率以后,傳統(tǒng)的搜索引擎變得相形見絀。而傳統(tǒng)搜索引擎業(yè)務(wù)所依賴的廣告生意,也會(huì)因?yàn)榱髁坑肯騆LM,而受到明顯壓制。
從這次大語言模型對(duì)傳統(tǒng)搜索引擎行業(yè)帶來的巨大沖擊,我們可以發(fā)現(xiàn)互聯(lián)網(wǎng)的變化之快,也可以從中理解為什么極其重視長(zhǎng)期眼光的沃倫·巴菲特,即使身處互聯(lián)網(wǎng)最發(fā)達(dá)的美國,也極少,或者說沒有投資過互聯(lián)網(wǎng)行業(yè)的公司(他投資過的蘋果公司只能說和互聯(lián)網(wǎng)行業(yè)略有搭邊)。
要知道,曾幾何時(shí),搜索引擎行業(yè)被認(rèn)為是互聯(lián)網(wǎng)行業(yè)中最好的商業(yè)模式。當(dāng)一個(gè)搜索引擎被越多人使用的時(shí)候,它的規(guī)模就越大;規(guī)模越大,就越會(huì)有網(wǎng)站愿意接入搜索引擎,越多的公司愿意給它廣告費(fèi);隨著公司脈絡(luò)的延伸,就會(huì)有越多的用戶使用搜索引擎。
于是,在幾乎各個(gè)市場(chǎng)上,我們都可以看到,在LLM流行以前,頭部搜索引擎公司幾乎壟斷了搜索市場(chǎng)。這種優(yōu)勢(shì)一度被認(rèn)為是無可撼動(dòng)的(包括我在早年的分析中也錯(cuò)誤地這樣認(rèn)為,人總是難免會(huì)犯錯(cuò)),是“城頭變幻大王旗”的互聯(lián)網(wǎng)行業(yè)中,為數(shù)不多的中流砥柱。
但是,隨著LLM的流行,搜索引擎公司的護(hù)城河正在被快速侵入。這種變化之迅速、沖擊力之廣,在傳統(tǒng)行業(yè)中很難出現(xiàn)。比如,我們難以想象,一種新的飲品會(huì)立刻顛覆中國人對(duì)茶葉的喜好、或者歐洲人對(duì)咖啡的執(zhí)著。而這次大語言模型對(duì)搜索引擎帶來的巨大挑戰(zhàn),也就給我們上了一堂生動(dòng)的商業(yè)分析課:永遠(yuǎn)不要低估互聯(lián)網(wǎng)行業(yè)中的變化與挑戰(zhàn)。
(作者陳嘉禾,系九圜青泉科技首席投資官)
(本文內(nèi)容僅代表作者個(gè)人觀點(diǎn))