2009互聯網大會會于11月2日至3日在北京召開,騰訊科技作為官方指定戰(zhàn)略合作門戶網站、官方指定*合作新聞中心進行全方位的視頻、圖文采訪與直播。特設立4個現場專訪間,力邀業(yè)界專家與企業(yè)代表剖析產業(yè)現狀,暢談產業(yè)前景,并就金融危機一年來的發(fā)展進行深度解讀。
以下是中搜總裁陳沛演講實錄:
陳沛:各位領導、各位來賓,大家下午好!很高興能夠在一年一度的*互聯網大會上和大家分享對互聯網的看法,另外搜索引擎相當長的時間應該說是互聯網的熱點。今天我的主題是關于第三代搜索引擎的。有很多人說中搜為什么最近不說很多話了?今天我也想跟大家匯報一下中搜在搜索方面的探索。
2003年的時候,我提出了第三代搜索的思想,當時我們雖然全力以赴在做第二代搜索,我們當時認為最早的搜索引擎是雅虎,上面有很多分類把網站和類別進行劃分,現在我們談到搜索會想起Google,在輸入框里面打進一個關鍵詞。
未來是什么樣?中搜一直在嘗試新一代的搜索,最近網上有很多關于第三代搜索的討論,因為很多公司都在嘗試一些搜索進行,雖然關于第三代搜索大家沒有什么結論,但是很多人都引用了前兩代的結果,以雅虎目錄為代表導航的搜索和以Google為代表的關鍵詞收入。
搜索一定會發(fā)生某種變革,一個是持續(xù)增長的互聯網數據。5年前的今天互聯網數據大大增長,每天以幾何數據增長。我們單純用技術的方式找到*的結果變得越來越困難,現在的搜索引擎主要是基于一些算法,在700萬個結果中迅速做一個排序,讓我們有機會在前幾頁中看到你需要的東西。如果互聯網的內容越來越多,我們如何提煉前兩頁,會變得越來越困難。
第二,用戶實際上也在進化,5年前我們在互聯網上搜索幾百條信息,大家就很滿意了,但是現在每一結果甚至有上百萬,但是很遺憾人的搜索能力有限,只能看前幾頁。用戶的能力不斷地細分,搜索的本質是用最短的時間得到自己想要的東西,而不一定是越多越好,搜索本身就是這樣的。根據這兩點,搜索一定會發(fā)生某種變革。
其實我們最近也能看到關于第二代搜索引擎的代表,他們也在嘗試做搜索的變革。*個是Google,Google正在做整合搜索,他們使很多的垂直搜索整合在一個界面中。百度最近在推“框計算”,當然我們不是說所有的搜索都在一個框里面,但是“框計算”允許第三方的搜索引擎成為它的結果的一部分。某種程度上,這個和中搜的想法一致,中搜做了兩件事,一個是開放,一個是聚合。
我們認為第三代搜索的本質一個是多方支持的融合,不僅僅是搜索引擎公司,因為搜索引擎公司掌握的能力是有限的。我們更多的是大數量處理能力。但是很多專業(yè)領域我們不具備這種知識。某種意義上我們希望搜索質量更高,可能需要更多、更專業(yè)的知識,這種搜索的結果需要有更專業(yè)的方式做,需要有一種合作的方式融合一種新的知識,當然它會變得更加專業(yè)化,包括領域化和更加個性化,這是我們認為新搜索可能體現的一些本質。
這里有一個關于張靚穎的頁面,左上角是她的簡介,來自于維基百科。其中有一個關于張靚穎的個人的新聞和張靚穎在新浪寫的圖片、博客和音樂,所有和她有關的東西完全被聚合在這一個頁面上,這些內容每天自動更新。它看起來是一個門戶,但是本質上是一個互聯網,另外是一個被人加工的用新的方式呈現出來的。
拼裝一個頁面,不需要學習什么知識,它可以按照自己的理解把互聯網的數據重新整合和展示,這也是我們認為的新一代搜索的新的條件,因為大部分沒有能力利用計算機的技術再架構這些數據,他們希望用簡單的方式再去構造自己的知識。
所以我們認為基于開放的平臺,應該使普通用戶參與這些內容成為一個可能。所以中搜這幾年主要做的是開放的平臺。當然所有的內容都必須由一個用戶加工整理,它的覆蓋面也會非常有限。
這里是一個貴州茅臺的主頁,和貴州茅臺有關的股票信息、行業(yè)信息包括它的論壇都在一個頁面上。當然這個東西做好的話,它也有快速復制的能力,所有的股票都會被復制出來,所以在財經的搜索里面,你可以看到針對所有個股的更完整、更及時的頁面,當然它可能會成為新的搜索潛力。
當然搜索引擎的質量標準也不一樣了,在新的搜索上,我們會提出更新的指標要求,比如說內容依然要全面,只是有更好的展示方式,它可能要更加準確,比如說我們要查自己的名字,我們會發(fā)現整個搜索引擎會給你一堆與關鍵詞相匹配的內容,但是不是你想找的人。
現在第二代的搜索引擎某種意義上只是關鍵詞搜索的匹配,離我們真正要找的內容有距離,對人顯而易見的事,對機器來說是很困難的。所以我們看到很多不是我們需要的內容。如果有人的知識參與,這個結果可能會變得更加準確。
現在的搜索引擎只是一個關鍵詞的匹配,它并不是一個智慧的關聯,對未來說我們有更高的要求,我們希望描述的內容就是我們想要的內容,而不僅僅是關鍵詞的匹配。因為是一個門戶的展示方式,可以有一個好的方式,可以有一個美觀的展示方式。所以這里面可能有新的標準。
這是《五星大飯店》是海巖的著作,所有的內容重新加工整理,依然覆蓋互聯網的各種內容,它的內容被加工和組織,以一種嶄新的方式嶄新出來,我想可能更多人愿意閱讀這樣的頁面。
開放的本質實際上就是專業(yè)技術的融合,這也是第三代搜索引擎的本質,也是中搜這幾年做的主要的工作。大家可以看到,在底層有各種各樣的數據庫,再往上是數據流,再往上是搜索的引擎,包括搜索的引擎,內容研發(fā)的引擎,包括web服務的引擎,當然這些東西對于大部分人來說可能都是陌生的、困難的。
中搜第三代開放的搜索引擎,在于這個平臺上可以簡單地與合作伙伴構造新的垂直搜索,比如我們和方正合作做圖書的垂直搜索,還有番薯網是我們和方正合作的一個產品。它就是中搜的第三代搜索結合了方正對數字圖書的理解,構建出的一個新的搜索和服務。
當然我們還可以和賽迪合作,也可以和專業(yè)領域擅長并且有愿望的人合作一個新的垂直搜索,這些垂直搜索共同構造了新的搜索,他們可以向現代的互聯網提供某種專業(yè)的內容?,F在的搜索引擎某種意義上可能是整個搜索引擎發(fā)展的必由之路。開放成為一個大的趨勢。
第三方搜索本質的含義是什么?我現在搜索的一部分的結果可能不如別人做得更好,或者是別人的搜索可能成為我搜索的一部分,某種基礎上也是對專業(yè)知識的一種認同。這是我介紹的關于第三代搜索引擎整體的思想,它體現了所謂的“開放”的思想。另外為了開放,必須有非常好的個性化的平臺,可以非常簡單地和不同的合作伙伴構造不同的垂直搜索,這是最近這年中搜做的主要的工作。
對于大部分的合作伙伴來說,底下那些復雜的,我們不太了解的和陌生的技術都不見了,只剩下一個開放的平臺。按照自己的意愿構造自己的服務和搜索。
這是我們跟方正合作的番薯網,這是從番薯網里面看到的各個頁面,都是中搜底層的技術構造的,無論從內容和形式來說都完全是一個垂直的領域。這是女性的頻道。這是關于一個作家的所有的內容。
當然也可以是與出版社相關的內容。這里面我們很難區(qū)分它是一個圖書的應用還是搜索引擎,因為這里面很多的內容來自于互聯網,當它應該出現的時候就自動出現了,所以我們并不贊成再一個輸入框里面實時獲取一個信息的全部,我甚至說過比較極端的話,未來若干年人的所有信息都再一個輸入框里面獲得,那是人類的悲哀,因為搜索應該和所有的應用結合在一起。有時候你很難區(qū)分電子商務和搜索引擎,他們無處不在。