離開密西沙加校區的時候,林志凌依然覺得心裡堵得有些感慨。
“爲什麼這些人在多倫多那麼好的學術氛圍裡,卻無法發揮出他們最大的價值呢?”
顧誠對此倒是毫不感慨,顯然早已沒心沒肺:“科學是很嚴謹的東西。如果你得了癌症,科學已經宣判了你的死刑,現在有一種吃了之後有10%概率懵對救命、但是生效機理不明的藥,你吃還是不吃?造這種藥賺錢的生意你做還是不做?
要想拿圖靈獎,這種生意就不能沾,這種研發就不能做。如果只是要錢,要實用,就無所謂。我這輩子從來沒想過擁抱科學,我最多隻是利用科學。但是如果某個具體問題上科學還沒巫術好使,我就用巫術好了。”
史蒂芬.庫克是個偉人,但是跟顧誠混的圈子不相交。
所以顧誠只能尊重對方的人品,但是道不同不相爲謀,然後儘量從他手下挖走那些三觀還沒定型、“節操”沒那麼滿滿的學者。
只要肯用名換錢,顧誠就有希望挖到。
他在多倫多滯留了兩天,好讓傑夫.辛頓有更多時間做手下人的思想工作。
一切都很順利,事情完全向着顧誠預想的方向進展着。面對鉅額的研究經費和薪水,乃至未來可能的基礎分紅,和其他媒體渠道的出名機會,最終戰勝了對學術上拿獎拿影響因子的欲-望。
除了傑夫辛頓這個研究“深度學習算法”的流派之外,史蒂芬.庫克麾下其他幾個技術路線的教授也略有鬆動,至少被顧誠挖走了兩個副教授和一堆博士研究生。
顧誠要的,就是這種效果。“跟着顧誠混,就算上不了核心期刊,照樣可以在別的嚴肅媒體渠道出名,用另一種方式被世人記住”。
第一步總是很艱難的,一旦這種念頭在腦子靈活的基礎科研能人心中紮根,顧誠的雪球就會越滾越大。
爲了完成這一切,顧誠也初步開出去了足足三千萬美元的支票,給他新註冊的空殼研究所和基金會注資。
這筆錢幾乎相當於“傳奇”一個季度的毛利,而且目前這個機構還只能設在米國——顧誠試探着問過傑夫.辛頓,“如果讓大家去華夏工作,並且加錢,有多少人願意走”,但結果是願意跟着他跑的人數至少會降低三分之二。
華夏如今給白人的印象,還是太不透明瞭,要是再過個五年十年,情況絕對會倒過來。
所以顧誠決定目前還是先在米國設立一個研究機構,以及yy網絡科技的子公司,過個兩三年等他盤面更大了,再從長計議把核心研發人員挪去華夏。
……
“深度學習算法”是未來人工智能的鼻祖,雖然不是其唯一實現路徑,卻爲人類開啓了一條“讓機器慢慢根據數據標識自我修正”的思路。
歷史上,這一技術最初的應用場景,其實是谷歌的圖片搜索引擎,和facebook的人臉識別技術。
在此之前,谷歌搜索只能搜文字信息,卻沒法搜圖片——
別看百度和谷歌都很早就開放了“百度圖片”之類的功能,但是最初的“百度圖片”並不是根據圖片的內容來決定搜索結果的,而是靠該圖片所屬的網頁鏈接的文字標題來搜的。
所以09年以前的“百度圖片”功能,其實並不是真正“讀懂”了圖的內容。只不過外行用戶只看療效,所以並沒有在這段還算平滑的技術過渡中察覺出什麼異常,還以爲後來的“百度圖片”識圖率“自然而然”就提高了。
只有基於深度學習爲代表的新一代人工智能真正應用之後,人類才學會了讓機器直接讀圖本身。
不過,這個應用場景雖然很宏大,卻跟顧誠的生意沒什麼關係。那是需要百度李老闆和阿狸馬風去操心的。李老闆將來或許可以做圖片搜索,馬風則可以做淘寶找同款。顧誠最多在合適的時機提點一下、換取自己的好處,卻不會親自下場。
深度學習型人工智能的第二個應用場景、也就是平行時空facebook的人臉識別,則是和顧誠眼下的生意非常契合的。
如今,扎克伯格還不是一個胸懷大志的傢伙,他只想着在哈佛女生當中揚名立萬,被無數人崇拜,混進最頂級的豪門俱樂部。所以十有八九會被顧誠勸誘至麾下。顧誠也不打算另搞facebook了,而是準備直接在海外運營“yy網”。
考慮到牆的因素,以及牆裡牆外的內容差異,到時候國內那部分就把英文的“yy網”倒過來,改叫“人人網”好了。
名字不重要,反正兩者最後都會是基於yy的朋友圈類空間產品。
國內騰雲那邊,馬騰如今正在做qq空間,而且騰雲的資金鍊比較緊張。等qq空間誤入歧途之後,顧誠再公佈自己的開發計劃教做人也來得及。
按照這個計劃,顧誠估計他回國後全面推進“yy網”和“人人網”的開發計劃、四季度十一黃金週前後上線網站,基本上就可以卡住幾個關鍵時間點。
除了歷史上facebook和谷歌已經幹過的事情之外,“深度學習”在顧誠手中自然還有他獨到的用處,那就是“用戶偏好分析”。
這事兒在平行時空的起步,比前兩項應用要晚得多,但顧誠深知那並不是這件事情技術上比前兩項難多少,而是因爲平行時空最初接觸深度學習型人工智能的巨頭們,統統都沒有涉獵娛樂/內容產業。
換言之,如果第一批接觸深度學習人工智能的換成亞馬遜公司,“用戶偏好分析和推送”肯定會變成第一優先級的存在。
顧誠的生意,和亞馬遜的重合度非常高,而且他是個知其然知其所以然的人,當然不會放過這一領域的佈局。
只是這塊工作量比較大,一方面要堆疊算法,另一方面也要讓把目前市面上已有的大量文娛作品進行標籤化分類和數據標識、將來再長年累月一步步細化細分數據表示。
按照最樂觀的估計,“用戶偏好分析和推送”至少要在實驗室裡躺兩三年,才能談試運營的問題。
幸好顧誠錢多,做得起這種長線投資。
……
在多倫多盤桓了三四天,挖夠了人之後,顧誠就準備驅車回波士頓,了結一下跟扎克伯格的賭約。
然而算算日子,跟扎克伯格的一週之約還沒到期,顧誠只好先去紐約休假兩三天。
以他這麼忙的身份,就算在紐約也不會很閒,至少也要電話遙控一下生意。
這不,他人還在多倫多的時候,就把公司的準cfo柳倩從紐約發配去了舊金山,讓她在硅谷投資一塊辦公樓地皮,在那兒註冊一間yy子公司、同時留心一家成立還不到兩年的初創公司,嘗試一下收購。
被顧誠盯上的這家公司,便是後來在05年拿出了世界三大物理運算引擎physx的ageia公司。這家公司歷史上應該於08年被英偉達(nvidia)收購,後來成就了英偉達的完全體gpu大業。
顧誠要搞深度學習型人工智能,要搞卷積神經網絡,挖一家這樣的公司就非常有必要。
就如前幾天顧誠和史蒂芬.庫克教授談到的那樣,任何“神經網絡”和傳統計算機網絡最大的區別,是“沒有中樞,每個神經元節點完全平等,徹底雲分佈”。
所以在執行“神經網絡”相應的運算時,人類傳統的電腦cpu效率其實並不是很高,無論英特爾還是amd。
因爲稍微懂點計算機常識的人都知道,cpu是“時分佔用”的計算硬件,通俗的說,一個4g主頻的cpu,只是一秒鐘能夠運算40億次,但每一瞬間依然只能計算一次,windows的“多任務處理系統”,本質上只是“把cpu的時間佔用細分,每個後臺程序在每一秒裡佔用那麼幾微妙”來實現的。
比如一個人打cs遊戲的時候,後臺開了個qq。運行qq需要佔用“每秒1億次運算”的cpu處理資源,那麼實質就是“4g主頻的cpu每秒分出25毫秒處理qq”,而不是物理意義上的“同時處理cs和qq”。
這種只能單核運算的模式,註定了不適合未來卷積神經網絡越來越多的“併線操作”。所以06年當卷積神經網絡的曙光出現之後,平行時空的英特爾公司也不是沒有意識到這一點並且掙扎。只不過英特爾公司最初的掙扎方式是“開發多核cpu”。
這纔有了後來人們熟知的“英特爾酷睿雙核/四核”。
可惜歷史最終證明,cpu再多核,要滿足浩如煙海的併線操作,也是杯水車薪。
要徹底滿足神經網絡的併線胃口,還是得靠最初作爲顯卡物理運算用的gpu。
這纔有了後來人工智能在軟件領域爆發後,倒逼硬件計算企業市值劇烈波動。做顯卡gpu出身的英偉達公司,一下子在兩年裡股價市值躍升了十幾倍,儼然對英特爾都形成了競爭。
用一句文科生都聽得懂的話來解釋這裡面的區別:爲什麼所有的顯卡都沒有“雙核/四核”概念?就是因爲顯卡gpu的每一個單元都是天然並行運算的。顯卡處理電腦圖像的時候,每一個像素都是單獨同時處理的。沒有了“時分佔用”的瓶頸,導致gpu顯然不像cpu那樣需要多核。
(注:gtx-titan系的顯卡有些被稱作“雙核”,其實是商家的錯誤宣傳,那些顯卡的本質是“兩塊顯卡”而不是“雙核”。)
顧誠的打算,就是在英特爾還準備靠多核掙扎的時候,他直接一步到位看穿其中的大坑,直接跳到gpu一統天下的路數上去。
如今的ageia公司成立還不到兩年,也沒什麼牛逼到爆的科技成果市場化。柳倩揮舞着顧誠的支票本出發,斷無不利之理。