煮酒品劍131:亞馬遜的AI革命
楊惟雯
一、用AI重塑金身
一直以來,亞馬遜好像跟高科技搭不上邊,但最近幾年 AWS、Alexa 等高科技產品卻頻頻搶佔頭條。這背後是亞馬遜對自己的重塑----將人工智慧融進公司的每一個細胞。
顯然,亞馬遜 CEO Jeff Bezos正依靠自己手下的精兵強將把亞馬遜打造成 AI 巨擘。近幾年,人工智慧界經歷了一場革命,機器學習變得更加高效。特別是深度學習,成了計算視覺、語音和自然語言處理等技術快速發展的催化劑。
亞馬遜真正將深度學習應用在產品推薦上。即借助深度學習重新定義推薦系統的工作方式。其搜索業務副總裁 Srikanth Thirumalai,開了用機器學習改進亞馬遜軟體的先河
還有一些高管提出要創建全新業務分支,如基於語音的家用電器,而這個想法最終進化成了 Echo。
從運行在全新機器學習架構上的推薦系統,在推薦你看什麼文本、買什麼產品和看什麼電影時,亞馬遜變得更智慧了。
二、Alexa語音平臺擴散效應
亞馬遜在 AI 領域的拳頭產品是智慧音箱——Echo 和在背後驅動它的 Alexa 語音平臺。這項目2011 年它以“運營計畫 1”為名被放在 Bezos 的辦公桌上。該項目的參與者之一是名為 Al Lindsay 的亞馬遜高管,他 2004 年就加入電商巨頭,當時“一款大腦完全存在雲端的低成本電腦,靠語音完成交互”這就是他構想中的新產品。
可是,它需要的人工智慧技術卻是亞馬遜最缺乏的。更可怕的是,那些有能力完成這套系統的專家中,很少有人願意為亞馬遜工作。穀歌和 Facebook 搜羅走了大量 AI 頂級人才。
Alexa 引擎副總裁 Al Lindsay 認為亞馬遜招聘人才時是個弱者。亞馬遜一心只想著消費者和其零碎的文化氛圍不符合學術界的調調,而且它們的待遇也比不過競爭對手。尤其,亞馬遜的保密文化阻礙了它們從學術界吸引頂級人才的腳步。例如亞馬遜想將業內的超級明星 Alex Smola(稱得上是深度學習教父之一)招致麾下。不過,亞馬遜卻不願向他透露入職後到底要幹什麼。最終 Smola 拒絕了這個 offer。
由於亞馬遜沒什麼 AI 人才,所以它們只能憑著超厚的錢包開始買買買。2011 年 9 月,它們吞下了 Yap,一家語音撰文子公司。
2012 年 1 月,亞馬遜又買下了 Evi,一家來自英國劍橋的 AI 公司,它們的軟體能像 Siri 一樣回應各種語音要求。
2013 年 1 月,它們又收了 Ivona,這家波蘭公司在文本轉語音上有自己的一套,而該技術 Echo 開口說話的關鍵。
不過,亞馬遜仍有自己的閃光點。由於它們會在藍圖中放出產品功能,而有些功能挑戰性十足,這就會吸引許多野心勃勃的科學家。Echo 的語音特性需要相當程度的會話 AI 技術支援,比如“喚醒詞”、識別並轉譯命令、提供正確答…案等,而這些技術當時都不存在。
即使亞馬遜沒有公佈最終產品是什麼,這個專案也吸引了 Rohit Prasad(備受尊敬的語音辨識科學家)的關注。在他看來,亞馬遜缺乏 AI 專家是它們的一大特點,而不是 bug。“這裡是一塊帶開墾的新天地。”他說道。“穀歌和微軟搞語音專案已經很多年了。在亞馬遜我們可能得從頭做起並解決很多難題。”2013 年剛加入亞馬遜,他就被派去做 Alexa 項目。“這款設備還只是個硬體,而且處在最早階段。”他回憶道。
Echo 音箱面臨的最棘手問題是被稱為遠場語音辨識的技術,為了它亞馬遜不得不開闢新天地。這項技術不但包含轉換並譯出遠處傳來的語音命令,還要克服各種外界噪音和其它聽覺干擾。
另一大挑戰則是設備不能花太多時間去理解語音命令,它需要將語音傳到雲端並迅速回饋答案,整個過程得像順暢的聊天。想打造一套能在吵雜環境下理解並回應各種詢問的機器學習系統需要天量的資料,而且這些資料從哪來也是個麻煩事。
他的團隊搞定了 Echo 這款遠場語音辨識設備,就能獲得做更大事的機會——將 Alexa 做成語音服務。他們擴展 Alexa 的一種直接方式是允許協力廠商開發者打造自己的語音技術小程式,也就是後來我們所說的“技能”,這些“技能”可在 Echo 上運行。不過,這僅僅是個開始。
亞馬遜資深首席科學家 Spyros Matsoukas從 Echo 身上抽出 Alexa 的魂魄後,亞馬遜的 AI 文化開始逐漸凝聚起來。公司的各個團隊開始意識到,Alexa 也可以為它們旗下的各種專案提供語音服務。於是各種資料和技術開始凝聚在一起。
隨後,第一批亞馬遜產品開始整合 Alexa。只要開口,你就能在 Alexa 設備上訪問 Amazon 音樂、Prime 視頻和你在主要購物網站上的個性化推薦等。
接著,這項技術的覆蓋面開始變的更廣。一旦擁有了基礎語音能力,他們就能把它融入到非 Alexa 設備中,比如 Fire TV、語音購物及最終的 AWS。
另一個促進亞馬遜轉型的關鍵環節是,一旦有數百萬用戶開始使用 Echo 或其他 Alexa 設備,就意味著它們正式在該領域紮根了。
亞馬遜能獲得海量的資料,很有可能是史上最大的語音驅動設備的交互集合。
這些海量資料,又成了亞馬遜招聘人才最好的籌碼。突然之間,原來對電商巨頭嗤之以鼻的機器學習專家都想來這工作了。Alexa 吸引力如此巨大,原因之一就是,只要你賣出一台設備,就獲得了回饋資源。這其中不但包括用戶回饋,還包括實打實的資料,它們對技術的提升,尤其是底層平臺相當重要。
因此,隨著使用 Alexa 人數的不斷增加,亞馬遜獲得的資訊不但能提升系統表現,還能為自家的機器學習工具和平臺充電,同時還讓自己成為機器學習科學家趨之若鶩的大磁鐵。
三、創造更聰明的AI雲
2014 年起,亞馬遜開始面向 Prime 會員銷售 Echo。
同年,亞馬遜 AI 副總裁Swami Sivasubramanian 開始愛上機器學習。當時的他負責 AWS 資料庫和分析業務,回老家(印度)探親的他由於沒倒過來時差,深夜還在擺弄類似穀歌 Tensorflow 和 Caffé 等工具,這可是 Facebook 和學界都非常青睞的機器學習框架。
熟悉了之後他發現,如果將這些工具與亞馬遜的雲服務相結合,能產生難以估量的巨大價值。他認為,通過降低雲計算中機器學習演算法的難度,亞馬遜能深挖出更多潛在的需求。“我們每個月都為數百萬開發者提供服務。”他說道。“他們中大多數人都不是麻省理工的教授,而是沒有機器學習背景的普通開發者。”
從某種程度上來說,他是為 AWS 服務添加機器學習服務的藍圖。不過,Sivasubramanian 的眼光放的更遠:他想讓 AWS 成為整個行業機器學習活動的中心。
他認為,為成千上萬的亞馬遜雲服務使用者提供機器學習是大勢所趨。
2015 年,AWS 的亞馬遜機器學習首次上線,它讓類似 C-Span 的用戶設置一個是人面部列表。例如,Zillow 用它來估算房價,Pinterest 則用它來做視覺搜索。此外,還有幾家自動駕駛新創公司在用 AWS 機器學習搞道路類比,以快速提升產品競爭力。
一年以後,AWS 又推出了新的機器學習服務,這次它們更直接的借鑒了 AWS 的創新,加入了一種名為 Polly 的文本轉語音元件和一種名為 Lex 的自然語言處理引擎。這些新功能讓 AWS 的客戶能打造自己的迷你版 Alexa。
除此之外,亞馬遜還有了視覺服務 Rekognition,它們要像穀歌、Facebook 和蘋果那樣在圖像識別領域掌握自己的魔法。
這些機器學習服務不但成了亞馬遜的金礦,還是電商巨頭 AI 飛輪的關鍵點,無論是 NASA 還是橄欖球大聯盟,都成了亞馬遜機器學習服務的大客戶。隨著企業紛紛在 AWS 內建立起重要的機器學習工具,它們未來另起爐灶與電商巨頭競爭的可能性變得越來越小。
就拿 Infor 這家公司來說,它們是企業應用領域的巨頭,最近還發佈了一款名為 Coleman 的應用,該應用讓使用者能自動處理各種流程、分析性能,並通過語音對話介面與資料進行交互。
這可不是 Infor 從零開始打造的聊天機器人,而是使用 AWS 的 Lex 技術生成的。“反正亞馬遜已經做好了,所以我們幹嘛還要花時間重來一遍呢?我們瞭解自己的客戶,這款應用絕對適合他們。”Infor 高級副總裁 Massimo Capoccia 解釋道。
AWS 在乙太網上的統治力也讓它擁有了對手沒有的戰略優勢,尤其是穀歌,搜索巨頭希望用自己在機器學習上的領先來追趕 AWS 在雲計算上的地位。
誠然,穀歌能在伺服器上給使用者提供速度超快的機器學習優化晶片,但 AWS 在交互上更為簡單方便,而且亞馬遜的完整鏈條還方便公司們銷售產品。就像 Willie Sutton 說的,他之所以選擇亞馬遜AWS當合作夥伴來搞機器學習,是因為我們的客戶都在這裡。
在2017年 11 月的 AWS re:Invent 大會上,亞馬遜推出了一款更為全面的機器學習產品:SageMaker,它雖然看起來複雜,但其實是個相當易用的平臺。它的創造者之一就是 Alex Smola,那位五年前拒絕了亞馬遜的機器學習大神。當 Smola 決定重返機器學習行業時,他就立志要打造一款強大的工具,讓普通的軟體發展人員也用上這項技術,因此他選擇回到亞馬遜,這個能將機器學習威力產生最大影響的地方,因為如果不做出真正的產品,就不會有人用你漂亮的演算法。
即使最終只有一部分 AWS 用戶選擇 SageMaker,亞馬遜也能拿到大量有關系統表現的資料,促使它們對資料進行持續改進。這又形成了一個良性迴圈,更好地平臺必然會帶來更多用戶。
四、讓AI 無處不在的文化
隨著機器學習的逐漸成熟,亞馬遜的 AI 專家現在已經遍佈了旗下各個團隊,這讓 Bezos 感到非常滿意。雖然亞馬遜沒有設立 AI 中心,但它們已經有了一個專門負責機器學習普及和支持的部門。同時,它們還有一些專注於將新技術導入公司專案的應用研究。
眼下,亞馬遜的核心機器學習小組由 Ralf Herbrich 領導,這位高管此前曾在微軟和 Facebook 兩家巨頭待過,2012 年才轉投亞馬遜。
Ralf Herbrich 的部分職責包括培養亞馬遜快速成長的機器學習文化。由於它們堅持以客戶為中心的政策,因此解決問題比漫無目的的研究更重要。亞馬遜的高管也承認,他們招聘時更偏向那些經世致用,真正有興趣打造新事物的人,而不是那些追求科學突破的人。
不過,在培養員工適應人工智慧上,亞馬遜正在學習 Facebook 和穀歌的經驗。它們會開設許多有關 AI 的內部課程,而且從 2013 年起,每年春天亞馬遜都會在總部舉辦一次內部的機器學習學術會議。
Herbrich 的團隊還在繼續推動機器學習融入公司的每一個細胞。
舉例來說,產品交付團隊想要更好地預測客戶訂單到底要用哪種尺寸的盒子包裝(一共 8 種尺寸),所以它們就找了 Herbrich 尋求幫助。“產品交付團隊不需要另設專門的科學家小組,但它們需要這些演算法,而且用起來得簡單。”Herbrich 說道。
在另一個例子中,David Limp 講述了亞馬遜是如何預測用戶購買新產品可能性的。“我在消費電子領域摸爬滾打 30 年了,其中有 25% 的工作都需要人類判斷、試算表和各種魔術貼來完成。”他說道。“但加入機器學習後,我們的失誤率開始顯著下降。”
即使如此,有時候 Herbrich 也得用上最尖端的技術。
就拿亞馬遜生鮮服務來說,雖然該服務運營時間已經有十年之久,但怎樣更好地評估蔬菜和水果的品質依然是個麻煩事。畢竟人類評判速度太慢,而且容易前後不一致。
於是,他在柏林的團隊搞了搭載感測器的硬體和新演算法,彌補了現有系統不能觸摸和嗅探食物味道的能力。“三年之後,我們就能拿出原形產品,到時判斷生鮮食品的品質就更簡單也更可靠了。”Herbrich 說道。
不用說,這樣的技術進步肯定能逐漸滲入亞馬遜的整個生態中。以最新的 Amazon Go 無人超市為例,其負責人就表示自己從 AWS 專案中學到了不少。“不過,AWS 也是受益者。”Amazon Go 技術副總裁 Dilip Kumar 說道。Amazon Go 有自己獨特的流媒體資料系統,它會通過數百個攝像頭採集購物用戶的一舉一動,它們團隊的創新為 AWS 旗下的 Kinesis 提供了説明,該服務讓使用者能將多個設備上的流媒體視頻上傳到亞馬遜的雲端,對這些資料進行處理分析就能不斷改進自家的機器學習技術。
或許有人會質疑,亞馬遜一個以產品為中心的公司能打敗那些擁有大量深度學習大咖的公司嗎?
飛輪還在快速旋轉,還有許多我們不知道的亞馬遜正在積聚力量呢?它們可能會為亞馬遜帶來更多資料,更多使用者,更好的平臺和更多人才。
留言列表