探秘小米聲學實驗室 Daniel Povey爲何選擇小米?

探秘小米聲學實驗室 Daniel Povey爲何選擇小米?

在小米科技園舉辦針對人工智能的媒體開放日本站科技也第一次近距離地接觸了小米“神秘”的人工智能實驗室。小米集團副總裁、集團技術委員會主席崔寶秋博士、人工智能部總經理葉航軍博士、AI實驗室主任王斌博士,介紹了小米在AI領域的自主研發技術成果、技術人才引進情況。

葉航軍、崔寶秋、王斌(從左至右)

探秘小米聲學實驗室

首先我們來到小米聲學語音實驗室,可以看到,各種以小米智能硬件生態核心產品小愛音箱中樞,四周佈滿了供聲學語音測試使用的硬件設備據介紹,小米的智能硬件產品中,所有具備麥克風揚聲器的語音交互設備,都要經過這個實驗室測試後上線。目前,小愛音箱語音算法已經做到由小米全部自主研發,在這個實驗室中,以小愛音箱爲代表的小米全系智能語音設備,均會進行遠場近場靈敏度等一系列詳細測試並進行調試,其中近場測試,主要針對手機進行。

圖:小米聲學語音實驗室

據現場工程師介紹,實驗室中的人工模型及揚聲器等設備,均會高度會模擬日常的人聲環境音、噪聲干擾等,其中人聲的測試,機器可以分別模擬不同性別、不同年齡的聲音並反覆進行機器還原測試,而無需人工測試,既節省了人力成本,又可以保證精準的測試效果。在這個實驗室中,工程師會在測試過程中發現算法中可提升的部分,並反饋給小米研發團隊進行優化和算法調試。

圖:小米聲學語音實驗室

不同於前者,進入與硬件強相關的聲學實驗室後,馬上會感覺有些安靜的不適應,房間四周佈滿了錐形吸引牆,房間整體重量約70噸,用料極其奢侈。據工程師介紹,該實驗室內部各個角落,都不會產生聲音的回波,所有聲音都會被錐形牆體吸收,因此理論上講,房間內,只存在源頭聲音一個干擾源。實驗室包括三層牆體,均爲實心磚牆,主要作用爲在絕對安靜的環境條件下,對設備進行高靈敏度的測試,以便準確找到硬件設備各類極值

圖:小米聲學語音實驗室

據介紹,語音識別的頂層爲雲識別算法,但是在硬件設備底層,要極大保證設備的靈敏度,如麥克風對於聲音的採集,只有這樣,纔可以在雲端更好地進行算法識別,小米不惜成本地打造聲學語音實驗室,原因也在於此。

圖:小米智能廚衛

接下來,在體驗了包括智能客廳、智能臥室、智能書房、智能廚衛等以小愛同學爲智能家庭中樞的小米全系智能家居場景後,可以很直觀地感受到,小米AIoT,已經把之前描繪的未來智能生活場景完全變爲了現實。

圖:小米智能客廳

Daniel Povey選擇小米的三個理由

DanielPovey是全球公認的國際語音識別和AI領域知名教授、語音識別開源工具Kaldi之父。他於1993年到2003在劍橋大學度過了自己的高等教育經歷,獲得語音識別的博士學位。2003年至2008年,他在IBM研究院負責計算機語音識別的工作,並且獲得了Research Staff Member的角色;隨後在2008年到2012年,Daniel Povey在微軟研究院參與計算機語音識別方面的工作。2012年,Daniel Povey加入約翰霍普金斯大學,擔任語言和語音處理中心的副教授。

圖:崔寶秋與DanielPovey

2019年,DanielPovey在長達兩週的中國之旅中,分別走訪了包括清華、北大等頂級學府,以及多箇中國的頭部科技互聯網公司,但其最終選擇了加盟小米,崔寶秋認爲,第一是因爲Daniel Povey已經瞭解小米“手機+AIoT”雙引擎戰略生態的強大,同時他十分清楚語音識別在“手機+AIoT”雙引擎戰略中所扮演的重要角色;第二,Daniel Povey在參觀了小米公司總部後,瞭解到小米對於人才和技術的重視,以及具備大批優秀的工程師,以及這也是吸引Daniel Povey加盟的重要原因;第三,小米從雲計算、大數據到今天的AI,對於開源的擁抱,也是吸引Daniel Povey的關鍵點

崔寶秋透露,在與Daniel Povey談offer的過程中,Daniel Povey對於其他入職大部分細節基本不關心,他最關心的是保證Kaldi100%的開源,而崔寶秋給出的回答是:對於小米來說,這根本不是問題。Daniel Povey入職當天,崔寶秋表示,無論對於Daniel Povey本人、對於小米、對於中國的語音識別屆,今天都是很重要的一天。

人工智能技術已實現廣泛產品落地

目前,小米人工智能技術實現了廣泛的產品落地,比如AI相機、小米電視、AI音箱、MIUI、搜索推薦、IoT設備等,涵蓋聲學、語音、深度學習、視覺等各個領域,一句話概括,AI在小米已經無處不在。此外,據瞭解,小米還承建了智能家居國家新一代人工智能開放創新平臺

說到小愛同學,其語音識別技術包括聲學和語音,嚴格來說,這是兩個不同的技術領域,小米人工智能的聲學技術包括:回聲消除,去混響聲源定位,多通道降噪以及多種麥克風陣列解決方案;而語音技術則包括:喚醒,識別,聲紋以及語音合成。目前,小米小愛音箱語音算法已經實現全部自主研發。

在參觀後的採訪中,葉航軍介紹,在小米“手機+AIoT”的雙引擎戰略裡,AI扮演了非常重要的角色。在手機上,對於用戶經常使用的拍照功能,葉航軍認爲“目前在整個行業,手機相機研發有一個明顯的趨勢,就是人工智能的深度整合,具體來講有兩個方面,一個就是手機相機的軟件化和算法化,之前很多手機相機的體驗是靠硬件去做,但是最近這兩年,一些領先的體驗是通過軟件算法實現。第二個趨勢就是算法AI化,越來越多的相機算法從傳統圖像處理算法轉變成AI算法。”

王斌博士則分享了小米AI自主研發技術成果,目前小米已經在聲學、語音、視覺,NLP、知識圖譜、機器學習6大方向取得一系列成果。此外,王斌還介紹了小米在視覺、NLP、知識圖譜、機器學習等技術上的進展。視覺方面,自研人臉識別美顏魔法換天、場景識別在多款手機上落地應用。小米已經打造了自己的NLP平臺和知識圖譜,全面支撐公司的多項內容業務。小米麪向移動端的深度學習開源計算平臺MACE(Mobile AI Compute Engine)一推出便受到業界的廣泛關注,目前廣泛用於公司的各項產品中。

公開數據顯示,2016年—2018年間,小米在AI領域申請專利684項,列居世界第11位。在宣佈“手機+AIoT”雙引擎戰略爲未來5年內小米的核心戰略同時,雷軍表示,未來5年小米將在AIoT領域持續投入超過100億元,綜合人才、技術積累以及資金投入等因素,不難推測,相對於競品,小愛音箱的線下場景優勢依然具備提升空間。(張楠