☰

探秘小米聲學實驗室 Daniel Povey爲何選擇小米？

在小米科技園舉辦針對人工智能的媒體開放日，本站科技也第一次近距離地接觸了小米“神秘”的人工智能實驗室。小米集團副總裁、集團技術委員會主席崔寶秋博士、人工智能部總經理葉航軍博士、AI實驗室主任王斌博士，介紹了小米在AI領域的自主研發技術成果、技術人才引進情況。

葉航軍、崔寶秋、王斌（從左至右）

探秘小米聲學實驗室

首先我們來到小米聲學語音實驗室，可以看到，各種以小米智能硬件生態鏈核心產品小愛音箱爲中樞，四周佈滿了供聲學語音測試使用的硬件設備，據介紹，小米的智能硬件產品中，所有具備麥克風、揚聲器的語音交互設備，都要經過這個實驗室測試後上線。目前，小愛音箱語音算法已經做到由小米全部自主研發，在這個實驗室中，以小愛音箱爲代表的小米全系智能語音設備，均會進行遠場、近場、靈敏度等一系列詳細測試並進行調試，其中近場測試，主要針對手機進行。

圖：小米聲學語音實驗室

據現場工程師介紹，實驗室中的人工模型及揚聲器等設備，均會高度會模擬日常的人聲及環境音、噪聲干擾等，其中人聲的測試，機器可以分別模擬不同性別、不同年齡的聲音並反覆進行機器還原測試，而無需人工測試，既節省了人力成本，又可以保證精準的測試效果。在這個實驗室中，工程師會在測試過程中發現算法中可提升的部分，並反饋給小米研發團隊進行優化和算法調試。

圖：小米聲學語音實驗室

不同於前者，進入與硬件強相關的聲學實驗室後，馬上會感覺有些安靜的不適應，房間四周佈滿了錐形吸引牆，房間整體重量約70噸，用料極其奢侈。據工程師介紹，該實驗室內部各個角落，都不會產生聲音的回波，所有聲音都會被錐形牆體吸收，因此理論上講，房間內，只存在源頭聲音一個干擾源。實驗室包括三層牆體，均爲實心磚牆，主要作用爲在絕對安靜的環境條件下，對設備進行高靈敏度的測試，以便準確找到硬件設備各類極值。

圖：小米聲學語音實驗室

據介紹，語音識別的頂層爲雲識別算法，但是在硬件設備底層，要極大保證設備的靈敏度，如麥克風對於聲音的採集，只有這樣，纔可以在雲端更好地進行算法識別，小米不惜成本地打造聲學語音實驗室，原因也在於此。

圖：小米智能廚衛

接下來，在體驗了包括智能客廳、智能臥室、智能書房、智能廚衛等以小愛同學爲智能家庭中樞的小米全系智能家居場景後，可以很直觀地感受到，小米AIoT，已經把之前描繪的未來智能生活場景完全變爲了現實。

圖：小米智能客廳

Daniel Povey選擇小米的三個理由

DanielPovey是全球公認的國際語音識別和AI領域知名教授、語音識別開源工具Kaldi之父。他於1993年到2003在劍橋大學度過了自己的高等教育經歷，獲得語音識別的博士學位。2003年至2008年，他在IBM研究院負責計算機語音識別的工作，並且獲得了Research Staff Member的角色；隨後在2008年到2012年，Daniel Povey在微軟研究院參與計算機語音識別方面的工作。2012年，Daniel Povey加入約翰霍普金斯大學，擔任語言和語音處理中心的副教授。

圖：崔寶秋與DanielPovey

2019年，DanielPovey在長達兩週的中國之旅中，分別走訪了包括清華、北大等頂級學府，以及多箇中國的頭部科技互聯網公司，但其最終選擇了加盟小米，崔寶秋認爲，第一是因爲Daniel Povey已經瞭解小米“手機+AIoT”雙引擎戰略生態的強大，同時他十分清楚語音識別在“手機+AIoT”雙引擎戰略中所扮演的重要角色；第二，Daniel Povey在參觀了小米公司總部後，瞭解到小米對於人才和技術的重視，以及具備大批優秀的工程師，以及這也是吸引Daniel Povey加盟的重要原因；第三，小米從雲計算、大數據到今天的AI，對於開源的擁抱，也是吸引Daniel Povey的關鍵點。

崔寶秋透露，在與Daniel Povey談offer的過程中，Daniel Povey對於其他入職大部分細節基本不關心，他最關心的是保證Kaldi100%的開源，而崔寶秋給出的回答是：對於小米來說，這根本不是問題。Daniel Povey入職當天，崔寶秋表示，無論對於Daniel Povey本人、對於小米、對於中國的語音識別屆，今天都是很重要的一天。

人工智能技術已實現廣泛產品落地

目前，小米人工智能技術實現了廣泛的產品落地，比如AI相機、小米電視、AI音箱、MIUI、搜索推薦、IoT設備等，涵蓋聲學、語音、深度學習、視覺等各個領域，一句話概括，AI在小米已經無處不在。此外，據瞭解，小米還承建了智能家居國家新一代人工智能開放創新平臺。

說到小愛同學，其語音識別技術包括聲學和語音，嚴格來說，這是兩個不同的技術領域，小米人工智能的聲學技術包括：回聲消除，去混響，聲源定位，多通道降噪以及多種麥克風陣列解決方案；而語音技術則包括：喚醒，識別，聲紋以及語音合成。目前，小米小愛音箱語音算法已經實現全部自主研發。

在參觀後的採訪中，葉航軍介紹，在小米“手機+AIoT”的雙引擎戰略裡，AI扮演了非常重要的角色。在手機上，對於用戶經常使用的拍照功能，葉航軍認爲“目前在整個行業，手機相機研發有一個明顯的趨勢，就是人工智能的深度整合，具體來講有兩個方面，一個就是手機相機的軟件化和算法化，之前很多手機相機的體驗是靠硬件去做，但是最近這兩年，一些領先的體驗是通過軟件算法實現。第二個趨勢就是算法AI化，越來越多的相機算法從傳統圖像處理算法轉變成AI算法。”

王斌博士則分享了小米AI自主研發技術成果，目前小米已經在聲學、語音、視覺，NLP、知識圖譜、機器學習6大方向取得一系列成果。此外，王斌還介紹了小米在視覺、NLP、知識圖譜、機器學習等技術上的進展。視覺方面，自研的人臉識別、美顏、魔法換天、場景識別在多款手機上落地應用。小米已經打造了自己的NLP平臺和知識圖譜，全面支撐公司的多項內容業務。小米麪向移動端的深度學習開源計算平臺MACE（Mobile AI Compute Engine）一推出便受到業界的廣泛關注，目前廣泛用於公司的各項產品中。

公開數據顯示，2016年—2018年間，小米在AI領域申請專利684項，列居世界第11位。在宣佈“手機+AIoT”雙引擎戰略爲未來5年內小米的核心戰略同時，雷軍表示，未來5年小米將在AIoT領域持續投入超過100億元，綜合人才、技術積累以及資金投入等因素，不難推測，相對於競品，小愛音箱的線下場景優勢依然具備提升空間。（張楠）

探秘小米聲學實驗室 Daniel Povey爲何選擇小米？

相關資訊