AWS 推出五項機器學習新服務,重塑和改進企業日常任務

在AWS re:Invent全球大會上,亞馬遜(NASDAQ:AMZN)旗下公司Amazon Web Services, Inc.(AWS)宣佈五項新的人工智能 (AI) 服務,旨在將機器學習交到更多應用程序開發者和終端用戶手中,而他們無需機器學習經驗。AWS介紹了幾項使用了AI的新服務,讓更多開發者應用機器學習,創造更好的終端用戶體驗,包括機器學習驅動企業搜索、代碼審覈與分析欺詐檢測醫療轉錄和AI預測的人工審覈。要了解有關AWS AI服務的更多詳細信息,請訪問https://aws.amazon.com/machine- learning/ai-services/。

機器學習持續快速增長,如今有數以萬計的客戶在 AWS上進行機器學習,包括許多選擇使用 AWS完全託管的 AI 服務的客戶,例如,Alfresco、拜耳作物科學、Cerner、CJ考克斯汽車、C-SPAN、德勤、多米諾、阿聯酋航空NBD、弗雷德哈欽森癌症研究中心、 FICO、FINRA、蓋洛普、Kelley Blue Book、起亞、Mainichi報業公司、美國宇航局、普華永道、白宮歷史協會、雅馬哈公司和Zola。在過去一年裡,AWS 推出了多個完全託管的 AI新服務,如 Amazon Personalize和Amazon Forecast,讓客戶能夠受益於亞馬遜消費者業務使用的、使其客戶體驗屢獲殊榮的、相同的機器學習個性化推薦和預測技術。AWS 客戶有興趣學習亞馬遜大規模使用機器學習的豐富經驗,以改進運營,提供更好的客戶體驗,又無需訓練優化部署自己的定製化機器學習模型。今天,AWS 宣佈推出五項新的 AI 服務,這些服務基於 Amazon 豐富的機器學習經驗,允許所有行業、所有規模的機構在其企業中採用機器學習,而無需機器學習經驗。

Amazon Kendra通過機器學習重塑企業搜索

儘管多年來多種嘗試,但內部搜索對於當今的企業來說仍是一個棘手的問題,大多數員工仍然經常難以找到他們需要的信息。機構擁有大量非結構化文本數據,如果能夠發現、存儲多種格式並跨不同的數據源(例如 Sharepoint、Intranet、Amazon S3和本地文件存儲系統),則這些數據非常有用。即使通用的、基於 Web 的搜索工具隨處可見,機構仍然發現內部搜索很困難,因爲沒有可用工具能夠很好地跨越現有數據孤島編制索引,無法提供自然語言查詢,並且無法提供準確的結果。當員工有疑問時,他們需要使用可能出現在不同上下文、多個文檔中的關鍵字,這些搜索通常會生成一長串隨機鏈接,員工必須篩選這些鏈接才能找到他們查找的信息(如果他們找得到的話)。

Amazon Kendra 讓員工可以使用真實問題(而不僅僅是關鍵字)在多個數據孤島中搜索,在後臺部署 AI 技術來提供他們尋求的精確答案(而不是隨機的鏈接列表),重塑企業搜索。員工可以使用自然語言運行搜索(關鍵字仍然有效,但大多數用戶更喜歡自然語言搜索)。例如,員工可以提出一個特定問題,如“IT 服務檯什麼時候開?”Amazon Kendra 會給他們一個具體答案,如“IT 服務檯在上午9:30打開”,同時給出指向 IT門戶和其它相關網站的鏈接。客戶可以在應用程序、門戶和 wiki 中使用 Amazon Kendra。只需在 AWS 管理控制檯中單擊幾下,客戶即可將 Amazon Kendra 指向其各種文檔存儲庫,服務會聚合 PB級的數據以構建集中索引。Amazon Kendra會掃描文檔的權限,確保搜索結果符合現有的文檔訪問策略,搜索結果僅包含用戶有權訪問的文檔。此外,Amazon Kendra還根據客戶的特定情況,積極地重新訓練機器學習模型,使用點擊率數據、用戶位置和反饋提高準確性,隨着時間的推移提供越來越好的答案。要了解有關Amazon Kendra的更多信息,請訪問http://aws.amazon.com/kendra。

Amazon CodeGuru 使用機器學習提供自動代碼審覈,幫助機構找到開銷最大的代碼行,從而改進軟件開發

跟亞馬遜一樣,AWS客戶也編寫了大量代碼。軟件開發是一個廣爲人知的過程。開發者編寫代碼、查看代碼、編譯代碼和部署應用程序、衡量應用程序的性能並使用該數據改進代碼,循環往復。然而,如果代碼一開始就不正確,那麼所有這些過程都沒什麼用,所以團隊都會在新代碼添加到現有應用程序代碼庫之前執行代碼檢查,檢查邏輯、語法和樣式。即使對於像亞馬遜這樣的大型機構,考慮其每天要編寫的代碼量,也很難有那麼多有經驗的開發者、他們有足夠的富餘時間來審覈代碼。而且即使是有經驗的審閱者遇到面向客戶的應用程序時也會漏掉問題,從而導致出錯和性能問題。

Amazon CodeGuru 是一種新的機器學習服務,可自動執行代碼審覈,找到應用程序開銷最大的代碼行。Amazon CodeGuru 有兩個組件: 代碼審覈和應用程序分析。對於代碼審覈,開發者像往常一樣提交其代碼(目前支持GitHub 和 CodeCommit,未來會支持更多的存儲庫),將 Amazon CodeGuru 添加爲代碼審閱者之一,無需對正常過程或要安裝的軟件進行其他更改。Amazon CodeGuru 收到拉取請求,會自動開始使用經過預先訓練的模型來評估代碼。這些模型已經在亞馬遜和GitHub前10000的項目中經受過數十年的代碼審覈訓練。Amazon CodeGuru將檢查代碼更改的質量,如果發現問題,它將向拉取請求添加易於閱讀的註釋,標識出代碼行、特定問題和修正建議,包括示例代碼和指向相關文檔的鏈接。

Amazon CodeGuru 還包含一個機器學習驅動的應用程序探查器,可幫助客戶找到開銷最大的代碼行。要使用它,客戶只要在其應用程序中安裝一個小小的代理程序,然後 Amazon CodeGuru 就可以觀察應用程序運行時,每五分鐘分析一次應用程序代碼。代碼配置文件包括有關延遲和 CPU利用率的詳細信息,直接鏈接到特定的代碼行。Amazon CodeGuru可幫助操作者在應用程序中找到開銷最大的代碼行,生成火焰圖,幫助直觀地標識出造成性能瓶頸的其它代碼行。多年來,亞馬遜內部團隊使用Amazon CodeGuru 對80000多個應用程序進行了代碼分析。2017到2018年,Amazon CodeGuru內部版本的廣泛使用,幫助亞馬遜消費者業務的 Amazon Prime Day團隊提高了其應用效率,CPU 利用率提高325%,減少了管理 Prime Day所需的實例數量,整體成本降低了39%。要了解有關 Amazon CodeGuru 的更多信息,請訪問http://aws.amazon.com/codeguru。

Amazon Fraud Detector使用機器學習進行自動欺詐檢測

世界各地的機構每年因欺詐而損失數百億美元。如今,許多 AWS 客戶都投資於大型、昂貴的欺詐管理系統。這些系統通常基於手工編碼的規則,耗時、定製成本高,很難隨着欺詐模式的變化而保持最新,導致系統的準確性低於預期。這導致機構將優秀客戶拒絕爲欺詐者,進行更昂貴的欺詐審覈,錯失降低欺詐率的機會。20多年來,亞馬遜一直在使用包括機器學習在內的尖端技術來檢測欺詐易,並瞭解這是一個與欺詐者不斷進行的貓捉老鼠遊戲,需要大量的資源來構建防禦、保持與時俱進。AWS的客戶們希望 AWS可以分享其專業知識和經驗。

Amazon Fraud Detector提供完全託管的服務,基於亞馬遜消費者業務使用的相同技術,實時檢測潛在的線上身份欺詐和支付欺詐,無需機器學習經驗。Amazon Fraud Detector使用欺詐和合法交易的歷史數據來構建、訓練和部署機器學習模型,提供實時、低延遲的欺詐風險預測。首先,客戶將交易數據上傳到 Amazon S3,定製模型訓練。客戶只需提供與交易關聯的電子郵件地址和 IP 地址,可以選擇添加其它數據(例如帳單地址或電話號碼)。根據客戶想要預測的欺詐類型(新帳戶或線上支付欺詐),Amazon Fraud Detector將預處理數據、選擇一個算法、訓練一個模型————使用亞馬遜數十年來大規模運行欺詐檢測風險分析的經驗。Amazon Fraud Detector還使用基於機器學習的、根據亞馬遜數據訓練過的數據檢測器。這些數據檢測器可幫助識別與 發生在Amazon上的 欺詐活動(例如異常的電子郵件命名規律)相似的模式,即使客戶向Amazon Fraud Detector提供的欺詐示例數量很少,也可以幫助提高模型訓練的準確性。

Amazon Fraud Detector將模型訓練、部署到完全託管的私有API 端點。客戶可以將新活動(例如註冊或新購買)發送到 API、接收包括風險評分的欺詐報告。根據此報告,應用程序可以確定正確的行動(例如接受購買,或將其傳遞給人工審覈)。藉助 Amazon Fraud Detector,客戶可以更快、更輕鬆地、更準確地檢測欺詐。要了解有關Amazon Fraud Detector的更多信息,請訪問http://aws.amazon.com/fraud-detector。

Amazon Transcribe Medical使用機器學習轉錄醫療語音,讓醫療保健提供商能夠專注於患者護理

如今,醫生們的一部分日常工作,是將詳細的數據輸入病歷(EHR)系統。然而,幫助他們準確記錄和存檔病情的解決方案是欠佳的。在許多醫院,醫生必須將醫療筆記口述到記錄器中,然後將這些語音文件提交到第三方手動抄錄,服務成本高昂,可能需要長達三個工作日,延誤了存檔流程。另一種選擇是利用現有的前端聽寫軟件,但受限於現有的工具,醫生們仍然每天要在臨牀記錄上花費好幾小時。第三種選擇是醫療保健提供商僱用人工抄寫員,在醫生們看病時協助做記錄,但人工抄寫員可能會令患者感到不安,醫生們經常提到他們的記錄有欠缺,醫療機構也很難大規模地安排和協調抄寫員。總之,現有的解決方案在提高臨牀記錄效率和改善患者護理方面都有不足。

Amazon Transcribe Medical通過使用機器學習技術自動轉錄自然醫學語音來解決這些問題。建立在 Amazon Transcribe Medical語音到文本功能之上的病歷應用,可以準確、經濟實惠地生成記錄。Amazon Transcribe Medical由多個機器學習模型組成,這些模型經過數萬小時的醫學語音訓練,可提供準確的、機器學習驅動的醫學轉錄。實時生成記錄,消除了多日的流轉時間。

Amazon Transcribe Medical可以幫助醫生們在跟患者溝通時自動轉錄對話,不用分心手動筆記,醫療保健提供商能夠專注於患者護理。醫生可以自然地說話,Amazon Transcribe Medical使用內置的自動標點符號,克服現有轉錄軟件的侷限性。對於醫療保健提供商,基於 Amazon Transcribe Medical的語音解決方案可擴展到數千個潛在的醫療中心,消除了管理和協調臨時抄寫員的操作難題。Amazon Transcribe Medical符合 HIPAA 認證,提供易於使用的 API,可與支持語音的應用程序和帶有麥克風的任何設備集成。Amazon Transcribe Medical的輸出文本也可以用於其他 AWS 服務,例如自然語言處理服務 Amazon Comprehend Medical,在最終進入病歷系統前進行下一步的數據分析。要開始使用Amazon Transcribe Medical,請訪問http://aws.amazon.com/transcribe/medical。

Amazon Augmented Artificial Intelligence (A2I) 允許開發者使用人工審閱驗證機器學習預測

機器學習可以爲各種應用場景提供高度準確的預測,包括識別圖像中的對象、從掃描的文檔中提取文本、或者轉錄與理解口語。在每種情況下,機器學習模型都會提供預測,提供置信度分數以表示模型預測的確定性。置信度分數越高,結果的可信度就越高。對於許多應用場景,當開發者收到高置信度結果時,他們可以信任其結果可能是準確的,可以自動處理它們(例如,自動調整社交網絡上用戶生成的內容,或者給視頻加字幕)。但是,在置信度低於預期的情況下,預測結果模糊,可能需要人工審覈才能解決這種模糊性。機器學習和人工審閱之間的這種相互作用,對於機器學習系統的成功至關重要,但人工審覈的大規模構建和運營,很有挑戰,成本高昂,通常涉及多個流程步驟,需要定製軟件管理人工審覈任務和結果,需要招聘和管理大量審覈人員。結果,開發者時常花費大量的時間來管理人工審覈過程,而不是構建其預想的應用程序,或者不得不放棄人工審覈,導致許多預測的信心和效用都很低。

Amazon Augmented Artificial Intelligence (A2I) 是一項新服務,使用它很容易構建和管理機器學習應用程序的人工審覈。Amazon A2I 爲常見的機器學習任務——例如圖像中的對象檢測、語音轉錄和內容審覈——提供預構建的人工審覈工作流,方便對來自 Amazon Rekognition 和 Amazon Textract 的機器學習預測做人工審覈。開發者爲其特定應用程序選擇置信閾值,所有置信度分數低於閾值的預測都將自動發送給人工審覈人員進行驗證。開發者可以選擇Amazon Mechanical Turk的50萬全球人工、預授權人工的第三方機構如Startek、iVision、CapeStart、Cogito 和 iMerit、或他們自己的審覈人員執行其審覈。審覈結果存儲在 Amazon S3中,開發者在審覈完成後會收到通知,以便他們根據審覈人員的可信結果進行下一步操作。Amazon A2I 爲所有開發者帶來了人工審覈,消除了構建和管理定製審覈流程或招募大量審覈人員方面的繁重工作。要開始使用 Amazon A2I,請訪問 aws.amazon.com/augmented-ai 。

亞馬遜機器學習副總裁 Swami Sivasubramanian表示,“各個行業領域的公司都告訴我們,他們希望利用亞馬遜豐富的機器學習經驗,應對企業面臨的一些共同挑戰。這些挑戰包括內部搜索、幫助軟件開發者編寫更好的代碼、識別欺詐易、以及提高所有機器學習系統的整體質量。亞馬遜還憑藉數十年來構建機器學習系統的經驗,打造了能夠成功應對這些挑戰的內部系統。今天的發佈是我們客戶至尚文化的又一次迭代,是它激勵我們開發這些系統。通過這些發佈,我們很高興能夠讓企業用戶使用這些機器學習功能,而無需任何機器學習專業知識。”

3M 是一家跨國公司,是研磨產品、化學品與先進材料、薄膜、過濾、粘合劑等產品的領先製造商之一。3M以協作的方式應用科技改善生活。3M企業研究系統實驗室技術總監David Frazee表示,“研發是3M的心跳,紮根科學讓我們強大。我們的材料科學家開展新的研究時,他們需要了解過去的、可能相關的研究。這些信息往往埋藏在我們的專利和廣泛的知識存儲庫中。尋找合適的信息往往讓人精疲力竭,耗時,有時信息不完整。藉助Amazon Kendra,我們的科學家可以使用自然語言查詢、快速準確地找到所需的信息。藉助Amazon Kendra,我們的工程師和研究人員熱情高漲,快速查找信息,加快創新速度,更有效地協作,源源不斷地爲客戶提供獨特的產品。”

Workgrid 軟件公司是 Liberty Mutual(利寶保險)的全資子公司,爲員工體驗平臺中提供軟件解決方案,讓工作更加互聯、更高效、生產力更高。“我們的核心產品之一是 Workgrid Chatbot,它讓員工能夠快速獲得頻繁查詢的答案,使用友好的自然語言界面自動執行任務。企業聊天機器人的一個關鍵部分是回答來自員工的無數問題,所以Workgrid 提供自助問答構建器,內容作者不用掌握編程語言,就可以訓練聊天機器人響應員工的問題。除了這些精心策劃的內容外,我們希望爲 Workgrid Chatbot 提供一種方法,以便從整個企業的大量文檔(例如 PDF 文檔)輕鬆提取知識,” Workgrid 雲工程和 AI 主管 Gillian McCann 說。“藉助 Amazon Kendra,很高興我們的客戶能夠快速高效地獲得所需的答案。Amazon Kendra 能夠直接從多個存儲庫的非結構化數據中提取答案,並且有可能快速跟蹤學習,讓我們向客戶交付準確、不斷優化的答案。我們很高興能探索 Amazon Kendra 聯繫上下文的智能搜索和任務自動化的結合,讓我們可提供強大的員工體驗。”

英國廣播公司是廣播業的世界領導者之一。他們把BBC的影像和聲音帶到世界各地。“作爲一家全球性媒體機構,我們管理數 PB 的視頻,每天24小時做直播,”BBC 首席技術和產品官 Matthew Postgate 說。“Amazon CodeGuru 以及我們的團隊使用的其它開發工具,有助於確保我們不斷爲受衆提供強大、可靠的服務,在問題出現之前發現問題。它還將幫助我們深入瞭解我們的服務如何與 AWS 平臺交互,使團隊能夠重構和優化其代碼,爲人們提供他們期望從 BBC 獲得的服務。”

Apptio SaaS 解決方案可幫助機構在分析、規劃和優化投資時做出明智的決策,轉變IT運營模式。Apptio 首席產品官 Scott Chancellor 表示:“爲客戶提供高度可用的無 Bug 服務對於我們的成功至關重要。我們一直在尋找工具變革我們的組織,更主動地檢測應用開發週期各個階段的問題,提高開發速度,少花時間在解決併發、資源泄漏和性能瓶頸等疑難問題上。我們嘗試了 Amazon CodeGuru,發現它可以提供在開發的早期階段主動解決這些問題的建議。此外,它可以指出降低服務速度的代碼區域,我們可以少花時間解決性能相關的缺陷。這些改進將幫助我們爲所有客戶提供更好的體驗。”

SmugMug+Flickr 是世界上最具影響力的、以攝影師爲中心的平臺之一。“Smugmug & Flickr專爲專業攝影師和攝影愛好者打造,展示他們的作品,也供他們欣賞他人作品。從第一天起,SmugMug 的激情就是,不斷想辦法讓攝影師講述他們想講述的故事,以他們想要的方式講述故事。當我們大規模運營時,圖像處理、分類和搜索的性能成爲重中之重,”SmugMug&Flickr首席執行官兼首席極客Don MacAskill 說。“Amazon CodeGuru 的實時分析有助於排除故障,識別我們服務的低效部分,尤其是應用程序中有價值的代碼行會減慢它們的速度。它提出建議、協助我們更改和優化。根據 CodeGuru 的建議,我們能夠重新構建代碼,使其高度可維護,提高我們的服務性能。”

Charles Schwab是一家先進的投資服務公司。“線上檢測欺詐活動是一項永無止境的挑戰,不良行爲人不斷製造着新的攻擊媒介。我們的使命是走在壞人的前面,保護我們的客戶,”Charles Schwab欺詐監控與調查副總裁 Kara H. Suro 說:“我們對Amazon Fraud Detector的推出感到興奮。這讓我們可以更快、更輕鬆地構建機器學習工具,發現欺詐活動;我們預計欺詐預防率會顯著提高。部署Amazon Fraud Detector,將有助於從我們的歷史數據中識別欺詐模式,也可以利用亞馬遜檢測欺詐的經驗。”

Vacasa是北美最大的全方位服務度假租賃管理公司,在17個國家/地區擁有超過23000家度假屋,每年爲超過200萬客人提供服務。Vacasa 創始人兼首席執行官 Eric Breon 表示:“自公司成立以來,我們利用技術使當地團隊能夠專注於照顧家庭和客人,同時爲度假房主實現收入最大化。我們對Amazon Fraud Detector的發佈感到興奮,這意味着我們可以更輕鬆地使用先進的機器學習技術,準確檢測欺詐性預訂。保護我們的‘門戶’免受潛在傷害,使我們能夠專注於使度假租賃體驗無縫、無憂。”

Cerner是衛生信息技術解決方案、服務和設備的領先提供商之一。Cerner公司解決方案策略師Jacob Geers 說:“臨牀文檔的精確性對於工作流程和總體的護理人員滿意度至關重要。通過利用 Amazon Transcribe Medical的轉錄API,Cerner正在初步開發數字語音抄寫器,自動收聽醫生與患者的互動,毫不顯眼地以文本形式捕獲對話。然後,我們的解決方案能夠智能地翻譯概念,進入Cerner病歷系統中的編纂組件。”

Suki 是一款 AI驅動、支持語音的數字助理,可減輕醫生的事務負擔。Suki AI公司首席執行官 Punit Soni 說:“臨牀文檔事關醫療數據工作流程,幫助臨牀醫生更有效地採集筆記是關鍵。我們可以輕鬆地將我們的臨牀數字助理與Amazon Transcribe Medical集成,允許醫生口述醫療筆記,將臨牀文檔的精力消耗平均降低76%。他們的時間應該花在照顧病人上,而不是做數據輸入工作。”

作爲美國的Un-carrier (去運營商化的運營商),T-Mobile美國公司通過領先的產品和服務創新,正在重新定義消費者和企業購買無線服務的方式。“在T-Mobile,我們以客戶的幸福來衡量成功。作爲Un-carrier,我們知道,當客戶覺得我們瞭解並預測到他們的需求、直接解決他們的痛點時,他們會感到最幸福,”T-Mobile執行副總裁、首席信息Cody Sanford說。“我們的專家團隊客戶服務模式致力於建立個人聯繫,並使用 A2I 等尖端工具爲我們的團隊取得成功做好準備。是的,機器學習帶來更深入、更投入的關係!訪問實時的上下文信息,例如如客戶詳細信息和可用折扣,使我們的團隊能夠在與客戶進行真實、實時的對話時,代表客戶做出現場決策……完全雙贏!”

VidMob 是一個營銷創意平臺,可爲品牌的所有創意需求提供端到端技術解決方案。其集成平臺將同類首創(first-of-a-kind)的創意分析與一流的創意製作相結合,提高營銷效率。“Vidmob 利用機器學習來分析視頻的各個方面,包括人物、對象和信息,幫助品牌瞭解創意績效,構建更好的創意。然而,對於現有機器學習模型未涵蓋的維度,要從我們每天分析的 PB 級數據中回顧創意,很有挑戰性,”VidMob 數據和見解高級副總裁Joline McGoldrick說。“憑藉我們目前訓練有素的創意評估隊伍,使用 A2I,我們可以更快地優化、微調我們的預測模型。這種效率使我們接觸到大量審覈人員,將模型上市速度提高了3倍。”