賴推人工智慧島 卓內閣首場院會「臺版ChatGPT」秀臺語

行政院長卓榮泰今天主持上任首場行政院會,國家實驗研究院科技政策研究與資訊中心副主任徐玉梅在會後記者會說明「生成式AI對話引擎TAIDE成果」。記者侯俐安/攝影

行政院長卓榮泰今天主持上任首場行政院會,就由國家科學及技術委員會今天進行「生成式AI對話引擎TAIDE成果」報告,有「臺版ChatGPT」之稱的TAIDE,加入臺灣特色與文化後更符合臺灣運用,國發會現場秀出TAIDE回答「規畫臺中一日遊」、「臺灣第一位民選總統」,內容精準度都勝過ChatGPT,還現場大秀臺語。

不過對於原民臺記者現場提問,TAIDE是否也能講原住民族語?國家實驗研究院科技政策研究與資訊中心副主任徐玉梅坦言,目前在發展臺語、客語,但發展語言需要大量資料,原住民語在蒐集上還比較困難,後續將與原民會密切溝通。

徐玉梅報告「生成式AI對話引擎TAIDE成果」指出,過去一年多來,各類生成式人工智慧(AI)應用服務紛紛出現,並帶來廣泛且巨大的影響有愈來愈多行業開始運用生成式AI進行各種創新。

徐玉梅表示,鑑於國際大語言模型訓練資料以英文爲主,且中文部分以簡體內容爲大宗,時有與臺灣文化、價值觀不符的迴應內容。爲保護在地文化、確保我國「數位主權」,國科會自去年4月推動發展具臺灣特色、繁體中文的TAIDE模型,以促進生成式AI應用普及、帶動相關產業發展,並提升國際競爭力。

徐玉梅表示,「生成式AI對話引擎TAIDE」是臺灣重要的AI基礎設施,第一階段以Meta開源模型Llama 2爲基礎,透過搜整繁體中文及在地文本訓練資料來開發預訓練模型,今年4月15日正式開源釋出可商用版TAIDE LX-7B模型。

至於學研版TAIDE LX-13B模型,徐玉梅表示,可以透過申請授權簽署合作備忘錄(MOU)取得,兩項模型在寫文章、寫信、摘要、英翻中、中翻英等五大任務表現優異,已可與ChatGPT 3.5相當,並具備多輪對話及阻絕產生不恰當迴應之能力。

另一方面,因應Meta最新對外釋出的新一代大型語言模型Llama 3,TAIDE開發團隊另於4月29日對外釋出「升級版」Llama 3-TAIDE-LX-8B-Chat-Alpha1模型,快速回應外界期待。

徐玉梅表示,TAIDE團隊亦與產學研夥伴發展多元應用,將TAIDE模型應用在農業知識檢索系統「神農TAIDE」、中小學生臺語教學等共7個領域。

國科會表示,將持續關注國際生成式AI進展並及時導入新技術,促使TAIDE模型與時俱進,成爲臺灣指標性的基礎模型。並將協助推動TAIDE模型導入公、私領域創新應用,使我國在生成式AI領域持續保有競爭力,落實賴總統全力推動臺灣成爲「人工智慧之島」的政策願景。