立法院第11屆第5會期教育及文化委員會第8次全體委員會議紀錄
時 間 中華民國115年4月29日(星期三)9時1分至12時53分
地 點 本院群賢樓101會議室
主 席 伍麗華Saidhai Tahovecahe委員
議 程 報告事項
一、宣讀上次會議議事錄。
二、中央研究院、國家科學及技術委員會、數位發展部就「AI主權時代:學門建構與應用、研究應用倫理及數位透明度之配套措施」進行專題報告,並備質詢。
答詢官員 中央研究院副院長彭信坤
中央研究院資訊科學研究所所長廖弘源
中央研究院資訊科學研究所副研究員黃瀚萱
中央研究院民族學研究所副所長丁仁傑
國家科學及技術委員會副主任委員陳炳宇
國家科學及技術委員會綜合規劃處副處長賴瀅宇
國家科學及技術委員會人文及社會科學研究發展處處長黃俊儒
國家科學及技術委員會前瞻及應用科技處副處長何紀芳
財團法人國家實驗研究院國家高速網路與計算中心副主任姚志民
數位發展部政務次長侯宜秀
數位發展部數位創新司司長莊明芬
數位發展部數位產業署副組長巫建恒
數位發展部資通安全署副署長鄭瑋
主席:報告委員會,出席委員12人,已足法定人數,現在開會。
本次會議是週三、週四一次會。首先進行報告事項,請議事人員宣讀上次會議議事錄。
立法院第11屆第5會期教育及文化委員會第7次全體委員會議議事錄
時 間:中華民國115年4月22日(星期三)上午9時至12時25分
地 點:本院群賢樓101會議室
出席委員:陳培瑜 蔡春綢 柯志恩 羅智強 謝龍介 陳秀寳 葛如鈞 郭昱晴 林宜瑾 葉元之 吳思瑤 吳沛憶 伍麗華Saidhai.Tahovecahe 羅廷瑋
委員出席14人
列席委員:許宇甄 鄭天財Sra Kacaw 鍾佳濱 洪孟楷 楊瓊瓔 何欣純 林倩綺 蘇清泉 盧縣一 林楚茵 蔡易餘 徐欣瑩
委員列席12人
列席人員: |
核能安全委員會主任委員 |
陳明真率同有關人員 |
|
交通部中央氣象署副署長 |
洪景山 |
|
衛生福利部食品藥物管理署組長 |
許朝凱 |
|
農業部漁業署副署長 |
繆自昌 |
|
海洋委員會科技文教處處長 |
林麗英 |
|
行政院人事行政總處組編人力處專門委員 |
廖鎮文 |
|
法務部參事 |
汪南均 |
主 席:羅召集委員廷瑋
主任秘書:陳杏枝
專門委員:白智榮
紀 錄:簡任秘書 盧焜鑫 簡任編審 蔡淑珍 科長 楊永綨
薦任科員 古建廷
報 告 事 項
一、宣讀上次會議議事錄。
決定:議事錄確定。
二、核能安全委員會主任委員陳明真列席就「我國海域放射性物質監測執行現況及未來因應作為」進行專題報告,並備質詢。
決定:報告及詢答完畢。
討 論 事 項
審查
(一)委員萬美玲等19人擬具「原子能法部分條文修正草案」案。
(二)委員葉元之等19人擬具「原子能法部分條文修正草案」案。
(三)委員羅廷瑋等19人擬具「原子能法部分條文修正草案」案。
(僅進行詢答)
(本次會議有委員陳培瑜、蔡春綢、柯志恩、羅智強、謝龍介、郭昱晴、陳秀寳、林宜瑾、葛如鈞、葉元之、吳思瑤、吳沛憶、伍麗華Saidhai.Tahovecahe、羅廷瑋、洪孟楷等15人提出質詢,均經核能安全委員會主任委員陳明真、行政院人事行政總處組編人力處專門委員廖鎮文及相關人員即席答復說明。)
決議:
一、報告及詢答完畢。
二、委員所提書面質詢或相關資料,列入紀錄並刊登公報。
三、對於委員質詢要求提供相關資料或未及答復部分,請相關機關儘速以書面答復。
四、「原子能法」相關修正草案,另定期繼續審查。
散會
主席:目前在場委員不足3人,議事錄稍後再行確定。
本日會議議程是邀請中央研究院、國家科學及技術委員會、數位發展部就「AI主權時代:學門建構與應用、研究應用倫理及數位透明度之配套措施」進行專題報告,並備質詢。
首先介紹與會官員,今天邀請的有3個機關,機關代表分別有中央研究院副院長彭信坤副院長及中央研究院秘書長陳君厚秘書長;第二個要介紹的機關代表是國科會副主任委員陳炳宇副主委、主任秘書林廣宏主秘;第三個要介紹的機關代表是數發部政務次長侯宜秀次長。其餘列席的機關代表請參閱名單,不再逐一介紹,列入公報紀錄。
立法院第11屆第5會期教育及文化委員會第8次全體委員會議 |
||
單 |
職稱 |
姓名 |
中央研究院 |
副院長 |
彭信坤 |
中央研究院 |
秘書長 |
陳君厚 |
中央研究院 |
副秘書長 |
林怡君 |
資訊科學研究所 |
所長 |
廖弘源 |
資訊科學研究所 |
副研究員 |
黃瀚萱 |
資訊科技創新研究中心 |
研究員 |
曹昱 |
民族學研究所 |
副所長 |
丁仁傑 |
語言學研究所 |
所長 |
林若望 |
法律學研究所 |
代所長 |
李建良 |
數位文化中心 |
召集人 |
陳熙遠 |
學術及儀器事務處 |
處長 |
周崇光 |
資訊服務處 |
處長 |
陳伶志 |
智財技轉處 |
處長 |
邱文聰 |
國家科學及技術委員會 |
副主任委員 |
陳炳宇 |
國家科學及技術委員會 |
主任秘書 |
林廣宏 |
綜合規劃處 |
副處長 |
賴瀅宇 |
自然科學及永續研究發展處 |
副處長 |
陳小玲 |
工程技術研究發展處 |
處長 |
洪樂文 |
生命科學研究發展處 |
副處長 |
涂君怡 |
人文及社會科學研究發展處 |
處長 |
黃俊儒 |
科教發展及國際合作處 |
副處長 |
龔繼康 |
前瞻及應用科技處 |
副處長 |
何紀芳 |
產學及園區業務處 |
副處長 |
吳醒非 |
資 |
處長 |
周子元 |
法規會 |
執行秘書 |
張益榮 |
南部科學園區管理局 |
副局長 |
林秀貞 |
行政法人國家太空中心 |
副主任 |
朱崇惠 |
財團法人國家實驗研究院 |
主任秘書 |
邱佳松 |
數位發展部 |
政務次長 |
侯宜秀 |
資料創新司 |
司長 |
莊明芬 |
數位策略司 |
司長 |
蔡壽洤 |
數位政府司 |
高級分析師 |
官長治 |
數位產業署 |
副組長 |
巫建恒 |
資 |
副署長 |
鄭瑋 |
主
席:現在進行報告,因為今天有3個機關要報告,所以每一位機關代表報告時間是5分鐘。
首先邀請中央研究院彭信坤副院長報告,時間5分鐘。
彭副院長信坤:召委、各位委員、各位同仁,大家早。承邀來委員會報告,今天就「AI主權時代:學門建構與應用、研究應用倫理及數位透明度之配套措施」向大院報告。我今天報告架構分成學門建構與應用及主權AI、AI應用於學術研究之倫理議題、數位透明度之配套措施等三項來報告。
首先,我們在2年前就已經成立了AI辦公室,匯聚院內所有相關的學者專家成立了AI辦公室,支援行政單位智慧化作業、推動AI知能培力教育,以及成立生成式AI風險研究小組,特別是在研發AI在人文與科學研究方面的創新應用,我們今年編列了1.2億來提升算力、精進設備、建置資料庫及培育本土AI相關人才做訓練。
主權AI主要有四大要素:基礎設施,主要是發展適合臺灣應用的小而美模型;在資料方面,我們必須應用中研院現有資料庫來做訓練,以及保護我們本身的資料庫;另外,我們要培育跨領域的人才。在這一方面,我要特別提到的是,我們在座資訊所廖所長所研發出來的多模態視覺模型,它的YOLOv7及YOLOv9應用在很多場域,這些場域的基本模型可以擴展到不同議題及應用。從動物模型到老鼠模型,它最近應用在阿茲海默症的行為模式。
其次,我要報告的是AI應用於學術研究之倫理議題,這分成兩個面向:首先是研究倫理的問題,我們必須要保護研究對象,尤其現在AI可以替代線上訪談問卷,但是我們必須要考慮到可能有些族群會受到影響,所以我們必須要依據人體研究法、個人資料保護法、IRB等進行規範;至於學術倫理方面,我們必須本於學術誠信的原則,誠實揭露哪些部分是AI生成、哪些是用AI改寫。
針對生成式AI,我們中研院在半年前訂定了AI三大指引:首先,我們必須要確保AI生成資料的正確性,因AI產出的東西不是完全都正確,所以研究人員必須要確保這個結果是正確的;第二,我們必須要維護個人隱私與安全,有些資料不能公開,機密性資料也不能提供給AI來做生成及訓練;另外,我們必須要考慮可課責性,也必須本於學術誠信原則,對你所撰寫的文章,不管有沒有用AI改寫,必須要負最後完全的責任。所以我們並不是全部都可以使用,有些部分我們還是禁止使用,比如學術審查報告、人事聘審相關資料,這部分暫時不可使用。至於其他部分,我們就鼓勵研究人員使用,但必須要本於誠實揭露的原則,對AI生成的資料必須要公開揭露。
在數位透明度之配套措施方面,我們要考慮到著作權的保護、語音資料庫的正確性,以及本土資料的精確性,避免我們的資料庫被別人使用及詮釋。
最後,主權AI的核心在於能夠技術自主,而且能夠兼顧安全與法治,能夠維護我們文化的主體性。以上精簡報告,詳細請參閱我們的書面報告。敬請指教,謝謝。
主席:謝謝中央研究院的報告。
接下來有請國家科學及技術委員會陳炳宇副主委報告,時間5分鐘。
陳副主任委員炳宇:主席、各位委員先進,大家好。感謝各位委員對於國家科技發展的重視與支持,安排本會就「AI主權時代:學門建構與應用、研究應用倫理及數位透明度之配套措施」進行專題報告。因應AI的快速演進,本會積極整合算力基礎建設、推動法制治理,並促進科研領域的AI應用。以下謹就本會目前的推動重點與措施進行報告,敬請各位委員惠予指教。
大院三讀通過的人工智慧基本法已經於今年1月14日經總統公告施行,本會作為法規主管機關,正積極協調各部會盤點法規,並與數發部等機關合作推動風險分類以及資料治理機制。在AI算力方面,本會正分年積極擴充算力,113年建置的0.8 MW,大約是16 PetaFLOPS的主機,已經在去年6月開放,目前使用率超過八成。緊接著建置的4.3 MW,大概是100 PetaFLOPS的主機,預計在今年年中會正式對外開放。目標是在118年將算力規模提升至23 MW,同時為提供安全跟高效便利的算力服務,我們建置了AI雲端開發平台(Taiwan AI RAP),目前已經有超過100個單位參加使用。
在科研發展及應用方面,本會鼓勵科研人員運用我們搭建的算力平台,並將AI技術融入各項科研領域。在工程領域:引領學界投入下世代新興晶片設計,以及研發高運算力、高節能的晶片系統創新架構;在自然科學領域:學研團隊已將AI應用於新材料開發、演算法優化以及災害監測等面向;在生命科學領域:本會結合國網中心資源,推動專屬的生醫雲端服務平台,厚植AI在生醫、農業領域的競爭力與研究效能;在人文社會領域:本會以專案計畫協助學者掌握多模態大型語言模型等關鍵技術,讓AI成為數位人文、法律判決預測、經濟風險控管等研究的強大助力。
隨著AI工具的普及,學術自律是本會高度重視的環節,本會要求研究人員在使用非自行記錄的資料時,應註明出處,秉持誠信負責的態度從事研究工作。在專題研究計畫審查作業,為保護研究人員創新與機密性,本會已嚴格要求審查人員不得將申請書內容輸入或提供給生成式AI工具。
總結來說,本會將以完善的算力建設為基礎,結合法制治理與學術推展,逐步形塑我國AI發展的整體布局。本會將在促進創新與應用的同時,兼顧風險管理,推動臺灣在全球AI主權時代的穩健前行。以上報告,謝謝大家。
主席:謝謝國科會的報告,請回座。
接下來有請數發部侯宜秀政務次長報告,時間5分鐘。
侯次長宜秀:主席、各位委員,大家好。今天應邀就「AI主權時代:學門建構與應用、研究應用倫理及數位透明度之配套措施」提出報告,謹就數位發展部推動的重點,向各位委員說明如下,還請各位委員不吝賜教。
面對人工智慧快速發展與國際對AI主權議題的重視,本部以「完善治理、強化基礎、促進產業發展」為推動主軸,從制度、資料、人才、產業四個面向,持續建構我國AI發展環境。
第一、完善AI治理機制:我國人工智慧基本法已在115年1月14日由總統公布生效,確立AI治理法制的基礎,本部負責推動的「人工智慧風險分類框架」,目的在協助各目的事業主管機關,依其業管特性與實際需求,辨識AI應用之風險,據以評估既有行政措施及管理規範是否足以避免或緩解風險,相關草案已呈報行政院審議中。
第二、強化資料與人才基礎:在資料面方面,為了促進資料流通與AI應用,本部提出「促進資料創新利用發展條例」草案,推動資料開放與公私資料共享機制,並將導入標準授權條款,降低資料使用門檻。同時,本部也在去年開始建置臺灣主權訓練語料庫,並與經濟部共同推出「臺灣主權AI訓練語料授權條款」,建立明確的授權機制,整合正體中文語料。截至目前為止,已經有超過200個政府機關參與,累積的資料量超過12億tokens。
人才方面:在公務人才部分,本部與人事行政總處共同成立「AI公務人才發展辦公室」,推動人才標準與訓練制度,並訂定「AI公務人才認定指引」,以協助各機關建立分級培訓及選才機制,強化政府整體AI應用能力,預計在115年年底正式發布;在產業人才部分,我們也發布了「AI產業人才認定指引」,建立共通職能標準,提出應用、開發、研究三種AI人才與五種AI能力類型,協助企業辨識及引導所需AI人才能力的養成,並已納入公務人員AI培訓參考。目前在這個人才指引底下,已經集結了24個生態系夥伴,包括21家培訓認證機構、3家人才媒合平台,後續也將持續擴大生態系夥伴,彙整相關認證及課程資訊供各界參考。
最後在促進AI產業與生態發展部分,數發部以五大政策工具,包括算力、資料、人才、行銷以及資金這五大政策工具進行推動。在算力方面,本部建置AI算力池供業者申請使用,協助新創進行模型訓練與技術開發,於115年3月將AI算力設施列入促參重大工程建設範圍,並在4月啟動首宗指標型數位建設促參案的政策公告,引進民間資金與創新技術,希望能共創政府與民間雙贏;在行銷的部分,為了促進AI跨產業應用與合作,數發部透過辦理AI Demo Day,促進產官學研對接,113年到114年已經吸引370家企業參與,累計的簽約金額達1,284萬元。115年將以「產域導向、產業聚焦、區域串聯」為策略,規劃辦理12場AI Demo Day,推動AI技術於多元場域導入驗證與應用;在資金方面,我們也推動「加強投資AI新創實施方案」,由國發基金匡列100億元、為期10年,受理投資申請,強化AI新創與數位經濟產業發展動能。
數發部將持續關注AI主權國際趨勢,積極擴展語料庫供AI訓練應用,以支持推動我國主權AI的運用。已經公告的「徵求民間自行規劃申請參與AI算力中心BOO案」,不僅是我國首宗指標型數位建設促參案,更是象徵政府與民間攜手建構完善國家算力基礎設施的重大政策。
以上報告,敬請指教,謝謝。
主席:謝謝數發部侯次長的報告。
機關代表報告完畢,相關書面資料請各位參閱並列入公報紀錄。
中央研究院書面資料:
AI主權時代:學門建構與應用、研究應用倫理及數位透明度之配套措施
(專題報告)
主席、各位委員女士、先生:
今日 大院第11屆第5會期教育及文化委員會召開全體委員會議,本院承邀列席報告,謹就「AI主權時代:學門建構與應用、研究應用倫理及數位透明度之配套措施」進行專題報告。
隨著全球人工智慧(AI)技術的爆炸性成長,臺灣正面臨維護科技自主與文化主權的關鍵時刻,本院亦積極投入「主權AI」的建構,並致力在學術研究倫理與數位透明度上,持續研擬並落實適切的規範與配套指引。
以下將從「學門建構與應用及主權AI」、「AI應用於學術研究之倫理議題」及「數位透明度之配套措施」三個面向進行報告與說明。敬請各位委員指教:
壹、學門建構與應用及主權AI:
為落實學門建構與應用,本院已成立「AI推動辦公室」,匯聚院內各領域專業人才,全面推動院內智慧化工作與尖端研究,其具體工作包括支援院內各行政單位的智慧化作業、推動AI知能培力教育、提供「AI合作社」諮詢服務、執行「研發AI在人文與科學研究的創新應用」計畫,並持續推動「中央研究院生成式AI風險研究小組」針對最新議題的深入討論。以本院推動「研發AI在人文與科學研究的創新應用」計畫為例,支援跨域合作及高運算需求,115年度預算已編列1.2億元。該計畫補助多項前瞻性的研究,例如運用人工智慧解鎖歷史文本,將多版式中文期刊、多語種手寫古文書與日文戶口調查簿進行全文數位化。這些豐富的數位化學術資源,日後不僅推動人文學科的數位轉型,更可作為充實臺灣主權AI發展時必備的正確訓練語料。
主權AI涵蓋基礎設施、資料、人才與商業網絡四大要素,並須配合監管與倫理框架,我國尤應在能源受限下,發展節能運算或小資料模型。在AI主權時代,臺灣所需要的不只是可用的語言模型,更是能夠理解臺灣場景、支援臺灣產業、吻合臺灣價值,並由臺灣自主掌握的基礎模型能力。過去幾年,本院參與TAIDE(Trustworthy AI Dialogue Engine,可信任生成式AI對話引擎)計畫的發展,正是希望為臺灣建立這樣的基礎,從語言模型進一步延伸到多模態視覺與影片大型模型,形成可支援多元研究與產業應用的共通AI底座。
我們特別重視多模態大型語言模型的發展,因為大量真實世界的資訊並不只存在於文字,而是存在於影像、影片、時序事件與行為互動之中。若臺灣能建立具備一般行為分析能力的多模態基礎模型,便可進一步支援智慧製造、智慧醫療、交通監測、公共安全、長照照護、運動分析、教育科技、社會科學研究與數位人文等多種應用場域。這樣的模型不必為單一任務而生,而是作為可泛化、可轉用、可持續微調的基礎能力平台,讓各產業與研究領域能在其上快速發展終端應用。基礎模型的定義是:具有可延展性、必須是開源碼,最好是能成為由臺灣自行開發、並且是在世界領先群的技術。具有類似條件,由臺灣自行開發的影像技術有YoLov7, YoLov9,及新近開發的Taiwan GBA(Taiwan general behavior analyzer)。透過這些多模態基礎模型的整合,很多實用的下游應用系統,例如居家周圍的安控系統,醫療體系的病人照護系統,以及長者的居家照護系統,都能輕易的發展並組合起來。
因此,我們認為,AI主權的核心不只是模型自主,更是建立屬於臺灣的資料、模型、評測、倫理與應用生態系。以多模態視覺/影音大型語言模型為核心的發展方向,能使臺灣在面對未來AI競爭時,不僅擁有技術能力,也擁有理解自身環境、支撐自身產業與服務自身社會的能力。這正是主權AI作為臺灣AI應用基礎模型的重要意義。
貳、AI應用於學術研究之倫理議題:
AI本身並非問題,關鍵在於人類如何選擇與運用該技術,「主權AI」強調國家對AI基礎設施、資料與關鍵技術的掌握,同時包含AI應用契合本國需求與符合本國規範要求的確保。因此,建立完善的AI管制框架與倫理規範,也是一國AI主權的展現,而確立AI應用於學術研究之倫理準則及行為規範,更是實踐主權AI不可或缺的一環。
人類進入全面受AI影響的社會,AI成為學術研究的課題,同時也以各種方式被應用在各學科領域中,並且多方面地改變了學術研究的過程與產出。AI對於學術發展的無窮機會與潛在風險,需要分析與評估,特別是可以生成文字與圖像的生成式AI。
AI應用於學術研究的倫理問題主要有兩個面向,均有待處理與規範:
一、研究倫理:重點在保護研究對象,例如Chatbot可以作為線上訪談、問卷等質性研究的工具,但可能會影響到研究對象的資訊隱私或自主性,特別是研究對象如果是易受傷害族群。
二、學術倫理:重點是維護研究誠信。例如AI可以用來收集、彙整研究資料、分析問題、編輯文字、生成文本、潤稿或校稿、轉換語言等等,但同時也可能發生研究人員以譯代稿、以生成文本代替研究著作、虛構註解或參考文獻等學術倫理問題。
本院除了在「中央研究院研究人員及研究技術人員倫理規約」中明定本院人員進行研究工作時,不得有研究舞弊、造假、學術論著抄襲或其他違反各專業領域研究倫理規範之行為外,特別發布「中央研究院使用生成式AI之參考指引」,協助研究人員在運用生成式AI時,做出正確判斷,實踐負責任的研究行為。該指引明確揭示三大核心準則:首先是「確保AI生成內容的正確性」,研究人員必須進行確實的人工檢核;其次為「維護個人隱私與資訊安全」,避免將未公開、機密或個人資料提供給生成式AI;最後是「實踐研究透明性與課責性」,若實質使用生成式AI,均應依照學術慣例予以揭露並正確註明,研究人員須對自身研究行為及成果負完全責任。並將其落實於研究管理流程中,包含於徵求說明文件中明確要求研究人員在撰寫與執行研究計畫時如有使用生成式AI之協助,均應對其正確與正當性負完全責任,以確保科研成果之誠信,該指引置於本院計畫申請系統中,供申請人於申請階段即可隨時下載閱覽。在此之外,本院「生成式AI風險研究小組」對於AI應用於學術研究的倫理問題及其對策,也進行了初步研究(見附件)。
針對運用AI從事學術研究及發表所生研究倫理與學術倫理問題,目前面臨的課題主要是,除了訂定「參考指引」等建議性的規範外,如何解釋及適用既有的相關倫理規範,例如在指引已要求落實揭露的基礎上,使用AI生成的文章是否應該揭露?內容大量使用AI生成的研究成果是否構成「抄襲」或「造假」?相關機關是否需要針對AI訂定新的行為規範,以供遵循?從學術自由及科學發展的角度來說,使用AI可以促進學術的發展與學術品質的精進,應該正面看待。至於使用AI對於學術研究所生的風險與問題,除了靠個別研究人員的自律外,需要由各學術社群針對學科特性逐步累積經驗,形成判準。總之,研究人員學術責任與研究誠信的強化,有賴學術界集思廣益、匯集共識,訂出兼顧學術自由與學術責任的倫理規範。
參、數位透明度之配套措施
因應AI主權時代,確保數位透明度與完善的治理配套措施至關重要。本院在此提出以下具體配套作為:
一、生成式AI風險治理對策:本院「生成式AI風險研究小組」已針對生成式AI可能帶來的風險,提出五大層面的治理對策與建言,包含:著作權等智慧財產權保護、個人資料保護與資料治理、技術風險治理與使用者保護、民主影響評估與公共領域風險治理,以及社會衝擊與環境影響之風險治理。
二、語料庫授權機制與資料透明度:充實具臺灣在地視角的主權AI語料庫是當務之急。本院正與國研院TAIDE計畫密切合作,盤點院內自主研究計畫之研究資料,研議透過「打包授權」或「共同授權」等機制,將優質研究資料導入大型語言模型訓練。同時建立資料使用紀錄與後續更新管理機制,確保訓練資料的透明度與合法性。
三、確保本土知識正確性與防範數位殖民:主權AI的核心在於確保本土知識的正確性。應著力於以專業領域知識建構的資料所發展出具備專業領域及文化特色的開源模型,開放提供給廣大的民眾使用及推廣商用。例如本院穩定推動「建構原住民族教育文化知識體系計畫」,將研究與典藏成果進行數位盤點並彙整為目錄。此外,透過數位博物館等平台開放平埔原住民族等多元典藏資料。這些多元且正確的在地研究資源,將是充實臺灣主權AI語料庫、維護文化主體性與數位透明度的重要防線。
肆、結語:
綜合上述說明,「主權AI」發端於人類思想,觀念與實踐仍在持續發展中。對於臺灣的意義在於我們必須能夠自主掌控並形塑數位資源及AI基礎設施,包括數位軟硬體、服務、技術及人才等,避免在關鍵層面上過度依賴外力,同時必須確保AI系統的安全性,完善資料保護的法律規範,維護人權保障與民主憲政的核心價值,並將文化自主性與創造力視為主權的重要內涵,在強化權利保護與提升科技競爭力之間持續尋求平衡。
以上報告,敬請
主席及各位委員、女士、先生指教,謝謝!
附件
AI研究應用倫理問題與對策
壹、AI與研究:問題面向
一、研究倫理:保護研究對象
‧訪談、民意調查、人體試驗……
問題:→以AI作為質性研究的工具:Chatbots、精準醫療技術……
二、學術倫理:維護研究誠信
‧收集資料、彙整資料、問題分析、議題設定、生成觀點、文字編輯、文本生成、文字校對、潤稿、語言轉換(翻譯)……
問題:→以譯代稿、以生成文本代稿、虛構註解、虛構參考文獻……
貳、倫理與規範
一、研究倫理:Set of Professional Values
‧人體研究法
‧人體研究計畫諮詢取得原住民族同意與約定商業利益及其應用辦法
‧個人資料保護法
‧人體生物資料庫管理條例
‧衛福部函釋
‧各IRB的現階段共識
‧…
二、學術倫理:Good Scientific Practice
中研院
‧中央研究院研究人員及研究技術人員倫理規約
第6條:「本院人員進行研究工作時,應以有效及安全之方式完成學術成果,遵守本院有關研究活動之規定,並不得有研究舞弊、造假、學術論著抄襲或其他違反各專業領域研究倫理規範之行為。」
‧中央研究院使用生成式AI之參考指引
國科會
‧國家科學及技術委員會學術倫理案件處理及審議要點
教育部
‧教育部專科以上學校學術倫理案件處理原則
各大學
‧國立成功大學(2025年1月)。國立成功大學生成式AI於教學研究的學術誠信指引。https://oai.web2.ncku.edu.tw/p/406-1072-215366,r154.php?Lang=zh-tw
‧國立陽明交通大學(2023年5月)。國立陽明交通大學生成式AI用於學術研究之參考指引。https://oaeri.nycu.edu.tw/userfiles/oaerich/files/20231006111309801.pdf
各學會
‧臺灣學術倫理教育學會(2023年2月23日)。人工智慧技術對學術倫理的影響及因應建議。https://www.taaee.org.tw/docs/20230223_conclusion_final.pdf
國際組織
‧Committee on Publication Ethics(COPE)Council.(2023, February 13).COPE position─Authorship and AI.
https://doi.org/10.24318/cCVRZBms
‧Empfehlung zur Sicherung der guten wissenschaftlichen Praxis beim Umgang mit Kunstlicher Intelligenz Beschlossen durch das Prasidium der Leibniz-Gemeinschaft am 29. November 2024. https://www.leibniz-gemeinschaft.de/fileadmin/documents/3085 -2906/Leibniz_Empfehlung_zur_KI_Beschluss_Praesidium_2024_11_29_.pdf
歐洲
‧ALLEA(2023):The European Code of Conduct for Research Integrity. https://www.alleageneralassembly.org/wp-content/uploads/2023/06/European-Code-of-ConductRevised-Edition-2023.pdf
德國
‧DFG(2023):Stellungnahme des Prasidiums der Deutschen Forschungsgemeinschaft(DFG)zum Einfluss generativer Modelle fur die Text- und Bilderstellung auf die Wissenschaften und das Forderhandeln der DFG. https://www.dfg.de/resource/blob/289674/ff57cf46c5ca109cb18533b21fba49bd/230921stellungnahme-praesidium-ki-ai-data.pdf
‧Hochschulforum Digitalisierung(2024):Leitlinien zum Umgang mit generativer KI.
https://hochschulforumdigitalisierung.de/wp-content/uploads/2024/02/HFD_Blickpunkt_KILeitlinien_final.pdf
奧地利
‧KI und wissenschaftliches Arbeiten und Schreiben.
https://studieren.univie.ac.at/umgang-mit-ki-im-studium/ki-und-wissenschaftliches-arbeiten-und-schreiben/
‧命題:
◆解釋現行規範?
◆訂定新的行為規範?
◆「其他違反學術倫理行為」作為概括條款?
參、思考與觀點:機會與風險
一、研究倫理
四原則:尊重自主原則、不傷害原則、行善原則、公平原則
二、學術倫理:lege artis
(一)思考層次
‧禁止使用?
Ex.學術審查
‧容許使用?使用AI≠違反學術倫理
◆揭露義務:是否使用?使用目的?使用程度(範圍)?
◆Authorship與「文責」:自然人?
◆學術評價:中立原則?違反學術倫理?
◆…
(二)權衡因素
‧學術品質與學術產量
‧學術自由與學術自律
‧…
三、研究倫理與學術倫理的共通課題:個資保護
國家科學及技術委員會書面資料:
「AI主權時代:學門建構與應用、研究應用倫理及數位透明度之配套措施」書面報告
一、前言
國科會(下稱本會)肩負推動國家科技發展與學術研究之核心職責,因應人工智慧快速演進,積極整合算力基礎建設、推動法制治理與促進跨領域應用,建構完善科研環境。透過強化AI基礎設施、促進公私協作及健全治理機制,支援學研發展並引導技術創新,兼顧社會公益與國家競爭力,奠定我國邁向智慧科技發展之穩固基礎。
二、構築AI基礎建設及法制環境支援學研
(一)完善AI算力支援科研
本會為強化AI科研基礎環境,採分年建置方式,積極擴充高效能AI超級電腦,以支援產官學研之科技研發,目標為118年累計可達23 MW。113年建置之0.8 MW,已於114年6月開放對外服務,平均使用率逾8成,接近滿載;114年再建置之4.3 MW,預定於今(115)年年中開放,將可大幅提升共用型算力資源。此外,為降低開發門檻,整合算力、開源模型與AI開發工具,建置高效便利之AI雲端開發平台(Taiwan AI RAP),協助加速生成式AI服務的發展及概念驗證,已有超過100個單位參與使用。
(二)建構AI法制、風險與資料治理
「人工智慧基本法」(下稱基本法)於今年1月14日經總統公告施行,其係原則性、綱領性之基本法,立法目的為確立我國推動AI發展之基本原則及政府推動方向。本會為基本法之法規主管機關,負責法規解釋及國家人工智慧戰略特別委員會之幕僚作業。
基本法明定數位發展部訂定風險分類框架,並協助各目的事業主管機關訂定管理規範,同時提供評估驗證工具以協助目的事業主管機關認定高風險應用。
另基本法亦明定應提升人工智慧可利用資料之品質與數量,並兼顧智慧財產權與個人資料保護,在完善資料治理機制下,促進人工智慧發展與應用,數位發展部將協助各目的事業主管機關,推動資料開放、共享與再利用之相關制度;本會亦將協同數位發展部及各目的事業主管機關,推動資料開放、共享與再利用之相關制度,促進人工智慧發展與應用。
三、推動AI研發與科研應用
(一)深化AI於科研領域之應用及發展
1.自然科學領域
AI技術已應用於自然科學各領域之研究,隨著技術之演進與成熟化,各學門應用之範圍與研究議題更為廣泛,例如於物理學涵蓋了理論物理的拓撲分析、生物物理的網絡研究及量子模擬;在化學領域,主要用於加速新材料的開發、催化劑設計及分子結構的優化;在數學方面則側重於 AI 模型本身的幾何結構分析、演算法優化及拓撲學的結合;在地球科學領域強調GeoAI在災害監測、資源管理及地質分析的應用。
2.工程技術領域
本會持續關注AI與各式前瞻應用的發展,推動高效能的晶片系統開發,引領學界團隊投入下世代所需新興晶片設計、前瞻元件與材料、化合物半導體元件、高運算力與高節能的晶片系統創新架構技術等關鍵技術研發,強化學術界所研發之矽基半導體晶片與系統的運算效能,結合2D/3D記憶體的整合設計與先進製程技術。在核心技術層面,持續深化例如影像處理與視訊處理、電腦圖學與人機互動、電腦視覺與圖形辨識,自然語言與語音處理等人工智慧相關基礎研究。
在跨域應用方面,將AI核心技術與傳統工程學門深度融合:例如與自動化、控制、機械固力等跨域合作推動智慧製造與數位孿生;發展智慧機器人所需自主感知、決策控制、導航及任務規劃;於材料化工領域透過AI驅動設計優化與研發效率提升;結合電力能源領域,發展預測模型、智慧電網調度等;在土木環工領域,結合AI可發展例如數據分析、自動化、風險預測及模型等環境永續相關應用。
3.生命科學領域
本會持續鼓勵科研人員依研究主題及技術發展實際需要,評估並適當運用AI技術,納入研發體系以提升研究效能與品質,以及更進一步鑽研開發AI創新輔助等相關工具,近年公共衛生、護理、放射核醫等學門投入與AI相關之研究計畫件數均逐年增長。
本會結合國網中心資源,推動並鼓勵使用「國家生醫數位資料與分析運算雲端服務平台」,提供生醫專屬高效能計算與巨量儲存資源,降低技術門檻並強化資料分析效率,以厚植AI於生醫農領域之應用能量與科研競爭力。
4.人文社會領域
本會推動「AI導入人文與社會科學領域研究之需求分析與可行方案之應用、示範及推廣」專案計畫,為人社學者建構友善的技術銜接橋樑,協助研究者掌握多模態大型語言模型(mLLM)、檢索增強生成(RAG)及AI代理人(AI Agents)等關鍵技術,使其能將先進工具轉化為研究能量,進而開創嶄新的數位人文研究模式,深化AI於各學門之應用深度與廣度。
目前AI導入人文與社會科學領域之研究,已超越單純的數位化工具定位,在學門應用多元。如人文藝術方面,運用AI深入分析不同語言或方言之語法結構,或藉由電腦視覺技術對古蹟文物進行精準辨識與虛擬修復,又或觸發關於AI生成藝術與人類創作關係的深度哲學思辨;社會科學領域應用則以AI追蹤假新聞的傳播路徑及開發法律判決預測模型等;在經濟與管理學門,預測模型已廣泛用於優化決策效率並強化風險控管。
(二)研究計畫管理與敦促學術誠信
AI技術為學術研究中多種工具之一,本會均持續關注最新動態並適時於多處場合宣導,研究人員應秉持誠信負責態度,儘可能客觀地蒐集與分析研究相關資料,使用非自行記錄或分析之資料時,應註明出處,避免誤導使人過度認定自己的創見或貢獻,並應以審慎且負責的態度使用AI,確保AI應用符合學術界普遍認可之研究行為自律規範。
對於科研人員運用AI工具協助研究工作一節,考量現行生成式AI多係以既有歷史資料為基礎進行內容生成,本會於計畫審查時,仍以研究主題之原創性與重要性為核心評估重點,並透過初審及複審機制,由專家學者進行專業學術審查,防範不當引用資料之情形。至於計畫審查作業,依本會審查獎勵及補助案件迴避及保密作業要點,不得對外洩漏審查資料,爰本會已要求審查人員不得將申請書內容輸入或提供予生成式AI。
本會訂有「學術倫理案件處理及審議要點」,已明文規範「抄襲」、「造假」等違反學倫之行為態樣,研究人員執行計畫時,若因不當使用AI衍生抄襲、造假等涉嫌違反學術倫理之情事,本會將依現有規範,啟動案件調查及審議。
四、結語
本會以完善算力建設為基礎,結合法制治理、學術推展與應用,逐步形塑我國AI發展之整體布局。未來將持續精進基礎設施、強化跨域整合與制度協調,並兼顧倫理與風險管理,促進創新與應用並進,提升科研能量與產業動能,推動我國在全球人工智慧發展中穩健前行。
數位發展部書面資料:
「AI主權時代:學門建構與應用、研究應用倫理及數位透明度之配套措施」專題報告
主席、各位委員:
今天應邀列席貴委員會,就數位發展部(下稱數發部)「AI主權時代:學門建構與應用、研究應用倫理及數位透明度之配套措施」提出專題報告,並就此向各位委員請益,還請各位委員不吝賜教。
為因應人工智慧(Artificial Intelligence,AI)迅速發展,以及國際間對AI主權之高度重視,數發部關注人工智慧創新發展,秉持兼衡風險管理、維護AI主權及隱私技術應用安全之原則,以「完善治理、強化基礎、促進產業發展」為推動主軸,積極建構AI治理制度、主權AI訓練語料庫,並從算力、資料、人才、行銷與資金等面向推動臺灣AI軟體產業發展。透過跨部會協作與公私協力機制,逐步建立可信任的AI發展環境,加速AI技術落地應用,帶動產業創新與數位經濟成長。以下就本部推動AI主權相關措施之執行情形說明:
一、AI治理
(一)AI風險治理架構
我國《人工智慧基本法》已於115年1月14日公布生效,確立AI治理法制基礎,數發部負責推動「人工智慧風險分類框架」,並採跨部會協作方式,由各目的事業主管機關依其業管特性與實際需求,循框架訂定以風險為基礎之管理規範。
(二)AI風險分類框架
「人工智慧風險分類」係以應用情境作為風險評估的核心錨點,引導各目的事業主管機關掌握所管領域AI應用之風險類型與影響程度,據以評估既有行政措施及管理規範是否足以避免或緩解風險,草案已陳報行政院研商中。
二、強化AI發展所需之資料與人才基礎環境
(一)推動「促進資料創新利用發展條例」立法
為促進資料開放與共享、支持AI發展,數發部於114年8月提出「促進資料創新利用發展條例」草案,建立資料開放、共享及再利用的法制基礎。草案規劃提升開放資料品質、推動政府與產業資料共享機制,並以標準授權條款與非專屬授權原則促進資料流通,降低AI研發利用門檻。同時建立資料治理制度,包括設置機關資料長及成立行政院資料創新利用諮詢會,透過基本計畫與執行計畫推動資料驅動創新生態,強化公私協力並加速主權AI發展。
(二)訂定《臺灣主權AI訓練語料授權條款》
為促進AI訓練資料的合法釋出與使用,數發部與經濟部共同推出《臺灣主權AI訓練語料授權條款》,建立明確授權機制,降低資料釋出與AI訓練可能產生的著作權風險與行政成本,加速主權AI發展。
(三)打造「臺灣主權AI訓練語料庫」
為強化AI模型在地化能力,數發部建置「臺灣主權AI訓練語料庫」,於114年12月24日上線,整合高品質正體中文語料,支援AI模型訓練更貼近臺灣語言、文化與生活情境。截至115年3月底,已經有逾200個政府機關參與,上架超過3,500筆資料集、累計逾12億tokens,內容涵蓋語言、文化、教育、生物與地理等領域,提供AI模型重要訓練素材,提升其對臺灣語境與社會情境的理解能力。數發部也將持續蒐集高品質的中文語料,供國內外AI模型開發者申請使用。
(四)成立「AI公務人才發展辦公室」
數發部與行政院人事行政總處於114年7月共同成立的「AI公務人才發展辦公室」,該辦公室為全國公務機關AI應用與人才培育的專責平台,本部負責應用發展組,辦理建立人才共通標準、提供各機關試煉資源及推動政府AI落地應用等業務。針對公務機關AI人才標準,本部對接AI產業人才認定指引制定「AI公務人才認定指引」,此指引定義AI公務人才規格、建立標準化訓練及認證制度、協助機關規劃分級訓練與選才,打造公私協力,可複製、具一致性的培育機制,預計115年底正式發布。
三、促進AI產業發展與生態系建構
(一)算力
1.為推動資服產業AI應用產品化,數發部建置AI算力池並提供業者申請使用,協助AI新創進行模型訓練與技術開發,截至114年底已經協助242家次(186家)業者開發266項AI模型與服務,其中80家業者成功將AI服務產品化。115年將持續擴充AI算力至140片GPU,預計協助逾300家次業者加速AI創新應用落地。
2.本部與財政部合作,於115年3月30日將AI算力設施列入促參重大公共建設範圍,並於115年4月啟動首宗指標型數位建設促參案之政策公告(截止日:115年5月14日)。期盼透過公私協力BOO模式,引進民間資金與創新技術,不僅為百工百業奠定AI產業升級的厚實基礎,更提供符合條件的投資者優渥的租稅優惠,共創政府與民間雙贏的新局。
(二)資料
AI發展高度仰賴大量高品質資料,為強化臺灣在主權AI上的基礎,數發部持續推動機關擴大政府資料開放,並針對政府機關擁有著作權之正體中文資料,優先輔導分階段釋出。同時,為持續擴大語料廣度及在地性,已辦理3場地方政府語料徵集說明會及研商會議,接續將辦理語料上架工作坊,輔導各地方語料上架,加速地方特色語料釋出。
(三)人才
數發部發布「AI產業人才認定指引」,建立共通職能標準,提出應用、開發與研究三種AI人才與五種AI能力類型,協助企業辨識及引導所需AI人才能力的養成,並且已經納入公務人員AI培訓參考。同時整合「需求端、訓練端、認證端」民間能量,建立AI人才生態系。目前已經集結24個生態系夥伴,包含21家培訓認證機構、3家人才媒合平台,後續也將持續擴大生態系夥伴,彙整相關認證及課程資訊供各界參考運用。
(四)行銷
為促進AI跨產業應用與合作,數發部推動跨產業AI交流與媒合機制,透過辦理AI Demo Day促進產官學研對接,113至114年已經吸引370家企業參與,累計簽約金額達1,284萬元。115年將以「場域導向、產業聚焦、區域串聯」為策略,規劃辦理12場AI Demo Day,並以健康照護為主軸,串聯智慧製造及智慧農畜牧等產業,推動AI技術於多元場域導入驗證與應用示範。
(五)資金
為促進AI新創與數位經濟產業發展,數發部推動「加強投資AI新創實施方案」,由國發基金匡列100億元、為期10年,並自114年3月起受理投資申請。截至115年3月底,已經遴選36家搭配投資人並核定投資6案,投資金額約7,556萬元,帶動民間投資約3億元。115年將持續擴大搭配投資人參與並推動投資案件審查,結合相關輔導政策,強化AI新創與數位經濟產業發展動能。
四、結語
數發部將持續關注AI主權國際趨勢變化,以資安、隱私與風險管控為基礎,積極推動多元語料徵集,加速地方特色語料之釋出,擴展語料庫範籌挹注AI訓練應用,以支持推動具我國觀點的AI主權應用。另,本部已於115年4月15日正式對外辦理政策公告「徵求民間自行規劃申請參與AI算力中心BOO案」,不僅是我國首宗指標型數位建設促參案,更象徵政府與民間攜手建構完善國家算力基礎設施之重大政策。
以上報告,敬請 指教。
並祝
各位委員身體健康,萬事如意。謝謝!
主席:由於議事錄之前已經宣讀完畢,尚未確定,現在先確定議事錄。請問各位委員,上次會議議事錄有無錯誤或遺漏?(無)好,議事錄確定。
現在開始進行詢答:每位出席委員質詢時間6分鐘,必要時延長2分鐘,列席委員質詢時間4分鐘,發言登記截止時間是上午10點30分;委員如果有臨時提案,請在10點30分之前提出,並於本會委員羅廷瑋召委質詢結束後即進行處理;處理提案時,若提案委員及連署委員均不在場,援例不予處理。
首先請登記第一位柯志恩委員進行詢答。
柯委員志恩:(9時20分)謝謝召委,我們先請數發部的侯次長好了。
主席:有請數發部侯次長。
柯委員志恩:次長好。非常感謝召委今天排定的AI主權時代所衍生非常多問題的議題,當然我們肯定AI基本法已經三讀通過,但是到現在,面對AI的時代,我們還是有很多細節需要來做討論。在進入主題之前,我先請問侯次長,目前高德地圖真的是鬧得沸沸揚揚,每個人都說它可能有資安的疑慮,但是地方政府卻認為目前並沒有個資外洩的問題。中央說有疑慮,地方說沒有資安的疑慮,次長,就你的觀點,到底是誰的認知有問題?
侯次長宜秀:首先跟委員說明,我們處理的原則是依據資通安全法第十一條的規定,就是公務機關不得下載、安裝或使用危害國家……
柯委員志恩:我知道,我的意思是,你們有做過這個評估……因為剛剛特別提到,高雄市交通局認為我們這些個資沒有外洩的問題,而且它純粹是用大數據的方式,其實這個政府不禁還好,一禁,它馬上就變成熱門下載app,上個禮拜還是第一名,這個禮拜變成第二名,所以顯然政府所謂的國安疑慮跟人民的使用是有一些落差的。我還特別來問,而且不要忘記你們上一次也特別發布的,去年數發部及國安局認定有高風險的五款中國製造app當中,像抖音幾乎就是排名第4名,微信、小紅書在社交類排名大概是第10名和第11名,我當然認為政府替人民把關是天經地義,但是你就應該檢視所有的app,所以到目前為止,你們認為高德地圖還是有資安的危險嗎?
侯次長宜秀:向委員報告,因為高德地圖是中國廠商的地圖,他會受到中國法律的拘束,在中國的法律底下,據我們所了解,關於他的情報法及網路安全法的規定,中國政府是可以隨時取用這些使用者的資料的。
柯委員志恩:我個人認為還是一句話,為了資安,你們可以做任何的事情,可是我覺得在發布這個消息之前,應該要有更審慎且一致的標準。如果你覺得這是有資安疑慮的話,但到目前為止,大家還是在用我剛剛所條列的不管是抖音或是小紅書等等,所以我才說這與民眾的認知有一些落差,而且就以大家感受最深刻的詐騙來說,以app來說,從數發部的網路詐騙通報查詢網內一個月詐騙平臺分布來看,那個是個資的問題,到底有沒有資安的問題,每個人見仁見智,但是這個部分裡面,人民受傷最多的、有關於詐騙的app的問題裡面,32萬則當中,Threads占了28.6%,Facebook占了24.8%,Instagram占了17.2%,這才是人民切身關切的。你們永遠都是在這裡告訴大家這些有國安疑慮,然後要禁、要禁、要禁,卻不去思考為什麼大家要用高德地圖,說實在我用了,我也不覺得有那麼好用,很多人看法就不一樣,但是我個人覺得app的標準應該要一致,像詐騙的部分,數發部目前為止束手無策啊!所以到底哪個軟體是我們人民在使用的時候最需要、最應該提高警覺的?數發部在這個層面上面也應該有更積極的作為嘛!
侯次長宜秀:是,跟委員報告,就app來說,還是必須看它所適用的準據法,因為中國的app有他原廠地國的法規,跟其他國家不一樣……
柯委員志恩:高德這部分,次長,我同意,只要有資安疑慮,你可以提出你的看法,但我現在是要告訴你,目前跟人民最相關的app當中,他們都是使用這些,其實這些部分的詐騙比率更高,在更高的狀況下,你會不會做出像高德一樣的警訊,告訴大家這些都是大家應該要注意的?我覺得這才是數發部的角色跟責任,我所要強調的是這一點,我並沒有說你們不應該完全不顧人民的資安問題,你要搞清楚我的重點好不好?所以關於這個部分,你應該更強調的去宣導,很多詐騙都是來自於這些,這些都需要大家共同去做。所以我才說不要有雙標,任何只要跟人民有關的,不管是跟資安或者是跟這個有關,都要做相同的提醒,不要顧此失彼。還有很重要的是,今天因為AI的倫理,時間的關係,你們特別建置了兩個很重要的任務,一個是建立AI風險分類框架與指引,沒錯吧?
侯次長宜秀:是。
柯委員志恩:另一個是推動AI模型評測機制。
侯次長宜秀:是。
柯委員志恩:關於AI風險分類框架與指引,我認為這是非常重要的,是重中之重,因為這涉及到各部會當中,這個法規是否充足以及風險管理的規範到哪裡。以目前來說,到選舉的時候,AI出來的東西簡直讓我們疲於奔命,我們看到有很多AI生成的扭曲訊息,即使AI基本法第五條已經明文規定,但它畢竟是一個基本大法,很多的細節並未規定,導致我們要承受很多AI生成之後造成資訊扭曲的部分,然後我們跟數發部檢舉,以Meta為例,你們最大的做法就是:好吧!那我們就通知Meta,然後把它下架。但如果這個分類的方法、框架一出來之後,就不用每次都由數發部來做處理,你們可以分門別類給不同的單位去做處理,沒錯吧?
侯次長宜秀:跟委員報告,其實目前就已經是由數發部統籌給各部會來處理。
柯委員志恩:好,你們預計這個要審查多久?
侯次長宜秀:我們現在已經把風險分類框架送到行政院了。
柯委員志恩:什麼時候可以下來?
侯次長宜秀:要看行政院那邊處理的狀況。
柯委員志恩:需要很快就下來,因為對我們來說,這樣我們才知道對等在什麼地方,包括我們用AI來做遠距醫療,我就可以直接去找衛福部,什麼事情要找什麼部會,所以你必須要在最快時間把它放出來,這樣我們才會知道,不然你們數發部真的會忙死啦!
侯次長宜秀:同意!跟委員報告,我們現在已經跟各個部會在進行協作中,也開了很多次的工作坊……
柯委員志恩:好,你們儘量趕快把這個管理規範訂出來,因為過去基本法只是個大框架,很多的細節、我們所遭遇的問題都來了。請回座。
關於遭遇的問題,我想請中研院彭副院長以及國科會陳副主委,因為這個很重要,這面臨到學術倫理的問題,這完全打破我們以前在教書……各位都教過書吧?
彭副院長信坤:對。
柯委員志恩:我們以前最重要的就是第二章文獻探討、reference,對不對?
彭副院長信坤:對。
柯委員志恩:當老師的、指導教授不是每天都要去看它到底跟我們之間的研究有什麼關係,現在這塊反而是老師最不曉得該怎麼辦的,為什麼?因為學生比我們更了解這個資訊,他把他全部的資料丟進去,AI把它生成連老師都沒有辦法出來的,以致在最後文獻參考資料的部分,以前我們只要把出自哪裡放出來就好,現在這麼多的整合,而且你們還要找到源頭,但是要從AI生成的資料當中找到源頭,必須要有一些技術跟方法,這叫我們怎麼辦呢?兩位學術單位,你們要怎麼辦?
彭副院長信坤:報告柯委員,中研院學術處已經有這個能力,而且我們已經在做這個動作,任何一個paper、任何一個計畫,我們都有辦法用AI去偵測到底是AI生成的,還是AI改寫的,甚至改寫了哪一部分,我們都可以mark起來,我們有在使用這個軟體。
柯委員志恩:我不想看到我們以前寫的paper,到最後被它生成之後,我看到這個,覺得看起來很像是我以前寫的,可是又好像不是,因為整合了很多。都會有這個狀況!然後以前你只要標注幾年幾月、什麼時候、在什麼地方出版,但現在光是後面的參考資料,我看都需要重新定義。中研院有這三個部分,但是我覺得目前為止還是……這都是在AI基本法之前你們就已經先做的。
彭副院長信坤:對。
柯委員志恩:國科會也是,但基本法公布之後,你們有沒有在參考指引上面做更細緻的分工、更細緻的分法?
陳副主任委員炳宇:跟委員報告,我們有根據生成式AI的進展,針對這些內容再做一些調整。
柯委員志恩:所以我們什麼時候可以在網站上看到?
陳副主任委員炳宇:我們應該是隨時調整完都會隨時公告在……
柯委員志恩:身為老師,我真的覺得馬上就會遭遇到這樣的問題,而且最重要的是,我也同意你們說未來只要用AI,它會有一些浮水印等等之類的,但是在學校裡面,不是每個人都可以像你們兩個單位做成這樣,所以你們這樣的技術是有辦法完全下放到所有的學術單位、任何公私立大學、168間所有的公私立大學都可以來做這樣的使用嗎?否則你會造成這些老師……
彭副院長信坤:我們中研院的部分是要購買、要有版權、要有中研院的IP才可以使用。
柯委員志恩:是,那學校怎麼辦呢?我們這些老師看學生報告的時候,以前看到學生寫出這樣的報告,我就會給他很高分,但現在看到學生寫報告寫得這麼完整,跟他平常的表現不一樣,我都要稍微質疑一下,這到底是用抄的還是他自己想的,這個就會造成我們很大的困擾,這部分怎麼辦?不能只有在你們中研院啊!包括國科會未來在審查的時候,包括五年創作的部分,都是我們審查的標準,你怎麼樣面對這個問題?
陳副主任委員炳宇:跟委員報告,這個還是要回到學術的本質上去做探究,我們的確會再透過很多的管道去讓老師們……
柯委員志恩:你就趕快拜託隔壁的中研院,他們要版權什麼的,你就拜託中研院,好不好?請他們把這個技術給你們,到最後我們要申請中研院的學術獎勵或是個人的專案獎勵的時候,搞不好大家都先用中研院的系統掃過一遍,告訴我們這個部分……當然原創性還是非常重要,對不對?
陳副主任委員炳宇:是。
柯委員志恩:但變成我馬上想到的第一個就是文獻探討的部分,以前大家覺得還要花很多時間,現在學生搞不好最後全部丟給AI生成,然後老師也搞不清楚,因為根本不知道,重點是對我們來說,一份寫這麼好的報告,以前都給他最高的肯定,現在第一個就馬上質疑到底是誰寫的,這才是我們現在面臨最大的問題!
彭副院長信坤:對我們來說,這部分不是問題,現在可以偵測到72%、68%。
柯委員志恩:好,既然你們已經有研發這個系統,就全部丟給老師。最重要的還是一句話,AI的臺灣模式到底是要像美國比較放寬、不要那麼多的限制,還是要像歐盟一樣?我們絕對要有臺灣的模式,趁最後時間告訴我們,你覺得在學術界來說,到底應該廣泛?還是在學術界當中,反而是像歐盟一樣,要給相當大的限制範圍?
陳副主任委員炳宇:因為AI基本法在制定的時候,就經過很多次討論,基本上,我們希望AI基本法能夠衡平比較創新跟風險控管的機制,但是在學術界,我們是更加鼓勵創新,希望大家能夠利用AI工具進展到其他的研究當中。
柯委員志恩:是,如果進入到更大的研究工具,就應該在一些文獻、歷史資料允許這樣的原則,透過一些科技方法幫我們把歷史資料做一系列的統整,統整完之後,基於這個部分,再去做額外的創新,這樣應該才是……當70%可以偵測出來的時候,到底是偵測出他是抄襲,還是資料完整,這個界定恐怕又是另一方面的問題了,對不對?
彭副院長信坤:分成兩塊,它有寫AI生成的部分以及AI改寫的部分,我手上就有資料,我過去半年已經用得很熟悉了。
柯委員志恩:好,還是一句話,副院長不要只有你們中研院在用,我們也需要,不管是改寫還是生成,要讓大學也能用,否則我剛剛所提到的問題還是會繼續發生。最重要的是到最後的參考書目當中,我真的認為應該有個準則,提供大家更好的方向,否則解決不了,好不好?感謝,謝謝。
主席:謝謝柯志恩委員的質詢。請機關代表回座。
接下來有請葛如鈞委員進行詢答。
葛委員如鈞:(9時33分)謝謝主席。有請國科會陳副主委、中研院彭副院長。
主席:請國科會、中研院。
葛委員如鈞:我先請教一下彭副院長,剛剛質詢你說可以檢查有沒有亂用AI生成內容,你們有一些軟體,是不是?這個部分可不可以延伸說明一下?
彭副院長信坤:中研院從去年開始有一個軟體可以產出AI偵測報告,每一個研究計畫有中研院的IP就可以丟進去,偵測出來就有兩欄,一是所謂AI生成的部分,另一是AI改寫的部分,百分比都可以很精準的秀出來。
葛委員如鈞:謝謝副院長,這個部分也就是本席擔心的,本席就是擔心我們要用軟體去檢查人類的成果。您剛剛提到的這一點,事前我的辦公室有跟中研院了解,有沒有使用軟體、有沒有採購軟體,得到的答案是沒有。結果您現在上來卻炫耀你們有使用軟體,為什麼?本席要在這裡提醒,要維繫AI倫理,重點不在檢測工具,而在教育,在店家裡面購買什麼樣的工具給客人,重點不在這些工具能不能傷人,而是他的用途是什麼、用意是什麼。放一把火可能會對帳篷造成危險,可是可以讓人類開始吃到熟食。你有沒有看過這則新聞?維繫校園安全,這個沒有問題,用檢查的方式、用AI來檢查人類,結果造成什麼?誤判!16歲的少年手上拿著Doritos,結果被說他手上拿著槍,於是員警一擁而上,這還不是什麼案例。副院長可能想這個是不一樣的AI,我就給副院長看一下,這是在美國學術界裡面廣泛流傳,而且已經被認定為錯誤判斷的案例,可以試試看把瑪麗‧雪萊寫的科學怪人第五章的開頭文字丟到你們的AI辨識軟體,大部分的AI辨識軟體都說這是AI寫的,請問瑪麗‧雪萊是AI嗎?
彭副院長信坤:我們不能完全相信AI,所以本於誠信原則還是要check它的準確性。
葛委員如鈞:很好。本來我上來是真的要鼓勵一下副院長,你說容許使用AI不等於違反學術倫理,我們就鼓勵。如果您過度強調AI偵測,以AI的軟體去監控或者審查,可能會有點本末倒置,我在這裡還是要校正一下視聽,也讓中研院所有同仁放心,中研院一定是站在一個更高的角度,而不是要用軟體去檢查、審查人所產出的內容,為什麼?因為AI可能會犯錯,對不對?
彭副院長信坤:沒有錯。
葛委員如鈞:尤其是文字的檢查,AI會犯錯的機率已經幾乎被證實了,所以這一點麻煩院長、副主委一起來努力。對於這樣的做法,其實我們也希望未來可以更好的運用AI。我們今天要談AI主權,或者大部分人講主權AI,我們也不要忽視算力,算力取決於AI的token,全世界對AI token的要求越來越高。本席過去曾經問過國科會吳主委,針對AI用得多、用得好的國內外教授,因為有一些是我們邀請來的國外教授,有一些則是國內的,我們可不可以透過這個來延攬他、能獎勵他?吳主委當時跟我們承諾,說沒問題、很好的建議,承諾一個月內提供相關的報告。現在也快一個月了,請教一下國科會陳副主委,目前進度如何?有沒有什麼初步的進展可以跟大家分享?
陳副主任委員炳宇:跟委員回報,目前在整理當中,應該是5月8號之前會提供給大院。
葛委員如鈞:太好了。我也問彭副院長同樣的問題,因為您剛剛也講了,使用AI不等於違反學術倫理,正面看待而且容許使用,我們也希望中研院的同仁很會善用AI。對於善用AI、有在使用AI token或使用AI工具在做研究的國內外優異研究員,有沒有提供一些幫助?或對延攬來的國外學者或者邀請來的國內學者,可不可以給他更多AI token,讓他可以做更好的研究?這個部分能不能一個月內給本席一個規劃,我們一起來努力,可以這樣嗎?
彭副院長信坤:可以,謝謝。
葛委員如鈞:謝謝。接下來本席想先請教副主委一個問題,我們來看一下這個畫面,字有點小,劉盛良、陳琬惠、邱臣遠目前是在立法院的哪一個委員會?
陳副主任委員炳宇:好問題,這個問題要查一下才知道。
葛委員如鈞:沒問題。事實上不用查AI,問在場所有的人,我們都知道,這三位都已經不是現任立委,但這個畫面是使用今年2月才釋出的TAIDE模型而來。它的回答非常具有想像空間,說他們是台灣民眾黨、這個會期擔任副院長等,而且還講了2025年底所屬的委員會,有各種想像,清楚告訴我們一個錯誤的宇宙,好像真實的一樣。我們理解資料是會出錯的,雖然研究同仁都很努力,但這些出錯的答案是從這個模型出來的,可能會被認為是真的。我們還問它,現在的副主委是誰?他說是林敏聰女士,想必副主委不是林敏聰女士,對吧?可是上面的資訊還寫得很清楚,截至2026年初。事實上,這樣的做法在過去的AI服務裡面是要清楚標示的,我們可以看得到ChatGPT、Gemini都有標示,那模型能不能?我想請教一下副主委,我們今年2月才推出的TAIDE模型,所有研究人員都很用心地去做出來,可是做出來的資訊、結果是這樣,我們應該如何看待、如何處理?
陳副主任委員炳宇:我們在TAIDE這一塊其實一直鼓勵大家來精進,我們會再繼續努力。
葛委員如鈞:事實上,我有幾個建議非常明確,第一個、有部分內容在問它的時候,它會很明確地講,它的資料只到2023年。我們也看到一些集權國家的AI模型,可能問它某一些數字的問題時,它不想回答。我們不去做審查,但是模型本身是可以自我理解它的資料到什麼時候,模型在吐出答案的時候,也是可以提醒用戶這個資料不盡正確。剛剛中研院彭副院長也說他用AI用得很熟,我相信有用過AI去問法律問題的人都知道,它最後一定會加一句:這是法律的相關參考,請你有問題還是要詢問律師。這一種所謂跟AI的互動過程當中所做到的提醒我們還是要有,這一點未來我們可不可以持續的改進?
陳副主任委員炳宇:跟委員報告,應該是可以的。
葛委員如鈞:好,我們其實也想說沒有關係,因為時間的問題,也許沒有辦法非常完美,但是我們也想要測試其文化主權的能力,因為我們也看嘛!若自己做自己的AI模型,要fine-tune,要對我們的文化有更多的了解,結果在地的語境也掌握不足。我們就問TAIDE模型「留友看」、「與眾分」、「高麗菜煮蛋那桌」到底是什麼,兩個不幸,第一個很不幸,我們已經問它這些是在「脆」上面的哏,結果它括號說TikTok抖音就是所謂的「脆」,對於我們臺灣的文化完全誤解,同時對於網友的文字用詞、用法也不了解,所以我們其實覺得非常的可惜啊!然後我們也測試了什麼?你說文化的主權、主權的AI,所以我們問它一些電影的翻譯,結果它說有一部很好看的影片是克里斯多夫‧諾蘭的「潛行空間」,我看到有人在笑,這是我最愛的電影「全面啟動(Inception)」,潛行空間是誰的翻譯?抱歉,是中國大陸的翻譯,結果Gemma吐出來……
我們完全沒有要苛責研究人員的意思,我們要幫助大家,所以我有具體的兩點訴求想跟副主委交流,第一,我們要超前部署,現在的這個模型,今年2月推出Gemma 3是12B的fine-tune版本,但是4月份Gemma 4就出了,我們做的時間很久,我沒有要苛責,但是我們能不能去討論產官學更多的公私協力合作?因為事實上在過去FreeSEED有一個大型的模型,林彥廷博士是非常棒的研究員,他用了很多臺灣本地的語料去訓練,用gpt-oss-120b去fine-tune一個120B的版本,他們很努力的還要去向群眾募資,並且去募集資源,但做了可能也很難做下去。
我們有沒有辦法公私協力?我們也幫副主委找了法源,AI基本法第八條、資通安全法第四條都明確要求政府要促進產官學合作,目前國際也是如此,NASA、國防部直接跟SpaceX來發射火箭。很多事我覺得三年前我們還可以討論由政府來做,但現在我們要借重民間的力量,在主權AI的發展上可不可以比照辦理,去建構一套政府與民間協力的機制?副主委,能不能在一個月內針對大模型及算力的機房去提出公私協力合作規劃的可能,可以嗎?
陳副主任委員炳宇:跟委員回報,基本上這個的確是我們現在在做的方向,包含我們在推的算力聯盟,TAIDE就是所謂的大型語言模型這一塊,我們也希望能夠跟廠商合作,一個月可能稍微短了一點……
葛委員如鈞:兩個月?
陳副主任委員炳宇:好,兩個月,可以。
葛委員如鈞:在AI的時代,一個月等於是一個世紀了啦,好不好?
陳副主任委員炳宇:好,這個我們其實正在做。
葛委員如鈞:兩個月,可以嗎?
陳副主任委員炳宇:可以,我們兩個月內跟……
葛委員如鈞:為什麼?因為我看到國科會今天的報告提到,2029年瞄準算力到多少瓦,你自己記得嗎?
陳副主任委員炳宇:2029年應該是……
葛委員如鈞:23 MW啦!
陳副主任委員炳宇:是。
葛委員如鈞:副主委有上網看網路新聞吧!有看這些國外大廠的發表會吧!
陳副主任委員炳宇:是的。
葛委員如鈞:我直接跟您分享,2027年到2028年,Meta要啟用1 GW,到2030年以前是2 GW,GW的單位我們上次已經跟國科會主委討論過,人家是2,000,我們是20啊!
陳副主任委員炳宇:是的。
葛委員如鈞:我們是科技之島、又矽盾,所以我們真的要跟產業一起合作。
陳副主任委員炳宇:當然。
葛委員如鈞:要加倍,而且要加速。
陳副主任委員炳宇:是。
葛委員如鈞:最後還有一個問題,另外本席也要請教,我們能不能進一步的來布局?因為我們自己要蓋可能真的很難,就算公私協力也很難,AI token我們能不能提前布局採購?這是什麼意思呢?澳洲、日本、美國正在蓋,沒有台積電的晶片,他們也蓋不了,沒有臺灣的供應商提供他們這些機架、水冷設備,他們也不能蓋。我們可不可以早一點在蓋的時候用國家的高度去跟他們談?我們談AI token的預購,阿拉斯加的LNG我們國家都可以預購啊!AI token我們能不能及早做國家級的預購?因為你們要建設,就建成像我們剛剛看到的,2029年我們要23 MW,是別人的百分之一,這個有沒有機會來研議一下?
陳副主任委員炳宇:好,這個我們回去研討看看。
葛委員如鈞:時間能不能給我一下?這個可能要快,一個月好不好?初步的,好不好?
陳副主任委員炳宇:好,初步的。
葛委員如鈞:有機會也可能要邀請國科會來我們這邊一起探討一下,因為這個真的是要提前布局,過了這個村,沒有那個店,你都蓋好了,你跟人家說要分,人家也不分你了啊!現在在商業合作,我們國家有話語權,這是我們的AI主權,也是我們的主權AI。
最後請教一下,我們剛剛講的都是長期,短期內沒有超前部署,我們可不可以做到精準打擊?因為我們的主權AI或AI主權,其實就是要有文化的主體性,這一點我相信也是我們主席安排這次專題報告非常重要的原因,我們的AI要講我們的語言,我們講影片就是影片,不是視頻;講聲音就是聲音,不是音頻;品質就是品質,不是質量。但是我們現在發現沒有這樣的語料庫,我們的語料庫有很多東西沒有更新,像我們上次提到AI token,對不對?
陳副主任委員炳宇:是。
葛委員如鈞:我們去查了,其實相關的語料庫是不夠的,像電影Inception,我們臺灣翻譯是什麼?是「全面啟動」,結果跑出一個「潛行空間」,其實這是可以解決的,如果我們有一個臺灣用語的語料庫,GPT可以來學、Gemini可以來學,TAIDE也可以來學,就不會發生我們剛剛看到的,重要的國家級資料是錯誤的、重要的國家文化是錯誤的。
我再考一下主委,這一題已經洩題過了,像這個是我們很重要的文化,簡報上的這個是什麼意思?這是前總統蔡英文在脆上面的留言,有20萬個讚,算是全球轟動的次文化,有沒有人要搭救一下副主委?
侯次長宜秀:真羨慕。
葛委員如鈞:數發部侯次長真的很了解庶民文化、網路文化,真羨慕這個詞打出來,全球的網路阿宅不明覺厲,事實上就是真羨慕的意思。真羨慕我們也考過了,全世界所有的主流AI都沒通過測驗,沒有任何一個AI知道這個是真羨慕的意思。只要我們有一個語料庫,這不用很貴,把它鍵進去,Gemma 3 12B也可以回答得出來,這個就是我們真正的AI主權、真正的主權AI。副主委,有沒有機會能夠在一定的期間之內……我剛剛有要很多報告,這個您自己講一個時間,好不好?我真的不想讓大家……但這個真的很重要,因為我從2024年2月1號進來就一直在呼籲,我們的政府要回過頭來定義我們自己的文化,包含我們的庶民文化、網路文化、電影的翻譯、藝人的名稱,是珍妮佛,不是珍妮花;是蜘蛛人,不是蜘蛛俠。副主委,若要跨部會,我想你們是最適合跨部會的。
陳副主任委員炳宇:是,因為語料庫這一塊現在是數發部在幫忙處理,所以我們可以跟數發部一起來做這件事情。
葛委員如鈞:能不能有一個時間線?就是一個月、兩個月或三個月有個初步的研議,我不喜歡這樣,但是因為這件事情很急迫,我想侯次長也很了解,你看侯次長剛剛都可以回答出來,說不定只要訪談一下侯次長,把它建立起來,這個語料庫說不定就很完整了。
陳副主任委員炳宇:是。
葛委員如鈞:可不可以有一個時間?
陳副主任委員炳宇:三個月,其實我們正在做。
葛委員如鈞:三個月,全球的主流AI,Claude、GPT、Gemini都殷殷期盼,因為他們真的很想要更加貼近我們民主、繁體中文的華文文化,好不好?這一點我們一起來努力,可以嗎?
陳副主任委員炳宇:好。
葛委員如鈞:謝謝副主委。
主席:謝謝葛如鈞委員的質詢,請官員回座。
接下來有請林宜瑾委員進行詢答。
林委員宜瑾:(9時51分)謝謝主席,有請國科會陳副主委、數發部侯次長、中研院彭副院長。
主席:好,請三個機關代表上質詢臺。
林委員宜瑾:首先我想請教國科會跟數發部,當初我們制定AI基本法的時候曾屢屢提及數發部要去盤點各部會,來配合訂定相關的子法,有些法律甚至是要配合AI基本法來做出相對應的修正,這個可以參照AI基本法第十七條到第十九條。另外,AI基本法第十六條有明定數發部要訂定AI的風險分類框架。想請教侯次長跟陳副主委,子法修法的盤點進度如何?這個風險分類框架什麼時候公告?相對應的修法有沒有在跟其他的部會進行討論?
陳副主任委員炳宇:跟委員報告,目前風險分類框架還有法規的盤點都在進行當中。風險分類框架應該已經送到行政院,正在等待核定。至於其他的盤點,我們應該是一直在進行。
林委員宜瑾:相關的子法?
陳副主任委員炳宇:對,一直在進行當中。
林委員宜瑾:可不可以把預計要修法的這些法規清單,不管是法律或者是法規命令,在一個禮拜內給本席一份報告?AI基本法都三讀通過那麼久了!
侯次長宜秀:跟委員報告,我們目前已經把AI風險分類框架送到行政院,也跟委員報告一下目前AI風險框架跟各部會協作的機制:風險分類框架裡面分為三大類,三大類底下有18個子類,這18個子類我們是參考MIT風險中有一個叫Risk Repository的架構,這個架構蒐集了全世界各國不同的風險分類去做統整。在這三大類、18個子類之下,我們把整個風險分類框架分為四個步驟:第一個步驟是盤點應用場景,也就是我們請各機關去盤點他們所管的業務範圍內有哪些AI應用的場景。第二個步驟就是看在這個應用場景底下,依據我們所提供的分類有哪些風險會產生。第三個步驟就是評估風險,也就是究竟他們識別出來的這些風險,它的可能性和發生之後的嚴重危害程度,是不是有達到高風險這個等級。最後就是請各部會去盤點,在風險識別和評估的結果底下,現有的法律和政策工具是不是足夠因應,如果不夠因應的話,是不是要進行修法,或是要提供新的政策工具。這整個措施跟步驟,我們現在在國科會的支持下已經開始跟各部會進行非常積極的協作。我相信委員也能夠理解,在各個不同的部會裡面,其實AI應用的程度是相當不一樣的,他們對AI的理解還有風險的識別也都不太一樣。目前我們跟勞動部、衛福部還有金管會都已經開始進行協作。關於修法的部分……
林委員宜瑾:現在討論到修法,就相關的子法我沒有說什麼時候要出來,但至少說明一下照你們的規劃,子法的草案什麼時候會出來以及相關的盤點進度到哪裡,我是在詢問這個。
侯次長宜秀:好,國科會其實已經有請各部會做初步的盤點,但是也請委員能夠理解,因為AI的運用還有技術一直在不斷地變動當中……
林委員宜瑾:所以還在盤點當中?
侯次長宜秀:我們可能要持續性地跟您做階段性的報告,因為……
林委員宜瑾:可不可以針對目前盤點得如何先給我一份書面報告?因為時間的關係……
侯次長宜秀:好。
林委員宜瑾:接下來檢視AI各層面的議題,因為很清楚地,它跨足了科研端、應用端,其實學科也不僅僅侷限在科技領域,它甚至還有法學的問題,這個侯次長可能最清楚,還有社會學的問題,所以本席認為中研院跟國科會在學研方面應該清楚奠基AI跨領域研究的基礎理論,來引領研究者投入更深的研究。想要請教中研院還有國科會,未來在AI這個基礎的研究上,會呈現什麼樣的跨領域研究?會建立什麼樣的學門?
彭副院長信坤:謝謝林委員。這一點我想我們要再做訓練,剛才在報告裡面提到,我們要跨領域,比如人文學者過去不懂AI,現在我們就要訓練他,我們也一直在開很多的課程,請他們的助理也要去上課。另外也有請我們院內的資訊人員協助他們做AI方面的訓練,從這兩方面來做。
林委員宜瑾:好,有一直在努力就對了。
彭副院長信坤:對。
林委員宜瑾:我想在AI浪潮襲捲全球的這個時刻,我們各學科的領域都有人深入研究,像清大的林勤富教授,在中研院的法學期刊有撰文分析歐盟的AI基本法。接續我前面提到的法制問題,本席認為國科會跟中研院真的應該很努力地來進行實證的研究,在AI這個議題上提供具體的修法跟立法建議,讓學研跟修法可以持續交流對話,進而可以被司法作為裁判的依據。
我們回到這次的主題之一,就是學門的建構與應用。本席認為,在這邊相關學門的建構最後指向的其實是應用,重點就在實際應用,所以本席作為一個立法者,我的幕僚常常在研讀各種法學的研究成果,也參考相關修法的建議來提出修法,所以本席要在這裡具體建議,AI的法律研究應該要突破單純的分析比較法視野,就如同我前面所說的,要跟立法實務有更多的對話。簡單來說,像中研院跟國科會做出的研究就應該要能實質建議給AI跟數位的主管機關跟立法院,所以在這裡想要了解,中研院、國科會跟數發部對於我剛剛提到的看法有什麼樣的想法?
彭副院長信坤:謝謝林委員的建議,其實我們在兩年前就已經成立了法律方面的風險小組,由我們在座法律所的李所長來負責,我們都會固定去盤點會碰到的法律問題,我希望未來有機會跟國科會做進一步的交流,謝謝。
林委員宜瑾:國科會呢?
陳副主任委員炳宇:跟委員報告,我們其實不只是法律的部分,國科會所支持的一些研究成果,只要跟各部會有關係的、有幫助的,我們都會轉請各部會參考。在法律這一塊,其實我們跟中研院也有很多密切的合作,也有一些對法規的……像人工智慧基本法這一塊,我們其實已經有很多的研究、討論,都有提供給數發部參考。
林委員宜瑾:好。最後我再談一個實際應用的問題,就是我們今天的主題之一──數位透明度,這個對應到我國AI基本法的宣示原則之一,就是「透明與可解釋性」,簡單來說就是當AI做出一個決策,我們必須要能交代它的演算過程跟理由,任何在我國落地的AI應用如果沒辦法滿足這樣的需求,產生爭議的話,可能會導致要去打官司,這勢必會引起很大的問題。所以談到透明,我覺得我們不只需要演算法跟決策過程的透明,也需要資料的透明,甚至是事後的清楚標示。
前陣子本席有向國安局提出一些書面質詢,詢問國安局是否具備以AI對抗AI的能力。針對現在快速傳播這些惡意的深偽內容要如何緊急處分,國安局回復本席說會研究導入AI代理人技術來強化偵測辨識AI生成內容及帳號群控等行為。另外,國安局也表示,或許可以借鑑歐盟的法制,強化相關的法源,來促使社群平臺業者能善盡企業責任,依法來標註錯假訊息,審查並下架不實的影音。本席看來,這個重點在於國家安全的守護搭配我國AI基本法的透明與可解釋性原則,我覺得應該要有辦法針對令人頭痛的AI生成錯假訊息來進行處理,比如說強制標註,就是要求他解釋生成的過程,後端就來審查下架,配合AI基本法第五條規定政府應避免人工智慧之應用,有破壞國家安全等等的情事。請教侯次長,臺灣面對這種日益嚴峻的資訊戰,數發部怎麼樣跟國安單位配合研擬相關政策,來對抗不利於我們臺灣這個國家的錯假訊息的散布?
侯次長宜秀:跟委員報告,我們就AI生成內容、錯假訊息還有標示的議題,目前由部長親自處理,並和各個主要的大型平臺及生成式AI的主要提供服務商去做討論,也已經召開會議,我們現在得到的反饋,就我所知,各個平臺其實都願意往主動標示的方向去做推進。
林委員宜瑾:好,因為國家安全確實是非常重要,所以這個部分再請各單位多加努力。謝謝,謝謝主席。
侯次長宜秀:是,謝謝。
主席:謝謝林宜瑾委員的質詢,請官員回座。
接下來請郭昱晴委員詢答。
郭委員昱晴:(10時3分)謝謝主席。有請國科會陳副主委、中研院彭副院長及數發部侯次長,謝謝。
主席:請機關代表到備詢臺,謝謝。
郭委員昱晴:三位早安。因為這個問題應該是跨部會的,所以先請你們三位上臺,不好意思。我想今天要談的這三個主題,其實核心重點就在問一件事情,就是臺灣的AI到底有沒有一套真正的國家戰略?我為什麼要這麼說呢?第一部分,AI其實不是三塊拼圖,剛剛也提到,它應該是一個系統,目前臺灣的AI發展大致分為三塊,我來敘述一下,不曉得對不對,三位可以指教。
國科會是做科研模型跟學門,中研院做的是學術標準及倫理的部分,數發部則是做應用資料跟治理,我想這三個部分應該沒有錯,看起來這個分工其實是很清楚,但是我們擔心的是各做各的、沒有整合。我舉幾個比較實際的例子,我想學門其實是傳統的分科,但是剛剛宜瑾委員也特別提到,AI是跨領域的。另外,在倫理的部分,目前大部分我們都是用指引的方式,並沒有真正的制度,AI已經進入到了政府跟產業,但是在透明的機制上可能還沒有辦法完全的補足、沒有辦法完全跟上。從研究一直到應用,這中間銜接的責任,目前為止,大家感覺好像還不是那麼的清楚,我首先想請教的是,目前有沒有一個所謂的跨部會統整機制?再來就是到底由誰來做最後的決策?這個權責大致上是怎麼樣分的?請教。
陳副主任委員炳宇:跟委員報告,目前行政院有一個三政委平臺,名稱我不是記得很清楚,是由國發會主委、國科會主委及法制政委,三位政委共同主持的一個會議,會去做跨部會的協商。
郭委員昱晴:所以它只是一個會議而已嗎?
陳副主任委員炳宇:它是一個協商平臺,所以各部會都會參與。
郭委員昱晴:協商平臺?最後的決策都會是怎麼樣來……
陳副主任委員炳宇:最後的決策還是回到行政院,應該是由行政院這邊來做最後決策。
郭委員昱晴:好,我再問一個更關鍵的問題,AI已經進入了所謂高風險的領域,比方說,像是公共治理、醫療、法律,以及現在所謂的倫理規範,還停留在所謂的學界自律,問題是將來這個會不會讓它制度化?比方說像是分級制度的管理,或者是強制的風險評估,政府在使用AI的時候,需不需要隨時向民眾做揭露?目前有沒有比較明確的進程或規劃,整個時程大概是怎麼樣?
侯次長宜秀:跟委員報告,就各個部會主管機關去對產業做的規範,我們就是會透過風險分類框架去協助各部會做盤點,在政府機關……
郭委員昱晴:但是沒有強制,對不對?這個部分目前是不是沒有強制?
侯次長宜秀:應該說我們的……
郭委員昱晴:只是一個指引?
侯次長宜秀:對,是指引,但是各個部會都積極在配合,我們都非常頻繁地在溝通跟協作的過程中。基本法裡面設定的時間點是兩年,但是有一些比較重要的,就是風險比較明確的,我想會在比較快的時間底下有一個比較早的決定,就是有一些部會可能會比較早完成整個法規的修訂。
另外,在政府機關的部分,數發部的數位政府司也在協助政府機關去做內控的部分,這個我們也在積極進行當中,基本法的附帶決議是要求6個月內要……
郭委員昱晴:6個月內?
侯次長宜秀:對。
郭委員昱晴:好。接下來第二個部分,我想要問的是主權AI的核心,就是剛剛有幾位委員特別提到的所謂語料跟資料的主導權部分。談到TAIDE,我從2024年一直在追,我一直在強調的一句話就是說,主權AI不只是模型,它其實也包含資料、算力以及長期的維運。現在我們面對一個比較現實的狀況是,我們看到臺灣合法的語料大概是100 GB,日本大概是25 PB,全球的中文語料有90%是來自於中國,換句話說,我們在用AI,可是資料的主權居然不在自己的手上,我想這個部分大家都會有一些隱憂啦。不管是語料、模型、應用還是分三邊在做,語料是數發部,內容的部分應該是中研院,對不對?模型的部分是國科會,又來了,這三個感覺分工都很細,問題是我們現在講的是中間會不會缺少一條所謂的整體戰略主軸?這個部分誰來回答我一下,目前我們到底有沒有主權AI的整體戰略整合機制?再來,三個部會又是怎麼樣來做分工、協作的?
陳主任委員炳宇:跟委員回報,這一塊雖然是分三個單位在做,但其實我們是一起在努力,模型這一塊雖然是國科會在主導,但是我們也跟中研院合作在做開發跟推動。
郭委員昱晴:既然是三個部會都有在做,那我要請問具體的語料建設目標,我要問一下這個目標,我們要做到多少量?我們要幾年完成?再來,我們能不能夠支撐下一代的模型部分?這個誰可以回答我?
侯次長宜秀:跟委員報告,語料的部分在法規上有非常大的限制,我想委員也應該清楚,因為臺灣著作權法的規定,還有合理使用……
郭委員昱晴:我們有沒有一個目標?
侯次長宜秀:數位部現在在草擬資料創新發展利用條例,希望能夠有一些突破,我們現在也在積極溝通當中。另外,我們目前能做的是透過語料庫的建立,設計一定的授權機制,首先是邀請各部會來提供語料,今年開始我們也邀請民間廠商能夠依據授權機制把他們的語料放進這個主權語料庫裡面,希望能夠持續推進,如果在法規上面有更大的突破就會更容易。
郭委員昱晴:有沒有預計什麼時程可以完成,或者是完成多少目標?另外,剛剛有提到所謂語料的部分,其實我們現在講語料大部分是所謂的科普跟學科,但是問題是我們有很大、很重要的一個關鍵是產業資料跟實務上的資料,我們怎麼樣讓這個部分也能夠進入到AI的訓練,有沒有一些制度或者誘因能夠吸引這樣的方向?
莊司長明芬:是,跟委員報告,有關於這個語料庫,數發部在去年年底12月24號就公布上線,目前的語料量是1.2 billion tokens。當然語料庫的徵集,我們是先從中央政府開始,在今年年初的時候,我們就朝地方政府邁進,所以會有很多在地的語料一起進來。我們在今年下半年會針對民間的語料開始進行徵集,所以我們是以有系統、有步驟的方式來擴大我們的語料量。我覺得語料量沒有止境的一天,我們會努力不斷地把這個語料庫擴大。
郭委員昱晴:有沒有定期的盤點?然後盤點的一些資訊是不是可以公開提供?再來,有沒有變成所謂的成效評估機制?就是變成一個可以一直不斷地被複製、一直不斷被修正這樣的機制,有沒有?
莊司長明芬:對,委員的建議非常的好,我們在中央跟地方政府這個部分都有開工作坊,請他們來進行定期的盤點,我們在年底的時候會有一個評獎的機制……
郭委員昱晴:所謂的定期大概是多久?
莊司長明芬:我們大概每兩、三個月就請他們盤一次,每次盤點我們會以協作的方式,請他們把資料放到語料庫上面來,我們在年底的時候會有一個評獎的機制,看看中央跟地方政府還有民間團體他們努力的成果,我們會頒獎……
郭委員昱晴:所以有一些誘因就對了?
莊司長明芬:對,會有一個頒獎的機制。
郭委員昱晴:好,如果有一些比較具體的計畫,就像您剛剛所說的這些內容其實是很豐富的,這些具體的計畫可以再提供給我辦公室嗎?可以嗎?
莊司長明芬:可以,我們整理一份資料給委員辦公室參考。謝謝。
郭委員昱晴:好,謝謝。謝謝主席。
主席:謝謝郭昱晴委員的質詢,請官員回座。
接下來有請陳秀寳委員進行詢答。
陳委員秀寳:(10時13分)謝謝主席,先請國科會陳副主委。
主席:請國科會陳副主委上備詢臺,謝謝。
陳副主任委員炳宇:委員早。
陳委員秀寳:副主委好。我們先關心一下有關於臺師大體操教練涉及霸凌這個案子,昨天臺師大已經做出停聘兩年的處分,目前會將這個處分先送到教育部來審議。針對這部分在這邊想請教國科會,目前有沒有收到學校的通報?
有嗎?有收到嗎?
陳副主任委員炳宇:報告委員,目前還沒有。
陳委員秀寳:還沒有。那我想請教,未來學校通報之後,你們會不會有相關的停止補助或是撤換主持人這些處理?
陳副主任委員炳宇:跟委員回報,我們會依據我們的作業要點去做處置。
陳委員秀寳:但是你的作業要點裡面有規範嗎?
陳副主任委員炳宇:我請我們同仁幫忙回答。
陳委員秀寳:我先就這部分跟您討論一下。國科會這邊給本席的資料是說,這位涉及霸凌案的體操教練,現在有兩個國科會的計畫案在執行中,執行期限一件是到明年,一件是到今年底,目前這個計畫還在執行中嗎?
陳副主任委員炳宇:目前還在執行中。
陳委員秀寳:好。那國科會在懲處確認之後會不會有進一步的處理?後續處理是什麼?您說會根據要點來做處理,但是針對國科會的補助計畫要點,我們來討論一下。目前要點裡面只有針對違反性平相關法規,經主管機關查證屬實之後,國科會會召開專案小組審議是否暫停補助或是撤換計畫主持人。但是現在校園裡面比較會有狀況的,除了性平之外就是霸凌事件,要點裡面並沒有針對霸凌事件有相關召開專案小組審議的機制,所以剛才您說這個案子會按照要點來處置,那你們現在的作法是什麼?
賴副處長瀅宇:報告委員,目前我們的要點裡面有規定,如果經過學校或者是教育部這邊確定相關的處分,計畫主持人因故無法執行的話,執行機構必須要辦理計畫終止或更換主持人。
陳委員秀寳:所以要點裡面並不是規範說他是違反了什麼,而只是說他因為這些處置而沒有辦法執行的時候,你們就會更換或者是說……
陳副主任委員炳宇:是的、是的。
陳委員秀寳:在這邊其實本席要建議國科會,要參照教師法第十四條及第十五條的規定,針對教師體罰或是霸凌學生,應該把相關的規範放進要點裡面。因為如果經過主管機關查證屬實,其實在國科會的部分,不管是事件成立、審議的過程,國科會是不介入的,但是你們要針對查證屬實案件中的涉案教師做出計畫終止或是撤換的決議,所以你們是不是可以把霸凌處置的機制放進要點裡面,來做到落實霸凌零容忍,這個可以嗎?
陳副主任委員炳宇:我們回去會再研議。
陳委員秀寳:因為現在校園內大家非常重視,而且比較多、比較嚴重的就是性平跟霸凌事件,所以建議國科會要把相關的規範放進你們的要點裡面,這樣會更明確,而不是說他如果經過學校或者是相關會議查證屬實之後,你們再針對學校或教育部對他的懲處結果來做處置,但是其實如果你們把相關規範放進去的話就很明確了,這個你們再研議一下。
陳副主任委員炳宇:是的。
陳委員秀寳:這邊我也要提醒,針對違反要點而受處分,不管是撤換或者是一定期間不可再申請計畫的這些主持人,我們應該要有相關的資料庫,把這些資料建置起來,讓申請人或是有其他子計畫需要尋找主持人的時候有可以依循的資料,也避免有受管制的狀況,這個可以嗎?
陳副主任委員炳宇:報告委員,我們其實已經有類似的資料庫在做處理。
陳委員秀寳:已經有了?
陳副主任委員炳宇:是。
陳委員秀寳:好,這個部分你們已經有先做這樣子的措施,謝謝。
接下來我請數發部侯次長。次長好。
侯次長宜秀:委員好。
陳委員秀寳:我想請教次長,AI基本法在去年底已經三讀通過,市面上開始有越來越多號稱具AI功能的產品在販售,本席想針對這些AI產品的相關問題來請教、釐清。市面上有許多號稱有AI功能的產品,像我們現在投影片上面看到的,家電產品很多會標榜它是AI,次長,請您看一下本席投影片上面,這些目前市面上販售的AI產品,你們覺得有哪些是真正有運用到AI科技?
侯次長宜秀:謝謝委員。委員提出的這個問題非常、非常的重要,其實沒有辦法從行銷廣告上面,他說是AI我們就直接認定是AI,那……
陳委員秀寳:對,所以?
侯次長宜秀:所以我想必須要透過人工智慧基本法裡面的定義。我們在人工智慧基本法裡面的定義應該是有自主運行能力的系統,然後透過機器學習演算法,針對明確或隱含目標實現預測、內容、建議或決策,影響實體或虛擬環境的產出,那所以……
陳委員秀寳:對,次長您的回答就是AI基本法規範的AI的定義,就是要包含自主運行能力,機器可以學習跟演算,也可以產出影響實體或虛擬環境之預測、內容、建議或決策。但是如同剛才我們所說的,光看相片、圖片或是說產品上面寫了AI,其實我們很難去判斷是不是真的有這些功能。其實這些產品不用寫AI,它本身就是一個很好用的家電了,那你冠上AI,其實對消費者來講他沒有辦法理解,本來就是很基本功能的,像滑鼠還是吹風機,冠上AI之後對它的使用性、實用性或者影響在哪裡?對民眾來講,他感受到最大的差別是,只要冠上AI兩個字,好像價格就會提高,這很明顯的會讓我們的消費者權益受損,他會多花冤枉錢。那為什麼我在這邊提出,我想問的是廠商可以任意的在他的產品上面放AI這兩個字嗎?
侯次長宜秀:就這個部分來說,我不太確定是不是有涉及不實廣告的部分。
陳委員秀寳:次長,這邊要跟您討論的就是,我們剛才提到AI基本法裡面有規定AI的定義有3個要點,這些宣稱有AI科技的相關產品是不是一定要符合這些要件才能說是AI產品?就是說它如果不符合我們剛才講的自主運行能力,或是可以學習與演算等這些相關的功能,它是不是應該不能標榜是AI產品?
侯次長宜秀:委員,就我目前所知,似乎沒有法律做這樣明確的強制。
陳委員秀寳:好。我現在要給你們的建議就是,既然AI基本法已經三讀通過,對於AI的定義也已經很明確,就是我們剛剛講的那3個要件,希望相關部會可以協助這些AI科技相關的應用,有民眾建議可以像節能標章一樣有申請及認證機制來保障消費者權益,次長,您覺得呢?
侯次長宜秀:這部分會跟各個主管機關去做討論。也跟委員報告,人工智慧基本法第三條雖然是這樣子定義,但是因為技術一直在發展當中,而且目前變化非常非常快,在不同的領域裡面,到底怎麼去定義它已經有自主運行能力,我覺得各個領域面對技術的評估可能會不太一樣,是不是能夠透過標章的方式,我們會去做討論和研究。
陳委員秀寳:本席提出這樣的疑問的時候,次長本身也會覺得好像他說它是AI,到底是不是?還是它只是具備這樣的產品所必須有的基本功能而已,因為登上熱潮就放上AI兩個字,讓消費者無所適從,也無法辨別,因為這樣子他多花了錢。所以當有這樣的疑慮產生的時候,我這邊提醒的是希望你們跟國科會、經濟部共同研議,對於剛才民眾建議用標章或是申請認證來保護消費者,也讓這些相關的家電、電器產品在生產的時候,因為他們是需要透過認證、申請或一個這樣的程序,他們在產品上精益求精,如果想要讓民眾覺得東西更好用而要有AI功能的時候,他必須去研發,而不是輕易地把這樣的稱謂冠上去,就可以得到消費者的支持,您覺得呢?
侯次長宜秀:謝謝委員的意見,我覺得這個方向我們會跟各個部會在風險分類框架底下去做討論,委員剛剛提出來的,不論是標章認證還是能量登錄這種方式,應該是在各個可能的因應措施裡面必須要被考慮的。
陳委員秀寳:好,就麻煩次長在跟國科會或經濟部研議出一個初步結論的時候,請把報告給我的辦公室。
侯次長宜秀:好的,謝謝委員。
陳委員秀寳:以上,謝謝,謝謝主席。
侯次長宜秀:謝謝。
主席:謝謝陳秀寳委員的質詢,請官員回座。
接下來有請陳培瑜委員進行詢答。
陳委員培瑜:(10時24分)謝謝主席。有請次長、國科會副主委,還有數發部次長,謝謝。
主席:請機關代表上備詢臺。
陳委員培瑜:副主委還有次長早安。我還是要問一樣的事情,但是我們來更新一下你們目前最新的進度。第一個是關於AI十大建設,國發會已經公布114到117年十大建設推動方案,國發會的十大建設方案指導第七點提到主權AI還有算力建設的部分,我相信兩位學者專家雖然現在在公部門服務,但是你們來自民間的專業一定認同大家現在在說的算力即國力,而我相信兩位應該也知道另外一個事情,可能這句話只講對了一半,因為最近一次4月多在總統府有一個關於與民間學者頒獎的活動上,有非常多做開放資料的人直接跟賴總統建議,他們說什麼呢?我不確定兩位有沒有follow到這個事情,例如說有一個叫OpenFUN的創辦人說:AI是日益強大的引擎,而資料則是驅動引擎運轉的石油。對吧?所以剛剛郭昱晴委員也問到關於資料的部分。而另外一個在做開放資料的開放文化基金會他們也說:主權不該只是放在兩岸議題上,資料也是一種主權;第二個,他們說以前我們關於資料想的是文本思維,現在在看的是資料思維;第三個,下一個階段不只是監督政府,而是要邀請民間一起協作。所以我要回過頭來看AI十大建設裡面,其中有一個是國發會提醒大家的,要做政府及民間資料的釋出,我相信你們兩位應該都非常清楚。
可是我們要問,現在我認為民間資料的釋出其實可能比公部門遇到的資料釋出還要面臨更大的困難,對不對?我想先請次長來說說看關於民間資料的部分,目前數發部如何看待現在可能遇到的困難,還有你們掌握了多少的進度跟可能性。
侯次長宜秀:跟委員報告,委員剛剛提到在總統府的那個會議其實是數發部協助的IT Matters Awards頒獎活動。我也在場,其實當場總統就指示我們,就是剛剛您提到的發言,必須要再去做追蹤和研究。確實在民間資料的部分,我想有幾個比較現實上面的影響,第一個問題,著作權法底下到底訓練或是產出在什麼條件底下算是合理使用,這件事情一直不明確,跟國外的狀況比較的話,臺灣因為刑事責任被使用的比較多的關係,因此確實會有寒蟬效應,就是訓練者會對於利用訓練資料感到比較恐懼,這是一個我們看到現實上的障礙。但是當然也很重要的就是,我們怎麼樣在保障內容權利人的方面必須要取得一個重要的平衡,這中間有一些比較細緻的,還有內容的利用方式,在什麼條件底下會不一樣,這個我們都希望能夠有更明確的界定。
在AI新十大建設底下,剛剛委員所提到的那個項目是由數發部主責,也邀請智慧財產局負責關於民間資料,有著作權的資料到底能不能被利用的部分去做負責。這個部分經濟部智財局給我們的資訊是,他們在今年5月的時候應該會有一個指引出來,我們希望透過這樣的指引能夠提供比較明確的利用界限。數發部目前已經在做、能做的是,第一個,語料庫透過授權的方式來明定授權資料的利用方式,包括剛剛說的政府機關。民間的力量我們也已經召開工作坊,邀請一些可能參與的民間單位一起提供,所以這兩個部分是我們已經持續在做的。我們也持續在盤點還有哪些可能釋出的語料,希望能夠提供在我們草擬中的資料利用創新條例底下,我們設計了新的資料分享機制,就是民間與民間之間資料分享的機制,我們也跟歐盟的資料空間以這樣的做法去做產業界之間的資料共享,希望能夠推動這樣的機制出來。
陳委員培瑜:我花了這麼多時間讓次長說清楚,就是我認為次長您從民間轉換到公部門之後,確實非常掌握狀況,不論是從公部門、政府端現在已經有的資料,或者是民間的資料,而且相關的法規,您意識到有著作權法的問題,我非常感謝次長您完全進入狀況,這個是絕對要給您肯定。但是從這個肯定我們往下看,之前數發部長林宜敬在去年9月接受專訪的時候,確實他也說我們要號召民間自願捐出內容,打造臺灣主權AI訓練語料庫,才可以打包足夠多的資料、百萬本的資料、1 TB的資料給國際科技巨頭可以使用臺灣的資料,降低資料使用的門檻。
回到所謂雲端上的臺灣主權這個議題上,現在如何透過與智財局的合作,透過民間團體或是所有這些擁有內容的人,他們如何願意join這個所謂數位國家內容的臺灣隊?他們如何願意join進來?上一次一樣在教育及文化委員會,我就直接請問國科會的主委,主委也說他絕對支持,而且他也絕對明白資料基礎建設的重要性。但是如果我們光談授權,這會是一個漫無止境的道路,而且如同你所說的,資料授權的授權費用,現在沒有人知道怎麼算,其實不是只有臺灣,全世界皆然,對吧?就像大家所熟悉的泰勒絲,這兩天還在主張他的聲紋權利。
對我來說,談授權非常沉重、非常困難,上一次國科會主委的說法是,但是民間擁有這些資料的人,公司也好、團體也好、所有人也好,他們如何把資料變成所謂乾淨的資料?這件事情其實是一個大工程,而且需要大筆預算,有沒有可能在成立內容國家隊的前提之下,由國科會也好、國發會也好、數發部也好,甚至協同文化部,我們開始把各式各樣擁有內容資料的人,協助他們做資料的優化、資料的清洗,然後做出結構定位,甚至做出適合機器人讀取的標籤,這是一個龐大的工程,需要龐大的預算,需要龐大政府資源的支持。所以我上一次問國科會主委,他的說法是他願意去想辦法來解決。
我想問一下國科會,目前在這個議題上,上一次我問完之後,主委有沒有帶回去討論跟做進一步的規劃?怎麼說?大家都以為資料只有平面或是文字性的資料,可是當我們去研究世界各國這些大語言模型在取用資料的時候,從來都不是只有文字,也不會只有照片。我舉一個例子,廣播聲音要不要用?當然要,還有臺灣長年累積的藝術文化,這些表演內容要不要取用?絕對是要,因為它有豐富的臺灣文化背景,臺灣的基礎邏輯基本上跟世界各國是不一樣的。現場還有吳思瑤委員,他也非常在意臺灣的藝術跟文化,所有這些藝術文化的data,在未來如何在雲端上不要被其他國家的文化稀釋掉,如臺灣專門的雲門舞集,這是重要的國際團隊,而這個國際團隊以臺灣文化所發展出的演出也好、聲音也好,所有的資料未來如何加入臺灣國家隊,獲得合理的對待,然後把它變成臺灣內容國家隊的重要基礎,我認為這絕對是所有教育及文化委員會的委員會關心的議題。
所以我要再次強調,一百萬本只是我們方便用來計算的可溝通語言,但是我相信兩位主管你們一定知道,我講的絕對不會只有平面資料,我講的包含聲音、影像、廣播、照片、文字,甚至是各式各樣民間的文化,例如臺灣特有的烤肉文化,這可能走到全世界都沒有,當中秋節的時候,我們就會看到金蘭烤肉醬的廣告跑出來了,變成臺灣人的特殊記憶,而這個東西如何在你們共同打包的過程當中也被放進去,這需要我投影片上的這些工程,對嗎?
所以我非常感謝國科會主委,上次質詢時他立刻明白,同時他立刻承諾會回去編列預算,找到相關的資源跟支持,所以我也很想知道,目前為止,你們規劃的進度到哪邊?請國科會副主委,謝謝。
陳副主任委員炳宇:報告委員,我們目前還在規劃當中。
陳委員培瑜:還在規劃當中?
陳副主任委員炳宇:是,還在規劃當中。
陳委員培瑜:好,沒關係,副主委,這樣好不好?我們辦公室會持續跟你們溝通。
接下來,根據AI基本法,我知道國科會這邊必須要組成人工智慧戰略特別委員會,對吧?好,你們委員會成立在即,我看到你們現在給我們辦公室的回復是,委員會的設置要點還沒有完成,現在也都還不知道結果,可是我看你們現在給我們的說法,你們目前只有邀請人工智慧相關學者專家、民間團體、產業代表,可是我不知道你們有沒有把所謂手上有內容的各式各樣的人,如聲音、廣播、電視、電影、文字、照片,這些人有沒有被你們視為重要的委員會成員?所謂這些手上有內容的人,不管是各個公協會的代表或是重要團體的代表,甚至你們是不是應該要召開關於內容產業的民間座談會?讓所有手上有內容的這些人意識到國家看到你們了,而且國家在建立AI十大基礎建設上很需要各位的協助,因為連賴總統都親自指示數發部跟國科會了,我想聽聽看你們目前關於跟內容產業合作層面的規劃是什麼?
陳副主任委員炳宇:報告委員,這邊我們應該會列入參考,謝謝。
陳委員培瑜:好,會列入參考,那我們辦公室再持續跟你們溝通,好嗎?好。
最後,我想給的建議:第一個,我希望你們未來三年內,就預算的部分、就政策的部分,如何協助所有的內容產業以資料轉換到AI可讀格式的工作邏輯、工作流程,去想像如何在三到五年內實現1 TB語料庫的這件事情,跟國外的這些大語言模型公司合作,讓雲端上的臺灣不會被消失,這件事情非常重要。第二個,我也希望你們積極地跟文化部或是經濟部智財局,甚至是文策院,手上有內容的這些產業都必須要有機會加入人工智慧戰略特別委員會,我認為來自內容產業的人的聲音非常重要。我上次還舉了一個例子,你現在去問AI,沒有人知道吳誠文主委打過威廉波特棒球隊,這件事情非常可惜。所以我想如同兩位剛剛的回復,非常積極,後續就期待我們一起來規劃、一起來推進相關工程,好嗎?
陳副主任委員炳宇:好,謝謝委員。
陳委員培瑜:好,謝謝。
數發部次長先請回,我問一下國科會副主委,我們也看到國科會在去年開始推動運動文化的研究專案,非常謝謝國科會在國科會推動的研究當中導入運動議題,目前我們看到你們規劃三大主軸、九個議題,我就不再細唸了,我們看到最後核准成案有七個案子,第一個是在地的體育運動文化與歷史,一共核准了四個案子;第二個是關於運動媒體與消費文化創新還有社會影響,這非常重要,有兩個案子;再來是關於運動人才培育制度的創新,很棒,有一個案子。可是我覺得其中有個部分很可惜,我要先說,我非常肯定你們的努力,也謝謝你們把運動文化、消費文化、人才培育放進去。但是我們現在看到裡面有一些缺漏,我不確定是因為沒有人送案所以沒有通過,還是有人送案但是最後沒有被審出來?第一個是關於運動性平的部分;第二個是關於運動當中的勞動權益;再來第三個非常重要,是關於運動當中的兒少權益,相關的三大主軸、九個議題,看起來應該有機會含括我今天所提醒的,所以我想請副主委回答一下,是沒有人遞案,還是有人遞案但是你們覺得還不夠好,所以沒有往下發展?
陳副主任委員炳宇:報告委員,我請處長幫忙回答。
陳委員培瑜:好,謝謝。
黃處長俊儒:報告委員,有關於性平跟兒少的部分,確實提案的團隊比較少;有關於勞動的部分,在媒體的那個部分應該會涉及運動相關的勞動產業。
陳委員培瑜:好,確實我們猜對了,就是因為比較少人提案,但是我想國科會應該有一個角度可以做,我們可以去找相關學者,鼓勵他們來年可以持續提案,你們可以有更多政策上的鼓勵,好不好?我們把兒少權益還有運動性平納入,可以嗎?
黃處長俊儒:好。
陳委員培瑜:好,謝謝。再來,前兩天有一個臺師大體操隊翁士航教練的霸凌事件、性平事件,細節我就不再說,但我知道翁教練有申請一個國科會的題目,叫做「完美翻騰、精準落地:科學化競技體操訓練與監控」,我現在不確定他有沒有在這個研究案當中獲得相關研究成果,但是這中間有一些關於學生參與部分是不當處置對待的,目前國科會有沒有掌握這個研究案的進度跟我剛剛所提出的相關問題?
黃處長俊儒:跟委員報告,翁老師目前所執行的計畫都是以18歲以上作為對象,我們都確認過,其實他目前的執行計畫都有通過IRB,但目前我們並沒有獲得這裡頭是不是有不當權勢的意見反映。
陳委員培瑜:好,如果就18歲以上的部分,大概就避開了所謂「小師大」,也有做了IRB的部分,但是我想如果未來你們有聽到任何在過程當中對18歲以上選手的不當對待,結果被納入了、變成研究的一部分,我想國科會還是要持續關注。關於剛剛我們希望可以推動運動性平的研究、兒少的研究,就拜託國科會持續支持,並且多加推廣,希望有更多的專家學者可以來提案。再來,校園中各項學術研究計畫,如果有不當對待、權勢壓迫取得的研究素材,也要拜託國科會嚴謹把關。如果有相關的報告跟進度,再拜託提供給我們辦公室,可以嗎?
黃處長俊儒:是。
陳副主任委員炳宇:好的。
陳委員培瑜:好,最後要拜託國科會,關於我剛剛講的資料的部分,我們一起努力,我想不管是數發部或國科會,我們確實要在內容國家隊這件事情加緊腳步。我舉一個最近的例子,現在有非常多臺灣人會用AI模型做影片,可能是講臺灣的故事,結果很無奈他用的聲音是中國的聲音、中國的發音,而且那個聲調其實令人聽了……很多人都覺得:天啊!為什麼AI會給我這個聲音?很簡單,因為現在很多AI語言模型沒有臺灣人的聲音。我想兩位都非常清楚,我們一起努力,謝謝。
陳副主任委員炳宇:好,謝謝委員。
主席:謝謝陳培瑜委員的質詢,請官員回座。
徵求一下吳沛憶委員的意見,是不是在吳思瑤委員詢答完畢之後可以休息5分鐘?可以嗎?好,謝謝。
有請吳思瑤委員進行詢答。
吳委員思瑤:(10時42分)謝謝主席,請中研院彭副院長、國科會陳副主委,還有數發部的侯次長。
主席:請機關代表上備詢臺。
吳委員思瑤:臺灣AI發展的三大龍頭都已經在這邊,我覺得你們如果想要回答都可以主動爭取回答的機會。今天我們站在這裡要謝謝召委所安排的,各國都在研發主權AI的策略,為了要確保人工智慧的技術自主性,而且要減少對國外的依賴,也因此維護國家經濟成長、經濟發展以及國家安全的利益,所以我們今天站在這裡。拼AI,臺灣要組成國家隊、以小博大!
首先,我非常感謝,還是要提一下我過去十度在教育委員會催生質詢,謝謝國科會、謝謝中研院,我們讓國家的科技顧問制度能夠恢復上路,而這樣一個重要的制度就是要為國家科技發展定錨、定方向。而三次召開的科技顧問會議,確實也點出跟今天主題相符的AI驅動下的世代發展,不管是資料治理的環境,不管是跟國際夥伴共同開發,不管是確保國家安全跟營業秘密AI資料的共享,更重要的是人才的培育,以及基礎算力設施的投資,這個重要的科技顧問會議,就是定出我們主權AI的大方向。我們AI教父黃仁勳說上一波的AI浪潮推手是誰?是這些科技巨頭、這些科技業、這些AI的新創,但是第二波AI浪潮的推手就會是各國政府,所以對應於我們科技顧問會議,確實也釐定了國家重要的戰略方向。
這個是2024年WEF公布的,為了發展各國的主權AI,他們訂定了六大戰略支柱,有數位基礎設施、有勞動力發展(即人才儲備);第三個支柱是研發、開發與創新;第四個是監管和道德框架,可能落實在法規、網路安全、數據保護等等;第五大支柱就是各國應創造有利的環境,簡化必要的流程,提供誘因激勵人工智慧相關的產業;最後一個,當然就是各國誰能夠贏得跟國際合作的tech leadership,誰就能贏。我想問三大龍頭、三大巨頭,你們自評,我們今天的主題在講臺灣的主權AI,我們就以WEF這六大戰略支柱,臺灣強在哪裡、弱在哪裡?來,副院長要不要先?
彭副院長信坤:謝謝吳委員……
吳委員思瑤:快速回答,大哉問,但是我覺得很重要。
彭副院長信坤:對,我想中研院能做的就是在六個戰略支柱下,就哪一個我們比較能夠著力的部分先來做,我們不可能包山包海全部做,這部分……
吳委員思瑤:對,您覺得重點我們優勢在哪裡?弱點在哪裡?
彭副院長信坤:我們優勢就是我們擁有的資料庫,還有最近Google也想跟我們合作,所以就他對我們有興趣的部分是哪裡以及他的技術什麼地方比我們厲害,這些我們都在盤點中。
吳委員思瑤:這可能就是在臺灣價值、民主自由的那一方面,我想Google跟我們接觸這是我們的優勢。
彭副院長信坤:是的。
吳委員思瑤:好,副主委。
陳副主任委員炳宇:我想我們的優勢還是比較偏AI硬體的方面,這是我們具有的優勢,但是我們在所謂系統層面、應用方面、需求的這一塊,其實還是比較偏弱。
吳委員思瑤:沒有錯,這也是我看到的問題。來,次長。
侯次長宜秀:謝謝委員。臺灣在2017年開始AI Action Plan第一次的行動計畫,當時科技部在人才還有硬體的部分做了非常多的著墨,經過將近十年,我想在這個部分硬體的成效非常非常明確,現在臺灣的AI server在全球的市占率是九成以上;晶片更不用說,所以我們在硬體上面當然是非常強的。但如何在這樣的基礎上,就像委員標題所說的急起直追,我想從去年開始政府在推動的重點就可以看出來,第一個是在……
吳委員思瑤:好,不用講細節,我自己認為重點是我們的硬體設施確實在布建,國家也在投資,但是我們的人才還是要補強,以及我們在應用端要多強化,這是我的觀察。我們來對應一下,國會要做什麼?AI基本法我們三讀通過了,謝謝各黨的努力,但是另外一個立法也需要國會來助力的就是你們數發部正在推動的促進資料創新利用發展條例,這也是非常重要的一個立法,我先從國會來切入,你們現在進度到哪裡?部版已經出來了嘛,對不對?
侯次長宜秀:是,草案已經在行政院了。
吳委員思瑤:你們有沒有push?
侯次長宜秀:有,因為……
吳委員思瑤:這個會期會送出來嗎?會送到立院來嗎?
侯次長宜秀:對,我們希望在5、6月能夠通過院會。
吳委員思瑤:好,我非常期待,好嗎?我想缺一不可,就是剛剛的六大戰略指標其中一個,其實在法規監理的部分我們要跟上,我就先以國會能幫忙,國會要當神隊友的角度來談。
接著,在硬體的部分,政府確實投資了AI新十大建設,我們各方面從智慧應用、關鍵技術到數位基磐有一個完整的建構,這就是請國會要幫忙的地方。我上上週站在這裡,好不容易……那時候預算還沒付委,會影響到311億AI新十大建設的預算,希望國會支持讓我們都關心的尤其主權AI,臺灣不能輸就是要從預算面的支持。
硬體部分,我先說謝謝大家共同的努力,南科國網雲端算力中心在去年底成立了,我們一併也成立了民間一起來合作的臺灣算力聯盟,算是到位了,但就是因為預算受了影響。臺南沙崙智慧創新算力中心表定的期程是2029年,因為預算被拖延了,我非常擔心,設計標沒有問題,建築標現在在哪裡?建築標現在的進程,誰能回答?
陳副主任委員炳宇:我請國網中心幫忙回答。
吳委員思瑤:是。
姚副主任志民:去年其實已經完成基本設計,現在正在辦理工程細部設計的作業,預計在5月底會完成,在第三季的時候工程就會向外發包。
吳委員思瑤:所以今年的第三季就可以順利發包?
姚副主任志民:對。
吳委員思瑤:當然也期待我們115年度預算還沒審的12.3億能夠順利,好嗎?
姚副主任志民:是。
吳委員思瑤:OK,好,這個不能延宕,我會全面持續來監督。再來,剛剛講硬體,現在講軟體。我過去2023年對TAIDE的質詢,在整個文本的採用,我們患寡、也患不均,因為數量少的文本,而且領域不夠多元,當時都側重在某些科技的領域。在我不斷地要求之下,謝謝你們再把文化……我最關心文化、藝術,國家文化記憶庫在文化部門的這些部分都放進來了,現在就是擴充再擴充。但是我也看到問題,我先問中研院,我們TAIDE系統,到現在我看到的應用端還是限於公務跟學術為主,我們有沒有更大的雄心壯志,讓全社會普及應用、商用的可能性,而且多平臺的使用,我們有沒有這樣子的雄心壯志?
彭副院長信坤:吳委員,這部分請我們院內參與TAIDE的同仁來回答。
吳委員思瑤:是,我的老朋友。
廖所長弘源:吳委員你好。最主要是這樣,我們現在要發展、要大大的應用、百工百業都要用的話,必須要是一個多模態的foundation model,現在中研院因為主委有指示副主委要辦一個AI Team Taiwan,因為行政程序太麻煩了,所以我們現在在TAIDE計畫下面成立一個這樣的小組……
吳委員思瑤:自己先做。
廖所長弘源:對,包括聲音、在座的曹昱研究員……
吳委員思瑤:影像、聲音。
廖所長弘源:然後影像、視訊,再加上原來的語言,我們把這些東西結合起來,這樣它的應用面就會非常廣。
吳委員思瑤:就更多元。
廖所長弘源:因為當我在edge端能夠處理行為的時候,我就可以把它放到edge端去處理老人家跌倒之類這些問題,或者是居家四周圍的安全維護,很多東西都可以用,包括醫生在病房裡面的這些手術。
吳委員思瑤:對,我當然知道我們擴大運用、結合團隊,但是我剛剛說的那個宏觀的目標,全社會的普及,可以往這個方向來努力吧?
廖所長弘源:這個就是要讓它普及到全社會,但是我們foundation model是最困難的部分。
吳委員思瑤:好,我知道很困難,但我還是要說出我們要有這個雄心壯志。右手邊我在講的是數發部,我們擁有臺灣主權AI的訓練語料庫,剛剛你們也已經揭露了國際大型語言的模型、Google已經主動跟我們接觸了嘛,對不對?
侯次長宜秀:是。
吳委員思瑤:那其他的呢?OpenAI、Claude?
侯次長宜秀:Anthropic即Claude的公司、OpenAI,我們都已經接觸了。
吳委員思瑤:好,我們主動好嗎?
侯次長宜秀:是,我們非常主動。
吳委員思瑤:既然我們就是在跟對岸比賽嘛,對不對?
侯次長宜秀:是。
吳委員思瑤:好,今天至少知道Google已經接觸,那我們就要把我們的東西好好的深化跟推廣。最後一個,數發部有AI產品跟系統的評測中心,我們依據了三個指標……臺灣價值觀、學測的社會科跟國文科來評估現在有的這些系統,依它的準確性、可靠性、公平性、資安跟隱私,你們上路到現在已經檢測了62個小模型、58個大模型嘛,對不對?接著我要問,TAIDE實在是相當具有進步的空間,我就看臺灣價值觀,我們當然要贏啊!可是我們還不是最好的,甚至在國文科跟社會科的評鑑裡頭,我們都還輸給中國的系統,當然也輸給這些國際大的語言資料庫、語言資料的模型。數發部可以來說一下嗎?在這個評測裡頭,TAIDE可以給我們一些進步面向的建議嗎?
侯次長宜秀:跟委員報告……
吳委員思瑤:因為我是不懂啦,我真的不懂,但是我看到我就覺得我們要贏啊!我們都要贏啊!
侯次長宜秀:我可能等一下要拜託黃瀚萱老師幫忙,但我猜跟模型的大小有關啦!
吳委員思瑤:對啦,當然是。
侯次長宜秀:另外一個是因為Gemma 3應該還沒有採用我們語料庫,就我所知應該5月會有……
吳委員思瑤:要趕快,對啊!
侯次長宜秀:對,已經有跟我們合作語料庫,我相信會有很明顯的希望。
吳委員思瑤:對,其實這個評測數發部有一個問題,你們評測的時間點跟公布有一點不公平,你知道嗎?你們沒有把評測的時間……因為有的是前面評測,如果跟後面評測的都擺在一起的時候,我也覺得可能對TAIDE會有一點不公平啊!
侯次長宜秀:我們會改進。
吳委員思瑤:對,我覺得既然是一個評測,它在各方面的公平或者如評測時間,這些基準都要拉齊,否則我覺得確實會對TAIDE系統的同仁們可能也有一點不公平。
侯次長宜秀:是。
吳委員思瑤:當然,我們也看到了,為什麼我的命題叫做臺灣要以小搏大?我們就從我們能做的強項下手,也是剛剛中研院的副院長一開始所說的,我們的語言資料庫裡頭,我們的內容、文本裡面能夠多有一些臺灣社會可以提供給全球的自由、多元、民主這些臺灣價值的面向,這就是我們能贏的關鍵,好嗎?
侯次長宜秀:是。
吳委員思瑤:今天時間非常有限,不好意思,我也拖到了一些時間,軟體、硬體都重要,但最重要的是立法院的預算趕快審查,趕快通過,AI新十大建設311億,我們一定要朝野共同來支持,謝謝。
侯次長宜秀:謝謝委員。
主席:謝謝吳思瑤委員的質詢,請官員回座。我們現在休息5分鐘。
休息(10時56分)
繼續開會(11時1分)
主席:現在繼續開會。
請吳沛憶委員進行詢答。
吳委員沛憶:(11時1分)謝謝主席,請數發部及國科會。
主席:請數發部及國科會到備詢臺。
吳委員沛憶:首先請教數發部侯次長,這幾天高德地圖引起很多的討論,數發部也有做了公開回應,對於公部門跟國軍禁用高德地圖,我是相當支持,因為我認為至少有兩點隱憂:第一個,高德地圖的定位是使用中國的北斗衛星系統;第二個,目前中國的法律是要求民間公司要配合政府蒐集資料,這對臺灣來說是相當大的風險。
剛剛前面柯志恩委員質詢的時候要求你們對於各國的各種軟體系統、app的標準要一視同仁,我反對,中國的這些系統軟體、app因為中國法律的關係,其實對臺灣來說是有特別高的風險,所以當然不能一視同仁,反倒我們應該要專案的審慎應對。我要先請國科會來協助說明的是,中國的北斗衛星系統是什麼樣的系統?
陳副主任委員炳宇:跟委員報告,就我們了解,這應該是比較類似於GPS的定位系統。
吳委員沛憶:對,GPS的定位系統,這個是中國自主發展的衛星系統,它新一代的導航系統代表了中國在太空領域上一個很戰略性的突破,除了民用之外,很重要的是它包括了軍用。我們看到臺灣的軍方相關研究單位做了很多的研究,像國防安全研究院的資料告訴我們,北斗衛星系統從研發開始就有中共解放軍總參謀部的參與跟支持,中共的官媒更直接說,北斗的軍事應用是最迫切的需求,例如洲際飛彈、無人機或智慧水雷。臺灣國防大學的黃埔學報也有一個研究提到,中國北斗系統導航系統的建立,相當於是中共在太空中建構一套偵測平臺,有利於中共執行各種作戰任務時破除戰爭迷霧。也就是說,在戰爭當中,假設GPS被破壞了,大家看不到,但是中國因為有北斗衛星系統,他們看得到,他們有眼睛。
中國為了加速北斗衛星的發展,不只是這一套系統而已,他們甚至打造了北斗產業鏈,中國的工業和資訊化部在2022年有發表聲明,依照中共黨中央、國務院的決策與部署,要將大眾的消費領域打造成北斗規模化應用的動力引擎,並且要培育20家以上的企業樹立一批應用的典型樣板。也就是說,民生消費的應用,也是我們剛剛講的中國這一套北斗衛星發展的重要引擎,而我們講的高德地圖就是在北斗衛星產業鏈、中國的紅色軍事產業鏈當中,也就是剛剛講的培育20家以上企業的其中一家。我要講的是,這個高德地圖我們真的要謹慎來看待,這個部分當然有些是國防部跟國安會他們要處理的,但今天是數發部的備詢,所以我們還是要回到技術跟資安來請教。現在這個高德地圖顯然是要回傳它的定位資訊嘛,技術上,這一些定位資訊如果整合起來,比如說使用者如果夠多的話,是不是有可能可以用來分析我們臺灣人的生活樣態?例如說車流、人流、社會行為的分析等等,有沒有可能做這樣的應用分析?
侯次長宜秀:是,就它能夠取得的資料確實是有可能,不僅是整體的社會樣態,甚至到個別用戶的生活型態,我們認為都是會有風險的。
吳委員沛憶:是,它蒐集的資料本身有風險,剛剛我們也有提到,依據中國的法律,中國網路安全法、中國國家情報法有規定,任何組織和公民依法必須要提供這些資料給中國政府,所以我們是非常的擔心。在中國,就算高德地圖是隸屬於阿里巴巴集團,但是連馬雲近年在中國也都遭受到政府強烈的打壓,中國的企業可以說是沒有自由可言,所以當然我們要特別謹慎的來看待。所以第一步我們現在要釐清的是,它到底會回傳哪些資訊?數發部資安署說會去進行資安檢測,請問目前會檢測的項目有哪些呢?
侯次長宜秀:會檢測的項目包括敏感性的資訊,這些檢測項目,我請資安署副署長來做說明。
鄭副署長瑋:跟委員報告,高德地圖目前已經送資安院在檢測當中,預計5月會出來。剛才委員所垂詢的檢測項目,包含它即時是讀取哪些資料,或者是它越過當初使用者允許的權限再去翻看通話紀錄,甚至是健康紀錄等等。再來就是它會不會未經授權就把這些資料傳到境外、中國的伺服器,剛剛委員有提到,既然是傳到中國的伺服器,就歸中國的法律來管,就有可能可以取用到我們人民的生活軌跡資料。
除了這些之外,我覺得還有一項比較重要的是,這個設備的裝置、每個device,手機裡面可能會有一些ID,這些ID也可能會被做記號,有下載過這些app的民眾有可能就被註記了。所以簡單來說,我們會檢測有沒有偷看使用者的資料,有沒有偷翻使用者的資料,其他app或其他儲存裝置裡面的,或者是偷送資料出去,最後還有被做記號等等的行為,我們會去做檢測。
吳委員沛憶:所以它是有可能偷看、偷翻,甚至註記等等,有可能有這樣風險存在?
鄭副署長瑋:是。
吳委員沛憶:因為這是資安的專業,就要拜託數發部依專業來進行檢測,如同我們剛剛所提到的,中國跟世界上其他民主國家都不一樣,它的法律規定對臺灣來說有特別高的風險,所以請你們一定要特別謹慎去對待。
副署長,謝謝。
鄭副署長瑋:謝謝。
吳委員沛憶:尤其是近期還有一案,這個目前還不到數發部,現在是公平會在審,就是中國的外送平臺Grab,想要透過併購的方式進入臺灣,哇,這個真的讓人相當的擔憂,已經有民間團體在分析,因為Grab是外送平臺嘛,未來如果有數百萬的外送員跟司機,然後透過這個GPS的軌跡即時回報,它是可以持續的去修正地圖,我們訂過外送的人都知道,是會到巷弄之間非常細的地理的資料,所以我們非常擔心中國的系統如果進入臺灣,這些資安對臺灣人所造成的風險,因為這一案目前是在公平會審查當中,我們也會嚴格的去監督,要拜託數發部,針對目前這個高德地圖,一定要依據你們的專業去進行資安的檢測。謝謝。
侯次長宜秀:謝謝委員。
吳委員沛憶:因為時間有限,國科會先請回。
接下來我就快速的來請教數發部,我很關心GPU的算力,過去在這裡也曾質詢過,去年我們臺灣主權AI訓練的語料庫在12月已經上線了嘛,語料庫當然要持續擴充,可是我們的算力擴充也很重要,本來是不是數發部有預計要買100片的GPU,結果去年後來……
侯次長宜秀:因為……
吳委員沛憶:是不是因為立法院預算審查的關係,預算被砍了,後來沒有買?
侯次長宜秀:是,去年因為預算被刪減的關係,就沒有購買,沒有辦法建這個算力。
吳委員沛憶:本來我們是預計要買100片嘛!
侯次長宜秀:是。
吳委員沛憶:因為我看了你們3月在交通委員會的質詢,有國民黨的委員質詢時提到這個GPU不是說要買嗎,怎麼還沒有買,應該要加速來建置,然後他們說他們並沒有刪除預算,但是你們說預算有被刪除,所以沒有買,是因為什麼原因?
侯次長宜秀:就我所知,就是預算刪除的關係。
吳委員沛憶:我看了一下,因為上次在審預算的時候,交通委員會其實只刪了3.2億,後來到政黨協商的時候,對數發部又通刪了20億,其實我在當時也是一直主張,立法院是監督單位,審查預算時可以刪預算,可是不要用通刪的方式,因為你不知道會刪了什麼項目,然後通刪沒有監督的理由,要刪減預算應該是要依據所看到的狀況,例如我們真的認為某個計畫的執行率不好或是預算不需要那麼高,才來進行刪減,但是用通刪的方式,結果變成當時通刪了20億,而刪除的委員到今天不知道他自己刪掉了這100片GPU的預算。去年,堂堂中華民國臺灣的數發部,本來要買100片的GPU,坦白說,100片都很少了,不是嗎?其他國家要建立AI算力中心,上萬片可能都不夠,結果我們連100片都沒錢買,我們國家有這麼窮嗎?所以要拜託數發部,因為馬上又要開始審查預算,你們今年是不是有續編GPU的預算?
侯次長宜秀:有,今年有編。
吳委員沛憶:今年一樣是預計要購買100片?
侯次長宜秀:對。
吳委員沛憶:要拜託你們多跟不同黨派的委員來溝通。
侯次長宜秀:是,我們會非常努力。
吳委員沛憶:這個算力對臺灣來講真的很重要,要拜託你們加強溝通,謝謝你們,謝謝主席。
侯次長宜秀:謝謝委員。
主席:謝謝吳沛憶委員的質詢,請官員回座。
主席(郭委員昱晴代):接下來請伍麗華召委。
伍麗華Saidhai Tahovecahe委員:(11時12分)謝謝主席,有請中研院、國科會、數發部三位副首長。
主席:有請。
伍麗華Saidhai Tahovecahe委員:針對今天安排的這個主題,我先問幾個問題,大家也可以拿出手機,如果有AI軟體的可以試試看,我大概先問三個問題,分別是難度一顆星、兩顆星、三顆星,這樣可以嗎?好。我先說為什麼我要這樣問,因為在28年前,1998年我們制定了原住民族教育法,到了2019年做了一次大的修法,其中很重要的一個改變就是把實施的對象從過去的原住民學生變成全體國民,這是因為我們發現在臺灣這個小小多山的國家,我們對身邊周遭的原住民族群不是很認識、很了解,推動以來,也許有一些長足的進步,但還是有一些問題想要就教大家。
首先請教一下,8月1日是什麼日?這個難度是一顆星,哇,都不行?是原住民族日。第二題請教一下,為什麼會把8月1號訂定為原住民族日?也不行?因為1994年8月1號公布施行的憲法增修條文把山胞正名為原住民,所以就把這一天訂為原住民族日,作為一個紀念日。第三題可能連各位的AI軟體都沒有辦法找到答案,因為我試過,第三個問題就是要請教,日本人來臺灣,最後一個進入的部落是哪一個部落?有沒有民族所的?
彭副院長信坤:民族所副所長。
伍麗華Saidhai Tahovecahe委員:可以嗎?
丁副所長仁傑:不好意思,因為我自己不是研究原住民族的,我不太清楚這個事情。
伍麗華Saidhai Tahovecahe委員:好,所以我們全體國民的原教還是有一大段要努力的,這個部分我覺得滿悲傷的,真的滿悲傷,因為我們可能知道美國怎麼樣、可能知道中國怎麼樣,但是我們對身邊這些原住民族群的文化、歷史、語言,甚至是人,可能有很多的不認識,我就直接回答這一題的答案,因為AI絕對找不到,是1933年接受招降的玉穗社,玉穗社是布農族,也就是說,日本人最後一個收服的其實是布農族,而且是接受招降,因為打不下來。
玉穗在哪裡呢?就是前幾年非常有名,有一條小小的玉穗溪竟然把明霸克露橋沖斷了,在南橫段,也就是現在高雄桃源那個地方,這個地方其實有一位很有名的文學作家,他是誰呢?以前我們還不能夠用原住民族名登記的時候,他叫王新民,他是國小老師,現在已經過世,他恢復的族名叫做Husluman Vava(霍斯陸曼·伐伐),他有一個著作叫玉山魂,這本著作榮獲2007年臺灣文學獎圖書類長篇小說金典獎,裡面有一段話是「如果你的出現是認為要幫助我、教育我,那麼請你回去。如果你將把我的經驗看成你生存的一部分,那麼或許我們可以一起努力。」為什麼我要特別講出這段話?因為在4月13日的深夜,有一位臺東大學布農族教授Haisul Palalavi,他是臺東大學的教授,他忍了很久,趁著一個深夜發文,而且標題是「澄清文」,我們很難過的是,因為他發現有一本出版的專書「臺灣原住民族知識論」,而且還副標「去殖民批判」,其中收錄的一篇文章在第一頁就提到了他,筆者寫道自己在部落進行田調的時候,與當地族人進行了一次深具啟發性的訪談,然後就寫了一個當地布農族人對這位學者教授的批判,說他的知識都是從書上看的,而且說他談的那些祖居地他沒有去過。書中這個深具啟發性的訪談,搞了老半天,竟然是他晚上在布農族乾媽的庭院中輕鬆聊天時聽那個人講的話,他就把這些話放在學術專作裡面。
各位都是學者,為什麼沒有原住民學者發聲,而是這個受害的當事人在忍了很久後在半夜發聲?因為他們都很清楚,在學術界自己是面對什麼樣的困境,他們也要常常接受審查,所以他們不敢發聲。我特別難過,因為這個很明顯,我在民國86年寫碩士論文,這個道理就已經很清楚了,研究倫理我們要保護、要去識別化,沒有!沒有做事實查證,也沒有做衡平報導,甚至是錯誤的詮釋,我們非常的難過。
我今天要特別談這些,就是要談我們為什麼那麼重視原住民的主權AI,為什麼我們不斷的談原住民族也要成為一個學門,因為人類學家本來是在學習在地者如何感受,但是我們沒有想到,把這種輕鬆聊天的八卦寫進去,經常有很多學者到我們原住民部落,我們也會在那邊講八卦,輕鬆的聊天、講笑話,結果把這個寫進去,傷害了那位Nihu,而且那位Nihu很聰明喔,一個部落可能有20個Nihu,但是這個受害者Haisul Palalavi,全名就那麼一個,我們知道是誰,這是一個毀人聲譽的事情,毀了自己的聲譽,也毀了中研院民族所的聲譽,犯了一個非常低級的錯誤,所以在這個部分,其實就暴露了長期以來我們在談的:仲裁者的優越視野,不自覺地用西方學術霸權去看待這些田野資料,把原住民視為「顯微鏡下的客體」;又知識生產的權力不對等,因為學者握有編排、篩選、定調田野資料,甚至詮釋的生殺大權;而且是一種慈善的迷思,帶著「為族群發聲」的一廂情願,卻忽略了可能導致污名化的結果,所以我今天特別站在這裡,因為如果我不發聲,大家也不好意思發聲,今天中研院負責的是研究倫理,國科會負責的是學門的建立,數發部主導未來這個AI語料庫的建置,所以我特別邀請三個部會正視這個問題。人類學倫理重視個人的知情同意,以前我們沒有做到,但是各位應該都很清楚,2005年原基法出來之後,把個人的同意拉到集體的同意,所以原基法第二十一條寫得很清楚,政府或私人如果要做學術研究,要取得原住民族或部落同意或參與,原住民得分享相關利益。
我要跟各位講,礦業法還有很多法案都已經在踐行諮商同意,我們對學者、學術界非常尊重,還沒有這樣強烈的要求,但是我們也很了解歐盟有一個所謂的taking care計畫,所以我想請問中研院,未來民族所的博物館可以開放讓原住民的學者一起申請合作研究部落文物嗎?
丁副所長仁傑:中研院民族所一直有辦工作展示,就是把過去蒐集的那些文物回到部落再重新展示,現在已經辦到第六屆了,所以我們長期有跟……而且我們還有原住民部落的獎助、研究獎助都有,也補助原住民族的研究生,這些長期都有補助計畫,也是我們一直在執行、在做的,我們也希望這方面能夠更擴大實作的範圍。
伍麗華Saidhai Tahovecahe委員:你說的這些我都了解,但是我舉個例子來講,像我們某個部落的祖靈柱,大家談文物要返鄉,但是都只做半套,可能第一次的文物返鄉來一個什麼呢?結婚,讓這個祖靈柱跟你們結婚;第二次是結親、結拜,其實在原住民看來,很客氣,但是我們不是不知道、也了解那個不是尊嚴、平等對待的做法,所以剛才講的我都了解,但我們是希望平等、共同的來分享利益,然後能夠做到FPIC(自由、事先並知情同意),這已經是聯合國、全世界一個很普遍的標準,希望我們的學術界能夠共同來做。
今天最主要是說為什麼我們需要原住民族的研究學門?因為原住民族研究不等於原住民做出來的研究,大家都可以做,而且原住民族研究的方法論跟研究倫理,其實是目前任何學門都沒有辦法有這樣的規範含納的,它是很獨特的,所以我們一直強調希望成為一個正式學門,然後有國家常態性的科研分類,具有正式學術地位,長期、穩定的基礎研究資金投入,然後透過嚴格同儕審查,產出客觀、正確、可用於AI訓練的系統性知識體系,提供AI這個大水庫乾淨的水源,因為我們不希望AI複製歧視、複製錯誤,這也是為什麼我今天要特別在這邊請中研院、國科會、數發部共同成立一個平台,就我剛才所談的學門,還有關於建置AI語料庫的時候,原住民能夠不被邊緣化,我們有很多乾淨的資料、水源,希望這個水庫能夠正確的建置起來。不曉得這個部分有沒有辦法在三個月內給我你們平台討論的成果?
陳副主任委員炳宇:好,委員,我們三個月內提供報告,謝謝。
伍麗華Saidhai Tahovecahe委員:可以喔?就是關於學門建置跟未來主權AI的建置,只要提供我你們預計怎麼做、怎麼投入資源經費,可以嗎?
陳副主任委員炳宇:好。
伍麗華Saidhai Tahovecahe委員:好,謝謝,謝謝主席。
主席:謝謝伍麗華召委,三位請回。
主席(伍麗華Saidhai Tahovecahe委員):接下來請蔡春綢委員進行詢答。
蔡委員春綢:(11時27分)主席、各位同仁,大家好,有請三個部會的代表。
主席:好,請三個部會機關代表上備詢台。
陳副主任委員炳宇:委員早。
蔡委員春綢:三位代表好。今天我要針對AI浪潮中的產業結構與人文深度失衡的問題提出質詢。首先請教國科會副主委,先前我在經濟委員會曾經質詢過有關運動產業的議題,我們臺灣的運動產業,不管是球拍、球鞋或者自行車,出口產值都是全球名列前茅,但當我們談到AI跟軟體應用的時候,情況卻讓人非常非常失望。目前的情況是政府投入大量預算進行AI補助計畫,但是結案之後,我們只看到一堆研究報告成果,卻沒有看到具體的出口產值,反觀來自中國大陸的一個高德地圖app,近期在臺灣市場引起軒然大波,他們憑藉著紅綠燈倒數還有車道導航,就已經有非常強大的AI演算法,直接衝擊我們對對岸軟體發展跟導航系統這樣一個軟體智慧的思維,我要請教副主委,上週總質詢的時候,國發會說有信心做得比高德還要好,國科會的看法呢?
陳副主任委員炳宇:報告委員,其實除了學術界在推動AI研發之外,我們也很積極的推動學術界跟產業界的合作,希望能夠把AI推動到百工百業,所以在這個部分,我們是真的很努力積極在推動當中,我們也滿有信心,因為以臺灣目前的人才跟產業狀況,應該是有機會可以做得到,謝謝。
蔡委員春綢:好,那我們期待可以看到我們的軟體產值,其實最主要是因為我們國家已經投入不少經費在這部分,希望可以看到跟硬體一樣的亮麗產值,所以我們很擔心,為什麼別人能夠把AI做成全世界有感的一個app軟體服務,但我們都是在寫一些程式、看到一些結果報告,我們希望臺灣不要一直停留在製造業的思維,只會做AI晶片、伺服器,卻沒有辦法有自己的軟體靈魂,那我們將永遠只能做別人的代工廠,副主委,你的看法呢?
陳副主任委員炳宇:跟委員報告,的確是這樣,所以我們也很積極推動培育系統人才、培育更高端的應用人才,希望能夠協助推動軟體的部分,謝謝。
蔡委員春綢:好,請國科會加油!接下來邀請中研院,我想有幾個觀點,有人提到臺灣社會長期……這個是中研院院長接受專訪的時候有提到,臺灣社會長期重工商輕文理,人文學科的核心價值在於培養具備格局跟視野的領導者,這與我們之前的觀察不謀而合。AI的發展不能排除人文,最近兩岸的文化對談也有提到,人類的審美是最後的防線,AI可以生成大量的知識,但是無法注入人生的經驗。中研院目前編列了1.2億的預算要補助AI在人文跟科學的創新運用,例如用AI來解鎖歷史的文本,或者是發展多模態的基礎跟模型,請問副院長,除了目前的計劃,有沒有更具體的作法,讓這筆1.2億的經費預算能夠產出學術論文?如何讓主權AI真正與臺灣自由、民主的創意結合,創造出具備臺灣價值,能產出商業產值的人文AI典範?
彭副院長信坤:謝謝蔡委員的關心。我們廖院長特別關心,所以過去兩年來我們特別有撥一筆預算在人文這一塊。中研院原來就已經有數位文化中心,是已經有資料了,但是就我過去的了解,人文部分的發展不可能那麼快的原因是,比如剛才說要解鎖日治時代的文本,我終於了解其原因就在,比如像民族所做的戶籍謄本,他們是用手寫的,不像用Word、用PDF馬上可以唸。因為是用手寫的,不同戶政人員的筆跡不一樣,所以必須要有一些時間去判讀。這部分我們會持續地努力,應該學習會越來越快。
蔡委員春綢:好,院長承諾要用AI來詮釋嘛!
彭副院長信坤:是的。
蔡委員春綢:好,最後我請數發部。今天要請問一下次長,我就引用金融時報的最新數據,在亞太地區500大高成長的新創公司當中,新加坡跟印度各有101家,南韓有79家,次長要不要猜猜看,我們臺灣有幾家入榜?
侯次長宜秀:這個圖上是顯示16家。
蔡委員春綢:是16家。次長要不要再猜猜看,我們臺灣進入前100名的有幾家?
侯次長宜秀:不太清楚。
蔡委員春綢:好,在前100名當中,臺灣竟然只有一家,而且排名在第97名。這說明了什麼?在AI快速融入商業改變經營模式的當下,臺灣的腳步遠輸日、韓還有印度、新加坡。我想問次長的是,我們發展AI的這個產業,到底是在幫助中小企業降低成本、發揮創意,還是淪為大者恆大的幫兇?有請數發部次長。
侯次長宜秀:跟委員報告,我們數發部在採用五大政策工具,不論是人才、資料、算力、行銷或者是資金,這五個政策工具面向上都非常對準中小企業,因為我們是在協助從算力上降低中小企業投入研發、AI研發的成本,我們提供免費的算力,讓中小企業可以進入研發的環境。在人才上面,我們也特別針對中小企業,提供他們需要的人才培訓,包括獎勵、補助這些機制,在新創上面百億資金的投入也是針對新創公司去做投入的。
蔡委員春綢:畢竟大公司跟小公司還是有差別,小公司的資源比較少,希望真的能夠協助中小企業。
侯次長宜秀:是。
蔡委員春綢:最後我希望:第一、能夠落實軟體產值的考核。行政部門應該要重新檢討AI補助的標準,不能只看研發,最後軟體的出口,商用化的產值我們還是要強調。第二、要強化人文AI的轉化機制。請中研院思考一下,如何讓研究跟技術能夠落實到生活文化還有運動產業具體的藍圖。第三、我們要縮短AI造成的數位鴻溝。政府應該針對那九成無感的非科技業勞工,利用AI工具提升他們的產值跟薪資,而非讓AI把貧窮的差距拉得更大,這是我們期待的。臺灣不能只有台積電這樣一座孤山,我們需要整片充滿創意與人文底蘊的綠洲,我們大家一起努力,謝謝。
侯次長宜秀:謝謝委員。
主席:謝謝蔡春綢委員的質詢,請官員回座。
下一位有請羅智強委員進行詢答。
羅委員智強:(11時37分)主席,有請國科會陳炳宇副主委、數發部侯宜秀次長、中研院彭信坤副院長。
主席:好,請三個機關代表上備詢台。
陳副主任委員炳宇:羅委員好。
羅委員智強:輝達執行長黃仁勳表示,各國必須擁有獨立的AI基礎建設,其重要性已經超越發展原子彈,他認為建立AI基礎建設對國家而言是絕對必要的,是贏得全球競賽的關鍵,全球至少已經有20個國家著手推動主權AI,臺灣當然不能缺席。
本席先肯定兩件事情:第一,國科會的國網雲端算力中心,是打造主權AI的算力基礎,這一步本來就應該要做,也算是走在前面,這是第一個要肯定的;第二個,中研院跟數發部合作,釋出超過620萬詞元的研究與科普文本,上架到臺灣主權AI訓練語料庫,也願意把多年累積的學術成果拿出來支援本土訓練模型,這一點我也覺得肯定。
我們也看到黃仁勳執行長提出的五層蛋糕理論,最底層的就是電力,AI運作都要電力,能源是萬物之基,所以決定AI系統產出多少智慧的根本就是電力。在AI時代,算力就是國力,我想要請教一下,以臺灣現在的能源結構,足以支應AI發展所需要的龐大電力嗎?評估過嗎?
陳副主任委員炳宇:跟委員報告,在我們國網中心所建置的算力中心當中,我們其實有做電力的評估,基本上是OK的。
羅委員智強:是OK喔?我看到你們在短短3年間的AI算力,這是台綜院的報告啦!臺灣目前有36座資料中心,3年內AI算力中心的電力負載規模將是目前的7.5倍,把這些都算進去,你仍然覺得電力是夠的?
陳副主任委員炳宇:跟委員報告,在國科會掌握的部分當中,我們是都有做盤點。
羅委員智強:如果核電沒有重啟,夠嗎?也有評估嗎?這個評估是有把核電重啟算進去,還是沒算進去?
陳副主任委員炳宇:跟委員報告,因為我們的算力中心之前在建置的時候,應該是在之前沙崙的……應該是還沒有把核電重啟這件事情考慮進去,其實就已經是夠的。
羅委員智強:是夠的,所以現在政府在計算電力的過程當中,因為缺電而想重啟核三的核電,並不包括AI算力的部分?電當然是大水庫啦,也沒有說什麼……你所謂的電夠不夠,也不能說我們的電力夠,AI算力就夠了,AI算力也是占掉電力大餅的一部分,對不對?
陳副主任委員炳宇:是。
羅委員智強:所以我覺得國科會還是要整個去評估,而不是說你現在去看電力規模,而是要去評估整體電力需求的成長,包括AI電力需求加進來的狀況,要根據實際的狀況去評估。
陳副主任委員炳宇:是。
羅委員智強:接下來我想請教一下,去年底在YouTube的影片當中有一個有萬人訂閱的陳志明醫師,他宣稱北榮跟臺大醫院發現糖尿病的致病元兇,而且用革命性的細菌療法就可以治癒;另外也有一個影片在網路流傳,內容是臺大醫院肺癌的權威醫師推薦一款可逆轉肺功能的藥物,以及在社群平臺上出現長庚知名中醫推薦宣稱可以改善糖尿病及四肢水腫藥物的廣告;還有三總眼科的名醫推薦眼藥水。我想請教數發部的侯次長,你知道我剛剛講的這些影片跟廣告有什麼共通之處嗎?
侯次長宜秀:就是以專門職業去進行廣告。
羅委員智強:這些都算鬧得沸沸揚揚,我覺得數發部也要稍微了解一下現在實際的狀況,我剛剛講的這些都是AI生成的,就是以深偽的假人或假冒名人傳播不實訊息甚至賣假藥詐騙。事實上,隨著人工智慧日益發展,AI生成的內容真的已經越來越真偽難辨了,很容易讓人誤信為真,我看到對岸在去年9月有強制規定,所有AI生成的文字、圖片、影音內容都必須包括顯示標識以及隱示標識,平臺在服務提供者的內容上架或上線時要進行審核,檢驗生成、合成內容的標識,否則就要加風險提示。我想請教次長,針對這種AI生成內容的深偽影像,數發部能不能訂出所謂的標識指引,具體要怎麼做?怎麼樣提高內容來源的透明跟可辨識性,以降低這些深偽影片、AI影片對於公共跟社會安全的危害?
侯次長宜秀:謝謝委員,就深偽影片、生成式影片的標註或生成式內容的標註,我們現在已經在研議指引,也同時跟各個平臺來討論在技術方面能夠做到什麼樣的程度,就是對目前這個狀況以現在的技術水準可以做到什麼程度,包括剛剛您提到的顯性標識還有隱性的標識,也包括之後跟平臺如果發現是偽造而且有造成損害的狀況,需要怎麼樣的處理機制,對這個我們都已經在進行當中。
羅委員智強:我是希望數發部還有相關單位要加快腳步,因為AI生成的深偽技術已經被廣泛運用在一些造假、詐欺的濫用行為當中,你可以看到,在過去沒有AI技術的時候詐騙就已經猖獗到這種程度,越來越棘手,那現在有AI這個助力,更是如虎添翼,所以要拜託數發部跟相關機關採取興利除弊的措施,請你們加快腳步。
侯次長宜秀:好。
羅委員智強:謝謝。
主席:謝謝羅智強委員的質詢,請官員回座。
接下來有請羅廷瑋召委進行詢答。
羅委員廷瑋:(11時45分)謝謝主席,有請國科會陳炳宇副主委、中研院彭副院長、數發部侯宜秀次長,謝謝。
主席:請三個機關代表。
陳副主任委員炳宇:召委早。
彭副院長信坤:羅委員好。
羅委員廷瑋:早安。我首先要請教副主委,對於用AI生成的文字,國際期刊目前是否接受投稿?
陳副主任委員炳宇:跟委員回報,應該是不接受。
羅委員廷瑋:好。此外,國際間針對AI生成的內容用於學術研究論文發表是否已經有相關的規範或通行的標準?
陳副主任委員炳宇:目前應該是沒有相關的標準。
羅委員廷瑋:沒有嘛?
陳副主任委員炳宇:對。
羅委員廷瑋:國科會今天所提書面報告的內容著重於說明推動AI的研發還有在科研上的應用效益,然而本次專案報告所聚焦的AI研究應用的倫理,中研院今日在書面報告第6頁對這個議題其實已有相當明確的說明,報告裡面寫:「針對運用AI從事學術研究及發表所生研究倫理與學術倫理問題,目前面臨的課題主要是,除了訂定『參考指引』等建議性的規範外,如何解釋及適用既有的相關倫理規範,例如在指引已要求落實揭露的基礎上,使用AI生成的文章是否應該揭露?內容大量使用AI生成的研究成果是否構成『抄襲』或『造假』?相關機關是否需要針對AI訂定新的行為規範,以供遵循?」副院長,請問這裡寫的「相關機關」指的是哪些機關?
彭副院長信坤:跟羅委員報告,我們中研院已經在開始落實一個做法,就是任何一個研究計畫書送上來,我們都有辦法用AI目前的軟體去偵測到底有多少部分是AI生成的、多少部分是AI改寫的,我們都會進一步去追蹤。
羅委員廷瑋:對,有這樣的技術嘛!
彭副院長信坤:沒有問題。
羅委員廷瑋:你們說相關機關要針對AI制定新的規範,你認為是哪些機關?
彭副院長信坤:關於規範的話,目前我們中研院有自己要求自己,其他學界的部分,我想應該要科技部跟教育部共同來……
羅委員廷瑋:應該有國科會吧?對吧?
彭副院長信坤:對,羅委員,我們現在面對一個牽涉很多的問題,就要各個學門來形成共識,比如說,過去翻譯的文章算是一個研究成果,那上面只寫「譯著」,可是現在用AI翻譯的,到底它的authorship要怎麼去算、它的credit要怎麼去算,我想這個……
羅委員廷瑋:關於標準在哪裡,我覺得對這個部分要大量的討論,大家來研究。
彭副院長信坤:對,要討論。
羅委員廷瑋:沒有說一刀切就是一定可以或一定不行嘛!我們透過討論來訂定一個標準,有跡可循嘛!副主委,針對中研院的建議,請問是否需要對AI訂定新的行為規範?
陳副主任委員炳宇:跟委員回報,其實我們國科會一直都有在針對AI制定一些指引的規定。
羅委員廷瑋:好,我認同中研院報告所指出的,就是AI確實有助學術發展還有提升整個研究的效率、品質,對這件事情我們正面看待,也肯定國科會長期推動AI的研發以及科研應用的努力。但是我認為現在AI在學術上的應用有許多混沌、曖昧的地方,我們也要把它拿出來好好的去做一個探討。所以我們慢慢來討論,無論如何,將AI界定清楚,不論是對學者個人、甚至對整個學術端都是有幫助的,我想大家應該都認同吧?
陳副主任委員炳宇:是的。
羅委員廷瑋:好,也因為現在大家都使用AI,關於怎麼樣使用AI是合情、合理、合法的,還有什麼樣的情形可能涉及學術倫理的風險,我覺得有必要跟大家說清楚、講明白,因為如果不講清楚,萬一誤觸了,學者的整個研究是不是也會付諸流水?請問國科會,AI生成的內容怎麼界定?有使用到AI就算嗎?應該不是吧?
陳副主任委員炳宇:跟委員報告,其實還是要回到研究的本質,AI其實是一個工具,它只是輔助的工具,它不應該成為研究的……
羅委員廷瑋:主體?
陳副主任委員炳宇:對,不能讓研究人員拿來做一些不當的使用然後藉此偷懶或卸責。
羅委員廷瑋:我知道。
陳副主任委員炳宇:所以我們還是會回到研究的本質,希望PI可以對他所提出的研究內容負責任。
羅委員廷瑋:對。
陳副主任委員炳宇:就算他使用了AI工具產生圖片也好、文字也好,他最後還是要做確認、還是要負責。
羅委員廷瑋:所以AI生成是生成到什麼階段就不行?我們基本上還是希望能夠界定清楚。
陳副主任委員炳宇:跟委員報告,也不能說AI生成到什麼程度不行,應該是說就算整篇都是AI生成的,但是核心的價值、核心的內容是他所提出來的原創性,然後他對整篇文章還是要負責任,就算他的文字是經過AI潤稿、潤飾,這個應該都還是屬於合理使用的範圍。
羅委員廷瑋:合情、合理?
陳副主任委員炳宇:是。
羅委員廷瑋:我就是想要問你,如果用AI潤飾文章,把贅字拿掉,但是基本的核心還是他自己的,這個有沒有學理問題?如果今天我們把它訂定清楚,沒有學理問題,基本上大家就會比較放心,因為怕會有誤觸或相關疑慮。
其實我今天也遇到一個滿尷尬的事情,我今天自拍,但是有一根頭髮翹起來了,我請AI幫我修掉,然後我就貼上去臉書,結果它就直接給我上一個AI標籤,好像說我沒有到那個地方,沒有在那個地點、時間出現,所以就造成一些誤會。我趕快拿ChatGPT生成的過程跟大家報告,我在那個時間點人在那邊,只是我的頭髮翹起來了,我請AI幫我修掉以後,我就直接貼了這個圖片,這就是有所謂的誤解,但是這個都還好,這只是一個臉書貼文。我們不希望學術研究的時候會有誤解、誤觸的問題,所以在學術倫理的訂定,我們希望能夠更加嚴謹,不是嚴苛,而是要有一定的步驟,有跡可循。接下來如果研究成果大量使用AI生成內容,國科會如何認定是否抄襲或造假,這是我今天很關心的問題,關於揭露義務是否有一致標準,是否要採用全面揭露,還是有重大影響的才揭露,這個部分有沒有具體的指引?
陳副主任委員炳宇:跟委員報告,其實我們都是要求要全面揭露。
羅委員廷瑋:沒關係,你們訂定清楚,好不好?我們要的是有跡可循,而不是現在我來指導你什麼樣是對、什麼樣是錯,因為實務上你們更清楚。
陳副主任委員炳宇:是的。
羅委員廷瑋:是否有需要訂定新的AI行為規範?
陳副主任委員炳宇:跟委員報告,其實AI行為規範與我們一般學術倫理規範是一致的,所以還是回到研究人員需要有學術的原創性等等,就算使用AI工具,這跟我們以前使用其他工具是一樣的規範。
羅委員廷瑋:跟副主委討論一個我認為非常重要但目前相對被忽略的問題,AI在學術圈的使用已經相當普遍,政府除了鼓勵使用之外,有沒有清楚地告訴研究人員應該如何使用AI,使用AI的時候應該搭配哪些保護措施,以及哪些情況是高風險,有沒有去告誡他們,以及有沒有進行相對應的教育?
陳副主任委員炳宇:跟委員回報,我們應該是有提供AI指引,而且一直隨時在修正當中。
羅委員廷瑋:舉例來說,AI是自己去學習,你可能跟AI不斷地對話,在這個過程中不斷地訓練,讓AI從不懂到懂,也把自己尚未發表的創建、研究、設計、實驗數據與AI分享,這些想法是你獨創的,但是也可能在跟AI討論的過程中被AI學走,獨創的內容一旦系統留存再利用,甚至成為後續模型訓練或者是服務優化素材的時候,就有可能產生研究構想外洩、機密流失、智慧成果被擴散的風險,所以學術單位也說他們不喜歡雲端,他們喜歡地端,對吧?
陳副主任委員炳宇:對。
羅委員廷瑋:所以這個部分不是不可能發生,而是AI進步太快,一不小心就洩漏,這個部分的教育以及如何使用,我覺得我們也要超前部署。
陳副主任委員炳宇:是,我們會做提醒。
羅委員廷瑋:請教副主委,將未發表的實驗數據初稿輸入AI進行校對分析的時候,這些敏感資訊的隱私歸屬為何?
陳副主任委員炳宇:這些應該都是我們研究人員自己要小心一點的。
羅委員廷瑋:自己要小心,所以作為主管機關、相關機關,我們也無法幫他?
陳副主任委員炳宇:對,因為我們很難去做實質上限制,就像在沒有AI的年代,我們也會要求你要把實驗數據等等資料,在實驗室當中做好一些控管,我們其實之前都有提醒、要求,AI時代也是一樣的做法。
羅委員廷瑋:現在是有AI的時代,大家也要有新的適應,新的自我審視的觀念,但是我們希望在品質建立的過程中,建立監督的機制也好,有相關的輔助功能也好,這個部分不是AI輔助,是我們要輔助使用者或學術研究過程有這樣的相關指引,當然有一部分是一般性應用及學術倫理的歸納,基本上大家都會有一個初步共識,但是我們還是希望後續能夠更加明確,因為我們還不知道AI未來的變化能夠有多少,大家一起加油,好嗎?
陳副主任委員炳宇:謝謝委員。
羅委員廷瑋:另外簡單問一個問題,訓練AI算力先要有高效能的設備,就是GPU,GPU的成本高達上千萬,學者如果要做這項技術,首先要有上千萬的資本額,這是入門的一個關鍵,政府可以具體協助業者什麼項目,請問數發部?
侯次長宜秀:跟委員報告,在算力上,數發部從去年開始就有建立算力讓業者能夠運用,現在已經有一百八十多家廠商來利用,去年比較可惜的狀況是因為預算刪減的關係,我們本來要增購100片GPU就沒有辦法購買,但是我們也另外去跟國網中心商借了一些算力,所以持續性的提供給業者使用。
羅委員廷瑋:只有購買GPU這一項方法嗎?基本上,不管是借算力或者是其他業者在研究地端、在研究所謂大型語言模組的時候,其實不一定都是靠GPU,因為我們也有接觸到一些業者,他們有提供新穎方法,我希望提出這個問題,購買GPU當然固然重要,但是只有GPU不斷地購買是唯一走向嗎?我覺得這個部分數發部是不是也應該多進行……
侯次長宜秀:我了解委員所提到的目前各種不同的、新的降低算力需求的做法,我知道也有硬體廠商提供新的架構,比如用其他的硬體設備來取代GPU,這個都是我們可以討論、合作。另外一個部分是在促參通過以後,我們也希望結合民間的力量、他們所興建的預算能夠提供部分給公共使用。
羅委員廷瑋:我最後再提這個問題,就是希望數發部能夠廣納意見,多了解一下廠商所提供的新穎計畫、技術,因為我們也有看到,我覺得不錯,GPU不再是購買的唯一選項,畢竟耗費的大量預算是人民的納稅錢,我們也希望有更切實際或者是花在刀口上的部分,我們能夠來參考,有必要需要我介紹,我們也都願意,只要能夠讓我們的環境、產業更好,我們大家一起努力,好嗎?
侯次長宜秀:謝謝委員。
主席:謝謝羅廷瑋召委的質詢,請官員回座。
接下來有請鍾佳濱委員進行詢答。
鍾委員佳濱:(11時59分)主席、在場委員先進、列席的政府機關首長官員、會場工作夥伴、媒體記者女士、先生。有請國科會陳副主委、數發部侯次長以及中研院彭副院長。
主席:請三位機關副首長上備詢臺,謝謝。
陳副主任委員炳宇:委員早安。
彭副院長信坤:鍾委員好。
鍾委員佳濱:副院長、副主委及次長,今天我們要談的是數位透明度分級兼顧資安與取用,科專計畫能否支援能源設施社科研究,我們來看一下原生數據,到底我們是要限制取用,還是放寬取用,這在AI基本法當中討論很多,像歐盟GDPR是為了保護隱私限制取用,但是相對的就是影響到AI的發展速度。現在歐盟大概是主要先進國家AI應用程度發展最慢的,相對地我們看到吉卜力畫風,日本政府的法令規定放寬取用、允許二創,但是這樣就影響到原來創作者的權益,先請問國科會副主委,你認為我國AI基本法之後的取向會偏向哪一邊?只能選一邊,不能兩邊都選。
陳副主任委員炳宇:其實AI基本法設定的過程當中,真的是兩邊衡平的。
鍾委員佳濱:衡平的,副院長,你也是這麼認為嗎?
彭副院長信坤:沒有絕對二選一,我想學界要形成一個共識。
鍾委員佳濱:好,侯次長呢?
侯次長宜秀:我們的目標是希望放寬取用,但是採用技術的方式來保障個人隱私。
鍾委員佳濱:很好!侯次長說明了,因為部會的權責不同,數發部要發展,當然要降低取用限制,但是我們看到的「資料取用」與「被取用者」,基本上,這有2個對價關係。如果AI的數據資料庫取用,對方的商業機制允許你取用,那你要不要有一個回饋機制?這是我們要討論的。但是如果民眾他有社交隱私,你要取用,那就要去識別化,這就是對價關係的設計。但是對於AI取用的對價關係,國科會在未來「AI基本法」實行之後的各項行政規定,有沒有一個思考?
陳副主任委員炳宇:跟委員報告,這個我們跟數發部應該會共同的一起來努力。
鍾委員佳濱:好,跟數發部啦!那我舉個例子,你們猜猜看這是什麼東西?這叫做「地籍資料」。你知道什麼叫做「地籍登記簿謄本」嗎?沒有人有印象?沒有!譬如說:我去銀行貸款前,我要去申請我本人名下的土地資料,它就會出現我的名字、出生年月日、身分證字號和住址,因為銀行要對保嘛!還有我有沒有設定抵押?但是如果今天我是狗仔隊,我看到陳副主委常出入某棟房子,那我就可以根據門牌號查到他的地籍,然後我就可以根據那個地籍登記簿謄本查出那個土地是誰的。如果說全揭露啊!我就可以說這個陳副主委跟某某地主有一些不尋常的曖昧關係,是不是?所以要限制嘛!
但是如果我是一個房客、承租人,我要去租你的土地,我好歹要知道你是這個土地的地主吧!所以政府提供的資訊要因著它的用途不同、身分的不同,有不同的取用項目,所以會分成登記人、任何人、以及登記名義人利害關係人。
但是有一種情況,我舉個例子,你們聽聽看。最近我在跟能源署討論臺灣未來的電力配置,它說未來能源署會根據……因為用電者需要知道目前每個地區的用電需求量,所以它會把每個電表的大數據下放到地方政府,讓民眾、用電人可以知道該地區的用電狀況。這個很可怕,我先問一下副院長,如果說你住在某個區公所,那個區公所可以上網看到所有家庭的電表,那我可不可以找不在家的去偷東西?
彭副院長信坤:對,所以這個部分應該是個人資料保護法要檢討的問題。
鍾委員佳濱:是的,所以當我們形成大數據要來供人民使用的時候,一定要有一些考量。但是這些還是有一些不平等,不只是身分不同、用途不同,還有算力的不平等。同樣的算力,強的人就可以掌握比較多的資訊,相對較弱的人就沒有辦法取用。我舉個例子,上個月有一個新聞,法國航空母艦戴高樂因為波灣戰雲吃緊,它要去馳援,結果有個軍官在航空母艦上跑步,因為他有使用一個慢跑app,這個app的資料是公開的,結果有人去查,發現他在印度洋上跑步,人家馬上就查出航空母艦的軌跡了。所以這個就是數位平等的數據近用權,還有數位隱蔽,因為要確保資安和國安除了,這兩個部分,還要溯擴及到你的算力,請問陳副主委,未來在立法的時候,會不會考量到立足點的不同?你們會不會有一個分級數位透明、數位隱蔽的相關子法?
陳副主任委員炳宇:這個可能……
鍾委員佳濱:可能要問數發部?
陳副主任委員炳宇:對,是。
侯次長宜秀:是,跟委員報告,這個部分確實在我們現在推動法律修正的過程,我們會有風險分類。您剛剛講到的這個部分,其實是風險分類中非常重要的一個部分,就是隱私的這個部分,我們會在不同的應用場景下去跟各部會對接,希望他們可以考慮到這件事情。
鍾委員佳濱:好,要注意到,因為媒體的數據近用權,會因著你的算力多寡不同,其實對有的人來講是隱蔽的;對有的人來講是透明的。如果你的算力不夠,雖然是透明公開的資料,但是你也沒有辦法使用,就像我說的地籍登記簿謄本,我想在座的有多少人用過?大家可能都不曉得自己可以申請第二類、第三類的謄本。
我們來看工商時報前天的新聞,台電董事長說,AI資料中心的用電規模堪比半導體產業,但是廠房的面積比較小,可以建在都會地區,但會對既有電網形成挑戰。什麼意思?我們往下看。所謂的算力靠電力;電網要韌性,但是電網裡面有變電所、儲能設施、燃料電池,鄰避效應要怎麼去處理?陳副主委,你們在設這些算力分布的時候,有沒有想過這個問題?還是哪一個人要回答?你們在強調算力的同時,有沒有考慮到「Power Couple」?
陳副主任委員炳宇:跟委員回報,我們在建置算力中心的時候,都有跟台電保持聯繫,有確保供電的來源。
鍾委員佳濱:但是台電很困擾,你們只是需求者,困難誰要去排除?台電要去排除,那台電怎麼排除?我舉個例子,過去我們在教文委員會,我們常常談到文資保存,文資保存常常在被認定為古蹟之後就被一把火放火燒掉,為什麼?因為地主怕被限制,因此後來有人就從都市計畫下手,想出一個叫做「容積率移轉」,我給你容積率獎勵,但是你臺灣銀行的這個古蹟不能拆、不能改建,但是你的發展權,我換算成容積率移轉到你臺銀的其他地方大樓,有沒有聽過?有聽過容積率移轉的這個獎勵吧!
好,這個是誰想出來的?這個就需要社科的研究才有辦法去解決,單單是台電,它有能力創設容積率移轉獎勵嗎?很難。但是你們要有算力、要有電力,問題都要解決,但是鄰避設施,像變電所在臺北市是不容興建的,那請問你,NVIDIA要落腳到臺北市,你要怎麼辦?陳副主委,你認為?
陳副主任委員炳宇:我們可以鼓勵學者做這方面的研究。
鍾委員佳濱:不是鼓勵,你們有科專計畫,我是覺得你們要鎖定,不是只看算力而已,你們要思考我們的科研在國家社會不能超然於社會而外,所以我們的科研計畫要支援的不只是科學應用,還要在應用的過程中有一些社科的調查,這樣才能協助政府機關。我們不只要統合這個科研資源,還要能夠發展出應對的有效政策,同不同意?
陳副主任委員炳宇:同意。
鍾委員佳濱:好,那最後呢!我們就往下看。這是最後的結論,所以希望在AI基本法的框架下,請數發部針對不同的算力;請國科會評估推動分級數位透明、數位隱蔽的相關子法,2個部會共同合作,可以嗎?2位,陳副主委跟侯次長。
陳副主任委員炳宇:OK!
侯次長宜秀:好,沒有問題。
鍾委員佳濱:請對著麥克風答復。
侯次長宜秀:是,我們會這麼做。
鍾委員佳濱:國科會好像有個人文及社會科學研究發展處,是不是?
陳副主任委員炳宇:是。
鍾委員佳濱:未來的科專計畫,是不是能夠專門針對能源設施如何符合鄰避效應去做社科方面的研究調查?這是中研院的,還是國科會的?我看你們這邊有一個人文及社會科學研究發展處。
陳副主任委員炳宇:對,我們有支持人社的研究。
鍾委員佳濱:是,那你們有沒有科專計畫?
陳副主任委員炳宇:國科會的不叫「科專計畫」。
鍾委員佳濱:那你們叫什麼?
陳副主任委員炳宇:我們就是研究計畫。
鍾委員佳濱:研究計畫,那科專計畫是由誰來分配?由國發會來分配?
陳副主任委員炳宇:經濟部。
鍾委員佳濱:由經濟部來分配,但是經濟部說是國科會分配完了之後,他用他們分配給他的部分。來,你們問問看,後面有人要回答?
陳副主任委員炳宇:那應該是指科技計畫。
鍾委員佳濱:科技計畫,好。那未來的科技計畫可不可在對其他部會匡定的額度內?或者你們優先的來支援這樣的社科調查跟研究?還是中研院想自告奮勇?中研院你們也有法律研究所。
陳副主任委員炳宇:科技計畫是這樣,就是各部會會提出一個申請,然後由我們這邊來做一個統籌。
鍾委員佳濱:好,希望你們未來審核的時候,要多多支持這樣的社科研究,好嗎?
陳副主任委員炳宇:好,謝謝。
鍾委員佳濱:謝謝。
主席:謝謝鍾佳濱委員的質詢,請官員回座。
接下來有請楊瓊瓔委員進行詢答。
楊委員瓊瓔:(12時9分)好,謝謝主席。楊瓊瓔發言。首先邀請中研院跟國科會。
彭副院長信坤:楊委員早。
楊委員瓊瓔:賴總統上任之後宣誓,我們每一年都要編列300億元(大概美金10億元)來推動人工智慧(AI)的資料中心跟相關的發展。AI是全球性的,它不只是科技的議題,它更是國安、產業與民主治理的核心競爭力,所以現在全球都在談AI主權,誰能夠掌控模型資料和算力,誰就能夠決定這個規則,所以我們今天要討論AI的學門建構應用,以及它的研究應用和倫理,還有它的數位透明化配套措施。
在整個學門的建構這方面,AI的核心學門應該包括基礎模型、語言模型、AI安全和計算社會科學。所以本席要請教中研院跟國科會,目前我們的AI研究,你們是不是有進行跨領域的整合?有沒有完整的AI基礎學門地圖?因為外界都有一個想法跟隱憂,就是我們是不是偏重在晶片製造這方面,而忽略了整個模型的研究,或是AI的倫理跟社會影響的研究這方面?來,請回答。
彭副院長信坤:好,謝謝楊委員,你的問題很好。我們中研院在做的就是剛才我報告上提到的,我們非常的強調人文跟科學的創新研究。人文方面,因為它過去的資訊背景不是那麼的強,所以我們就成立了一個AI辦公室,鼓勵跨領域的研究,所以會有很多資訊方面的人才來協助我們。另外,比如說:我們廖所長所做的模型,他的資訊背景非常強,最近他也有跟生命科學的人合作來研究阿茲海默症相關的行為。我想我們中研院有這個條件,也有這方面的人才來做跨領域的研究,但是我們不可能包山包海的都做,所以要看我們的人力相對的強項在哪裡,根據我過去的瞭解,雖然感覺上我們投資AI很多,但是比起來還算是少,一個是人的問題,一個是錢的問題。我們要全面的發展還是有我們本身的限制,還是會面臨很大的挑戰。
楊委員瓊瓔:我們有這個信心和軌道,但是你還是認為有不足的地方?
陳副主任委員炳宇:國科會這邊跟委員回報。說實在的,其實AI每個學門都有,所以跨領域的整合我們早就已經做在進行,不管是生科領域也好、人社領域也好、自然領域也好、防災領域也好,我們都有AI的導入,所以這個跨領域的整合是本來就有在做的,國科會也有做AI的盤點。
楊委員瓊瓔:這個非常重要,尤其是這個盤點,因為現在是全球性,每一個領域都是必要的。
請數發部,2025年12月23日立法院通過人工智慧基本法,它等於是我國第一部法律位階的人工智慧相關規範。同時,我們也預估2年內要完成相關的法制領域,這可以說是非常細部的去完善相關法制以及制定相關的子法跟配套措施,這是我們一直要努力去完成的。
財訊「AI時代大調查」,邀請上市櫃企業副總級以上的高階主管填答問卷,結果顯示有六成的企業知道政府正在推動AI政策,但是多數的企業對於立法的過程並不是很嫻熟,有三成認為這個政策到目前為止他都沒有什麼感受,所以在國科會這部分,雖然你們有訂定相關子法的修訂時間,但是我個人要請問,AI基本法通過之後,你們國科會的配套以及子法的修訂,現在進度為何?
陳副主任委員炳宇:跟委員報告,現在我們正透過行政院的「三政委平臺」在做子法的盤點跟修正。
楊委員瓊瓔:所以這個時間是關鍵的時刻,特別是針對加強企業對政策瞭解的程度,我個人認為這一點是國科會在制定相關的制度跟子法時,企業的部分務必要加入這個因子。所以在臺灣AI治理的三個核心面向,包括制度的強度、組成的能力跟透明的治理,雖然這些目前我們都有在推動,但是如果跟歐美相比的話,我們似乎還有很大的空間要追,在這樣的情況下,因為歐盟已經有完整的法制,美國也正努力的在開發這個模型,我們現在是在基本的框架,因為歐盟有AI Act,它也有罰則和風險分級,所以國科會跟數發部是否有針對高風險的AI有強制審查的制度?這個制度要怎麼樣去建立?特別是有關AI的責任歸屬制度,這也是你們現在修正這些子法裡非常重要的元素。數發部先回答。
侯次長宜秀:是,跟委員報告,「人工智慧基本法」通過之後,數發部已經把人工智慧風險分類的框架送到行政院。同一時間,在國科會和「三政委平臺」的指導下,基於風險框架,我們已經開始跟各部會協作來盤點應該修訂哪些法律,然後剛剛有提到……
楊委員瓊瓔:送到行政院了?
侯次長宜秀:是。要特別跟委員報告,在跟國外對接的部分,因為歐盟的人工智慧法架構太過複雜,而且缺乏彈性,所以他們有提出一個新的法案,就是要討論、修正「EU Omnibus」這個法案,因為他們想要簡化某些流程,所以針對高風險的部分,我們會協助各部會針對他們所主管的業務範圍內特定AI應用場景下的風險是否屬於高風險來去做評估和識別。如果是高風險的話,依據基本法的規定,我們會需要評測的工具、標示、救濟或是保險制度,這些因應,我們都會跟各部會協作。同時,我們也有跟金管會討論,保險的部分是不是可以有一些推動的方向?因為各部會必須要對他們所主管的業務範圍內的AI應用場景先做盤點,我們會針對比較成熟的、應用廣泛的、風險程度高……的
楊委員瓊瓔:先進行之?
侯次長宜秀:是的。
楊委員瓊瓔:這個非常重要,因為世界各國走在前端,他們有很多的優缺點,這些我們都可以拿來參考。
侯次長宜秀:是。
楊委員瓊瓔:國科會要不要補充?
陳副主任委員炳宇:國科會會跟數發部一起努力。
楊委員瓊瓔:一起努力。接下來本席要討論的是,剛剛中研院也說我們有這個能力,但是對於很多的人力跟預算,他們也有提出,但是我個人還是要討論一個,就是說,在我們所有的企業界裡頭,到底我們要怎麼樣協助企業來運用AI,尤其是國科會這邊?現在似乎所有的企業趕快派人出來學習AI,也就是AI人才訓練,目前的情況是如此,但是我們也有看到一個統計數據,有超過五成的受訪人員認為高科技最能快速導入AI;消費與零售服務業和金融業大概各15.9%;醫療生技的部分大概是11.2%;國防軍工是4%;傳統製造業僅有2%,所以我個人還是要請政府無論如何都要加強協助中小企業進行轉型,因為有四成的業者,包括傳統產業跟科技業的廠商都希望政府可以加重這一塊。同時,對於專屬的補助跟獎勵這方面,希望可以有更專門的部分來加速AI的落地。當然,這必須要跨部會,但是3位是靈魂指揮中心,來!
彭副院長信坤:謝謝楊委員的報告。其實我們很早就注意到這個問題,我們覺得最快的方式就是從業界來訓練,所以三、四年前,我們成立了「人工智慧學校」,它不屬於中研院的編制,但是它現在的董事長是我們的院長,而且裡面的老師,包括執行長,都是我們院裡面的人員。我們是從各產業裡面去挑選他們來報名,我們覺得他對本身主管的業務最熟,所以從這裡面去訓練他們最快,結果我們現在得到的回報是,現在有很多的產業都非常感謝我們幫他們訓練這方面的人才。
楊委員瓊瓔:非常好,所以這個部分要怎麼樣加強?請問國科會,在整個企業界裡頭,我們到底要怎麼樣去協助他們?
陳副主任委員炳宇:跟委員報告,其實國科會跟經濟部有一起合作去推動中小企業導入AI的部分,我們希望中小企業跟學界老師可以相互合作,儘早將AI導入他們的……
楊委員瓊瓔:目前產業界也都非常積極推出人員來學習AI,但是學了之後到底要怎麼放?第二階段才是重點。所以你把方案及書面資料提供給本席,謝謝。
陳副主任委員炳宇:是。
主席:謝謝楊瓊瓔委員質詢,請官員回座。
接下來請張雅琳委員進行詢答。
張委員雅琳:(12時21分)謝謝主席,有請數發部侯次長。
主席:請數發部侯次長,謝謝。
侯次長宜秀:委員好。
張委員雅琳:侯次長好。本席第一次質詢次長,畢竟我們過去一起寫AI基本法,我對AI基本法一直非常關注的一個重點,就是有關於兒少影響的部分,所以在這次兒少影響性評估裡面,我有看到是做了這個評估,但是其實裡面完全沒有兒少的聲音,數發部是告訴我們是因為時間有限,所以相關兒少人員沒有辦法參與,但是其實行政院的專家諮詢會議也非常明確的建議,應該要邀請兒權會的兒少委員,所以我想瞭解為什麼還是沒有納入任何一位兒少的聲音呢?
侯次長宜秀:跟委員報告,確實因為12月23日基本法通過以後,附帶決議要求我們在三個月內要做三個影響評估報告。
張委員雅琳:對,沒錯。
侯次長宜秀:我們在這個過程中,因為又牽涉到中間有過年那段時間,那需要去做各部會的協調,因為這個影響評估也不是只有我們數發部主責,其他還有包括吳政委這邊,然後還有跟院內的性平處、人權處。
張委員雅琳:坦白說,其實你們還是可以邀請嘛,因為行政院本來就有兒權會了嘛,對吧?
侯次長宜秀:我們接下來會持續滾動調整,不是故意不邀請。
張委員雅琳:明明是兒少影響性評估報告,裡面卻沒有兒少的聲音,我認為是一個蠻大的問題,我待會再跟您討論這個問題。另外,我覺得有一個問題,就是在這一次的問卷裡面,我們雖然是參考了國際的風險管理通用的辦法,去把可能性跟影響程度上做出了一些評分,但是我認為有一些是根本就不能夠評分,應該直接列為禁止事項,例如兒少性剝削影像生成的問題,或是兒少詐騙合成性影像的勒索等等,這些都應該是直接列為禁止,且不能夠被接受的事項,而展翅協會其實在會議之中,或者是他們後續跟我們反映的時候,也都有提到應該要有一條明確的界線,不曉得次長的看法又是怎麼樣呢?是不是應該有一個明確的界線,來直接說明這是完全禁止的事項?
侯次長宜秀:跟委員報告,我們整個風險評估框架包括了四個步驟:第一個步驟是辨識盤點應用場景;第二個步驟是在特定的應用場景底下有哪些風險是識別風險;第三個步驟是評估這些風險的嚴重性和發生的可能性;第四個步驟就是剛剛您說到的,到底針對哪些風險我們要做什麼樣的因應措施,那這些因應措施確實包括了您所說的,是不是直接採取禁止的措施,或者是必須要先審視,或是要用什麼樣的方式來限制。那在這個評估報告裡面,我們其實做到第三步……
張委員雅琳:是,沒錯。
侯次長宜秀:後續我們會持續,其實已經開始包括……
張委員雅琳:有第四條線,就直接把紅線畫出來嘛,對不對?
侯次長宜秀:是的。
張委員雅琳:那就非常好,我想次長過去對這個議題也非常非常關注嘛,所以我相信也期待我們還是秉持這樣的專業,能夠緊緊守護我們的兒少,就是在哪一條完全不可以跨越的紅線,就應該要直接把它踩下去,明確的列出來。
接下來的另外一個問題,因為有很多的團體也告訴我們,其實在你們自己的會議應該都有蒐集到這些資料,就是這個問卷非常的難以填寫,而且不是只有一個專家學者這樣講,你可以看到光這個名單上就有五個人說這份問卷非常難填寫,所以您剛剛有提到說會做滾動式修正,但是如果用這個方式做滾動式修正,連大人都非常困難了,對兒少一定是更加困難,對這個部分是不是會重新檢討我們現在的研究架構呢?
侯次長宜秀:是,跟委員報告,這一次其實是時程的關係,我們又希望儘量能夠徵詢多數專家學者意見,因為當時要進行譬如工作坊或是審議……
張委員雅琳:瞭解、瞭解,因為時間有限啦,所以我想是不是未來在現在這個問卷架構之下的研究流程,你是不是會重新做設計?
侯次長宜秀:會的、會的。
張委員雅琳:否則到時候蒐集到的意見要如何執行?在現場跟實務上面運用都非常的困難。第二個,回到我剛剛講的,我們還是需要納入兒少的聲音,過去在兒少大會裡面也有提到,他們其實希望各個部會是不是都可以有兒權小組,是不是也可以趁這一次數發部來研議成立我們自己的兒權小組?因為接下來我們要做滾動式修正嘛,因為AI的變化非常非常的快,是不是也可以來成立兒權小組?我們就可以更快地諮詢到這些兒少代表的意見。
侯次長宜秀:跟委員報告,我們現在是跟各部會進行協作,因為各部會都會需要透過這個流程,所以我們的基本原則是希望運用原有、既有的制定機制,然後我們把這個新的觀點放進去,所以我們會跟……
張委員雅琳:但是這樣子就會擔心討論的時間變少嘛!
侯次長宜秀:對啊!
張委員雅琳:一定會稀釋掉嘛!
侯次長宜秀:我們會跟衛福部這邊,因為其實我們在過程中都跟衛福部有聯繫,請他們提供意見名單,我們會跟衛福部來協作,看怎麼樣能夠把這部分的聲音儘量具體呈現出來,我也認為這個非常重要。
張委員雅琳:當然衛福部本來就有自己的兒少推動小組,但是我們是不是也可以在數發部裡面成立呢?因為這個問題看起來就是會持續,因為兒少對於網路安全相關議題來說其實是非常脆弱的,我們應該要更積極地去瞭解他們現實的狀況,所以如果我們可以有一個兒權小組,我們就可以更積極地去瞭解他們的意見及蒐集他們的意見,是不是可以這麼做?
侯次長宜秀:我們可以研議是不是可以成立一個在技術面諮詢的兒少小組,但還是要跟委員報告,因為各個主管機關必須要去做最後因應的決定,所以像剛剛我們識別出來這些非常高優先序的風險,還是要由衛福部基於職掌,決定因應的措施。
張委員雅琳:我想大家都還是要諮詢嘛,然後互相對照嘛。
侯次長宜秀:是。
張委員雅琳:我們剛剛講的其實就是更方便的,數發部可以更積極、更快速,即時的得到兒少的意見,所以這部分可以研議,對嗎?
侯次長宜秀:是的。
張委員雅琳:大概什麼時候本席可以來追蹤相關的結果?
侯次長宜秀:我們一個月內給委員回應,好嗎?
張委員雅琳:好,謝謝次長。
侯次長宜秀:謝謝委員。
主席:謝謝張雅琳委員質詢,請官員回座。
接下來請洪毓祥委員進行詢答。
洪委員毓祥:(12時29分)謝謝主席,有請中研院、國科會及數發部。
主席:請三個機關代表上備詢臺,謝謝。
彭副院長信坤:洪委員好。
洪委員毓祥:各位長官好。我剛才看完你們交出來的報告,今天的題目是AI主權,當時國科會在TAIDE的計畫裡頭其實是很早,我先讚美中研院,起碼在報告裡頭是有提到TAIDE計畫好幾次,國科會、數發部則是沒有。這是國科會自己生的兒子,現在應該放在哪裡?
陳副主任委員炳宇:跟委員報告,現在TAIDE還是在持續進行當中……
洪委員毓祥:還是在國科會?
陳副主任委員炳宇:我們還是跟中研院在合作。
洪委員毓祥:主要是誰負責?ownership是誰負責?
陳副主任委員炳宇:我們是一起在做協作……
洪委員毓祥:我最怕聽到這種「一起」了,所謂「冤有頭,債有主」啊!
廖所長弘源:跟委員報告,我是中研院資訊所所長廖弘源,現在是這樣,整個TAIDE計畫是大型語言模型,而且是繁體字……
洪委員毓祥:這個我知道,你只要回答我……
廖所長弘源:對,現在是這樣,現在模型跟優化是在中研院,但我把多模態的也加進來了,也就是把影像……
洪委員毓祥:所以將來成功或是失敗都是中研院負責?
廖所長弘源:這件事情是這樣……
洪委員毓祥:有沒有肩膀?不然就是你旁邊那個國科會啊!
廖所長弘源:OK,沒問題!
洪委員毓祥:沒問題,這樣就好了,我只要這個答案就好,對不對?因為我參與過,我也是資訊領域的,國科會生的兒子嘛,現在把他養肥肥的是中研院嘛,如果養得不好或是怎麼樣都是中研院,這樣可以啦?好,感謝你,中研院代表請回,其他數發部及國科會兩位官員請留在臺上。謝謝。
政府針對TAIDE計畫投入大概8億預算,因為這些預算一定都是國科會編的,國科會不給我們錢,其他部會也做不出來啦。針對G-TAIDE,政府機關作為示範場域,這是誰負責?
陳副主任委員炳宇:跟委員報告,G-TAIDE這一塊是國科會幫忙在做導入,現在是有在做試用。
洪委員毓祥:好,那有多少機關用?使用狀況如何?頻率及反饋又是如何?誰可以幫我回答?
陳副主任委員炳宇:G-TAIDE這一塊,我對數字不是那麼記得,大概有6、7個……
洪委員毓祥:沒關係,交報告給我,好不好?交報告給我可以嗎?一個禮拜內交報告給我。因為我們都號稱要讓政府機關作為專用的示範場域,自己生的小孩,如果自己不用,自己種的菜,自己不吃,那別人要吃很困難。
再來,數發部數在這裡頭,我也支持這一個概念,打造主權AI的一個訓練的語料庫,逾200個機關參與,上架逾3,500筆資料集,累計逾12億tokens。當然12億tokens真的是很不夠啦,非常遠遠不夠!我的問題是全國有兩千七百多個機關,所以真正參與到目前為止大概是7%至8%,如果把你們寫的數字即3,500筆除以200個機關,平均每單位僅上傳17.5筆資料,這樣能看嗎?還是又要告訴我這是預算問題?如果是預算,那就要問旁邊的國科會了?
侯次長宜秀:確實,首先要跟委員報告,剛剛講的TAIDE計畫8億6,913.8萬元裡面並沒有包括語料庫的建置。對於語料庫的建置,目前我們有邀請到200個機關參與,對每一個機關我們都非常非常感謝他們,實際上參與的機關其實都盡可能地拿出了更多的資料。另外那些還沒有參與的機關,當然委員也知道是大多數,我們會繼續努力,我們也跟地方政府持續在推進當中。
洪委員毓祥:上次我有書面質詢,但報告還沒給我,因為這裡頭牽扯到一個很重要的問題,這些資料如果要有價值的話,有些東西還是要去購買,對不對?所以到底要如何去維運主權AI語料庫?現在我的問題是TAIDE有沒有用你的語料庫?
陳副主任委員炳宇:跟委員報告,TAIDE現在有在用語料庫。
洪委員毓祥:有在用。
侯次長宜秀:其實在語料庫釋出前,我們就已經跟中研院有討論了。
洪委員毓祥:有就好,有就好,我怕的是沒有。
再繼續下一個。今天大概比較倒楣,只有數發部在,我也問過經濟部,國發基金到時候我再來問。TAIDE當初的目的其實就是我們要主權AI嘛,所以不管是怎麼樣,也就是臺灣的一些模型要混合對不對?multimodal都可以,我的問題是數發部這邊,我們根據你交的報告,輔導242家次企業者開發266項AI模型與服務,80家產品化,我們不要講架構,這些AI模型跟服務有多少是使用了TAIDE這樣的模型?
侯次長宜秀:報告委員,您提到這個數字其實是我們提供算力的部分,就是算力上面的業者開發的部分,到底有多少運用到……
洪委員毓祥:有做統計嗎?
侯次長宜秀:我等一下請數產署來回復。另外也要跟委員報告,我們今年有一個新的計畫是很明確會用到TAIDE,然後跟業者一起合作,這個預算就是要請委員支持。現在就請數產署向委員說明。
巫副組長建恒:報告委員,我們在去年就讓TAIDE上架給業者使用,不過相關的數據我們要回去再盤一下。
洪委員毓祥:好,回去之後再交報告給我,好不好?
巫副組長建恒:好,謝謝。
洪委員毓祥:因為我只想要知道,臺灣花了這麼多錢在做主權AI,做出來我當然是希望都用,這個方向是支持的,但是我說過,政府所有的執行計畫,說實在的都是執行力的問題,再者就是所設KPI對不對的問題,我講這個是給你們參考,因為我也太熟你們了,所以我們就省略客套。
再看下一頁。因為國科會掌管著我們的科技預算,這一點我是非常有意見,因為學術歸學術的科技預算,產業的歸產業,其實產業的需求,產業是要去市場打仗的,他們最清楚產業的技術,他可能沒有辦法那麼遠,但可以針對短、中這些要攻城掠地的,所以我在想,請各位去借助一下,韓國的AI國家戰略非常清楚,第一步一定是先充實他的算力,所以4萬張GPU、追加跟NVIDIA買的26萬張,總共是30萬張,會再往上堆疊。往上堆疊之後,公共領域的算力分配5萬張,民間領域就給它21萬張,也就是總共跟NVIDIA買的26萬加他原本的4萬,然後他的目的很清楚,我都會背了,所以我還不得不佩服河正宇,對不對?韓國的AI策略首席長。也就是我先把我的算力弄完,然後做完這一些主權AI的資料模型,下一個就是要發揮臺灣的特色,就是你垂直領域的推論。垂直領域的推論就很清楚,你有工廠,你有製造化,對不對?你有physical的AI,所以不管是現代、SK,這些集團就會進來,那這個東西你就會再做到所謂的製造業的、做到智慧移動的,對不對?我想這一塊給各位參考,非常清楚,三階段的一個動程,然後最後是生態系出來。所以如果我們的算力真的不夠,就請國科會要幫忙。
第二個很重要,我最後10秒講一下就好。請國科會不要只看硬體,我們AI整個軟體關鍵技術的發展,也要多給這些產業跟相關部會支持,好不好?謝謝。
陳副主任委員炳宇:謝謝委員。
侯次長宜秀:謝謝委員。
主席:謝謝洪毓祥委員質詢。請官員回座。
蘇清泉委員、蘇清泉委員、蘇清泉委員不在。
顏寬恒委員,顏寬恒委員、顏寬恒委員不在。
下一位請葉元之委員進行詢答。
葉委員元之:(12時39分)謝謝主席,麻煩請數發部及國科會代表。
主席:有請數發部、國科會上備詢臺。
葉委員元之:兩位官員好。我們現在講AI,其實在臺灣大家都說臺灣的AI算還滿厲害,但是都是在講硬體啦,包括像我們現在股市漲那麼多,其實很多都AI的相關,但都是屬於硬體部分。但我覺得在軟體這一塊,明明臺灣有很好的條件,可是就臺灣的軟體,我不知道現在政府對於軟體的投入資料有多少,其實在上個世代,像電子支付這些的,臺灣的軟體好像有一些並沒有跟上啦,還有社群媒體等等。現在AI軟體好不容易又有一個新的機會,到底我們對於AI軟體的輔導或者是給予的資源,有沒有可能出現我們AI軟體的獨角獸?我覺得政府也應該要去重視這一塊。
現在業界比較重視的東西,我要跟兩位講,最主要就是在算力,因為大部分商業的軟體,就是AI軟體,他們要做機器人的話,其實主要還是跟國外的三大雲租用AI算力,而這個費用是非常驚人的。他要做一個對話機器人,比如說,要放在大賣場,然後顧客去和機器人對話,可能是要找產品或是詢問要買的東西在哪裡,要問一些細節,可能只有5分鐘,但是算力就是非常可觀,我不知道數發部知道這個事嗎?應該知道嘛,對不對?
侯次長宜秀:我們知道業界現在在後端會去對接各個不同的大語言模型,但是在技術的發展中,我們數發部現在也在推進臺灣本土的小語言模型的開發。
葉委員元之:你不要答非所問,好不好?我現在只是在講說,現在我們從業界軟體的需求去探討這件事情,你不用去跟我扯到你有沒有去研發小語言模型,那個是另外一回事啦,不要答非所問。我們的無限的創意是在民間,如果今天政府能夠站在輔導的立場,知道他們缺什麼,然後來協助他們的話,我們可能就會出現非常多很厲害的AI軟體,甚至可以走向國際跟世界,所以你要去幫忙解決問題,大家現在最care的就是算力嘛,因為現在算力的費用非常可觀,那我想請教一下,我們政府一直在講說要建立算力中心嘛,對吧?那現在大概是要編列多少預算來做?
陳副主任委員炳宇:跟委員回報,我們在AI新十大建設裡面大概編列四十幾億……
葉委員元之:四十幾億?編了四十幾億做算力?你的終極目標是要花多少錢?
何副處長紀芳:報告委員,像我們在沙崙的AI data center的部分,目前在主機的部分大概有123億,為期4年,到117年。
葉委員元之:4年編了123億?
何副處長紀芳:123億,就是沙崙的這個AI data center。
葉委員元之:好。那除了這個之外還有嗎?
何副處長紀芳:剛剛講的是不包含土建的部分,另外還有包含在晶創那邊有相關的資源投入。
葉委員元之:所以總共多少嘛?你們知道馬斯克建立算力中心總共花了多少錢嗎?你們知道多少嗎?馬斯克建算力中心,總共花了50億美金,50億美金就是一千多億臺幣啊。那你現在是編一百多億?
何副處長紀芳:對。
葉委員元之:所以我們國家的資源投入是一百多億啊。那請問一下,你覺得夠嗎?
陳副主任委員炳宇:跟委員報告,我們還是會持續,我們會再做持續的……
葉委員元之:你已經編到117年了,4年的計畫也才這樣而已啊!而且這個算力只會越來越多,不是嗎?
陳副主任委員炳宇:對。所以我們現在是會採公私協力的方式,跟民間多多合作來去……
葉委員元之:跟民間合作?
陳副主任委員炳宇:是。
葉委員元之:所以其實感覺上是遠遠不足,但是第二個問題就是,現在國家建置算力中心,如果軟體業者要來使用的話,是用什麼方式?租,然後補助?還是用什麼方式?
陳副主任委員炳宇:現在國網中心所擁有的算力中心有提供一個叫做AI RAP的平台,我們有大略規劃了三分之一的算力,是提供給新創的業者或中小企業,他們可以來申請,我們會有一些補助。
葉委員元之:是補助?
陳副主任委員炳宇:對。我們會有一些優惠。
葉委員元之:是怎麼樣的優惠?價格跟一般比,比如說,去租三大雲的話,會差到多少?
姚副主任志民:一定比他們便宜啦,只是說……
葉委員元之:一定比較便宜,我知道啊,難道你比較貴,人家會跟你租嗎?
姚副主任志民:對。基本上……
葉委員元之:對啊。那大概是便宜多少?為什麼今天你們回答問題都……
姚副主任志民:我們都有定價啦,至於說……
葉委員元之:是便宜多少嘛?你已經花納稅人的錢建置了,對不對?
姚副主任志民:是。
葉委員元之:為什麼要花納稅人的錢建置?就是希望能夠透過一些方式去輔導我們產業的發展,因為它可能是未來的下一顆新星啊,你們不是都強調自己是AI內閣嗎?
姚副主任志民:是。
葉委員元之:所以你的租金當然比外國便宜啊,不然誰要跟你租?我現在問的是你租金大概便宜多少。
姚副主任志民:這個我回去查,因為他們的價格一直在變,因為這個變化很快,那我們的定價都出來了。
葉委員元之:你們制定一個政策,做了一件事情,制定了一個政策,都沒有去思考價格大概定到多少能幫助得了產業,都沒有去想這個問題。我現在問,理論上這個東西你應該對答如流了,還要回去查喔?
侯次長宜秀:跟委員報告,數發部這邊有算力的支持,那個部分是透過審查流程,是免費的。
葉委員元之:所以這個是新創來跟數發部申請都免費,是不是?
侯次長宜秀:是。
葉委員元之:那審查要件是什麼?
侯次長宜秀:審查要件我請數產署的同仁跟您補充。
巫副組長建恒:報告委員,我們審查要件就是它的新穎性,還有可以產品化等等,這些對於AI產業發展比較多助益的一些要件。
葉委員元之:好。那請問一下,他們申請算力有上限嗎?
巫副組長建恒:我們還是要看……
葉委員元之:有上限嗎?上限是多少?
巫副組長建恒:我們大概是用點數來算,大概10,000點、20,000點。
葉委員元之:10,000點、20,000點是指什麼?一個月10,000點、20,000點?
巫副組長建恒:不是,就是一個週期。一個週期大概大概1個月,一個點數我們大概是算10萬tokens。
葉委員元之:10萬tokens?
巫副組長建恒:類似這樣子。就是有一個定量。因為我們的算力不足,所以我們就是用排隊的方式。
葉委員元之:排隊?
巫副組長建恒:對。
葉委員元之:所以就是很有限嘛!就講得好像很厲害,什麼AI內閣講了一大堆,然後業界真正需要的算力就是很有限嘛,然後問個價格也講不太清楚。
好啦。我知道政府一直在講主權AI、主權AI,但是說實在的,政府當然有發展AI的需求,可是其實業界對於主權AI期望不高,大家都認為這個跟他們比較沒有關係,其實算力才是最相關的,假設想要輔導我們的AI軟體的話,比起主權AI,算力這一塊真的應該要多投入一些資源。那我想問一下,你們講的主權AI是指大語言模型嗎?
侯次長宜秀:跟委員報告,主權AI其實不只是大語言……
葉委員元之:有沒有?是不是大語言?有沒有包括?
侯次長宜秀:會包括大語言模型,但是更重要的是人才、資料、算力整合,能夠訓練AI的一個能力。
葉委員元之:當然啊,當然都需要,因為這個是一個整體嘛!那我想請教一下,我們現在要建置自己的大語言模型,那現在有趕上兩年前的OpenAI嗎?誰可以回答?數發部不能回答嗎?你們不是輔導軟體的嗎?我們現在的主權AI大語言模型有沒有趕上兩年前的OpenAI?
侯次長宜秀:委員指的主權AI是指哪一個模型?
葉委員元之:就是大語言模型,我們現在政府要發展的大語言模型。
侯次長宜秀:在策略上面,數發部並不著重於大語言模型的開發,我們著重的是特用型的模型,並不是要去開發一個像OpenAI那樣子的frontier模型……
葉委員元之:所以我們的主權AI不是大語言模型,是特用模型?
侯次長宜秀:應該是說,如果委員說的主權AI的話,我們數發部應該不是專注在您所定義的這個模型上面,而是在建構整個臺灣主權AI能力,包括您剛剛所提到的人才、資料、資金、算力這些能力上面。委員剛剛講的主權AI的大語言模型是不是專門指TAIDE?可能要請中研院來跟您說明。
葉委員元之:好。那請中研院。
黃副研究員瀚萱:向委員報告,您剛剛提到的OpenAI的模型,我們確實有拿一個OpenAI的模型做為參考的基準,去年有一顆叫做OSS 20B的模型,我們拿它來當作一個參考,我們的模型在一些公務系統的應用上面的服務,對於臺灣的知識、臺灣的認知能力是有超越原版的OpenAI的OSS的模型。
葉委員元之:所以我們現在已經超過了OpenAI、ChatGPT?
黃副研究員瀚萱:對。其中一顆比較小的模型已經超過了。
葉委員元之:有超過一顆比較小的模型?
黃副研究員瀚萱:對。
葉委員元之:那我講的大語言模型呢?
黃副研究員瀚萱:它是比較小的大語言模型。
葉委員元之:好,那加油啦。加油。
廖所長弘源:委員,我是中研院資訊所的所長,我也是TAIDE計畫裡面的一員,剛剛您講的那個東西,大語言模型,以我們臺灣人口的規模,我們沒有辦法跟Google或OpenAI這種大公司來匹敵這種general的LLM,是沒有辦法的。我們能做的就是把它的東西當作一個foundation model,經過supervised fine-tuning或pre-training來帶到中游,讓我們的百工百業……因為在中游有比較大的軟體公司,或是由中研院或國科會這樣的政府機構來幫助我們的中小企業,把上面那種大型語言模型想辦法帶到中游來,然後讓中游做一個平台,來support我們臺灣的百工百業,所以我們沒有能力,因為就像剛剛講的算力部分……
葉委員元之:我問這個問題,最主要是這樣啦,就是說,我們大家講AI,講得很大,方向很大,但是真正落實到大家真正的需求,有沒有真的具體地照顧得到?就像主權AI,喊得很大聲,因為每個國家都要主權AI啊,但是實際上做出來的東西大家真的用不用得到?還是說,其實大部分的人還是會去用,比如說Google或其他的AI,這個是大家關切的問題,所以不要喊太多口號。
廖所長弘源:是。我跟委員報告一下,是有實際用到的,比如說,我們最近用了一個影像的部分,我們就是在上游的部分就用YOLOv7、YOLOv9,就是我們臺灣中研院自己發展出來的世界級的物件偵測系統,新竹的上市公司義隆電子把它加工以後,結合聯發科跟聯詠的12奈米晶片,還有NVIDIA的Orin晶片,合在一起,軟硬體結合以後,訓練一個中游的平台,放在CCTV上面,因為以前我們的六都的CCTV,比如說交通中心的話,都只是看到video,但是都沒有做任何的處理,但是現在義隆電的這個系統等於結合剛剛講的軟體跟硬體,用臺灣本土的帶到中游去,現在這個CCTV是用在高雄捷運的車廂裡面,就可以觀察車廂裡面的狀態,這是實際的用途。
葉委員元之:OK,好,謝謝。
主席:好。謝謝葉元之委員的質詢。請官員回座。
蔡易餘委員、蔡易餘委員,蔡易餘委員不到。
今天登記質詢的委員均已發言完畢,詢答結束。
關於本日會議,作出以下決定:報告及詢答完畢。委員所提書面質詢或相關資料,均列入紀錄,刊登公報。對於委員質詢時要求提供的相關資料或未及答復的部分,請相關機關儘速以書面答復。
報告委員會,今日議程全部處理完畢,大家辛苦了,現在休息,散會。
休息(12時53分)