人工智能已成為時代的潮流,許多國家也把『人工智能+』升級為國家發展的戰略!如何擁抱AI似乎成為各行各業的重要議題,市面上看見各種行銷廣告與產品都會主動掛上:輔導智能轉型、智能客服、陪伴聊天療癒的機器人、智能決策系統、智能銷售系統……等,不談智能好像自己落伍!但是談智能卻不知道智能為何?就如同雲服務、雲系統剛出來時,幾乎所有把『雲』當作是與時俱進的標誌,但是『講雲時卻讓人不知所云!』
在2026年1月7日的新年度人才驅動未來的論壇中,筆者提到了GAI、KM相關問題,並提到當今企業的數據資產,即使透過KM,假如缺乏數據治理的觀念,企業的KM好像一個塞滿圖書的圖書館,但雜亂無章、無序,即使是頂尖的AI智能體或圖書管理員,也會成為智障!無從發揮其本事!

核心關鍵就在『數據治理』,這是台灣當前討論GAI 智能體時,幾乎沒有人會提及的!多數人只是在談GAI 、AI智能體的展演,或是文稿生成、會議錄音轉錄,少有人關注大數據底層建構的問題!
今日閱讀了李波的一篇文章:你企業的AI為什麼總像“人工智障”?解藥就在“元數據(或稱中繼數據)”!元數據就是數據中的數據!李波的觀念與我的前述的想法相似,也用著與我一樣的圖書館作為比喻!圖書館圖書的建檔管理有一套嚴密的分類系統,這有如給每本圖書建一個『戶口』,方便到圖書館查閱書籍時,可以很方便的、很快的搜尋並找到所希望的圖書!
當你的提問時,GAI的回應讓你覺得是正經八百、胡說八道時,到底是GAI智障?還是我們提問出了問題?還是智能體出了問題?還是建構智能體時的大數據出了問題?還是建置大數據資料庫時出了問題?如果層層追問,可能會發現終極的問題可能在建構大數據庫時出了問題,因為我就根據習慣性作業方式,把手工紙本轉為數據輸入!這些原始的紙本數據本來只是為了工作方便而用,很少人會重視『數據』品質還有許多參數是有用的!
對於面對公眾的LLM模型,所採用的大數據都是來自網路海量的數據,而我們知道網路數據的品質是有問題的!如同看著媒體對同一事件的報導,確有不同、甚至矛盾的描述!具體的物理事件或社會事件是真實的!但經過『人』─有色眼鏡,資訊就產生偏差、甚至被誤導,但卻是報導者的目的!透過對資訊的操弄來達到他的私欲!我相信大家對選舉時海量網路資訊充斥著抹黑造謠更是成為政治選舉的惡招!儘管大家都知道此現象,但意識固執的人,永遠相信他相信的!不符合他意識的,都是別人惡意攻擊!不會放開心胸,去傾聽、瞭解、查核事實!所以造謠、抹黑還是有用的!對自己人有用!
回到智能體而言,這是就企業內部封閉數據庫所建構的數據庫或檔案庫!以企業而言,如果對企業內部智能體說:給我上個月台灣中區的銷售金額與利潤率!智能體可能無法回答你的問題!因為 它根本不知道什麼是『台灣中區』?或者業務部門提出銷售額的數據報告,但是財務部門會說這與公司系統數據不合!企業老闆對於公司花了大筆錢投資建構AI智能體,但出來的感覺向是智障!到底問題在哪裡?或是變成誰在說謊?…等許多問題。
最有可能的一個問題根源是:數據品質!這不是簡單的當前報表中的數字登錄正確而已,更涉及到企業在建構數據庫時,是否明確規劃設計了『數據治理』規範!企業各部門的數據蒐集是否依循數據治理規範?這是許多企業推動數位轉型、AI智能體最容易忽視的關鍵議題!智能體無法回答我們的提問,可能原因是它不懂我們的數據品質及內容!
什麼是元數據?用個簡單的比喻:AI智能體與數據湖之間的溝通、連接的橋樑!以圖書為例,就是:書名、關鍵詞、作者、出版社、出版日期、圖書編號、書的內容簡介、擺放圖書的書架位置…等標籤,這些標籤就是元數據。元數據就是數據中的數據!雖然中繼數據不是數據本身,但它讓數據變得可信、可理解、可做進一步的分析利用。在現實企業裡,元數據/中繼數據無所不在,又如物流倉儲系統,如何入庫、檢貨出庫等,同樣需要一套的元數據!但我們卻常常『視而不見』或忽視它的存在與價值。
在企業中,元數據的規劃設計與管理常成為『三不管』區!業務覺得這是IT部門的事!IT部門覺得這是業務部門的事!管理部門覺得這是個部門的事!這種現象早就存在企業推動數位轉型的過程中!到底企業轉型該由誰負責?IT部門?業務部門?還是管理部門?當企業搞不清楚這問題的本質,就形成部門之間權力與責任的互相推諉,導致企業轉型的失敗!而轉型成功的企業則彙整和技術與業務部門共同來推動企業的數位、數智轉型!這也是華為及其他企業所說的雙驅動模式。
本文僅代表作者立場,不代表本平台立場









Facebook Comments 文章留言