莊詠恩
理工學院
資訊工程學系
在參與「2025 全國 AI 專題競賽—Quantum AI 體驗組」的過程中,從基礎資料收集、模型建構,延伸至物聯網控制與量子計算模擬的完整技術。這不是一次單純的實作比賽,更是探索人機協作與計算智慧的體驗
首先從Google Colab 開始。我們安裝了 transformers 與 torch 等套件,並導入了 Whisper_Taiwanese_Tv05 模型
接下來是多模態感知的實作。利用 Llama 3.2 生成式 AI 模型,我們對拍攝的場景進行「圖轉文」的描述生成,再利用這些文字描述進行「文生圖」的再創作
資料收集完成後,要如何讓機器「理解」這些數據。在 KWS AI 平台上,我們建立了 QCI 知識模型,這是我第一次深入接觸模糊邏輯(Fuzzy Logic)的應用
有了定義,接下來便是邏輯的串聯。我們在 Excel 中建立了高達 81 條的推論規則(Rule Base),詳盡地列舉了各種情境組合,例如「當距離近、亮度暗、生成品質低時,適應度為極差」
本次實作的主要重點技術在於軟體模型與硬體設備的結合。我們使用 Thonny IDE 與 MicroPython 撰寫程式,透過 MQTT 通訊協定將雲端的 AI 推論結果傳輸至開發板
為了讓硬體正確顯示我們親自生成並設定的影像,我們甚至需要手動將圖片像素調整至 320x240 的 BMP 格式 very_poor(數值低)時,風扇靜止,螢幕顯示對應的圖片與紅燈;而當推論結果為 very_good(數值高)時,風扇自動啟動運轉,螢幕顯示 "The ability of GAI in travel is Very Good!"
實作的尾聲,我們並未止步於現有的規則,而是進一步利用機器學習演算法進行優化。透過粒子群聚最佳化(PSO)與基因演算法(GA),我們對模糊模型進行了 200 代的訓練
這次的競賽實作讓我掌握了從資料處理、模型訓練到硬體控制的完整 AI 開發流程。我學會了如何運用 KWS 平台管理複雜的模糊邏輯,如何透過 MQTT 串聯,更重要的是,我理解了 AI 系統並非遙不可及的黑科技,而是可以透過嚴謹的邏輯定義與持續的參數優化來構建的工程藝術。這份經驗將成為我未來在人工智慧領域持續探索的重要基石。