“
大語言模型在公共衞生研究中的角色和問題
中大、英、越、新合作研究
越
越南語和廣東話這樣的低流通性語言,數碼資源有限且質素較低,大語言模型在這些語言中的表現通常較差。這種準確性的差異可能會令數碼鴻溝的問題加劇,因為低流通性語言主要在中、低收入國家(地區)使用。
香港中文大學(中大)醫學院與越南 RMIT 國際大學、新加坡國立大學、英國倫敦帝國學院合作,進行了兩項研究。首項研究揭示 ChatGPT 能輔助公共衞生從業員開發數學模型,制訂感染控制政策。第二項研究則發現,某些語言的大語言模型可能帶來不準確的資訊傳播,構成公共衞生風險。上述研究分別刊於《計算與結構生物技術雜誌》和《英國醫學雜誌》。
利用 ChatGPT 開發疾病傳播數學模型
在公共衞生領域,數學模型愈來愈重要,然而,並非每一個公共衞生從業員均具備所需的編程或高階數學知識,而大語言模型則可發揮作用。
研究團隊在《計算與結構生物技術雜誌》中發表的研究文章描述了具體案例。一位公共衞生從業員利用自然對話與 ChatGPT 溝通,提供文字指令予 ChatGPT 編寫程式,包括除錯及迭代,成功建立了一個經驗證的數學傳播模型。該模型可配對十天的疾病流行數據,並估算兩個關鍵的流行病學參數。與 1978 年英國寄宿學校流感爆發的歷史數據進行驗證後,該模型的估算結果與文獻一致,展示了其可靠性和現實應用性。
團隊表示,這種快速及方便的數學模型開發方法,有助擴大先進模型建立技術的應用範圍,提供更快速及更具包容性的公共衞生應對方案。
中大醫學院賽馬會公共衞生及基層醫療學院副教授郭健安博士表示:「ChatGPT 有助降低複雜疾病傳播數學模型的應用門檻… 為傳染病流行病學課程增添教育價值,讓學生能以互動方式模擬疾病擴散。」
郭健安博士
健康資訊的數碼鴻溝
在另一發表於《英國醫學雜誌》的研究中,研究團隊探討了低流通量的語言在大語言模型中所表現的數碼鴻溝及相關影響。
研究個案中,一名使用越南語的人士諮詢心房顫動的症狀,卻收到有關柏金遜症的資訊。
郭健安博士表示:「大語言模型本身存在局限性,更傾向流通性較高、數碼資源較豐富的語言。這是公共衞生資訊息傳播的一大挑戰。錯誤的症狀檢測或疾病指引會對疫情管理帶來嚴重影響。因此,加強大語言模型的準確性是重中之重。
越南 RMIT 國際大學科學、工程與技術學院高級講師鄧國雄博士表示:「大語言模型的準確性,很大程度取決於其訓練數據集的數量和質素。因有豐富的英語高質量數碼訓練資源,大語言模型在英語中的表現通常較好。相對而言,像越南語和廣東話這樣的低流通性語言,數碼資源有限且質素較低,大語言模型在這些語言中的表現通常較差。這種準確性的差異可能會令數碼鴻溝的問題加劇,因為低流通性語言主要在低收入和中等收入國家中使用。」
鄧國雄博士
新加坡國立大學李陳愛禮護理學研究中心副教授兼研究主任談維新博士表示:「大語言模型如 ChatGPT 和 Gemini-Pro 在健康資訊傳播方面提供了顯著的便利。然而,必須仔細監控它們的準確性和可靠性。」
談維新博士
為了加強人工智能的語言包容性,團隊提出了六大支柱:政策制定者制定全球公平的 AI 治理監管框架;研究資助機構增加對語言包容性的支持;科技公司改善 AI 翻譯能力;研究社群創建並共享開源語言數據和工具;醫護人員提供反饋;語言代表性不足的社群提供洞察和經驗。
來源:香港中文大學
中大、英、越、新合作研究
大語言模型在公共衞生研究中的角色和問題