暑期學院特約報道之二
2024
8月11日至13日,澳大-南師語料庫與數字人文暑期學院繼續推出精彩紛呈的講座。講座內容涉及語言智能與人文研究、民族語言文字識別、搭配自動抽取與可視化分析等多個方面,從不同角度展示了語料庫與數字人文研究的前沿議題,為線上和線下的師生獻上一場場學術盛宴。
胡老師的講座點燃了線下會場參與者的熱情,大家圍繞講座內容展開熱烈討論,共同分享對數字人文應用的觀點。澳門大學人文學院院長徐杰教授與華中師範大學沈威副教授分別進行了精彩點評。
徐杰教授認為,生成式人工智能有助於扭轉一直以來人們將經過大量省略的先秦書面語視作當時完整語言的認知誤區。沈威副教授建議,針對古漢語的AI可以考慮RAG技術和微調綜合進行。在場同學學以致用,現場操作測試AI太炎的文白對譯能力。經過現場實踐,有的同學對進一步調整大語言模型的方向提出建議,有的同學興奮地表示,AI太炎為其研究方向提供了無限啟發和有效助力。本次講座也吸引了近300位觀眾在線觀看。
8月12日,中國社會科學院民族學與人類研究所龍從軍研究員圍繞“民族語言OCR文字識別最新進展與應用”這一主題開展講座。本次講座介紹了民族語言文字現階段識別現狀及問題,展示了相關的研究實踐和數字化應用手段,深入淺出地介紹了大語言模型的構建原理,鼓勵人文社科領域的研究者進一步關注古籍數字化處理、保護、利用等方面的工作,以此提高民族文字識別對多學科研究的價值。
線上、線下學員反響熱烈,與唐教授積極互動近一小時,唐教授耐心細緻地解答大家的問題,現場掌聲雷動。
暑期學院第二日到第四日的三天講座充分展現了數字人文交叉學科前沿領域的豐碩成果,每晚同步進行的實踐操作課程則手把手帶領學員們體驗語料庫和檢索系統從零開始的建設過程。11日至13日晚,南京師範大學李斌與常博林二位老師采用線上線下相結合的方式,基於古代詩歌數據,耐心細緻地講授了“數據表的構建”“數據庫的查詢”“PHP程序設計”三次課程,指導學員結合個人的研究興趣,基於自己的科研項目熟悉MySQL的進階操作,逐步構建自己的數據庫並能按需進行檢索、利用PHP生成網頁等實踐。