2024年8月10日,“澳大-南師 語料庫與數字人文暑期學院”在澳門大學人文學院隆重開幕,本屆暑期學院由澳門大學人文學院與南京師範大學文學院聯合主辦,以線上線下結合的形式,邀請計算語言學與數字人文領域的7位学者作學術報告。暑期學院開幕式在人文學院E21-3118線下會場舉辦,40多位師生參加了開幕式和講座。暑期學院吸引了來自全球20個國家及地區的371所高等院校的956名師生參與報名,最終錄取線上及線下總計110名學員,開幕式線上直播觀看人數達500多人。開幕式由南京師範大學李斌教授主持,澳門大學人文學院院長徐杰教授、澳門大學中文系主任袁毓林教授、南京師範大學文學院副院長孫道功教授分別致辭。
澳門大學人文學院院長徐杰教授表示,澳門大學人文學院以跨語言、跨文化研究為長項,本次暑期學院的舉辦不僅能夠開拓學院對外學習的窗口,亦有助於傳統與前沿研究的相互學習,在迎接新挑戰的同時為語言學研究帶來新的機遇。澳門大學中文系系主任袁毓林教授認為本次課程安排豐富、設計合理,大數據是人工智能和大語言模型不可或缺的基礎資源,對語言研究、智能服務等都具有很大的價值。南京師範大學文學院副院長孫道功教授表示,本次活動不僅體現兩校深度合作,也體現語言學與數字技術探索的結合,接下來精彩紛呈的學術活動將充分展現相關領域研究的前沿成果,亦會帶給學習者諸多啓發。主持人李斌老師介紹了暑期學院的安排、錄取情況與課程目標,表示本次報名者的熱情遠超預期。此前在南師大舉辦的第一屆講習班實踐成績顯著,希望本屆暑期學院能夠助力學習者更上層樓。
徐杰院長宣布暑期學院正式開幕,對參與本次暑期學院的各地特邀講者、學員、志願者表達歡迎與感謝,並預祝活動圓滿成功。開幕式後,澳門大學中文系系主任袁毓林講授了主題為“如何測試ChatGPT的語義理解與常識推理水平”的講座。
袁教授回顧了計算機科學家設計的新舊兩代測試大語言模型理解能力的“圖靈測試”,指出了這些測試的缺陷,介紹了解決方案,並呼籲:語言學家應該積極參與構建WinoGrade測試集相關工作,在人工智能時代擴展自身的學術研究領域,擁抱並適應新技術帶來的變化。
袁毓林教授的講座內容豐富、講解細緻,講座後的討論環節中參會師生踴躍發言、提問,討論氛圍熱烈。澳門大學人文學院徐宇航老師提出,測試大語言模型時應考慮不同文化背景下同一語言的不同應用情況。
華中師範大學沈威副教授對測試大語言模型的測試集設計提出建議。
晚上的講習班講授第一講內容“課程介紹與軟件安裝”。講習班課程由李斌與常博林主講,近110名學員在線上線下同步學習。課程開始前,李斌老師首先強調了本屆講習班的課程要求,希望各位同學能夠按時出勤、認真完成作業,最終通過講習班提升自己的技術水平,助力自己的研究。當晚課程的前半部分由李斌老師簡要介紹語料庫和數字人文的發展歷程,使學員們對這兩個方面的歷史脈絡有更加清楚的認識,隨後介紹了上一屆在南師大舉辦的講習班的最終彙報成果,鼓勵本屆學員向優秀案例看齊,在本屆課程學習結束時能夠展示出精彩的成果。課程後半段由常博林帶領學員們安裝課程需要的軟件。常博林細心負責,認真處理安裝過程中學員們提出的所有問題,線上、線下的各位助教也同步進行答疑。期待暑期學院參與者積極交流、深度探討,知識學習與技術實踐雙豐收!