2024年5月8日晚上7点,清华金融高端讲坛——“Big-Data and AI in Finance”在清华大学经济管理学院建华楼503举行。美国达特茅斯学院Tucker商学院教授Gordon Phillips受邀作为本次论坛的演讲嘉宾,分享了大数据和人工智能(AI)在金融领域的重要应用价值。
Phillips教授指出,大数据和人工智能等技术近年来迅速发展和普及,颠覆了传统的数据处理方式。自然语言处理(NLP)提供了强大的自动化工具,使研究者能够高效准确地提取和分析海量文本信息,充分挖掘企业的市场结构、竞争格局、研发与创新模式。大语言模型(LLM)如ChatGPT的出现,将复杂的后台处理简化成用户友好的界面,使这些先进技术进一步得到了广泛的应用。在商业实践和金融学术领域,大数据和人工智能技术成为了不可或缺的工具。Phillips教授以苹果公司为例,探讨了如何通过应用这些先进技术,高效分析海量财务数据和市场动态,准确识别市场趋势,定位竞争格局,推动技术创新,从而在全球市场中保持领先地位。为了有效识别企业潜在的竞争关系和产品差异化程度,Phillips教授的团队开发了基于文本的网络行业分类模型(TNIC)。针对美国上市公司10-K财务报告的产品描述文本,构建了公司间的产品相似度指标,揭示了公司潜在的竞争对手和并购目标,帮助企业发现跨行业的业务拓展机会。在讲座中,Phillips教授深入探讨了大语言模型(LLM)的发展历程和应用前景。他从Doc2Vec等词嵌入模型谈起,介绍了近年来各种大语言模型的发展和演变,直到最新的GPT-4模型。教授提到,不同的大语言模型针对不同的任务具有各自独特的适应性,通过微调与优化能够实现特定领域的功能。比如,BERT具有较强的上下文理解能力,适用于文本理解和问答任务,Longformer则擅长处理长文本数据,因此应用时需要根据具体任务做出选择。这些大语言模型广泛应用于企业战略规划、金融预测、市场结构分析等方面,在金融和商业领域具有广阔的应用前景。Phillips教授向听众分享了他的研究团队基于大语言模型的一项新研究成果。他们关注了美国最高法院的Alice公司诉CLS国际银行一案,该案裁定商业方法、软件等领域的专利不再具备专利保护资格,面临失效的风险。运用Longformer模型,Phillips教授基于美国大量的专利文本数据,有效地预测出存在失效风险的专利,从而能够衡量企业潜在的专利失效和侵权风险,并进一步深入探讨了失去知识产权保护对企业创新、竞争、收购、诉讼和就业协议的影响。作为一项强有力的分析工具,大语言模型在金融学术领域已经表现出了巨大的应用潜力。
但是,Phillips教授强调,人工智能技术和大语言模型预测结果的可靠性高度依赖于输入数据的质量和准确性,因此必须确保数据来源经过充分校验。尽管大语言模型迅速发展和日益先进,但在处理文本信息时,有时可能存在模型无法准确理解的模糊性和歧义问题。由于人类专家可以更加准确地理解复杂的上下文,在处理这些模糊性方面具有优势,因此人类专家的经验和判断仍然不可替代。Phillips指出,企业应当保持警惕,确保数据的准确性,将人工智能工具与人类专家的知识相结合,从而制定更优的商业策略。
最后,Phillips教授还就听众对于大数据和人工智能技术,特别是大语言模型在模型评估、应用前景等方面的问题做了详细的分析和解答,并为金融工作者如何学习和应用这些技术提供了宝贵的建议。讲座在热烈的讨论与交流中圆满结束。
本次活动的主持人是清华大学经济管理学院中国金融研究中心主任陆瑶教授。来自清华大学各院系以及其他院校的80余位学生参加了讲座。
感谢阅读!