Allen Hu | 图像数据与公司金融:非结构化数据分析的前沿探索

文摘   2024-09-03 21:00   北京  


2024年7月3日至5日,2024数字金融暑期学术研讨会(2024 Summer Institute in Digital Finance,SIDF2024)在北京成功举办。


此次会议由清华大学孵化的学说平台主办,康奈尔大学商学院金融科技中心提供学术支持。研讨会联席组委由康奈尔大学约翰逊商学院Rudd家族管理学讲席教授、金融学教授及《Management Science》金融主编叢林(丛林),与清华大学五道口金融学院副院长、金融学讲席教授张晓燕组成。


演讲者:Allen Hu,即将加入英属哥伦比亚大学尚德商学院担任助理教授。2024年从耶鲁大学管理学院获金融经济学博士学位,2017年从清华大学获工业工程学士学位。


本次会议共收到超过300位国内外的老师、学生以及业界人士的热情申请,最终共有约200位来自103所高校的师生和数位业界人士同时在线上和线下参会,并有18篇论文在本次会议上进行展示。



线上&线下参会人员扫描下方二维码

即可观看演讲视频回放



Allen Hu教授就视频数据在公司金融研究中的应用进行了深入讲解,探讨了如何分析高维度、大规模的非结构化数据。Hu教授首先强调,在处理非结构化数据时,研究者需要考虑三个关键步骤:选择适当的数据表示方法(representation)、确定最适合的测量方法(measurement),以及进行数据分析(analysis)。


Hu教授指出,经济学家面临的一个重要任务是将概念上模糊的事物进行降维处理。以视频数据为例,可以将其拆分为图像和音频两个部分进行分析。在文本分析方面,Hu教授介绍了从传统的词袋模型(Bag of Words)到更先进的词嵌入(Word Embedding)技术的发展。他详细解释了word2vec、BERT等模型的原理和应用,并通过多个案例展示了这些技术在金融研究中的应用。这些案例包括Hoberg和Phillips的"Text-based network industries and endogenous product differentiation" (JPE, 2016),Kelly等人的"Measuring technological innovation over the long run" (AER Insights, 2021)关于长期技术创新测量的研究,以及Li等人的"Measuring corporate culture using machine learning" (RFS, 2021)使用机器学习测量公司文化的研究等案例,展示了这些技术在金融研究中的应用。


在图像分析方面,Hu教授介绍了面部情感识别和分析的方法。他举例说明了如何利用这些技术分析第一印象对创业者融资的影响,如Huang等人的"Angel investment and first impressions" (JFE, 2023),以及对金融分析师信息收集的影响,如Peng等人的"Face Value" (JAR, 2022)。在音频分析方面,Hu教授提到了语音识别、情感分析和音频事件检测等技术,并讨论了它们在分析财报电话会议、投资者日等场合的应用潜力。


Hu教授强调,在选择表示方法时,研究者需要权衡模型的复杂性和可解释性。例如,虽然BERT等复杂模型可能提供更准确的结果,但其"黑箱"性质可能使结果难以解释。在测量方法的选择上,Hu教授指出这是整个研究过程中最具挑战性的部分。研究者需要确保所选的测量方法能够准确捕捉研究对象的本质特征,同时还要考虑到数据的特性和研究问题的具体要求。


在实际应用中,Hu教授展示了如何将这些技术应用于公司金融研究。例如,通过分析公司年报的语言风格变化,可以洞察公司文化的演变;通过分析社交媒体上的图片内容,可以评估品牌价值和市场反应。他还讨论了如何利用深度学习模型来预测股票收益、识别财务欺诈等问题。


最后,Hu教授强调了跨学科合作的重要性。他指出,处理非结构化数据需要综合运用计算机科学、统计学和经济学的知识,研究者应该积极寻求跨领域合作,以充分发挥这些新技术在金融研究中的潜力。Hu教授的演讲不仅介绍了非结构化数据分析的最新技术和方法,还通过具体的研究案例展示了这些技术在公司金融研究中的应用前景。这为与会者开拓了研究视野,也为未来金融研究的方向提供了宝贵的启示。







金科丛林
聚焦国际前沿研究,经济思想应用,行业发展动态,政策法规洞察,学研信息共享,学者领袖沟通。共推数字化,大数据,人工智能,Web3等在数字经济,科技金融,普惠可续领域的知识积累和创新应用。(康奈尔大学丛林教授数济金科实验室)
 最新文章