国奖特辑(一)国家奖学金获得者:胡纪鸿——向光而生,逆光而行

文摘   2024-11-18 15:26   江西  

学在江财,金融伴你成才!

胡纪鸿|向光而生,逆光而行


胡纪鸿,男,中共党员,2023级金融专硕(金融科技方向)研究生,曾任金融学院研分会实践部部长、研究生研三党支部党小组组长,现任金融学院金融服务团副团长。研究生期间,加权总成绩91.48,综合测评位列班级第一,荣获国家奖学金,一等学业奖学金(2次),校优秀团员,金融学院实践之星等荣誉。在校期间积极参加科研竞赛,曾参与赣州银行线上类贷款产品数字化风控体系建设咨询课题,荣获第二十届和第二十一届华为杯研究生数学建模竞赛国家二等奖、江西省研究生数学建模竞赛省一等奖、全国大学生统计建模竞赛江西省三等奖、华创杯江西省市场调查分析大赛省三等奖、美国大学生数学建模竞赛H奖和华数杯(国际赛)国家一等奖。

访谈记录

您好!恭喜师兄获得国奖,

师兄您取得如此优异的成绩,

想请教下您有什么学习经验

想和学弟学妹们分享呢?

第一,调整心态,勇于尝试,赛中学,学中练。相信很多人可能会因为一个比赛之前没有参与过,而产生“畏难”心理,害怕自己没学过、做不好、拖后腿等等,因此犹豫到最后往往就是放弃。但不试一试怎么知道呢?如果一个比赛,在这期间提升了自己的信息检索、资料收集整理、数据分析、软件使用、图表制作等方面的能力,哪怕没有获奖也是有所收获的,对于自己未来毕业论文等都是有所帮助的。因此,抱着这个心态,我在研一一年打了10几个比赛,在每一次比赛期间多多少少都会遇到从未接触过的内容,通过B站、CSDN、知乎等平台进行自主学习,不断解决困难,有时虽然没获奖,但收获了很多就是值得的。

第二,向优秀者看齐,赛后做好总结反思。学习优秀队伍的作品,可能是你进一步提升的良方。一个比赛没有获奖或者只获得了三等奖,那说明还有很大的改进空间,如果我们能够赛后找到优秀队伍的作品学习、聆听其现场答辩过程等,发现他们作品的优点、找出自己作品的不足,因此在下一次比赛过程中,你就会比之前有所改善,反之可能依旧原地踏步。


第三,放下得失心,倾尽全力认真对待。参加比赛大家都想获奖,因此会有一定的期待,如果想冲击好的名次,那会期望越大,同样失望也可能越大。我在本科期间,打过两次数学竞赛,当时我的高数、线代和概率论基本都是满分,因此大二参加比赛的时候觉得自己肯定能获奖,在考试的过程中发现题目难度大多比学校期末考试高很多,因此第一次没获奖。于是在大二升大三的暑假,我买来吉米多维奇的数学竞赛书进行学习,认真准备了一个半月,以平常心的心态进行答题,最终意外获得了山东省一等奖的成绩。读研的第一个比赛便是华为杯,当时基本没怎么学过机器学习、各种模型算法的我和两位队友凭借我们自己最大的努力,以完成参赛为目标,没想到最终获得了国家二等奖,8000多队伍排215名。

第四,做好时间周期规划,不拖沓,留出修改时间。对于华创杯、统计建模等长周期类比赛,很多队伍可能会临近2周左右才开始准备,这样会导致时间安排上较为紧张,最终导致修改时间少甚至没有。因此,建议大家提前做好规划,安排好每一周的任务,至少留出一周的时间来各种调格式、进一步完善等。

第五,好的队友是成功的一半。对于团队比赛,靠谱、优秀的好队友至关重要,因此建议大家多寻找自己熟悉的朋友,对于陌生人科研通过简历等方式来进行筛选。此外,有些可跨校组队的比赛,大家可以在小红书等平台进行队友的寻找。同时,也要考虑一个团队中尽量不要位置重合,最好是一个人擅长做数据分析,一个人擅长图表制作,一个人擅长文字的写作润色优化与排版等。当然,最佳的配置是每一个人这些都很擅长,这对于华为杯等比赛是一个很好的选择。

向左滑动查看更多分享

刚入学的研究生可能会有些迷茫,

就研究生这三年如何安排,师兄有哪些建议可供学弟学妹们学习呢?

第一,研一期间想清楚是要读博还是直接工作。我个人在读博与工作两个选择中纠结了长达一年,因为我的本科学历不好,想通过读211的博士来进行弥补。在研一下写完论文后进行投稿,被3.4家C刊拒绝后,目前坚定选择工作。具体来说,如果选择读博,要问自己至少三个问题:①为什么要读博,目的是什么?②自己真的适合读博吗?对学术的热情积极性等是否真的很高,还是只是一时的想法,不然很难坚持下去。③如果真的读博,自己对什么感兴趣,研究规划方向是什么?不妨自己先写一篇小论文,进行投稿发表,慢慢可能自己就会心中有答案了。如果选择直接工作,建议先明确职业规划方向,精心攥写自己的简历(在实习和项目上建议STAR法则),然后在BOSS直聘、实习僧、智联招聘、各公司公众号、网站等上面找高质量的实习,进行垂类实习。


第二,注重提升自己的数据分析和图表制作能力。无论是写论文还是实习工作基本业务处理过程中都需要进行一定的数据分析和图表制作。因此,数据分析方面建议大家熟练掌握Excel,python等软件以及Power BI,tableau等可视化工具。图表制作等方面建议大家熟练掌握PPT,origin(科研绘图),亿图图示、draw.io(流程图)等软件。

向左滑动查看更多分享


师兄您认为本次获得国奖,

自己有哪些方面的心得?

第一,熟悉了解综测、各种奖学金的评审加分规则。对规则清楚了解,方能在日常更有方向的进行努力。因此,建议大家好好研读学院的综测以及奖学金评审文件,针对性地进行努力。

第二,多打华为杯等数学建模比赛。数学建模在学习过程中,会涉及图表制作、数据分析、论文写作等,这其中需要我们熟悉掌握了解各种机器学习、深度学习模型,特征工程、模型融合算法等。因此,通过学习数学建模,各方面的能力都会有所提升,这对于打其他比赛都是有所帮助的。此外,学院非常重视华为杯等数学建模比赛,在奖学金评选中国二及以上具有一定的优先权,因此对于评选奖学金具有一定帮助。

向左滑动查看更多分享


学长寄语

非常感谢师兄抽出宝贵的时间接受我们的采访,师兄有哪些想要对学弟学妹们说的话呢?

第一,结果看平时。我一直相信一句话,走过的每一步路都算数,自己平时所做的很多努力都不会白费,当机会来临时我们才能够抓得住,而不是懊悔“早知道我之前参加…了”。

第二,时刻保持上进心,但也需要进行劳逸结合。一个人想获得的更多,自然付出的就会比别人更多,但身体健康更为重要,长时间的久坐会产生很多问题,多起来走走、运动运动,我们才能由更多的动力往前走下去。



第三,慢一点,停下来多想想。不定期的进行总结反思,想一想自己走的路是否偏离了原来的轨迹,非常重要!如果我们一味向前走,很多时候可能会迷失了方向,很多的努力可能是没有意义的。

第四,有时间多去看看远方的风景。读万卷书,不如行万里路。趁着周末、假期建议大家多去外面走走、看看祖国的大好河山,领略秀丽的风光,开阔视野、陶冶情操、减轻压力。

向左滑动查看学长寄语


独家笔记

华创杯决赛学习感受和项目不足反思

点此亲启

致各位学弟学妹们:

华创杯决赛学习感受和项目不足反思

第一,决赛作品大多为老师课题组或国家社科基金项目,且很多都暑期进行了实地调研(如果要进行实地调研,需要进行随机抽样和分层抽样)去到各大县市调研访谈,甚至有些项目发了数篇论文已经,由于时间原因我们无法做到这一点。

第二,在看了20多份作品后研究生的项目大部分都是通过做实证来进行分析(大多团队都做了基准回归,稳健性、内生性、异质性和机制检验,中介调节,Bootstrap检验等,其中做出来的每一点背后结果都需要进行深入分析),我看到的作品中只有1.2个是和我们做的情况差不多,也怪我初学stata,确实还是不会这部分!

第三,老师问的最多的也是一开始最关键的点:设计出的量表问题被调查者能不能客观进行回答,是否了解其中相关的概念,其实我在后面进行分析的时候一再发现咱们设计的量表问题以及数据有问题,为了结果显著进行手动调整表格数据进行操作。

第四,关于因变量为是否采纳这种二元变量,大多团队用的是有序probit,或者是逻辑回归,老师更加推荐使用结构方程模型SEM。其实结构方程模型,单独这一个模型就可以专门发一篇文章出来了,涉及到的内容非常多,我当时学艺不精,未能很好的进行操作。

第五,如果是有线上和线下都进行了调研,考虑一下如何最终把问卷数据合到一起。不能简单的合并!因为线下数据往往是我们和别人进行解释过的,会有一定的影响。

第六,提出的假设需要有理论支撑(这个和论文中是一样的),不能单独的提出来,常见的一些理论包括态度行为情景,计划行为,资源禀赋等

第七,很多作品都用到了python爬虫,去抖音等各大平台爬数据,虽然咱们文中也提到了爬虫,但实际上由于我还未学会爬虫,因此确实当时做不了!从而后面的词云图数据也是不严谨的(分析的每一步都需要逻辑严谨)此外,不是所有数据都是爬虫获得,缺什么数据再去爬。

第八,在进行问卷选项信息设置时应当更加具体!才能让被调查者更客观的做出选择。

第九,一种新型量表设计的方法LDA(文档主题生成模型),通过进行访谈等方式,从文本中进行主题提取,此种方法会比一般的通过看文献进行指标选取一定程度更为客观。

第十,分析要发现有价值的点,一些广为人知的结论道理推出来没有很大意义,不如不做。

第十一,一些学到的模型方法。①在进行政策效果评价时可以通过DEA数据包络模型,进行多投入-多产出分析。②smartpls-sem做结构方程软件;③Bootstrap;④链式中介效应,即一篇论文里做了x推z,另一篇做了z推y,我们可以创新成x推z推y。

第十二,数据的选取年份如果离最新年份较远(例如现在是2023年,数据最新只到2020年),那么需要补充最新状况进行说明。

向上滑动获取独家笔记丨点击打开

点我查看数模学习日常

优化:GA-MPSO

PSO+惯性因子

在介绍一个模型的时候:把题目融入模型介绍,文字+流程图

指标评价

1.变异系数(CV):反映特征离散程度

2.最大信息系数(MIC):度量两个变量之间关系强度

ARIMA-MLP:使用 ARIMA 模型处理线性部分的预测,使用 MLP 神经网络模型处理非线性部分的残差预测,最后将两部分预测值相加。

模型选择:AIC,BIC准则

超参数搜素:网格搜索,随机搜索,贝叶斯优化(最佳)

异常值分布:missingno

伪代码

模型融合:Blending和Stacking

常用方式为等权重加和,对于分类问题可以采用投票表决方法将相对多的结果作为最终的决策结果;对于回归问题,可以采用求平均值的方式将均值作为最终的预测结果。

当大多数模型表现较好,部分模型表现较差时,可以给表现好的模型更大的权重,给相对不好的模型较小的权重。

对于分类问题尽量给出概率输出,对概率进行加权平均,通过sigmoid函数得到标签预测结果。

集成学习:Bagging和Boosting

Bagging是一种并行(每一个基学习器是相互独立的)的集成学习框架,代表是随机森林。Bagging是采用自助采样法(Bootstrap Sampling)。基学习器:决策树和神经网络,是从降低方差的角度来提高集成性能。

Boosting框架代表是AdaBoost模型,在此基础上不断改进为GBDT(分类)/GBRT(回归),以及Xgboost。

集成学习的关键策略:添加扰动+增加多样性

(1)数据扰动:在样本空间上训练不同的基学习器,采用自助法;并在样本不均衡问题中,采用smote方法处理。

(2)属性扰动:当特征较多时,选择一定比例的属性训练新的基学习器。

(3)样本权重扰动:作用在损失函数上,在下一次模型训练并计算损失函数时,对表现不好的样本给予更大权重或惩罚。

(4)算法扰动:基学习器尽量采用不稳定的学习器,很多模型往往对初始化条件敏感(决策树和神经网络dropout),稳定学习器包括(SVM,朴素贝叶斯,K-近邻)

差异性分析

1.单样本t检验:用于比较样本数据与一个特定数值之间的差异情况,同时要求数据呈现正态性分布。

示例:一家食品生产企业以生产罐装食品为主,每瓶的标准重量应该是100g。为了对装罐过程进行监测,企业质检部门要进行抽检,以分析每瓶重量是否符合要求。现从某天生产的一批食品中随机抽取了50瓶,测得每瓶重量。试检验该批次食品重量是否符合要求。

2. 配对样本t检验:用于比较配对的连续变量X1与连续变量X2之间的差异情况,同时要求配对变量差值呈现正态性分布。‘

示例:检验某医院30个病人注射某药剂前后血压是否一致。

3.独立样本t检验:分析一个定类变量与一个或者多个定量变量之间有无明显差异,需要特别注意的是,该定类变量为二分类变量(三分类及以上使用方差分析),各分类频数可以不相等。

示例:如研究不同学校的学生(各学校学生数不一定相等)高考成绩是否存在差异性。

4.单因素方差分析:用于定类字段(X)与1个或1个以上的定量字段(Y)之间的差异性研究(方差分析可用于多分类定类字段数据的差异性分析,T检验只能作用于二分类定类变量。)

5.事后多重比较:在确定存在显著差异后,可用来进一步确定哪两个平均数间有差异,哪两个平均数间没有差异。


数模学习日常

图文/胡纪鸿 周艺媛 

编辑/周艺媛

学生审核人/胡力 周艺媛

单位审核人/王琪 廖春妍 赵云飞 


江财金融学院
学在江财,金融伴你成才。
 最新文章