学术研修丨11月2日. 专为人文社科作者设计的Python文本分析课程

学术   2024-10-23 18:30   山东  

本课程专门针对人文社科背景的研究者设计,系统全面地讲解Python在文本分析领域的应用,从Python基础语法入门,讲授数据采集、清洗、文本分析等内容,并设置丰富的编程练习,让大家学会使用Python完成词频统计、情感分析、主题建模等文本分析任务,使用简单通俗的语言和案例串讲,可使大家无门槛进行软件学习。同时,课程中还会提供每个知识点的代码块,方便学员快速搭建符合自己研究需求的Python代码,省时省力,搭配课后作业和作业讲解,分析实际的研究文本,掌握研究要义。课程中还涉及一些文本相似度计算、机器学习算法等高级应用的介绍,适用于想要使用Python分析文本、提升研究效率的中青年教师及科研人员,为大家打开数据分析和文本挖掘的新视野,从而在论文写作与发表方面快人一步。另外,为了能让大家获得更好的学习体验,我们还配备了经验丰富的助教老师,负责社群内课后答疑,切实帮助大家提升学习效率和实操效果。

课程主题

专为人文社科作者设计的Python文本分析课程


课程特色

1、针对性和系统性:课程内容专门针对人文社科背景的研究者,系统讲解Python语法入门、数据采集、数据分析、文本分析、机器学习等内容,帮助人文社科研究人员学会用Python做数据分析和文本分析。

2、实战性与操作性:抛弃纯理论讲解的传模式,采用多案例串联的形式,内容深入浅出,搭配范文,力求让零基础的小白也能轻松学会使用Python。


3、互动性与交流性:每节课设置作业答疑和课程内容答疑环节,并配套助教老师及社群服务,提供交流平台,及时解答学员问题,促进学习效果的提升。

适用群体

本课程适用于对数据分析感兴趣,希望快速提升数据处理与分析能力的Python软件初学者。

时间形式

课程时间:2024年11月2日-11月23日
讲座形式:小鹅通线上直播 + 长期回放

课程大纲

第一节

初识Python

时间

11月2日 19:00 — 21:00

课程

大纲

1、Python是一门语言

2、Python的起源、应用场景和发展趋势

3、Win中的Python安装与配置

4、Mac中的Python安装与配置

5、课后作业:在电脑安装Anaconda集成开发环境

6、课后助教答疑(社群内进行)

第二节

Python语法入门(一)

时间

11月3日 19:00 — 21:00

课程

大纲

1、作业讲解

2、数据类型:字符串、列表元组集合、字典、布尔值、None

3、逻辑语句(if&for&tryexcept)

4、列表推导式

5、理解函数

6、课后作业:通讯录管理

7、课后助教答疑(社群内进行)

第三节

Python语法入门(二)

时间

11月6日19:00 — 21:00

课程

大纲

1、作业讲解

2、常用的内置函数

3、内置库文件及目录操作os库

4、内置库之csv文件库

5、内置库之中文分词jieba库

6、python入门的常见问题汇总

7、课后作业:创建文件及文件目录

8、课后助教答疑(社群内进行)

第四节

Python应用:数据采集

时间

11月9日 19:00 — 21:00

课程

大纲

1、作业讲解

2、网络爬虫原理

3、网络访问requests库

4、网页解析BeautifulSoup库

5、如何用爬虫下载文档及多媒体文件

6、课后作业:爬取百度贴吧和网站新闻

7、课后助教答疑(社群内进行)

第五节

Python应用:文本分析

时间

11月10日 19:00 — 21:00

课程

大纲

1、作业讲解

2、什么是文本分析

3、如何读取不同格式文件中的数据

4、如何将多种数据整理到一个文本文件中

5、中文分词及数据清洗

6、词频统计&词云图

7、课后作业:法论文本分析

8、课后助教答疑(社群内进行)

第六节

Python应用:数据分析(一)

时间

11月13日 19:00 — 21:00

课程

大纲

1、作业讲解

2、Pandas基础知识

3、数据去重与缺失值处理

4、合并数据与重塑数据

5、如何选取表中指定记录(行)和指定字段(列)

6、描述性统计

7、课后作业:股票基金数据分析

8、课后助教答疑(社群内进行)

第七节

Python应用:数据分析(二)

时间

11月16日 19:00 — 21:00

课程

大纲

1、作业讲解

2、如何在表中创建新字段(列)

3、批操作apply与agg

4、透视表pivot_table

5、数据分组groupby

6、时间序列时间点创建

7、时间序列date_range、重采样resample与时间窗口rolling

8、课后作业:股票基金数据分析

9、课后助教答疑(社群内进行)

第八节

Python应用:机器学习与文本分析(一)

时间

11月17日 19:00 — 21:00

课程

大纲

1、 作业讲解

2、 什么是机器学习

3、 scikit-learn机器学习库

4、 Kmeans聚类算法

5、 如何使用机器学习做文本分析

6、 如何对文本文件中的内容进行情感分析

7、LDA主题模型

8、课后作业:社会媒体交互文本情感分析

9、课后助教答疑(社群内进行)

第九节

Python应用:机器学习与文本分析(二)

时间

11月20日 19:00 — 21:00

课程

大纲

1、作业讲解

2、文本特征抽取

3、词向量word2vec扩充领域词典

4、在线评论文本分类

5、使用标注工具对数据进行标注

6、tfidf计算文本情感分析(有权重)

7、课后作业:社会媒体文本分类及情感分析

8、课后助教答疑(社群内进行)

第十节

Python应用:机器学习与文本分析(三)

时间

11月23日 19:00 — 21:00

课程

大纲

1、作业讲解

2、文本相似性计算

3、使用文本相似性识别变化

4、机器学习文本分类器模型

5、文本分析在经管领域中的应用

6、文本分析在教育学领域中的应用

7、文本分析在社会学领域中的应用

8、课后助教答疑(社群内进行)

专家简介

王毅,武汉大学博士,现任中国地质大学地空学院教授、博士生导师,“地球观测与导航”领域国家科技专家库专家、河南省自然资源科技创新中心特聘专家,波兰国家科学中心国际基金评审,国家自然科学基金、中国博士后科学基金、湖北省科技厅等项目评审专家,教育部学位与研究生教育发展中心通讯评议专家,主要研究方向为遥感技术与应用、地质与生态环境遥感监测、地学数据智能处理、空间数据库构建及大数据可视化,近年来在JOH, IJGIS, IEEE TIP, CATENA等国内外学术期刊上发表论文60余篇,出版专著1部,出版教材1部,获国家发明专利授权3项、软件著作权1项,主持与参与国家级、省部级项目等10余项课题。

助教介绍


李帅,统计学硕士,国高信息技术产业研究院数据分析师,擅长利用Python进行实证科研论文写作,熟练掌握数据获取处理、实证模型构建、机器学习、文本可视化等技术。


收费标准

全套1990,课前3人拼团

立享580

单节售价199

团报价格:9980元(不限人数)
赶快扫描下方二维码参与学习吧 


讲座社群

如有疑问

请添加客服进行咨询

缴费方式

扫描下图二维码支付

 发票事宜:
交费成功并在研修结束后10个工作日内,由国高信息技术产业研究院(山东)集团有限公司开具“培训费”项目的电子发票,通过邮件发送至联系人预留邮箱中。如对发票有特殊要求,请在报名时备注。

学习证书

学员按照规定完成研修课时,在研修结束后10个工作日内将获得电子版“学习证书”。具体领取方式:关注“科研写作研究所”公众号,点击菜单栏“科研服务-证书查询”即可领取,证书中注明研修课程名称及学时。


报销通知

扫码支付后,扫码添加客服获取下载盖章版通知


课程详情请滑动查看

语言学通讯
欢迎关注语言学通讯、翻译学通讯两个公众号。18万学者关注了我们,本号主要发布国内外语言学、翻译学、文学相关的会议讲座、1教师研修、专著推荐、期刊动态等。投稿和业务合作请联系 dianzishu@126.co
 最新文章