技术创新:课程知识图谱的建设和应用

文摘   2024-09-07 06:01   河北  


一、什么是知识图谱



知识图谱(Knowledge Graph),又被称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。知识图谱通过将人工智能、应用数学、图形学、信息可视化技术等学科的理论与方法,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。



知识图谱的建设对当前人工智能从感知智能向认知智能演进奠定了基础。随着技术的发展,人工智能已经在“听、说、看”等感知智能领域已经达到或超越了人类水准,但在需要外部知识、逻辑推理或者领域迁移的认知智能领域还处于初级阶段。认知智能将从认知心理学脑科学及人类社会历史中汲取灵感,利用知识图谱、因果推理,持续学习等技术建立稳定获取和表达知识的有效机制,让知识能够被机器理解和运用,实现从感知智能到认知智能的关键突破。



二、什么是课程知识图谱



课程知识图谱是利用学科专家和AI技术,人工或自动梳理课程内容,抽取课程知识点,建立知识点和知识点之间的关系网络结构,关联知识点和课程资源而形成的课程内容的结构化、可视化成果。

知识图谱作为课程内容的精炼,归纳,有着广泛的应用。尤其是对于线上教育,知识图谱和AI推荐算法的结合可以基于知识点的掌握情况对每个学生进行个性化教育,规划学习路径,展示学情状况,从而做到千人千教。具体来说包括几类典型应用场景:

(1)课程知识点图谱展示

(2)智适应学习:学习路径展示,学习资源推荐(3)学情报告

(4)助学机器人(课程自动问答)

(5)智能备课

课程知识图谱是AI技术和教育结合的产物,同时基于它的各种应用也是AI+教育,尤其是AI+在线教育的主战场。海量线上教育资源和基于知识图谱的智适应学习和推荐是对延续千年的“多人一教”的传统教育模式的伟大颠覆。



三、奥鹏课程知识图谱



奥鹏教育作为学历在线教育的头部企业,拥有数千门课程资源,涵盖数十个学科、上百个专业。既有课程知识图谱建设的迫切需求,也具备课程知识图谱建设所需的课件、语料资源等得天独厚的数据优势。

从2019年开始,工程中心联合产品中心,学生用户事业部和产教融合,共同进行课程知识图谱的建设和应用的各种尝试。分阶段、分批次增加课程/专业的知识图谱建设和相关应用。



四、当前成果和能力



经过工程中心AI创新组持续不断对相关技术和算法的探索、实验、预研,逐渐摸索出一套半自动化半人工(90/10)抽取课程知识点,识别知识点之间整体部分关系,关联知识点和资源(视频,文档,试题)的有效方法。

方法主要包括:视频内容的解析(OCR)、音频内容的解析(语音识别ASR)、教学大纲的解析(爬虫,数据清洗)、知识点抽取(自然语言处理)、知识点整体部分关系识别(自然语言处理)、知识点和资源关联等。

根据每门课程不同的风格,不同资源类型,由AI技术自动抽取识别,配合人工矫正,形成了一条流水线,从而将一门课程的知识图谱建设控制在1-2人日内完成,基于产品中心的老师去年人工建设课程知识图谱的反馈,一门课程知识图谱人工建立需要半个月到一个月的时间。可以看出AI技术自动抽取的流水线方法大大提高了课程知识图谱建设的效率。


课程知识图谱建设流水线


通过比较同一门课程(“马克思主义基本原理概论”)教师人工抽取的知识点和AI自动抽取的知识点,可以发现AI自动抽取的知识点粒度更精细,抽取到的知识点数量为人工抽取的数量的4倍。


同一视频片段人工抽取知识点(左侧)和AI抽取知识点(右侧)对比


上图视频片段中AI抽取相关知识点的层次结构



AI生成的福建师范大学版《马克思主义基本原理概论》知识图谱

课程总时长14小时29分钟,AI抽取知识点总数466个


AI生成的福建师范大学版《马克思主义基本原理概论》知识图谱

注:上图中橙色节点为某一个知识点,绿色节点为它关联的试题,黄色节点为它关联的视频。视频和知识点之间的“Teach”关系的属性中包含了知识点在该视频中的startTime,endTime等信息,可用于视频精准推荐


截止到目前,奥鹏已经拥有通过产品中心老师人工生成的30门课程知识图谱和通过AI技术最新生成的4门课程的知识图谱。并基于其上开发了各种应用场景。

(1)课程学情报告

(2)基于错题的试题推荐(错题本)

(3)基于错题的精准视频推荐

(4) 基于FAQ的自动问答(开发中)

后续,在持续推进越来越多课程知识图谱建设的同时,会基于已有知识图谱的内容开发越来越多的应用场景。


五、后续规划



课程知识图谱的建设和应用是一个持续不断的过程。一方面AI算法的精度和流水线自动化程度都可以进一步提高,另一方面,更多知识点关系的自动发掘(例如:先修关系识别)会对智适应学习规划等应用奠定坚实的学科知识基础。外部知识的引入(例如百度百科,中文维基百科)会大大提高知识图谱的建设及应用的算法准确性。后续AI组会重点在以下几个方面持续提高知识图谱的建设和应用能力:


建设方面

(1)引入外部百科专业知识 (百度百科,中文维基百科)

(2)知识点之间更多关系识别(先修关系,等价关系等)

(3)学科知识图谱生成 (跨课程的学科专业术语图谱)

(4)理科公式OCR自动识别技术

(5)语音识别结果自动纠错

(6)在线书籍知识图谱建设平台


应用方面

(1)基于知识图谱的自动问答

(2)基于图机器学习的各种推理,推荐算法的应用

(3)协同过滤推荐系统(基于XAPI用户行为收集)

(4)智能备课

(5)自适应学习系统


六、结束语



人工智能技术的发展和应用是二十一世纪最重要、最核心的技术潮流。随着相关算法的陆续推出和成熟,人工智能在人脸识别、智能推荐、智能客服等领域已经有了广泛的应用。

基于知识图谱的AI+在线教育将引领教育模式和学习模式的深刻变革。工程中心AI创新团队会在这个AI+教育的蓝海领域里深入挖掘,持续探索,将业务创新和技术创新结合起来,利用创新为奥鹏在线教育建立起独具特色的技术护城河。

来源:网络

说明:以上图文,贵在分享,版权归原作者及原出处所有。内容为作者观点,并不代表本公众号赞同其观点和对其真实性负责。如涉及版权等问题,请及时与我们联系删除13240705815。

师培联盟
是一家教育研究、教育咨询、出版发行、培训服务为一体具有独立经营、自主研发能力的民间教育智库。
 最新文章