以赛促学|“用友杯”选拔赛实训练习之Hadoop批处理调度器:Azkaban(二)

科技   2024-10-09 17:50   北京  

“ 用 友 杯 ”

“用友杯”第七届全国大学生大数据技能竞赛已进入选拔赛阶段,为帮助选手学习竞赛知识,提升实操技能,竞赛平台的线上学习空间新增实训项目,针对性指导选拔赛段考核重点。




实训模块三

Hadoop批处理调度器:Azkaban

4

Azkaban单一任务调度管理




任务目标

  • 了解Azkaban WEB UI界面功能

  • 掌握Azkaban单一任务调度




单一任务调度流程

  • project创建

  • job创建

  • job打包

  • 上传job

  • 执行工作流

  • 查看工程

  • 执行结果

  • 执行日志

5

Azkaban多任务调度管理




任务目标

  • 掌握依赖调度实现流程

  • 掌握依赖调度中增加子流

  • 掌握定时任务调度实现




依赖调度实现流程

  • 创建project

依赖工作流指用户按照顺序执行自定义作业,从而完成整体任务调度流程。首先需要创建调度项目Flow

  • 开发工作流

dependencies--编写job文件--压缩job文件--上传压缩包--运行工作流

  • 查看工作流

6

MapReduce任务调度管理




任务目标

  • 掌握MapReduce程序任务调度流程实现




MapReduce程序实现

(1)Map端:获取行数据,对行数据按空格切分、单词记为1。

(2)Reduce端:获取map端数据,对数据进行求和统计。

(3)Driver端:设置mapreduce程序实现、输入输出路径(参数传递)等。

(4)程序打包处理:测试程序并进行打包处理,上传至服务器指定目录。

7

综合案例:Hive脚本任务调度管理




任务目标

  • 掌握Hive脚本任务调度管理流程




Hive脚本任务调度管理流程

数据准备--编写Hive脚本--创建job文件--压缩job文件--创建project--上传压缩包--执行工作流--查看执行--验证结果



操作指引

实操练习及详细任务演示,请使用PC端浏览器打开竞赛系统链接:

https://nqxbknmmmwod.vip.qingjiaoclass.com/

注册/登录个人账号后,输入邀请码:

RRSMEP

加入学习空间后,即可开始实训操作。

点击文末“阅读原文”,可直接跳转学习空间




新道工科聚焦新IT与工业互联网,涵盖信息安全、工业互联网、大数据、人工智能、区块链、智能网联汽车、智能制造、工业智能等多个专业领域,基于用友集团和新道科技子公司红亚科技的产业与技术优势,不断深化和拓展数智化教学产品和内容,形成覆盖范围更广的课程体系及综合解决方案,为本科、高职、中职院校提供优质教学服务。

扫码关注

新道工科

微信号|hongyaa-2012

新道工科
北京红亚华宇科技有限公司(新道工科)隶属用友集团,是新道科技股份有限公司全资子公司。红亚科技肩负科技使能教育、服务中国教育事业的使命,致力于打造新时代的新工科人才培养新体系,为国内本科、高职、中职院校提供优质的教学服务。
 最新文章