Hive数据仓库精讲
- 授课地址:在线课程
- 授课学校:课工场
- 关注人数:800
- 课程原价:
- 网上报名价:99元元
- 课程详情
学习建议:
1.一定要查看官网资料,官网才是第一手资料;
2.不要怕英文,英文是一个慢慢积累的过程;
3.一定要做好笔记,最好是要养成写博客的习惯。
Hive数据仓库精讲
-
第1节 Hive入门 免费试看
-
免费hive Hadoop 体系架构 环境搭建适合人群:
有一定Hadoop基础或对Hive感兴趣的人群。
课程描述:Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析;本课时是带大家进入Hive的世界,如何搭建Hive运行时环境。
学习目标:
1.了解Hive的概念 ;
2.理解Hive体系架构 ;
3.能够进行Hive环境部署 。
学习建议:
1.一定要查看官网资料,官网才是第一手资料;
2.不要怕英文,英文是一个慢慢积累的过程;
3.一定要做好笔记,最好是要养成写博客的习惯。
目录1Hive入门学习目标01:10Hadoop概述15:03Hive概述14:25测试体系结构与部署架构07:19与关系型数据库的区别04:34Hive部署架构16:15 -
-
第2节 DDL&DML
-
¥49.00hive hive ql dml ddl适合人群:
有一定Hadoop基础或对Hive感兴趣的人群。
课程描述:Hive是基于Hadoop之上的数据仓库,可以将我们提交的Hive QL语句转换成MapReduce作业并提交到集群上去执行,那么Hive QL的编写就是非常重要的一个环节,那么对于Hive QL中的DDL和DML就是必须要掌握的基础;表的定义、数据导出以及常用的查询语句的掌握是完成大数据统计分析的基础。
学习目标:
1.了解什么是DDL和DML ;
2.能够进行Hive中数据库和表的DDL操作 ;
3.掌握Hive中表的DML操作 ;
4.掌握Hive中分区表的使用 ;
5.了解Hive中基本数据类型和复杂数据类型 。
学习建议:
1.Hive wiki中有非常详细的DDL和DML操作,建议详细阅读wiki中的内容;
2.分区表是提升Hive查询效率非常有效的方案,建议查阅网络上一些对于动态分区的文章。
目录1DDL&DML学习目标02:16Hive中数据库操作23:45表的DDL操作23:14Hive中表的DML操作32:58Hive中分区表14:44复杂数据类型13:10 -
-
第3节 压缩在Hadoop&Hive中的使用
-
¥49.00hive 压缩 hdfs mapreduce适合人群:
有一定Hadoop基础或对Hive感兴趣的人群。
课程描述:Hadoop作为一个较通用的海量数据处理平台,每次运算都会需要处理大量数据,我们会在 Hadoop 系统中对数据进行压缩处理来优化磁盘使用率,提高数据在磁盘和网络中的传输速度,从而提高系统处理数据的效率。在使用压缩方式方面,主要考虑压缩速度和压缩文件的可分割性。
学习目标:
1.了解什么是压缩、为什么要使用压缩 ;
2.能够进行常用压缩格式的技术选型 ;
3.掌握压缩在MapReduce中的使用 ;
4.掌握压缩在Hive中的使用 。
学习建议:
测试各种压缩方式在HDFS上的空间占用情况。
目录1压缩在Hadoop&Hive中的使用学习目标01:05压缩概述13:19压缩格式07:07压缩在Hadoop中的使用19:21压缩在MapReduce中的应用06:56压缩在Hive中的使用17:32 -
-
第4节 存储格式在Hive中的使用
-
¥49.00hive 存储格式 调优适合人群:
有一定Hadoop基础或对Hive感兴趣的人群。
课程描述:Hive中存储格式的选择是调优的一个非常重要的手段,要掌握各种存储格式的优缺点,并结合压缩综合运用在生产中来提升执行效率。
学习目标:
1.了解Hive中常用的存储格式 ;
2.掌握存储格式在Hive中的使用 ;
3.能够进行常用存储格式的技术选型 。
学习建议:
1.测试各种存储格式在查询时读取HDFS文件字节数情况;
2.测试各种存储格式在HDFS上的空间占用情况;
3.测试存储格式结合压缩格式的综合使用。
目录1存储格式在Hive中的使用储存格式概述06:02行式存储vs列式存储17:09Storage Format详解116:21Storage Format详解218:41 -
-
第5节 Hive进阶
-
¥49.00hive api 编程 函数适合人群:
有一定Hadoop基础或对Hive感兴趣的人群。
课程描述:前面的课时重点介绍的是对Hive的基础的使用,比如DDL和DML;本课时重点讲解的如何针对Hive进行编程:使用Java API开操作Hive、开发Hive UDF函数。
学习目标:
1.了解HiveServer2配合beeline进行统计分析 ;
2.能够使用Java API操作Hive表 ;
3.了解Hive内置函数的使用 ;
4.掌握Hive UDF函数的开发 。
学习建议:
1.学习任何一个大数据框架,掌握源码编译是第一步,因为在使用大数据框架使用过程中,会发现各种各样的bug,为了满足业务需求,那么就需要对源码进行修改,修改完之后只有编译后才能进行部署使用;
2.在工作中需要编写各种各样的UDF函数,包括UDF、UDAF、UDTF。
目录1Hive进阶学习目标02:13HiveServer2配合beeline的使用17:14Java API访问Hive表16:34Hive内置函数的使用08:43Hive UDF函数120:26Hive UDF函数219:33 -
-
第6节 Hive高级
-
¥49.00hive 元数据 作业 调优适合人群:
有一定Hadoop基础或对Hive感兴趣的人群。
课程描述:本课时是Hive部分高级的特性,掌握好这些特性能大大提升Hive的执行效率;在优化过程中可以很好的借助于执行计划来进行分析;本课时还会介绍3个本人在生产中遇到的常见案例。
学习目标:
1.了解Hive元数据表结构及关联关系 ;
2.掌握Hive执行计划 ;
3.掌握Hive中各种join的对比 ;
4.了解Hive如何将SQL语句转换成MapReduce作业 ;
5.能够进行Hive的常见调优 ;
6.掌握Hive生产中常用操作 。
学习建议:
1.Hive性能优化是在生产中的最重要的环节,如何解决数据倾斜是关键;
2.梳理清楚Hive元数据各个表之间的关联关系也能提升对Hive的把握能力。
目录1Hive高级学习目标02:45Hive元数据表30:17Hive执行计划17:48Hive中Join的用法40:48将SQL语句转换成MapReduce作业04:58Hive生产中常用操作25:59Hive调优27:16 -
-
第7节 数据导入导出框架Sqoop
-
¥49.00hive sqoop etl适合人群:
有一定Hadoop基础或对Hive感兴趣的人群。
课程描述:Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。
学习目标:
1.了解Sqoop是什么、能做什么及架构 ;
2.能够进行Sqoop环境部署 ;
3.掌握Sqoop在生产中的使用 ;
4.能够使用Sqoop进行ETL操作 。
学习建议:
1.Sqoop脚本的使用可以参考sqoop help或者官网介绍;
2.可以尝试使用MapReduce作业来完成从RDBMS到HDFS的导入操作,这样可以加深数据导入导出操作底层原理;
3.尝试搭建Azkaban或者Oozie调度平台来对ETL处理流程进行调度。
目录1数据导入导出框架Sqoop学习目标00:58Sqoop概述19:28Sqoop部署16:22实战:MySQL导入数据到HDFS118:45实战:MySQL导入数据到HDFS216:23实战:MySQL导入数据到HDFS316:58实战:HDFS导出数据到MySQL13:32实战:MySQL导入数据到Hive17:12实战:Hive导出数据到MySQL02:08Sqoop ETL案例概述04:51Sqoop ETL案例实现步骤13:43ETL实现步骤统一封装到shell12:26大数据调度框架介绍10:29 -
-
第8节 大数据图形展示框架HUE
-
¥49.00hive hue适合人群:
有一定Hadoop基础或对Hive感兴趣的人群。
课程描述:HUE是Cloudrea公司开源的,与Hadoop生态系统紧密结合的一个Web UI应用程序,可以通过Hue来查看、管理HDFS上面的文件,通过Hue从界面编写Hive的SQL语句对Hive进行查询,并使用图表直观的展示查询结果,可以与Oozie集成,用户创建和监控工作流程。
学习目标:
1.了解HUE是什么、能做什么及架构 ;
2.能够进行HUE环境部署 ;
3.掌握HUE在生产中的使用 。
学习建议:
1.HUE编译的前置依赖工作一定要准备好 ;
2.详细的安装使用一定要参考官网介绍 。
目录1大数据图形展示框架HUE学习目标00:50数据计算和展示现状04:42HUE概述16:54HUE部署13:49HUE实战开始学习第9节 Hadoop离线批处理实战项目
有一定Hadoop基础或对Hive感兴趣的人群。
介绍大数据离线批处理(特别是针对各种日志分析的场景)的处理流程和系统架构,通过一个比较复杂的案例手把手带大家实现,使得大家能够了解离线批处理有更深刻的认识。
学习目标:
1.了解用户行为日志分析的目的 ;
2.掌握离线批数据处理流程和系统架构 ;
3.掌握整合Hive及周边框架完成离线批处理操作;
4.掌握Hive常用优化方案 。
学习建议:
1.查阅资料总结常见场景下导致数据倾斜的原因 ;
2.总结常用数据倾斜的解决方案:join、group by、distinct等。
讲师介绍
-
罗皆
CRM客服系统:北京移动、贵州移动、甘肃移动、辽宁移动客服系统建设; 大数据平台:上海移动、山东移动大数据平台建设,主要负责Hive、Spark、Storm、HBase、ES等的研发及落地。
想要了解更多关于Hive数据仓库精讲课程方面资讯,可以来79招生网网上报名免费咨询!
更多课程推荐:
课工场开设有:人工智能学院、大数据学院、区块链学院、云计算学院、创意设计学院、互联网软件学院、互联网营销学院、代码学院等。
课工场提供互联网企业岗位相关的课程,面向互联网企业中热门的产品,技术,设计,运维等方向提供岗位路线课程,也擅长制作精美的入门基础课程,精选了大量课件免费提供给在校大学生。课工场的技术岗位课程包括多个专业方向:前端开发工程师课程、HTML5+CSS3开发工程师、JavaScript网页特效、Android开发工程师、JAVA开发工程师、互联网+大数据开发工程师等。
课工场全称北京课工场教育科技有限公司,是由北京大学优秀校办产业北大青鸟集团全资建设的互联网教育平台,创始团队来自中国IT职业教育领军企业北大青鸟研究院。团队在泛IT职业教育领域深耕细作19年,始终秉持北京大学严谨的治学精神,深谙互联网+职业教育的运营之道,与北京大学保持良好的合作关系。北京大学教育学院师资力量派驻课工场,为课工场提供教育理论研究支持。
课工场汇聚了中国和北美数百位来自知名互联网企业的行业大咖,向寻求就业和技术提升的人群提供直播、录播、面授等多模式教学场景,并通过遍布全国的线下服务中心提供成熟学习服务,形成完善的“互联网+教育”解决方案。同时,课工场也为高校、企业、行业提供教育技术赋能,依托Transformer智能教育生态平台,打造智慧校园、企业大学、行业培训的教育场景,提供一站式教育解决方案。
- 暂无评论!
      79招生网为第三方平台,不会向学员收取任何费用;内容素材如有侵权、虚假不实、违法违规信息等请联系我们 020-26225931。
      课程信息由培训机构(或其代理)自行发布(或提供),请用户在自辨课程虚实、有效性、及时性时留意以实际授课为准。