老汤大数据微职位课程 资源介绍
分别对Hadoop的三个组件(HDFS, MapReduce以及Yarn)做了系统多面的讲解,使得我们从思想上和技术上都入门大数据。且讲解了大数据基础技术–Zookeeper,学习Zookeeper在大数据领域的应用。
全部内容涉及到Linux基础、大数据入门、NoSQL数据库HBase、Scala、Spark等大数据技术。
资源目录:
├─01 [老汤]微职位:Linux基础知识 │ 1-1课程内容.zip │ 2-1虚拟机安装(windows).zip │ 2-2虚拟机网络配置.mp4 │ 2-3xshell连接虚拟机.mp4 │ 2-4虚拟机安装(Mac).mp4 │ 2-5Linux文件系统简介.mp4 │ 3-1文件目录操作命令.mp4 │ 3-2文件目录管理命令.mp4 │ 3-3文件内容修改命令.mp4 │ 3-4文件内容查看命令.mp4 │ 3-5文件大小查看命令.mp4 │ 3-6文件压缩打包命令.mp4 │ 3-7grep命令.mp4 │ 4-1用户与用户组概念.mp4 │ 4-2文件权限的讲解.mp4 │ 4-3chgrp和chown讲解.mp4 │ 4-4chmod讲解.mp4 │ 4-5权限实战.mp4 │ 4-6su和sudo讲解.mp4 │ 5-10date命令.mp4 │ 5-11往文件中追加内容.mp4 │ 5-12crontab命令.mp4 │ 5-1认识bash shell.mp4 │ 5-2bash shell的变量.mp4 │ 5-3bash shell操作环境.mp4 │ 5-4alias history clear.mp4 │ 5-5第一个bash脚本.mp4 │ 5-6脚本参数.mp4 │ 5-7test命令.mp4 │ 5-8条件判断结构.mp4 │ 5-9循环控制结构.mp4 │ 6-1克隆3台虚拟机.mp4 │ 6-2修改主机名.mp4 │ 6-3配置无密钥登录.mp4 │ 6-4使用filezilla上传文件.mp4 │ 6-5java的JDK的安装.mp4 │ 6-6java相关命令的讲解.mp4 │ 6-7虚拟机关闭防火墙.mp4 │ 6-8三台虚拟机通过ntp同步时间.mp4 │ ├─02[老汤]微职位:大数据技术入门 │ 1-10WebUI看不了怎么办.mp4 │ 1-11HDFS的安装(二).zip │ 1-12HDFS安装后的额外强调.mp4 │ 1-13HDFS Web UI讲解.mp4 │ 1-14HDFS常用操作命令一.mp4 │ 1-15HDFS常用操作命令二.mp4 │ 1-16HDFS文件恢复机制.mp4 │ 1-17Http方式访问HDFS.mp4 │ 1-18HDFS各组件作用.mp4 │ 1-19HDFS中的数据块.mp4 │ 1-1课程内容.zip │ 1-20写HDFS文件实战与原理讲解.mp4 │ 1-21读HDFS文件实战与原理讲解.mp4 │ 1-22Java基本操作HDFS API.mp4 │ 1-23Java开发HDFS应用的时候需要注意的点.mp4 │ 1-24DataNode心跳机制的作用.mp4 │ 1-25NameNode中的EditsLog和FSimage机制.mp4 │ 1-26SecondaryNameNode帮助NameNode减负.mp4 │ 1-27Federation配置.mp4 │ 1-28ViewFS的配置.mp4 │ 1-29回退到一个NameNode的状态.mp4 │ 1-2Java开发环境的安装(Windows).mp4 │ 1-30告诉你怎么使用Snapshots.mp4 │ 1-31平衡数据.mp4 │ 1-32SafeMode.mp4 │ 1-3IDEA导入已经存在的maven项目(windows).mp4 │ 1-4jar包依赖管理说明.mp4 │ 1-5使用java命令启动JVM.mp4 │ 1-6RPC.mp4 │ 1-7分布式存储的原理.mp4 │ 1-8HDFS安装前的准备.mp4 │ 1-9HDFS的安装(一).mp4 │ 2-10Java创建zk节点.mp4 │ 2-11Java设置和删除zk节点.mp4 │ 2-12ZNode的watcher机制.mp4 │ 2-13ZNode的watcher机制二.mp4 │ 2-14ZNode的ACL机制.mp4 │ 2-15使用curator客户端操作zk.mp4 │ 2-16zk使用之配置管理实战.mp4 │ 2-17zk使用之分布式锁实战.mp4 │ 2-18zk使用之Master选举实战.mp4 │ 2-19HDFS HA集群规划.mp4 │ 2-1课程内容.mp4 │ 2-20使用zk来实现HDFS HA的实操.mp4 │ 2-21NameNode恢复到非HA的状态.mp4 │ 2-22NameNode恢复到非HA的状态_2.mp4 │ 2-2为什么需要Zookeeper.mp4 │ 2-3单机安装zookeeper.mp4 │ 2-4使用命令行操作zookeeper.mp4 │ 2-5使用ZooInspector操作zk.mp4 │ 2-6数据模型.mp4 │ 2-7安装分布式zookeeper.mp4 │ 2-8分布式zookeeper的特点.mp4 │ 2-9Java创建zookeeper会话.mp4 │ 3-10MR内存cpu资源配置.mp4 │ 3-11MR中的Combiner.mp4 │ 3-12实现并运行WordCount.mp4 │ 3-13shuffle & sort.mp4 │ 3-14自定义分区器.mp4 │ 3-15MapReduce应用.mp4 │ 3-16Hadoop压缩机制.mp4 │ 3-17text文件格式的读写.mp4 │ 3-18avro文件和parquet文件的讲解(很重要).mp4 │ 3-19avro文件的读写.mp4 │ 3-1课程内容.mp4 │ 3-20parquet文件的读写(必须掌握).mp4 │ 3-21sequenceFile文件的读写.mp4 │ 3-22用sequenceFile合并小文件.mp4 │ 3-23CombineTextInputFormat讲解.mp4 │ 3-24Yarn的三种资源调度机制.mp4 │ 3-25Yarn Capacity Scheduler配置.mp4 │ 3-26Yarn Fair Scheduler配置.mp4 │ 3-27ResourceManager的HA配置.mp4 │ 3-2Yarn是用来做什么的.mp4 │ 3-3Yarn的安装.mp4 │ 3-4分布式计算的特点.mp4 │ 3-5MapReduce安装.mp4 │ 3-6hadoop序列化机制.mp4 │ 3-7实现并运行第一个MapReduce job.mp4 │ 3-8block与map的input split的关系.mp4 │ 3-9MapReduce在Yarn上运行的原理.mp4 │ 4-1NCDC数据源的获取.mp4 │ 4-2NCDC数据字段的详解.mp4 │ 4-3NCDC数据的预处理.mp4 │ 4-4数据处理逻辑以及实现方案讲解.mp4 │ 4-5MapReduce代码实现讲解.mp4 │ 4-6Hadoop的本地安装.mp4 │ 4-7单元测试、集成测试以及验证.mp4 │ 4-8求每一年最高的温度.mp4 │ ├─03 [老汤]微职位:NoSQL数据库之HBase │ 1-10HFile文件格式详解(必须掌握).mp4 │ 1-11Block Encoder和Compressor.mp4 │ 1-12Bloom Filter.mp4 │ 1-13HBase技术架构.mp4 │ 1-1核心原理课程内容.mp4 │ 1-2引出主角HBase.mp4 │ 1-3HBase安装.mp4 │ 1-4HBase数据模型.zip │ 1-5namespace.mp4 │ 1-6Version和TTL.mp4 │ 1-7HA配置.mp4 │ 1-8Java客户端put数据到HBase表.mp4 │ 1-9Table到Region到CF(非常重要).mp4 │ 2-1客户端怎么找到对应的Region.mp4 │ 2-2Memory Store写缓存机制.mp4 │ 2-3WAL.mp4 │ 2-4读缓存机制-BlockCache.mp4 │ 2-5LruBlockCache.mp4 │ 2-6BucketCache.mp4 │ 2-7HBase内存规划案例.mp4 │ 3-1compaction.mp4 │ 3-2pre-split(设计HBase表时必须考虑的点).mp4 │ 3-3auto-split.mp4 │ 3-4手工split.mp4 │ 3-5auto-split的实现.mp4 │ 3-6region太多的影响以及合并.mp4 │ 3-7balancing.mp4 │ 3-8snapshot.mp4 │ 4-10PageFilter.mp4 │ 4-11FilterList.mp4 │ 4-1Java客户端增删改Hbase表.mp4 │ 4-2batch接口.mp4 │ 4-3保证相同行操作的原子性.mp4 │ 4-4异步接口BufferedMutator.mp4 │ 4-5version相关.mp4 │ 4-6Scan.mp4 │ 4-7RowKey的过滤.mp4 │ 4-8Column的过滤.mp4 │ 4-9ColumnValue的过滤.mp4 │ 5-1实战应用课程内容.mp4 │ 5-2几个column family比较合适呢.mp4 │ 5-3RowKey设计一(重要).mp4 │ 5-4RowKey设计二(重要).mp4 │ 5-5RowKey设计三(重要).mp4 │ 5-6RowKey设计四(重要).mp4 │ 6-1Spark在driver端和executor端读写Hbase.mp4 │ 6-2每一个Executor维护一个Connection.mp4 │ 6-3HBaseContext封装Spark和HBase交互的代码.mp4 │ 6-4Spark使用bulkput将数据写入到HBase中.mp4 │ 6-5Spark使用bulkput将数据写入到HBase中优化.mp4 │ 6-6RDD分区与Region的关系.mp4 │ 6-7隐式转换的使用.mp4 │ 6-8Spark Streaming读写Hbase.mp4 │ 7-10需求问题的解决.mp4 │ 7-11OLAP架构图讲解.mp4 │ 7-12设置solr开启不自动启动.mp4 │ 7-1需求说明.mp4 │ 7-2Schema的设计.mp4 │ 7-3csv格式的数据转换成HFile格式(重要).mp4 │ 7-4HFile导入到HBase并验证.mp4 │ 7-5实验环境下的Solr的安装.mp4 │ 7-6Solr中的schema.mp4 │ 7-7简单使用Solr.mp4 │ 7-8生产环境中的Solr.mp4 │ 7-9利用Solr创建索引.mp4 │ 8-1构建简单的Spring boot应用.mp4 │ 8-2构建复杂的Spring boot应用.mp4 │ 8-3将Spring boot应用打成jar包在服务器上运行.mp4 │ 8-4将Spring boot应用打成war包在服务器上运行.mp4 │ 8-5Java Web展现产品质量数据.mp4 │ ├─04[老汤]微职位:Scala语言的学习 │ 1-10选择Scala的理由.mp4 │ 1-1怎样学习Scala.mp4 │ 1-2章节内容.mp4 │ 1-3Scala的诞生史.mp4 │ 1-4学习scala需要的环境(windows).mp4 │ 1-5学习Scala需要的环境(Mac).mp4 │ 1-6简单例子对比面向对象和函数式编程.mp4 │ 1-7Java中的函数式编程.mp4 │ 1-8Scala面向对象和函数式编程的特点.mp4 │ 1-9Scala为什么Scalable.mp4 │ 2-10元组Tuples的使用.mp4 │ 2-11Sets和Maps的使用.mp4 │ 2-12使得程序更加函数式.mp4 │ 2-13Scala读取文件内容.mp4 │ 2-1章节内容.mp4 │ 2-2学习使用Scala解释器.mp4 │ 2-3变量的定义.mp4 │ 2-4函数的定义.mp4 │ 2-5编写Scala脚本.mp4 │ 2-6关键字while和if.mp4 │ 2-7使用foreach和for进行迭代.mp4 │ 2-8数组Arrays的使用.mp4 │ 2-9列表Lists的使用.mp4 │ 3-10多态和绑定.mp4 │ 3-11使用组合而不是继承.mp4 │ 3-12给Element类增加方法.mp4 │ 3-13使用工厂方法.mp4 │ 3-14客户端使用Element类.mp4 │ 3-15Scala的类型体系.mp4 │ 3-16超类Any的讲解.mp4 │ 3-17Bottom Type-Nothing和Null的讲解.mp4 │ 3-18trait的定义.mp4 │ 3-19trait使得瘦接口变成富接口.mp4 │ 3-1章节内容.mp4 │ 3-20trait叠加修饰的作用.mp4 │ 3-21trait与多重继承的区别.mp4 │ 3-22什么时候使用trait.mp4 │ 3-23package的讲解.mp4 │ 3-24import的讲解.mp4 │ 3-25访问修饰符的讲解.mp4 │ 3-2Scala脚本的运行-fsc命令.mp4 │ 3-3Scala应用程序的入口.mp4 │ 3-4分号推断规则.mp4 │ 3-5Class的定义.mp4 │ 3-6伴生对象.mp4 │ 3-7基本类型及其操作.mp4 │ 3-8抽象类的定义以及继承.mp4 │ 3-9子类构造器调用父类构造器.mp4 │ 4-10函数参数的规则.mp4 │ 4-11尾递归.mp4 │ 4-12高阶(high-order)函数.mp4 │ 4-13函数柯里化(currying).mp4 │ 4-14自定义控制结构.mp4 │ 4-15by-name和by-value参数的区别.mp4 │ 4-1章节内容.mp4 │ 4-2if表达式和while循环.mp4 │ 4-3for表达式.mp4 │ 4-4Scala中的break和continue.mp4 │ 4-5异常处理和模式匹配.mp4 │ 4-6重构命令式程序为函数式程序的例子.mp4 │ 4-7本地(Local)函数.mp4 │ 4-8first class function.mp4 │ 4-9Closures(闭包).mp4 │ 5-10模式的种类-元组模式.mp4 │ 5-11模式的种类-类型模式.mp4 │ 5-12模式的种类-变量绑定.mp4 │ 5-13模式的守卫.mp4 │ 5-14模式的重叠.mp4 │ 5-15数据结构Option.mp4 │ 5-16Option与模式匹配.mp4 │ 5-17模式在变量定义中的使用.mp4 │ 5-18模式在偏函数中的使用.mp4 │ 5-19在for表达式中的使用.mp4 │ 5-1章节内容.mp4 │ 5-20unapply方法的作用.mp4 │ 5-21unapply方法返回单个参数值.mp4 │ 5-22unapplySeq方法的作用以及特点.mp4 │ 5-2case class.mp4 │ 5-3浅尝模式匹配.mp4 │ 5-4sealed case class.mp4 │ 5-5模式的种类-通配符模式.mp4 │ 5-6模式的种类-常量模式.mp4 │ 5-7模式的种类-变量模式.mp4 │ 5-8模式的种类-构造器模式.mp4 │ 5-9模式的种类-序列模式.mp4 │ 6-10隐式作用域.mp4 │ 6-11慎用隐式转换.mp4 │ 6-12scala.Predef中使用隐式转换详解.mp4 │ 6-13JavaConversions中使用隐式转换.mp4 │ 6-14集合排序中使用隐式参数.mp4 │ 6-15Spark RDD中使用隐式转换.mp4 │ 6-1章节内容.mp4 │ 6-2隐式系统使用场景.mp4 │ 6-3关键字implicit.mp4 │ 6-4隐式转换.mp4 │ 6-5隐式类.mp4 │ 6-6隐式参数.mp4 │ 6-7隐式参数结合默认参数.mp4 │ 6-8标志符与作用域.mp4 │ 6-9隐式解析机制.mp4 │ 7-10结构化类型.mp4 │ 7-11scala.PreDef使用type关键字.mp4 │ 7-12路径依赖类型.mp4 │ 7-13枚举类型.mp4 │ 7-14存在类型.mp4 │ 7-15自身类型.mp4 │ 7-16Context and View Bounds.mp4 │ 7-17TypeTag and ClassTag.mp4 │ 7-18具体化类型约束.mp4 │ 7-19特殊的方法.mp4 │ 7-1章节内容.mp4 │ 7-2类型参数的含义.mp4 │ 7-3型变的基本概念.mp4 │ 7-4协变(co-variant)及其问题.mp4 │ 7-5下界(Lower Bound).mp4 │ 7-6逆变(contra-variant).mp4 │ 7-7上界(Upper Bound).mp4 │ 7-8type关键字.mp4 │ 7-9抽象类型.mp4 │ 8-10high order function第三部分.mp4 │ 8-11high order function第四部分.mp4 │ 8-12List伴生对象中的方法.mp4 │ 8-13Multiple Lists操作.mp4 │ 8-14可变集合ListBuffer.mp4 │ 8-15可变集合与不变集合.mp4 │ 8-16集合框架继承关系图以及统一性.mp4 │ 8-17trait Traversable.mp4 │ 8-18trait Iterable.mp4 │ 8-19为什么需要Traversable.mp4 │ 8-1章节内容.mp4 │ 8-20Seq特性及其方法讲解.mp4 │ 8-21Seq的子类LinearSeq和IndexedSeq.mp4 │ 8-22IndexedSeq的子类Vector.mp4 │ 8-23LinearSeq的子类Stream.mp4 │ 8-24数组Array.mp4 │ 8-25特殊集合String.mp4 │ 8-26Set.mp4 │ 8-27Map.mp4 │ 8-28集合视图Views.mp4 │ 8-29集合迭代器Iterator.mp4 │ 8-2List的构建方式.mp4 │ 8-30Scala集合和Java集合相互转换.mp4 │ 8-3List的结构及其基本操作.mp4 │ 8-4List和模式匹配.mp4 │ 8-5first order function第一部分.mp4 │ 8-6first order function第二部分.mp4 │ 8-7first order function第三部分.mp4 │ 8-8high order function第一部分.mp4 │ 8-9high order function第二部分.mp4 │ ├─05 [老汤]微职位:Spark核心技术 │ 1-1IntelliJ IDEA开发spark应用.mp4 │ 1-2spark源代码环境的搭建.mp4 │ 1-3Spark集群安装-虚拟机上Scala的安装.mp4 │ 1-4Spark集群环境的搭建.mp4 │ 1-5集群spark-submit提交应用.mp4 │ 1-6mysql的安装(后面会用到).mp4 │ 1-7Spark模块学习说明.mp4 │ 2-10Spark SQL组件解决的问题及其特点二.mp4 │ 2-11Spark Streaming组件解决的问题及其特点.mp4 │ 2-12Spark Graphx组件解决的问题及其特点.mp4 │ 2-13Spark ml组件解决的问题及其特点.mp4 │ 2-1Spark是怎么进行分布式计算的?.mp4 │ 2-2数据重新分区概述.mp4 │ 2-3Spark分布式计算流程中的几个疑问点.mp4 │ 2-4从上面的疑问中导出RDD的概念.mp4 │ 2-5实践:RDD API简单使用一.mp4 │ 2-6实践:RDD API简单使用二.mp4 │ 2-7理解Spark分布式内存计算的含义.mp4 │ 2-8Spark Core组件解决的问题及其特点.mp4 │ 2-9Spark SQL组件解决的问题及其特点一.mp4 │ 3-10实战:自定义Partitioner.mp4 │ 3-11实战:coalesce使用场景(非常的重要).mp4 │ 3-12coalesce原理讲解.mp4 │ 3-13coalesce源码解析.mp4 │ 3-14单类型RDD的transformation api的使用.mp4 │ 3-15MapPartitionsRDD的原理代码详解.mp4 │ 3-16RDD的采样api(sample等).mp4 │ 3-17RDD分层采样api(sampleByKey等).mp4 │ 3-18实践:RDD的pipe api的使用.mp4 │ 3-19RDD的pipe的原理深入讲解.mp4 │ 3-1再次理解RDD概念.mp4 │ 3-20单类型RDD的基本action api的讲解.mp4 │ 3-21combineBykey的七大参数的详解一.mp4 │ 3-22combineBykey的七大参数的详解二.mp4 │ 3-23ShuffleRDD的原理详解.mp4 │ 3-24基于combineByKey的api详解.mp4 │ 3-25实践:combineBykey实战以及使用过程中需要注意的点.mp4 │ 3-26reduceByKey和groupByKey的对比.mp4 │ 3-27cogroup api的感官认识.mp4 │ 3-28通过原理图和源代码详解cogroup原理.mp4 │ 3-29join等api的原理实现.mp4 │ 3-2实践:怎么样创建RDD.mp4 │ 3-30subtractByKey的原理.mp4 │ 3-31sortedByKey原理.mp4 │ 3-32count、countByKey等计数api.mp4 │ 3-33union的使用及其原理.mp4 │ 3-34intersection的使用及其原理.mp4 │ 3-35cartesian笛卡尔积的使用及其原理.mp4 │ 3-36zip的使用及其原理.mp4 │ 3-37RDD的缓存机制,即persist.mp4 │ 3-38checkpoint的作用和实现流程.mp4 │ 3-39checkpoint实现原理一.mp4 │ 3-3parallelize和makeRDD的实现原理.mp4 │ 3-40checkpoint实现原理二.mp4 │ 3-41broadcast的机制及其用法.mp4 │ 3-42accumulator的使用及其自定义accumulator.mp4 │ 3-43spark支持的读写存储系统.mp4 │ 3-44HadoopRDD的原理和实现.mp4 │ 3-45spark支持的通用的文件格式.mp4 │ 3-46二进制文件的读写.mp4 │ 3-47spark sql读写parquet and avro文件.mp4 │ 3-48项目实战:业务讲解.mp4 │ 3-49项目实战:代码实现讲解一.mp4 │ 3-4RDD的依赖设计及其特点(必须掌握的知识).mp4 │ 3-50项目实战:代码实现讲解二.mp4 │ 3-51项目实战:结果验证.mp4 │ 3-5HashPartitioner原理.mp4 │ 3-6实战:对RDD合理分区能提高性能.mp4 │ 3-7RangePartitioner的原理.mp4 │ 3-8Partitioner源码解析.mp4 │ 3-9Hash对比Range Partitioner.mp4 │ 4-10--package相关参数详解.mp4 │ 4-11--files与--properties-file参数详解.mp4 │ 4-12--queue相关参数的详解.mp4 │ 4-13python spark应用的正确提交.mp4 │ 4-14利用SparkLauncher在代码中提交spark应用.mp4 │ 4-15spark脚本系统.mp4 │ 4-16spark-class脚本原理以及实现.mp4 │ 4-17spark-daemon脚本原理以及实现.mp4 │ 4-18SparkSubmit原理以及源码分析.mp4 │ 4-1课程内容.mp4 │ 4-2java命令启动JVM.mp4 │ 4-3java ProcessBuilder启动JVM.mp4 │ 4-4spark-submit感官认识.mp4 │ 4-5master和deploy-mode参数详解.mp4 │ 4-6--conf参数详解.mp4 │ 4-7driver相关参数的详解.mp4 │ 4-8executor相关参数的详解.mp4 │ 4-9--jars参数详解.mp4 │ 5-10task调度的推测机制.mp4 │ 5-11task调度的黑名单机制.mp4 │ 5-12task调度的黑名单机制使用场景.mp4 │ 5-13executor资源的管理.mp4 │ 5-14task的launch流程及其需要注意的点.mp4 │ 5-15task的statusUpdate流程.mp4 │ 5-16schedulers on driver的总体流程.mp4 │ 5-17源码讲解之schedulers的初始化.mp4 │ 5-18源码讲解之job提交流程.mp4 │ 5-19源码讲解之task结果处理.mp4 │ 5-1课程内容.mp4 │ 5-20动态资源分配机制.mp4 │ 5-21External shuffle service机制.mp4 │ 5-22开启External shuffle service机制.mp4 │ 5-2stage的划分.mp4 │ 5-3stage的调度.mp4 │ 5-4taskset调度的先进先出(FIFO)机制.mp4 │ 5-5实战:实现taskset调度的公平调度(FAIR).mp4 │ 5-6taskset调度的公平调度(FAIR)机制需要注意的点.mp4 │ 5-7task调度的本地性级别定义.mp4 │ 5-8task调度的延迟调度讲解一.mp4 │ 5-9task调度的延迟调度讲解二.mp4 │ 6-10Spark SQL四大目标.mp4 │ 6-11Spark SQL架构及其处理流.mp4 │ 6-12API实现的发展.mp4 │ 6-13DataFrame.mp4 │ 6-14Dataset.mp4 │ 6-15API演化的合理性.mp4 │ 6-16Dataset API分类.mp4 │ 6-17Spark SQL未来会成为Spark的新核心.mp4 │ 6-1课程内容.mp4 │ 6-2DSL.mp4 │ 6-3SQL.mp4 │ 6-4数据格式的种类及其特点.mp4 │ 6-5Spark SQL的初衷.mp4 │ 6-6SQL On Hadoop - Hive.mp4 │ 6-7SQL On Hadoop - Imapla.mp4 │ 6-8Shark.mp4 │ 6-9大事记.mp4 │ 7-10数据源-parquet和orc文件的读写.mp4 │ 7-11数据源-json文件的读写一.mp4 │ 7-12数据源-json文件的读写二.mp4 │ 7-13数据源-csv文件的读写一.mp4 │ 7-14数据源-通过jdbc读写mysql数据库.mp4 │ 7-15通过jdbc写mysql数据库需要注意的点.mp4 │ 7-16通过jdbc读mysql数据库需要注意的点.mp4 │ 7-17数据源-text文件和table数据源的读写.mp4 │ 7-18数据源实战之数据分区.mp4 │ 7-19catalog元数据管理讲解.mp4 │ 7-1spark SQL基本概念.mp4 │ 7-20DDL-表的类型种类及其创建方式.mp4 │ 7-21DQL-sql查询及其sql函数讲解.mp4 │ 7-22SQL内置函数(绝对全).mp4 │ 7-23Column的表达.mp4 │ 7-24DataFrame中Untyped API讲解.mp4 │ 7-25DataFrame Untyped API与SQL对比.mp4 │ 7-26Dataset typed API.mp4 │ 7-27group分组聚合相关API.mp4 │ 7-28join关联相关API.mp4 │ 7-29sort排序相关API.mp4 │ 7-2浅尝spark SQL的API.mp4 │ 7-30实战:自定义UDAF.mp4 │ 7-31Action API和其他API.mp4 │ 7-32RDDsDataFramesDatasets各自使用场景.mp4 │ 7-33实战一:json格式数据处理.mp4 │ 7-34实战二:物联网设备信息的ETL.mp4 │ 7-3SparkSession的讲解.mp4 │ 7-4DataFrame的创建.mp4 │ 7-5Dataset的创建.mp4 │ 7-6RDDDatasetDataFrame的转换.mp4 │ 7-7schema的定义以及复杂数据类型的用法.mp4 │ 7-8实战:schema api的用处.mp4 │ 7-9数据源-基本操作load和save.mp4 │ ├─06 [老汤]微职位:大数据实时流处理技术 │ 1-10Basic API.mp4 │ 1-11Join相关API.mp4 │ 1-12transform API.mp4 │ 1-13window(窗口) API.mp4 │ 1-14reduceByKeyAndWindow API.mp4 │ 1-15为什么需要checkpoint.mp4 │ 1-16其他window相关API.mp4 │ 1-17updateStateByKey API.mp4 │ 1-18mapWithState API.mp4 │ 1-19Java版本的DStream的API.mp4 │ 1-1课程内容.mp4 │ 1-20实战一:结果保存到HDFS.mp4 │ 1-21结果保存到Mysql讲解.mp4 │ 1-22实战二:结果保存到Mysql演示.mp4 │ 1-23Spark Streaming结合Spark Sql.mp4 │ 1-24Spark Streaming进行网站流量实时监控.mp4 │ 1-2实战:本地运行Spark Streaming程序.mp4 │ 1-3细讲word count程序.mp4 │ 1-4监控Spark Streaming程序.mp4 │ 1-5讲解StreamingContext.mp4 │ 1-6讲解DStream.mp4 │ 1-7Queue Streams Source.mp4 │ 1-8实战:使用HDFS File作为Streaming的输入数据.mp4 │ 1-9实战:自定义数据接受者.mp4 │ 2-10性能之结果输出的性能调优.mp4 │ 2-11Backpressure(压力反馈).mp4 │ 2-12Elastic Scaling(资源动态分配).mp4 │ 2-1课程内容.mp4 │ 2-2Spark应用对比Spark Streaming应用.mp4 │ 2-3Spark Streaming Application原理.mp4 │ 2-4性能之创建多个接收器.mp4 │ 2-5性能之接收到的数据块的数量.mp4 │ 2-6性能之接收器接收数据的速率.mp4 │ 2-7性能之数据处理的并行度.mp4 │ 2-8性能之数据处理的数据序列化.mp4 │ 2-9性能之数据处理的内存调优.mp4 │ 3-1课程内容.mp4 │ 3-2Executor失败容错.mp4 │ 3-3Driver失败容错.mp4 │ 3-4利用WAL恢复接收到的数据.mp4 │ 3-5可靠和不可靠的Receiver.mp4 │ 3-6当一个task很慢的时候的容错.mp4 │ 3-7流计算语义(Semantics)的定义.mp4 │ 3-8Spark Streaming容错语义.mp4 │ 3-9Output怎样达到Exactly once.mp4 │ 4-10Kafka基本术语 - topic.mp4 │ 4-11Producer原理.mp4 │ 4-12Kafka基本术语–Consumer Group(必须搞懂).mp4 │ 4-13Java 开发Produce 和Consumer(必须搞懂).mp4 │ 4-14Spark Streaming 集成 Kafka一.mp4 │ 4-15Spark Streaming 集成 Kafka二.mp4 │ 4-16Receiver模式对比Direct模式.mp4 │ 4-17Java版本的Spark streaming集成Kafka.mp4 │ 4-18Kafka作为Flume的Source.mp4 │ 4-19Kafka作为Flume的Sink.mp4 │ 4-1课程内容.mp4 │ 4-20Kafka作为Flume的Channel.mp4 │ 4-21Redis的安装.mp4 │ 4-22实际案例业务、架构以及代码讲解.mp4 │ 4-23实际案例实战演示.mp4 │ 4-24解决上节课的Bug.mp4 │ 4-2Flume实践一.mp4 │ 4-3Flume实践二.mp4 │ 4-4Flume实践三.mp4 │ 4-5Flume的基本架构和基本术语.mp4 │ 4-6Spark Streaming集成Flume(push模式).mp4 │ 4-7Spark Streaming集成Flume(pull模式).mp4 │ 4-8Java版本的Spark streaming集成Flume.mp4 │ 4-9Kafka总结介绍和安装.mp4 │ 5-1课程内容.mp4 │ 5-2Spark Streaming的优点和痛点.mp4 │ 5-3Continuous Applications.mp4 │ 5-4Streaming in Spark的未来.mp4 │ └─07 [老汤]微职位:SQL On Hadoop 10通过JDBC访问Spark SQL.mp4 11Spark SQL代码中写SQL读写Hive.mp4 12通过table和saveAsTable两个接口读写Hive.mp4 13Spark SQL本地调试读写Hive.mp4 14案例业务讲解.mp4 15ETL job详细讲解.mp4 16机器学习推荐功能job详细讲解.mp4 17Spark SQL和Hive的各自职责.mp4 1课程内容.mp4 2通过和socket编程模型进行对比来引出Thrift的作用.mp4 3Thrift的使用方法.mp4 4课程数据准备.mp4 5Hive CLI的用法.mp4 6Hive beeline的用法.mp4 7代码里JDBC的方式访问Hive.mp4 8Spark SQL兼容Hive配置.mp4 9通过beeline访问Spark SQL.mp4