【6390】-北京尚学堂1903期大数据全套视频教程(视频、源码、课件)
内容介绍:
01_第一阶段 linux和高并发
01_LINUX.
01linux_系统安装
02linux_使用和脚本编程
02_高并发负载均衡_LVS
01资料.rar
02视频
03笔记.rar
04代码.rar
05能力提升.rar
03_高并发负载均衡_nginx
01资料.rar
02视频
03笔记.rar
04代码.rar
05能力提升.rar
02_第二阶段 hadoop体系之离线计算(最新更新hadoop3)
01_hadoop
02_ Hive数据仓库
03_Hbase-NOSQL7
04_ZooKeeper
05_redi-内存数据
06_cdh8
07_es-搜索引擎
08_总结
03_第三阶段 Spark体系之分布式计算
01_storm
01 应用场景 架构模型 伪分布式与全分布式搭建
02 异步与同步时时分析框架与源码和实例
03容错 事务和项目案例
02_Scala
03_Spark
6.初识SparkSQL,SparkSQL加载DataFrame方式,Spark on Hive配置,UDF函数
04_第四阶段 机器学习与数据挖掘
01_python
01. python介绍、安装、基础知识、函数、文件操作
03. 视频
02. Python类与对象、设计模式、异常、模块安装、numpy
03. 视频
02_机器学习
1.线性回归原理及使用,贝叶斯原理使用,KNN算法及案例,KMeans原理及案例
4.推荐系统之协同过滤,App推荐原理,App推荐系统架构及数据清洗
5.构建推荐系统训练集,dubbo服务生成推荐列表,决策树和随机森林算法原理
05_第五阶段 大数据项目实战
01_某大型网站日志分析系统
1. 数据源讲解及数据收集
2. Flume、数据存储及ETL
3. 利用MapReduce进行模块设计1
4. 利用MapReduce进行模块设计2
5. Sqoop讲解、hive进行模块设计、项目优化
02_Spark项目
1.交通项目介绍,数据处理方式,数据模拟,卡扣监控业务分析,自定义累加器实现
2.项目任务优化,车辆速度top10,卡扣车辆数top5,车辆轨迹,随机抽取车辆实现