机读格式显示(MARC)
- 010 __ |a 978-7-302-61363-3 |d CNY59.00
- 099 __ |a CAL 012023021419
- 100 __ |a 20221228d2022 em y0chiy50 ea
- 200 1_ |a Hadoop与Spark入门 |A Hadoop yu Spark ru men |f 覃雄派, 陈跃国编著
- 210 __ |a 北京 |c 清华大学出版社 |d 2022
- 215 __ |a xiv, 233页 |c 图 |d 26cm
- 225 2_ |a 面向新工科专业建设计算机系列教材 |A mian xiang xin gong ke zhuan ye jian she ji suan ji xi lie jiao cai |i 数据科学与大数据技术
- 330 __ |a 本书包含13章:第1、2章介绍如何为深入学习Hadoop和Spark做环境准备,包括VMware虚拟机的创建和CentOS操作系统安装。第3-6章介绍Hadoop大数据平台的基本原理,包括HDFS、MapReduce计算模型、HBase数据库,以及Hive数据仓库的原理、部署方法和开发技术。第7-11章介绍Spark大数据平台的基本原理,包括弹性分布式数据集、转换与动作操作、宽依赖与窄依赖、有向无环图表达的作业及其处理过程等,并且介绍了Spark Core、Spark SQL、Spark MLlib、Spark GraphX的部署和开发技术。最后两章介绍了Flume(第12章)和Kafka(第13章)两个工具。
- 410 _0 |1 2001 |a 面向新工科专业建设计算机系列教材 |i 数据科学与大数据技术
- 606 0_ |a 数据处理软件 |A shu ju chu li ruan jian |x 高等学校 |j 教材
- 701 _0 |a 覃雄派 |A qin xiong pai |4 编著
- 701 _0 |a 陈跃国 |A chen yue guo |4 编著
- 801 _0 |a CN |b CAU |c 20240421
- 905 __ |a CAU |d TP274/753