机读格式显示(MARC)

000 01553nam 2200325 450

001 0000609875

005 20240429165100.0

010 __ |a 978-7-302-61363-3 |d CNY59.00

099 __ |a CAL 012023021419

100 __ |a 20221228d2022 em y0chiy50 ea

101 0_ |a chi

102 __ |a CN |b 110000

105 __ |a a a 000yy

106 __ |a r

200 1_ |a Hadoop与Spark入门 |A Hadoop yu Spark ru men |f 覃雄派, 陈跃国编著

210 __ |a 北京 |c 清华大学出版社 |d 2022

215 __ |a xiv, 233页 |c 图 |d 26cm

225 2_ |a 面向新工科专业建设计算机系列教材 |A mian xiang xin gong ke zhuan ye jian she ji suan ji xi lie jiao cai |i 数据科学与大数据技术

300 __ |a 国家级一流本科专业配套教材

320 __ |a 有书目

330 __ |a 本书包含13章：第1、2章介绍如何为深入学习Hadoop和Spark做环境准备，包括VMware虚拟机的创建和CentOS操作系统安装。第3-6章介绍Hadoop大数据平台的基本原理，包括HDFS、MapReduce计算模型、HBase数据库，以及Hive数据仓库的原理、部署方法和开发技术。第7-11章介绍Spark大数据平台的基本原理，包括弹性分布式数据集、转换与动作操作、宽依赖与窄依赖、有向无环图表达的作业及其处理过程等，并且介绍了Spark Core、Spark SQL、Spark MLlib、Spark GraphX的部署和开发技术。最后两章介绍了Flume(第12章)和Kafka(第13章)两个工具。

410 _0 |1 2001 |a 面向新工科专业建设计算机系列教材 |i 数据科学与大数据技术

606 0_ |a 数据处理软件 |A shu ju chu li ruan jian |x 高等学校 |j 教材

690 __ |a TP274-43 |v 5

690 __ |a TP274 |v 4

701 _0 |a 覃雄派 |A qin xiong pai |4 编著

701 _0 |a 陈跃国 |A chen yue guo |4 编著

801 _0 |a CN |b CAU |c 20240421

905 __ |a CAU |d TP274/753

920 __ |a 211180 |z 1