机读格式显示(MARC)

000 01358nam 2200289 450

001 0000578806

005 20191212114700.0

010 __ |a 978-7-302-53432-7 |d CNY49.00

099 __ |a CAL 012019113804

100 __ |a 20190918d2019 em y0chiy50 ea

101 0_ |a chi

102 __ |a CN |b 110000

105 __ |a ak z 000yy

106 __ |a r

200 1_ |a Spark大数据分析与实战 |A Spark da shu ju fen xi yu shi zhan |f 黑马程序员编著

210 __ |a 北京 |c 清华大学出版社 |d 2019

215 __ |a X, 228页 |c 图 |d 26cm

225 2_ |a 大数据技术与应用丛书 |A da shu ju ji shu yu ying yong cong shu

300 __ |a 国家软件与集成电路公共服务平台信息技术紧缺人才培养工程指定教材

330 __ |a 本书围绕Spark生态圈相关系统介绍了实时流处理架构Spark。全书共9章，其中第1章主要带大家认识了Spark框架的底层实现语言—Scala。第2章主要讲解了Spark集群环境的搭建。第3-8章主要介绍了弹性分布式数据集RDD、结构化数据文件处理SparkSQL、分布式数据库HBase、分布式订阅消息系统Kafka、实时计算框架SparkStreaming以及机器学习算法库MLib。第9章是一个综合项目，主要通过实时交易数据数据，其目的是教会大家如何利用Spark构建大数据架构并进行开发，同时加深Spark技术的理解。

410 _0 |1 2001 |a 大数据技术与应用丛书

606 0_ |a 数据处理软件 |A shu ju chu li ruan jian

690 __ |a TP274 |v 5

711 02 |a 黑马程序员 |A hei ma cheng xu yuan |4 编著

801 _0 |a CN |b CAU |c 20191209

905 __ |a CAU |d TP274/557

920 __ |a 211180 |z 1