机读格式显示(MARC)

000 02239nam 2200385 450

001 0000512547

005 20190105101800.0

010 __ |a 978-7-115-48252-5 |d CNY69.00

099 __ |a CAL 012018081936

100 __ |a 20180606d2018 em y0chiy50 ea

101 1_ |a chi |c eng

102 __ |a CN |b 110000

105 __ |a ak z 000yy

106 __ |a r

200 1_ |a Spark高级数据分析 |A Sparkgao ji shu ju fen xi |d = Advanced analytics with Spark |f (美) 桑迪·里扎 ... [等] 著 |g 龚少成, 邱鑫译 |z eng

210 __ |a 北京 |c 人民邮电出版社 |d 2018

215 __ |a xviii, 226页 |c 图 |d 24cm

225 2_ |a 图灵程序设计丛书 |A tu ling cheng xu she ji cong shu

304 __ |a 题名页题其余责任者: (美) 于里·莱瑟森, (英) 肖恩·欧文, (美) 乔希·威尔斯著

305 __ |a 译自原书第2版

306 __ |a 英文原版的翻译得到O'Reilly Media, Inc.的授权 O'Reilly Media, Inc.授权人民邮电出版社出版

314 __ |a 桑迪·里扎 (Sandy Ryza), Spark项目代码提交者、Hadoop项目管理委员会委员, Time Series for Spark项目创始人。于里·莱瑟森 (Uri Laserson) , MIT博士毕业, 致力于用技术解决遗传学问题, 曾利用Hadoop生态系统开发了可扩展的基因组学和免疫学技术。肖恩·欧文 (Sean Owen), Spark、Mahout项目代码提交者, Spark项目管理委员会委员。现任Cloudera公司数据科学总监。龚少成, 现任万达科技集团数据工程部总经理, 清华大学自动化系研究生毕业, 国内专注企业级大数据平台建设的先驱者之一。邱鑫, 毕业于武汉大学, 目前就职于英特尔亚太研发有限公司, 是Intel大数据团队高级工程师。

330 __ |a 本书是使用Spark进行大规模数据分析的实战宝典, 由知名数据科学家撰写。本书在第1版的基础上, 针对Spark近年来的发展, 对样例代码和所使用的资料进行了大量更新。新版Spark使用了全新的核心API, MLlib和Spark SQL两个子项目也发生了较大变化, 本书为关注Spark发展趋势的读者提供了与时俱进的资料, 例如Dataset和DataFrame的使用, 以及与DataFrame API高度集成的Spark ML API。

410 _0 |1 2001 |a 图灵程序设计丛书

510 1_ |a Advanced analytics with Spark |z eng

606 0_ |a 数据处理软件 |A shu ju chu li ruan jian

690 __ |a TP274 |v 5

701 _1 |a 里扎 |A li za |g (Ryza, Sandy) |4 著

701 _1 |a 莱瑟森 |A lai se sen |g (Laserson, Uri) |4 著

701 _1 |a 欧文 |A ou wen |g (Owen, Sean) |4 著

702 _0 |a 龚少成 |A gong shao cheng |4 译

702 _0 |a 邱鑫 |A qiu xin |4 译

801 _0 |a CN |b CAU |c 20190105

905 __ |a CAU |d TP274/251:2

920 __ |a 211180 |z 1