机读格式显示(MARC)

000 01345nam0 2200277 450

001 0000504537

005 20180615091800.0

010 __ |a 978-7-302-49073-9 |d CNY99.00

099 __ |a CAL 012018010083

100 __ |a 20180112d2018 em y0chiy50 ea

101 0_ |a chi

102 __ |a CN |b 110000

105 __ |a a z 000yy

106 __ |a r

200 1_ |a Python+Spark 2.0+Hadoop机器学习与大数据实战 |A Python+Spark 2.0+Hadoop ji qi xue xi yu da shu ju shi zhan |f 林大贵著

210 __ |a 北京 |c 清华大学出版社 |d 2018

215 __ |a XVII, 519页 |c 图 |d 26cm

330 __ |a 本书从浅显易懂的“大数据和机器学习”原理说明入手，讲述大数据和机器学习的基本概念，如分类、分析、训练、建模、预测、机器学习（推荐引擎）、机器学习（二元分类）、机器学习（多元分类）、机器学习（回归分析）和数据可视化应用等。书中不仅加入了新近的大数据技术，还丰富了“机器学习”内容。为降低读者学习大数据技术的门槛，书中提供了丰富的上机实践操作和范例程序详解，展示了如何在单机Windows系统上通过Virtual Box虚拟机安装多机Linux虚拟机，如何建立Hadoop集群，再建立Spark开发环境。书中介绍搭建的上机实践平台并不限制于单台实体计算机。

606 0_ |a 软件工具 |A ruan jian gong ju |x 程序设计

606 0_ |a 数据处理软件 |A shu ju chu li ruan jian

690 __ |a TP311.561 |v 5

690 __ |a TP274 |v 5

701 _0 |a 林大贵 |A lin da gui |4 著

801 _0 |a CN |b CAU |c 20180615

905 __ |a CAU |d TP311.561/105

920 __ |a 211180 |z 1