MARC状态:审校 文献类型:中文图书 浏览次数:3
- 题名/责任者:
- Python和PySpark数据分析/(加) 乔纳森·里乌著 殷海英译
- 出版发行项:
- 北京:清华大学出版社,2023
- ISBN及定价:
- 978-7-302-64536-8/CNY118.00
- 载体形态项:
- 13, 402页:图;24cm
- 丛编项:
- 数据科学与大数据技术
- 个人责任者:
- 里乌 (Rioux, Jonathan) 著
- 个人次要责任者:
- 殷海英 译
- 学科主题:
- 程序语言-程序设计
- 学科主题:
- 数据处理
- 非控制主题词:
- Python
- 中图法分类号:
- TP312PY
- 中图法分类号:
- TP274
- 中图法分类号:
- TP312
- 相关题名附注:
- 版权页英文题名:Data analysis with Python and PySpark
- 提要文摘附注:
- 本书是一本精心设计的教程,可帮助读者使用PySpark交付任何规模的数据驱动应用程序。这本清晰的实践指南展示了如何使用来自任何来源的数据(从基于Hadoop的集群到Excel工作表)扩大多台机器的处理能力。通过阅读本书,读者将学习如何将大型分析任务分解为可管理的块,以及如何为您的独特需求选择和使用最佳PySpark数据抽象。完成后,您将能够编写和运行速度极快的PySpark程序,这些程序可扩展、操作高效且易于调试。本书中将介绍如何打包你的PySpark代码,管理跨多台机器扩展的数据,在PySpark中重写Pandas、R和SAS作业,排查常见数据流水线问题,并创建可靠的长期工作。
- 随书光盘:
全部MARC细节信息>>
索书号 | 条码号 | 年卷期 | 馆藏地 | 书刊状态 |
TP312/4057 | 01392961 | 总馆 | 在编 | |
TP312/4057 | 01392962 | 总馆 | 在编 |
显示全部馆藏信息