《精通Spark数据科学》pdf电子书免费下载

Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎。这是一本专门介绍Spark的图书，旨在教会读者利用Spark构建实用的数据科学解决方案。本书内容包括14章，由浅入深地介绍了数据科学生态系统、数据获取、输入格式与模式、探索性数据分析、利用Spark进行地理分析、采集基于链接的外部数据、构建社区、构建推荐系统、新闻词典和实时标记系统、故事除重和变迁、情感分析中的异常检测、趋势演算、数据保护和可扩展算法。本书适合数据科学家以及对数据科学、机器学习感兴趣的读者阅读，需要读者具备数据科学相关的基础知识，并通过阅读本书进一步提升Spark运用能力，从而创建出高效且实用的数据科学解决方案。

根据中华人民共和国国家版权局相关法规，本站不提供该PDF电子版书籍
您可以进入交流社群中继续寻找资料或购买正版书籍

技术交流社群：//gulass.cn/club

Linux书籍在线阅读：//gulass.cn/chapter-00.html

本文原创地址：//gulass.cn/spark-linux-ten.html编辑：向金平，审核员：KSJXAXOAS

彩票走势图

《精通Spark数据科学》pdf电子书免费下载

《精通Spark数据科学》pdf电子书免费下载

为您推荐一些与本文相关的文章：