PySpark机器学习、自然语言处理与推荐系统

9787302540908 - PySpark机器学习、自然语言处理与推荐系统

内容简介

使用PySpark构建机器学习模型、自然语言处理应用程序以及推荐系统,从而应对各种业务挑战。《PySpark机器学习、自然语言处理与推荐系统》首先介绍Spark的基础知识,然后讲解使用PySpark构建传统机器学习算法以及自然语言处理和推荐系统的全部知识点。

《PySpark机器学习、自然语言处理与推荐系统》阐释了如何构建有监督机器学习模型,比如线性回归、逻辑回归、决策树和随机森林,还介绍了无监督机器学习模型,比如K均值和层次聚类。《PySpark机器学习、自然语言处理与推荐系统》重点介绍特征工程,以便使用PySpark创建有用的特征,从而训练机器学习模型。自然语言处理的相关章节将介绍文本处理、文本挖掘以及用于分类的嵌入。

在阅读完《PySpark机器学习、自然语言处理与推荐系统》之后,读者将了解如何使用PySpark的机器学习库构建和训练各种机器学习模型。此外,还将熟练掌握相关的PySpark组件,从而进行数据获取、数据处理和数据分析,开发数据驱动的智能应用。

构建一系列有监督和无监督机器学习算法

使用Spark MLlib库实现机器学习算法

使用Spark MLlib库开发推荐系统

处理与特征工程、分类平衡、偏差和方差以及交叉验证有关的问题,以便构建最优的拟合模型

Pramod Singh是Publicis.Sapient公司数据科学部门的经理,目前正作为数据科学跟踪负责人与梅赛德斯奔驰的一个项目进行合作。他在机器学习、数据工程、编程,以及为各种业务需求设计算法方面拥有丰富的实践经验,领域涉及零售、电信、汽车以及日用消费品等行业。他在Publicis.Sapient主导了大量应对机器学习和AI的战略计划。他在孟买大学获得了电气与电子工程的学士学位,并且在印度共生国际大学获得了MBA学位(运营&财务),还在IIM – Calcutta(印度管理学院加尔各答分校)获得了数据分析认证。在过去八年中,他一直在跟进多个数据项目。在大量客户项目中,他使用R、Python、Spark和TensorFlow应用机器学习和深度学习技术。他一直是各重大会议和大学的演讲常客。他会在Publicis.Sapient举办数据科学聚合并且…

部分文章资源需要积分下载(1元=10积分),请点击下载按钮自行下载。已支付订单如发现下载链接失效导致无法下载,请联系客服,会尽快为您全额退款处理,请放心扫码支付下载,推荐使用支付宝支付(可用花呗)。网站服务QQ:340321425,微信号:huixueku


版权声明:
1. 本站为纯属学习资源分享站点 ,资源均来源于网络搜集经整理而成, 仅限个人测试学习之用, 版权归原作者及开发商所有,请勿用作商业用途。如果喜欢,请支持正版,谢谢。
2.本站资源下载地址均为网盘链接或外链,本站的主机服务器不储存任何可供下载 资源 , 不确保所有网盘下载链接或外链资源的安全性、可用性, 对用户下载及使用过程中造成的损失由下载使用者自负 ,本站不对任何网络资源负法律责任。
3.因时间与精力有限,对网络来源的资源未能做到一一确认版权权属,若无意中侵犯到您的版权利益,请来信联系我们,我们会在收到版权权属信息后三个工作日内核实并进行立即删除处理。
4.本站所有文章资源,未经允许,禁止转发,谢谢合作。
5.联系方式:pla73121@qq.com

汇学库精品资源网 » PySpark机器学习、自然语言处理与推荐系统

【汇学库精品资源网】-为您提供最优质的资源集合

立即查看 了解详情