作者:尼娜·祖梅尔 日期:2022-06-04 12:16:34
在《R数据科学实战》(第2版)这本书中,作者用了一些篇幅描述了什么是数据科学、数据科学家是如何解决问题的,以及对他们工作的描述。其中,包括对经典监督学习方法(如线性回归和逻辑回归)的详细描述。我们喜欢本书的调研式风格,以及使用的大量的竞赛获奖方法和程序包的示例(如随机森林和xgboost)。本书涵盖了非常有用的、可共享的经验和实践建议。我们注意到,在本书中甚至包括了我们自己使用过的一-些技巧,例如使用随机森林变量重要性进行初始变量的筛选。
有依据的决策对于成功至关重要。将正确的数据分析技术应用到精心筹备的业务数据中有助于做出准确预测、确定趋势,以及提前发现问题。R数据分析平台提供了许多高效率的工具,可用来处理日常的数据分析和机器学习任务。《R数据科学实战》(第2版)是一本基于任务的教程,引导读者使用R语言参与几十个实用的数据分析实践。本书重点介绍读者在工作中将面临的*重要任务,对于商业分析师和数据科学家来说都非常实用。因为数据只有在可理解的情况下才有用,所以读者也可以在表格中找到组织和展示数据的妙招,以及快速生动的可视化效果。