MGPHPZJ

Hello, friends! Welcome!

介绍
在上一章中,我们讨论了机器学习算法数据的重要性以及一些Python配方,以便用统计数据来理解数据。 还有另一种称为可视化的方法来理解数据。

借助数据可视化,我们可以看到数据的外观以及数据属性所保持的相关性。 这是查看功能是否与输出相对应的最快方法。 借助以下Python配方,我们可以通过统计数据来理解ML数据。

单变量图:独立理解属性
最简单的可视化类型是单变量或“单变量”可视化。 借助单变量可视化,我们可以独立地理解数据集的每个属性。 以下是Python中用于实现单变量可视化的一些技术。

单变量图和描述
1.直方图
直方图将数据分组到箱中,是了解数据集中每个属性分布的最快方法。

2.密度图
获取每个属性分布的另一种快速简便的技术是密度图。

3.盒和晶须图
Box和Whisker图,简称为boxplots,是审查每个属性分布的分布的另一种有用技术。

多变量图:多个变量之间的相互作用
另一种可视化是多变量或“多变量”可视化。 借助多变量可视化,我们可以理解数据集的多个属性之间的交互。 以下是Python中用于实现多变量可视化的一些技术。

多变量图和描述
1.相关矩阵图
相关性表示两个变量之间的变化。

2.Scatter Matrix Plot
散点图显示了一个变量受另一个变量影响的程度,或者它们之间的关系在二维点的帮助下。

Leave a Reply

Your email address will not be published. Required fields are marked *