沙龙晃荡 | 3月31日 京东、微博、华为拭魅战专家与你合营商量容器技巧实践!
数据可视化是数据科学家工作中的重要构成部分。在项目标早期阶段,你平日会进行摸索性数据分析(Exploratory Data Analysis,EDA)以获取对数据的一些懂得。创建可视化办法确切有助于使工作变得加倍清楚易懂,特别是对于大年夜型、高维数据集。在项目停止时,以清楚、简洁和惹人注目标方法展示最终结不雅是异常重要的,因为你的受众往往长短技巧型客户,只有如许他们才可以懂得。
Matplotlib 是一个风行的 Python 库,可以用来很简单地创建数据可视化筹划。但每次创建新项目时,设置数据、参数、图形和排版都邑变得异常繁琐和麻烦。在这篇博文中,我们将着眼于 5 个数据可视化办法,并应用 Python Matplotlib 为他们编写一些快速简单的函数。与此同时,这里有一个很棒的图表,可用于在工作中选择精确的可视化办法!
散点图异常合适展示两个变量之间的关系,因为你可以直接看到数据的原始分布。 如下面第一张图所示的,你还可以经由过程对组进内行单地色彩编率攀来查看不合组数据的关系。想要可视化三个变量之间的关系? 没问题! 仅需应用另一个参数(如点大年夜小)就可以对第三个变量进行编码,如下面的第二张图所示。
如今开端评论辩论代码。我们起首用别号 “plt” 导入 Matplotlib 的 pyplot 。要创建一个新的点阵图,我们可调用 plt.subplots() 。我们将 x 轴和 y 轴数据传递给该函数,然后将这些数据传递给 ax.scatter() 以绘制散点图。我们还可以设置点的大年夜小、灯揭捉?色和 alpha 透明度。你甚至可以设置 Y 轴为对数刻度。标题和坐标轴上的标签可以专门为该图设置。这是一个易于应用的函数,可用于大年夜头到尾创建散点图!
当你试图将类别很少(可能小于10)的分类数据可视化的时刻,柱状图是最有效的。如不雅我们有太多的分类,那么这些柱状图就会异常混乱,很难解得。柱状图对分类数据很好,因为你可以很轻易地看到基于柱的类别之间的差别(比如大年夜小);分类也很轻易划分和悠揭捉?色进行编码。我们将会看到三种不合类型的柱状图:惯例的,分组的,堆叠的。在我们进行的过程中,请查看图形下面的代码。
- import matplotlib.pyplot as pltimport numpy as npdef scatterplot(x_data, y_data, x_label="", y_label="", title="", color = "r",yscale_log=False):
- # Create the plot object
- _, ax = plt.subplots() # Plot the data, set the size (s), color and transparency (alpha)
- # of the points
- ax.scatter(x_data, y_data, s = 10, color = color, alpha = 0.75) if yscale_log == True:
- ax.set_yscale('log') # Label the axes and provide a title
- ax.set_title(title)
- ax.set_xlabel(x_label)
- ax.set_ylabel(y_label)
折线图
当你可以看到一个变量跟着另一个变量明显变更的时刻,比如说它们有一个大年夜的协方差,那最好应用折线图。让我们看一下下面这张图。我们可以清楚地看到对于所有的主线跟着时光都有大年夜量的变更。应用散点绘制这些将会极其纷乱,难以真正明白和看到产生了什么。折线图对于这种情况则异常好,因为它们根本上供给给我们两个变量(百分比和时光)的协方差的快速总结。别的,我们也可以经由过程彩色编码进行分组。
推荐阅读 HTTPS那些协议:TLS, SSL, SNI, ALPN, NPN 沙龙晃荡 | 3月31日 京东、微博、华为拭魅战专家与你合营商量容器技巧实践!
本文存眷个中 Web 办事(HTTPS)相干>>>详细阅读 地址:http://www.17bianji.com/lsqh/40891.html 1/2 1