«

matplotlib如何实现一维散点分布图

时间:2024-8-2 10:48     作者:韩俊     分类: PHP


这篇“matplotlib如何实现一维散点分布图”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“matplotlib如何实现一维散点分布图”文章吧。

引言

本次的目标是绘制数据的一维散点分布图,应用场景是数据一维标签的聚类可视化,假定我们拥有原始的带标签数据 ( X , y ) (X,y) (X,y)其中 X X X为样本特征矩阵, y y y为对应样本的标签(连续值),通过聚类算法得到了 X X X的伪分类标签 y ^ , y ^ ∈ ( 1 , 2 , . . . , N ) hat{y}, hat{y}in(1,2,...,N) y^,y^∈(1,2,...,N),想要绘制出相同类别样本在标签值是否同样是集中的。
值得注意的是,由于我们可能获得多类样本,因此仅仅使用一张图来进行绘制可能会使得不同类别样本的marker在图上相互重叠,因此需要为每一类样本单独绘制一维散点分布图,并在同一张画布上显示。

方法

为了显示一维的单张散点分布图,我们需要对matplotlib默认的二维画布进行调整,将其余三条轴线都设置为不可见,只保留底部的轴线,进一步的,要把纵轴label的位置向图左端移动(否则在横轴包括负半轴时,label会出现在图中央),实例代码如下:

axs.spines['top'].set_visible(False)
axs.spines['right'].set_visible(False)
axs.spines['left'].set_visible(False)
axs.yaxis.set_ticks_position('left')
axs.set_xlim((-0.05,1.05))
axs.set_ylim((0,1))
axs.set_yticks([0],labels=['score'])

对于多张一维散点图的绘制,只需要利用subplot函数,对子图重复进行上述操作即可。整体代码如下:

def score_distr(group,x_lim=(-0.1,1.1),y_lim=(-0.1,1.1)):
    '''
    可视化N个类别中每个样本的y分布
    :param group: List[np.ndarray], N类样本标签y组成的数组
    :param x_lim: 横坐标区间
    :param y_lim: 纵坐标区间
    :return:
    '''
    group_num=len(group)
    color_map=["violet","tomato","cyan","salmon","limegreen"]
    fig,axs=plt.subplots(group_num,1)
    dem_labels=[]
    for i in range(group_num):
        axs[i].scatter(group[i],[0.05]*group[i].shape[0],label="class_"+str(i),c=color_map[i])
        # axs[i].xlim(x_lim)
        dem_labels.append("class_"+str(i))
        axs[i].spines['top'].set_visible(False)
        axs[i].spines['right'].set_visible(False)
        axs[i].spines['left'].set_visible(False)
        axs[i].yaxis.set_ticks_position('left')
        axs[i].set_xlim(x_lim)
        axs[i].set_ylim(y_lim)
        axs[i].set_yticks([0],labels=['score'])
    fig.legend(dem_labels,loc=(0.45,0.85))

测试结果

给出示例代码及对应结果如下:

test=[]
for i in range(3):
    test.append(np.random.rand(15))
score_distr(test,x_lim=(-1.05,1.05))

结果:

标签: php php教程

热门推荐