提问者:小点点

为什么我的seaborn displot实际上没有显示分布?


我有一个问题,最精确的seaborn displot函数只有一个变量,我得到

sns.distplot(df.abc, hist = True, norm_hist = True)

这就是我得到的阴谋。 Y轴上的值上升到150+(不正常)

顺便说一句,我应该补充一下,我的数据并不是真的很奇怪,因为它不应该这么做。 下面是数据的describe()(如您所见,没有太多异常):


共3个答案

匿名用户

关于高直方图值,有两个ISUE需要考虑:

  • 您的发行版是离散的,而distplot用于连续发行版。 在这里,一些值被扔到同一个bin中,而相邻的bin保持为空。 您可以通过显式设置回收箱来解决此问题。
  • 直方图规范化,使总面积相加为1。 矩形的面积是它的底乘以它的高度。 在这种情况下,宽度约为0.001,因此平均高度为50的约20个条将使总面积等于1.

匿名用户

你能详细说明一下问题是什么吗? 我不清楚。

你希望得到什么作为一个阴谋?

匿名用户

请提供示例数据集