当前位置:首页 > 城事 > 正文

minitab学习教程(Minitab基础知识)

1、Minitab 中包括哪些随机数据和概率分布功能

生成随机数据根据一列数据或从选定的数据分布创建一个或多个随机数据列。在 Minitab 中,选择计算 > 随机数据。

  • 要根据工作表中的数据创建随机样本,请选择来自列的样本。

  • 要根据某特定分布创建随机样本,请指定该分布和相应参数。

指定随机数字生成器为随机数生成器指定一个起点,以便将来生成相同的随机数据集。在 Minitab 中,选择计算 > 设置基数。创建分布的 PDF、CDF 或逆 CDF。计算所选分布的 PDF、CDF 或逆 CDF。在 Minitab 中,选择计算 > 概率分布。

2、访问数据分布的方式

一组数据可按许多不同方式分布或散布。例如,掷骰子所得的数据可以是从 1 到 6 的随机整数值。制造过程所得的数据可以目标值为中心进行分布,也可以包括远离中心值的数据值。

可以通过图形、描述性统计量或者与理论分布的比较来评估数据分布:图形通过图形(如直方图),可以直接深入了解数据集的分布情况。直方图可以帮助您观测:

  • 数据聚类是围绕单个值,还是具有多个峰值或模式。

  • 数据是稀疏散布于宽广的范围,还是位于较小的范围。

  • 数据是偏斜的还是对称的。

描述性统计量用于描述包含数字值的数据的中心趋势(平均值、中位数)和展开(方差、标准差)的描述性统计,这些统计添加了明细层并且可用于与其他数据集进行比较。理论分布最后,一些常见分布可通过正态分布、Weibull 分布和指数分布等进行标识和称呼。例如,正态分布始终为钟形,且沿均值对称分布。真实数据将只能接近于这些完全分布。如果存在紧密拟合,则可认为数据由给定分布进行了合理建模。可使用统计 > 质量工具 > 个体分布标识来确定最适合您数据的分布。

3、连续和离散概率分布

概率分布要么是连续概率分布,要么是离散概率分布,这取决于它们是定义连续变量还是离散变量的概率。

  • 什么是连续分布? 连续分布描述连续随机变量的可能值的概率。连续随机变量是具有一组无限且不可计数的可能值(称为范围)的随机变量。 连续随机变量 (X) 的概率被定义为其 PDF 曲线下的面积。因此,只有值范围才能具有非零的概率。连续随机变量等于某个值的概率始终为零。 重量分布示例 连续正态分布可以描述成年男性的体重分布。例如,可以计算男性体重为 160 到 170 磅之间的概率。


但是,X 精确等于某个值的概率始终为零,因为曲线下单个点的面积为零(没有宽度)。例如,男子体重恰好为 190 磅(至无限精确)的概率为零。您可以计算男性体重超过 190 磅或小于 190 磅的概率,或者介于 189.9 到 190.1 磅之间的概率,但恰好等于 190 磅的概率为零。

  • 什么是离散分布? 离散分布描述离散随机变量的每个值的发生概率。离散随机变量是指具有可计数的值的随机变量,例如非负整数的列表。 在离散概率分布中,离散随机变量的每个可能值可与一个非零概率相关联。因此,离散概率分布通常具有表格形式。 客户投诉数量示例 不同于连续分布,在离散分布中,您可以计算 X 恰好等于某个值的概率。例如,可以使用离散 Poisson 分布来描述一天内的客户投诉数量。假设平均每天的投诉数量为 10,并且您想知道在一天中接收 5、10、15 个客户投诉的概率。