转头分析本事可用于策画因变量和一个或多个诠释注解变量之间的估算关系。 借助转头分析真实迷奸女高中生,不错对所选变量之间的关系进行建模,并左证模子瞻望值。
转头分析使用指定估算方法、一个因变量以及一个或多个诠释注解变量来创建用于估算因变量值的方程。
转头模子包括输出,举例 R2 和 p 值,以提供关联模子对因变量估算才调的信息。
图表(举例散点图矩阵、直方图和点图)也不错用于转头分析,以分析关系和测试假定。
转头分析可用于惩办以下类型的问题:
详情与因变量相关的诠释注解变量。交融因变量和诠释注解变量之间的关系。瞻望因变量的未知值。 示例以下是使用转头分析的示例场景:一家微型连锁零卖店的分析东说念主员正在盘问不同位置的商店的绩效。 该分析东说念主员思知说念为什么一些商店的销量低得出乎预思。 该分析东说念主员将使用诠释注解变量(举例周围住户区中住户的年纪和收入中位数以及到零卖中心和民众交通的距离)创建转头模子以详情影响销售的变量。一家教练部门的分析东说念主员正在盘问学校早餐策画的后果。 该分析东说念主员将使用诠释注解变量(举例班级鸿沟、家庭收入、东说念主均学校预算和逐日吃早餐的学生比例)创建教练进程戒指(举例毕业率)的转头模子。 此模子的方程可用于详情每个变量对教练进程戒指的相对影响。一家非政府组织的分析东说念主员正在盘问全球温室气体排放量。 该分析东说念主员将使用诸如国内坐蓐总值 (GDP)、东说念主口、使用化石燃料的电力坐蓐和车辆使用等诠释注解变量创建列国最新排放量的转头模子。 然后,不错使用该模子通过瞻望的 GDP 和东说念主口值来瞻望以前的温室气体排放量。粗鄙最小二乘法
使用粗鄙最小二乘法 (OLS) 对 ArcGIS Insights 中的转头分析进行建模。
OLS 方法是多元线性转头的一种相貌,即因变量和自变量之间的关系必须通过将线性方程拟合到不雅测数据来进行建模。
OLS 模子可使用以下方程:
yi = β0 + β1 x 1 + β2 x 2+...+βn x n + ε
其中:yi = 点 i 处的因变量的不雅测值β0 = y 截距(常量值)βn = 点 i 处的诠释注解变量 N 的转头悉数或斜率xn = 点 i 处的变量 N 的值ε = 转头方程的纰缪假定
每个转头方法都有多个假定,必须自满这些假定,此方程才可视为可靠。 创建转头模子时,应考据 OLS 假定。
在使用 OLS 方法时,应测试并自满以下末节中所述的假定。
模子必须为线性模子OLS 转头只可用于创建线性模子。 不错使用散点图来测试因变量和诠释注解变量之间的线性。 若是变量以为不超过 5 个,则散点图矩阵不错测试悉数变量。
数据必须进行随即采样转头分析中使用的数据应以样本不依赖于任何外部要素的花样进行采样。 不错使用转头模子中的残差对随即采样进行测试。 在散点图或散点图矩阵上针对诠释注解变量进行画图时,残差(转头模子的输出)应不具有相关性。
诠释注解变量不得共线共线性是指诠释注解变量之间的线性关系,它将在模子中创建冗余。 在某些情况下,可使用共线性创建模子。 可是,若是其中一个共线变量似乎依赖于另一个共线变量,则可能要斟酌从模子中删除该变量。 不错使用诠释注解变量的散点图或散点图矩阵来测试共线性。
诠释注解变量的测量纰缪必须可忽略不计转头模子仅与其输入数据一样精准。 若是诠释注解变量的纰缪幅度较大,则无法袭取该模子为精准。 践诺转头分析时真实迷奸女高中生,仅使用来自已知受信任开端的数据集以确保纰缪可忽略不计是极度遑急的。
残差的预期总数为零残差是转头分析中不雅测值与臆度值之间的差值。 落在转头弧线以上的不雅测值将具有正残差值,而落在转头弧线以下的不雅测值将具有负残差值。 转头弧线应位于沿数据点中心的位置;且残差的总数应为零。 不错在汇总表上钩算字段的总数。
残差具有王人质方差悉数残差应具有疏通的方差。 不错使用残差(y 轴)和臆度值(x 轴)的散点图来测试该假定。 生成的散点图应披露为悉数这个词图中随即画图的点构成一个水平带。
残差为正态散布正态散布也称为钟形弧线,是当然产生的散布,其中精辟的频率略高于平均值,而况跟着与平均值距离的增大而慢慢减小。 正态散布经常用作统计分析中的零假定。 残差必须为正态散布,才能披露最好拟合线在不雅测的数据点内聚积优化,而不是偏私一些数据点并远隔其他数据点。 不错通过创建具有残差的直方图来测试该假定。 不错叠加正态散布弧线,然后在直方图卡片的后头论说偏度和峰度测量值。
相邻残差不得披露自相关此假定基于依时分排序的数据。 若是数据依时分排序,则每个数据点必须寥落于前一个或后一个数据点。 践诺转头分析时,确保按正确的划定来组织依时分排序的数据十分遑急。 不错使用德宾-沃森窥伺来策画该假定。
德宾-沃森窥伺是针对转头模子中残差的自相关进行的测量。 德宾-沃森窥伺使用 0 到 4 级别,值为 0 到 2 暗示正自相关,值为 2 暗示无自相关,值为 2 到 4 暗示负自相关。 需要接近 2 的值以自满残差中无自相关的假定。 经常,1.5 到 2.5 之间的值被视为可袭取值,而小于 1.5 或大于 2.5 的值暗示该模子不安妥无自相关性的假定。
模子灵验性转头方程的精准性是转头分析的一个遑急部分。 悉数模子都将包含无数纰缪,可是了解统计数据可匡助您详情模子是否可用于分析,大约是否需要进行退换。
有两种详情转头模子灵验性的方法:探索性分析和考据性分析,具体态状如下末节所示。
探索性分析探索性分析是一种使用多种不同的可视化和统计本事来交融数据的方法。 在悉数这个词探索性分析历程中,您将测试 OLS 转头的假定并相比不同诠释注解变量的灵验性。 探索性分析允许您相比不同模子的灵验性和准确性,但它并未定定您是否应使用或间隔模子。 应在每个转头模子的考据性分析之前进行探索性分析,并重复践诺分析以在模子之间进行相比。
以下图表和统计数据可用作探索性分析的一部分:散点图和散点图矩阵直方图和正态散布转头方程和瞻望新的不雅测点判决悉数,R2 和修订的 R2轨范残差点图
在遴选诠释注解变量和创建转头模子之前,应先进行探索性分析。 由于 OLS 是一种线性转头方法,因此其中一项主要假定为模子必须为线性模子。 散点图或散点图矩阵可用于评估因变量与诠释注解变量之间的线性相关性。 散点图矩阵不错披露最多四个诠释注解变量以及因变量,使其成为在悉数变量之间进行大鸿沟相比的遑急用具。 单个散点图仅披露两个变量:一个是因变量,另一个是自变量或诠释注解变量。 检察因变量和单个诠释注解变量的散点图,使您不错更精准地评估变量之间的关系。 在创建转头模子之前,不错测试线性相关性,以匡助详情哪些诠释注解变量将创建可袭取模子。
创建转头模子后,不错使用多个统计输出,包括转头方程、R2 值和德宾-沃森窥伺。 创建转头模子后,应使用输出和必要的图表和表格来测试其余的 OLS 转头假定。 若是模子安妥假定,则不错连续进行其余的探索性分析。
转头方程提供了每个诠释注解变量对瞻望值影响的有价值的信息,包括每个诠释注解变量的转头悉数。 不错对斜率值进行相比,以详情每个诠释注解变量对因变量的相对影响;斜率值离零(正数或负数)越远,影响越大。 转头方程还不错通过输入每个诠释注解变量的值来瞻望因变量的值。
判决悉数(标志化为 R2)可测量转头方程对本色数据点的建模进程。 R2 值是介于 0 和 1 之间的数字,其值越接近 1,则暗示模子越精准。 R2 值为 1 暗示模子完整,斟酌到不同要素和未知变量之间互相作用的复杂性,这在本色情况中真的弗成能存在。 您应该奋力使用尽可能最高的 R2 值来创建转头模子,但要强劲到该值可能不会接近 1。
践诺转头分析时,通过添加诠释注解变量来创建具有可袭取的 R2 值的转头模子存在一定的风险,这些诠释注解变量可仅基于概率产生更好的拟合。 修订 R2 值也将介于 0 和 1 之间,斟酌附加诠释注解变量,由此镌汰了概率在策画中的作用。 修订 R2 值应该用于使用好多诠释注解变量的模子,大约用于相比具有不同数目的诠释注解变量的多个模子。
轨范残差用于测量转头模子使用新数据瞻望值的准确性。 数值越小暗示模子越精准;当对多个模子进行相比时,具有最小值的模子将是最小化轨范残差的模子。
点图可用于分析诠释注解变量的模式,如集群和特殊值,这可能会影响模子的准确性。
考据性分析考据性分析是针对零假定测试模子的历程。 在转头分析中,零假定是指因变量与诠释注解变量之间无关系。 无关系的模子的斜率值为 0。 若是考据性分析的要素具有统计显贵性,则不错间隔零假定(换言之,统计显贵性标明因变量与诠释注解变量之间存在关系)。
以下统计输出用于详情看成考据分析一部分的显贵性:
F 统计量偏激相关联的 p 值t 统计量偏激相关联的 p 值置信区间F 统计量是从 F 窥伺复返的全局统计量,它通过详情模子中的悉数转头悉数与 0 的各异是否显贵来标明转头模子的瞻望功能。 F 窥伺分析诠释注解变量的抽象影响,而不是单独窥伺诠释注解变量。 F 统计量具有相关联的 p 值,标明数据中的关系随机发生的概率。 由于 p 值基于概率,因此这些值介于 0.0 到 1.0 之间。 需要一个小 p 值(经常为 0.05 或更小)来详情模子中的关系是否信得过(换言之,非随机发生),并间隔零假定。 在这种情况下,模子中的关系随机发生的概率为 0.05 或 1/20。 大约,这些关系为信得过的概率是 0.95 或 19/20。
t 统计量是从 t 窥伺复返的局部统计量,它分袂暗示每个诠释注解变量的瞻望功能。 与 F 窥伺一样,t 窥伺将分析模子中的转头悉数与零的各异是否显贵。 可是,由于对每个诠释注解变量都践诺 t 窥伺,是以模子将为每个诠释注解变量复返一个 t 统计值,而不是每个模子复返一个。 每个 t 统计量都有一个相关联的 p 值,暗示诠释注解变量的显贵性。 与 F 窥伺的 p 值一样,每个 t 窥伺的 p 值应为 0.05 或更小,以间隔零假定。 若是诠释注解变量的 p 值大于 0.05,则即使全局 p 值显贵,也应丢弃该变量并创建新模子。
置信区间披露了每个诠释注解变量的转头悉数以及相关联的 90%、95% 和 99% 的置信区间。 置信区间不错与 t 窥伺的 p 值一王人用于评估单个诠释注解变量的零假定。 若是要间隔零假定并连续使用该模子,则转头悉数不得即是 0。 关于每个诠释注解变量,转头悉数和相关联的置信区间不应与 0 相通。若是给定诠释注解变量的 99% 或 95% 的置信区间与 0 相通,则诠释注解变量无法间隔零假定。 在模子中包含此类变量可能会影响模子的举座显贵性。 若是只好 90% 的置信区间与 0 相通,则在其他全局统计数据显贵的情况下,诠释注解变量可能包含于模子中。 理思情况下,悉数诠释注解变量的置信区间都应远隔 0。
其他输出其他输出(如臆度值和残差)关于窥伺 OLS 转头的假定极度遑急。 以下末节中先容了这些值的策画方法。
臆度值使用转头方程和每个诠释注解变量的值来策画臆度值。 理思情况下,臆度值将即是不雅测值(换言之,因变量的本色值)。
臆度值与不雅测值一王人用于策画残差。
残差转头分析中的残差值是数据聚积不雅测值与使用转头方程策画的估算值之间的差值。
上述关系的残差 A 和 B 策画如下:
残差 A = 不雅测值 A - 臆度值 A 残差 A = 595 - 487.62 残差 A = 107.38
残差 B = 不雅测值 B - 臆度值 B 残差 B = 392 - 527.27 残差 B = -135.27
残差可用于策画转头方程中的纰缪以及测试多个假定。
智慧树在线教育平台关联此主题的反映? 真实迷奸女高中生