你的位置:韩国伦理片 > 娱乐中文网 >

马来西亚#文爱 回来分析—ArcGIS Insights | 文档

发布日期:2024-10-29 22:50    点击次数:65

马来西亚#文爱 回来分析—ArcGIS Insights | 文档

回来分析期间可用于规划因变量和一个或多个诠释变量之间的估算关系。 借助回来分析马来西亚#文爱,不错对所选变量之间的关系进行建模,并说明模子计算值。

回来分析使用指定估算规律、一个因变量以及一个或多个诠释变量来创建用于估算因变量值的方程。

回来模子包括输出,举例 R2 和 p 值,以提供讨论模子对因变量估算才调的信息。

图表(举例散点图矩阵、直方图和点图)也不错用于回来分析,以分析关系和测试假定。

回来分析可用于科罚以下类型的问题:

信托与因变量干系的诠释变量。 清醒因变量和诠释变量之间的关系。 计算因变量的未知值。 示例

以下是使用回来分析的示例场景:

一家微型连锁零卖店的分析东谈主员正在扣问不同位置的商店的绩效。 该分析东谈主员念念知谈为什么一些商店的销量低得出乎预念念。 该分析东谈主员将使用诠释变量(举例周围住户区中住户的年齿和收入中位数以及到零卖中心和各人交通的距离)创建回来模子以信托影响销售的变量。 一家考验部门的分析东谈主员正在扣问学校早餐筹备的成果。 该分析东谈主员将使用诠释变量(举例班级畛域、家庭收入、东谈主均学校预算和逐日吃早餐的学生比例)创建考验进度达成(举例毕业率)的回来模子。 此模子的方程可用于信托每个变量对考验进度达成的相对影响。 一家非政府组织的分析东谈主员正在扣问全球温室气体排放量。 该分析东谈主员将使用诸如国内坐褥总值 (GDP)、东谈主口、使用化石燃料的电力坐褥和车辆使用等诠释变量创建列国最新排放量的回来模子。 然后,不错使用该模子通过计算的 GDP 和东谈主口值来计算改日的温室气体排放量。

庸俗最小二乘法

使用庸俗最小二乘法 (OLS) 对 ArcGIS Insights 中的回来分析进行建模。

OLS 规律是多元线性回来的一种方法,即因变量和自变量之间的关系必须通过将线性方程拟合到不雅测数据来进行建模。

OLS 模子可使用以下方程:

yi = β0 + β1 x 1 + β2 x 2+...+βn x n + ε

其中:

yi = 点 i 处的因变量的不雅测值 β0 = y 截距(常量值) βn = 点 i 处的诠释变量 N 的回来所有或斜率 xn = 点 i 处的变量 N 的值 ε = 回来方程的舛错

假定

每个回来途序都有多个假定,必须心仪这些假定,此方程才可视为可靠。 创建回来模子时,应考证 OLS 假定。

在使用 OLS 规律时,应测试并心仪以下末节中所述的假定。

模子必须为线性模子

OLS 回来只可用于创建线性模子。 不错使用散点图来测试因变量和诠释变量之间的线性。 若是变量算计不提升 5 个,则散点图矩阵不错测试扫数变量。

数据必须进行立地采样

回来分析中使用的数据应以样本不依赖于任何外部身分的表情进行采样。 不错使用回来模子中的残差对立地采样进行测试。 在散点图或散点图矩阵上针对诠释变量进行绘图时,残差(回来模子的输出)应不具有干系性。

诠释变量不得共线

共线性是指诠释变量之间的线性关系马来西亚#文爱,它将在模子中创建冗余。 在某些情况下,可使用共线性创建模子。 然则,若是其中一个共线变量似乎依赖于另一个共线变量,则可能要接头从模子中删除该变量。 不错使用诠释变量的散点图或散点图矩阵来测试共线性。

诠释变量的测量舛错必须可忽略不计

回来模子仅与其输入数据相似精准。 若是诠释变量的舛错幅度较大,则无法袭取该模子为精准。 实行回来分析时,仅使用来自已知受信任源头的数据集以确保舛错可忽略不计辱骂常迫切的。

残差的预期总数为零

残差是回来分析中不雅测值与测度值之间的差值。 落在回来弧线以上的不雅测值将具有正残差值,而落在回来弧线以下的不雅测值将具有负残差值。 回来弧线应位于沿数据点中心的位置;且残差的总数应为零。 不错在汇总表入网算字段的总数。

残差具有皆质方差

扫数残差应具有疏通的方差。 不错使用残差(y 轴)和测度值(x 轴)的散点图来测试该假定。 生成的散点图应知道为通盘图中立地绘图的点构成一个水平带。

残差为正态分散

正态分散也称为钟形弧线,是当然产生的分散,其中气候的频率略高于平均值,何况跟着与平均值距离的增大而冉冉减小。 正态分散频繁用作统计分析中的零假定。 残差必须为正态分散,才能知道最好拟合线在不雅测的数据点内聚积优化,而不是偏畸一些数据点并辨别其他数据点。 不错通过创建具有残差的直方图来测试该假定。 不错叠加正态分散弧线,然后在直方图卡片的后面论说偏度和峰度测量值。

相邻残差不得知道自干系

此假定基于按时候排序的数据。 若是数据按时候排序,则每个数据点必须孤苦于前一个或后一个数据点。 实行回来分析时,确保按正确的规定来组织按时候排序的数据十分迫切。 不错使用德宾-沃森考验来规划该假定。

德宾-沃森考验是针对回来模子中残差的自干系进行的测量。 德宾-沃森考验使用 0 到 4 级别,值为 0 到 2 暗示正自干系,值为 2 暗示无自干系,值为 2 到 4 暗示负自干系。 需要接近 2 的值以心仪残差中无自干系的假定。 频繁,1.5 到 2.5 之间的值被视为可袭取值,而小于 1.5 或大于 2.5 的值暗示该模子不适合无自干系性的假定。

模子有用性

回来方程的精准性是回来分析的一个迫切部分。 扫数模子都将包含无数舛错,然则了解统计数据可匡助您信托模子是否可用于分析,随机是否需要进行盘曲。

有两种信托回来模子有用性的规律:探索性分析和考证性分析,具体形色如下末节所示。

探索性分析

探索性分析是一种使用多种不同的可视化和统计期间来清醒数据的规律。 在通盘探索性分析进程中,您将测试 OLS 回来的假定并相比不同诠释变量的有用性。 探索性分析允许您相比不同模子的有用性和准确性,但它并未定定您是否应使用或拒却模子。 应在每个回来模子的考证性分析之前进行探索性分析,并重复实行分析以在模子之间进行相比。

以下图表和统计数据可用作探索性分析的一部分:

散点图和散点图矩阵 直方图和正态分散 回来方程和计算新的不雅测点 判决所有,R2 和矫正的 R2 表率残差 点图

在选择诠释变量和创建回来模子之前,应先进行探索性分析。 由于 OLS 是一种线性回来途序,因此其中一项主要假定为模子必须为线性模子。 散点图或散点图矩阵可用于评估因变量与诠释变量之间的线性干系性。 散点图矩阵不错知道最多四个诠释变量以及因变量,使其成为在扫数变量之间进行大畛域相比的迫切器具。 单个散点图仅知道两个变量:一个是因变量,另一个是自变量或诠释变量。 稽查因变量和单个诠释变量的散点图,使您不错更精准地评估变量之间的关系。 在创建回来模子之前,不错测试线性干系性,以匡助信托哪些诠释变量将创建可袭取模子。

创建回来模子后,不错使用多个统计输出,包括回来方程、R2 值和德宾-沃森考验。 创建回来模子后,应使用输出和必要的图表和表格来测试其余的 OLS 回来假定。 若是模子适合假定,则不错持续进行其余的探索性分析。

回来方程提供了每个诠释变量对计算值影响的有价值的信息,包括每个诠释变量的回来所有。 不错对斜率值进行相比,以信托每个诠释变量对因变量的相对影响;斜率值离零(正数或负数)越远,影响越大。 回来方程还不错通过输入每个诠释变量的值来计算因变量的值。

判决所有(秀气化为 R2)可测量回来方程对本体数据点的建模进度。 R2 值是介于 0 和 1 之间的数字,其值越接近 1,则暗示模子越精准。 R2 值为 1 暗示模子齐备,接头到不同身分和未知变量之间互相作用的复杂性,这在本体情况中着实弗成能存在。 您应该竭力使用尽可能最高的 R2 值来创建回来模子,但要意识到该值可能不会接近 1。

实行回来分析时,通过添加诠释变量来创建具有可袭取的 R2 值的回来模子存在一定的风险,这些诠释变量可仅基于概率产生更好的拟合。 矫正 R2 值也将介于 0 和 1 之间,接头附加诠释变量,由此镌汰了概率在规划中的作用。 矫正 R2 值应该用于使用很多诠释变量的模子,随机用于相比具有不同数目的诠释变量的多个模子。

表率残差用于测量回来模子使用新数据计算值的准确性。 数值越小暗示模子越精准;当对多个模子进行相比时,具有最小值的模子将是最小化表率残差的模子。

点图可用于分析诠释变量的模式,如集群和特别值,这可能会影响模子的准确性。

考证性分析

考证性分析是针对零假定测试模子的进程。 在回来分析中,零假定是指因变量与诠释变量之间无关系。 无关系的模子的斜率值为 0。 若是考证性分析的要素具有统计权贵性,则不错拒却零假定(换言之,统计权贵性标明因变量与诠释变量之间存在关系)。

以下统计输出用于信托四肢考证分析一部分的权贵性:

F 统计量终点干系联的 p 值 t 统计量终点干系联的 p 值 置信区间

F 统计量是从 F 考验复返的全局统计量,它通过信托模子中的扫数回来所有与 0 的各异是否权贵来标明回来模子的计算功能。 F 考验分析诠释变量的概述影响,而不是单独考验诠释变量。 F 统计量具有干系联的 p 值,标明数据中的关系偶然发生的概率。 由于 p 值基于概率,因此这些值介于 0.0 到 1.0 之间。 需要一个小 p 值(频繁为 0.05 或更小)来信托模子中的关系是否真正(换言之,非偶然发生),并拒却零假定。 在这种情况下,模子中的关系偶然发生的概率为 0.05 或 1/20。 随机,这些关系为真正的概率是 0.95 或 19/20。

t 统计量是从 t 考验复返的局部统计量,它差别暗示每个诠释变量的计算功能。 与 F 考验一样,t 考验将分析模子中的回来所有与零的各异是否权贵。 然则,由于对每个诠释变量都实行 t 考验,是以模子将为每个诠释变量复返一个 t 统计值,而不是每个模子复返一个。 每个 t 统计量都有一个干系联的 p 值,暗示诠释变量的权贵性。 与 F 考验的 p 值一样,每个 t 考验的 p 值应为 0.05 或更小,以拒却零假定。 若是诠释变量的 p 值大于 0.05,则即使全局 p 值权贵,也应丢弃该变量并创建新模子。

置信区间知道了每个诠释变量的回来所有以及干系联的 90%、95% 和 99% 的置信区间。 置信区间不错与 t 考验的 p 值一谈用于评估单个诠释变量的零假定。 若是要拒却零假定并持续使用该模子,则回来所有不得便是 0。 关于每个诠释变量,回来所有和干系联的置信区间不应与 0 重复。若是给定诠释变量的 99% 或 95% 的置信区间与 0 重复,则诠释变量无法拒却零假定。 在模子中包含此类变量可能会影响模子的合座权贵性。 若是唯一 90% 的置信区间与 0 重复,则在其他全局统计数据权贵的情况下,诠释变量可能包含于模子中。 理念念情况下,扫数诠释变量的置信区间都应辨别 0。

很很鲁很很很鲁很很鲁在线视频播放 其他输出

其他输出(如测度值和残差)关于考验 OLS 回来的假定极度迫切。 以下末节中先容了这些值的规划规律。

测度值

使用回来方程和每个诠释变量的值来规划测度值。 理念念情况下,测度值将便是不雅测值(换言之,因变量的本体值)。

测度值与不雅测值一谈用于规划残差。

残差

回来分析中的残差值是数据聚积不雅测值与使用回来方程规划的估算值之间的差值。

具有残差值和最好拟合线的散点图

上述关系的残差 A 和 B 规划如下:

残差 A = 不雅测值 A - 测度值 A 残差 A = 595 - 487.62 残差 A = 107.38
残差 B = 不雅测值 B - 测度值 B 残差 B = 392 - 527.27 残差 B = -135.27

残差可用于规划回来方程中的舛错以及测试多个假定。







Powered by 韩国伦理片 @2013-2022 RSS地图 HTML地图

Copyright Powered by站群 © 2013-2024