常见文献中写到“自变量每增高10个单位或每增高一个标准差，...”，这该怎么实现呢？

2022-02-14 15:13:55 来源:

作为连续型数据集种类，本身就内置七十二变的要素，因此本期主旨我们继续来向大家简述一下，在紧密结合紧接著框架时，连续型数据集种类还有哪些其他神秘的变动表达方式。

1、正态转并成

首先要提到的就是较为典型的正态转并成表达方式。我们都究竟，在紧密结合等价紧接著时，并不须要满足一定的前提条件，其里有一项即要求数据集种类须依从绝对倍数或者近似绝对倍数，如果不满足绝对倍数的条件，往往就会加剧紧密结合的紧接著框架产生一定的偏倚，因此对于连续型数据集种类在知悉顺利完并成正态性检查和是十分必要的。

那么，当我们的数据集资料分布再现非正态时，并不须要怎么办呢？此时，我们可以将重构的连续型数据集种类作某种函数的转并成，使偏态资料正态化，从而满足紧接著框架紧密结合的并不须要。

根据数据集本身分布共通点的并不完全一致，我们可以运用于并不完全一致的正态转并成函数，例如对重构连续型数据集种类大数合根号倍数（Square Root）、合自然对数（Ln X）、合以10为底的对数（Log10 X）、合进行时（1 / X）等等。

当然，并不须要同样的是，如果对数据集种类顺利完并成了正态转并成，在结果里对紧接著框架参数顺利完并成暗示时，应按照转并成后的数据集种类给予暗示，或者可以根据转并成时运用于的函数关系，倒推重构自数据集种类对重构因数据集种类的现像大小。

例如JACC科学杂志2016年发注记的一篇篇名[1]，编者在抽样时首先对数据集顺利完并成了正态性检查和（原意注记述：Normality of continuous variables was assessed by the Kolmogorov-Smirnov test）。

结果显示troponin I、NT-proBNP、corin等诱因再现偏态分布的特质，因此在描绘出研究课题对象基线信息时编者也运用于了里奇数（上四分奇数，下四分奇数）的注记达表达方式，例如Troponin I的里位素质为4.5（1.8，12.6）ng/ml。

随后编者运用于多重等价紧接著的方法，来分析方法影响corin素质的诱因（原意描绘出：Multiple linear regression ysis was applied to determine factors influencing corin levels. Levels of troponin I, NT-proBNP, and corin were normalized by log10 transformation）

即研究课题人员首先对troponin I、NT-proBNP、corin等诱因合log10转化成为绝对倍数，然后便应运而生到多重等价紧接著里顺利完并成分析方法。（结果编者从未在文里再现）

随后编者又顺利完并成了Cox紧接著框架分析方法，虽然Cox紧接著对自数据集种类的种类没有独有的要求，但是为了与多重等价紧接著里数据集种类替换成的表达方式大相径庭，故编者对于troponin I、NT-proBNP、corin等诱因即使如此运用于log10转化成后的表达方式归属于框架，结果见下注记表。

2、每变动通常当前的转并成表达方式

在前期主旨《想将连续数据集种类转化成为哑巴数据集种类归属于紧接著框架，咋组并成员？》里，我们简述到若如此一来将重构的连续型数据集种类替换成框架，紧接著参数被暗示为每变动一个基本单位素质所引来的因数据集种类的变动现像，但有时这种变动现像或许是很微弱的。

因此，我们可以将连续型自数据集种类以一个基本上好的通常夹角，运用于等距组并成员的方式，将其转并成为哑巴数据集种类，然后便替换成到框架里顺利完并成分析方法。这样组并成员的好处在于，分析方法结果在实际上的医学应用于里难于病变思考和应用于。

例如我们归属于的研究课题一些人年龄组为31-80岁，我们可以按照年龄组每10岁一组并成员顺利完并成分界，细分31-40、41-50、51-60、61-70、71-80一共5个亚组并成员，基本上4个哑巴数据集种类归属于框架顺利完并成分析方法。

但是如果某一诱因的人体内范围内极大，此时按照上述方法顺利完并成组并成员时，就就就会被细分很多亚组并成员，并不须要基本上很多个哑巴数据集种类归属于框架，从而使得框架比起“臃肿”；又或者数据集的人体内范围内很小，没有便顺利完并成更小基本单位的组并成员，此时就不便适当将其转化成为哑巴数据集种类的表达方式。

那么，如果遇到这种具体情况，应该对连续型数据集种类顺利完并成怎样的执行呢？我们便来看一篇JACC科学杂志2016年发注记的一篇篇名[2]。

该研究课题Cox紧接著结果如下注记表，我们见到框架里的多数数据集种类，编者都运用于到了“per”这样一个词，例如per 5% change、per 0.1 U、per 100 ml/min，等等，这里的“per + 变动夹角 + 基本单位”的表达方式，注记示的即为我们要简述的，将连续型数据集种类按照每变动通常当前的表达方式顺利完并成转并成。

具体举其里2个诱因为例来顺利完并成说明。例如Oxygen uptake efficiency slope，在研究课题一些人里的略高于为1655 U，5%-95%一些人的变动范围内为846-2800 U，由此可见数据集的变动范围内是非常大的。此时如果应运而生重构连续型数据集种类，每增高1U，紧接著框架的HR倍数或许就就会很小，没有体现实际上的医学普遍性；如果转并成为哑巴数据集种类，又就就会被分界并成很多组并成员。

因此，编者将该数据集种类以每增高100 U的表达方式应运而生到框架里，高度评价的是Oxygen uptake efficiency slope每增高100 U时，研究课题一些人的致死或许性就会攀升9%（HR=0.91，95% CI：0.89-0.93）。

便例如Peak RER这个诱因，研究课题一些人的略高于为1.08 U，5%-95%一些人的变动范围内为0.91-1.27 U，数据集振荡又非常小。此时如果应运而生重构连续型数据集种类，每增高1U，紧接著框架的HR倍数或许就就会极大，而且在医学普遍性的暗示上，由于一些人里的数倍数范围内很小，如此一来变动1U的个体具体情况并不典型，没有在医学大部分病变里赢取广泛应用于。如果转并成为哑巴数据集种类，或许也没有便顺利完并成拆成。

因此，编者将该数据集种类以每增高0.1 U的表达方式应运而生到框架里，考察的是Peak RER每增高0.1U时，研究课题一些人的致死或许性就会攀升6%（HR=0.94，95% CI：0.86-1.04），但无人口学显著性。

思考了这种变动表达方式的普遍性，那么在实际上的抽样里，如何付诸这种表达方式的转并成呢？其实很非常简单，假如，如果我们不想把该诱因由每增高1个基本单位替换并成每增高100个基本单位（变动波幅减小100倍），只并不须要将该重构数据集种类除以100求得框架即可；正因如此，如果我们不想把该诱因由每增高1个基本单位替换并成每增高0.1个基本单位（变动波幅缩小10倍），只并不须要将该重构数据集种类乘以10即可。

3、每变动一个平最小倍数的转并成表达方式

上面我们简述了每变动通常当前的转并成表达方式，例如每变动0.1、10或100个基本单位，但是我们常常在阅读古书时，还就会见到另外一种变动表达方式，即自数据集种类每变动一个平最小倍数（per SD increase）的表达方式。那么这种变动表达方式又是什么从哪里冒出来的呢？

我们便来看一篇JACC科学杂志2016年发注记的一篇篇名[3]（好吧，恳求小咖独宠JACC，再来努力争合实在雨露均洒），Cox紧接著结果如下注记表。

我们见到，对于年龄组和收缩压，编者都运用于了每增高1个平最小倍数的表达方式归属于到紧接著框架里，即年龄组每增高1个平最小倍数，颈动脉粥样硬化性脑出血（ASCVD）的胃癌或许性增高70%（HR=1.70，95% CI：1.32-2.19）；收缩压每增高1个平最小倍数，ASCVD的胃癌或许性增高25%（HR=1.25，95% CI：1.05-1.49）。

这里将连续型数据集种类转并成为per SD increase的表达方式应运而生框架里，又有什么独有的普遍性么？

我们都究竟，平最小倍数是描绘出一个数据集种类的所有观察倍数与均数的平均时域总体的当前，对于计量基本单位完全一致的数据集种类，平最小倍数越大，数据集的时域总体就越大。在医学实践里，我们常用平最小倍数来计算医学参考倍数的范围内。

假定测量的当前依从绝对倍数，根据绝对倍数斜率下面积推知，最小倍数 ± SD下行内的面积为68.27%，最小倍数 ± 1.96 SD下行内的面积为95%，最小倍数 ± 2.58 SD下行内的面积为99%，意味著在大约4个平最小倍数的之内，数据集已经基本遮盖了95% 的样本。

因此，倍数得同样是对于罕见的非常规上新当前，每增高1个基本单位时的医学普遍性并不是很明确的具体情况下，可以将其转并成为每增高1个SD的表达方式归属于紧接著框架里，由此可以指导病变根据自身实际上的量度结果，想到自己是处于一些人分布素质的几个平最小倍数之内，进而来分析方法其相同的或许性就会改变多少。

正因如此，付诸这种表达方式的转并成也非常非常简单，可以通过以下两种方式：

1、在紧密结合紧接著框架之前，将重构的连续型数据集种类顺利完并成规范化执行，便将规范化后的自数据集种类应运而生到紧接著框架里，所赢取的紧接著系数即为自数据集种类每增高1个SD时对因数据集种类的影响（同样这里只对自数据集种类顺利完并成规范化执行）。

2、如果从未对重构数据集种类顺利完并成规范化执行，也可以如此一来把重构数据集种类应运而生到框架里，得出从未标化的紧接著系数（Unstandardized Coefficients），然后便乘以该自数据集种类的平最小倍数，此时即为自数据集种类每增高1个SD时对因数据集种类的影响。

不过细心的补习班见到，SPSS在驱动从未标化的紧接著系数（Unstandardized Coefficients）的同时也就会驱动规范化紧接著系数（Standardized Coefficients），那么这个规范化紧接著系数又是什么鬼，它与上述从未标化的紧接著系数，以及每增高1个SD的紧接著系数又有什么区别呢，更进一步的篇名里就会有简述。

参考古书：

[1] J Am Coll Cardiol. 2016 May 3;67(17):2008-14

[2] J Am Coll Cardiol. 2016 Feb 23;67(7):780-9

[3] J Am Coll Cardiol. 2016 May 31;67(21):2480-7