redkylin 发表于 2011-12-2 10:26

一个关于数据统计和相似随机数生成的问题


问题是这样的,我有一组数据属于多于随机变量,它的两组数据各自服从均值为17.122 标准差为1.03375 均值为56.6781 标准差为4.03468 的正态分布。        并且两组数据的相关性如下
                                                VAR00001                            VAR00002
VAR00001        Pearson 相关性             1                                        .554**
        显著性(双侧)                                                                 .000
        N                                               189                                          189
VAR00002        Pearson 相关性        .554**                                       1
        显著性(双侧)                        .000        
        N                                                   189                                        189
**. 在 .01 水平(双侧)上显著相关。
也就是说如果变量1取了一个较大的值得话,变量2有一个很大的几率也取一个较大值,这样的话我在matlab中使用单纯normrnd()命令生成的随机数据就难以说明问题了。所以我想请问各位大神,如何在能很好考虑到两组数据相关性的情况下生成大量与我现有数据相类似并可供我进行蒙特卡罗发计算的随机数呢???(不用matlab也可以,只求各位大神提供一个解决问题的思路)

rivuletwj 发表于 2011-12-4 15:01

我们只考虑标准化后的随机数生成问题,非标准化的问题可以转化成标准化的问题。
现在的问题就转化为怎样生成两个来自于标准正态分布的随机序列但其又满足一定的相关性。
第一步,利用matlab生成两个独立的序列,记为u,v
第二步,设随机变量x=a*u,y=b*u+c*v为所需要生成的序列,其中a,b,c为待估的参数
第三步,求参数。具体来说,由x,y的方差可列出两个方程,由x,y的相关系数可列出第三个方程。这样三个未知数三个方程即可解出a,b,c
第四步,将求出的a,b,c代入x,y,这样就可求得满足条件的随机数序列x,y

redkylin 发表于 2011-12-4 21:47

rivuletwj 发表于 2011-12-4 15:01 static/image/common/back.gif
我们只考虑标准化后的随机数生成问题,非标准化的问题可以转化成标准化的问题。
现在的问题就转化为怎样生 ...

非常感谢~!有思路就好办了

gigiliao 发表于 2011-12-7 23:17

路过。。。我也顺便学习学习~
页: [1]
查看完整版本: 一个关于数据统计和相似随机数生成的问题