数学建模社区-数学中国

标题: 《生日悖论》是个延续了百年的谬误！ [打印本页]

作者: 商与儒 时间: 2009-6-14 15:00
标题: 《生日悖论》是个延续了百年的谬误！
本帖最后由商与儒于 2009-7-9 10:08 编辑

《生日悖论》是个延续了百年以上的谬误

发展非线性经济学的哲学漫谈

这是我在提议发展我国非线性经济学时，用自己的非线性哲学思维审视精确科学——数学的一篇哲学漫谈，我相信诸位很容易判断我的结论是否正确。欢迎各位批评和指正！

《概率理论》是《经济学》的重要分析工具，它真的是那么科学、那么完美、那么无暇可击吗？
我们先来看个例子：
  一个袋子里有9个材质、形状、重量都一样的小球，它们分成3组，分别写着1-3的数字。我们随机摸3个小球，问：摸到3个数字相同的小球和摸到3个数字都不同的小球，哪个概率大？
显然数字相同的小球只有3个组合：111，222，333；而数字都不同的小球有6个排列（123，132，213，231，312，321），所以答案一定是摸到数字都不同的3个小球的概率大。
现在我们用三种不同的颜色分别代替三个不同的数字，给这些小球上涂上红兰棕三色，每种颜色涂3个小球。我们随机摸3个小球，问：摸到3个颜色相同的小球和3个颜色都不同的小球，哪个概率大？
  颜色相同的3个小球只有三个组合——红红红、蓝蓝蓝、棕棕棕；颜色都不同的3个小球有6种不同排列（红蓝棕、红棕蓝、蓝红棕、蓝棕红、棕红蓝、棕蓝红），所以答案一定是摸到颜色都不同的3个小球的概率大。
现在我们再在三组颜色相同的小球上分别写上123三个不同的数字：
1 2 3
1 2 3
1 2 3
于是，如上图所示，9个小球中，颜色相同的小球，数字一定不同；数字相同的小球，颜色一定不同。
我们问：随机摸3个小球，概率最小的是哪一种情况时，就形成了一个“悖论”——回答“摸到3球颜色相同的概率最小”，那么这3球的数字一定不同（这是同时发生的必然事件，概率为1），摸到3球数字不同的概率一定不是最小；回答“摸到3球数字相同的概率最小”，那么这3球的颜色一定不同，摸到3球颜色不同的概率一定不是最小。
概率是门严密精确的数学，怎么会得到如此矛盾的结果呢？
我们来分析其中的原因：
如上图所示，我们先来研究一下，这里颜色和数字的互相关系。取颜色相同就是取列，颜色相同数字一定不同；取数字相同就是取行，数字相同颜色一定不同，因而颜色和数字在这里的关系是“正交”，也是等价的（转90度就互相转换了）。
从哲学角度看，两个正交的特征，本身体现了一种对立与辩证的关系。
数学是严格遵守形式逻辑的科学，是以形式逻辑为生命（存在前提）的，因而绝对排斥辩证逻辑。所以在同一个题目里，它只能认定同时出现的两个正交特征中的一个，而将另一个排斥。
  我们以“数字”作为标识特征来具体论证上述结论：
我们随机摸3个小球，当3个球的数字都不同时，会出现六种排列（123，132，213，231，312，321）；而3个球数字相同时，却只有三个组合 ——111，222，333 ，不是排列，为什么不排列呢？我们很清楚的知道，这里的3个1（或3个2、3个3）肯定不是同一种球（看颜色就知道，3个1其实是三种不同颜色的小球），完全可以排列，也应该排列，但实际上你就是排列了，也没有用，因为排列后产生的各个项，会因为它们的数字相同而被压缩（同类项合并），原因在于形式逻辑在这里只认数字，数字相同的小球，虽然颜色不同，但无论你如何排列，它们都只是同一个数字，所以被合并（压缩）了！
以“颜色”作为标识特征，也能得到相类似的分析结果。
这个现象显然与计算概率的理论相悖，根据概率的计算理论，任何一种可能出现的排列或组合，就是一种可能出现的基本事件，在计算概率时，都应该被包括进去，不能因为形式逻辑“识别能力”的局限，遗漏了不该遗漏的基本事件，因为这些排列客观上是存在差异的，并不是同类项！

1 2 3
4 5 6
7 8 9

假定我们如上图所示，给三种颜色的小球分别标上1-9的数字后，我们发现，随机摸3个小球，假定我们按小球的颜色排列组合，只能得到27个基本事件。假定我们按数字排列组合(这次不会有任何遗漏)，我们居然得到了504个基本事件！原来，“正交”特征的被排斥，不仅排斥了同色小球的排列，也排斥了不同色小球的组合！
形式逻辑排斥辩证逻辑——这就是《概率理论》在这里出现问题的根本原因！
《概率理论》的问题仅仅于此吗？
不是！
从哲学角度看，真实世界是模拟和辨证的，是连续结构系统；形式逻辑是人造的，是离散结构，凡是严格遵守形式逻辑的科学，一定是“线性科学”，是离散结构系统，它对真实世界连续结构系统的描述只能是一种“逼近和近似”，在系统的标度、维度、精度、速度、温度……等变化时，这种描述的“误差（矛盾）”一定会显现。离散结构（线性系统）与连续结构（真实世界）之间的矛盾，本质上就是形式逻辑与辩证逻辑之间的矛盾、是数字量与模拟量之间的矛盾。用线性系统去逼近和近似的分析真实世界，矛盾是一定会显现的！
还是用上面的例子，来具体看看概率理论的线性局限性：
一、维度变化：我们给这些小球增加一个正交的特征，就是增加了维度，上面的分析已经告诉我们，概率理论在维度增加时，就会得出自相矛盾的结论。
二、精度变化：我们给3色的9个小球标上1-9的数字，就是提高了对小球的识别精度。对于同样的9个三色小球，我们随机摸3球，假定要计算3球都为红色的概率，在精度没有提高时，小球只有颜色作为标识，这个概率为 1/21=4.76%。提高精度后（用数字做标识），基本事件变成了504个，这个概率变成1/84=1.19%了！按理我们不改变小球的颜色、仅仅给小球加上数字标识，是不应该改变摸到3球都为红色的概率的，但是概率理论却明明白白的算出来，两者的概率是不同的，而且差异很大（差了3倍多！）！这个结论显然与真实世界的真实情况是相悖的。
三、标度的变化：我们扩大3色小球的标度——再增加9个同样3色的小球，这次用1-18的数字来标定这18个3色小球，还是随机摸3个小球，基本事件就变成了4896个，3球都为红色的概率变成5/204=2.45%。如果再增加9个同样3色的小球，用1-27的数字来标定这27个小球，还是随机摸3个小球，基本事件变成了 17550个，3球同为红色的概率变成了28/975=2.87%。《概率理论》在这里用这些不同的数字明确告诉我们，即使3种颜色的小球同比例增加，随机摸3球都为红色的概率是会变化的。可是我们如果不给这些小球标上数字的话，《概率理论》却会告诉我们，不管可供取样的小球增加多少，只要3种颜色的小球同比例增加，随机摸3球都为红色的概率是不变的，始终是1/21！——难道在颜色球上标不标数字会影响摸颜色球时发生的概率吗？显然不会！
所以我说，线性理论在维度、精度、标度变化时，它的误差会显现——《概率理论》是线性的，一定有它的局限性。
在实际运用概率理论时，人们的线性理解，也会产生错误。譬如《生日悖论》，就是一个延续了百年以上的谬误！而且至今还在继续误导全世界的下一代！
受帖子字数限制，这个帖子先到这里。

谢谢！

商与儒（余季方）

作者: 商与儒 时间: 2009-6-14 15:27
本帖最后由商与儒于 2009-6-14 15:29 编辑

《生日悖论》是个有名的根据《概率理论》得出的结论。

先把百度百科的相关内容转摘如下：
生日悖论是指，如果一个房间里有23个或23个以上的人，那幺至少有两个人的生日相同的概率要大于50%。这就意味着在一个典型的标准小学班级(30人)中，存在两人生日相同的可能性更高。对于60或者更多的人，这种概率要大于99%。从引起逻辑矛盾的角度来说生日悖论并不是一种悖论，从这个数学事实与一般直觉相抵触的意义上，它才称得上是一个悖论。大多数人会认为，23人中有2人生日相同的概率应该远远小于50%。计算与此相关的概率被称为生日问题，在这个问题之后的数学理论已被用于设计着名的密码攻击方法：生日攻击。

生日悖论是这样描述的：
不计特殊的年月，如闰二月。
先计算房间里所有人的生日都不相同的概率，那么
第一个人的生日是 365选365
第二个人的生日是 365选364
第三个人的生日是 365选363
:
第n个人的生日是 365选365-(n-1)
所以所有人生日都不相同的概率是：
(365/365)× (364/365) ×(363/365) ×(362/365)× ... ×(365-n+1/365)
那幺，n个人中有至少两个人生日相同的概率就是：
1-(365/365)× (364/365) ×(363/365) ×(362/365)× ... ×(365-n+1/365)
所以当n=23的时候，概率为0.507
当n=100的时候，概率为0.9999996
真是不算不知道，一算吓一跳。
【理解生日悖论】
  理解生日悖论的关键在于领会相同生日的搭配可以是相当多的。如在前面所提到的例子，23个人可以产生23 × 22/2 = 253种不同的搭配，而这每一种搭配都有成功相等的可能。从这样的角度看，在253种搭配中产生一对成功的配对也并不是那样的不可思议。
于是我开始在网上查，看看有没有人提出过这个论断是错的，结果不但没有找到有人说它错，还看到了这些数据：
当：
N=50，概率为96.3%，
N=60, 概率已经大于99%；
N=100，概率为99.99996%;
N=200时，居然为0后面29个9！

我也看到了描述这个结论的曲线——N过了60人之后，概率已经大于99%，曲线就像一根渐近线，以几乎平行的方式接近概率等于1的直线，最终在N=366处达到1。
还找到Paul Halmos （1916-2006）用数学论证（非数字方法）对这个论断的证明，Halmos还写了这样一段话：
“这个推导是基于一些数学系学生必须掌握的重要工具。生日问题曾经是一个绝妙的例子，用来演示纯思维是如何胜过机械计算：一两分钟就可以写出这些不等式，而乘法运算则需要更多时间，并更易出错，无论使用的工具是一只铅笔还是一台老式电脑。计算器不能提供的是理解力，或数学才能，或产生更高级、普适化理论的坚实基础。”
  同一篇文章中还有这样的说明：生日悖论普遍的应用于检测哈希函数:N-位长度的哈希表可能发生碰撞测试次数不是2N次而是只有2N/2次。这一结论被应用到破解cryptographic hash function的生日攻击中。生日问题所隐含的理论已经在[Schnabel 1938]名字叫做capture-recapture的统计试验得到应用，来估计湖里鱼的数量。
还有不少国外的数学家，用其他一些方法，也得出了生日悖论的结果；甚至还有很多如何用各种程序产生随机数来检验这个悖论正确的例子！我在网上查到的概率学，不管国内外，无一例外将它作为教材；我还查到很多用生日悖论作为直观靠不住的例子的文章和书，很多还是科学家写的书……

《生日悖论》难道真的是如此神奇而正确的吗？

我用两个办法来检验一下：
一个就是，直接计算“发生两个人以上生日相同的概率”，而不是先算发生生日不同的概率，再用1去减。
由于每个人只能在365天里的某一天出生，所以每个人的生日取值就是全部生日的1/365。
N=1 时，不可能发生生日相同的事件，概率: P=0；
N=2 时，“任意两个人生日相同”的概率: P=1/365；
N=3;时，设3人为A，B，C；
三个人之间有三个“任意两个人生日相同”的可能（三人及三人以上生日都相同的不是基本事件，被排除）：
AB，AC，BC；
因为“任意两个人生日相同”的概率为 1/365；所以三人之间发生两两生日相同的概率为3*（1/365）=3/365；
N=4 ；A，B，C，D
AB，AC，AD；
BC，BD；
CD
这里有六个“任意两人生日相同”的可能，所以P=6/365；
N=5； A，B，C，D，E
AB，AC，AD，AE
BC，BD，BE
CD，CE
DE
这里有10个“任意两个人生日相同”的可能，所以P=10/365；
显然，这是个等差级数，等差级数求和的公式为 N（N-1）/2
（写到这里我们明白了，取样23个人的时候，比对“两人生日相同”的次数有253个，就是这样算出来的：23*(23-1)/2=253;  ）
则，N个人生日相同的概率P=[N*（N-1）] /（2*365）
但是，
当N=20时，有两个人生日相同的概率为 52%，已经超过50%。
当N=27时，有两个人生日相同的概率为 96%
N=28时，有两个人生日相同的概率为 103%！
算到这里显然看出这个公式错了！因为概率是不能大于1 的！
但是从逻辑上、计算上看,我们完全遵循了《概率理论》，这里并没有任何错啊？！
问题在哪里呢？我们后面再分析。

我用了第二种方式——扩大它的标度。根据题目的设定，我们知道这个《生日悖论》的结论可以适用于任何标度。假定1年有1000天、10000天、100000天……
按《生日悖论》的算法，我计算出1-1000中，只要随机取38个数，其中两个数相同的概率就达到50%；在1-10000中，只要随机取118个数，其中两个数相同的概率就达到50%；在1-100000中，只要随机取363个数，其中两个数相同的概率就达到50%。
  如果计算1-100000个数中，取多少数就能使发生两个相同数的概率超过99.999%, 我估计不会超过5%，将它画成曲线，我们一定会看到这根曲线离开0点后，会很快“直冲云霄”（接近1），这时离开“终点（100000）还有十万八千里！后面的数字却早就全部没有意义了，只有那个100001候补守门员在场外守候，因为最后确定概率为1 非它出场不可！
我相信这里一定出问题了！也就是说，我们在365个数字中，只要随机取占总数6.5%个数——23个；在1-1000个数中，只要随机取占总数3.8% 的数——38个；在1-10000中，只要随机取占总数1.18%个数——118个，在1-100000中，只要随机取占总数0.36%个数——363个，则取出的这些数中有两个相同数的概率就都达到了50%！
如果我们把数字扩大到1亿，我相信这个比例会小于万分之一！在1亿个数里随机的取出不到万分之一的数，却能使这些取出的数里有两个相同数的概率大于50%——这绝对是个不符合事实的结论，与之相悖的不是直观，而是事实！
因为根据对题目的分析，我们知道，这个被取样的系统，是设定为一个最分布最均衡的系统，也就是熵为最大的系统。那就是说，无论你如何取样，无论你取样后如何计算，都不可能改变原系统的熵值，也不应该改变原系统的熵值；同样，无论你怎样取样、取样多少，被取样的群体，也应该是熵为最大的系统、与原系统是一致的。但是《生日悖论》的结论却等于告诉我们，只要一取样，被取样部分的“熵值”就变小了！而且这个变小与原系统的标度有关，标度越大的系统，被取样部分的熵值越低！这与题目给出的先决条件显然是相悖的。所以从熵的角度，我们很容易得出《生日悖论》是个谬误的结论！
我们还可以这样来考察《生日悖论》的结论：假定我们对这个熵最大的系统随机取样24人，尽管每次取样的分布都不会一样，但是根据统计学原理，无数次取样的结果应该是线性分布的（因为熵最大、随机取样），那么他们平均分布在12个月的概率应该是最大，也就是平均一个月分布两个人的概率应该是最大的。常识告诉我们，发生两个人生日相同的前提条件，是两个人至少在同一个月里出生，不在同一个月出生的人之间虽然也可以互相比对生日，但是这个比对的结果是确定的概率为0事件（不可能发生的事件），不能列入基本事件。所以23个人虽然有253次比对生日的机会，实际上其中绝大多数是概率为0 的事件，正是由于大量的非基本事件参与了计算，才会得出那么离谱的结论。

作者: 商与儒 时间: 2009-6-14 15:42
这里的关键问题，是一个“序”的问题！大家在理解《生日问题》的时候，都会把《生日问题》看成是一个没有“序”的问题，因为我们只关心是否有人生日相同，对哪一天发生生日相同事件、这些生日相同事件是如何排序的、或同一天生日的有几个人……等，我们都不必考虑，所以《生日问题》一直被认为是没有“序”的问题。事实上，《生日问题》有一个内在严格的“序”！一年的365个生日，就像365个席位，本身是严格排序的，它们之间不存在“两两相同”的可能（也就是不存在互相比对的需要）。我们一旦取样N个人，这N个人每个人占据的席位就是确定的，不会再变动，不是同一个席位的任何人之间，根本就不存在互相比对生日相同的必要（或者说比对生日是否相同的概率是确定的0）。用这样的思路来分析这个问题，我们就很清楚了，在这里根据《概率理论》将N个人排列组合后再计算生日相同的概率的做法，是错误的！实际上被取样的N个人，并不是围成一群在互相比对生日，而是直奔自己的席位坐下，不同席位的人，根本不存在比对生日的必要（这种比对是确定的概率为0 事件）。实际情况是：取样N个人，只要这N个人中有人坐到了相同的席位上，就发生了生日相同事件，同时，也一定有“空席位”产生，也就是N个人占据了少于N个席位，所以《生日问题》实际上要研究的，就是被取样的N个人各自坐到自己的席位上以后，占据的席位总数与N是否相同，如果N个人占据的席位数小于N个，就一定发生了生日相同的事件。因此，计算取样N个人发生生日相同事件的概率，关键就是计算N个人应该占据的N个席位中，发生“空席位”的可能是多少。
根据这个思路，我做出以下推论：
1.N个人最多占据N个席位（N<366,生日全部不同）；
N个人至少占据一个席位（生日全部相同）；也就是取样N个人，这N个人占据的席位中，1个座位不为空是绝对的，是概率为1 的事件。
2.N个人各取哪一天生日，是完全独立的等价事件，互相没有影响。
3.N个人应该占据的N个席位，每一个都有发生空席位的可能性，这些席位发生空席位的可能性，也完全是等价的独立事件，互相没有影响。
4.所以，每次取样N个人，发生空席位的可能性为N个，但是根据第二条推论，必须减去1个绝对不为空的席位（我们不关心是哪一个）。因此取样N个人，发生空席位的可能性为：(N-1)个；
5.由于每个人只能有一个生日，只能占据365个席位中的一个，也就是占据所有席位的1/365。而取样N个人，如果没有生日相同事件发生，N个人一定占据所有席位的N/365；如果有生日相同事件发生，就是有空席位事件发生，N个人发生空席位的可能为(N-1)个，所以取样N个人时，发生(N-1）个空席位的可能占总席位数的（N-1)/365，就是取样N个人发生生日相同的概率：
P=(N-1)/365
当 N=1时，P=0，没有生日相同的可能发生；
当 N=366时，P=1,发生生日相同的概率为1。
  这是个完全线性的公式，适用于任何标度。
  我们可以用这个公式和《生日悖论》的公式做些比较：
这个线性的公式告诉我们：
当N= 60 时，发生生日相同事件的概率为16.16%；
当N=100时，发生生生日相同事件的概率为27.1%；
当N=200时，发生生日相同事件的概率为54.52%；
这些结论告诉我们，不要说随机抽取100个人，这些人完全可能均匀的散布在365个席位上，不发生生日相同事件；极端的讲，就是随机抽365个人去坐这365个席位，也有可能正好365个人的生日都不同！
  但是《生日悖论》却告诉我们：
当N=60 时，发生生日相同事件的概率为99%；
当N=100时，发生生日相同事件的概率为99.99996%；
当N=200时，发生生日相同事件的概率为0后面29个9！

  写到这里，我用下面的分析，来说明一个很重要的概念。
  假定取样N个人，我们对最后一个人（N）“入座”前的情况做个分析：对于任何一次取样，前面(N-1)个人的席位分布只有两种情况： (N-1)个人之间没有人生日相同，那么他们一定占据了(N-1)个席位，对N来讲，他就有(N-1)个他的席位已经有人坐的可能，所以在这种情况下，第N个人所遇到的发生生日相同的可能为(N-1)个，就是取样N个人发生生日相同的全部可能，因为前面没有发生任何生日相同事件。在N之前的(N-1)个人当中，可能发生了M次生日相同的事件（M小于等于N-1），那么在这种情况下，他们一定只占据(N-1-M)个席位，于是对N来讲，他就只有(N-1-M)个他的席位已经有人坐的可能，这个可能加上前面的人可能已经发生的M次生日相同事件，取样N个人发生生日相同的全部可能为：[(N-1-M)+M]=(N-1)个,与《情况一》假定前面没有人生日相同是一样的。
  现在我们再来重温一下空席位的概念，就会理解上面的结论得更清楚了：取样N个人，除了第一个人以外，从第二个人开始，任何人的席位都有可能已经有人坐了，因而有产生空席位的可能。任何一个人在他寻找自己的席位时，不管他有多少个“产生空席位”的可能，最终坐下后，却只能产生一个空席位，因为一个人只有一个确定的生日，所以一个人可以有很多“产生空席位的可能”，却最多“产生一个空席位”。取样的人越多，每个人产生空席位的可能就越多，但是任何一个人在任何情况下，至最多只能产生一个空席位。
  上面的分析告诉我们一个重要的概念：那就是“比对生日相同的可能”与“发生生日相同的可能”，是很不同的概念，无论在第N个人之前的(N-1)个人之间有多少个“比对生日相同的可能”，我们都不必考虑，我们只要考虑这(N-1)个人之间能发生多少次“生日相同的可能”（M个）。而且对第N个人来讲，前面(N-1)个人中间每发生1个生日相同事件，就一定产生1个空席位，对他（第N个人）来讲，就一定减少了一个入座时发生他的席位有人的可能性，这两者是严格的对等，并且同时发生的！所以不管前面(N-1)人中有没有发生生日相同事件，取样N个人发生生日相同的总可能数，都是(N-1)个，也就是说，取样N个人时，有（N-1)个发生生日相同的可能，已经包括了取样N个人时所有发生生日相同的可能。假定我们再把前面每个人“比对生日相同的可能”都相加，就把很多无效事件作为基本事件在处理了。

  我们现在再来分析前面那个直接计算生日相同公式出现的问题，就很清楚了，那个公式在计算取样N个人发生生日相同的概率时，把N个人“产生空席位的可能（也就是比对生日相同的可能）”都加起来了，因而得到了一个等差级数。实际上根据我们的分析，取样N个人，发生生日相同的可能就是(N-1)个，因此，只要用(N-1)替代那个等差级数，生日相同的概率公式就是：
P=(N-1)/365;

与我们用空席位的办法得出的结论是一致的。

  我们再来分析得出《生日悖论》的计算公式在哪里出了问题：

先计算房间里所有人的生日都不相同的概率，那么
第一个人的生日是 365选365
第二个人的生日是 365选364
第三个人的生日是 365选363
:
第n个人的生日是 365选365-(n-1)

我们用两个办法来理解这个公式：
1.顺着这个说法的思路：每个人的生日取值都应该是365选365，为什么这里N每增加1，选取生日的范围要减少1呢？因为这个公式设定的前提条件是“假定这些人的生日都不相同”，也就是假定(N-1)个人占据了(N-1)个席位，没有空席位发生。所以按这个假设而产生的生日选取模式，必须不断减去前面被占的席位，以确保不发生生日相同事件，所以后面的人的生日取值范围要不断缩小。也就是说，按这样的设定选取生日的办法，本身就保证了取样N个人的时候，这N个人的生日都不同，所以这种生日取值方法本身，就是取样N个人的时候，生日不同的概率！

2.我们也可以这样来理解这个公式：每个人的生日取值都是365 选365，但是第二个人在“入座”时，有一个“自己的席位已经有人的可能”，也就是发生生日相同的可能，发生这个可能的概率为1/365，而我们要计算的是生日不同的概率，因此要减去这个生日相同的概率；第二个人有两个这样的可能……第N个人就有(N-1)个这样的可能。根据前面的概念，这些人发生生日相同的可能不用叠加，重复一下：因为无论在N之前的(N-1)个人之间已经发生了多少次生日相同的事件（M个），对N来讲，他发生生日相同的可能数，一定同时减少了同样的M个，这两者是严格等价的。所以不管取样的人数为多少，第N个人有(N-1)个生日相同的可能，已经包括了前面所有的人发生生日相同的全部可能性。由于这个设定排除了（减去了）取样N个人的时候，全部生日相同的可能，所以这个设定的本身就是取样N个人的时候，大家生日都不同的概率，不能再逐项相乘了，就像直接计算生日相同概率时那样，不能再将前面所有人的发生生日相同的可能逐个相加一样。
  于是，取样N个人，生日不同的概率就是：
P=[365-(N-1)]/365=(366-N)/365;
用1 减去这个概率，就得到取样N个人，生日相同的概率：
P=1-(366-N)/365=(N-1)/365;
至此，我们用“空席位法”、直接计算生日相同的办法、先计算生日不同的办法……三种办法，得到了统一的结果。

  概率理论的问题就是这些吗？不是！还有一个很重大的问题。我再举个例子：为了方便起见，我们假定一年为52周，每周7天，全年为364天。我们把被取样的人群按出生日期所在的“周”，划分成52群，然后在每个人群里随机取样2个人，共取104个人，再来计算这样取样的104个人中间，发生生日相同事件的概率。由于52个周在这里是等价的，我们只要算一个周里随机取样2个人时，发生生日相同的概率，再全部相加（乘以52）就可以得到答案。

一周7天，同一周出生的2个人，生日相同的概率为1/7,
P=(1/7)*52 远远大于1 ！
  问题出在哪里呢？
  我们来分析取样的方式：由于这些人来自52个不同的周，因此不可能发生重叠取样的问题。实际上即使假定我们还是在未经划分的人群里取样104人，尽管每次取样的104人的分布都不一定均匀，但是根据统计学原理，由于我们设定被取样的人群的生日是均匀分布的，取样是随机的，因此无数次取样的平均值，一定是线性分布的，也就是这104个人本来就应该是均匀分布在52周里的。
  我们的计算方式也是没有问题的，因为我们并没有在不同周出生的人之间做无效比对；每周2个人，生日相同的概率就是确定的1/7，用任何公式计算都是这个结果；这52周是完全独立的、等价的；52周的每一个周里被取样的2个人，发生生日相同的概率也是独立的、等价的，所以取样104人发生生日相同的概率，就是应该将这52个概率相加的（52个周之间是“或”的关系，也就是是“加”的关系）。

  看来我们找不到出错的原因，只能得出的唯一结论，就是“不能这样算”！

  从哲学角度看，这个问题的本质就是“非线性系统的局部之和不等于整体”。用线性的概率理论来分割非线性系统后，把分割后的局部都看成是等价的部分，分别计算后再线性叠加，是一定出问题的。

  现在我们再来进一步分析概率的计算理论：综合概率的频率定义、古典定义、和严格定义，我们知道，概率计算的原始想法就是：尽管每次取样都会发生不同的结果，我们只要把所有可能发生的基本事件用排列组合全部列出来，再把你感兴趣的事件出现的次数全部相加后，除以所有可能出现的基本事件的总数，就得到你感兴趣的事件出现的概率。

问题是，我们凭什么认定“所有可能出现的基本事件，它们出现的几率本身是等价的？” 拿上面举过的只涂颜色的小球例子来讲，同样作为基本事件，红红红、蓝蓝蓝、棕棕棕出现的几率，与红蓝棕、红棕蓝、蓝红棕、蓝棕红、棕红蓝、棕蓝红……出现的几率并不是等价的，因为红红红本质上是几个排列的集合；……即使排除正交的因素，我们把9个小球标上1-9的数字，我们又凭什么认定经过所有的排列和组合出现的504个基本事件，每一个基本事件出现的几率是等价的？那只是人为的设定而已！

  真实世界是非线性的，用非线性的分形理论来看，实际上每个基本事件都是所要计算的概率的分形，它们具有内在的“自相似性”，所以用形式逻辑去线性的设定它们的等价，就像用数字量去对模拟量进行量子化（数模转换），一定会“遗失非线性部分（描述细节）”的部分。在标度不大或精度要求不高时，误差在许可的范围，当标度扩大后，这种误差一定会达到“离谱”的程度。

作者: 商与儒 时间: 2009-6-14 16:05

我们在广泛应用的微积分也存在这个问题，微分就是用线性的函数去无穷的逼近非线性函数的局部，从而达到用线性办法解决非线性问题的目的。其实本质上微分也是一种“模数转换”，就像现代数字音频系统，用有限的数字量去转换变幻无穷的模拟量，把真实世界的模拟量量子化，并把每个同类的量子都看成等价的、把不同类的量子之间的关系线性化！但是学过模数转换的人都知道，任何精度的模数转换（时钟脉冲再小、幅度分级再多），所得到的数字量，只能是模拟量的“逼近和近似”，总有“高频损失”，所以实际上通过模数转换得到的同类量子，不管精度多高，互相之间实际上并不等价；不同类的量子之间，也不是严格的线性关系。只是在精度允许的情况下，我们人为的设定它们是等价的。概率理论也是用基本事件作为量子，去量子化真实世界的实际概率，并人为的设定这些基本事件（量子）是等价的。所以，概率理论在精度要求不高、标度不大时，计算结果是“管用”的，但是千万不要把它看成是“绝对真理”，是可以运用在任何场合、可以适用任何标度！这种人为的认定，就是一种线性方式，建筑在这个设定基础上的理论和公式，一定是线性的，在标度和精度要求高的地方、在描述真实世界时，它的线性本质一定会暴露的！

概率的本质问题，是偶然性和必然性之间的关系问题、是微观的无序与宏观的有序之间的关系问题、是局部（取样部分）与整体的对称或相似的关系问题；这三重关系互相之间又是耦合的关系，不能线性的割裂开计算后，再线性的叠加。我不是研究数学的，但是我可以告诉大家一个事实，我曾经抛开概率公式，假定一年的天数分别从1-20（由于时间和精力的关系，我没有算到365），根据实际可能发生生日相同的事件（两人生日相同、三人生日相同、四生日人相同……），列出一组数字，它们居然是标准的“分形”！有兴趣的朋友可以自己去试验，我相信你会得出与我一样的结论——非线性的概率理论，一定是分形的理论！因为分形理论实际上也是一种非线性数学（几何）的理论。只有分形，无论标度如何变化，它的精细结构（精度）是不变的！分形系统的局部和整体的关系、偶然和必然的关系，有序与无序的关系，都不是线性分割和线性叠加的关系，分形系统中局部与整体的统一、偶然和必然的统一，无序与有序的统一，是个更高层面的统一，它们不仅统一在内在的自相似性、内在的对称性、内在的一致性，还统一在结构和序上、维度上、信息上、能量上……分形系统任意小的局部，都蕴含了全部整体的信息，就像全息照片一样；分形是个连续结构的系统，在维度上是连续的，局部的分数维，可以连续的过渡到整体的整数维（后面我会用数系的例子来说明）！而我们现在所熟悉的“线性三维空间”，实际上是人造的离散结构系统，在维度上是不连续的！

从哲学角度看，《概率理论》的线性本质，是由形式逻辑的线性本质决定的，因此，所有以形式逻辑为“生命”的学科，都存在同样的问题。

下面我们再来看看《欧氏几何》，这是大家最熟悉和运用最多的学科。

现在建房的图纸，都是根据欧氏几何画的，但是造完房子后，如果我们去精确的测量房子，一定会发现图纸上矩形的房子，实际上屋顶一定比楼房的底要长，房子两边的墙也是不平行的（它们都垂直于地面），因为矩形房子在真实世界里都是扇形的。
根据欧氏几何的理论，两个平直的平面，是一定可以“处处吻合”的。我们日常生活中所见的桌面，就是实际的例子。但是当我们把标度放大后，就会发现并非如此！譬如：飞机的跑道必须是个绝对水平的面，我们用水平仪在飞机跑道上的任何一段测试，都可以发现它是水平的，假定一个小球静止的放在跑道的一端，它可以一直保持静止。假定给它一个初速度让它开始做匀速直线运动，只要忽略摩擦力，它一定能匀速的跑到跑道的另一端。那么这样的两个飞机跑道“面对面”的贴合，理论上应该是处处吻合的。实际上我们都知道，飞机跑道其实是曲面，这样的两个跑道是绝对不会“面对面”吻合的。假定我们按欧氏几何的定义，把跑道真正做成“平直”的（就像一根筷子放在碗底上），那么我们在跑道的一端放一个静止的小球，那个小球一定会自己动起来，它在跑道上的运动轨迹，一定等同于在一个碗型跑道上的运动轨迹——先加速滚向当中，再减速滚向另一端，然后再滚回来，不断循环震荡!——所以在标度大的真实世界的空间，线性理论与真实世界是不“吻合”的！在宏观世界里(譬如相对论的计算中)，我们也确实不能用线性的欧氏几何，而只能用非线性的“黎曼几何”。（我们不妨用这个例子去理解“引力场里空间的形变”）

作者: 商与儒 时间: 2009-6-14 16:20

事实上数学的基础——复平面数系，也是线性的，它也有致命的矛盾——以实数轴为例，它是所有实数的集合，所有的实数，都对应数轴上的一个点。但是，点是0维的，没有长度和面积，线是1维的，有长度，数轴的长度是哪里来的呢？请各位不要在这里引进“无穷和极限”的概念，因为这里的“点”是精确的定义没有长度和面积的，无论有多少这样的点，都不会有长度和面积。

我用自己的非线性哲学研究后发现，再简单的形，都是模拟量，再复杂的数，还是数字量，无论是用“线”去表达“点”，还是用“点”去表达“线”，本质上都是在做“模数转换”或者“数模转换”。只有“圆”，才能在理论上实现精确的“模数转换（就像用圆的内接多边形求π）”，所以用数轴（形）去表示数的集合，这个数轴一定是个圆！那么在圆的数系里，又如何来解释上面的矛盾呢？也就是0维的“点”的集合，怎么会成为1维的线（圆弧）？我的解释很简单：因为这些“点”不同于一般意义上的“点”，它们有个内在的“自相似性”——到圆心的距离相等，所以它们本质上是一种最简单的“分形（圆）”，而“分形”的豪斯道夫维数大于拓扑维数，分形是具有分数维的，这些“点”的维度不是0维，而是大于0小于1的分数维，它们的集合，就形成了1维的弧线（局部的分数维，组成了整体的1维）。所以现在的复数平面，精确的讲，应该是个球面，它是两维的，但占据了三维空间——我相信这就是全世界的数学家花了几百年，都没能找到“三维数系”的本质原因！
现在我们再回过来分析实数轴的问题，就明白了，原来现在的实数轴，是强行把圆弧“摊直”了，所以它实际上是一根有无数“裂痕”和无数曲线细微碎片组成的“混合线”，也就是说，在这个数轴上有无数的空隙存在，空隙是有长度的，所以数轴的长度是由空隙形成的。这么说有依据吗？我来举个例子：循环小数和自然数都是实数，它们都对应数轴上的点。我们来考察一下自然数1和0.9循环小数，在它们之间，我们永远无法插入任何其他的数，但是无论你对0.9循环小数取多少位，它总是小于1，所以，它们之间就有一个空隙。其实其他循环或不循环小数、无理数……两边都有空隙，正是这无数的空隙，造就了数轴的长度。
支持我以上观点的，还有一个最好的事实——超越数的存在，它们是被形式逻辑排除在外的“特殊无理数”，因为所有的超越数都不是整系数代数方程的解，对于代数数成立的加法和乘法消去律，对于超越数来说就不一定成立。譬如：
三个超越数a，b，c有下式成立：a＋b＝a＋c
但b＝c却不一定成立。
类似地，对于这三个数，如果下式成立：a×b＝a×c
但b＝c也不一定成立。
另外，π和e虽不能用有限的式子表示出来，但却可用无穷级数表示：
　　π=4*(1/1-1/3+1/5-1/7+1/9-1/11+……)=4*∑((-1)^n/(1+2n)),n∈[0,∞)；
　　e=1/(0!)+1/(1!)+1/(2!)+1/(3!)+1/(4!)+1/(5!)+……. =∑1/(n!),n∈[0,∞)；
无穷是个辨证的概念，无法用形式逻辑精确定义（A=A；A≠Ā；A不能既等于A又等于Ā——无穷等于无穷、不等于0、无穷不能既等于0 又不等于0）。
同为实数，超越数显然与其他实数有极大的差别，呈现了显著的非线性。我相信它们就是球面数系被强行压平后产生的碎片，或者说，是对数轴（直线）进行模数转换后留下的非线性（高频）碎片……但是集合论证明代数数的数量远比超越数少（有人把代数数比喻成由超越数组成的黑暗天空中的星星）。所以我开个玩笑——上帝不会创造这么多没有用的超越数吧？我们似乎可以这样比喻：现代数学像个极挑剔的导演，它从数亿万计的大众中，只选了几个完美的明星（譬如自然数），却让它们统治了整个数学舞台。但是我相信随着社会的进步，数学舞台的真正演员应该是“人民大众”的!
从哲学角度看，数字计算机的硬件极限是量子计算机，软件极限就是基于线性（精确）数学和形式逻辑（布尔）代数的算法。一旦模拟数学和辩证逻辑代数被创建，计算机将产生一个非线性的飞跃——模拟计算机（生物计算机）就能被发明！
我认为模拟数学研究的就是连续结构系统，模拟数学用的数系，一定就是那个占据三维空间的球面数系，在这个数系上，数轴上的空隙不存在了，令数学家最头痛的区间、奇点、处处连续却处处不可微、无穷小量与0的矛盾、超越数……都不再存在！只是我们的思维也必须有很大的改变，因为人造的“自然数、二进制、十进制、三维空间……”都是典型的离散结构系统，我们对它们太熟悉了，甚至已经把它们的“存在”当成了真实、真理、和必然。但是在模拟数学里，它们一定随着离散结构的消失而消失，或者被赋予完全不同的意义！
不过，线性数学和线性科学永远不会过时，永远不会被抛弃，因为在人造的平台上（全世界统一的标准、协议……譬如计时单位、时差、长度单位、重量单位、温度单位、海平面、经纬度……），它们还是非常好用的。就像经典力学永远不会被量子力学和相对论淘汰、欧氏几何永远不会被曲面几何淘汰一样，虽然前者只是后者的一个特例而已！

数学是忽略事物的内容，只研究事物存在形式中的“数、量、积、形（空间位置、形状）……”的学科，因而是高度抽象的，也因此而成为许多学科的工具。数学遵循的是严密的形式逻辑。
世界上不存在“只有存在形式、没有存在内容”的东西，所以数学尽管被广泛的应用于实践中，但是数学本身的研究对象，在真实世界里是不存在的，它们都是“抽象”的概念。
譬如：点、线、面就是这样的抽象概念。
无论是欧几里德的《几何原本》还是希尔伯特的《几何基础》，点、线、面的概念，都只作为原始概念或不加证明的公理，事实上我们对这些抽象的概念也确实无法证明或证伪，甚至根本无需证明或证伪。你要学几何学，就必须信它，你若不信它，就无法学几何学（当然你可以自己另外创造一门几何学），因为它们是全部几何学的元点（出发点）。
从哲学角度看，形式逻辑的特点是“永不拐弯”，所以它从一个点出发后，永远只能直线式的发展，数学和几何的定理，都是从元点出发后，不断由前面得出的定理出发，去推出后面的定理。因此它可以顺着原路退回来（可逆），却不可能“拐弯”后回到出发点，也是说，它不可能用后面的任何定理，反过来证明自己前面的出发点。所以任何基于形式逻辑的系统，能做到的“自洽”，最多就是“不自相矛盾（相容）”，而不可能做到“完备”，也就是无法只用自己的公理系统，来证明自己系统中所有的定义或命题——这就是“哥德尔不完备定理”的哲学本质。用个最通俗的例子来说明上面的意思，那就是：一个人的力气再大，也无法拉住自己的头发，把自己提起来！
事实上“形式逻辑”本身，只是一个人造的“思维工具”（这里不展开了，有兴趣的可以查看我另一篇文章《非线性哲学浅说》）。它是个线性的工具，因而只用形式逻辑来建造的所有思维工具（各类学科），都是线性的思维工具。但真实世界是非线性的，人类很快在实践中发现了真实世界的非线性本质和线性工具的局限性，光的波粒二象性的发现、测不准定律和不完备定律的被承认，都标志着人类看到了真实世界是非线性的（不是线性确定的）；而量子力学（我认为它只是“半非线性科学”，因为它用‘重整化’的办法，把非线性的矛盾（发散的项）扔到一个更大的系统去处理，从而使自己在研究的系统能够用线性方式处理）、相对论、混沌、分形、孤立子、自组织（耗散结构）……等理论的创立，都是人类开始创建非线性思维工具的现实例子。
写到这里，再来分析《经济学》的线性局限问题，就很容易了。
我要强调的是两点：
第一、《经济学》的线性特征，除了因为它用于分析的数学本身是线性的，还在于它的研究方式也是线性的，《经济学》在建立每一个理论时，都必须忽略或设定一些条件，这些被忽略或设定的条件，实际上在建立该理论时，都在发生变化，都在时时刻刻影响着哪些被研究的项，就像用经典力学分析“天体的三体运动”一样，三体之间的关系是耦合，不是线性的叠加，所以这些理论，都是“排除了非线性因素”后的线性定律！他们与真实世界只是“逼近和近似”，是很难真正吻合的！
第二、数学的研究对象是忽略了被研究事物的内容后，只研究事物存在形式中的数、量、积、形，研究的对象是最“抽象的、精确的”，可以完全人为设定的，数学遵循的是严格的形式逻辑，完全排斥了辩证逻辑，因为数学成为了“最精确、最抽象”的学科，并成为一切学科的工具。自然科学的研究对象是精确界定的物，切断了“人”与这些研究对象的关系，从而排除了由“人”带来的不确定性；自然科学基本遵循形式逻辑，基本排除了由辩证逻辑带来的不确定性，因而自然科学基本是精确学科。《经济学》最不幸！它研究的对象是人类最重要的社会活动，是动态和辨证的现象，它无法排除由“人”带来的各种不确定性，也无法排除同样设定条件下，出现的很多矛盾的可能性（辨证现象）。
所以《经济学》的线性特征不仅表现在应用它们去分析经济现状的时候，还表现在各类经济学派之间永无休止和永不统一的矛盾和争斗中！
最后我要强调的是：非线性科学是覆盖线性科学的（牛顿力学是量子力学和相对论的最简式、微积分是连续结构系统中维度为自然数的特例），非线性科学不排斥线性科学，线性科学是基础，在精度要求不高和常规标度内，它的线性本质（可精确复制、可逆、可叠加、易推广……等），决定了线性科学还是很好用，所以大家一定要认真学好基础知识！！！

以上供各位参考，欢迎批评指正！

谢谢！

商与儒（余季方）

作者: sea_star666 时间: 2009-6-14 23:02
呵呵

作者: p31415 时间: 2009-6-16 13:42
有意思。。。。。。。。

作者: fwjun840308 时间: 2009-6-18 23:45
对于你说的小球那个悖论，我有个小疑问
1.对于问题“哪种现象的概率最小”，这理解应该是一个现象，换句话说，应该是这个现象的其中一个特征。
举例说明，在你的例子里面提到了，颜色和数字，但任何随即取出现象里面都包含两个特征就是，颜色和数字，但是对于概率计算来说，只能就其中的一个特征来计算，要么数字要么颜色，就是在比较的时候也是数字和数字比较，颜色和颜色比较，但是你这里确实数字和颜色比较，这里我觉得有点偷换概念的嫌疑，如果考虑一个现象的两个特征，这个计算方法应该不是和这个样的

以上是个人的观点，望多指教，谢谢

作者: 商与儒 时间: 2009-6-27 14:42

对于你说的小球那个悖论，我有个小疑问( T4 e( z! d# [5 W/ r% x
1.对于问题“哪种现象的概率最小”，这理解应该是一个现象，换句话说，应该是这个现象的其中一个特征。: V+ ]: K3 m% G P1 p+ D$ J
举例说明，在你的例子里面提到了，颜色和数字，但任何随即取出现象里 ...6 z2 o5 c0 O# S8 g7 G" I' u+ x
fwjun840308 发表于 2009-6-18 23:45

谢谢先生的回帖！

“偷换概念”是诡辩的一种方法，指在辩论中“偷偷的、在对方不注意的时候悄悄的把其中一个概念偷换成另一个不同的概念”。我这里是很公开的说清楚，颜色和数字是正交（对立和辨证的）关系，正是这种内在的关系，使得线性的概率理论陷入困境，因为形式逻辑无法包容辨证逻辑。

限于时间和精力，我不在这里详细与先生讨论。能否麻烦先生移步《数学中国》论坛，查看或参与我在那里与几个网友的探讨？

http://www.mathchina.com/cgi-bin/topic.cgi?forum=5&topic=6621&start=12&show=0

如有不便和得罪，还请先生原谅和海涵！

再次感谢先生的回帖！

商与儒（余季方）

作者: mistyriverr 时间: 2009-7-4 23:23
学习学习呵呵厉害

作者: cherry_deluxe 时间: 2009-8-22 08:42
学习中~~~~~

作者: kmkjwjf 时间: 2010-4-21 10:06
N=4 ；A，B，C，D$ I1 b" [/ Z. k& g+ [
AB，AC，AD；
* T7 V4 s. W1 B- @BC，BD；6 E6 m' _: R) ~# W: N
CD/ {$ H6 i& H! \4 n' D
这里有六个“任意两人生日相同”的可能，所以P=6/365；

你还要减去ABC,ABD,ACD,BCD的概率，然后加上ABCD的概率

作者: cylcjy009 时间: 2010-4-22 19:52
谢谢楼主。！！！挺好的。呵呵～

作者: songdragon 时间: 2010-5-15 01:45
回复 2# 商与儒

你的第一种解法，从N=3时就开始出错。生日悖论计算的是N个人中至少两个人生日相同的概率。
再看你的解法
N=3，设3人为A，B，C，三个人之间有三个“任意两个人生日相同”的可能（三人及三人以上生日都相同的不是基本事件，被排除）：; A5 AB，AC，BC，因为“任意两个人生日相同”的概率为 1/365；所以三人之间发生两两生日相同的概率为3*（1/365）=3/365。
首先，将三人及三人以上生日相同的情况排出是错误的，你所计算的概率仅为3人有两人生日相同的概率。
其次，计算方法，并不能直接使用N=2的情况。正如后文中提到的，“一年的365个生日，就像365个席位，本身是严格排序的，它们之间不存在“两两相同”的可能（也就是不存在互相比对的需要）。我们一旦取样N个人，这N个人每个人占据的席位就是确定的，不会再变动，不是同一个席位的任何人之间，根本就不存在互相比对生日相同的必要（或者说比对生日是否相同的概率是确定的0）。”，所以在用古典概率计算时，要正确运用排列组合。
N=3时，3人生日情况有3^N种组合，任意两人生日相同的情况有C(3,2)*365*364种，所以三人之间发生两两生日相同的概率为3*365*364/365^3=3*364/(365*365)
同理，楼主之后第一种解法都应相应的修改，重新计算一下。并不是概率理论出了错，而是楼主计算错误

欢迎光临数学建模社区-数学中国 (http://www.madio.net/)