- 在线时间
- 10 小时
- 最后登录
- 2012-5-29
- 注册时间
- 2010-3-8
- 听众数
- 3
- 收听数
- 0
- 能力
- 0 分
- 体力
- 165 点
- 威望
- 0 点
- 阅读权限
- 20
- 积分
- 83
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 65
- 主题
- 16
- 精华
- 0
- 分享
- 0
- 好友
- 2
升级   82.11% 该用户从未签到
- 自我介绍
- 学习哦,加泡妞
 |
实际问题是这样的:( N/ q* e) s2 r: r
在实际基因组测序过程中,我们想从测序的reads的数据情况中了解生物的基因组的大小(未知)?
* G# Y. P+ [( p3 S! T! H
& f: ?6 B& t6 L6 [概念解释:7 i; P6 i( k$ Q/ e
reads:为了知道生物基因组的DNA序列情况,把生物基因组的DNA打断为小的片段,测定每个片段的DNA序列情况,每次测定反应得到的数据叫:reads0 ~8 A; \# M$ f0 |' c5 d
测序深度:测序的reads的总大小 /基因组大小,叫测序深度
: c/ N0 v& n' F- Q- H6 ~& _% T+ [2 t; U1 G. e& c
之前,生物信息估计基因组大小的方法
; E @+ X5 Q( _- l; [- p% M" }& u我的实验过程是这样的
$ j* O) ~& Q+ V* L. D9 f$ E( ~) n
1、在一个长度为G的大小的字符串中(DNA序列),从头至尾按一定长度去字符串(叫做K-mer)。例如:ATCT,取3-kmer为:ATC,TCT0 m4 B) c0 v* b. i$ t9 D# u
2、统计相同K-mer出现的次数(叫K-mer的深度): d% e6 Y& X) K" ], ~1 P% ^+ U0 t I
3、统计相同深度出现的次数(叫深度的频数)
( G3 j, r! u5 t/ t; `8 Q4、作深度与深度的频数的图1 W- o W) l" m' f; K
9 @0 \& F/ k: W/ J7 H$ K% z! K) b假设:K-mer的深度与深度的频数图服从泊松分布,可以得到:位置基因组大小=K-mer的个数/K-mer的期望深度(叫peak值)
7 a, b; J3 C. V/ D5 ]# g1 h% s2 ?" E: }( M0 ], w3 q& i. e
我的问题:
& {3 N) j! J. N; v H% E在一个基因组中存在相同的区域,按照上面的做法得到的深度与深度的频数的图,会出现两个峰,其深度关系成2倍关系。
; J' ^5 ~ W" y6 E% R o那么,
. h4 A' s; Q/ Z- |' ]1 c- |- r1、这样的图是符合什么数学公式了?0 t$ r. e3 j1 A, w+ X( u$ N
2、能否区分出基因组中重复的区域?
4 D7 f( ]1 a- E9 _& Y- \, s/ K1 O1 L$ E- F* f
另一个问题,在基因组测序中,由于样品不纯存在污染(混合有其他生物的基因组),做深度与深度的频数的图,也会出现两个峰。4 {) y6 P6 D( Z( B( `5 {8 x
那么,+ ?+ X- i' J( f+ y+ w' B$ a
1、这个可以用数学公式表示吗?( H) @5 H# M% U4 ~8 f/ {" E2 R
2、能否区分出污染的数据?7 Z( d6 A1 B7 |7 w7 e
9 k4 B2 ], l+ a- f- M, d2 p8 Z第三个问题,泊松公式能否像三角函数一样,成叠加的性质,(sinx+cosx)0 B2 e m0 y# _$ Q9 i! \& F u% N
7 Q% y/ |; L# X$ v- `2 e( k
1 T7 a% x- x3 ?& b8 W5 y. Q自我介绍6 j+ j/ T0 V( B: P6 z
我是学生物的,现在做基因组测序工作,在我们的实际工作中,我们经常要计算位置基因组大小,但是我们做的图都不是标准的泊松分布图,所以按照上面公式估计出的大小有很多偏差;而且在实际工作中,经常会遇到杂合和污染的情况;对我们的估计影响也很大。所以希望从数据上得到一些处理。4 U1 {1 E9 m1 U3 ~5 H
+ r$ e8 I. Z4 t" L' r& K* L
希望得到数学同志们的帮助,$ Y( Y& d7 p5 p# v2 S
我的邮箱是:jingyc01@163.com,qq是51178182
2 j' N u/ c# S. Y* p+ `* l0 o/ X8 a& Q% l" g
: G8 f2 T: T, ~: B( b
9 [! p3 S7 u, L5 J: @2 n
|
zan
|