- 在线时间
- 10 小时
- 最后登录
- 2012-5-29
- 注册时间
- 2010-3-8
- 听众数
- 3
- 收听数
- 0
- 能力
- 0 分
- 体力
- 165 点
- 威望
- 0 点
- 阅读权限
- 20
- 积分
- 83
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 65
- 主题
- 16
- 精华
- 0
- 分享
- 0
- 好友
- 2
升级   82.11% 该用户从未签到
- 自我介绍
- 学习哦,加泡妞
 |
实际问题是这样的: P( r& |) J4 b( l& ]
在实际基因组测序过程中,我们想从测序的reads的数据情况中了解生物的基因组的大小(未知)?6 y7 }% j1 B |% E( k
2 _ U C! ?- U/ X# b
概念解释:/ c$ g! M, M) K8 ?% y8 U
reads:为了知道生物基因组的DNA序列情况,把生物基因组的DNA打断为小的片段,测定每个片段的DNA序列情况,每次测定反应得到的数据叫:reads% W$ n K1 N# i. l' }$ \
测序深度:测序的reads的总大小 /基因组大小,叫测序深度
& l: L1 Z9 S2 W8 d7 V: m6 ^) t' G; B+ d0 I1 ^, N- A" Q
之前,生物信息估计基因组大小的方法
2 ^5 m! n0 ~2 ]* `+ p: a, i' f# R# D我的实验过程是这样的4 s: y' {; J! u& }8 D3 c
8 m: \/ \# h" D* D( W2 R
1、在一个长度为G的大小的字符串中(DNA序列),从头至尾按一定长度去字符串(叫做K-mer)。例如:ATCT,取3-kmer为:ATC,TCT
. g: O; c- s3 I5 d2、统计相同K-mer出现的次数(叫K-mer的深度)7 d2 F: G( G) L! X" L9 a
3、统计相同深度出现的次数(叫深度的频数), _$ l, L6 ^) v- O4 ?+ e
4、作深度与深度的频数的图
3 L& Q; J: B; p, s6 g& r: z& m( x
0 C- D) G6 H8 O- ^2 b假设:K-mer的深度与深度的频数图服从泊松分布,可以得到:位置基因组大小=K-mer的个数/K-mer的期望深度(叫peak值)" Y: Z, w% H* E1 H. F3 z: D2 b! h
0 X6 r; g6 P7 I) l- ]" S我的问题:
1 Z. C9 g/ ]/ E+ F1 N6 q在一个基因组中存在相同的区域,按照上面的做法得到的深度与深度的频数的图,会出现两个峰,其深度关系成2倍关系。
. y' o7 w0 |& Z1 I那么,4 G8 {' v Q* p
1、这样的图是符合什么数学公式了?
( B5 T6 a* h! G+ o2 a& C2、能否区分出基因组中重复的区域?0 j& _# j, N- [9 \
: C, }3 p; J6 I: ~# T- f3 n3 U8 M3 u
另一个问题,在基因组测序中,由于样品不纯存在污染(混合有其他生物的基因组),做深度与深度的频数的图,也会出现两个峰。
1 B% h3 [' \. S3 O7 L那么,
, u. \ ^' c$ c& v C4 R2 @$ A* O9 n1、这个可以用数学公式表示吗?
6 e/ m/ G# G: T2 u( W% R3 I2、能否区分出污染的数据?$ t* C- d. r9 [0 G8 { {0 x0 v
: U# y6 v- f2 ` a% }4 k$ Z1 D% H
第三个问题,泊松公式能否像三角函数一样,成叠加的性质,(sinx+cosx)6 \1 ^! I5 G/ `4 u: B5 K/ a
; K9 I* j- X0 z9 |
+ i) T( U9 r0 t# W( u5 x4 \ O自我介绍
2 L4 n5 t' ?5 m3 V2 \我是学生物的,现在做基因组测序工作,在我们的实际工作中,我们经常要计算位置基因组大小,但是我们做的图都不是标准的泊松分布图,所以按照上面公式估计出的大小有很多偏差;而且在实际工作中,经常会遇到杂合和污染的情况;对我们的估计影响也很大。所以希望从数据上得到一些处理。0 T3 T+ G' y+ \7 g6 T! ]
; g& N7 ^% q5 ]9 x希望得到数学同志们的帮助,+ |& _# F' a# m( c9 r; ]
我的邮箱是:jingyc01@163.com,qq是51178182) v/ [2 Q! ]2 C7 V/ l
8 r: ?9 Z0 T/ m* H: X4 B4 D
h9 t* J8 r) j* F a$ D$ F7 m. F
+ e8 w2 Z* P, M8 R) Q; Y T |
zan
|