数学建模社区-数学中国

标题: [转] 为什么网站项目只需测试5个用户 [打印本页]

作者: sdccumcm    时间: 2013-6-13 19:32
标题: [转] 为什么网站项目只需测试5个用户
本帖最后由 sdccumcm 于 2013-6-13 19:33 编辑
% ~. }0 N& ~. Y% l# f
( ~! b) r1 [' s9 y6 @# F人们总是认为,用户测试是一个复杂且代价昂贵的事情。一个网站设计项目需要一个庞大的预算和长长的时间表。其实,可用性测试并非如大多数人认为的是浪费资源的事情。在你可承受的测试成本范围内,使用不超过5个用户,即可达到很好的测试效果。最初的研究过程中,Tom Landauer  和我得出了一个可用性测试方面的,关于测试人员的数量的公式:3 R8 L# e! {! b' W( Z. @# F

& Q5 s( r2 l# p4 C6 m, p假设一个可用性测试的测试人员数量为n,N为所有可用性测试发现的问题总数,L是单个测试人员的问题发现率。( K  Q3 x4 a( h( g

3 I/ [4 w+ i) ~  ^: CN(1-(1-L)n)
$ U/ g3 |6 U# `6 D( _  ^3 n0 v+ e  n, d" Q  V1 G2 O) [
我们发现,大多数项目的平均的问题发现率为31%。当 L=31%时,可以得到如下的图形:
, i: i' _# C" _  k% H2 B
. E- C0 L# @& |) `- ahttp://img.linux.net.cn/data/att ... g0p38u80cvedpzj.gif
$ P6 x( w4 j, z8 f; U) w% p3 O# I+ Y1 f& B3 Z' x  F" W7 \+ d
user testing diminshin returns curve
' i3 x2 v8 T1 {# s3 j. J. S0 e2 v6 q$ W  c; b* ?
当用户为零时,发现的问题数目是零,即“零用户零发现”。我们可以看到,第一个用户几乎发现的三分之一的设计的可用性的问题,和零发现截然不同。当我们看第二个用户的测试情况时,可以发现,有一部分问题是和第一个user重合的。人们之间的行为或发现有一定的差异,第二个user可以发现一些不同于第一个user的问题,有区别于第一个用户的新发现,但是问题数量不及第一个用户的最初发现。第三个用户做了很多前两者重复的事情,有些甚至重复2次。另外,当然,第三个用户本身异能发现少量的新问题,显然数量远远不及前 两个用户。6 N- l/ v7 e- s

" _7 I& i8 J5 s8 M' L/ m现在,加入更多的测试人员(user),你会发现一个现象,随着人数的增加,重复的事情一再出现,发现的新问题发现率开始下降。显然不再需要让更多的人来重复发现重复的问题,自然回回去重新设计,以解决发现问题。
# |# y* c2 o/ o, q
" d1 o. a9 a% ?/ a0 W0 C; ]到了第5个user,你就是在浪费时间,去做重复的事情,并且几乎再没有先的发现。" m+ u$ P" z& J6 ~2 c/ x' N

( [1 {5 J6 a1 Q+ S' E" ~$ s迭代设计! A: M+ R8 A/ M

2 ]  B: s1 b1 z, k5 r  P5 T* a上图中的曲线很清除地标明,至少需要15个用户去发现所有的设计中的可用性问题。但是,为什么我更倾向于推荐 用更少的测试人员呢?一个主要的原因是合理分配可用性测试的预算。让我们看看,当你招聘15个客户代表来对你的设计进行测试时,就一位着你得花费5个用户 的3倍的费用!8 r, p" {# b/ E6 B/ _# C
" f  K4 S" ]6 \' S: i
当我们去做用户的可用性测试时,最终的目标是为了解决或者提高实际的设计,而不是仅仅得到一份书面的报告。当5个用户的首次测试发现了85%的可用性问题时,你已经可以在下一个desagn中修复这些问题。2 V! P2 X) c( f6 l# S5 L8 N
0 {- P: [( s( V/ y0 ^7 K
如果想发现更多的问题,当然需要再次测试。即使我说重新设计可以修复第一次测试时发现的问题,事实是你可能认 为新的设计可以客服已有的问题。但是,在没有人能设计出更完美的用户界面之前,无法保证新的设计可以修复事实存在的问题。第二次测试可以回归已有的问题, 确认是否修复。同时,一个新的设计,意味着还需要一次新的用户测试。
; e) d8 E& V! x( x' s
2 Q1 Q* s; t# A5个用户的第二次测试,可以发现第一次测试时遗留的15%的问题。(仍旧会有2%的问题遗留要等到第三次测试来发现)。2 u2 Z, s" R+ H, {9 f

- x* |* G8 _- X0 ~, L最终,第二次测试的深度可以设计到网站的设计架构,获取到我们所需的一些信息,如体系架构、任务流程等是否符合客户需求。这些问题常常在隐藏在一些表面的可用性问题之后,而为人们所忽略。
7 f( ]- W% V* A' b2 a2 k( j2 ?
. R( H% j  g/ u( V5 S& l7 F所以,第二次的测试作为第一次测试的质量保障,并且可以发现更深入的问题。第二次测试会为系统的重新设计提供一份新的问题清单,但数量显然会少于第一次测试。但是,本次测试并不能完全补充第一次测试,还需要第三次的测试来进行查漏补缺。7 I/ e& {6 y8 I
* u/ R' k/ P+ ]/ k: v
5个用户三次的最终测试效果要远高于15个用户测试一次的效果。. z) s/ s7 G) j: ?  Q8 j% I

9 O7 H, [* W/ E4 [  v& |为什么不建议单用户的测试?单个人的行为总会有一些风险,人总会有一些意外的,不确定的行为。
$ t0 l! Y5 f& m
3 Q2 ^; H4 c. F$ E2 U- i2 Z你可能会认为15个用户做一轮测试,比5个用户做3轮要好。因为曲线表明,第一个用户的发现率明显高于后续的 用户,但是,为什么我们要坚持多轮测试?两个原因:第一,通过观察3个人就可以看到用户行为的多样性,可以洞察到那些行为是独特的那些是可以一概而论的; 第二,用户测试的成本效益分析表明,3-5个测试用户的最佳比例,依赖于测试的风格。初始的运行成本和测试计划相关,多个用户对于降低最初的成本效果更好。1 Q, }7 M3 Z* O0 \1 h
9 l' W, b) V+ y
什么时候增加更多的测试用户! Z: H6 b8 M3 F  J5 h+ N0 h
  {5 a0 N2 @& X" w/ ^
当你的网站客户群覆盖到几个不同高度的用户群时,你需要增加更多的测试用户。上面公式的适用于网站的用户群接 近或者差异很小时。举个例子,当你的网站客户群是定位于父母和孩子时,你就需要充分考虑到两个不同群里的使用行为。系统的相同之处是对于采购代理商的销售 人员之间的连接。
3 _: z7 a9 s& B/ k, ^$ R! z
0 p8 J: L' Y5 p, a5 M- m甚至当用户群体差异性完全不同时,在两类人之间也可发现很多相似之处。毕竟,所有的用户都是人。所有的可用性问题反应的都是人的行为与网站之间的互动和影响。3 T, v0 a$ d/ Q* ?5 [$ T7 A, y
) p9 [4 G. H  D% u! I/ g" Y. A7 l8 g
在测试不同的用户群时,你不需要每个用户群中都有很多测试人员(user),有以下的一个测试人员数目就足够了:1、如果测试两个用户群,则每类群需要3-4个用户;2、如果测试3个或更多的用户群,则每类有3个测试用户就可以了(至少3个users就可以确保你覆盖到某一个用户群中的不同的行为)7 y3 F; P. D5 q( C8 {" c- _

6 C' [) l' L$ f6 m) U! N" O& X英文原文:http://www.useit.com/alertbox/20000319.html   写于2000年3月19日

8888.gif (12.73 KB, 下载次数: 170)

8888.gif


作者: sdccumcm    时间: 2013-6-14 16:10
学习了!        
作者: sdccumcm    时间: 2013-6-14 16:10
学习了!        
作者: sdccumcm    时间: 2013-12-17 19:00
啊        
# w" n. K) e; E: v/ j% ~1 O! q5 P9 l$ Q, N+ `, I

Unnamed.gif (2.37 KB, 下载次数: 205)

Unnamed.gif






欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5