lxz778
发表于 2014-4-16 16:22
B题:第一问:我们导入图片像素阵,转化成0-1阵,考虑左右边缘,提取出左右边缘矩阵,每张图片的右侧矩阵与其余图片的左侧矩阵比较,用SPSS分析相关性,得到两两相关系数,系数越大越相关,得到排列,5 |, [$ ~6 q5 D0 d) y8 y* [3 b& q
7 l7 I! n0 C( I% t
第二问:我们提取出0-1阵后,目标是先分出图片所在行,排完每行后,再对行进行排列,找出纸片上下首次出现有字的位置,位置大致相当的分为一类,分出11类,每类19张纸片,再用1的方法对行进行排列$ @) P6 f% C, Q
% T2 Y$ K2 x5 |& m% j
第三问,用spss根据字高,行高大致分出类别,分出大类后,再考虑相关性,程序筛选+人工干预,得到大致排列,用二中方法,先排每行中的纸片顺序,再排行
lxz778
发表于 2014-4-16 23:06
关于B题:' ^6 W; v* k1 N8 J' R
1,第一问简单,每张碎片都对应着一个灰度矩阵,大致思路是提取每个灰度矩阵的左右边缘向量,通过计算两个矩阵的边缘向量的差向量的2-范数,则2-范数最小的那一组匹配。算法是:1,先找第一张碎片(第一张碎片的灰度矩阵前几列的元素都是255,容易找到)--------2,假设前 i 张碎片已连接好,则提取第 i 张碎片矩阵的最后一列向量Ai(i>=1且i<=19),从未匹配的碎纸片中提取它们的第一列向量Bj(j>=i+1且j<=20),求其差向量Ai-Bj的范数,使Ai-Bj的范数最小的Bj所在的碎片矩阵就是与第 i 张纸片连接的,,用matlab编程很快就能得到结果(中英文均用此法,速度快,且无人工干预)。% F. K$ j) r- `, f# C
2,第二问大体思路是先根据纸片特征对11*19张纸片进行分类,分成11组,每组19张;然后每组里面的19张纸片进行连接;最后是11组纸片进行连接。对中文以行基线为特征进行分组,因为中文文字规则,这个好求;而对英文,字母不规则,则是进行模式匹配(以出现频率高的字母为模板,对每张纸片进行匹配),然后得到行基线。分组后就是按问题一的思路来做。值得注意的是,问题二中分组后可能边缘是空白的,还有行间距的约束。我们做的结果是中文全自动,英文还需少许人工干预。
3,第三问和问题二的英文的思路差不多,不过有一点需要注意,标有a的图片不全是在同一面,标有b的图片不全是在同一面,也就是说每面既有a也有b。新增加的约束是一旦一面的一组排好后,背面也排好。思路就是这样。。
charles.Liao
发表于 2014-8-7 00:09
谢谢楼主分享
页:
4
5
6
7
8
9
10
11
12
13
[14]