数学建模社区-数学中国

标题: 如何写一个简单的手写识别算法? [打印本页]

作者: 大微微---0170    时间: 2015-6-8 14:15
标题: 如何写一个简单的手写识别算法?
             如何写一个简单的手写识别算法?
可以精准快速的识别出自定义的简单图形。
类似于下面这种?
Magic Touch - A Free Game by Nitrome
Magic Touch: Wizard for Hire on the App Store on iTunes


1 条评论 分享


按投票排序按时间排序



洒家也有一个类似的算法,借鉴了原始手写ocr的思路来实现的。其实是写在 $1 gesture recognizer 之前的,但没有 $1 gesture recognizer 归纳得好,作者jacob还是我偶像。

Realtime Gesture recognition

把所有的笔画定义了个8个方向,然后将B的笔画可以分解成一个字符串。然后当人在触摸屏上画出一个符号时,也将它分解成8个方向的字符串,最后比较两个字符串的距离就能判断出和不同符号的近似度。

实现起来也很简单,第一步去噪,因为不同触摸屏的采样频率不同。


第二步把去噪后的数据转换成方向序列,把之前得到的点换成方向序列,并把方向序列归纳到之前定义的8个方向中去。

第三步把连续一致的方向合并。

第四步把小片段的移动略去,最后就能得出其实是画了一个凹的形状。

这个算法的厉害之处是可以实时识别,画到一半也能判断出来。

Realtime Gesture recognition 源代码和demo都在上面了。



===============



我来告诉你为什么第一名不靠谱,

首先ocr拿来做gesture recognition是不对滴!

ocr是一个比gesture recognition更难的问题,因为ocr得到的是一张图片,所有点并没有时间戳,而手势识别时,每一下移动是有时间戳的,所以是知道“怎么画出来”这个额外信息的。


其次ocr不是这么解释的。

ocr问题的重点是怎么选择特征,比如知名的uci 数据集就有以下这些特征量:

     1.        lettr        capital letter        (26 values from A to Z)     2.        x-box        horizontal position of box        (integer)     3.        y-box        vertical position of box        (integer)     4.        width        width of box                        (integer)     5.        high         height of box                        (integer)     6.        onpix        total # on pixels                (integer)     7.        x-bar        mean x of on pixels in box        (integer)     8.        y-bar        mean y of on pixels in box        (integer)     9.        x2bar        mean x variance                        (integer)    10.        y2bar        mean y variance                        (integer)    11.        xybar        mean x y correlation                (integer)    12.        x2ybr        mean of x * x * y                (integer)    13.        xy2br        mean of x * y * y                (integer)    14.        x-ege        mean edge count left to right        (integer)    15.        xegvy        correlation of x-ege with y        (integer)    16.        y-ege        mean edge count bottom to top        (integer)    17.        yegvx        correlation of y-ege with x        (integer)
我不懂deep learning,别和我讲什么ocropus....










欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5