QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 1192|回复: 0
打印 上一主题 下一主题

如何写一个简单的手写识别算法?

[复制链接]
字体大小: 正常 放大

180

主题

68

听众

1975

积分

  • TA的每日心情
    开心
    2015-6-19 13:01
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    社区QQ达人

    跳转到指定楼层
    1#
    发表于 2015-6-8 14:15 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
                 如何写一个简单的手写识别算法?
    可以精准快速的识别出自定义的简单图形。
    类似于下面这种?
    Magic Touch - A Free Game by Nitrome
    Magic Touch: Wizard for Hire on the App Store on iTunes


    1 条评论 分享


    按投票排序按时间排序



    洒家也有一个类似的算法,借鉴了原始手写ocr的思路来实现的。其实是写在 $1 gesture recognizer 之前的,但没有 $1 gesture recognizer 归纳得好,作者jacob还是我偶像。

    Realtime Gesture recognition

    把所有的笔画定义了个8个方向,然后将B的笔画可以分解成一个字符串。然后当人在触摸屏上画出一个符号时,也将它分解成8个方向的字符串,最后比较两个字符串的距离就能判断出和不同符号的近似度。

    实现起来也很简单,第一步去噪,因为不同触摸屏的采样频率不同。


    第二步把去噪后的数据转换成方向序列,把之前得到的点换成方向序列,并把方向序列归纳到之前定义的8个方向中去。

    第三步把连续一致的方向合并。

    第四步把小片段的移动略去,最后就能得出其实是画了一个凹的形状。

    这个算法的厉害之处是可以实时识别,画到一半也能判断出来。

    Realtime Gesture recognition 源代码和demo都在上面了。



    ===============



    我来告诉你为什么第一名不靠谱,

    首先ocr拿来做gesture recognition是不对滴!

    ocr是一个比gesture recognition更难的问题,因为ocr得到的是一张图片,所有点并没有时间戳,而手势识别时,每一下移动是有时间戳的,所以是知道“怎么画出来”这个额外信息的。


    其次ocr不是这么解释的。

    ocr问题的重点是怎么选择特征,比如知名的uci 数据集就有以下这些特征量:

         1.        lettr        capital letter        (26 values from A to Z)     2.        x-box        horizontal position of box        (integer)     3.        y-box        vertical position of box        (integer)     4.        width        width of box                        (integer)     5.        high         height of box                        (integer)     6.        onpix        total # on pixels                (integer)     7.        x-bar        mean x of on pixels in box        (integer)     8.        y-bar        mean y of on pixels in box        (integer)     9.        x2bar        mean x variance                        (integer)    10.        y2bar        mean y variance                        (integer)    11.        xybar        mean x y correlation                (integer)    12.        x2ybr        mean of x * x * y                (integer)    13.        xy2br        mean of x * y * y                (integer)    14.        x-ege        mean edge count left to right        (integer)    15.        xegvy        correlation of x-ege with y        (integer)    16.        y-ege        mean edge count bottom to top        (integer)    17.        yegvx        correlation of y-ege with x        (integer)
    我不懂deep learning,别和我讲什么ocropus....





    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2025-5-12 01:09 , Processed in 0.414689 second(s), 49 queries .

    回顶部