【导读】本文是专栏《计算机视觉40例简介》的第12个案例《手写数字识别》。该专栏简要介绍李立宗主编《计算机视觉40例——从入门到深度学习(OpenCV-Python)》一书的40个案例。 目前,该书已经在电子工业出版社出版,大家可以在京东、淘宝、当当等平台购买。 大家可以在公众号“计算机视觉之光”回复关键字【案例12】获取本文案例的源代码及使用的测试图片等资料。 针对本书40个案例的每一个案例,分别录制了介绍视频。如果嫌看文字版麻烦,可以关注公众号“计算机视觉之光”直接观看视频介绍版。 |
本案例中,我们采用模板匹配的方式完成手写数字识别。例如,在图1中,左侧数字图像是待识别数字,右侧的每一列都是不同数字的模板。该图中,左侧待识别图像与右侧模板集中第7列第5行的图像最匹配。被匹配的模板是数字6的模板,因此左侧待识别图像被识别为数字“6”。
图1 识别原理
可以看到,当一个数字包含更多的模板,就可以识别更多不同形态的数字。当然,和人类一样,计算机也会犯错,也会发生识别错误。但是,我们可以通过增加模板数量,提高其识别率。
总体来说,本案例的任务有两个:
任务1:了解模板匹配及其使用方法。我们已经知道,在图像处理时,量化是一个关键步骤。简单来说,衡量两个对象的匹配度时,需要使用量化指标,也就是要用一个数值来衡量两个图像之间的相似程度。OpenCV中提供了模板匹配函数,调用该函数即可计算出两个图像间的匹配度。
任务2:为后续案例车牌识别打好基础。相比手写数字识别,车牌识别要先定位车牌、再将车牌分割为一个个单独的字符,最后再完成分割。
案例介绍中,对识别的基本原理进行了详细的说明,如图2所示。
图2 识别原理
在《计算机视觉40例——从入门到深度学习(OpenCV-Python)》一书中,从算法原理、实现流程等角度系统深入地介绍了该案例的理论基础和实现过程,并对具体的代码实现进行了细致的介绍与解释。欢迎大家阅读第12章《手写数字识别》获取详细内容。
《计算机视觉40例——从入门到深度学习(OpenCV-Python)》在介绍Python基础、OpenCV基础、计算机视觉理论基础、深度学习理论的基础上,介绍了计算机视觉领域内具有代表性的40个典型案例。这些案例中,既有传统的案例(数字识别、答题卡识别、物体计数、缺陷检测、手势识别、隐身术、以图搜图、车牌识别、图像加密、指纹识别等),也有深度学习案例(图像分类、风格迁移、姿势识别、实例分割等),还有人脸识别方面的案例(表情识别、驾驶员疲劳监测、识别性别与年龄等)。