Online Handwritten Persian Isolated Letter Recognition by Using Discrete Markov Models and Language-Based Features

Document Type : Persian Original Article

Authors

Engineering faculty, Golestan university, Gorgan, Iran

Abstract

In this paper, an online Persian isolated letter recognition by using discrete Markov models and language-based features is presented. In the proposed method, the preprocessing includes the extraction of dots, the removal of ending-bends, the normalization of the main body dimension, and the main body smoothing. The direction of the pen for the main body, and also the location and the number of secondary movements and dots of letters are used as the observable features in order to train and test models. No alphabet grouping has been used in the proposed method. In order to produce appropriate discrete observation sequences for the hidden Markov models, the proposed codebook is based on the characteristics of the Persian language. To improve the recognition accuracy, the proposed post-processing checks the recognized character in terms of the number and location of the secondary movements and dots. The final recognition rate is obtained more than 98% for the test dataset and outperforms other methods applied to this dataset.

Keywords


  [1]     سید محمود رضوی و احسان الله کبیر، " یک پایگاه داده برای بازشناسی برخط، “ ششمین کنفرانس سیستم‌های هوشمند، ص ۲۱۸ تا ۲۲۵، کرمان، آذر ۱۳۸۳.
  [2]     V. Ghods, E. Kabir, “A STUDY ON FARSI HANDWRITTEN STYLES FOR ON LINE RECOGNITION” , Malaysian journal of Computer Science Vol. 26, no. 1, pp, 44-59, 2013
  [3]     فؤاد جلالی، “ بازشناسی نویسه‌های برخط فارسی بر اساس متامورفیسم شکل”، پایان نامه کارشناسی ارشد، دانشگاه تربیت مدرس، تهران، اسفند ۱۳۸۷
  [4]     هدیه ساجدی، منصور جم زاد، حسین ثامتی، باقر باباعلی، “ارائه یک روش مبتنی بر گروه بندی برای بازشناسی حروف مجزای برخط فارسی به کمک مدل مخفی مارکوف”، کنفرانس بین المللی انجمن کامپیوتر ایران، دوره دوازدهم، ص ۴۱۹ تا ۴۲۶، دانشگاه شهید بهشتی، تهران، اسفند ۱۳۸۵
  [5]     مجید مرزانی، سید محمود رضوی، مهران تقی پور گرجی کلایی، " روشی کاربردی برای بازشناسی برخط حروف مجزای دست نویس فارسی با استفاده از همزمان از دانش مربوط به بدنه اصلی و ریزحرکات"، هوش محاسباتی در مهندسی برق، سال ششم، شماره دوم، ص ۸۷ تا ۱۰۰،  تابستان ۹۴
  [6]     وحید قدس، و احسان الله کبیر، " بازشناسی حروف برخط فارسی با استفاده از ویژگی‌های ساختاری، “روشهای هوشمند سازی در صنعت برق، سال سوم، شماره دهم، ص ۶۶ تا ۷۱، تابستان ۹۱
  [7]     محمدامین مهر علیان و کاظم فولادی، "بازشناسی برخط حروف مجزای دست نویس فارسی براساس تشخیص گروه و بدنه اصلی با استفاده از ماشین بردار پشتیبان،" هفتمین کنفرانس ماشین بینایی و پردازش تصویر، تهران، دانشگاه علم و صنعت، ۱۳۹۰.
  [8]     محمدامین مهرعلیان و کاظم فولادی،" بازشناسی برخط حروف مجزای دست نویس فارسی بر اساس تشخیص گروه اصلی بدنه با استفاده از مدل مخفی مارکوف،" پانزدهمین کنفرانس بین المللی سالانه انجمن کامپیوتر ایران، تهران، انجمن کامپیوتر، مرکز توسعه فناوری نیرو،۱۳۸۸.
  [9]     V. Ghods, M. K. Sohrabi, “Online Farsi Handwritten Character Recognition Using Hidden Markov Models”, Journal of computers, vol. 11, no. 2, pp. 169-175, March 2016.
[10]     سیدمحمد رضوی و احسان اله کبیر،" روشی ساده برای بازشناسی برخط حروف مجزای فارسی"، ششمین کنفرانس سراسری سیستم های هوشمند، کرمان، دانشگاه شهید باهنر کرمان، ۱۳۸۳
[11]     اعظم شکاری شهرک و مریم خادمی، "بازشناسی دست نوشته فارسی با مدل مخفی مارکوف"، همایش ملی مهندسی کامپیوتر و توسعه پایدار با محوریت شبکه های کامپیوتری، مدل سازی و امنیت سیستمها، مشهد، موسسه آموزش عالی خاوران، ۱۳۹۲
[12]     مسعود فرکی و مازیار پالهنگ، "بازشناسی برخط حروف فارسی بر پایه مدل مخفی مارکوف"، فصلنامه مهندسی برق دانشگاه تبریز، جلد 40، شماره ۱،  ۱۳۸۹
[13]     B.Q Huang and Y.B Zhang and M-T. Kechadi, “Preprocessing Techniques for Online Handwritten Recognition”, Seventh International Conference on Intelligent Systems Design and Applications (ISDA), pp. 793-798, 20-24 Oct. 2007.
[14]     Y. Zhang, G. Shi, J. Yang, “ HMM-based Online Recognition of Handwritten Chemical Symbols”, 10th International Conference on Document Analysis and Recognition, pp. 1255-1259, 2009
[15]     V. Kumar, “Online Handwritten Recognition Problem: Issues and Techniques”, MIT international Journal of Computer Science & Information Technology, Vol. 4, No. 1 , pp. 16-24, Jan. 2014.
[16]     M. Pastor, A. Toselli, E. Vidal, “Writing speed Normalization for Online Handwritten Text Recognition”, Eight International Conference on Document Analysis and Recognition (ICDAR’05), pp. 1131-1135, Seoul, South Korea, 2005
[17]     David H. Douglas and Thomas K. Peucker. “Algorithms for the reduction of the number of points required to represent a digitized line or its caricature”. Cartographica: The International Journal for Geographic Information and Geovisualization, vol. 10, no. 2, pp. 112-122, October 1973.
[18]     Lauri Vanhatalo, “Online Sketch Recognition Geometric Shapes”, MS Thesis, Aalto University ,School Of Science and Technology, Helsinki May 29, 2011
[19]     Devijver, P. A. and Kittler, J. “Pattern Recognition: A Statistical Approach”. Prentice-Hall International, 1982.
[20]     L. R. Rabiner, “A Tutorial on Hidden Markov Models and Selected Applications in speech recognition, Proc. IEEE, Vol. 77, No. 2, Feb 1989.
[21]     G. Rigoll, A. Kosmala, J. Rottland, Ch. Neukirchen, “ A Comparison between Continuous and Discrete Density Hidden Markov Models for Cursive Handwritten Recognition”,In proceedings of the 13th International Conference on Pattern Recognition, vol. 2, pp. 205-210, Vienna, Austria, 1996
[22]     Xiaofang Xic, “On the Recognition of Handwritten Mathematical Symbols”, PhD. Thesis, the University of Western Ontario, London, Dec 2007
[23]     J. Andersson, “Hidden Markov Model based Handwritten Recognition”, MS Thesis, Center for Mathematical sciences, Lund Institute of Technology, May 21, 2002