بازشناسی برخط حروف مجزای دست نویس فارسی با استفاده از مدل مخفی مارکوف گسسته و ویژگی‌های مبتنی بر زبان فارسی

نوع مقاله: مقاله پژوهشی فارسی

نویسندگان

گروه مهندسی برق، دانشکده فنی و مهندسی گرگان، دانشگاه گلستان، گرگان، ایران

چکیده

در این مقاله، بازشناسی برخط حروف مجزای دستنویس فارسی با استفاده از مدل مخفی مارکوف گسسته و ویژگی‌های مبتنی بر زبان فارسی ارائه می‌شود. در روش پیشنهادی، از استخراج نقطه‌های حرف، حذف قلاب‌ها، یکسان سازی ابعاد بدنه اصلی و هموارسازی آن به‌عنوان بخشی از فرایند پیش پردازش استفاده می‌شود. جهت حرکت قلم برای بدنه اصلی و همچنین محل و تعداد ریزحرکت‌ها و نقطه‌های حروف به‌عنوان ویژگی‌های قابل مشاهده به منظور استفاده در فرایند آموزش و آزمایش مدل به‌کار می‌روند. در روش پیشنهادی از هیچ‌گونه گروه‌بندی حروف، استفاده نشده است. به‌منظور تولید دنباله مشاهدهای گسسته برای مدل مخفی مارکوف، از کتاب کد پیشنهادی که مبتنی بر خصوصیات نوشتاری زبان فارسی است استفاده می‌شود. برای افزایش دقت بازشناسی، فرایند پس‌پردازش پیشنهادی، حرف بازشناسی شده را از نظر تعداد و محل ریزحرکت‌ها و نقطه‌ها بررسی کرده و خروجی نهایی را بر می‌گرداند. نرخ بازشناسی با استفاده از روش پیشنهادی بیش از ۹۸ درصد برای مجموعه داده‌های آزمایشی است که نسبت به سایر روش‌های اعمال شده بر روی این مجموعه داده، دقت بهتری را ارائه می‌دهد.

کلیدواژه‌ها


  [1]     سید محمود رضوی و احسان الله کبیر، " یک پایگاه داده برای بازشناسی برخط، “ ششمین کنفرانس سیستم‌های هوشمند، ص ۲۱۸ تا ۲۲۵، کرمان، آذر ۱۳۸۳.
  [2]     V. Ghods, E. Kabir, “A STUDY ON FARSI HANDWRITTEN STYLES FOR ON LINE RECOGNITION” , Malaysian journal of Computer Science Vol. 26, no. 1, pp, 44-59, 2013
  [3]     فؤاد جلالی، “ بازشناسی نویسه‌های برخط فارسی بر اساس متامورفیسم شکل”، پایان نامه کارشناسی ارشد، دانشگاه تربیت مدرس، تهران، اسفند ۱۳۸۷
  [4]     هدیه ساجدی، منصور جم زاد، حسین ثامتی، باقر باباعلی، “ارائه یک روش مبتنی بر گروه بندی برای بازشناسی حروف مجزای برخط فارسی به کمک مدل مخفی مارکوف”، کنفرانس بین المللی انجمن کامپیوتر ایران، دوره دوازدهم، ص ۴۱۹ تا ۴۲۶، دانشگاه شهید بهشتی، تهران، اسفند ۱۳۸۵
  [5]     مجید مرزانی، سید محمود رضوی، مهران تقی پور گرجی کلایی، " روشی کاربردی برای بازشناسی برخط حروف مجزای دست نویس فارسی با استفاده از همزمان از دانش مربوط به بدنه اصلی و ریزحرکات"، هوش محاسباتی در مهندسی برق، سال ششم، شماره دوم، ص ۸۷ تا ۱۰۰،  تابستان ۹۴
  [6]     وحید قدس، و احسان الله کبیر، " بازشناسی حروف برخط فارسی با استفاده از ویژگی‌های ساختاری، “روشهای هوشمند سازی در صنعت برق، سال سوم، شماره دهم، ص ۶۶ تا ۷۱، تابستان ۹۱
  [7]     محمدامین مهر علیان و کاظم فولادی، "بازشناسی برخط حروف مجزای دست نویس فارسی براساس تشخیص گروه و بدنه اصلی با استفاده از ماشین بردار پشتیبان،" هفتمین کنفرانس ماشین بینایی و پردازش تصویر، تهران، دانشگاه علم و صنعت، ۱۳۹۰.
  [8]     محمدامین مهرعلیان و کاظم فولادی،" بازشناسی برخط حروف مجزای دست نویس فارسی بر اساس تشخیص گروه اصلی بدنه با استفاده از مدل مخفی مارکوف،" پانزدهمین کنفرانس بین المللی سالانه انجمن کامپیوتر ایران، تهران، انجمن کامپیوتر، مرکز توسعه فناوری نیرو،۱۳۸۸.
  [9]     V. Ghods, M. K. Sohrabi, “Online Farsi Handwritten Character Recognition Using Hidden Markov Models”, Journal of computers, vol. 11, no. 2, pp. 169-175, March 2016.
[10]     سیدمحمد رضوی و احسان اله کبیر،" روشی ساده برای بازشناسی برخط حروف مجزای فارسی"، ششمین کنفرانس سراسری سیستم های هوشمند، کرمان، دانشگاه شهید باهنر کرمان، ۱۳۸۳
[11]     اعظم شکاری شهرک و مریم خادمی، "بازشناسی دست نوشته فارسی با مدل مخفی مارکوف"، همایش ملی مهندسی کامپیوتر و توسعه پایدار با محوریت شبکه های کامپیوتری، مدل سازی و امنیت سیستمها، مشهد، موسسه آموزش عالی خاوران، ۱۳۹۲
[12]     مسعود فرکی و مازیار پالهنگ، "بازشناسی برخط حروف فارسی بر پایه مدل مخفی مارکوف"، فصلنامه مهندسی برق دانشگاه تبریز، جلد 40، شماره ۱،  ۱۳۸۹
[13]     B.Q Huang and Y.B Zhang and M-T. Kechadi, “Preprocessing Techniques for Online Handwritten Recognition”, Seventh International Conference on Intelligent Systems Design and Applications (ISDA), pp. 793-798, 20-24 Oct. 2007.
[14]     Y. Zhang, G. Shi, J. Yang, “ HMM-based Online Recognition of Handwritten Chemical Symbols”, 10th International Conference on Document Analysis and Recognition, pp. 1255-1259, 2009
[15]     V. Kumar, “Online Handwritten Recognition Problem: Issues and Techniques”, MIT international Journal of Computer Science & Information Technology, Vol. 4, No. 1 , pp. 16-24, Jan. 2014.
[16]     M. Pastor, A. Toselli, E. Vidal, “Writing speed Normalization for Online Handwritten Text Recognition”, Eight International Conference on Document Analysis and Recognition (ICDAR’05), pp. 1131-1135, Seoul, South Korea, 2005
[17]     David H. Douglas and Thomas K. Peucker. “Algorithms for the reduction of the number of points required to represent a digitized line or its caricature”. Cartographica: The International Journal for Geographic Information and Geovisualization, vol. 10, no. 2, pp. 112-122, October 1973.
[18]     Lauri Vanhatalo, “Online Sketch Recognition Geometric Shapes”, MS Thesis, Aalto University ,School Of Science and Technology, Helsinki May 29, 2011
[19]     Devijver, P. A. and Kittler, J. “Pattern Recognition: A Statistical Approach”. Prentice-Hall International, 1982.
[20]     L. R. Rabiner, “A Tutorial on Hidden Markov Models and Selected Applications in speech recognition, Proc. IEEE, Vol. 77, No. 2, Feb 1989.
[21]     G. Rigoll, A. Kosmala, J. Rottland, Ch. Neukirchen, “ A Comparison between Continuous and Discrete Density Hidden Markov Models for Cursive Handwritten Recognition”,In proceedings of the 13th International Conference on Pattern Recognition, vol. 2, pp. 205-210, Vienna, Austria, 1996
[22]     Xiaofang Xic, “On the Recognition of Handwritten Mathematical Symbols”, PhD. Thesis, the University of Western Ontario, London, Dec 2007
[23]     J. Andersson, “Hidden Markov Model based Handwritten Recognition”, MS Thesis, Center for Mathematical sciences, Lund Institute of Technology, May 21, 2002