Script-Independent Handwritten Text line Segmentation Using Directional 2D Filters

نوع مقاله: مقاله پژوهشی انگلیسی

نویسنده

گروه مهندسی برق، دانشکده فنی و مهندسی گرگان، دانشگاه گلستان، گرگان، ایران

چکیده

جداسازی سطرها بخش مهمی از الگوریتمهای بازشناسی متن است. به منظور تحلیل و بازشناسی یک متن، ابتدا باید سطرهای نوشته شده از یکدیگر جدا شوند. جداسازی سطرها در متنهای دستنویس بسیار سخت‌تر از متنهای تایپی است. سطرهای منحنی شکل و با زاویه‌های مختلف نسبت به محور افقی، سطرهای دارای همپوشانی و سطرهای بسیار کوتاه مهمترین چالشها در مبحث جداسازی صحیح سطرهای دستنویس هستند. اغلب روشهای موجود خصوصیات محلی سطرها در یک متن را در نظر نمی‌گیرند. در روش پیشنهادی، هم خصوصیات کلی و هم محلی در نظر گرفته می‌شوند. روش پیشنهاد شده مبتنی بر استفاده از فیلترهای دو بُعدی گوسی است. کلیه پارامترهای روش پیشنهادی بر اساس یک متغیر کلی بدست می‌آیند که این پارامتر کلی برای هر متن بصورت جداگانه محاسبه می‌شود. بنابراین روش پیشنهادی مستقل از مجموعه داده‌ها است. یک متن ورودی ابتدا به چندین بلاک تقسیم می‌شود که برای هر بلاک، ویژگی‌های محلی استخراج می‌شود. در هر بلاک، نواحی متنی با استفاده از ویژگی‌های محلی از جمله میزان چرخش در بلاک، شناسایی می‌شوند. به منظور تخمین صحیح زاویه چرخش نواحی متنی در یک بلاک، یک الگوریتم تخمین زاویه در این مقاله پیشنهاد می‌شود. نتایج آزمایش‌ها نشان می‌دهند که روش پیشنهادی از تمامی روشهای خوب دیگر و بر روی سه مجموعه داده استاندارد دقت بهتری ارائه می‌کند. نتایج بدست آمده برای روش پیشنهادی در مجموعه داده های ICDAR2013 ، ICDAR09 و HIT-MW، به ترتیب به میزان 54/0، 03/0 و 02/0 درصد نسبت به نتایج برنده مسابقه جداسازی سطرها در ICDAR2013 بهبود داشته است. همچنین آزمایش‌ها نشان می‌دهند که روش پیشنهادی می‌تواند سطرهای متن‌های دستنویس با میزان پیچیدگی زیاد را نیز با دقت کافی از هم جدا نماید.

کلیدواژه‌ها