توسعه موتور جستجوی فارسی بر اساس بهبود فرآیند یادگیری آنتالوژی

نوع مقاله : مقاله پژوهشی فارسی

نویسندگان

1 گروه مهندسی کامپیوتر، دانشکده فنی، دانشگاه گیلان

2 دانشگاه گیلان - دانشکده فنی و مهندسی - گروه مهندسی کامپیوتر

3 گروه مهندسی برق، دانشکده فنی، دانشگاه گیلان

چکیده

موتور جستجو ابزاری است که نیازهای اطلاعاتی کاربران را برطرف می ­کند. کاربران با استفاده از پرس و جوهای مختلف در موتورهای جستجو تلاش می کنند به نتایج مورد نظر خود دست یابند. برخی از این پرس و جوها با استفاده از کلمات کلیدی مؤثر انجام می شود. اگر موتور جستجویی بتواند تا حدودی روابط حاکم بین کلمات را درک نماید مسلماً نتایج بهتری را برای کاربران استخراج می نماید. اما درک این روابط و بیان منظور کاربر تا حدودی به ساختار پرس و جو در هر زبان بر می گردد. انجام جستجوها در موتور جستجوی فارسی با توجه به قوانین نحوی، تلفظی و املایی آن، کار راحتی نیست. به منظور بهبود و افزایش دقت موتورهای جستجوی فارسی می توان از مفهوم آنتالوژی جهت توصیف کلمات ئ درک مفاهیم آنها استفاده کرد. در این مقاله با توجه به عملکرد موتور جستجو و آنتالوژی، مدلی جهت بهبود استخراج روابط معنایی از زبان فارسی ارائه می شود. در این مدل از یک مجموعه متنی استاندارد فارسی به نام پیکره بی جن خان استفاده می شود. آزمایشات از طریق الگوهای زبانی و نحوی فارسی بدست آمده بر روی برخی متون این پیکره نشان داد که دقت مدل پیشنهادی حدود 87% است.

کلیدواژه‌ها