%0 Journal Article %T رتبه‏ بندی ویژگی‏‌ها در تشخیص نظرات اسپم فارسی %J مجله علمی رایانش نرم و فناوری اطلاعات %I دانشگاه صنعتی نوشیروانی بابل %Z 2383-1006 %A صفریان, نشاط %A بصیری, محمد احسان %A خسروی, هادی %D 2019 %\ 06/22/2019 %V 8 %N 2 %P 1-16 %! رتبه‏ بندی ویژگی‏‌ها در تشخیص نظرات اسپم فارسی %K نظرات اسپم فارسی %K نظرات جعلی %K نظرکاوی %K تحلیل احساسات %K دسته‏بندی متن %K رتبه‌بندی ویژگی‌ها %R %X یکی از عوامل اصلی در تصمیم‌گیری مشتریان برای خرید یک محصول یا استفاده از خدماتی خاص، استفاده از نظرات برخط است. این‌گونه از نظرات منابعی ارزشمند از اطلاعات هستند که برای تشخیص افکار عمومی در مورد محصول یا خدمات استفاده می‏شوند. اگرچه نظرات برخط می‌توانند مفید باشند اما اعتماد کورکورانه به آن‏ها، هم برای فروشنده و هم برای خریدار خطرناک است زیرا ممکن است برای به‌دست آوردن سود، دستکاری شده باشند که اصطلاحاً به این گونه نظرات « نظرات اسپم» گفته می‌شود. پژوهش حاضر روی نظرات فارسی ثبت‌شده در مورد تلفن همراه در وب‌سایت دیجی‌کالا انجام شده و از میان انواع اسپم، اسپم نوع یک و دو بررسی شده‌اند که نوع اول نظرات جعلی و نوع دوم نظراتی هستند که تنها در رابطه با مدل کالا نوشته شده‏اند. ویژگی‌های مورد استفاده در این پژوهش به علت کارا بودن آن‏ها در دسته‌بندی، شامل ویژگی‌های مبتنی بر نظر و ویژگی‌های فراداده است. این ویژگی‌ها و نیز ترکیب‌های متفاوت از آن‏ها در تشخیص نظرات اسپم فارسی و تأثیر آن‏ها روی دقت دسته‌بند بررسی شده ‌است. دسته‌بندی توسط درخت تصمیم، دسته‌بند ماشین بردار پشتیبان و دسته‌بند نایو بیز انجام شده و در نهایت دقت آن‏ها روی ترکیب‌های مختلف این ویژگی‌ها با هم مقایسه گردیده است. بالاترین میزان دقت به‌دست آمده از سه دسته‌بند توسط درخت تصمیم حاصل می‏شود که برابر با با 778/0 براساس معیار اِف است. در رتبه‎دهی به ویژ‌گی‌ها باز هم درخت تصمیم با دقت 824/0 و با ترکیب سه ویژگی بازخوردهای مثبت، امتیاز کلی کالا و قطبیت نظر رتبه‌ی برتر را به خود اختصاص می‌دهد. %U https://jscit.nit.ac.ir/article_87279_df20f941945a01babc0de419ea3e34af.pdf