@article { author = {Parooie, Marzie and زارع بیدکی, علی محمد}, title = {An improved link-based method for spam detection in Persian web graph}, journal = {Journal of Soft Computing and Information Technology}, volume = {5}, number = {3}, pages = {16-54}, year = {2016}, publisher = {Babol Noshirvani University of Technology}, issn = {2383-1006}, eissn = {2588-4913}, doi = {}, abstract = {Today using the internet has spread wildly, and increasing number of web pages leads to importance of using search engines, therefore some people try to misguide search engines to have more customers and benefit. They increase the rank of their pages by some illegal ways. search engines to. Identify of this kind of web pages can improve search engines and attract confidence to user. According to importance of finding spam pages, the research is presented a new linke-based way to detect spam pages in Persian web graph. This way, first link farms detectes. Finally, the negative scores of spam pages propagate in whole of web graph. This way was implemented on data of Parsijoo search engine and the result of data analyses indicates 21.2% improvement in p@n factor.}, keywords = {Search engine,Spam,Ranking}, title_fa = {ارائه روشی بر مبنای پیوند جهت بهبود تشخیص صفحات فریب‌آمیز در گراف وب فارسی}, abstract_fa = {امروزهباافزایشچشمگیراستفادهازاینترنتوهمچنینرشدبسیارفزایندهصفحاتوب،استفادهازموتورهای جستجو اهمیتبیشتریپیداکردهاست. درنتیجهبعضیازافرادبرایبدستآوردنمخاطببیشترو افزایش سود ناشی از آن تلاشمی­­کنندموتورهای جستجوراگمراهکنندورتبهصفحاتموردنظرخودراباروش­هاینامشروعبالاببرند.شناساییاینصفحاتمی­تواندنقشیاساسیدربهبودعملکردموتورهایجستجووبالابردناطمینانکاربرانبه آنهاگردد. نظر به اهمیت کشف صفحات وب فریب­آمیز، دراینمقالهروشی جدید بر مبنای اطلاعات پیوندها جهت شناسایی صفحات فریب­آمیز در گراف وب فارسی ارائه می­گردد. در این روش با بهره­گیری از اطلاعات پیوندها، ابتدا توده­های فریب­آمیز شناسایی می­شود و سپس امتیاز منفی آنها در کل گراف انتشار می­یابد. برای بررسی صحت عملکرد الگوریتم ارائه شده،  این روش بر روی داده­های موتور جستجوی فارسی پارسی­جو پیاده­سازی شده است و نتایج ارزیابی­های صورت گرفته بهبودی برابر با 21.2% را در فاکتور دقت نشان می­دهد. امروزهباافزایشچشمگیراستفادهازاینترنتوهمچنینرشدبسیارفزایندهصفحاتوب،استفادهازموتورهای جستجو اهمیتبیشتریپیداکردهاست. درنتیجهبعضیازافرادبرایبدستآوردنمخاطببیشترو افزایش سود ناشی از آن تلاشمی­­کنندموتورهای جستجوراگمراهکنندورتبهصفحاتموردنظرخودراباروش­هاینامشروعبالاببرند.شناساییاینصفحاتمی­تواندنقشیاساسیدربهبودعملکردموتورهایجستجووبالابردناطمینانکاربرانبه آنهاگردد. نظر به اهمیت کشف صفحات وب فریب­آمیز، دراینمقالهروشی جدید بر مبنای اطلاعات پیوندها جهت شناسایی صفحات فریب­آمیز در گراف وب فارسی ارائه می­گردد. در این روش با بهره­گیری از اطلاعات پیوندها، ابتدا توده­های فریب­آمیز شناسایی می­شود و سپس امتیاز منفی آنها در کل گراف انتشار می­یابد. برای بررسی صحت عملکرد الگوریتم ارائه شده،  این روش بر روی داده­های موتور جستجوی فارسی پارسی­جو پیاده­سازی شده است و نتایج ارزیابی­های صورت گرفته بهبودی برابر با 21.2% را در فاکتور دقت نشان می­دهد.}, keywords_fa = {موتور جستجو,وب فریبکارانه,رتبه بندی}, url = {https://jscit.nit.ac.ir/article_51676.html}, eprint = {https://jscit.nit.ac.ir/article_51676_1d683964afa818dc785e803e0afcf39f.pdf} }