افزایش روزافزون دادهها در پایگاه دادهها، نیاز به روشهای بهینه برای آنالیز دادهها را افزایش داده است. بیشتر مطالعات، بر روی پیداکردن الگوهای کاربردی در پایگاه دادهها متمرکز شدهاند. این مطالعات برای کاربردهای تشخیص فعالیت مجرمین در تجارت الکترونیک و تشخیص انحرافات نسبت به کاربردهای دیگر مفیدتر واقع شده است. الگوریتمهای زیادی برای تشخیص دادههای پرت ارائه شده است، اما اکثر این الگوریتمها بر روی دادههای ایستا کارایی دارند. دادههای جریانی، دادههای پیوسته و نامحدودی هستند که در طول زمان، تغییر توزیع خواهند داشت. این تغییر توزیع، باعث افزایش نرخ مثبت- کاذب و عدم کارایی الگوریتمهای موجود میشود. در این مقاله، الگوریتمی جهت شناسایی داده های پرت، با استفاده از روش تقسیم جریان دادهها به قطعههای مساوی و محاسبه ضریب ناهنجاری محلی برای دادهها و استفاده از لیستی برای دادههای پرت کاندید ارائه داده ایم تا علاوه بر شناسایی دادههای پرت، نرخ مثبت-کاذب پایینی داشته باشد. نتایج بدست آمده بر روی مجموعه دادههای مصنوعی و حقیقی، نشان میدهد که الگوریتم ارائه شده، باعث کاهش قابل توجه نرخ مثبت-کاذب و افزایش دقت شده و نسبت به الگوریتم های دیگر کارایی بهتری دارد.
Mazidi, Arash, Sadreddini, Mohammadhadi, & Tahayori, Hooman. (1394). ارائه الگوریتم جدید جهت کشف داده های پرت محلی در جریان داده ها. مجله علمی رایانش نرم و فناوری اطلاعات, 4(4), -.
MLA
Arash Mazidi; Mohammadhadi Sadreddini; Hooman Tahayori. "ارائه الگوریتم جدید جهت کشف داده های پرت محلی در جریان داده ها". مجله علمی رایانش نرم و فناوری اطلاعات, 4, 4, 1394, -.
HARVARD
Mazidi, Arash, Sadreddini, Mohammadhadi, Tahayori, Hooman. (1394). 'ارائه الگوریتم جدید جهت کشف داده های پرت محلی در جریان داده ها', مجله علمی رایانش نرم و فناوری اطلاعات, 4(4), pp. -.
VANCOUVER
Mazidi, Arash, Sadreddini, Mohammadhadi, Tahayori, Hooman. ارائه الگوریتم جدید جهت کشف داده های پرت محلی در جریان داده ها. مجله علمی رایانش نرم و فناوری اطلاعات, 1394; 4(4): -.