@article { author = {Khandezamin, Ziba and Naderan, Marjan and Rashti, Mohammad Javad}, title = {Intelligent detection of breast cancer with feature selection based on logistic regression and support vector machine Classification}, journal = {Journal of Soft Computing and Information Technology}, volume = {9}, number = {2}, pages = {115-123}, year = {2020}, publisher = {Babol Noshirvani University of Technology}, issn = {2383-1006}, eissn = {2588-4913}, doi = {}, abstract = {Breast cancer is the most common cancer among women and the existence of a precise and reliable system for the diagnosis of benign or malignant of this cancer is essential. Nowadays, using the results of needle aspiration cytology, data mining and machine learning techniques, early diagnosis of breast cancer can be done with greater accuracy. In this study, we propose a method consisting of two steps: in the first step, to eliminate the less important features, logistic regression has been used to select more important features. In the second step, the Support Vector Machine (SVM) classification algorithm has been used with three different kernel functions for the diagnosis of benign and malignant samples. To evaluate the performance of the proposed method, two data sets, WBCD and WDBC have been used with investigation of several metrics such as precision, the Area Under the ROC (AUC), true positive rate, false positive rate, accuracy and the F-measure. The results show that using the logistic regression method, it is possible to select the more efficient features, such that the proposed method reaches 98.69% in terms of classification accuracy.}, keywords = {breast cancer,Machine Learning,Feature selection,logistic regression,Support Vector Machine}, title_fa = {تشخیص هوشمند سرطان پستان با انتخاب ویژگی مبتنی بر رگرسیون لجستیک و دسته‌بندی ماشین بردار پشتیبان}, abstract_fa = {سرطان پستان شایع‌ترین سرطان در میان زنان است و وجود یک سیستم دقیق و مطمئن برای تشخیص خوش‌خیم و یا بدخیم بودن توده سرطان ضروری است. امروزه با استفاده از نتایج سیتولوژی آسپیراسیون سوزنی، تکنیک‌های داده‌کاوی و یادگیری ماشین می‌توان شناسایی و تشخیص زود هنگام سرطان پستان را با دقت بالاتری انجام داد. در این مقاله روشی پیشنهاد شده است که شامل دو مرحله است: در مرحله اول برای حذف ویژگی‌های کم اهمیت‌تر، از رگرسیون لجستیک استفاده شده است تا ویژگی‌های مهم‌تر انتخاب شوند. در مرحله دوم، از الگوریتم طبقه‌بندی ماشین بردار پشتیبان (SVM) با سه هسته‌ی متفاوت برای تشخیص خوش خیم و بدخیم بودن نمونه‌ها استفاده شده است. برای ارزیابی کارایی روش پیشنهادی از دو مجموعه داده WBCD و WDBC و معیارهای دقت، ناحیه زیر نمودار ROC (AUC)، نرخ مثبت حقیقی، نرخ مثبت کاذب، صحت و معیار F بررسی شده‌اند. نتایج نشان می‌دهد که با استفاده از روش رگرسیون لجستیک می‌توان انتخاب ویژگی موثرتری انجام داد، به‌گونه‌ای که روش پیشنهادی از نظر دقت طبقه-بندی به دقت 69/98% می‌رسد.}, keywords_fa = {سرطان پستان,یادگیری ماشین,انتخاب ویژگی,رگرسیون لجستیک,ماشین بردار پشتیبان}, url = {https://jscit.nit.ac.ir/article_103556.html}, eprint = {https://jscit.nit.ac.ir/article_103556_c1b4b5aea3381a7822a15a998fea0d26.pdf} }