خلاصة:
در این مقاله شاخصهایی ارائه میشود که با استفاده از آنها میتوان آن دسته از کاربرانی که مشکوک به ارائه صورتحسابهای جعلی هستند را شناسایی نمود. به کمک روشهای دادهکاوی میتوان به صورتسازیهایی که مربوط به درج اطلاعات نادرست مالی و عملیاتی برای فرار از پرداخت مالیات یا کاهش آن است، پی برد. در این پژوهش، ابتدا با استفاده از الگوریتمهای خوشه بندی [1] مانند شبکههای خودسازمانده [2] و شبکههای عصبی گازی [3]، گروههایی از مودیان مالیاتی را که رفتار مشابهی دارند، شناسایی و سپس با استفاده از الگوریتمهای درخت تصمیمگیری، شبکههای عصبی [4] و شبکههای بیزی [5] به شناسایی متغیرهای مربوط به رفتارهای متقلبانه، الگوهای رفتاری مرتبط و تشخیص موارد تقلب مبادرت نمود. جامعه آماری این پژوهش بنگاههای اقتصادی اعم از شرکتها، کارخانهها، کارگاهها در شهر و استان تهران میباشد. نتایج روشهای دادهکاوی این پژوهش، متغیرهایی که در مورد بنگاههای اقتصادی کوچک و بزرگ و متوسط جهت ممیزی باید مد نظر قرار بگیرد را متمایز کرد و مدل شبکه عصبی با درصد صحت 92% بر روی دادههای آموزش با درصد صحت 88% بر روی دادههای اعتبار سنجی و با درصد صحت 89% بر روی دادههای آزمون توانسته موفق به کشف فرار مالیاتی گردد.
In this paper, we present indices by which it is possible to characterize and detect those potential users of false invoices in a given year, depending on the information of their tax payment, their historical performance and characteristics, using different types of data mining techniques. In this research first, clustering algorithms like Self- Organizing Map (SOM) and neural gas networks are used to identify groups of similar behaviors of taxpayers. Then decision trees, neural networks and Bayesian networks are used to identify those variables that are related to conduct of fraud and/or no fraud, detect patterns of associated behavior and establishing to what extent cases of fraud and/or no fraud can be detected with the available information. We utilize some information gained from tax auditors who are working in the Tax offices of Tehran and the informal unofficial statistics and anonymous questionnaire from some companies to gain primary data to detect fraud and compare different techniques of false invoices. To determine the main indexes in false invoices, we divided taxpayers to the micro and small enterprises and on the other side medium and large enterprises and examined the factors of fraud on each groups, with neural gas networks, separately. Particularly the neural gas method found that it was possible to identify some relevant variables to differentiate between good or bad behavior, not necessarily associated with the use and sale of false invoices. Kohonen’s method however, did not provide any behavioral patterns. In the case of micro and small businesses, the percentage of correctly detected fraud cases was 92%, while in the case of medium and large enterprises, this percentage was 89%.
ملخص الجهاز:
نتایج روش های داده کاوی این پژوهش ، متغیرهایی که در مورد بنگاه های اقتصادی کوچک و بزرگ و متوسط جهت ممیزی باید مد نظر قرار بگیرد را متمایز کرد و مدل شبکه عصبی با درصد صحت ٩٢% بر روی داده های آموزش با درصد صحت ٨٨% بر روی داده های اعتبار سنجی و با درصد صحت ٨٩% بر روی داده های آزمون توانسته موفق به کشف فرار مالیاتی گردد.
در سال های اخیر، تکنیک های داده کاوی و هوش مصنوعی در فعالیت های برنامه ریزی حسابرسی گنجانیده شدند که عمدتاً برای تشخیص الگوهای تقلب یا فرار از مالیات ، و توسط مقامات مالیاتی به مقاصد خاص مورد استفاده قرار میگیرند (دفتر پاسخگویی ایالات متحده ٢، ٢٠٠٤؛ سازمان توسعه و همکاریهای اقتصادی، ٢٠٠٤).
در اداره مالیات استرالیا، برنامه پذیرش بر اساس یک مدل شناسایی ریسک تهیه و تدوین شده است که از تکنیک های آماری و داده کاوی جهت مقایسه ، پیدا کردن ارتباط ها و الگوهای رگرسیون لجستیک ١، درخت های تصمیم گیری و ماشین برداری پشتیبان ٢ استفاده میکند (اداره پاسخگویی دولت آمریکا، ٢٠٠٤؛ دفتر پاسخگویی دولت آمریکا، ٢٠٠٨).
کشور کانادا نیز به نوبه خود از شبکه های عصبی و درخت های تصمیم گیری برای تشخیص ویژگیهای مالیات دهندگانی که از پرداخت مالیات فرار کرده یا مرتکب تقلب میشوند، استفاده میکند که براساس نتایج حاصل از ممیزیهای گذشته و در راستای تشخیص الگوهای عدم پذیرش یا فرار از مالیات شکل گرفته اند (سازمان توسعه و همکاریهای اقتصادی، b٢٠٠٤).
The Application of Data Mining Techniques in Financial Fraud Detection: A Classification▄Framework▄and▄an▄Academic▄Review▄of▄literature;▄Decision▄Sup- port▄Systems,▄vol.
K. Mahapatra, Business Data Mining, a Machine Learning Perspec- tive, Information Management, Vol. 39, 2001, pp.