全部版块 我的主页
论坛 经济学人 二区 外文文献专区
687 28
2022-06-04
英文标题:
《Data science for assessing possible tax income manipulation: The case of
  Italy》
---
作者:
Marcel Ausloos, Roy Cerqueti, Tariq A. Mir
---
最新提交年份:
2017
---
英文摘要:
  This paper explores a real-world fundamental theme under a data science perspective. It specifically discusses whether fraud or manipulation can be observed in and from municipality income tax size distributions, through their aggregation from citizen fiscal reports. The study case pertains to official data obtained from the Italian Ministry of Economics and Finance over the period 2007-2011. All Italian (20) regions are considered. The considered data science approach concretizes in the adoption of the Benford first digit law as quantitative tool. Marked disparities are found, - for several regions, leading to unexpected \"conclusions\". The most eye browsing regions are not the expected ones according to classical imagination about Italy financial shadow matters.
---
中文摘要:
本文从数据科学的角度探讨了一个现实世界的基本主题。它特别讨论了是否可以通过公民财政报告的汇总,在市政所得税规模分配中或从市政所得税规模分配中观察到欺诈或操纵。研究案例涉及2007-2011年期间从意大利经济和财政部获得的官方数据。所有意大利(20)个地区都被考虑在内。经过深思熟虑的数据科学方法具体化为采用本福德第一位数定律作为定量工具。在几个地区发现了明显的差异,导致了意想不到的“结论”。根据对意大利金融阴影问题的经典想象,最容易引起人们注意的区域并不是预期的区域。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Physics        物理学
二级分类:Physics and Society        物理学与社会
分类描述:Structure, dynamics and collective behavior of societies and groups (human or otherwise). Quantitative analysis of social networks and other complex networks. Physics and engineering of infrastructure and systems of broad societal impact (e.g., energy grids, transportation networks).
社会和团体(人类或其他)的结构、动态和集体行为。社会网络和其他复杂网络的定量分析。具有广泛社会影响的基础设施和系统(如能源网、运输网络)的物理和工程。
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-6-4 16:29:57
评估可能的税收收入操纵的数据科学:ItalyMarcel Ausloo1,2,*+, Roy Cerqueti3,,Tariq A.Mir4,§莱斯特大学管理学院会计与金融研究所,莱斯特大学路,莱斯特,LE1 7RH,UKGRAPES,rue de la Belle Jardiniere,B-4031 Liege,Federation Wallonie Bruxelles,BelgiumUniversity of Macerata,Department of Economics and Law,via Crescimbeni 20,I-62100,Macerata,ItalyNuclear Research Laboratory,印度查谟和克什米尔斯利那加Bhabha原子研究中心天体物理科学部2017年11月8日摘要本文从数据科学的角度探讨了一个现实世界的基本主题。它特别讨论了通过公民规模报告的汇总,是否可以在市政所得税规模分布中观察到欺诈或操纵。本研究案例涉及2007-2011年间从意大利经济和财政部获得的官方数据。所有意大利(20)个地区都被考虑在内。经过深思熟虑的数据科学方法具体化为采用Benford第一位数定律作为量化工具。在几个地区发现了明显的差异,导致了出乎意料的“结论”。根据意大利金融阴影问题的经典想象(classicalimagination),大多数眼球浏览区域并非预期区域。关键词:数据科学、本福德定律、所得税合计、数据操纵、意大利。JEL代码:H71、C82。*电子邮件:ma683@le.ac.uk,+电子邮件:marcel。ausloos@ulg.ac.be通讯作者。电子邮件:roy。cerqueti@unimc.it§电子邮件:taarik。mir@gmail.com1引言本文论述了识别税务公司是否存在异常的相关主题。我们特别关注意大利地区的情况。这一问题是在数据科学的视角下面临的,适合本研究的范围。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-4 16:30:00
事实上,数据科学如今是处理大型数据集的研究前沿的一个主要领域(参见Carbone et al.,2 016和其中包含的参考文献)。这项研究的相关性在于,有证据表明,评估财务报表中的错误是审计人员、监管人员或分析师的主要任务,不仅是在金融市场,而且在宏观经济和公共事务中,如政府经济数据中。会计报表数据报告对公共预算管理至关重要,甚至至关重要。因此,必须观察是否已经或正在发生错误估计、错误、偏差甚至操纵(Puyou,2014)。另一方面,学术研究人员必须提出检测错误或异常的方法。在创建和验证技术以评估不同的错误结构时,提出了许多方法和步骤(Cooper等人,2013)。然而,尽管在这一安全领域取得了实质性进展,但现有方法的有效性却受到了限制,有时是由于该方法背后的假设不明确。最有可能的是,这种情况将永远持续下去,因为众所周知,骗子的想象会导致进一步的网络钓鱼式操纵,而“决策者”的反应会受到法律程序的影响。是的,控制权受到聪明人的挑战,缺乏古典伦理。在对个别案件进行辩论之前,虽然没有对所有意大利公民提出指责,但通过GDP排名(http://inv estorplace.com/investorpolitics/10),人们通常承认意大利是逃税损失最大的国家之一(仅次于美国和巴西)- 最差的- 国家- 对于- ta x公司- 规避/#。V vkqf3AR54c),或通过影子经济造成的税收损失。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-4 16:30:03
因此,可以在这样一个(国家)案例中对收入操纵进行合理的测试,例如Brosio et al.(2002)、Alexeev et al.(2004)、Calderoni(2011)或Mir et al.(2014)最近讨论的与伦理和有组织犯罪相关的主题。当然,不仅公民伪造了他们的财务数据,企业甚至政府也伪造了他们的财务数据(Aggarwal和Lucey,2007年;Michalski和Stoltz,2013年;Luippold等人,2015年)。例如,希腊向欧盟统计局提交的数据是否符合欧盟(EU)制定的严格定义标准,有人提出了疑问,请参见Rauch等人(2011),或中国的宏观经济数据(Holz 2013)。经理们可以采取比股东们更愿意采取的更多或更少的公司避税措施(Armstrong等人,2015年)。另一方面,企业有动机操纵收益以说服投资者,例如,当他们有收益(即4000万美元)时,报告一个四舍五入的上限值,当他们有损失时,报告一个数字,如3995万美元,正如Thomas(1989)所讨论的,他观察到了报告收益的这种常见模式。这种四舍五入的方法指向对数据的“适度操纵”。然而,它的相关性被认为是不常见的。0.301 0.176 0.125 0.097 0.079 0.067 0.058 0.051 0.046表1:一组数据中第一位数字(d)的频率(“频率”);d值范围从1到9,-根据BL1,等式(1)。对投资者来说微不足道。在citize ns的“较低水平”上,我们还知道,看似很小的舍入操作可能会影响财务报表用户对信贷质量的感知(Guan等人2008年)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-4 16:30:07
在另一个层面上,当公民被淹没在人群中,并期望受到某个骗子的阴影的保护时,很有意思的是提出是否可以看到集体效应的疑问。这可以通过在地方层面上重新检查所得税缴款来实现。这一会计水平是我们调查和报告的核心。Bolton和Hand(2001、2002)对欺诈检测的统计方法进行了回顾,而Bierstaker等人最近讨论了会计师对欺诈检测和预防方法的看法。(2006); 另见Wadhwa和Pal(2012)的快速总结,或Lin et al.(2015)对几种技术的具体讨论。在此背景下,本文提出的数据科学方法是基于本福德定律的。本福尔d定律最初用于数据集的第一位数(BL1)分布,遵循对数定律:P(d)=对数(1+d),d=1,2,9,(1)其中P(d)是数据序列中第一个数字等于d的概率;Log是以10为底的对数。这一“定律”源于纽科姆(1881)和后来本福德(1938)的观察,即第一位数字的分布更集中于较小的值:数字“1”的频率最高,“9”的频率最低。在表1中,为了便于读者阅读,对BL1给出的第一个数字的频率进行了重新采集。此后,数学可以为第二、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三、第三。。。数字分布。然而,由于后者变得更加统一,因此很难(但已经做到)使用如此高级别的数字来测试报告数据的准确性。因此,让我们将目标集中在第一位数字以下,即:。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-4 16:30:11
BL1在特定案例中的有效性(或无效性),作为其他大数据调查的范例。总的来说,Benfor d法律必须得到重新推荐,因为它包含许多优点,如不受规模入侵的影响,并且在没有证明“交易”真实性的支持文件时,它也会被承认有帮助(Var ian 1972)。如今,这种所谓的“定律”为对性质相似的数字序列进行数字分析提供了方便的基础。例如,基于Benford法则的分析已被广泛用于识别员工盗窃和逃税的情况(Guan等人,2008),以及汇率偏离常规路径(Carrera 2015)或伦敦银行同业拆借利率(Abrantes Metz等人,2011)。事实上,根据Thomas(1989),可以使用Benford(1938)定律获得“操纵预期”,Nigrini(199419962012)后来指出了这一点。自Nigrini和Mittermaier(1997年)以来,人们承认BL1可以用来检测报告个人收入的会计数据中的欺诈行为。Hill(1998)、Pinkham(1961)、Raimi(1985)、Durtschi e t al.(2004)等,以及最近的Cleary和Thibodeau(2005)、Nigrini和Miller(2012)、Clippe和Ausloos(2012)、Pimbley(2014)、Amiram et al.(2015)、Mir(2016),都进一步强调了纽科姆-本福特法(1881-1938)在审计领域的有力方法,Auslo os等人(2016年)。事实上,BL1也适用于财务审计领域以外的领域;e、 g.参见Fu et al.(2007)了解图像取证,Ausloos et al.(2015)了解出生率异常,Pollachet et al.(20 15)了解孕产妇死亡率,或自然科学方面的其他信息(Sambridge et al.2010),以及宗教活动方面的信息(Mir 2012)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群