Wer Bilanzen und Co. manipuliert, benutzt meist unbewusst seine Lieblingszahlen. Statistische Methoden erkennen das und weisen auf eine Veränderung der Originaldaten hin. Steuerberater können diese Methoden vor der Finanzverwaltung anwenden und so ihren Mandanten Strafen ersparen.
Früher war Betriebsprüfung eine mehr oder minder stichprobenweise akribische Belegprüfung. Kontrollmitteilungen wurden abgearbeitet. Plausibilitätsprüfungen und ein Abgleich mit der Richtsatzsammlung sollten Auffälligkeiten aufdecken und gegebenenfalls einen tieferen Einstieg bis hin zur Verwerfung der Buchführung bringen. Die Zeiten haben sich im Rahmen der veränderten technischen Möglichkeiten geändert: Mit dem digitalen Datenzugriff wird die elektronische Buchhaltung sortiert, geschichtet und nach Auffälligkeiten durchkämmt. Mit einer viel größeren Durchdringungsdichte wird die gesamte Buchhaltung sortiert. Statistische Methoden wie der Chi²-Test (Chi-Quadrat-Test) und NBL (Newcomb-Benford’s Law) führen zu neuen Prüfungsansätzen. Zudem versucht die Betriebsprüfung − zum Teil mittels Suchmaschinen und statistischer Auswertungen −, Auffälligkeiten in der Finanzbuchhaltung aufzuspüren. Ob der Prüfer dann allerdings mit seinen Ideen beziehungsweise Beanstandungen in Form von Prüfungspunkten weiterkommt, ob er recht hat oder an rechtliche oder technische Grenzen bei seinen Ermittlungen stößt, ob er seine Vermutungen anhand der Prüfungsmethoden darlegen und beweisen kann, ist eine Frage des Einzelfalls. Echte Mehrergebnisse findet der Prüfer dann, wenn er die Beweiskraft der Buchführung nach § 158 Abgabenordnung (AO) verwerfen und nach § 162 AO schätzen kann.
Chi-Quadrat-Test
Jeder hat eine Lieblingszahl und benutzt sie unbewusst. Sympathie und Antipathie für und gegen bestimmte Zahlen sorgen bei durch einen Menschen manipulierten Zahlen für auffällige Abweichungen. Der Chi-Quadrat-Test entlarvt solche Auffälligkeiten. Prüfstein ist die letzte oder vorletzte Zahl vor dem Komma (also die Einer- oder Zehnerstelle) großer Zahlenmengen. Bei geringen Zahlenmengen (unter 1.000) ist die Verprobungsmenge zu klein, sodass der Test nicht aussagekräftig ist. Statistisch wird bei den Ziffern von 0 bis 9 eine gleichmäßige Verteilung erwartet. Bei 30.000 Zahlen müsste also jede Ziffer von 0 bis 9 eigentlich 3.000-mal auftreten. Minimale Abweichungen sind in der Toleranz. Größere Abweichungen führen zu einer hohen Chi-Quadrat-Zahl und entlarven die Zahlenverteilung als eben nicht zufällig. Tauchen dann zum Beispiel die 2 und die 8 überproportional häufig und die 0 und 3 zu selten auf, schließt die Statistik und ihr folgend der Prüfer, dass die 0 und 3 dem (vermeintlichen) Manipulierer nicht gefallen und die 2 und 8 seine Lieblingszahlen sind.
Finanzgericht Rheinland-Pfalz
Allein auf solche Abweichungen lässt sich allerdings eine Verwerfung der Buchführung nicht stützen (Finanzgericht [FG] Rheinland-Pfalz, Urt. v. 24.08.2011 – 2 K 1277/10). Denn allein der Umstand, dass ein Chi-Quadrat-Test − eine statistische Methode des Vergleichs der festgestellten Ziffern mit deren theoretisch erwarteter Häufigkeit, basierend auf der Annahme, dass derjenige, der manipuliert, unbewusst bestimmte Lieblingszahlen häufiger verwendet – nach Auffassung des Prüfers eine 100-prozentige Manipulationswahrscheinlichkeit ergeben hat, rechtfertigt keine Zuschätzungen, wenn das häufigere Auftreten bestimmter Zahlen sich zwangsläufig aus der Preisgestaltung des Unternehmers ergibt (FG Rheinland-Pfalz, Urt. v. 24.08.2011 – 2 K 1277/10 – juris). So hielt das FG Rheinland-Pfalz aufgrund der Preisgestaltung in einem Friseursalon das häufigere Auftreten bestimmter Zahlen für normal und keineswegs für auffällig und teilte die Einschätzung des Prüfers nicht. Das FG urteilte, dass die von dem Beklagten ins Feld geführte „Manipulationswahrscheinlichkeit von 100 Prozent“ aufgrund des vom Prüfer durchgeführten Chi-Quadrat-Tests (vgl. Bl. 108–119 Prüferhandakte) nicht zur Zuschätzungsbefugnis nach § 162 Abs. 1 AO führen kann. Der Test allein ist jedenfalls nicht geeignet, Beweise dafür zu erbringen, dass die Buchführung nicht ordnungsgemäß ist (vgl. Urteil des niedersächsischen Finanzgerichts vom 17.11.2009 m.w.N.), abgesehen davon, dass er bei einem Friseursalon, bei dem − wie hier − für die Leistungen ausschließlich volle beziehungsweise halbe Eurobeträge berechnet werden (vgl. Preisliste für 2007, Bl. 120 u. 121 Prüferhandakte), ungeeignet erscheint. Denn mit dem Chi-Quadrat-Test werden Verteilungseigenschaften einer statistischen Grundgesamtheit untersucht. Ausgehend von der Preisliste im Streitfall des Friseurs ergibt sich aber, dass naturgemäß die Zahl 0 wie auch die Zahlen 1, 4, 5 überdimensional häufig auftreten müssen (zum Beispiel Föhnfrisur: 15 Euro; Färben: 25 Euro beziehungsweise 46,50 Euro, Föhnen: 40,50 Euro; vgl. FG Rheinland-Pfalz, Urt. v. 24.08.2011 – 2 K 1277/10).
Zudem ist der Chi-Quadrat-Test keine von der Rechtsprechung anerkannte Methode, eine Einnahmenmanipulation sicher zu belegen. Er ist daher bei summarischer Prüfung auch nicht geeignet, die Ordnungsmäßigkeit einer Buchführung zu verwerfen (FG Düsseldorf, Beschluss vom 14.04.2004 – 11 V 632/04 A(U) – juris). Losgelöst von der Frage im Einzelfall, ob die Verprobungsmengen ausreichend sind beziehungsweise die Preisgestaltung gegebenenfalls Chi-Quadrat-ungeeignet ist, genügt der Chi-Quadrat-Test allein auch nicht zur Verwerfung der Buchführung: Wie das Finanzgericht Münster in seinem Beschluss vom 14.08.2003 (8 V 2651/03 E, U, EFG 2004, 9) ausgeführt hat, ist der Chi-Quadrat-Test keine von der Rechtsprechung anerkannte Methode, eine Einnahmenmanipulation sicher zu belegen (vgl. FG Münster, Beschluss vom 11.02.2000 − 9 V 5542/99 K, U, F, DStRE 2000, 549). Andererseits kann der Chi-Quadrat-Test neben anderen Prüfungsschritten zusätzliches Indiz für die Manipulationen sein (FG Düsseldorf, Beschluss vom 03.06.2008 – 14 V 1214/08 A: „Das Ergebnis des Chi-Quadrat-Tests war somit zur Rechtfertigung der Schätzung nicht erforderlich. Der Antragsgegner hat das Ergebnis lediglich als ein weiteres Indiz für eine fehlerhafte Kassenführung angesehen.“).
Umgekehrt hilft aber auch nicht ein unauffälliger Chi-Quadrat-Test: Sollte also der Chi-Quadrat-Test keine Auffälligkeiten zeigen, entlastet er den Steuerpflichtigen nicht, beweist also nicht die Richtigkeit der Buchführung. Er ist lediglich kein Indiz für die Unrichtigkeit. Die Richtigkeit dieses Gedankens folgt daraus, dass durch Manipulations-Software die Manipulationen vorgenommen sein könnten, sodass programmgesteuerte Manipulationen den menschlichen Fehlern um die Lieblingszahl entgegenwirken und damit naturgemäß bei Manipulations-Software der Chi-Quadrat-Test unauffällig sein muss. Insoweit ist es auch zulässig, einen aus Sicht des Steuerpflichtigen unauffälligen Chi-Quadrat-Test im Ergebnis zu ignorieren, weil der Zeitreihenvergleich Auffälligkeiten aufweist (vgl. FG Köln, Urteil vom 21.08.2008 – 2 K 3468/07).
Manipulations-Softwares (Zapper et cetera) arbeiten solchen menschlichen Schwächen entgegen und folgen bei ihren gesteuerten Eingriffen den statistischen Verteilungen, sodass typischerweise beim Einsatz von Zapper-Software der Chi-Quadrat-Test keine Auffälligkeiten bringt.
Newcomb-Benford’s Law
Das NBL ist nicht auf alle Zahlenmengen anwendbar, sondern nur auf die frei gewachsenen. Im Gegensatz zum Chi-Quadrat-Test, der auf die letzte oder vorletzte Ziffer vor dem Komma oder die erste nach dem Komma abstellt, setzt Benford’s Law mit der statistischen Untersuchung an der ersten Ziffer an. Deswegen ist hier auch die Ziffer 0 unbeachtlich. Bei der Benford-Analyse werden zunächst alle Zahlen eines Zahlenwerkes entsprechend ihrer Anfangsziffern gefiltert. Während beim Newcomb-Benford-Test die Anfangsziffern einer Zahl getestet werden, werden beim Chi-Quadrat-Test die hinteren Ziffern überprüft. Die dahintersteckende Logik geht davon aus, dass diese Ziffern der Gleichverteilung unterliegen sollten, was mit diesem Test überprüft wird. Das NBL erwartet bei großen Zahlenmengen die 1 mit 30,1 Prozent an erster Stelle, die 9 hingegen nur mit einer Wahrscheinlichkeit von 4,57 Prozent. Die anderen Zahlen mit der nachstehend abgebildeten Häufigkeit. Die Häufigkeitsverteilung bei großen, unbeeinflusst gewachsenen Zahlenmengen folgt stets folgender Verteilungshäufigkeit:
1 | 30,10 Prozent |
2 | 17,60 Prozent |
3 | 12,49 Prozent |
4 | 9,69 Prozent |
5 | 7,91 Prozent |
6 | 6,69 Prozent |
7 | 5,79 Prozent |
8 | 5,11 Prozent |
9 | 4,57 Prozent |
Abweichungen indizieren Manipulationen
Das NBL gilt aber nicht für alle Zahlenmengen. So zum Beispiel nicht für Zahlen, deren inhaltliche Zusammensetzung systematisch gesteuert oder beeinflusst wird, die einem bestimmten vorgegebenen Muster folgen. Diese sind nicht frei gewachsen und entsprechen damit in der Regel nicht dem Benford’schen Verteilungsmuster. Gemeint sind Produktpreise, welche aus der individuellen Preisgestaltung des Unternehmers resultieren, Zahlen, die nach gewissen Regeln vergeben werden (Kontonummern), aber auch Zahlen, die anderen vorgegebenen Strukturen folgen, wie Wetterdaten, Sportergebnisse und andere. Auch auf Zahlen, die dem Zufallsprinzip unterliegen, wie die Lotteriezahlen, findet Benford’s Law keine Anwendung. Der Benford-Anfangsziffer-Test würde in solchen Fällen (Ausnahme: Lotteriezahlen) lediglich die systembedingte, gewollte Zahlenverteilung bestätigen.
Zahlenwerke, die der Benford’schen Regel folgen, sind etwa Umsatzzahlen (zum Beispiel Umsätze einzelner Artikel eines Kaufhauses), Fibu-Daten (sämtliche Einzelbuchungen eines Unternehmens), Inventurzahlen (bei einer breit gefächerten Warenpalette). Solche Zahlenmengen sind nicht systematisch beeinflusst. Sie wachsen auf natürliche Weise oder entstehen zufällig.
Zahlenwerke, die nicht der Benford’schen Regel folgen, sind zum Beispiel Telefon-/ Konto-/ Sozialversicherungsnummern, Produktpreise (Preisgestaltung des Unternehmers), Umsatzzahlen (Tagesendsummen).
Liegt keine gesetzmäßige Verteilung vor, ist dies ein Indiz für Manipulationen (Niedersächsisches Finanzgericht, Urt. v. 17.11.2009 – 15 K 12031/08) − aber eben kein Beweis. Der Prüfer kann daher mit einer abweichenden Verteilung von der erwarteten Verteilungshäufigkeit allein kein Mehrergebnis begründen, erst recht keine Buchführung verwerfen und keine Zuschätzung vornehmen.
Ob mit Benford’s Law und dem Chi-Quadrat-Test allein die Verwerfung der Buchführung möglich ist, ist höchst zweifelhaft, da beide statistischen Methoden nur Auffälligkeiten indizieren, aber nicht beweisen. Wenn jede für sich nicht tauglich ist, die Buchführung zu verwerfen, sind sie es in ihrer Kombination auch nicht.
Analyseverfahren
Das Finanzgericht Niedersachsen beurteilt das so: Nach Auffassung des erkennenden Senats handelt es sich bei dem Chi-Quadrat-Test unter Berücksichtigung des Newcomb-Benford-Law um keine von der Rechtsprechung anerkannte Methode, eine Einnahmemanipulation sicher zu belegen. Selbst Befürworter derartiger Analysemethoden betonen ausdrücklich, dass es sich bei dem Verfahren nur um ein Analyseverfahren handelt, das keinen Beweis im juristischen Sinne, sondern Anhaltspunkte für mögliche Unregelmäßigkeiten liefern kann. Ergeben sich daher nach Durchführung eines solchen Tests Anzeichen für Einnahmemanipulationen, obliegt es daher der Finanzverwaltung, beispielsweise durch eine Geldverkehrs- oder eine Vermögenszuwachsrechnung Einnahmemanipulationen sicher zu belegen. Der Chi-Quadrat-Test und Newcomb-Benford-Test sind jedenfalls nicht geeignet, Beweis darüber zu erbringen, dass die Buchführung nicht ordnungsgemäß ist (so im Ergebnis auch: FG Münster vom 14.08.2003 − 8 V 2651/03, EFG 2004, 9; FG Düsseldorf, Beschluss vom 14.04.2004 − 11 V 632/04 − in juris)“ (Niedersächsisches Finanzgericht, Urt. v. 17.11.2009 – 15 K 12031/08).
Fazit
Es gibt Grenzen – auch für die Prüfung. Manches entdeckt sie – manchen Phantomen jagt sie nach. Sie hat auch ganz andere Seiten: Sie entlarvt manchen Dritten, der das Unternehmen schädigt – sie ist teilweise auch hilfreiche Revision und hilft dem Unternehmer. Hat der Prüfer nun (immer) recht? Die Antwort ist, es kommt darauf an: auf die Auslegung von Verträgen, auf die Analyse von Sachverhalten, auf die Beweisführung. Es gibt bei der BP seit vielen Jahren neue Entwicklungen, mehr Statistik, mehr elektronische Prüfungsansätze, aber nicht alles überzeugt und hat sich durchgesetzt. Es rentiert sich, genauer einzusteigen und stets die Beanstandungen der BP kritisch zu durchdenken und zu überprüfen. Nur das führt zu zutreffenden Ergebnissen.
MEHR DAZU
Die „Fachtagung Digitale Datenanalyse 2015“ ermöglicht den Blick auf die Betriebsprüfung aus drei Perspektiven: Steuerberater, Betriebsprüfer und Richter – wie unterscheiden sich die Meinungen beim digitalen Datenzugriff im Rahmen der neuen GoBD?
Einige Schwerpunkte der Fachtagung:
- Kassenbetriebsprüfung: Ein Betriebsprüfer demonstriert live, wie er Unregelmäßigkeiten findet (Joachim Zimmermann, Fachprüfer Finanzamt Waldshut-Tiengen)
- Der Steuerberater in der digitalen Betriebsprüfung – Rechte und Pflichten (Dr. Bernhard Bellinger, RA/StB/vBP, Spezialist für digitale Prüfungen von Apotheken)
- Neue Prüfungsmethoden der Finanzverwaltung (Andreas Wähnert, Prüfer beim Finanzamt Kiel-Nord)
- Den aktuellen Prüfungsmethoden würdig begegnen, die Mandanten optimal beraten (Sebastian Müller, StB, ehemaliger Betriebsprüfer)
Termine:
10.06.−11.06.2015 in Mörfelden-Walldorf bei Frankfurt am Main
23.06.−24.06.2015 in Dortmund
30.06.−01.07.2015 in Bremen
07.07.−08.07.2015 in Berlin
Weitere Infos auf www.datev.de/fachtagung-datenanalyse oder im DATEV-Shop unter Art.-Nr. 73166.
Wählen Sie bitte bei der Anmeldung aus, an welchen Fachvorträgen Sie teilnehmen möchten.
Kontakt, Anmeldung und weitere Informationen: Tel. +49 911 319-6144; E-Mail: apveranstaltungen@service.datev.de
Weiteres Wissen vermitteln folgende Online-Seminare:
-
Dialogseminar online „Der Gastwirt zwischen Betriebsprüfung und Steuerfahndung“ (Art.-Nr. 76464)
-
Dialogseminar online „Erste Hilfe bei Steuerfahndungszugriff“ (Art.-Nr. 76463)