Praxis |

Verdachtsmoment: Lieblingszahl

Statistische Prüf­me­thoden

0Kommentare

Wer Bilanzen und Co. mani­pu­liert, benutzt meist ­un­be­wusst seine Lieb­lings­zahlen. Statistische Me­tho­den er­ken­nen das und weisen auf eine Ver­än­de­rung der Ori­gi­nal­daten hin. Steuer­be­ra­ter können diese Me­tho­den vor der ­Fi­nanz­ver­wal­tung an­wen­den und so ihren Mandanten Strafen ersparen.

Früher war Betriebsprüfung eine mehr oder minder stichprobenweise akribische Belegprüfung. Kontrollmitteilungen wurden abgearbeitet. Plausibilitätsprüfungen und ein Abgleich mit der Richtsatzsammlung sollten Auffälligkeiten aufdecken und gegebenenfalls einen tieferen Einstieg bis hin zur Verwerfung der Buchführung bringen. Die Zeiten haben sich im Rahmen der ver­än­der­ten technischen Möglichkeiten geändert: Mit dem digitalen Datenzugriff wird die elektronische Buchhaltung sortiert, geschichtet und nach Auffälligkeiten durchkämmt. Mit einer viel größeren Durchdringungsdichte wird die gesamte Buchhaltung sortiert. Statistische Metho­den wie der Chi²-Test (Chi-Quadrat-Test) und NBL (Newcomb-Benford’s Law) führen zu neuen Prüfungsansätzen. Zudem versucht die Betriebsprüfung − zum Teil mittels Suchmaschinen und statistischer Aus­wer­tun­gen −, Auffälligkeiten in der Finanzbuchhaltung aufzuspüren. Ob der Prüfer dann allerdings mit seinen Ideen beziehungsweise Beanstandungen in Form von Prü­fungs­punkten weiterkommt, ob er recht hat oder an rechtliche oder technische Grenzen bei seinen Ermittlungen stößt, ob er seine Vermutungen anhand der Prüfungsmethoden darlegen und beweisen kann, ist eine Frage des Einzelfalls. Echte Mehrergebnisse findet der Prüfer dann, wenn er die Beweiskraft der Buchführung nach § 158 Abgabenordnung (AO) verwerfen und nach § 162 AO schätzen kann.

Chi-Quadrat-Test

Jeder hat eine Lieblingszahl und benutzt sie unbewusst. Sympathie und Antipathie für und gegen bestimmte Zahlen sorgen bei durch einen Menschen manipulierten Zahlen für auffällige Ab­wei­chun­gen. Der Chi-Quadrat-Test entlarvt solche Auffälligkeiten. Prüfstein ist die letzte oder vorletzte Zahl vor dem Komma (also die Einer- oder Zehnerstelle) großer Zahlenmengen. Bei geringen Zahlenmengen (unter 1.000) ist die Verprobungsmenge zu klein, sodass der Test nicht aussagekräftig ist. Statistisch wird bei den Ziffern von 0 bis 9 eine gleichmäßige Verteilung er­wartet. Bei 30.000 Zahlen müsste also jede Ziffer von 0 bis 9 eigentlich 3.000-mal auftreten. Minimale Abweichungen sind in der Toleranz. Größere Abweichungen führen zu einer hohen Chi-Quadrat-Zahl und entlarven die Zahlenverteilung als eben nicht zufällig. Tauchen dann zum Beispiel die 2 und die 8 überproportional häufig und die 0 und 3 zu selten auf, schließt die Statistik und ihr folgend der Prüfer, dass die 0 und 3 dem (vermeintlichen) Manipulierer nicht gefallen und die 2 und 8 seine Lieblingszahlen sind.

Finanzgericht Rheinland-Pfalz

verdachtsmoment_ganz

Allein auf solche Abwei­chungen lässt sich al­ler­dings eine Ver­wer­fung der Buch­füh­rung nicht stüt­zen (Fi­nanz­ge­richt [FG] Rhein­land-Pfalz, Urt. v. 24.08.2011 – 2 K 1277/10). Denn allein der Um­stand, dass ein Chi-Quadrat-Test − eine sta­tis­tische Me­thode des Ver­gleichs der fest­ge­stell­ten Zif­fern mit deren theo­re­tisch er­war­teter Häu­fig­keit, ba­sierend auf der An­nahme, dass der­je­nige, der mani­pu­liert, un­be­wusst be­stimmte Lieb­lings­zahlen häu­figer ver­wendet – nach Auf­fas­sung des Prüfers eine 100-pro­zen­tige Mani­pu­la­tions­wahr­schein­lich­keit er­geben hat, recht­fer­tigt keine Zu­schät­zun­gen, wenn das häu­fi­gere Auf­tre­ten be­stimm­ter Zahlen sich zwangs­läu­fig aus der Preis­ge­stal­tung des Unter­nehmers er­gibt (FG Rheinland-Pfalz, Urt. v. 24.08.2011 – ­2 K 1277/10 – juris). So hielt das FG Rhein­land-Pfalz auf­grund der Preis­ge­stal­tung in einem Fri­seur­salon das häu­fi­gere Auf­treten be­stimm­ter Zahlen für normal und keines­wegs für auf­fäl­lig und teilte die Ein­schät­zung des Prüfers nicht. Das FG urteilte, dass die von dem Beklagten ins Feld geführte „Mani­pu­la­tions­wahr­schein­lich­keit von 100 Prozent“ aufgrund des vom Prüfer durchgeführten Chi-Quadrat-Tests (vgl. Bl. 108–119 Prüferhandakte) nicht zur Zuschätzungsbefugnis nach § 162 Abs. 1 AO führen kann. Der Test allein ist jedenfalls nicht geeignet, Beweise dafür zu erbringen, dass die Buchführung nicht ordnungsgemäß ist (vgl. Urteil des niedersächsischen Finanzgerichts vom 17.11.2009 m.w.N.), abgesehen davon, dass er bei einem Friseursalon, bei dem − wie hier − für die Leistungen ausschließlich volle beziehungsweise halbe Eurobeträge berechnet werden (vgl. Preisliste für 2007, Bl. 120 u. 121 Prüferhandakte), ungeeignet ­erscheint. Denn mit dem Chi-Quadrat-Test werden Verteilungseigenschaften einer statistischen Grundgesamtheit untersucht. Ausgehend von der Preisliste im Streitfall des Friseurs ergibt sich aber, dass naturgemäß die Zahl 0 wie auch die Zahlen 1, 4, 5 überdimensional häufig auftreten müssen (zum  Beispiel Föhnfrisur: 15 Euro; Färben: 25 Euro beziehungsweise 46,50 Euro, Föhnen: 40,50 Euro; vgl. FG Rheinland-Pfalz, Urt. v. 24.08.2011 – 2 K 1277/10).
Zudem ist der Chi-Quadrat-Test keine von der Rechtsprechung anerkannte Methode, eine Einnahmenmanipulation sicher zu belegen. Er ist daher bei summarischer Prüfung auch nicht geeignet, die Ordnungsmäßigkeit einer Buchführung zu verwerfen (FG Düsseldorf, Beschluss vom 14.04.2004 – 11 V 632/04 A(U) – juris). Losgelöst von der Frage im Einzelfall, ob die Ver­pro­bungs­mengen ausreichend sind beziehungsweise die Preisgestaltung gegebenenfalls Chi-Quadrat-ungeeignet ist, genügt der Chi-Quadrat-Test allein auch nicht zur Verwerfung der Buchführung: Wie das Finanzgericht Münster in seinem Beschluss vom 14.08.2003 (8 V 2651/03 E, U, EFG 2004, 9) ausgeführt hat, ist der Chi-Quadrat-Test keine von der Rechtsprechung anerkannte Methode, eine Einnahmenmanipulation sicher zu belegen (vgl. FG Münster, Beschluss vom 11.02.2000 − 9 V 5542/99 K, U, F, DStRE 2000, 549). Andererseits kann der Chi-Quadrat-Test neben anderen Prüfungsschritten zusätzliches Indiz für die Manipulationen sein (FG Düsseldorf, Beschluss vom 03.06.2008 – 14 V 1214/08 A: „Das Ergebnis des Chi-Quadrat-Tests war somit zur Rechtfertigung der Schätzung nicht erforderlich. Der Antragsgegner hat das Ergebnis lediglich als ein weiteres Indiz für eine fehlerhafte Kassenführung angesehen.“).
Umgekehrt hilft aber auch nicht ein unauffälliger Chi-Quadrat-Test: Sollte also der Chi-Quadrat-Test keine Auffälligkeiten zeigen, entlastet er den Steuerpflichtigen nicht, beweist also nicht die Richtigkeit der Buchführung. Er ist lediglich kein Indiz für die Unrichtigkeit. Die Richtigkeit dieses Gedankens folgt daraus, dass durch Manipulations-Software die Manipulationen vorgenommen sein könnten, sodass programmgesteuerte Manipulationen den menschlichen Fehlern um die Lieblingszahl entgegenwirken und damit naturgemäß bei Manipulations-Software der Chi-Qua­drat-Test unauffällig sein muss. Insoweit ist es auch zulässig, einen aus Sicht des Steuer­pflich­ti­gen unauffälligen Chi-Quadrat-Test im Ergebnis zu ignorieren, weil der Zeitreihenvergleich Auf­fäl­lig­kei­ten aufweist (vgl. FG Köln, Urteil vom 21.08.2008 – 2 K 3468/07).
Manipulations-Softwares (Zapper et cetera) arbeiten solchen menschlichen Schwächen entgegen und folgen bei ihren gesteuerten Eingriffen den statistischen Verteilungen, sodass typischerweise beim Einsatz von Zapper-Software der Chi-Quadrat-Test keine Auffälligkeiten bringt.

Newcomb-Benford’s Law

Das NBL ist nicht auf alle Zahlenmengen anwendbar, sondern nur auf die frei gewachsenen. Im Gegensatz zum Chi-Quadrat-Test, der auf die letzte oder vorletzte Ziffer vor dem Komma oder die erste nach dem Komma abstellt, setzt Benford’s Law mit der statistischen Untersuchung an der ersten Ziffer an. Deswegen ist hier auch die Ziffer 0 unbeachtlich. Bei der Benford-Analyse werden zunächst alle Zahlen eines Zahlenwerkes entsprechend ihrer Anfangsziffern gefiltert. Während beim Newcomb-Benford-Test die Anfangsziffern einer Zahl getestet werden, werden beim Chi-Quadrat-Test die hinteren Ziffern überprüft. Die dahintersteckende Logik geht davon aus, dass diese Ziffern der Gleichverteilung unterliegen sollten, was mit diesem Test überprüft wird. Das NBL erwartet bei großen Zahlenmengen die 1 mit 30,1 Prozent an erster Stelle, die 9 hingegen nur mit einer Wahrscheinlichkeit von 4,57 Prozent. Die anderen Zahlen mit der nachstehend abgebildeten Häufigkeit. Die Häufigkeitsverteilung bei großen, unbeeinflusst gewachsenen Zahlenmengen folgt stets folgender Verteilungshäufigkeit:

1 30,10 Prozent
2 17,60 Prozent
3 12,49 Prozent
4 9,69 Prozent
5 7,91 Prozent
6 6,69 Prozent
7 5,79 Prozent
8 5,11 Prozent
9 4,57 Prozent

Abweichungen indizieren Manipulationen

Das NBL gilt aber nicht für alle Zahlenmengen. So zum Beispiel nicht für Zahlen, deren inhaltliche Zusammensetzung systematisch gesteuert oder beeinflusst wird, die einem bestimmten vor­ge­ge­be­nen Muster folgen. Diese sind nicht frei gewachsen und entsprechen damit in der Regel nicht dem Benford’schen Verteilungsmuster. Gemeint sind Produktpreise, welche aus der individuellen Preisgestaltung des Unternehmers resultieren, Zahlen, die nach gewissen Regeln vergeben werden (Kontonummern), aber auch Zahlen, die anderen vorgegebenen Strukturen folgen, wie Wetterdaten, Sportergebnisse und andere. Auch auf Zahlen, die dem Zufallsprinzip unterliegen, wie die Lotteriezahlen, findet Benford’s Law keine Anwendung. Der Benford-An­fangs­ziffer-Test würde in solchen Fällen (Ausnahme: Lotteriezahlen) lediglich die sys­tem­be­dingte, gewollte Zahlenverteilung bestätigen.
Zahlenwerke, die der Benford’schen Regel folgen, sind etwa Umsatzzahlen (zum Beispiel Umsätze einzelner Artikel eines Kaufhauses), Fibu-Daten (sämtliche Einzelbuchungen eines Unternehmens), Inventurzahlen (bei einer breit gefächerten Warenpalette). Solche Zahlenmengen sind nicht systematisch beeinflusst. Sie wachsen auf natürliche Weise oder entstehen zufällig.
Zahlenwerke, die nicht der Benford’schen Regel folgen, sind zum Beispiel Telefon-/ Konto-/ Sozialversicherungsnummern, Produktpreise (Preisgestaltung des Unternehmers), Umsatzzahlen (Tagesendsummen).
Liegt keine gesetzmäßige Verteilung vor, ist dies ein Indiz für Manipulationen (Niedersächsisches Finanzgericht, Urt. v. 17.11.2009 – 15 K 12031/08) − aber eben kein Beweis. Der Prüfer kann daher mit einer abweichenden Verteilung von der erwarteten Verteilungshäufigkeit allein kein Mehr­er­geb­nis begründen, erst recht keine Buchführung verwerfen und keine Zuschätzung vor­nehmen.
Ob mit Benford’s Law und dem Chi-Quadrat-Test allein die Verwerfung der Buchführung möglich ist, ist höchst zweifelhaft, da beide statistischen Methoden nur Auffälligkeiten indizieren, aber nicht beweisen. Wenn jede für sich nicht tauglich ist, die Buchführung zu verwerfen, sind sie es in ihrer Kombination auch nicht.

Analyseverfahren

Das Finanzgericht Niedersachsen beurteilt das so: Nach Auffassung des erkennenden Senats handelt es sich bei dem Chi-Quadrat-Test unter Berücksichtigung des Newcomb-Benford-Law um keine von der Rechtsprechung anerkannte Methode, eine Einnahmemanipulation sicher zu belegen. Selbst Befürworter derartiger Analysemethoden betonen ausdrücklich, dass es sich bei dem Verfahren nur um ein Analyseverfahren handelt, das keinen Beweis im juristischen Sinne, sondern Anhaltspunkte für mögliche Unregelmäßigkeiten liefern kann. Ergeben sich daher nach Durchführung eines solchen Tests Anzeichen für Einnahmemanipulationen, obliegt es daher der Finanzverwaltung, beispielsweise durch eine Geldverkehrs- oder eine Ver­mö­gens­zu­wachs­rech­nung Ein­nah­me­ma­ni­pu­la­tionen sicher zu belegen. Der Chi-Quadrat-Test und Newcomb-Benford-Test sind jedenfalls nicht geeignet, Beweis darüber zu erbringen, dass die Buchführung nicht ordnungsgemäß ist (so im Ergebnis auch: FG Münster vom 14.08.2003 − 8 V 2651/03, EFG 2004, 9; FG Düsseldorf, Beschluss vom 14.04.2004 − 11 V 632/04 − in juris)“ (Nieder­säch­sisches Fi­nanz­ge­richt, Urt. v. 17.11.2009 – 15 K 12031/08).

Fazit

Es gibt Grenzen – auch für die Prüfung. Manches entdeckt sie – manchen Phantomen jagt sie nach. Sie hat auch ganz andere Seiten: Sie entlarvt manchen Dritten, der das Unternehmen schädigt – sie ist teilweise auch hilfreiche Revision und hilft dem Unternehmer. Hat der Prüfer nun (immer) recht? Die Antwort ist, es kommt darauf an: auf die Auslegung von Verträgen, auf die Analyse von Sachverhalten, auf die Beweisführung. Es gibt bei der BP seit vielen Jahren neue Entwicklungen, mehr Statistik, mehr elektronische Prüfungsansätze, aber nicht alles überzeugt und hat sich durchgesetzt. Es rentiert sich, genauer einzusteigen und stets die Beanstandungen der BP kritisch zu durchdenken und zu überprüfen. Nur das führt zu zutreffenden Ergebnissen.

0Kommentare Neuen Kommentar verfassen

Einen neuen Kommentar verfassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.