Stichproben und mathematische Verfahren - 18. März 2017

Stichproben

Große Informationsdienstleister wie Google oder Facebook haben gezeigt, wie man aus Daten In­for­ma­tionen generiert. Aufgrund der extrem gestiegenen Datenmengen in Unternehmen bietet es sich an, diese auch für die Wirtschaftsprüfung heranzuziehen.

Verfolgt man die Veröffentlichungen der letzten Jahre in der Fachliteratur für Wirtschaftsprüfer (WP) / Steuerberater, bekommt man den Eindruck, dass ohne Massendatenanalyse oder statis­tische Methoden auch in mittelständischen Wirtschaftsprüferkanzleien nichts mehr geht. Manche eher boulevardorientierte Medien orakeln sogar über das Ende des Berufsstands in seiner heutigen Form. Doch woher kommt dieses Vertrauen in die Leistungsfähigkeit moderner Analysesysteme?

Große Informationsdienstleister wie Google oder Facebook mit ihren nicht mehr vorstellbaren Datenmengen und ihren intelligenten Algorithmen haben gezeigt, wie man aus Daten In­for­ma­tionen generiert und damit das bislang erfolgreichste Geschäftsmodell des neuen Jahrhunderts hervorbringt. An diesem Goldrausch wollen verständ­licher­weise viele partizipieren. Aufgrund der extrem gestiegenen Datenmengen in den Unternehmen bietet es sich an, diese auch für die Wirt­schafts­prüfung heranzuziehen, zumal sich im Bereich der steuer­lichen Be­triebs­prüfung ent­sprechende Methoden großer Beliebtheit erfreuen. Anwendung finden in beiden Fällen vor allem die statistischen Methoden zur Stich­proben­ziehung und der Verteilungstests.
Der Großteil der gestiegenen Datenmengen in den Unternehmen entfällt allerdings weniger auf Prüfungsvorgänge des Rechnungswesens, sondern vielmehr auf das Kunden-, Waren- und Pro­duk­tionsmanagement und wird im Bereich des Marketings verwendet.

Status quo

Überraschenderweise und entgegen mancher Quellen sind die Fortschritte der IT im Umfeld des Rechnungswesens für diesen Hype weniger verantwortlich. Die entsprechenden mathematisch-statistischen Grundlagen sind meist schon lange bekannt, und die führenden Anwendungen sind seit vielen Jahrzehnten am Markt. Ausnahmen finden sich in spezialisierten Analysesystemen zur Spuren- oder Mustersuche in komplexen Berechtigungssystemen der Unternehmen. Leider ist der Fortschritt an der Ergonomie der klassischen Programme teilweise spurlos vorbeigegangen. Dies und die nicht selbsterklärenden mathematischen Hinter­gründe führen dazu, dass fast nur Spe­zia­listen Programm und Theorie in Gänze durchschauen und somit zielorientiert anwenden können. Größere Kanzleien bedienen sich in diesen Fällen meist dedizierter Spezialisten in der Kanzlei, die eine entsprechende informatische, mathematische oder eine vergleichbare Ausbildung besitzen. Kleine und mittlere Kanzleien haben hier das Nachsehen.

Ziel

Die Strategie, diesen Wettbewerbsnachteil zu vermindern, sollte von zwei Seiten ansetzen. Zum einen sollten dem Prüfer intuitive Werkzeuge an die Hand gegeben werden, zum anderen sollte ihm das Wissen vermittelt werden, um diese Werk­zeuge auch sinnvoll einsetzen zu können.
In unseren Seminaren legen wir neben der Methoden- und IT-Kompetenz besonderen Wert auf die im Rahmen des prüferischen Ermessensspielraums vernünftige Anwendung der möglichen Methoden. Dabei ist stets zu berück­sich­ti­gen, dass sich der Prüfer bei der Wahl seiner Methode im Spannungsfeld zwischen Aussagekraft des Prüfungsschritts und der Wirtschaftlichkeit ihrer Anwendung befindet. Aus der Vollprüfung erhält man natürlich die höchste Aussagekraft, doch dürfte die Wirtschaftlichkeit durchaus darunter leiden. Umgekehrt wäre das auf dem Einzelfall beruhende Abhaken die wirtschaftlichste Methode, die allerdings oft mit einer problematischen Aussagekraft einhergeht.

Sicherheit und Stichprobenumfang

Bei Schulungen erleben wir es oftmals, dass sich nach der Hälfte der Zeit eine gewisse Er­nüch­te­rung und Enttäuschung bei den Teilnehmern einstellt, wenn in den ersten praktischen Übungen zum Stichprobenumfang teilweise Stich­pro­ben­um­fänge um die 200 berechnet werden. Dies stellt beispielsweise bei Salden­be­stä­ti­gungen offensichtlich keinen wirtschaftlich gangbaren Weg dar. Hier kommen in der Praxis verschiedene Risikomodelle zum Einsatz, mit deren Hilfe es statistisch begründet möglich ist, die erforderliche Konfidenz (Sicherheit, Zuverlässigkeit) für den Test zu senken. Die Konfidenz als eine zentrale Größe in der Statistik gibt an, mit welcher Wahr­schein­lich­keit die Lage­schät­zung aus einer Stichprobenerhebung auch für die Grundgesamtheit zutreffend sein kann. Dies ist der wesentliche Unterschied zur bewussten Stichprobenauswahl oder dem bewussten Festlegen des Stich­proben­umfangs. Diese Methoden liefern zwar auch Ergebnisse, die Qualität der Proben lässt sich allerdings nicht quantifizieren. Aus diesem Grund kann auch keine verantwortungsvolle Hochrechnung erfolgen. Die Anforderung an die Qualität der Stichprobe ist nach dem Modell der ri­si­ko­orien­tier­ten Prüfung abhängig von der Zuverlässigkeit der Kontroll­systeme. Dabei sind laut einer Empfehlung der Europäischen Kommission in ihren Leitlinien zu Stich­proben­ver­fahren für Prüfbehörden Konfidenzen zwischen 95 und 60 Prozent anwend­bar. Der Prüfer wird 95 Prozent wählen, wenn über das Kontrollumfeld keine In­for­ma­tion vorliegt oder das Kontrollsystem im Wesentlichen als unzuverlässig gilt. Der Prüfer wird 60 Prozent wählen, wenn das Kontrollsystem als sehr zuverlässig gilt und nur geringfügige Verbesserungen notwendig erscheinen.

Beispiel

Die Auswirkungen dieser Bandbreite der Konfidenz soll kurz an einem Beispiel demonstriert werden. Dabei wird für die Bestimmung des Stichprobenumfangs das in der Prüfung von monetär werthaltigen Prüffeldern gängigste Verfahren – das Monetary Unit Sampling – angewendet. Nimmt man einen maximal zu tolerierenden Fehlbetrag von drei Prozent und einen aus der Vergangenheit oder einer Vor­ab­stich­probe bekannten erwarteten Fehlbetrag von einem Prozent, erhält man bei einer Konfidenz von 95 Prozent einen Stichprobenumfang von 214. Kann man hingegen aufgrund des hervorragenden Kontrollsystems mit 60 Prozent Konfidenz prüfen, verringert sich der Stichprobenumfang auf 49. Dies stellt meiner Meinung nach auch die untere Grenze des sinnvollen mathematisch-statistischen Stich­proben­ein­satzes dar. Theoretisch könnte man, um den Stichprobenumfang weiter zu senken, noch die Parameter für den erwarteten und den tolerierbaren Fehler weiter spreizen, jedoch erhöht dies den Stichprobenfehler erheblich und liefert dadurch wenig belastbare Resultate.

Saldenbestätigung

Stichprobenumfänge im Bereich der Saldenbestätigung sind damit meist wirt­schaft­lich sinnvoll zu erhalten. Allerdings gibt es bei der Behandlung nicht beantworteter Bestätigungen erhebliche Probleme. Dabei erstreckten sich die Hand­lungs­mög­lich­keiten zwischen vollem Fehler und Nach­ziehen der Probe. Beides ist pro­ble­ma­tisch, da bereits ein voller Fehler meist zu einer negativen Beurteilung des Tests führt und das Nachziehen in den mathematischen Modellen so nicht vorgesehen ist. Insofern bietet es sich in diesem Fall durchaus an, die Stich­pro­ben­ziehung nach prüferischem Ermessen zu beschreiten, ohne allerdings die statistisch geforderte Menge ein­zu­schränken. Ein Beispiel für die Problematik der Saldenbestätigung zeigt der Fraud-Fall Thielert (Peemöller, Krehl, Hofmann Bilanzskandale 2016, S. 114ff.) Nur 0,03 Prozent des For­de­rungs­be­stands wurden in einer Sonderprüfung bestätigt.

Inventur

Ein Beispiel für den wirtschaftlich sinnvollen Einsatz der Stichprobenverfahren zeigt der nach­fol­gende Fall. Es handelt sich um die Lagerprüfung bei einem großen Internetversandhandel. Dessen Lager umfasst gut 17.000 Regallagerplätze, die jeweils mehrere verschiedene Produkte und Produktgruppen enthalten können. Dabei weisen die Werte der verschiedenen Produkte, ungünstigerweise für eine statistische Hochrechnung eine sehr hohe Streuung auf. Dem Prüfer ging es bei der Prüfung nicht um die Qualität der Warenwirtschaft, sondern rein um die monetäre Bewertung des Lagers. Da es keine laufende Inventur gab, eine Voll­prüfung zeitlich mehrere Wochen mit mehreren Personen in Anspruch genommen hätte und nur der monetäre Bestand interessierte, wurde das Monetary Unit Sampling als Stichprobenmethode gewählt. Mit den strengen Vorgaben einer 95-prozentigen Konfidenz, einer zweiprozentigen Wesentlichkeit und eines 0,75-prozentigen erwarteten Fehlers errechnet sich ein Stichprobenumfang von 385.
Mit rund 60 Fehlbewertungen wurde eine recht hohe absolute Fehlerzahl gefunden. Diese hätte bei einem rein qualitativen Test der Lagerhaltung mit Sicherheit zu Problemen geführt. Da die jeweiligen relativen Abweichungen jedoch sehr klein waren und man die gefundenen Über- und Unterbewertungen bei dem rein monetär orientierten Verfahren in geeigneter Weise ge­gen­ein­ander verrechnen kann, ergab sich eine nur sehr geringe hochgerechnete Abweichung des Lagerbestands vom Buchbestand.
Die Stichprobeninventur der 385 Lagerplätze konnte an einem Tag mit sieben Mann, einem Prüfungsleiter und sechs Zählern innerhalb von acht Stunden durch­ge­führt werden. Würde man die Einsparung der Stich­pro­ben­inventur gegen­über der Vollerhebung hochrechnen, ergäben sich gut 300 Manntage. Als weiterer positiver Aspekt konnte im Folgejahr bei gleicher Konfidenz aufgrund der sehr niedrigen hochgerechneten Lager­ab­wei­chung mit einem reduzierten Stich­proben­umfang von 200 Stich­proben die Inventurzeit weiter verkürzt werden.

Fazit

Sowohl die statistisch-mathematischen Methoden als auch die bewusste Auswahl nach prü­fe­rischem Ermessen sind Werkzeuge, die der Prüfer sinnvoll und dem Einzelfall angepasst einsetzen sollte. Maßgebend ist stets das Ziel einer jeden Stichprobe, deren Repräsentativität für die Grund­gesamtheit zu gewährleisten. Wie bei jeder Statistik kommt es dann auf die Vor­aus­set­zungen und die Wahl der statistischen Parameter an. Entscheidend bleibt bei aller Begeisterung für die jeweiligen Methoden die Verfahrenskompetenz des Prüfers. Doch für eine optimale Wahl und einen optimalen Einsatz ist es zwingend erforderlich, die verschiedenen Alternativen mit ihren Vor- und Nachteilen genau zu kennen. Dieses Wissen hat Zukunft.

Fotos: bestdesigns, ziablik_n/Getty Images

MEHR DAZU

DATEV Datenprüfung classic/comfort führt Sie schrittweise von der Bestimmung des Stichprobenumfangs bis zur Dokumentation und Auswertung der Ergebnisse. Siehe dazu den Beitrag Sicher und effizient durch die Stichprobenziehung.

Weitere Informationen zu DATEV Datenprüfung finden Sie unter www.datev.de/datenpruefung

Besuchen Sie das Seminar So ziehen Sie Stichproben, Art.-Nr. 70868. Dort lernen Sie die verschiedenen Stichprobenverfahren kennen. Am Schulungs­rechner wenden Sie diese anhand von Beispielen an, bewerten den Umfang und lernen das Ergebnis zu verstehen.

Weitere Informationen zum Seminar und Anmeldemöglichkeiten: www.datev.de/stichproben

Zum Autor

Dr. Stefan Strobel

DATEV eG, Mitarbeiter im Fachbereich Wirtschaftsprüfung

Weitere Artikel des Autors