Stichproben

Große Informationsdienstleister wie Google oder Facebook haben gezeigt, wie man aus Daten Informationen generiert. Aufgrund der extrem gestiegenen Datenmengen in Unternehmen bietet es sich an, diese auch für die Wirtschaftsprüfung heranzuziehen.

Verfolgt man die Veröffentlichungen der letzten Jahre in der Fachliteratur für Wirtschaftsprüfer (WP) / Steuerberater, bekommt man den Eindruck, dass ohne Massendatenanalyse oder statistische Methoden auch in mittelständischen Wirtschaftsprüferkanzleien nichts mehr geht. Manche eher boulevardorientierte Medien orakeln sogar über das Ende des Berufsstands in seiner heutigen Form. Doch woher kommt dieses Vertrauen in die Leistungsfähigkeit moderner Analysesysteme?

Große Informationsdienstleister wie Google oder Facebook mit ihren nicht mehr vorstellbaren Datenmengen und ihren intelligenten Algorithmen haben gezeigt, wie man aus Daten Informationen generiert und damit das bislang erfolgreichste Geschäftsmodell des neuen Jahrhunderts hervorbringt. An diesem Goldrausch wollen verständlicherweise viele partizipieren. Aufgrund der extrem gestiegenen Datenmengen in den Unternehmen bietet es sich an, diese auch für die Wirtschaftsprüfung heranzuziehen, zumal sich im Bereich der steuerlichen Betriebsprüfung entsprechende Methoden großer Beliebtheit erfreuen. Anwendung finden in beiden Fällen vor allem die statistischen Methoden zur Stichprobenziehung und der Verteilungstests.
Der Großteil der gestiegenen Datenmengen in den Unternehmen entfällt allerdings weniger auf Prüfungsvorgänge des Rechnungswesens, sondern vielmehr auf das Kunden-, Waren- und Produktionsmanagement und wird im Bereich des Marketings verwendet.

Status quo

Überraschenderweise und entgegen mancher Quellen sind die Fortschritte der IT im Umfeld des Rechnungswesens für diesen Hype weniger verantwortlich. Die entsprechenden mathematisch-statistischen Grundlagen sind meist schon lange bekannt, und die führenden Anwendungen sind seit vielen Jahrzehnten am Markt. Ausnahmen finden sich in spezialisierten Analysesystemen zur Spuren- oder Mustersuche in komplexen Berechtigungssystemen der Unternehmen. Leider ist der Fortschritt an der Ergonomie der klassischen Programme teilweise spurlos vorbeigegangen. Dies und die nicht selbsterklärenden mathematischen Hintergründe führen dazu, dass fast nur Spezialisten Programm und Theorie in Gänze durchschauen und somit zielorientiert anwenden können. Größere Kanzleien bedienen sich in diesen Fällen meist dedizierter Spezialisten in der Kanzlei, die eine entsprechende informatische, mathematische oder eine vergleichbare Ausbildung besitzen. Kleine und mittlere Kanzleien haben hier das Nachsehen.

Ziel

Die Strategie, diesen Wettbewerbsnachteil zu vermindern, sollte von zwei Seiten ansetzen. Zum einen sollten dem Prüfer intuitive Werkzeuge an die Hand gegeben werden, zum anderen sollte ihm das Wissen vermittelt werden, um diese Werkzeuge auch sinnvoll einsetzen zu können.
In unseren Seminaren legen wir neben der Methoden- und IT-Kompetenz besonderen Wert auf die im Rahmen des prüferischen Ermessensspielraums vernünftige Anwendung der möglichen Methoden. Dabei ist stets zu berücksichtigen, dass sich der Prüfer bei der Wahl seiner Methode im Spannungsfeld zwischen Aussagekraft des Prüfungsschritts und der Wirtschaftlichkeit ihrer Anwendung befindet. Aus der Vollprüfung erhält man natürlich die höchste Aussagekraft, doch dürfte die Wirtschaftlichkeit durchaus darunter leiden. Umgekehrt wäre das auf dem Einzelfall beruhende Abhaken die wirtschaftlichste Methode, die allerdings oft mit einer problematischen Aussagekraft einhergeht.

Sicherheit und Stichprobenumfang

Bei Schulungen erleben wir es oftmals, dass sich nach der Hälfte der Zeit eine gewisse Ernüchterung und Enttäuschung bei den Teilnehmern einstellt, wenn in den ersten praktischen Übungen zum Stichprobenumfang teilweise Stichprobenumfänge um die 200 berechnet werden. Dies stellt beispielsweise bei Saldenbestätigungen offensichtlich keinen wirtschaftlich gangbaren Weg dar. Hier kommen in der Praxis verschiedene Risikomodelle zum Einsatz, mit deren Hilfe es statistisch begründet möglich ist, die erforderliche Konfidenz (Sicherheit, Zuverlässigkeit) für den Test zu senken. Die Konfidenz als eine zentrale Größe in der Statistik gibt an, mit welcher Wahrscheinlichkeit die Lageschätzung aus einer Stichprobenerhebung auch für die Grundgesamtheit zutreffend sein kann. Dies ist der wesentliche Unterschied zur bewussten Stichprobenauswahl oder dem bewussten Festlegen des Stichprobenumfangs. Diese Methoden liefern zwar auch Ergebnisse, die Qualität der Proben lässt sich allerdings nicht quantifizieren. Aus diesem Grund kann auch keine verantwortungsvolle Hochrechnung erfolgen. Die Anforderung an die Qualität der Stichprobe ist nach dem Modell der risikoorientierten Prüfung abhängig von der Zuverlässigkeit der Kontrollsysteme. Dabei sind laut einer Empfehlung der Europäischen Kommission in ihren Leitlinien zu Stichprobenverfahren für Prüfbehörden Konfidenzen zwischen 95 und 60 Prozent anwendbar. Der Prüfer wird 95 Prozent wählen, wenn über das Kontrollumfeld keine Information vorliegt oder das Kontrollsystem im Wesentlichen als unzuverlässig gilt. Der Prüfer wird 60 Prozent wählen, wenn das Kontrollsystem als sehr zuverlässig gilt und nur geringfügige Verbesserungen notwendig erscheinen.

Beispiel

Die Auswirkungen dieser Bandbreite der Konfidenz soll kurz an einem Beispiel demonstriert werden. Dabei wird für die Bestimmung des Stichprobenumfangs das in der Prüfung von monetär werthaltigen Prüffeldern gängigste Verfahren – das Monetary Unit Sampling – angewendet. Nimmt man einen maximal zu tolerierenden Fehlbetrag von drei Prozent und einen aus der Vergangenheit oder einer Vorabstichprobe bekannten erwarteten Fehlbetrag von einem Prozent, erhält man bei einer Konfidenz von 95 Prozent einen Stichprobenumfang von 214. Kann man hingegen aufgrund des hervorragenden Kontrollsystems mit 60 Prozent Konfidenz prüfen, verringert sich der Stichprobenumfang auf 49. Dies stellt meiner Meinung nach auch die untere Grenze des sinnvollen mathematisch-statistischen Stichprobeneinsatzes dar. Theoretisch könnte man, um den Stichprobenumfang weiter zu senken, noch die Parameter für den erwarteten und den tolerierbaren Fehler weiter spreizen, jedoch erhöht dies den Stichprobenfehler erheblich und liefert dadurch wenig belastbare Resultate.

Saldenbestätigung

Stichprobenumfänge im Bereich der Saldenbestätigung sind damit meist wirtschaftlich sinnvoll zu erhalten. Allerdings gibt es bei der Behandlung nicht beantworteter Bestätigungen erhebliche Probleme. Dabei erstreckten sich die Handlungsmöglichkeiten zwischen vollem Fehler und Nachziehen der Probe. Beides ist problematisch, da bereits ein voller Fehler meist zu einer negativen Beurteilung des Tests führt und das Nachziehen in den mathematischen Modellen so nicht vorgesehen ist. Insofern bietet es sich in diesem Fall durchaus an, die Stichprobenziehung nach prüferischem Ermessen zu beschreiten, ohne allerdings die statistisch geforderte Menge einzuschränken. Ein Beispiel für die Problematik der Saldenbestätigung zeigt der Fraud-Fall Thielert (Peemöller, Krehl, Hofmann Bilanzskandale 2016, S. 114ff.) Nur 0,03 Prozent des Forderungsbestands wurden in einer Sonderprüfung bestätigt.

Inventur

Ein Beispiel für den wirtschaftlich sinnvollen Einsatz der Stichprobenverfahren zeigt der nachfolgende Fall. Es handelt sich um die Lagerprüfung bei einem großen Internetversandhandel. Dessen Lager umfasst gut 17.000 Regallagerplätze, die jeweils mehrere verschiedene Produkte und Produktgruppen enthalten können. Dabei weisen die Werte der verschiedenen Produkte, ungünstigerweise für eine statistische Hochrechnung eine sehr hohe Streuung auf. Dem Prüfer ging es bei der Prüfung nicht um die Qualität der Warenwirtschaft, sondern rein um die monetäre Bewertung des Lagers. Da es keine laufende Inventur gab, eine Vollprüfung zeitlich mehrere Wochen mit mehreren Personen in Anspruch genommen hätte und nur der monetäre Bestand interessierte, wurde das Monetary Unit Sampling als Stichprobenmethode gewählt. Mit den strengen Vorgaben einer 95-prozentigen Konfidenz, einer zweiprozentigen Wesentlichkeit und eines 0,75-prozentigen erwarteten Fehlers errechnet sich ein Stichprobenumfang von 385.
Mit rund 60 Fehlbewertungen wurde eine recht hohe absolute Fehlerzahl gefunden. Diese hätte bei einem rein qualitativen Test der Lagerhaltung mit Sicherheit zu Problemen geführt. Da die jeweiligen relativen Abweichungen jedoch sehr klein waren und man die gefundenen Über- und Unterbewertungen bei dem rein monetär orientierten Verfahren in geeigneter Weise gegeneinander verrechnen kann, ergab sich eine nur sehr geringe hochgerechnete Abweichung des Lagerbestands vom Buchbestand.
Die Stichprobeninventur der 385 Lagerplätze konnte an einem Tag mit sieben Mann, einem Prüfungsleiter und sechs Zählern innerhalb von acht Stunden durchgeführt werden. Würde man die Einsparung der Stichprobeninventur gegenüber der Vollerhebung hochrechnen, ergäben sich gut 300 Manntage. Als weiterer positiver Aspekt konnte im Folgejahr bei gleicher Konfidenz aufgrund der sehr niedrigen hochgerechneten Lagerabweichung mit einem reduzierten Stichprobenumfang von 200 Stichproben die Inventurzeit weiter verkürzt werden.

Fazit

Sowohl die statistisch-mathematischen Methoden als auch die bewusste Auswahl nach prüferischem Ermessen sind Werkzeuge, die der Prüfer sinnvoll und dem Einzelfall angepasst einsetzen sollte. Maßgebend ist stets das Ziel einer jeden Stichprobe, deren Repräsentativität für die Grundgesamtheit zu gewährleisten. Wie bei jeder Statistik kommt es dann auf die Voraussetzungen und die Wahl der statistischen Parameter an. Entscheidend bleibt bei aller Begeisterung für die jeweiligen Methoden die Verfahrenskompetenz des Prüfers. Doch für eine optimale Wahl und einen optimalen Einsatz ist es zwingend erforderlich, die verschiedenen Alternativen mit ihren Vor- und Nachteilen genau zu kennen. Dieses Wissen hat Zukunft.

Fotos: bestdesigns, ziablik_n/Getty Images

MEHR DAZU

DATEV Datenprüfung classic/comfort führt Sie schrittweise von der Bestimmung des Stichprobenumfangs bis zur Dokumentation und Auswertung der Ergebnisse. Siehe dazu den Beitrag Sicher und effizient durch die Stichprobenziehung.

Weitere Informationen zu DATEV Datenprüfung finden Sie unter www.datev.de/datenpruefung

Besuchen Sie das Seminar So ziehen Sie Stichproben, Art.-Nr. 70868. Dort lernen Sie die verschiedenen Stichprobenverfahren kennen. Am Schulungsrechner wenden Sie diese anhand von Beispielen an, bewerten den Umfang und lernen das Ergebnis zu verstehen.

Weitere Informationen zum Seminar und Anmeldemöglichkeiten: www.datev.de/stichproben

Zum Autor

Dr. Stefan Strobel

DATEV eG, Mitarbeiter im Fachbereich Wirtschaftsprüfung

Stichproben

Status quo

Ziel

Sicherheit und Stichprobenumfang

Beispiel

Saldenbestätigung

Inventur

Fazit

MEHR DAZU

Zum Autor

Meistgelesene Artikel

„Wir haben gar keine andere Wahl“

Omas Häuschen im Visier des Fiskus

Job-Ticket statt Lohnerhöhung

Aktuelle Meldungen im Fokus

Komplett digital im Rechnungswesen

Eilmeldung: Quasi-Fristverlängerung für die Offenlegung der Jahresabschlüsse 2022 verkündet!