Bundeskartellamt bemängelt Nutzerbewertungssysteme im Internet

Out-Law Analysis | 02 Jul 2020 | 2:03 pm | Lesedauer: 6 Min.

Das Bundeskartellamt prangert Defizite bei Nutzerbewertungssystemen im Internet an und fordert die Portale auf, mehr Verantwortung zu übernehmen. Stellungnahmen nimmt die Behörde bis Ende Juli entgegen.

Nutzerbewertungen zählen zum Marktstandard im Online-Shopping und sind neben dem Preis zum wichtigsten Kriterium bei einer Kaufentscheidung avanciert, ersetzen sie doch die Empfehlungen von Freunden oder Verkäufern im Einzelhandel. Um etwaige Defizite zu Lasten der Verbraucher in diesem Bereich zu identifizieren, leitete das Bundeskartellamt (BKartA) im Mai 2019 die Sektoruntersuchung zu Nutzerbewertungen im Internet ein. Auch andere Behörden, beispielsweise in Australien, Großbritannien und den USA, sind in diesem Bereich bereits aktiv und haben Verfahren und Untersuchungen angestoßen.

Das Bundeskartellamt hat dabei von seiner relativ jungen Kompetenz im Verbraucherrecht Gebrauch gemacht und die unter dem Schlagwort der „Fake-Bewertungen” diskutierten Probleme aufgegriffen, die Verbraucher beim Online-Kauf massiv in die Irre führen und nicht zuletzt auch für Betreiber geschäftsschädigend sein können. Kernstück des im Juni veröffentlichten Konsultationspapiers bilden aber die Maßnahmen, die die Behörde von den Portalen einfordert, um etwa manipulierte Bewertungen und verdeckte Produkttests einzudämmen. Laut Mitteilung verlangen die Wettbewerbshüter „vor allem eine zielgenaue Filterung der abgegebenen Bewertungen und die Zulassung gekennzeichneter und damit für den Verbraucher erkennbarer Produkttests.” Noch bis Ende Juli können alle Interessierten – auch bisher Unbeteiligte – zu den vorläufigen Ergebnissen Stellung nehmen. Ein Abschlussbericht soll dann im Herbst folgen. 

Zuvor hatten die Bonner Wettbewerbshüter schon bei Vergleichsportalen genauer hingeschaut und erstmals von der seit 2017 bestehenden Befugnis Gebrauch gemacht, einen gesamten Sektor mit  Blick auf Verstöße gegen verbraucherrechtliche Vorschriften zu prüfen. Dies war vorher nur im Kartellbereich möglich.

Die aktuelle Untersuchung hat Systeme für Nutzerbewertungen von Produkten, von Unternehmen sowie von Apps in Augenschein genommen. Die von Buchungsportalen, Plattformen, Vergleichsportalen, Bewertungsportalen oder Online-Shops genutzten Systeme weisen dabei ganz unterschiedlich ausgeprägte Defizite beim Erfassen, Filtern und Darstellen von Bewertungen auf. Das macht das Konsultationspapier deutlich. Befragt wurden mehr als 60 relevante Portale aus 16 Branchen, in denen Nutzerbewertungen einen besonders großen Einfluss auf die Entscheidungen von Verbrauchern haben, darunter Amazon, Check24, Holidaycheck und Jameda.

Akteure mit unterschiedlicher Interessenlage

Die vorläufigen Ermittlungsergebnisse des BKartA veranschaulichen anhand der Interessen aller Beteiligten, wie es zu regelmäßigen Fälschungen und Manipulationen von Nutzerbewertungen kommt, obwohl insbesondere Portalen, die stark differenzierte Produkte oder emotionale Leistungen vertreiben, sehr an glaubhaften und informativen Nutzerbewertungen gelegen ist.

Verbraucher lesen zwar gerne Bewertungen anderer Verbraucher, scheuen aber in der Regel den Aufwand, selbst welche zu schreiben. Das BKartA geht nach Auswertung von Studien von einer Beteiligungsquote aus, die in der Regel eher im einstelligen Prozentbereich liegt, wobei Restaurantbesucher und Hotelgäste ihre Meinung noch am ehesten mitteilen. Portalbetreiber und Händler hingegen benötigen laut BKartA möglichst viele Bewertungen, um ihren Umsatz zu steigern. Nicht nur verkaufen sich Produkte und Dienstleistungen leichter, wenn sie besser bewertet wurden, dem Verbraucher scheint auch eine hohe Anzahl von Bewertungen besonders wichtig zu sein.

Besonders interessant ist, dass die Behörde hier einen selbstverstärkenden Effekt ausmachen konnte, der gerade bei unbekannten Produkten und Dienstleistungen von Bedeutung sein dürfte. Die häufige Bewertung eines Produkts kann – je nach System – zu einer besseren Platzierung in der Produktanzeige führen, was wiederum zur besseren Auffindbarkeit des Produkts, erhöhten Verkaufszahlen und neuen Bewertungen beiträgt.

Die mangelnde Eigenmotivation der Verbraucher führt also dazu, dass die Händler einen Anreiz zur Bewertungsabgabe setzen müssen: Verbraucher werden etwa per E-Mail „angestupst“, nachdem sie ein Produkt gekauft oder ein Hotelzimmer gebucht haben, und auch gerne mit Gutscheinen und der Teilnahme an Gewinnspielen zur Abgabe einer Bewertung gelockt. Zudem werden Vermittler eingesetzt, die sich auf die Suche nach privaten Produkttestern begeben und die Bewertungen an die Händler verkaufen.

Portale sollen Probleme proaktiv und freiwillig beheben

Für die während der Sektoruntersuchung erkannten Problembereiche enthält das Konsultationspapier konkrete ­– und nach Ansicht des Amtes auch zumutbare – Handlungsanweisungen, um Fälschungen und Manipulationen zu verhindern und Bewertungssysteme zu etablieren, die dazu beitragen, Verbraucher zu informieren, anstatt sie durch Verzerrungen in die Irre zu führen.  Unabhängig von der Zumutbarkeit wird sich in der Praxis aber zeigen, ob der Ansatz, den ohnehin schon wenig motivierten Nutzer bei der Bewertungsabgabe genauer zu durchleuchten, tatsächlich förderlich für das so essentielle System authentischer Nutzerbewertungen ist.

Das BKartA hat zwar keine Befugnis, die vorgeschlagenen Änderungen gegenüber den Portalen durchzusetzen, nutzt aber die Öffentlichkeit, damit die Betreiber freiwillig mehr Verantwortung übernehmen. Auch ist vorstellbar, dass etwa Verbraucherschutzorganisationen als Wächter des Wettbewerbs einspringen und die Portale vor den Zivilgerichten in Anspruch nehmen, wenn es zu Rechtsverstößen kommt. Die mit der Sektoruntersuchung erarbeiteten Erkenntnisse können dabei zwar herangezogen werden, am Ende wird es aber auf den konkreten Einzelfall ankommen, zumal sich die Funktionsweisen der Portale teilweise sehr stark voneinander unterscheiden.

Kennzeichnung incentivierter Bewertungen

Werden durch Anreize wie etwa Gutscheine zusätzliche Bewertungen generiert, mag dies die vielfältigen Verbrauchererfahrungen zwar besser widerspiegeln, allerdings kann die hohe Zahl auch zu dem irreführenden Rückschluss verleiten, das Produkt sei besonders beliebt oder bekannt. Auch kann die Belohnung dazu führen, dass sich die Nutzer durch eine positivere Bewertung bedanken.

Das BKartA hält Anreize zwar für grundsätzlich zulässig, findet es jedoch problematisch, wenn die Verbraucher nicht erkennen können, dass die Bewertung unter solchen Bedingungen zustande gekommen ist. Bei einer Offenlegung wäre das nicht der Fall: Der Verbraucher könne sich die hohe Zahl an Bewertungen dann besser erklären. Eine Pflicht zur Kennzeichnung könnte etwa von der Höhe des Anreizes abhängig gemacht werden, ist aber auch bei geringen Anreizen denkbar, wenn diese nur für bestimmte Produkte gewährt wurden. Ist der Anreiz branchenüblich, erscheint eine Kennzeichnung tendenziell nicht notwendig.

Früherkennung und Kennzeichnung von Produkttests

Auch Produkttests können Verbraucher motivieren, eine Bewertung zu verfassen. Die Tatsache, dass die getesteten Produkte gratis oder deutlich vergünstigt überlassen werden, führt zu tendenziell positiveren Bewertungen. Fehlt eine Kennzeichnung als Produkttest, ist das irreführend. Trotzdem ist es den Portalen nach Einschätzung des BKartA in der Vergangenheit nicht nachhaltig gelungen, sich gegen derartige verdeckte Produkttests durchzusetzen. Auch ist der Anreiz dazu eher gering, da sich die Verbraucher bislang noch nicht von den Portalen abwenden, sondern in Sicherheit wägen und annehmen, Produkttests auch ohne Kennzeichnung zu erkennen.

Vor diesem Hintergrund fordert die Behörde die Portale nun auf, ihr Überwachungspotential stärker auszuschöpfen, um verdeckte Produkttests besser zu identifizieren und zu entfernen. Hierbei könnten Filter zum Einsatz kommen, die die Daten der Bewertungsabgabe analysieren oder automatisiert Verbindungen zwischen Bewertungen, Angeboten von Bewertungsvermittlern und Rezensenten herstellen. Vergleichbare Filter werden bereits genutzt, um beispielsweise Schimpfwörter zu entdecken.

Ferner sieht es das BKartA als erfolgversprechend an, wenn die Portale die Darstellung von Produkttests nicht weiter zu unterbinden versuchen, sondern den Verbrauchern die Möglichkeit geben, die durchaus wertvollen Produktbewertungen zu lesen – verbunden mit dem Hinweis auf deren Aussagekraft.  

Verstärkte Überwachung auch zur Erkennung manipulierter Bewertungen

Ökonomisch schädlich und rechtswidrig sind auch manipulierte Bewertungen, die zustande kommen, wenn etwa unseriöse Bewertungsvermittler dem Produkttester den Inhalt der Bewertung vorgeben, beispielsweise mit einer sogenannten 5-Sterne-Garantie, und damit die tatsächliche Erfahrung vertuschen.

Die Untersuchung des BKartA legt nahe, dass die Nachfrage nach manipulierten Bewertungen unverändert hoch ist und in den letzten Monaten sogar zugenommen hat. Dabei werden inoffizielle Wege in sozialen Medien genutzt, die nur schwer nachzuverfolgen sind, unter anderem über WhatsApp Gruppen. Wie auch bei verdeckten Produkttests setzt das BKartA hier auf eine verstärkte Überwachung durch die Portalbetreiber und auf Warnhinweise, die auf mögliche Manipulationen im Rahmen der Produktanzeige hinweisen. 

Vorabprüfung nicht-authentischer Bewertungen

Bei der Bewertung von Dienstleistungen von Restaurants, Hotels oder Ärzten scheinen nicht-authentische Bewertungen problematisch, die den Verbraucher dadurch in die Irre führen, dass die Bewertung von einer Person abgegeben wird, die die Dienstleistung gar nicht in Anspruch genommen hat. Mitunter werden dazu auch Computerprogramme, sogenannte Bots, eingesetzt.

Welches Ausmaß nicht-authentische Bewertungen annehmen, hängt unter anderem davon ab, ob die Portale ein „offenes“ oder „geschlossenes“ System betreiben. Die Mehrheit der befragten Portale betreibt ein offenes System, bei dem für die Abgabe einer Bewertung gar keine oder nur eine leicht zu überwindende Hürde wie die E-Mail-Registrierung zu nehmen ist.

In geschlossenen Systeme dagegen sind Bewertungen beispielsweise von einer Transaktion abhängig, wie etwa der Buchung eines Hotelzimmers. Geschlossene System haben den Vorteil, dass sie nicht-authentische Bewertungen vermeiden. Sie sind aber gegebenenfalls weniger repräsentativ, da nicht so viele Bewertungen generiert werden wie bei offenen Systemen.

In diesem Zusammenhang hält es das BKartA für erforderlich, dass Portale, die in einer fälschungsanfälligen Branche mit einem offenen Bewertungssystem operieren, standardisierte Filtermaßnahmen zur Überprüfung der Authentizität von Bewertungen einsetzen.

Änderungen der Filterprozesse

Die Sektoruntersuchung hat gezeigt, dass die von den Portalen eingesetzten manuellen oder automatisierten Filterprozesse, die genutzt werden, um beispielsweise Schimpfworte oder versteckte Werbung zu entdecken, stark variieren. Den Verbrauchern werden – über alle befragten Portale hinweg – im Ergebnis circa sieben Prozent der abgegebenen Bewertungen nicht angezeigt.

Dass davon überproportional viele negative Bewertungen betroffen sind, liegt zum Teil am Bewertungssystem selbst, etwa wenn es leicht ist, eine positive Bewertung abzugeben oder nur schlechte Bewertungen einer manuellen Prüfung unterzogen werden, positive aber nicht.

Im Ergebnis trägt auch das sogenannte Notice-and-take-down-Verfahren zur Verzerrung der Ergebnisse bei. Dieses Verfahren bietet die Möglichkeit, Bewertungen nachträglich – vor allem auf ihre Echtheit – überprüfen zu lassen. Freilich, wird dies eher von Händlern oder Unternehmen in Anspruch genommen, wenn diese negativ bewertet wurden. Zu Verzerrungen kommt es, weil die Verfasser oftmals den Aufwand scheuen, ihre Bewertung bei dieser nachträglichen Überprüfung zu verteidigen. Damit erleichtern sie dem Portal die Entfernung der negativen Bewertung.

All das führt dazu, dass die angezeigte durchschnittliche Kundenmeinung zu positiv und damit irreführend dargestellt wird. Solche Verzerrungen können nach Ansicht des BKartA nur dadurch abgestellt werden, dass strukturelle Elemente entfernt werden, die zur Verzerrung führen. So könnte etwa die Authentizität der Bewertung nicht erst im nachtäglichen Verfahren, sondern schon bei Abgabe der Bewertung überprüft werden. Gekennzeichnet werden könnte auch, wie viele Bewertungen dem Nutzer nicht angezeigt werden, weil sie noch überprüft werden.