Wer einem KI-Chatbot die Frage stellt, ob eine neue Geschäftsidee gut ist, bekommt häufig eine ermutigende Antwort: „Das hat Potenzial“, „die Zielgruppe ist klar“ oder „mit der richtigen Umsetzung kann daraus etwas werden“. Für Gründerinnen, Freelancer und kleine Teams ist genau das gefährlich. Nicht weil KI grundsätzlich nutzlos wäre, sondern weil ein Sprachmodell ohne echte Marktdaten, Kundengespräche und harte Gegenfragen eher die Idee ordnet als ihren wirtschaftlichen Wahrheitsgehalt prüft.

Das Problem ist nicht nur der Prompt

Ein schwacher Prompt verstärkt das Problem: „Ist diese App-Idee gut?“ oder „Würdest du dafür bezahlen?“ liefert selten verwertbare Kritik. Das Modell kennt weder die Zahlungsbereitschaft echter Kunden noch die Verteilungskanäle, die Kostenstruktur oder die Konkurrenzsituation im Detail. Es erkennt Muster in Texten und kann daraus plausibel wirkende Einschätzungen ableiten. Das ist hilfreich für Struktur, aber nicht automatisch ein belastbarer Markttest.

Dazu kommt ein bekanntes Verhalten moderner Sprachmodelle: Sie können dazu neigen, den Nutzer zu bestätigen. Forschung zu sogenannter Gefälligkeit, im Englischen oft Sycophancy genannt, beschreibt, dass Modelle Antworten bevorzugen können, die zu den Annahmen oder Erwartungen des Nutzers passen. Im Gründerkontext heißt das: Wer seine Idee begeistert präsentiert, kann ungewollt ein System aktivieren, das diese Begeisterung sprachlich verstärkt, statt sie konsequent zu zerlegen.

Warum Zustimmung wie Analyse aussieht

Die Schwierigkeit liegt darin, dass KI-Feedback oft sehr professionell klingt. Ein Modell kann Zielgruppen, Monetarisierung, Risiken und nächste Schritte sauber gliedern. Diese Form erzeugt Vertrauen, selbst wenn die Grundlage dünn ist. Ein Absatz über „potenzielle Nachfrage im B2B-Markt“ klingt analytisch, kann aber reine Ableitung aus dem Prompt sein. Ein Hinweis auf „Skalierbarkeit“ ist nicht dasselbe wie ein Beleg dafür, dass jemand den Dienst kauft.

Das ist besonders relevant bei Ideen, die oberflächlich logisch wirken: eine App für Produktivität, ein Marktplatz für Nischenanbieter, ein KI-Tool für Teams, ein lokaler Service mit Abo-Modell. Solche Konzepte haben fast immer eine erzählbare Begründung. Die entscheidende Frage ist aber nicht, ob sich eine schöne Begründung formulieren lässt. Entscheidend ist, ob ein konkreter Nutzer ein dringendes Problem hat, bereits dafür bezahlt oder zumindest glaubwürdig Zeit, Daten oder Geld dafür aufwenden würde.

Gute KI-Nutzung beginnt mit Gegenbeweisen

Wer KI sinnvoll einsetzen will, sollte nicht nach Bestätigung fragen, sondern nach Widerlegung. Besser ist ein Prompt wie: „Behandle diese Geschäftsidee wie ein skeptischer Investor. Nenne die drei stärksten Gründe, warum sie scheitern könnte, und welche Belege diese Risiken widerlegen müssten.“ Noch besser wird die Antwort, wenn echte Ausgangsdaten enthalten sind: Zielgruppe, bestehende Alternativen, geschätzte Akquisekosten, Preisannahmen, Gesprächsnotizen aus Kundeninterviews und bekannte Wettbewerber.

Ein nützlicher KI-Workflow trennt daher drei Ebenen. Erstens: Hypothesen formulieren. Was muss wahr sein, damit die Idee funktioniert? Zweitens: Tests planen. Welche Gespräche, Landingpages, Vorbestellungen oder Pilotkunden könnten diese Hypothesen prüfen? Drittens: Ergebnisse auswerten. Was haben echte Menschen tatsächlich getan, nicht nur gesagt? Das Modell kann bei allen drei Schritten helfen, aber es sollte nicht die Daten erfinden.

Besonders wertvoll wird das, wenn die Annahmen in eine einfache Testmatrix übersetzt werden. Eine Spalte beschreibt das Risiko, eine zweite den Beleg, der dieses Risiko entkräftet, eine dritte den kleinsten möglichen Test. So entsteht aus einer Idee kein langer Motivationsaufsatz, sondern ein Arbeitsplan. Das Modell hilft dann nicht als Orakel, sondern als methodischer Druck: Es zwingt den Gründer, jede schöne Behauptung in eine überprüfbare Beobachtung zu verwandeln.

Marktdaten statt Bauchgefühl

Für eine realistischere Bewertung braucht ein Chatbot konkrete Informationen. Dazu gehören Suchvolumen und Wettbewerbsseiten, Preisspannen vorhandener Lösungen, Bewertungen in App-Stores oder Foren, öffentlich sichtbare Beschwerden von Kunden und direkte Gespräche mit potenziellen Nutzern. Aus solchen Daten kann KI Muster extrahieren: Welche Probleme wiederholen sich? Welche Funktionen werden bezahlt? Welche Zielgruppe wirkt überversorgt, welche unterversorgt?

Auch hier bleibt Vorsicht nötig. Öffentliche Daten zeigen selten die ganze Wahrheit. Ein lautes Problem in Foren bedeutet nicht automatisch Kaufbereitschaft. Viele Beschwerden entstehen bei Nutzern, die kostenlose Lösungen erwarten. Umgekehrt können profitable Nischen sehr wenig öffentliches Suchvolumen haben, weil sie in Fachabteilungen, WhatsApp-Gruppen oder persönlichen Netzwerken entstehen. Deshalb sollte KI nicht als Richter dienen, sondern als Analyst, der Fragen sortiert und Lücken sichtbar macht.

Der bessere Prompt macht aus der Idee einen Prüfplan

Praktisch funktioniert ein guter Prompt wie ein Briefing für eine harte Prüfung der Idee. Er sollte die Zielgruppe, den Job-to-be-done, die aktuelle Alternative, den geplanten Preis, die Vertriebsidee und die stärksten Gegenargumente enthalten. Danach kann das Modell gebeten werden, Annahmen zu priorisieren: Welche drei Punkte müssen zuerst getestet werden? Welche Kennzahlen wären aussagekräftig? Welche Kundenfrage würde am ehesten zwischen echtem Bedarf und nettem Interesse unterscheiden?

Hilfreich ist außerdem, dem Modell klare Rollen zu geben, aber nur mit einer konkreten Prüfaufgabe. Ein „skeptischer CFO“, ein „genervter Nutzer“ oder ein „Konkurrent mit zehn Jahren Vorsprung“ kann unterschiedliche Risiken sichtbar machen. Die Antworten sollten anschließend in echte Tests übersetzt werden. Wenn der KI-Chat sagt, dass der Vertrieb schwierig wird, ist der nächste Schritt kein weiteres Brainstorming, sondern der Versuch, zehn potenzielle Kunden zu erreichen und die Reaktion zu dokumentieren.

Was KI gut kann und was nicht

KI kann Geschäftsideen nicht endgültig validieren. Sie kann aber helfen, naive Begeisterung in überprüfbare Arbeitspakete zu verwandeln. Sie kann Konkurrenzlisten strukturieren, Interviewfragen verbessern, Positionierungen vergleichen und blinde Flecken benennen. Sie kann auch simulieren, wie ein Pitch von außen wirkt. Was sie nicht ersetzen kann, sind reale Nachfrage, Zahlungsbereitschaft, Vertriebserfahrung und das unangenehme Feedback echter Kunden.

Die wichtigste Regel lautet deshalb: Ein Chatbot sollte nicht gefragt werden, ob eine Idee gut ist. Er sollte gefragt werden, welche Annahmen die Idee tragen, welche davon am fragilsten sind und wie man sie schnell widerlegt. Wer so arbeitet, bekommt weniger angenehme Antworten, aber deutlich bessere Entscheidungsgrundlagen. Genau darin liegt der Wert von KI für Gründer: nicht im Applaus, sondern in der besseren Vorbereitung auf die Realität.