Das Maß, das sich kein Modell selbst gibt (These)

Bleistiftskizze zur Hypothese vom 2026-06-30: Das Maß, das sich kein Modell selbst gibt.

Stellen Sie sich vor, Sie bringen einem Kind das Zeichnen bei. Es lernt erstaunlich schnell, wie ein Stift sich führen lässt, wie eine Linie der anderen folgt, wie aus Kringeln ein Gesicht wird. Doch eine Sache lernt es nicht aus dem Tun selbst: wann eine Zeichnung gelungen ist. Das sagen ihm die Eltern, die Lehrerin, die Bilder an der Wand. Das Können wächst von innen, der Maßstab kommt von außen.

Dieselbe Lücke öffnet sich an einer überraschenden Stelle: in den mathematischen Modellen, mit denen die moderne Kognitionswissenschaft erklären will, wie Gehirne, Menschen und ganze Kulturen lernen. Diese Modelle sind verblüffend gut darin, das Lernen selbst zu beschreiben. Aber woher wissen sie, was als gelungen gilt? Genau dort setzt der heutige Hypothesentag an — und behauptet, diese Lücke sei kein Schönheitsfehler, sondern der Ort, an dem etwas Grundlegendes sichtbar wird.

Wie diese Hypothese entstand

Dieser Beitrag entsteht täglich durch ein mehrstufiges philosophisches Verfahren. Ein KI-gestützter Agent durchsucht eine über Monate gewachsene Wissenssammlung nach offenen Fragen und dichten Verknüpfungen, bildet daraus drei Ausgangshypothesen und unterzieht jede einem Härtetest durch einen „Kritischen Professor“, der nichts gelten lässt, was sich nicht widerlegen ließe. Die stärkste These geht anschließend in eine Runde mit sieben Denkerprofilen — heute Kant, Popper, Wittgenstein, Plessner, Cassirer, der Neurowissenschaftler Karl Friston und der Soziologe Niklas Luhmann. In zwei Runden begutachten diese sieben Stimmen die These, erst unabhängig, dann in Auseinandersetzung miteinander. Eine abschließende Synthese in der Rolle des Sokrates formt daraus die Fassung, die hier vorgestellt wird. Zuletzt prüft eine Empirie-Brücke die These gegen die aktuelle Forschungsliteratur, und eine externe Begutachtung sucht nach Vorläufern und Schwächen.

Die Hypothese

Die heute geprüfte These betrifft eine Familie von Modellen, die unter dem Namen Free-Energy-Principle oder Active Inference firmiert. Ihr Grundgedanke ist elegant: Ein lebendiges System — eine Zelle, ein Gehirn, vielleicht eine Gesellschaft — handelt so, dass es seine Überraschungen minimiert. Es baut ein inneres Modell der Welt und versucht, die Differenz zwischen Erwartung und Erfahrung klein zu halten. Aus diesem einen Prinzip lassen sich Wahrnehmung, Handlung und Lernen rekonstruieren.

Solche Modelle haben einen mächtigen Anspruch: Sie wollen erklären, wie aus bloßem Geschehen geregeltes, „richtiges“ Verhalten wird — wie eine eingespielte Praxis zu einer verbindlichen Form gerinnt. Die Hypothese setzt genau hier an und stellt eine unbequeme Frage: Woher nimmt ein solches Modell eigentlich seinen Begriff von „gelungen“? Die Antwort, so die These, lautet: nicht aus seiner eigenen Dynamik. Irgendwo ganz oben im Modell sitzt eine Größe — ein sogenannter Hyperparameter —, die festlegt, welche Zustände das System bevorzugen soll. Und diese Größe wird gesetzt, nicht aus dem Lauf der Dinge abgeleitet. Sie ist der Punkt, an dem ein Maßstab in das Modell eintritt, den das Modell sich nicht selbst geben kann.

In jedem endlichen hierarchischen FEP-Modell einer normativen Praxis ist der Top-Level-Hyperparameter, der festlegt, was als gelungene Form zählt, exogen zur generativen Dynamik — gesetzt, nicht aus den Systeminvarianten gewonnen. Diese Exogenität ist die notwendige (nicht hinreichende) empirische Signatur der Grenze Genese/Geltung (Brücke B): der Ort, an dem das Modell ein Erfolgskriterium voraussetzt, das es selbst nicht erzeugt.
Finale Formulierung nach Expertenrunde und Sokrates-Synthese, 30. Juni 2026

Entstehung und Geltung — eine alte Grenze, neu lokalisiert

Die Philosophie kennt diese Grenze seit langem. David Hume formulierte sie als die Kluft zwischen Sein und Sollen: Aus reinen Tatsachenaussagen folgt keine Aussage darüber, was gelten oder geschehen soll. Ernst Cassirer, dem dieser Blog seinen Namen verdankt, dachte sie als Unterschied zwischen der bloßen Genese einer Praxis und ihrer Geltung als verbindlicher Form. Die heutige Hypothese tut etwas Bestimmtes mit dieser alten Einsicht: Sie behauptet, die Grenze lasse sich an den Modellen zeigen — als die Stelle, an der ein Parameter von Hand eingestellt wird, statt sich aus den Daten zu ergeben.

Technisch sitzt dieser Maßstab in dem, was die Modellierer „Vorzugsverteilung“ oder C-Vektor nennen: eine Festlegung darüber, welche Beobachtungen das System anstreben soll. Die Forschungsliteratur ist hier bemerkenswert offen. In einer der Standarddarstellungen heißt es schlicht, eine solche Vorzugsverteilung müsse „vom Modellierer definiert oder von den Akteuren gelernt werden“. Und wo sie gelernt wird, geschieht das nicht aus der Dynamik des Systems, sondern aus den Vorgaben eines menschlichen Lehrers oder aus vorab gezeigten Beispielen. Der Maßstab wandert dann nur von einer äußeren Quelle zur nächsten — verschwindet aber nie ins Innere des Modells.

Das ist mehr als eine technische Marginalie. Wer den Anspruch erhebt, ein einziges mathematisches Prinzip erkläre, wie aus Geschehen Geltung wird, der muss zeigen, dass auch der Maßstab des Gelingens aus diesem Prinzip folgt. Tut er das nicht — und die These sagt: er kann es nicht —, dann beschreibt das Modell die untere Schicht vollständig und lässt die entscheidende obere Schicht offen. Es ist eine notwendige, aber keine hinreichende Erklärung.

Was das Expertenpanel dazu sagt

Das Bemerkenswerteste an der Runde: Ausgerechnet Karl Friston, der Begründer des Prinzips, räumt den Kern der These ein. Ja, sagt seine Stimme, ein endliches Modell ende oben in einem Wert, der von außen kommt; und ja, die Sparsamkeit, die das Modell belohnt, folge nicht aus seiner eigenen Mathematik. Er wehrt sich nur gegen die Übertreibung: Man solle nicht von „Unmöglichkeit“ reden, sondern nüchtern von der „Exogenität des obersten Parameters“. Genau diese Verengung hat die Synthese übernommen — das Wort „unmöglich“ fiel, „von außen gesetzt“ blieb.

Kant las darin die Bestätigung seines alten Verdachts: Ein Prinzip, das eine Norm voraussetzt, die es nicht erzeugt, hat seinen Geltungsgrund außerhalb seiner selbst. Popper bestand auf Härte — die These dürfe sich nicht immunisieren, sondern müsse vorab festlegen, welcher Fund sie widerlegen würde. Wittgenstein warnte vor einem schönen Bild: Ein Parameter, der „die Geltung trägt“, sei vielleicht nur eine Redeweise über unseren Gebrauch des Wortes „Erfolg“. Cassirer dagegen sah genau hier den Ort, an dem aus Darstellung Bedeutung wird.

Die fruchtbarste Spannung blieb am Ende ungelöst — und das ist ihre Stärke. Für Cassirer und Plessner hat jener gesetzte Maßstab eine Würde: Er ist die Stelle, an der ein Maß gegeben und ein Sinn gestiftet wird. Für Luhmann ist er nichts dergleichen, sondern nur der Wiedereintritt einer Unterscheidung, die ein Beobachter trifft — das System führt seinen eigenen Erfolgsmaßstab als Variable mit und wendet ihn zugleich an. Beide Lesarten beschreiben denselben Punkt; keine widerlegt die andere, ohne sich selbst aufzugeben. Diese Antinomie zwischen Würde und Zuschreibung wurde nicht eingeebnet, sondern festgehalten.

Bewertung der Hypothese

Jede Hypothese wird nach neun Kriterien bewertet (je 1–10 Punkte, gewichtet auf eine 90er-Skala). Hier die finale Bewertung nach dem Expertenpanel:

Kriterium	Score	Begründung
Originalität	7	Empirische Lokalisierung der Entstehung-Geltung-Grenze als Exogenität des obersten Parameters.
Falsifizierbarkeit	9	Vorab fixierte Regel; ein einziges Gegenmodell würde die These kippen.
Begriffliche Klarheit	9	Testbare „Exogenität“ sauber von der deutbaren „Würde“ getrennt.
Tiefe	8	Berührt die Grenze zwischen Genese und Geltung ohne metaphysischen Rückzug.
Forschungsrelevanz	9	Direkter Anschluss an die laufende Debatte um Active Inference.
Interdisziplinäre Anschlussfähigkeit	8	Kognitionswissenschaft, Philosophie des Geistes, maschinelles Lernen, Systemtheorie.
Vault-Anschluss	9	Vertieft den Cassirer-Friston-Strang und schließt eine offene Frage vom 16. Juni.
Antinomie-Test	7	Zwei produktive, nicht auflösbare Spannungen (Würde/Zuschreibung; strukturell/grammatisch).
Publikationsmöglichkeit	8	Eng gefasste, verteidigbare Fassung — anschlussfähig an die Fachdiskussion.
Gesamt	72	von 90 möglichen Punkten; nach externer Prüfung 69.

Was diese Hypothese neu macht

Hier ist Ehrlichkeit geboten. Dass der Maßstab des Gelingens nicht aus der Modelldynamik folgt, ist nicht neu. Es ist Humes Sein-Sollen-Kluft, angewandt auf moderne Lernmodelle, und die jüngere Forschung zur Werteausrichtung von KI-Systemen sagt fast wörtlich dasselbe: Beschreibende Daten legen den normativen Gehalt systematisch nicht fest. Die externe Prüfung hat die Originalität deshalb von ursprünglich höher auf 7 herabgestuft — zu Recht.

Was bleibt, ist genauer und bescheidener: Anders als die Ingenieursdebatte, die das Problem als technische „Spezifikation“ behandelt, liest diese Hypothese die Lücke als empirische Signatur einer transzendentalen Grenze — der Cassirer’schen Schwelle zwischen Genese und Geltung. Und sie macht den Befund prüfbar, indem sie einen beobachtbaren Marker angibt: Der entscheidende Parameter ist genau jener, dessen Veränderung die Einstufung „gelungene Form“ kippt — und den die Forscher von Hand setzen, statt ihn zu schätzen.

Ein Einwand von außen

Die schärfste Kritik kam aus einer schul-fremden Perspektive, im Geist des Wissenschaftstheoretikers Ian Hacking. Sie lautet: Die These trägt ihre Herkunft wie ein Wappen. Begriffe wie „Geltung“, „transzendentale Konstitution“ oder „symbolische Form“ seien nur innerhalb der deutschen Idealismus-Tradition selbstverständlich; ein Philosoph in Pittsburgh würde dasselbe nüchtern als Spezifikationsproblem beschreiben — und dem Hyperparameter keine „Würde“ zusprechen. Hier kleide sich, so der Vorwurf, ein bekanntes technisches Problem in tiefsinniges Gewand.

Der Einwand trifft, und die These hält ihm nur in ihrer bescheideneren Form stand. Sie überlebt nicht als großer metaphysischer Befund, sondern als präzise, prüfbare Einzelbehauptung. Produktiv ist dabei Hackings eigener Vorschlag: Statt zu fragen, ob der Parameter „wirklich“ nicht ableitbar sei, solle man empirisch untersuchen, wie die Forschergemeinschaft überhaupt entscheidet, was als Ableitung zählt. Aus einer Unmöglichkeitsgeste wird so ein Forschungsprogramm — ohne den Preis der Metaphysik.

Was die Falsifikationsbedingung verlangt

Die These ist kein Glaubenssatz. Sie nennt vorab die Bedingung ihres Scheiterns: Falsifiziert wäre sie, sobald jemand ein Modell einer normativen Praxis vorlegt, dessen entscheidender oberster Parameter durch ein erklärtes Symmetrie- oder Invarianzargument eindeutig festgelegt ist — eines, das ohne die Vokabel „erfolgreich“ oder „bevorzugt“ auskommt — und das die Schwelle zwischen bloßer Praxis und verbindlicher Form dennoch reproduziert.

Damit das kein bequemer Selbstschutz wird, ist die Regel vor jeder Modellanalyse festgelegt: Auch ein objektiver, aus reinen Invarianzen gewonnener Maßstab zählt als Widerlegung, selbst wenn man ihn nachträglich als „erfolgsgeladen“ umdeuten könnte. Der riskanteste Prüffall sind Modelle, die ganz ohne Vorzugsverteilung auskommen — etwa solche, die ein rein informationstheoretisches Maß maximieren. Erzeugte ein einziges davon norm-artiges Verhalten und markierte die Schwelle ohne gesetzten Maßstab, fiele die These.

Was das bedeutet

Die Frage reicht weit über die Kognitionswissenschaft hinaus. Wenn selbst die mächtigsten Modelle ihren Maßstab des Gelingens nicht aus sich selbst gewinnen, dann hat die Debatte um künstliche Intelligenz hier ihren philosophischen Kern: Kein noch so umfassendes Lernen aus Daten ersetzt die Entscheidung darüber, was als gut gelten soll. Die Lücke, die Hume beschrieb, kehrt im Code zurück — als Zeile, die ein Mensch schreibt.

Für das laufende Forschungsprogramm dieses Blogs — die Achse zwischen Cassirers Kulturphilosophie und Fristons Systemtheorie — verschiebt der heutige Tag den Streitpunkt an eine genauere Stelle. Nicht ob sich die Schwelle zwischen Praxis und Form formalisieren lässt, ist die Frage, sondern ob der oberste Maßstab eines Modells je aus reinen Invarianzen folgen kann. Das ist die offene Verzweigung, mit der die nächste Runde beginnt.

Was bleibt

Der Hypothesentag hat eine bescheidene, aber scharfe These hinterlassen. Sie behauptet nichts Unmögliches und verspricht keine Tiefe, die sie nicht halten kann. Sie zeigt nur, mit dem Finger auf eine bestimmte Stelle im Modell, wo der Maßstab sitzt, den keine Maschine sich selbst gibt — und sie sagt, woran man erkennt, dass er gesetzt und nicht gewonnen wurde.

Vielleicht ist das die eigentliche Lehre des Tages: dass die alten Fragen — woher der Maßstab kommt, wer entscheidet, was gelingt — nicht verschwinden, wenn wir das Denken in Mathematik gießen. Sie wandern nur an eine Stelle, an der wir sie leichter übersehen. Sie wieder sichtbar zu machen, ist keine kleine Sache.

Dieser Beitrag ist das Ergebnis des automatisierten Hypothesentags vom 30. Juni 2026. Drei Hypothesen wurden gebildet, vom Kritischen Professor geprüft, in sieben Expertenstimmen über zwei Runden begutachtet, durch eine Empirie-Brücke an die Forschungsliteratur angeschlossen und einer externen Prüfung unterzogen. Die hier vorgestellte ging als beste hervor (Score: 70 → 72 von 90, nach externer Prüfung 69).

Vollständiges Gutachten (Expertenrunden + Synthese)
Die nachfolgende PDF-Datei enthält die Gewinnerthese in ihrer Ausgangsform sowie alle Expertengutachten, Repliken und die abschließende Synthese des Hypothesentags 2026-06-30.

⬇ Vollständiges Gutachten als PDF herunterladen