4. März 2026

Launch, und warum ich Sisyphos jetzt persönlich kenne

quergelesen ist live. Und das Clustering-Finetuning ist die unendlichste Aufgabe, die ich je angefasst habe.

LaunchClusteringNLP

quergelesen ist live. Ohne Konfetti, aber et läuft.

Mich hat dat ewige Nachrichten-Chaos einfach genervt. Also hab ich als Pottkind mal die Ärmel hochgekrempelt und genau dat gebaut, wat ich selbst im Netz immer vergeblich gesucht hab.

Die Idee is simpel: Du gehst auf quergelesen.news, und statt 40 einzelne Artikel vor de Füße gekippt zu kriegen, siehste Themen. Fünf Zeitungen schreiben heute über denselben Vorfall, aber jede n bisken anders. Anderer Spin, andere Gewichtung, manche bringen’s auch gar nich. Genau dat will ich sichtbar machen. Dat is kein weiterer Aggregator, der dir nur stumpf Links hinwirft. Sondern der nackte Blick darauf: Wie behandelt die deutsche Medienlandschaft eigentlich gerade dieses eine Thema – und wer ignoriert et komplett.

Der Launch war leise. Kein riesen Fass aufgemacht, kein Producthunt-Gedöns. Dat Dingen is auf der Straße und macht seine Arbeit.

Wie das Clustering funktioniert – kurz und ohne Bullshit

Damit quergelesen überhaupt weiß, welche Artikel zusammengehören, muss ich Texte inhaltlich vergleichen können. Das nennt sich Clustering: Artikel die sich ähnlich sind, landen im selben Haufen.

Konkret: Jeder Artikel wird in so’n numerischen Vektor umgewandelt – stell dir’s vor wie 'ne Koordinate im Raum, die den Inhalt abbildet. Dann wird geschaut, wie nah diese Koordinate an anderen Artikeln liegt. Nah genug? Gleicher Cluster. Zu weit weg? Neuer Cluster.

Klingt nach 'nem gelösten Problem aus den 2010ern. Ist es irgendwie nicht.

Die Sisyphos-Aufgabe

Ich dreh seit Tagen an denselben Schrauben. Und jedes Mal wenn ich denk: okay, jetzt passt’s – rollt der Stein wieder runter.

Runde 1: Artikel über denselben Raketenangriff landen in drei verschiedenen Clustern, weil jede Quelle 'nen anderen Titel wählt. Schwellenwert hoch. Passt.

Runde 2: Jetzt landet alles was irgendwie nach Krieg, Militär oder Nahost riecht im selben Riesencluster. Bundeswehr-Haushalt. US-Sanktionen. Irgendein Kommentar über Teherans Innenpolitik. Alles zusammen, komplett unbrauchbar. Schwellenwert wieder runter.

Runde 3: Wir sind wieder in Runde 1. Hi.

Das ist kein Bug, aber auch kein Finetuning-Problem dem ich noch irgendwie beikommen werde. Irgendwann muss man akzeptieren dass’s keinen universellen Schwellenwert gibt und aufhören daran zu drehen. Ich dreh immer noch daran. Grad versuche ich das auf Codeebene zu lösen, andere Gewichtungen für Politik als für Wirtschaft, bessere Erkennung wenn sich Themen schneiden. Ob das reicht weiß ich ehrlich gesagt noch nicht.

Der Stein liegt unten. Ich geh ihn wieder holen.