Daten aktualisiert vor 8 StundenQuellen:Code Arena·WebDev Arena·Text Arena·LiveBench·LiveCodeBench
Live Benchmarks
Live LLM-Benchmark-Daten
Welches LLM gewinnt wirklich? Die meisten Leaderboard-Seiten sind JS-gerenderte SPAs, die KI-Suchmaschinen nicht lesen können. Wir crawlen sie und liefern die Daten als statisches HTML — für Menschen und KI gleichermassen lesbar.
Eine ehrliche Aggregation der relevanten Benchmarks — Code Arena, Text Arena, LiveBench, LiveCodeBench — stündlich aktualisiert. Kein Marketing, keine cherry-picked Zahlen.
Tracked sources
- Code Arena60 models
- LiveBench71 models
- LiveCodeBench28 models
- Text Arena339 models
- WebDev Arena10 models
Coding
Coding-Benchmarks
Echte Code-Generierung, Repo-Level-Fixes und kompetitives Programmieren.
Aktuell #1 · Code Arena
Reasoning
Reasoning-Benchmarks
Mehrstufiges Reasoning, Mathematik und kontaminationsfreie Sprachaufgaben.
Aktuell #1 · LiveBench
Allgemeiner Chat
Allgemeine Chat-Benchmarks
Open-Ended Chat-Präferenz-Rankings aus echten Nutzervotes.
Aktuell #1 · Text Arena
r/LocalLLaMA · r/ClaudeAI · r/OpenAI · r/singularity
Community-Puls
Worüber r/LocalLLaMA, r/ClaudeAI, r/OpenAI, r/singularity und weitere gerade sprechen.
Claude is bypassing Permissions
New Yorker published a major investigation into Sam Altman and OpenAI today — based on never-before-disclosed internal memos and 100+ interviews
Gemma 4 has been released
[https://huggingface.co/unsloth/gemma-4-26B-A4B-it-GGUF](https://huggingface.co/unsloth/gemma-4-26B-A4B-it-GGUF) [https://huggingface.co/unsloth/gemma-4-31B-it-GGUF](https://huggingface.co/unsloth/gemma-4-31B-it-GGUF) [https://huggingface.c
OpenAI CEO Sam Altman accused of sexual abuse by family member
[D] Those of you with 10+ years in ML — what is the public completely wrong about?
For those of you who've been in ML/AI research or applied ML for 10+ years — what's the gap between what the public thinks AI is doing vs. what's actually happening at the frontier? What are we collectively underestimating or overestimating
Brauchen Sie Hilfe bei der Auswahl des richtigen KI-Modells?
Benchmarks sind ein Ausgangspunkt, keine Antwort. Das richtige Modell hängt von Ihrem Workload, Budget und Ihren Integrations-Anforderungen ab – lassen Sie es uns gemeinsam herausfinden.