AI-nieuws 24 april 2026

Modelrelease ↑ 622

OpenAI lanceert GPT-5.5 met nieuwe benchmarkresultaten

negatief

OpenAI heeft GPT-5.5 officieel uitgebracht, een volledig hertraind agentic model dat 82,7% scoort op Terminal-Bench 2.0 en 58,6% op SWE-Bench Pro. Op SWE-Bench Pro presteert Claude Opus 4.7 met 64,3% beter. OpenAI plaatste in de officiële documentatie een asterisk bij benchmarkcijfers van Anthropic, met een claim over mogelijke memorization.

GPT-5.5OpenAIGPT-5.5 ProOpenRouterClaude-Opus-4.7

Officiële bronnenIntroducing GPT-5.5 | OpenAI OpenAI's GPT-5.5 masters agentic coding with 82.7% benchmark score r/singularity: GPT-5.5 benchmark results have been releasedRedditGPT-5.5 benchmark results have been released GPT-5.5 AND GPT-5.5 PRO HAVE BEEN SPOTTED ON OPENROUTER!GPT 5.5 is coming GPT 5.5 beats Claude Opus 4.7

Modelrelease ↑ 934

DeepSeek brengt V4-preview uit met twee MoE-modellen

positief

DeepSeek heeft een previewversie van DeepSeek V4 uitgebracht, beschikbaar via web, app en API en gepubliceerd op HuggingFace. De release omvat twee Mixture-of-Experts-modellen: V4-Pro met 1,6 biljoen parameters (49 miljard geactiveerd) en V4-Flash met 284 miljard parameters (13 miljard geactiveerd). Beide modellen ondersteunen een contextvenster van één miljoen tokens.

DeepSeek V4HuggingFace

Officiële bronnenDeepSeek Official DeepSeek-V4-Pro · Hugging Face China's DeepSeek releases preview of long-awaited V4 modelRedditDeepSeek V4 has released Deepseek V4 Flash and Non-Flash Out on HuggingFace

Dev-tool ↑ 2.278

Anthropic erkent drie bugs achter maanden van Claude-degradatie

gemengd

Anthropic publiceerde een postmortem waarin drie opeengestapelde bugs worden erkend die Claude Code, de Agent SDK en Claude Cowork maandenlang deden ondermaats presteren. De bugs betroffen een stille verlaging van reasoning-inspanning, een caching-fout die redeneergeschiedenis verwijderde en een onvolledige systeemprompt. Alle drie zijn opgelost per versie 2.1.116, en gebruikslimieten zijn gereset voor alle abonnees.

AnthropicClaudeClaude CodeAgent SDKCowork

Officiële bronnenAn update on recent Claude Code quality reports Mystery solved: Anthropic reveals changes to Claude's harnesses Post-mortem on recent Claude Code quality issuesRedditAnthropic just published a postmortem explaining exactly why Claude felt dumber for the past month Post-mortem on recent Claude Code quality issues

Dev-tool ↑ 283

DeepSeek open-sourct DeepEP V2 en TileKernels

positief

DeepSeek heeft twee open-source infrastructuurtools uitgebracht: DeepEP V2, een communicatiebibliotheek voor Mixture-of-Experts en expert parallelism met high-throughput GPU-kernels, en TileKernels, een kernelbibliotheek geschreven in tilelang. Beide tools richten zich op systeemknelpunten bij het trainen en serveren van grote AI-modellen. De code is beschikbaar via GitHub.

DeepSeekDeepEP V2TileKernels

Officiële bronnenGitHub - deepseek-ai/DeepEP GitHub - deepseek-ai/TileKernels DeepSeek releases infrastructure tools — Startup FortuneRedditDeepseek has released DeepEP V2 and TileKernels.

Dev-tool ↑ 272

Qwen3.6-27B draait op 85 TPS op één RTX 3090

positief

Een gepubliceerde inferentiestack laat zien dat Qwen3.6-27B op een enkele RTX 3090 met 24GB VRAM 85 TPS sustained en 106 TPS piek haalt via vLLM. Het model vereist 16,8GB VRAM in Q4-kwantisatie en ondersteunt een contextvenster van 125.000 tokens inclusief visuele mogelijkheden. Prestaties variëren sterk per configuratie: gebruikers rapporteren resultaten tussen de 40 en 207 tokens per seconde.

Qwen3.6-27BRTX 3090

Officiële bronnenQwen/Qwen3.6-27B · Hugging Face An Overnight Stack for Qwen3.6–27B: 85 TPS, 125K Context, Vision — on One RTX 3090 Qwen3.6-27B VRAM Requirements — Dense 27B That Beats 397B-A17BRedditAn Overnight Stack for Qwen3.6–27B: 85 TPS, 125K Context, Vision — on One RTX 3090 | by Wasif Basharat | Apr, 2026

Beleid ↑ 356

White House kwalificeert Chinese AI-distillatie als veiligheidsdreiging

negatief

Het White House Office of Science and Technology Policy publiceerde op 23 april een memo waarin China wordt beschuldigd van grootschalige campagnes om Amerikaanse frontier-AI-systemen te distilleren via proxyaccounts en jailbreaktechnieken. Federale agentschappen worden opgedragen R&D-programma's kritisch voor nationale veiligheid te beschermen tegen diefstal en exploitatie door strategische concurrenten. De Trump-administratie positioneert model theft als een kwestie van nationale veiligheid en economische concurrentiekracht.

Office of Science and Technology Policy

Officiële bronnenWhite House accuses China of 'deliberate, industrial-scale campaigns' to steal US AI models White House Accuses China-Based Actors of Stealing U.S. AI Capabilities White House Pivots Federal R&D StrategyRedditUS gov memo on “adversarial distillation” - are we heading toward tighter controls on open models?