OpenAI lanceert GPT-5.5 met nieuwe benchmarkresultaten
OpenAI heeft GPT-5.5 officieel uitgebracht, een volledig hertraind agentic model dat 82,7% scoort op Terminal-Bench 2.0 en 58,6% op SWE-Bench Pro. Op SWE-Bench Pro presteert Claude Opus 4.7 met 64,3% beter. OpenAI plaatste in de officiële documentatie een asterisk bij benchmarkcijfers van Anthropic, met een claim over mogelijke memorization.
DeepSeek brengt V4-preview uit met twee MoE-modellen
DeepSeek heeft een previewversie van DeepSeek V4 uitgebracht, beschikbaar via web, app en API en gepubliceerd op HuggingFace. De release omvat twee Mixture-of-Experts-modellen: V4-Pro met 1,6 biljoen parameters (49 miljard geactiveerd) en V4-Flash met 284 miljard parameters (13 miljard geactiveerd). Beide modellen ondersteunen een contextvenster van één miljoen tokens.
Anthropic erkent drie bugs achter maanden van Claude-degradatie
Anthropic publiceerde een postmortem waarin drie opeengestapelde bugs worden erkend die Claude Code, de Agent SDK en Claude Cowork maandenlang deden ondermaats presteren. De bugs betroffen een stille verlaging van reasoning-inspanning, een caching-fout die redeneergeschiedenis verwijderde en een onvolledige systeemprompt. Alle drie zijn opgelost per versie 2.1.116, en gebruikslimieten zijn gereset voor alle abonnees.
DeepSeek open-sourct DeepEP V2 en TileKernels
DeepSeek heeft twee open-source infrastructuurtools uitgebracht: DeepEP V2, een communicatiebibliotheek voor Mixture-of-Experts en expert parallelism met high-throughput GPU-kernels, en TileKernels, een kernelbibliotheek geschreven in tilelang. Beide tools richten zich op systeemknelpunten bij het trainen en serveren van grote AI-modellen. De code is beschikbaar via GitHub.
Qwen3.6-27B draait op 85 TPS op één RTX 3090
Een gepubliceerde inferentiestack laat zien dat Qwen3.6-27B op een enkele RTX 3090 met 24GB VRAM 85 TPS sustained en 106 TPS piek haalt via vLLM. Het model vereist 16,8GB VRAM in Q4-kwantisatie en ondersteunt een contextvenster van 125.000 tokens inclusief visuele mogelijkheden. Prestaties variëren sterk per configuratie: gebruikers rapporteren resultaten tussen de 40 en 207 tokens per seconde.
White House kwalificeert Chinese AI-distillatie als veiligheidsdreiging
Het White House Office of Science and Technology Policy publiceerde op 23 april een memo waarin China wordt beschuldigd van grootschalige campagnes om Amerikaanse frontier-AI-systemen te distilleren via proxyaccounts en jailbreaktechnieken. Federale agentschappen worden opgedragen R&D-programma's kritisch voor nationale veiligheid te beschermen tegen diefstal en exploitatie door strategische concurrenten. De Trump-administratie positioneert model theft als een kwestie van nationale veiligheid en economische concurrentiekracht.