Vandaag.ai

dagelijks overzicht van AI-nieuws
Vrijdag 24 april stond in het teken van modelreleases: zowel OpenAI als DeepSeek brachten nieuwe modellen uit, terwijl Anthropic verantwoording aflegde over maanden van prestatieproblemen in Claude.
negatief

OpenAI heeft GPT-5.5 officieel uitgebracht, een volledig hertraind agentic model dat 82,7% scoort op Terminal-Bench 2.0 en 58,6% op SWE-Bench Pro. Op SWE-Bench Pro presteert Claude Opus 4.7 met 64,3% beter. OpenAI plaatste in de officiële documentatie een asterisk bij benchmarkcijfers van Anthropic, met een claim over mogelijke memorization.

GPT-5.5OpenAIGPT-5.5 ProOpenRouterClaude-Opus-4.7
positief

DeepSeek heeft een previewversie van DeepSeek V4 uitgebracht, beschikbaar via web, app en API en gepubliceerd op HuggingFace. De release omvat twee Mixture-of-Experts-modellen: V4-Pro met 1,6 biljoen parameters (49 miljard geactiveerd) en V4-Flash met 284 miljard parameters (13 miljard geactiveerd). Beide modellen ondersteunen een contextvenster van één miljoen tokens.

DeepSeek V4HuggingFace
gemengd

Anthropic publiceerde een postmortem waarin drie opeengestapelde bugs worden erkend die Claude Code, de Agent SDK en Claude Cowork maandenlang deden ondermaats presteren. De bugs betroffen een stille verlaging van reasoning-inspanning, een caching-fout die redeneergeschiedenis verwijderde en een onvolledige systeemprompt. Alle drie zijn opgelost per versie 2.1.116, en gebruikslimieten zijn gereset voor alle abonnees.

AnthropicClaudeClaude CodeAgent SDKCowork
positief

DeepSeek heeft twee open-source infrastructuurtools uitgebracht: DeepEP V2, een communicatiebibliotheek voor Mixture-of-Experts en expert parallelism met high-throughput GPU-kernels, en TileKernels, een kernelbibliotheek geschreven in tilelang. Beide tools richten zich op systeemknelpunten bij het trainen en serveren van grote AI-modellen. De code is beschikbaar via GitHub.

DeepSeekDeepEP V2TileKernels
positief

Een gepubliceerde inferentiestack laat zien dat Qwen3.6-27B op een enkele RTX 3090 met 24GB VRAM 85 TPS sustained en 106 TPS piek haalt via vLLM. Het model vereist 16,8GB VRAM in Q4-kwantisatie en ondersteunt een contextvenster van 125.000 tokens inclusief visuele mogelijkheden. Prestaties variëren sterk per configuratie: gebruikers rapporteren resultaten tussen de 40 en 207 tokens per seconde.

Qwen3.6-27BRTX 3090
negatief

Het White House Office of Science and Technology Policy publiceerde op 23 april een memo waarin China wordt beschuldigd van grootschalige campagnes om Amerikaanse frontier-AI-systemen te distilleren via proxyaccounts en jailbreaktechnieken. Federale agentschappen worden opgedragen R&D-programma's kritisch voor nationale veiligheid te beschermen tegen diefstal en exploitatie door strategische concurrenten. De Trump-administratie positioneert model theft als een kwestie van nationale veiligheid en economische concurrentiekracht.

Office of Science and Technology Policy