Gebruikers melden prestatiedegradatie in Claude Code
AMD's senior director of AI publiceerde een gedetailleerde analyse op GitHub waarin zij degradatie in Claude Code beschrijft op basis van bijna 7.000 sessies. Volgens de analyse leest het model code minder vaak voor het bewerkt, herschrijft het vaker volledige bestanden en stopt het taken vaker halverwege. Tegelijkertijd lekte Anthropic per ongeluk broncode van Claude vrij, het tweede incident in een week; de officiële statuspage toont 99,57% uptime.
Anthropic verkortte stiekem cache-levensduur in API
Een analyse van Claude Code-sessiebestanden toont aan dat Anthropic de standaard prompt cache TTL begin maart stilletjes terugbracht naar vijf minuten, zonder dit te communiceren aan developers. De officiële API-documentatie vermeldt de vijf-minutenstandaard inmiddels als huidig beleid. Gebruikers rapporteren hogere API-kosten als gevolg van de verandering.
MiniMax M2.7 uitgebracht met beperkte commerciële licentie
MiniMax lanceerde het M2.7-model met open gewichten en een licentie die commercieel gebruik verbiedt zonder voorafgaande schriftelijke toestemming. Het model is een Mixture-of-Experts-architectuur met 229 miljard parameters en 11 miljard actieve parameters, en is beschikbaar via Hugging Face, Ollama en OpenRouter. Unsloth uploadde kwantisaties van Q1 tot BF16 naar Hugging Face, variërend van 60,7 GB tot 457 GB.
DFlash haalt 3,3x snelheidswinst op Apple Silicon
Een MLX-gebaseerde implementatie van DFlash speculative decoding behaalt op een M5 Max een snelheid van 85 tokens per seconde op Qwen3.5-9B, tegenover 26 tokens per seconde voor de standaard aanpak. De methode genereert via block diffusion meerdere concepttokens tegelijk, die vervolgens in één forward pass worden geverifieerd door het doelmodel. De community toont sterke interesse in integratie van de aanpak in llama.cpp voor breder gebruik.
Meta lanceert Contemplating-modus in Muse Spark
Meta introduceerde Muse Spark met een Contemplating-modus die meerdere AI-agents parallel inzet om complexe vragen te beantwoorden. Het model werkt ook in een snellere modus voor eenvoudige vragen en is mede ontwikkeld in samenwerking met duizend artsen voor betere gezondheidsantwoorden. Muse Spark is closed-source en concurreert direct met Google Gemini Deep Think en OpenAI.
Neuralink stelt ALS-patiënt in staat te communiceren
Neuralink demonstreerde een brain-computer interface waarmee een niet-verbale ALS-patiënt weer kan communiceren. De implementatie maakt gebruik van een neuraal implantaat in combinatie met AI-spraaksynthese. Het implantaat bevindt zich nog in de experimentele fase en heeft geen FDA-goedkeuring voor commercieel gebruik.
Alibaba verschuift focus van open-source naar omzet
Alibaba herziet zijn AI-strategie richting inkomstengenererende producten en enterprise-monetisatie, na het vertrek van meerdere sleutelmedewerkers van het Qwen-team inclusief de tech lead. Qwen is momenteel de meest gedownloade AI-modelfamilie ter wereld. Alibaba stelt officieel dat de open-source strategie wordt voortgezet, terwijl de R&D-investeringen worden opgeschaald.
Nederland keurt Tesla FSD Supervised goed als eerste in Europa
De Nederlandse RDW verleende als eerste Europese instantie officiële typegoedkeuring aan Tesla Full Self-Driving Supervised. Het systeem is geclassificeerd als Level 2-rijassistentie en vereist dat de bestuurder actief toezicht houdt; het systeem schakelt zichzelf tijdelijk uit bij onvoldoende aandacht. De prijs in Nederland is €99 per maand of €7.500 eenmalig, met een EU-specifieke softwareversie die afwijkt van de Amerikaanse variant.