
DiffusionGemma基于Gemma 4架构,总参数25.2亿,推理时仅激活3.8亿参数,支持256K上下文长度,并针对NVIDIA硬件深度优化。。
与传统自回归模型逐个生成token不同,它采用文本扩散架构,每步可并行去噪256个tokens,在NVIDIA GPU上速度提升约4倍。
该模型采用Apache 2.0许可证开源,支持文本与图像多模态输入,星空SPORTS支持完全运行于本地RTX或DGX平台,无需联网、无需按token付费。
对于Windows开发者,RTX 5090用户可立即下载体验;专业级用户则可选用RTX PRO 6000工作站或DGX Station完成大规模部署和微调任务。