发布日期:2025-05-29 13:53:30 浏览次数:52
5月29日凌晨,国内领先人工智能研究公司深度求索(DeepSeek)开源了DeepSeek-R1最新0528版本,该模型在多项基准测试中表现优异,综合能力媲美OpenAI o3系列模型,为全球AI开发者社区提供更强大的开源选择。
DeepSeek-R1 基于深度求索自研的下一代架构优化,在语言理解、逻辑推理、代码生成等核心能力上均达到行业领先水平。在权威评测集(如 MMLU、GSM8K、HumanEval 等)中,R1 的综合表现接近 OpenAI 的 o3 模型,部分任务甚至实现超越。
此次开源的 R1 版本包含 340 亿参数,采用混合专家(MoE)架构,在保证高性能的同时大幅降低推理成本,使其更适用于企业级应用与学术研究。
DeepSeek-R1 以 Apache 2.0 协议 开源,允许商业用途,开发者可自由下载、微调并部署。深度求索同步发布了 预训练模型权重、推理代码及详细技术报告,确保研究社区能够充分利用该模型的强大能力。
深度求索 CEO 表示:“我们相信开源是推动 AI 技术进步的关键。DeepSeek-R1 的发布,不仅为开发者提供了媲美闭源商业模型的选择,也进一步降低了企业应用大模型的门槛。”
DeepSeek-R1 适用于多种场景,包括: