DeepSeek-V3 发布新论文,揭示低成本大模型训练的奥秘 近日,DeepSeek 团队发布了关于其最新模型 DeepSeek-V3的一篇技术论文,重点讨论了在大规模人工智能模型训练中遇到的 “扩展挑战” 以及与硬件架构相关的思考。这篇长达14页的论文不仅总结了 DeepSeek 在开发 V3过程中的... 颜悦眉 2025-05-16 850 网络采编
DeepSeek回应“崩了”:部分功能已恢复正常 今日,DeepSeek突发状况引发网友广泛关注与热议,迅速成为网络焦点。大量网友反馈,在使用DeepSeek时遭遇严重问题。不少人表示,点进DeepSeek后页面疯狂转圈,根本无法正常使用。更让一些用户感到困扰的是,他们的历史记录莫名消... 帝释天 2025-05-13 699 网络采编
福布斯发布中国人工智能企业 TOP 50 榜单,阿里云与 DeepSeek 脱颖而出 2025年5月11日,福布斯发布了中国人工智能科技企业 TOP50评选名单,标志着中国在全球人工智能领域的持续崛起。随着技术爆发与场景落地的双重加速,中国的人工智能产业正在快速扩张... 可可 2025-05-13 947 AIbase基地
腾讯助力DeepSeek:网络通信性能大幅提升,AI训练更高效 近日,腾讯技术团队对 DeepSeek 开源的 DeepEP 通信框架进行了深度优化,显著提升了其在多种网络环境下的性能。经过测试,优化后的通信框架在 RoCE 网络环境下的性能提升达到了惊人的100%,而在 IB 网络环境中则提升了30%... 可可 2025-05-08 429 AIbase基地