(北京综合讯)中国人工智能(AI)企业深度求索(DeepSeek)的新模型引发关注后,中国官媒《经济日报》发文指出,大模型创新不一定要依赖最先进的硬件,“瘦身”反而促进AI技术的创新和突破。
深度求索1月20日发布的推理模型DeepSeek-R1,在测试表现、训练成本和开源开放程度等多个基准测试中均超越美国OpenAI公司的最新模型o1,但成本仅为o1的三十分之一。
《经济日报》星期天(1月26日)发布评论指出,DeepSeek-R1的成功说明,大模型创新不一定要依赖最先进的硬件,而是可以通过聪明的工程设计和高效的训练方法实现,“模型并非越大越好,而是越精越妙,大模型‘瘦身’促进了AI技术的创新和突破。”
但评论也提到,如何在保证模型性能的前提下实现最大程度“瘦身”,是当前需要解决的关键问题。“瘦身”后的模型如何在不同场景下保证适应性和稳定性,也需要进一步验证和优化。
不少西方舆论对DeepSeek-R1给予正面评价。英国《金融时报》评论指,美国和其盟友通过出口管制限制中国获取先进晶片,却激发了中国的创新能力。
澎湃新闻引述清华大学计算机系长聘副教授刘知远说法称,DeepSeek出圈说明了中国的竞争优势所在,即通过有限资源的极致高效利用,实现以少胜多。
刘知远也提醒,需要警惕舆论从极度悲观转向极度乐观,“在别人已经探索出的路上跟随快跑还是相对容易的,接下来如何在迷雾中开拓新路,才是更大的挑战。”
您查看的内容可能不完整,部分内容和推荐被拦截!请对本站关闭广告拦截和阅读模式,或使用自带浏览器后恢复正常。