DeepSeek的“Aha一刻”开辟新思路，对AI巨头意味着什么？

栏目分类

你的位置：腾讯分分彩人工计划精确版 > 新闻动态 > DeepSeek的“Aha一刻”开辟新思路，对AI巨头意味着什么？

发布日期：2025-02-02 18:49 点击次数：82

中国人工智能初创公司 DeepSeek 引领的强化学习和小模型发展的技术创新震撼了全球市场，这一新思路可能引来大量初创公司的效仿，让"巨额现金储备能创造无可争议的优势"这一论点变得更为复杂。而这对于人工智能巨头意味着什么？

就在硅谷对 DeepSeek " Aha 一刻"（"顿悟一刻"）的热议声中，当地时间 1 月 29 日，Meta 和微软两家人工智能巨头公司公布了新一季度财报，两家公司的高管都在财报会上提及 DeepSeek。截至目前，Meta 并未削减与人工智能投入相关的支出，并计划今年向 AI 投入 600 亿至 650 亿美元。微软表示 AI 成本下降将是趋势，该公司还预计 2026 财年资本支出增长率将低于 2025 财年。

投资基础设施是一种"战略优势"

Meta 首席执行官马克 · 扎克伯格周三表示，现在判断 DeepSeek 的突破性 AI 模型将对 Meta 及更广泛的科技行业产生何种影响还为时过早。

扎克伯格还强调，对于大型企业而言，随着时间的推移，在资本支出和基础设施上进行大量投资将成为一种"战略优势"。"我敢打赌，构建这种基础设施的能力将是一个主要优势。"他说道。

"虽然公司最终可能需要更少的计算资源来训练这些强大的模型，但当软件在实际运行和执行操作时，拥有大量的服务器的能力可能是必要的，这将有助于实现更高水平的智能和更高质量的服务。"扎克伯格在与分析师讨论 DeepSeek 的最新进展时表示。

他进一步称，为所有人提供服务的成本会很高。以 Meta 为例，该公司第四季度日活用户数量超过 33.5 亿。

扎克伯格的表态与此前 OpenAI 的 CEO 奥尔特曼以及 Meta 首席 AI 科学家 Yann LeCun 的表态相呼应。奥尔特曼称，计算资源"现在比以往任何时候都更加重要"。LeCun 也表示："为数十亿人提供 AI 助理服务仍需要大量计算能力。"

DeepSeek 已经证明构建尖端 AI 模型所需的资金和计算资源比之前预计的可以少得多。但 Meta 的最新财报中仍然计划今年向 AI 投入 600 亿至 650 亿美元，2025 财年的总支出预计将超过 1140 亿美元。Meta 股价当天收盘上涨 2%。

扎克伯格称，Meta 仍在消化 DeepSeek 的一些"惊人之举"，他的团队希望最终将其中的一些进步应用于 Meta 自己的 AI 项目。

" Meta 将从 DeepSeek 等技术中继续学习，并不断优化发布自己的免费开源 AI 模型 Llama，以推动行业发展。"扎克伯格说道。

同日，微软也发布了最新季度财报。微软此前已经承诺将在本财年为人工智能数据中心预留 800 亿美元的支出。对此，微软首席执行官萨蒂亚 · 纳德拉表示，这笔支出是为了克服阻碍微软利用人工智能的能力的产能限制。

纳德拉在与分析师的电话会议上表示："随着人工智能变得更加高效和普及，我们将看到需求呈指数级增长。"不过该公司预计支出将在 7 月 1 日开始的 2026 财年逐渐放缓。

微软首席财务官 Amy Hood 表示，该公司本季度和下一季度的资本支出将保持在第二季度约 226 亿美元的水平。"在 2026 财年，我们预计将继续在强劲需求信号下进行投资。不过，增长率将低于截至 6 月底的 2025 财年。"她说道。

无论是 Meta 还是微软，在人工智能巨额支出面前，缺乏回报是资本市场最大的担忧。微软股价在盘后交易中下跌超过 5%。微软财报显示，Azure 云业务增长低于预期。

Futurum Group 分析师 Daniel Newman 表示："由于这些巨额支出，他们需要在创收方面加大力度，但我认为就目前的人工智能而言，资本支出过多，消费不足。"

周三微软公布季度业绩后，纳德拉在投资者电话会议上表示：" DeepSeek 确实有一些创新。显然，现在一切都商品化了，它将得到广泛应用。"

他还表示，为了扩大 AI 的应用，微软与 OpenAI 合作做了很多工作。纳德拉补充说道："仅仅发布最好的新模型是不够的。你必须让它具有成本效益。如果服务成本太高，那就不好了。"

" Aha 一刻"或引众创新公司效仿

DeepSeek 的 AI 模型之所以能举世瞩目，是因为该公司采用了创新技术开发了一种在有限人工干预下进行训练的人工智能模型，AI 的这一"顿悟时刻"可以降低开发人员基于该技术构建"杀手级"应用程序的成本。

DeepSeek 表示，当模型重新评估答案并调整处理时间以解决不同问题时，它发现该模型出现了该公司所谓的"顿悟时刻"。DeepSeek 的创建者在他们的研究论文中写道："‘顿悟时刻’有力地提醒了我们，强化学习有可能在人工智能系统中解锁新的智能水平，为未来更加自主和自适应的模型铺平道路。"

让聊天机器人生成更有用的响应的一种方法是"从人类反馈中强化学习"（RLHF），这是 OpenAI 为改进 ChatGPT 而首创的一种技术。但这一步通常费力、昂贵且耗时，通常需要一支人工数据标记员队伍。DeepSeek 的重大创新是使用一种称为强化学习（RL）的技术来自动化这最后一步。

人工智能研究公司 Hugging Face 研究员 Lewis Tunstall 表示："要实现这一目标，秘诀似乎就是拥有一个非常强大的预训练模型，然后拥有非常好的基础设施来大规模进行强化学习过程。"

"智能的秘诀非常简单。" Hugging Face 联合创始人兼首席科学官 Thomas Wolf 表示，" DeepSeek 的技术已被该领域的其他人所理解，我预计很多团队可以重复它们的工作。"

有 AI 专家认为，DeepSeek 展示了"真正的创新"，而且该公司在技术上采取透明的策略，公开详细的技术报告，概述它是如何构建推理模型的做法值得称赞。

英国剑桥大学首任 DeepMind 机器学习教授 Neil Lawrence 表示，DeepSeek 发布的模型可能只是"冰山一角"。"历史表明，大公司在扩大规模时很难创新，我们从许多大公司看到的是用计算投资取代智力上的辛勤工作。"他说道。

TechInsights 分析师 G Dan Hutcheson 在一份报告中称："我不认为 DeepSeek 最有可能威胁英伟达，而应该更会影响到试图靠卖人工智能产品来赚钱的公司，比如 OpenAI。"

此前，英特尔前 CEO 帕特 · 基辛格（Pat Gelsinger）在 LinkedIn 帖子中表示："市场的反应是错误的，降低 AI 成本将扩大市场应用。DeepSeek 是一项令人难以置信的工程，将引领 AI 更广泛地被采用。"

( 本文来自第一财经 )

上一篇：盛弘股份：公司的新能源电能转换设备，涵盖了一系列创新技术产品，包括但不限于模块化储能变流器、直流变换器、逆变升压一体舱以及预制柜式及箱式半集成储能系统等设备

下一篇：时尚品味: 粉色修身连衣裙