了解材料和算法成本对AI经济的影响

使用我们的合作伙伴Salesforce,将销售,营销和客户服务统一。加速您的成长!

我们为您提供一个新的系列,专门针对AI幕后的AI,以更好地了解其工作原理以及操作它们的演员的真实问题。

AI初创公司的价格和盈利能力的真正竞争压力是什么?生成AI可以代替多少SaaS应用程序? OpenAI,Google,Anthropic和LLM模型的真正轨迹是什么? AI什么时候在各个领域平等?哪个Genai初创公司认为产品市场合身?

我们将回答最有教育意义的方式的许多问题。该文件将伴随AI术语的词典,以了解要知道的基本概念。

在第一集中,我们发送了与人工智能相关的成本的主题。

每个人每天都能听到它,生成人工智能的兴起是基于相当复杂和成本的物质基础设施。最先进的模型的培训和推断需要不断增加的计算能力,促使企业和研究人员探索替代方案以优化其效率。在短期内,专业组成部分的稀缺性和市场高度限制了任何大幅降低成本。在中期,算法创新和新玩家的到来可能会改变这一轨迹。

计算成本,AI可访问性的结构制动

生成人工智能基于架构,其功能特别令人震惊。类似的模型 GPT-4 动员数万 GPU NVIDIA A100 在他的培训和要求基础设施中同样强加于其推论。每个请求约束 chatgpt 消耗 三到五倍的能量 Google研究说明了计算机资源需求的程度。

这种技术需求水平导致了高度影响所有市场参与者的运营成本:

  • 高级标准(Microsoft,Google,Amazon) 在其数据中心投资数十亿欧元以满足这一需求。
  • AI部门初创公司,通常取决于这些基础设施,必须处理高单位成本,威胁其盈利能力。
  • 客户公司 试图将生成的AI集成到他们的产品中,这是一个难以吸收的发票。

面对这种财务压力,整个生态系统旨在优化其对资源的使用并探索解决方案以降低这些成本的情况,而无需牺牲模型的性能。

AI半导体市场的主人Nvidia,但直到何时?

如果计算能力需要爆炸,则能够响应它们的组件仍集中在单个演员手中。 NVIDIA主导着专门用于人工智能的GPU市场,估计份额超过 80%。它的软件体系结构 库达,要利用这些芯片,加强了霸权并限制了竞争解决方案的出现。

生成AI的成功已巩固了这一立场,使NVIDIA强加了未出版的价格:芯片 H100,AI基础架构的中心要素目前正在谈判 30,000和40,000美元,远远超出了其制造成本。因此,供应的稀缺与需求的爆炸相结合,使公司能够显示出原始的记录利润率,从而捕获了AI开发产生的大多数利润。

然而,这种垄断的情况开始引起反应。几项旨在减少对NVIDIA GPU的依赖的举措:

  • AMD和英特尔加速了他们的努力 具有竞争性替代方案(MI300X,Gaudi 3)。
  • Google和AWS开发了自己的专业跳蚤 (TPU,推理)。
  • 华为和伯伦(Biren)等中国制造商投资大量投资 尽管有美国的限制。

如果这些替代方案仍然是少数派,那么几年后,它们就可以分散市场,并且 导致材料成本逐渐下降

算法优化,一种决定性依赖性依赖性的决定性杠杆

公司的价格迅速下跌,公司投资了大规模投资 提高软件效率。目标很简单: 减少模型操作所需的计算消耗,而不会损失可感知的性能

几项重大的技术进步有助于这种优化:

  • 数量 :降低计算的准确性(从FP32格式到INT8或FP16)使得可以加速模型的执行,同时减少其能耗。
  • 修剪和稀疏 :通过消除不必要的神经连接,可以获得更轻和快速的模型。
  • 模型的蒸馏 :通过导致较大模型的减轻版本,研究人员可以通过降低的计算机烙印来保持可比的效率。

这些技术已经在某些模型中使用,例如 Mistral 7b或Gemma 7b,使实现与更大模型的性能相当,但能源成本明显降低。

其他方法的重点 架构的优化 自己:

  • 闪烁,通过减少RAM的需求来改善长序列的处理。
  • 专家的混合物(MOE),它仅根据请求激活模型的某些部分,从而优化资源分配。
  • 并行培训和新的数据存储方法,最小化无用信息的重复。

最后,推理的优化也就是说,使用生产模型是降低成本的战略轴。解决方案 Tensorrt,ONNX运行时或JAX 使得可以更有效地执行模型,而专用基础架构则可以 AWS推理或NVIDIA TRITON服务器,减少他们的能耗。

得益于这些进步,据估计,按AI任务计算的消费可以 到2026年从30%降低到50%,这将构成AI应用的经济可行性的转折点。

成本和需求爆炸之间的不稳定平衡

如果在硬件和软件优化方面的进展使人们有可能降低计算的单位成本,则这种动态被抵消 AI需求的持续爆炸。有三个因素支持计算能力需求的持续增加:

  1. 增加模型大小 :每一代LLM都需要 10至100倍的功率 即使围绕DeepSeek的交流可以建议
  2. 人工智能正在蔓延到所有部门 :从云计算到SaaS应用程序,包括工业自动化和消费者服务。
  3. 自主代理人的兴起 :能够在没有监督的情况下执行循环任务的模型的到来(AutoGPT,Devin AI)可以 乘以十次计算消耗

因此,即使技术发展使降低单位计算成本成为可能, 使用量在很大程度上弥补了这些收益。因此,生成剂的经济可及性将取决于市场能力平衡这些相反趋势的能力。

生成的AI今天基于紧张的经济模式:

  • 材料成本仍然很高,由于组件的供应有限和指数需求。
  • NVIDIA仍然主导市场,但替代方案逐渐出现。
  • 算法优化使得有可能部分补偿这些约束,减少计算能力要求。
  • 但是,需求的爆炸可能会吸收这些收益,现在持续承受成本的压力。

在中期,只有基础设施和培训方法的深刻转变才能确保 AI的可持续民主化,不损害其盈利能力。

台中鑽戒當鋪 新竹借錢快速 新竹增貸二胎 雲林增貸二胎 澎湖當鋪鑽石 新北鑽戒當鋪 桃園機車典當 彰化融資借錢 花蓮當鋪車貸 台南手機借錢app