之前有传闻是损失上千万,以为是夸大其辞,现在看可能也没有离谱太多。
起诉索赔 800 万,明确的金额,说明字节应该有比较可靠的证据证明田某某造成的直接损失。田某某是在字节的大模型训练任务中篡改代码,就算不考虑前期收集和清洗数据的成本,光在训练阶段,大模型的成本就包括计算成本(显卡、服务器租金、维护等)、电力成本、人力成本这几个大头。还好字节是用自己的火山引擎,没有租金费用,但是这么大规模的集群,日常维护、网络带宽的开销也很大,在加上几周(?)的电费和人工费,800 万这个数字真不算大。
大模型是最烧钱的,这几年大公司都花大成本投入 AI 的研发, OpenAI 的 GPT-4 和 Google 的 Gemini Ultra 的训练成本分别估计为 7800 万美元和 1.91 亿美元。