过去几个月我在提醒算力过剩的问题,没想到deepseek的出现直接釜底抽薪来个大的。
2024年10月:
美政府被曝正考虑再出招限制中国获取用于人工智能的芯片技术,中方此前已表态,如何评价美方此举?2024年12月:
严肃的敬告我的所有关注者,不要入局算力…从我能拿到的消息,2024年初国内就已经出现算力过剩了。年中时已经算力过剩严重,很多算力平台的使用率低于5成,到年底时已经使用率低至2-3成。
早期的逻辑来自于美国制裁中国采购AI算力,国内的媒体也大量宣传此事,形成了算力行业是紧缺资源的印象。于是很多公司和地方政府大规模投资建设算力中心,短时间就把算力提高到过剩的地步。
随后就是2024年期间,很多从事大模型研发的公司,已经不再自己训练基座模型了,而是选择个开源基座模型为基础进行研发。国内比较流行的是qwen,国外比较流行的是llama。这都导致了算力的需求方大幅度缩减,不考虑新入局者时,算力需求会降低到不足原来的10%。
随后就是这几周突然爆火的deepseek,让大家知道了,即使是