先别急着下定论说这是文化或者语言的问题,这锅中文和汉字不背。
你要是去翻翻二十年前的中文互联网,去那个BBS和博客百花齐放的年代看看,你会发现那时咱们的内容质量一点都不差,甚至哪怕是现在的微信公众号深处,依然藏着大量惊才绝艳的深度长文。
但为什么你搜不到?为什么你感觉满屏都是垃圾?
作为一个在后台亲手调试过无数个点击率模型、做过无数次流量分发实验的工程师,我可以很负责任地告诉你,中文互联网之所以变成今天这个局域网孤岛和垃圾场,是一场精心策划的、集体无意识的、且无法逆转的技术与商业合谋。
我们正在经历一场前所未有的信息熵增,而你我都是在这个巨大的噪音工厂里被不断投喂的电池。
咱们从最直观的感受聊起。你刚才提到的那个场景,简直就是我每天工作的噩梦重现。我要查一个Python的报错,把错误代码往百度或者必应里一扔,前三页出来的必定是CSDN、博客园或者某些采集站。点进去一看,好家伙,十篇文章有八篇是完全一样的,剩下的两篇是机翻的Stack Overflow,排版乱得像被炸弹炸过,代码块连换行都没有。最要命的是,这些答案往往是三年前的,根本解决不了今天的版本问题。
这时候你会下意识地切到Google,切到英文搜索,甚至去翻官方文档,你会发现世界清静了。排版整洁,逻辑清晰,有人在认真维护。
这种巨大的落差感,本质上是因为中文互联网的底层协议已经变了。
这里我要抛出一个可能让你觉得有点极端的观点:中文互联网已经杀死了超链接。
万维网,World Wide Web,它的灵魂是什么?是Link,是链接。是你可以从一个页面自由地跳转到另一个页面,搜索引擎可以通过爬虫顺着这些链接爬遍全世界,建立索引。
但在中国,这个逻辑失效了。
咱们现在的互联网巨头,每一个都在修墙。你写的文章发在微信公众号里,百度的爬虫爬不到。你在抖音里发的硬核科普,谷歌搜不到。你在小红书写的生活经验,外面的人也看不见。淘宝早就屏蔽了百度,京东也筑起了高墙。
你想想看,当最优质的创作者——那些原本应该在独立博客、在开放论坛里贡献高质量内容的人——都被迫迁移到了微信公众号、知乎、小红书、抖音这些APP孤岛里的时候,开放的Web还剩下什么?
剩下的只有无主的荒原。
这时候,占领荒原的是谁?是内容农场,是采集站,是做号党。因为优质内容都在APP的高墙里锁着,搜索引擎搜不到东西了,它只能抓取那些还在开放Web上裸奔的信息。而还在开放Web上裸奔且大规模更新的,绝大多数都是为了骗点击、骗广告费而批量生产的垃圾。
这就是你觉得搜索结果全是垃圾的第一个原因:优质内容私有化,公共区域荒漠化。
这导致了一个非常恐怖的恶性循环。因为搜不到好东西,用户就不搜了,直接去APP里搜。你想买东西去淘宝搜,想看八卦去微博搜,想学知识去知乎或者B站搜。通用搜索引擎流量下降,广告收入下降,它就更没有动力去优化搜索结果,反而更倾向于把流量导给自己家的产品(比如百家号),或者谁给钱多谁排前面。
这不仅仅是商业竞争,这是对互联网精神的一种背叛,但没办法,这是最高效的变现路径。
咱们再往深了挖,作为算法工程师,我要揭露一个更残酷的现实:算法不想要真相,算法只想要时长。
在英文互联网,虽然也有Facebook和TikTok这种时间黑洞,但由于PC时代的惯性非常强,加上由于各种原因导致的APP生态没有中国这么封闭,大量的流量依然把持在Google手中,而Google的商业模式决定了它必须让你尽快找到答案离开,你才能去点击下一个广告。
但在中国,移动互联网弯道超车太快了。我们的主流并非搜索,而是推荐。
你知道我们在训练推荐模型的时候,最核心的指标是什么吗?
不是你有没有学会这个知识,不是这条信息准不准确,甚至不是你喜不喜欢。
是留存,是使用时长,是CTR(点击率)。
当所有的APP都在疯狂卷这些指标的时候,内容的逻辑就变了。一篇逻辑严密、论证详实、干货满满的万字长文,读起来是很累的。它需要你动脑子,需要你专注。对于大多数疲惫的打工人来说,这种文章的完读率极低。
反观那些情绪煽动、断章取义、把复杂的概念庸俗化、把既有的答案洗稿重发的爽文,点击率高,完读率高,评论区撕逼激烈(互动率高)。
在算法眼里,后者就是优质内容。
机器不懂逻辑,机器不懂真理。机器只知道,这篇垃圾文章让用户在APP里多停留了5分钟,那它就是好文章,就要给它几百万的流量。
于是,劣币驱逐良哉。认真的创作者发现自己写的硬核内容没人看,反而是那些把他的观点拿去洗稿、配上夸张标题、加上几个表情包的人赚得盆满钵满。
久而久之,谁还产出原创?谁还做深度总结?
我们把既有的最佳答案加工得很糟糕,是因为那个糟糕的样子,才是算法喜欢的样子,才是大众在这个高压社会下愿意吞咽的样子。
这其实挺让人绝望的。特别是当你看到所谓的AI写作工具出来之后。
现在的中文互联网,正在面临第二波毁灭性的打击——AIGC的滥用。
以前做号党还要雇几个人去复制粘贴,现在好了,随便接个API,一天能生成几万篇看起来像模像样、实则废话连篇的文章。
你在搜索结果里看到的那些吵来吵去的垃圾,很多甚至都不是人在吵,是机器人互搏。是无数个被指令驱动的程序,在为了SEO关键词,为了填充页面空白,在疯狂地制造电子排泄物。
你问为什么英文环境好一点?
除了刚才说的开放Web生态保留得比较好之外,还有一个很重要的原因:英文互联网的极客精神和社区文化还没有完全死绝。
Reddit、Stack Overflow、Wikipedia,以及无数依然活跃的独立博客、开源社区,这些地方的人有一种近乎偏执的洁癖。他们以贡献original content为荣,以引用来源为基本道德。
而在我们的环境里,这种洁癖被嘲笑为迂腐。
这就不得不提一下你问的文化关联。我不认为是中国文化的问题,但我认为是中国互联网的草莽商业文化的问题。
我们的互联网起步就是为了赢,为了变现。这里的节奏太快了,快到容不下一个安安静静写博客的人。
在硅谷,你写一个开源项目,写得好,你会获得极大的社区声望,甚至因此获得高薪工作。在中国,你写个开源项目,明天就被大厂拿去改个名字申请专利,或者被培训班拿去当收费课程。
这种反馈机制的断裂,让愿意做基础设施、愿意做知识整理的人越来越少。
大家都很焦虑,都想赚快钱。写这篇回答的我也很焦虑。
我看着我们训练出来的大模型,有时候会陷入沉思。这些大模型是吃着互联网上的数据长大的。如果中文互联网全是垃圾,那我们的国产大模型,吃进去的是垃圾,吐出来的能是什么?
这就是数据枯竭。
不要以为数据是无限的。高质量的中文语料,其实非常非常稀缺。那些逻辑严密、有可信度的资料被埋没,意味着未来的AI可能根本学不到逻辑,学不到可信。它学到的全是情绪宣泄,全是营销话术,全是洗稿后的废话。
这是一场生态灾难。
不仅如此,由于中文互联网的割裂,现在的年轻人,也就是00后、10后这一代,他们的搜索习惯已经完全改变了。
他们不懂什么叫关键词匹配,不懂什么叫布尔逻辑搜索。他们遇到问题,第一反应不是去搜原理,而是去小红书搜避雷,去抖音搜教程。
这有什么问题?问题大了。
这种搜索习惯,导致他们只能接受碎片化、视频化、情绪化的信息。他们失去了阅读长文本的能力,失去了在复杂的搜索结果中辨别真伪的能力。
当一代人都不再具备信息检索和甄别能力的时候,制造垃圾的人就更加肆无忌惮,因为由于受众的降级,垃圾也能卖出好价钱。
说到这,你可能会觉得我在制造焦虑。但我必须得告诉你,这种信噪比极低的现状,在未来几年只会恶化,不会好转。
因为技术没有回头路。
只要封闭的APP生态能带来更高的商业价值,巨头们就不会拆墙。只要推荐算法能带来更高的用户时长,平台就不会回归到纯粹的搜索。只要洗稿和垃圾内容能带来流量,做号党就不会消失。
那我们怎么办?我们这些还要点脸、还想看点真东西的人怎么办?
这也是我今天想和你分享的最核心的观点:你要建立自己的信息护城河。
既然公域流量已经是垃圾场,你就不能再指望百度的第一页能给你真相。
你需要逃离算法的舒适区。
这很难,真的很难。因为算法太懂你的人性弱点了。它知道你累,知道你懒,知道你喜欢看美女,喜欢看撕逼。
但你必须反着来。
你要强迫自己去建立高质量的信息源列表。去订阅那些还在坚持更新的RSS,去关注那些真正有洞见的Newsletter,去寻找那些还活着的独立博客。
你要学会用Google高级搜索指令,把垃圾站屏蔽掉。你要学会去GitHub找源头代码,去arXiv找原始论文,去官方文档找第一手资料。
甚至是,你要开始囤积数据。
这不是开玩笑。我现在看到一篇好文章,第一反应不是收藏,而是保存。因为你不知道哪一天,这篇文章就会因为所在的平台倒闭、账号被封,或者作者心灰意冷而彻底消失(404)。
中文互联网的记忆是只有7秒的。
我们现在所处的,可能是一个知识的黑暗时代的前夜。虽然信息量爆炸,但有效知识的密度却在极速坍缩。
如果你不想让自己的大脑变成别人思想的跑马场,不想变成算法喂养的肉鸡,你就得行动起来。
别再问为什么环境这么差了,环境一时半会儿好不了。
这是一场个人对峙系统的战争。
你要做一个数字游牧民。在微信、知乎、抖音、小红书这些孤岛之间穿梭,但绝不被任何一个孤岛锁死。我们要像当年那些淘金者一样,在巨大的泥沙流里,用自己手里的筛子,一点一点地把金子筛出来。
更重要的是,如果你有能力,请输出。
请哪怕是仅仅为了你自己,去写一些逻辑通顺、引用规范、排版整洁的文字。发在博客也好,发在GitHub也好,哪怕发在Notion里分享出来也好。
不要在乎有没有流量,不要在乎有没有人点赞。
在这个垃圾泛滥的时代,清晰、理智、原创的文字,本身就是一种反抗。
或许我们改变不了潮水的方向,但我们至少可以决定自己不被潮水淹没。
这就是我对这个问题的回答。很残酷,但很真实。中文互联网的信噪比低,是因为我们把互联网从图书馆变成了游乐场,进而变成了垃圾填埋场。
但只要还有人在挖掘,只要还有人在记录,文明的火种就还在。
别让劣币彻底驱逐了良币。从你我做起,别做那个制造噪音的人,也别做那个沉溺于噪音的人。
这不仅仅是为了找资料方便,这是为了保卫我们的大脑。