我的 AI 使用经历
我自己使用 AI 工具,有一个从怀疑到接受再到主动适应的过程
Deepseek R1 是 2025 年初发布的模型,到现在刚过一年,但是期间 LLM 模型及应用的发展结果,很难让我相信这是此领域在仅仅 12 个月出头的时间里迭代的产出。因为近两年(2023-2025)更新换代的速度过于惊人,我对 LLM 工具的接受程度也有了很大的改变,2023 年我还在因写文章时 GPT-4 辜负了我对它鼓起的一点信任而感叹,2025 年末已经无法在搜索信息、Code、理解信息等日常及工作场景依赖上 Gemini-3 了。回过来看,这些年我自己使用 AI 工具,有一个从怀疑到接受再到主动适应的过程,这篇文章记录这个过程。
2024 年以前:有趣的大玩具
2024 年之前,我没有学过 AI 相关的理论知识,没有深度使用过热门 LLM 工具(当时主要是 ChatBot 和文生图),也没有广泛地接触过 AI 生态,认为 GPT 模型、Stable Diffusion 的文生图模型虽然很贵,但都是本应该仅存在于论文里的东西,因为它们的实际表现在我一个正常智人眼里,实在显得智商不高或者审美水品不高,只能算是一个有点意思的大玩具。
在头几次用简单的常识问题询问 GPT 模型时会感到强烈地新鲜感,因为以前从来没有见过这样的赛博客服,但是尝试问一些复杂且具体的问题,真想依靠它做点事比如写论文时,就很容易发现它在自信地生成毫不相关的文本,像是一个带一点想象力和自由发挥空间的确定性计算机程序。此外,当时的模型有着十分明确的知识界限,就是大概一年或几个月之前互联网上的信息,因为它们是从那时候开始被训练的。
文生图的产物曾一度充斥 Bilibili、Tieba、QQ 消息群组,那些比较完整但实在谈不上精致的图片很容易和真人画师的作品区分开来,而且看多后会产生审美疲劳,这就导致一些群组或论坛会禁止发布 AI 图片或开一个专门的区域给 AI 图片,视频网站上发布 AI 图片的视频的评论区除了求原图的回复外,消息也寥寥无几。
这段时间,国产 LLM 为大众所知的只有百度的文心一言,按照网上的说法,它的出现开启了中国“百模大战”的序幕。
2024 至 2025 年初:怀疑可用性
2024 年,延续之前的风格,LLM 领域出现了更多具有科研原型特点的产品,我也初次在日常中试着使用 LLM 工具辅助完成任务,但是我一直觉得 LLM 离真正可用,不辜负用户的信任还有很长的距离。
Sora 视频模型在 2024 年初发布,然而直到今天,它生成的视频才刚达到和曾经文生图模型产物类似的“足以在互联网上被传播和注意到”的水平,刚发布时生成的视频更是毫无观赏性可言,可以说就是一堆会动的色块。其实无论是感觉还是实际观察,都让人觉得生成视频这个任务的艰难,毕竟视频的随机性相比文本图片是指数级增加,信息的密度不可相提并论。
这段时间,Claude 、编程 Agent 和 IDE 在这段时间开始被频繁刷到,多模态、上下文、端到端等领域内的名次经常出现在身边,但是因为 AI 的工作原理不可被解释,而我通常对不可理解事物带有怀疑、无法认同开发者们对着一个黑箱调试性能的过程,所以始终没有深入使用过这些工具,仅仅会在遇到无法通过搜索解决的问题时才会试着问问 LLM。当 AI 科研和产品发布的推文出现在眼前,很多时候我只会大致浏览,比较“无动于衷”。
国产 LLM 领域的应用产品一直做的比较落后,这段时间里并没有令人眼前一亮的东西出现,做的东西还是偏文案生成一些。
2025 年 1 月至 4 月:熟悉应用
2025 年初 DeepSeek 发布了 R1 模型,这个低成本开源模型的发布引起国内外媒体的广泛宣传,导致英伟达市值蒸发 17%。模型的使用体验在当时确实和宣传的一样跟国外模型相差无几,并且供所有人免费使用。R1 是我首次以非常易用的方式接触到高性能 LLM 模型,在使用过程中,我开始被人工智能的产品惊艳到,随着周围越来越多的人也开始开发模型各种玩法,我逐渐从应用自顶向下的角度,而不是之前原理的角度熟悉 LLM 模型。
除了 DeepSeek R1,Gemini、Grok、Llama 一批模型也在年初出现,参数量一个比一个多,上下文越来越长,论文里标称的性能也一个比一个好,并且各有各的特点,比如 Gemini 有强大的多模态能力、Grok 比较网红且图片视频能力强、Llama 开源等。这段时间模型在变强,但是始终没有脱离 ChatBot 的形式,好用的 Agent 工具还没出现,所以除非出现一个性能数倍好于正在用的模型,我不会切换自己惯性使用的模型。
2025 年 4 月至 12 月:持续探索使用
2025 下半年 Claude Code、Opencode、Antigravity 等好用的 Code Agent 陆续出现,我在使用之后意识到基于 LLM 的 Agent 工具已经很强大,并且 LLM 模型已经成熟到支持以非常快的速度被应用化了,所以写代码时会尽可能多地用 Vibe Coding 来完成任务而不是古法手搓,也开始积极了解 Agent 应用开发用到的技术,推测 Agent 工具的实现方法和实际考量。除了 Coding,Agent 也开始进入浏览器、写作、总结等很多领域,甚至 Chatbot 都已经默认调用,之后必然跟长久流传的一样进入到方方面面。
从 LLM 模型到 Agent 的过程很好理解,把 LLM 工具当作函数,人来规格地 prompt 工程组织 LLM 工具,在解决问题时肯定是比纯 LLM 输出要更好的,看来就算在 AI 应用领域,传统软件工程还要发很长时间的力,只是原本需要全栈工程师,现在需要 AI Native 全栈工程师。
以上是我记忆中前两年自己的 AI 使用经验,可以看到,从怀疑 LLM 到使用 Agent 工具的转变主要还是受外因的影响,看来自己的知识和视野还是很受限啊。