2024，我的大模型之旅

约 3139 字大约 10 分钟

2025-01-14

大家好！转眼间，2024年已经悄然过去。原本打算在年底写几篇总结性的分享文章，但由于元旦前两周忙着赶新应用的进度，这些计划只好推迟到本周。希望这几篇分享能给大家带来一些启发和思考。

2024年对我来说，无疑是正式踏入AI领域的起点。在此之前，我跟随王老师学习过信息检索和数据挖掘，也跟着亮哥深入研究过机器学习。虽然这些经历让我对人工智能有了初步的认识，但始终没有真正深入研究和实际应用。直到2024年，我才真正开始与AI，尤其是大模型，进行了广泛而深入的接触。

这一年，除了原有产品的持续运营和升级，我的大部分时间都在探索和实践AI技术。从最初的怀疑和好奇，到逐渐掌握并应用于实际项目，这段旅程充满了挑战和收获。今天，我想跟大家分享一下这一年的经历，希望能为同样在AI领域摸索的你提供一些参考和灵感。

23年底

记得去年底，当ChatGPT刚开始流行的时候，我心里想的是：“这不就是一个包装得挺好看的搜索引擎吗？”说实话，当时的我并没有太在意，觉得它不过是又一个短暂的潮流。但随着时间的推移，我发现身边的朋友和同事越来越多地谈论起大模型，它的热度不仅没有减退，反而愈演愈烈。这种现象让我开始重新审视这个技术，心中不禁产生了些许好奇：它到底有什么特别之处？

24年3月

到了3月份，我终于忍不住好奇心，决定深入探究这个所谓的“大模型”究竟是什么。这一探究竟，就是一年！原本以为它只是一个包装精美的工具，没想到背后竟然蕴藏着如此巨大的潜力。随着了解的深入，我逐渐意识到，这不仅仅是一个技术突破，更是一种可能改变工作方式的新力量。

24年4月

4月，我第一次尝试用Python作为骨架，调用通义百炼大模型API，实现了一个编写长文档的工具。

后来了解了Agent设计模式才发现，这里我竟然融合了“工具调用”、“规划”两个模式，再后来，我又发现，Dify、Coze都有这方面功能了，并且还是可视化的。

吴恩达提出的Agent设计模式：反馈（Reflection）、工具调用（Tool Use）、规划（Planning）和多智能体协作（Multi-agent Collaboration）。

说实话，刚开始的时候，我对生成结果并没有太大的信心。没想到，当我看到最终生成的文档时，简直被震撼到了！那效果不敢说是完美，但已经远远超出了我的预期。那一刻，我突然意识到，大模型的力量远不止于简单的知识获取，它似乎有着更多的可能性。

当然，我也试着在本地搭建过大模型，使用的 Ollama ，但显卡的性能问题确实让人头疼。不过，幸好各大厂商提供了不少免费的API额度。通过这些尝试，我已经可以通过大模型API改造原有的业务或者功能了，大大提升了工作的便利性。

24年5、6月

5、6月份，我逐渐意识到，调用大模型API确实简单，但真正的挑战在于如何编写有效的提示词。通过不断了解各种提示词工程，学习其它效果较好的提示词示例，我逐渐掌握了提示词的技巧。

一旦掌握了编写有效提示词的技巧，你会发现大模型在搜集资料、辅助编写文档等方面简直是如鱼得水。尤其是在使用通义千问时，它的写文档和改文档能力真的很强。无论是生成初稿还是优化现有内容，通义千问都能提供高质量的支持，大大提升了我的文档编写效率。

这段时间，我还接触到了一个名为 Dify 的工具，它能够屏蔽不同模型之间的差异，使得多模型的管理和调用变得更加简单，还支持图形化工作流，私有知识库等Agent特性，十分好用。

24年7月

7月份，我突然意识到，自己对大模型的理解还停留在表面。为了深入学习，我决定报名参加由Gitee AI和天数智芯联合举办的 “Gitee AI & 天数智芯创新应用大赛” 。说实话，最初参赛的动机很简单，就是希望通过这个机会，进一步加深对大模型的理解。

同时，我还接触到了 Coze 。字节团队的产品更新和生态建设，真的让我大开眼界，不管是我想到的还是没想到的，很快就会上线，感觉团队真的在从用户角度考虑。

现在，Coze不仅仅能开发简单的对话智能体，也具备了联网、知识库、永久存储、调用插件等功能，甚至还可以直接开发一套完整的带有UI界面的应用。

历史文章：
扣子实现文章封面配图（二）- 生成图片
科研Cozer：扣子助力科研数据收集
大模型有UI了？用新上线的扣子应用搭建个表情包生成工具

24年8、9月

8、9月份，我在比赛中不断试错、摸索，逐渐掌握了更多技巧，也学到了不少宝贵的经验。这个过程虽然充满挑战，但也充满了乐趣。

最终，在9月底的决赛中，我获得了三等奖！说实话，当时的心情既惊喜又激动。获奖固然很重要，但这次经历对我大模型认知的提升，我感觉更为重要。

这次比赛让我深刻体会到，只要你愿意去尝试，总会有收获的。很多时候，我们可能会因为准备不足而犹豫不前，但一次勇敢的尝试，也许能给我们带来不一样的惊喜和可能。

Gitee AI 每人每天100次白嫖机会，大家可以多多参与哈。

历史文章：
Gitee AI每天白嫖100次，Cursor助我完成毛茸茸风格图片生成

24年10月

进入10月，我开始了新一轮的探索和实践：

提升个人效率：我使用Coze实现了很多小工具，免费额度、可视化、不用管UI，对于工作辅助来说，Coze真的太好用了。这些工具可以帮我很好的完成文章编写、封面生成、数据搜集等耗时工作，让我能够更加专注于创新性的事务。同时，大量的使用“通义灵码”辅助编码，比如仿写模块、构造测试数据、根据文档快速实现新接口对接、调试bug等，又进一步为我节省了大量时间。
创新细胞溯源产品：我尝试将大模型与之前的细胞溯源产品相结合，一方面通过大模型能力切实的为客户提升效率，另一方面也可以增强我们在行业内的竞争力。
开发新应用：有些场景感觉特别好，但是目前尚未有非常惊艳的应用发布，我就自己开始设计研发。大模型这波浪潮，虽然参与的有点晚，但终究也要尝试一下嘛。

24年11、12月

实践过程中，感觉有些技术点掌握的还是不够，也找了很多教程去学习，但感觉效果不明显。 11月，正好赶上了上海人工智能实验室的 “第四期书生大模型实战营” ，中间的学习过程也有被打断过，但是好在最终坚持结营了。

由于书生的产品体系覆盖了大模型全链路，因此，这次实战营给我带了巨大的提升，包括但不限于大模型的RAG、Agent、微调、训练、测评等等。

现在尚未结营，大家可以去了解下，等下一期尽快报名参与。

这期间，我还开始深入使用 Cursor 等智能编码工具。刚开始感觉也就那样，比“通义灵码”多了代码对比插入、图片提问、多文件操作（这个最初效果不佳）。

但升级了Composer模式，甚至Yolo模式后，感觉完全不一样了。原来的智能编码工具，更多是Copilot（助手）的概念，而升级后，Cursor更像是一个可以结对编程的“人”了，甚至，他还没有情绪。

简单列举几个Cursor和我的成果：

不到30分钟，实现了一个还可以的前端页面。
不到1个小时，基于Streamlit实现了一个和书生大模型API对接好的AI对话应用，附带流式响应，打字机效果。
不到2个小时，对接Gitee Serverless接口，实现图生图应用。
2天时间，基于uniapp实现了一个微信小程序大部分功能，包括首页、一个模块的增删改查、一个AI图片识别、一个AI对话、另外两个AI小场景、我的，以上模块全部都是界面+功能。这么久还是因为Claude对uniapp、uview的支持不太到位。

当然，想要良好的使用Cursor，必须改变一下个人的项目开发习惯，这样才能与Cursor配合的更好（后续我专门再整理一份Cursor的个人使用心得）。

历史文章：
Bolt.new：结对编程的AI伙伴（前端篇）
Cursor：前端不会消失，但前端的你会消失
Windsurf初体验，据说要超越Cursor

随着新应用转向toC市场，我又开始学习AIGC生图方面的知识。图片、视频的传播显然比文字更有吸引力，所以，最近我花了很多时间研究如何利用AI生成高质量的视觉内容。

这块后续会出一个小程序给大家玩耍。

展望2025年

站在2025年的起点上，我对未来的AI发展充满了期待。

今年，我在AI领域的计划依然延续上述3个方向：

继续打磨个人工具，包括研发和其他事务的，争取打造出一个全面的数字团队，大大提升团队的单兵作战能力。
努力完善细胞溯源产品，计划春节后发布AI相关升级。
新应用也会尽快研发完成，并持续运营下去，在大模型的这波浪潮里面扑腾一下。

回顾2024年，这段大模型之旅不仅让我收获了宝贵的知识和技术，更重要的是，它教会了我如何在一个快速变化的领域中保持好奇心和学习的热情。感谢每一位支持我的朋友，也希望你们能在自己的AI之路上越走越宽广。

最后

给大家分享两个体会：

有时候，我们不需要追求完美，只需要勇敢地迈出第一步。相信只要坚持下去，总会找到属于自己的那片天空。
大模型是不是AGI，是不是人工智能唯一的道路，都不重要，如何利用大模型给现在的世界创造价值，才是最重要的。