外观
2024,我的大模型之旅
大家好!转眼间,2024年已经悄然过去。原本打算在年底写几篇总结性的分享文章,但由于元旦前两周忙着赶新应用的进度,这些计划只好推迟到本周。希望这几篇分享能给大家带来一些启发和思考。
2024年对我来说,无疑是正式踏入AI领域的起点。在此之前,我跟随王老师学习过信息检索和数据挖掘,也跟着亮哥深入研究过机器学习。虽然这些经历让我对人工智能有了初步的认识,但始终没有真正深入研究和实际应用。直到2024年,我才真正开始与AI,尤其是大模型,进行了广泛而深入的接触。
这一年,除了原有产品的持续运营和升级,我的大部分时间都在探索和实践AI技术。从最初的怀疑和好奇,到逐渐掌握并应用于实际项目,这段旅程充满了挑战和收获。今天,我想跟大家分享一下这一年的经历,希望能为同样在AI领域摸索的你提供一些参考和灵感。
23年底
记得去年底,当ChatGPT刚开始流行的时候,我心里想的是:“这不就是一个包装得挺好看的搜索引擎吗?”说实话,当时的我并没有太在意,觉得它不过是又一个短暂的潮流。但随着时间的推移,我发现身边的朋友和同事越来越多地谈论起大模型,它的热度不仅没有减退,反而愈演愈烈。这种现象让我开始重新审视这个技术,心中不禁产生了些许好奇:它到底有什么特别之处?
24年3月
到了3月份,我终于忍不住好奇心,决定深入探究这个所谓的“大模型”究竟是什么。这一探究竟,就是一年!原本以为它只是一个包装精美的工具,没想到背后竟然蕴藏着如此巨大的潜力。随着了解的深入,我逐渐意识到,这不仅仅是一个技术突破,更是一种可能改变工作方式的新力量。
24年4月
4月,我第一次尝试用Python作为骨架,调用 通义百炼 大模型API,实现了一个编写长文档的工具。
后来了解了Agent设计模式才发现,这里我竟然融合了“工具调用”、“规划”两个模式,再后来,我又发现,Dify、Coze都有这方面功能了,并且还是可视化的。
吴恩达提出的Agent设计模式 :反馈(Reflection)、工具调用(Tool Use)、规划(Planning)和多智能体协作(Multi-agent Collaboration)。
说实话,刚开始的时候,我对生成结果并没有太大的信心。没想到,当我看到最终生成的文档时,简直被震撼到了!那效果不敢说是完美,但已经远远超出了我的预期。那一刻,我突然意识到,大模型的力量远不止于简单的知识获取,它似乎有着更多的可能性。
当然,我也试着在本地搭建过大模型,使用的 Ollama ,但显卡的性能问题确实让人头疼。不过,幸好各大厂商提供了不少免费的API额度。通过这些尝试,我已经可以通过大模型API改造原有的业务或者功能了,大大提升了工作的便利性。
24年5、6月
5、6月份,我逐渐意识到,调用大模型API确实简单,但真正的挑战在于如何编写有效的提示词。通过不断了解各种提示词工程,学习其它效果较好的提示词示例,我逐渐掌握了提示词的技巧。
一旦掌握了编写有效提示词的技巧,你会发现大模型在搜集资料、辅助编写文档等方面简直是如鱼得水。尤其是在使用通义千问时,它的写文档和改文档能力真的很强。无论是生成初稿还是优化现有内容,通义千问都能提供高质量的支持,大大提升了我的文档编写效率。
这段时间,我还接触到了一个名为 Dify 的工具,它能够屏蔽不同模型之间的差异,使得多模型的管理和调用变得更加简单,还支持图形化工作流,私有知识库等Agent特性,十分好用。
24年7月
7月份,我突然意识到,自己对大模型的理解还停留在表面。为了深入学习,我决定报名参加由Gitee AI和天数智芯联合举办的 “Gitee AI & 天数智芯创新应用大赛” 。说实话,最初参赛的动机很简单,就是希望通过这个机会,进一步加深对大模型的理解。
同时,我还接触到了 Coze 。字节团队的产品更新和生态建设,真的让我大开眼界,不管是我想到的还是没想到的,很快就会上线,感觉团队真的在从用户角度考虑。
现在,Coze不仅仅能开发简单的对话智能体,也具备了联网、知识库、永久存储、调用插件等功能,甚至还可以直接开发一套完整的带有UI界面的应用。
历史文章:
24年8、9月
8、9月份,我在比赛中不断试错、摸索,逐渐掌握了更多技巧,也学到了不少宝贵的经验。这个过程虽然充满挑战,但也充满了乐趣。
最终,在9月底的决赛中,我获得了三等奖!说实话,当时的心情既惊喜又激动。获奖固然很重要,但这次经历对我大模型认知的提升,我感觉更为重要。
这次比赛让我深刻体会到,只要你愿意去尝试,总会有收获的。很多时候,我们可能会因为准备不足而犹豫不前,但一次勇敢的尝试,也许能给我们带来不一样的惊喜和可能。
Gitee AI 每人每天100次白嫖机会,大家可以多多参与哈。
历史文章:
24年10月
进入10月,我开始了新一轮的探索和实践:
- 提升个人效率:我使用Coze实现了很多小工具,免费额度、可视化、不用管UI,对于工作辅助来说,Coze真的太好用了。这些工具可以帮我很好的完成文章编写、封面生成、数据搜集等耗时工作,让我能够更加专注于创新性的事务。 同时,大量的使用“通义灵码”辅助编码,比如仿写模块、构造测试数据、根据文档快速实现新接口对接、调试bug等,又进一步为我节省了大量时间。
- 创新细胞溯源产品:我尝试将大模型与之前的细胞溯源产品相结合,一方面通过大模型能力切实的为客户提升效率,另一方面也可以增强我们在行业内的竞争力。
- 开发新应用:有些场景感觉特别好,但是目前尚未有非常惊艳的应用发布,我就自己开始设计研发。大模型这波浪潮,虽然参与的有点晚,但终究也要尝试一下嘛。
24年11、12月
实践过程中,感觉有些技术点掌握的还是不够,也找了很多教程去学习,但感觉效果不明显。 11月,正好赶上了上海人工智能实验室的 “第四期书生大模型实战营” ,中间的学习过程也有被打断过,但是好在最终坚持结营了。
由于书生的产品体系覆盖了大模型全链路,因此,这次实战营给我带了巨大的提升,包括但不限于大模型的RAG、Agent、微调、训练、测评等等。
现在尚未结营,大家可以去了解下,等下一期尽快报名参与。
这期间,我还开始深入使用 Cursor 等智能编码工具。刚开始感觉也就那样,比“通义灵码”多了代码对比插入、图片提问、多文件操作(这个最初效果不佳)。
但升级了Composer模式,甚至Yolo模式后,感觉完全不一样了。原来的智能编码工具,更多是Copilot(助手)的概念,而升级后,Cursor更像是一个可以结对编程的“人”了,甚至,他还没有情绪。
简单列举几个Cursor和我的成果:
- 不到30分钟,实现了一个还可以的前端页面。
- 不到1个小时,基于Streamlit实现了一个和书生大模型API对接好的AI对话应用,附带流式响应,打字机效果。
- 不到2个小时,对接Gitee Serverless接口,实现图生图应用。
- 2天时间,基于uniapp实现了一个微信小程序大部分功能,包括首页、一个模块的增删改查、一个AI图片识别、一个AI对话、另外两个AI小场景、我的,以上模块全部都是界面+功能。这么久还是因为Claude对uniapp、uview的支持不太到位。
当然,想要良好的使用Cursor,必须改变一下个人的项目开发习惯,这样才能与Cursor配合的更好(后续我专门再整理一份Cursor的个人使用心得)。
历史文章:
随着新应用转向toC市场,我又开始学习AIGC生图方面的知识。图片、视频的传播显然比文字更有吸引力,所以,最近我花了很多时间研究如何利用AI生成高质量的视觉内容。
这块后续会出一个小程序给大家玩耍。
展望2025年
站在2025年的起点上,我对未来的AI发展充满了期待。
今年,我在AI领域的计划依然延续上述3个方向:
- 继续打磨个人工具,包括研发和其他事务的,争取打造出一个全面的数字团队,大大提升团队的单兵作战能力。
- 努力完善细胞溯源产品,计划春节后发布AI相关升级。
- 新应用也会尽快研发完成,并持续运营下去,在大模型的这波浪潮里面扑腾一下。
回顾2024年,这段大模型之旅不仅让我收获了宝贵的知识和技术,更重要的是,它教会了我如何在一个快速变化的领域中保持好奇心和学习的热情。感谢每一位支持我的朋友,也希望你们能在自己的AI之路上越走越宽广。
最后
给大家分享两个体会:
- 有时候,我们不需要追求完美,只需要勇敢地迈出第一步。相信只要坚持下去,总会找到属于自己的那片天空。
- 大模型是不是AGI,是不是人工智能唯一的道路,都不重要,如何利用大模型给现在的世界创造价值,才是最重要的。
