



About This Site
Hi,欢迎来到我的个人博客。我是一名企业数据技术顾问,擅长统计分析和数据建模。目前在探索基于大语言模型的有趣应用,并利用这个空间做一些阶段性整理和输出。主要包含两个板块:
- 应用展示:旨在提供一个集中的入口,方便在线测试和体验我搭建的各种应用 Demo。包括基于知识库的精准问答机器人、自然语言数据库查询系统,以及能够模拟不同专业角色的思维引导机器人等。
- 培训分享:整理展示我之前做的 AI 基础培训的内容,涵盖原理和应用,旨在帮助非专业人士理解和掌握大语言模型。
如果你也对AI充满好奇,或者想要共同探讨相关应用和技术,欢迎与我联系。
Application Demo
这里汇集了我在学习和探索AI模型/框架/工具过程中搭建的一些应用Demo。点击链接进入各应用的介绍页面,可以找到对应的体验入口。
微调垂直领域大模型
本项目旨在利用先进的预训练语言模型技术,结合特定领域的专业知识,打造一个专注于无人机飞行安全规范的...
非暴力沟通智能助手
本项目意图打造一款用于即时聊天工具的智能沟通插件。它基于非暴力沟通(NVC)原则,实时分析用户即将...
舆情洞察(语义分析+情感评价)
这是一个精华液产品的消费者洞察示例。在分析中引入大语言模型的语义分析和情感分析能力,替代复杂的传统...
Text-to-SQL数据查询系统
利用大语言模型的自然语言理解和代码生成能力,打造一个用自然语言查询数据库的检索系统。你可以用简单的...
Training and Sharing
这个板块分享我做的一些AI相关的基础培训视频。包含原理和应用。旨在帮助非专业人士理解大语言模型的底层逻辑和局限性,从而在实际工作中更合理地选择和使用AI底层模型或工具,提升效率。
注:培训中的内容是基于对 OpenAI o1模型发布之前的主流大语言模型(GPT系列)的理解和判断。而 OpenAI o1模型在底层机制和能力上与之前的模型有较大差异。所以培训内容中有些部分可能需要重新评估。
大语言模型的底层数学原理
章节介绍
– 按照统计模型——神经网络模型——大语言模型的发展历程来讲解大语言模型的底层数学原理。
– 帮助学员理解模型训练,模型预测,参数,输入/输出等关键概念的含义。
注:跳转到B站可观看清晰版本。
生成式AI的预测机制
章节介绍
– 剖析了生成式AI的运作机制,阐释它如何从简单的“预测下一个字”任务,发展到生成连贯、有意义的结构化内容。
– 也介绍了 Temperature 和 TopK 参数如何影响模型的创作风格和结果。
注:跳转到B站可观看清晰版本。
目前大语言模型的局限性
章节介绍
– 介绍了 ChatGPT 和其他主流大语言模型(OpenAI o1 模型除外)存在的主要局限性,并解释了这些局限性背后的原因。
注:跳转到B站可观看清晰版本。
大语言模型的应用解决方案
章节介绍
– 介绍了克服大语言模型自身局限性的三种应用解决方案:提示词工程,模型微调,智能体。
注:跳转到B站可观看清晰版本。
基础模型的能力对比与选择
章节介绍
– 介绍了AI基础模型的能力对比与选择。
– 针对不同工作任务推荐了一些合适的AI工具。
注:跳转到B站可观看清晰版本。
© All Rights Reserved.