大模型的应用实践

字数统计: 1.5k阅读时长: 5 min

 2025/03/24 

大模型产品

国外大模型产品

在前篇文章中，通俗地介绍了大模型的概念原理，本篇将介绍大模型的应用实践。在开始之前，先简单汇总下国内外的大模型产品。目前国外的大模型龙头企业主要有美国的OpenAI，Google，Anthropic和X AI，以及欧洲的Mistral AI。

其中，Open AI是全世界最早做出大模型的公司，当前的产品类型也覆盖最广，除了有全球最优的综合类大模型ChatGPT系列外，在图片、音频和视频等领域也都有相应的头部产品。

Anthropic是由部分从Open AI离职的人创建的，旗下的大模型产品Claude 4.0 Opus，在数学和科学领域超越了人类专家水平。其首创的宪法AI架构，可以使偏见与幻觉率降至0.02%。

Google做为老牌的科技公司，积攒了海量的数据和先进的算法，使得其研发的大模型也有很好的性能表现。旗下的Gemini系列是一个多模态大模型，可以实时接收文字、语音、图像、视频等信息，并进行推理反馈。

X AI入局大模型领域的时机稍晚，但凭借强大的研发能力，使得X AI当前也跻身进大模型的第一梯队。其研发的Grok系列模型，支持实时的数据获取，使得知识时效性全球领先。

Mistral AI被称为欧洲的AI之光，旗下拥有人工智能助手 “Le Chat” 以及多个基础模型。Mistral AI目前专注于小模型和细分领域的小创新，但其早期开源的Mixtral 8x7B模型，带火了混合专家(MoE)技术，在当时引起广泛的讨论。

国外大模型产品

国内大模型产品

在国外寥寥无几的大模型产品，在国内则是遍地开花，前期曾号称是“百模“大战。传统大厂，如腾讯、字节、阿里、百度等都纷纷入局大模型赛道。此外还有以“大模型六小龙”（智谱、MiniMax、月之暗面、百川智能、零一万物和阶跃星辰）为代笔的新一批AI明星公司，也在迅速发展。国内的大模型产品，在技术侧还处于追赶Open AI的状态，但差距在逐渐缩小。而在产品侧，大部分公司都打磨得较好，如果不是很复杂的任务，基本都能完成。另外国外的大模型产品基本都不能直接访问，需要翻墙，而且生成内容相对自由，会有合规风险。而国内大模型产品绝大部分都可以直接免费使用，这也是国内大模型的一大优势。

国内大模型产品

大模型基础使用

使用界面

这里以腾讯元宝为例，来看一下大模型的一个常规使用界面。首先可以在聊天框内输入对话，跟大模型进行交流。高亮“深度思考”后，可以将模型切到推理模型，适合做数学，逻辑推理等需要分步骤规划的复杂任务。而高亮联网搜索，可以实时获取网上最新消息，解决知识时效性问题。在右下角可以上传word、pdf和图片。通过这里可以上传垂直领域的私有信息。最后每次切换话题时，建议都新建一个对话，避免不同话题相互影响。

大模型基础使用

提示词工程

与职场新人向导师提问一样，如何向大模型提问，也是有技巧的。用户输入大模型的内容，叫做提示词。用来触发大模型的响应。而提示词工程就是通过设计结构化的输入，来引导大模型更好地输出。例如可以先为大模型指定一个角色，明确它擅长的技能。然后简洁清晰地表述大模型需要完成的任务。期间可以列举示例，让大模型更好地理解需求。最后明确需要输出的格式，比如以markdown的形式输出。这里有一个例子，比如想让大模型做一个旅游攻略，第一种问法就问得很泛，得到的结果会不如人意。而第二种问法，通过向大模型明确角色、任务、步骤等，得到的结果会更加可用。

提示词工程