大模型产品
国外大模型产品
在前篇文章中,通俗地介绍了大模型的概念原理,本篇将介绍大模型的应用实践。在开始之前,先简单汇总下国内外的大模型产品。目前国外的大模型龙头企业主要有美国的OpenAI,Google,Anthropic和X AI,以及欧洲的Mistral AI。
其中,Open AI是全世界最早做出大模型的公司,当前的产品类型也覆盖最广,除了有全球最优的综合类大模型ChatGPT系列外,在图片、音频和视频等领域也都有相应的头部产品。
Anthropic是由部分从Open AI离职的人创建的,旗下的大模型产品Claude 4.0 Opus,在数学和科学领域超越了人类专家水平。其首创的宪法AI架构,可以使偏见与幻觉率降至0.02%。
Google做为老牌的科技公司,积攒了海量的数据和先进的算法,使得其研发的大模型也有很好的性能表现。旗下的Gemini系列是一个多模态大模型,可以实时接收文字、语音、图像、视频等信息,并进行推理反馈。
X AI入局大模型领域的时机稍晚,但凭借强大的研发能力,使得X AI当前也跻身进大模型的第一梯队。其研发的Grok系列模型,支持实时的数据获取,使得知识时效性全球领先。
Mistral AI被称为欧洲的AI之光,旗下拥有人工智能助手 “Le Chat” 以及多个基础模型。Mistral AI目前专注于小模型和细分领域的小创新,但其早期开源的Mixtral 8x7B模型,带火了混合专家(MoE)技术,在当时引起广泛的讨论。

国内大模型产品
在国外寥寥无几的大模型产品,在国内则是遍地开花,前期曾号称是“百模“大战。传统大厂,如腾讯、字节、阿里、百度等都纷纷入局大模型赛道。此外还有以“大模型六小龙”(智谱、MiniMax、月之暗面、百川智能、零一万物和阶跃星辰)为代笔的新一批AI明星公司,也在迅速发展。国内的大模型产品,在技术侧还处于追赶Open AI的状态,但差距在逐渐缩小。而在产品侧,大部分公司都打磨得较好,如果不是很复杂的任务,基本都能完成。另外国外的大模型产品基本都不能直接访问,需要翻墙,而且生成内容相对自由,会有合规风险。而国内大模型产品绝大部分都可以直接免费使用,这也是国内大模型的一大优势。

大模型基础使用
使用界面
这里以腾讯元宝为例,来看一下大模型的一个常规使用界面。首先可以在聊天框内输入对话,跟大模型进行交流。高亮“深度思考”后,可以将模型切到推理模型,适合做数学,逻辑推理等需要分步骤规划的复杂任务。而高亮联网搜索,可以实时获取网上最新消息,解决知识时效性问题。在右下角可以上传word、pdf和图片。通过这里可以上传垂直领域的私有信息。最后每次切换话题时,建议都新建一个对话,避免不同话题相互影响。

提示词工程
与职场新人向导师提问一样,如何向大模型提问,也是有技巧的。用户输入大模型的内容,叫做提示词。用来触发大模型的响应。而提示词工程就是通过设计结构化的输入,来引导大模型更好地输出。例如可以先为大模型指定一个角色,明确它擅长的技能。然后简洁清晰地表述大模型需要完成的任务。期间可以列举示例,让大模型更好地理解需求。最后明确需要输出的格式,比如以markdown的形式输出。 这里有一个例子,比如想让大模型做一个旅游攻略,第一种问法就问得很泛,得到的结果会不如人意。而第二种问法,通过向大模型明确角色、任务、步骤等,得到的结果会更加可用。

大模型高阶使用
生成思维导图
利用元宝,可快速阅读100多页的财报文件。生成markdown格式的总结后,导入xmind,就可以得到思维导图。该方法可以用到所有需要阅读大量文件,并生成总结的场景中。同时大模型也具备翻译能力,所以也可以上传英语论文,并生成中文的总结。


辅助数据分析
利用元宝,可收集财报数据,生成统计表格,并作可视化展示。其中的财报数据可能因大模型的幻觉问题,导致出错,可以查看引用的数据源,进一步确认。


生成PPT
利用Kimi 的PPT助手,可快速生成PPT。


语言学习
利用豆包,可进行英语的语法、口语练习。该方法适用所有上传图片并和大模型进行对话的场景,例如从海外购买了药妆,可以拍照上传给大模型,咨询成分和使用说明。

AI作图
利用即梦AI ,可以制作精美的图片和视频。


数字人播报
利用腾讯智影,可以生成数字人播报视频。

