欢迎来到朝三暮四网

朝三暮四网

智谱AI推出第三代基座大模型ChatGLM3 激活了模型智能体能力

时间:2024-05-17 10:27:32 出处:休闲阅读(143)

10月27日,智谱智谱AI在2023中国计算机大会(CNCC)上推出了全自研的推出第三代基座大模型ChatGLM3及相关系列产品。此次推出的第代大模众博国际【Aurl:www.8233066.com】送888元ChatGLM3采用了独创的多阶段增强预训练方法,使训练更为充分。基座

智谱AI推出第三代基座大模型ChatGLM3 激活了模型智能体能力

智谱AI CEO张鹏在现场做了新品发布 ,智谱并实时演示了最新上线的推出产品功能 。据介绍 ,第代大模通过更丰富的基座训练数据和更优的训练方案 ,智谱AI推出的智谱ChatGLM3性能更加强大。与ChatGLM2相比  ,推出MMLU提升36%、第代大模众博国际【Aurl:www.8233066.com】送888元CEval提升33%、基座GSM8K提升179% 、智谱BBH提升126% 。推出

智谱AI推出第三代基座大模型ChatGLM3 激活了模型智能体能力

同时,第代大模ChatGLM3瞄向GPT-4V本次实现了若干全新功能的迭代升级,包括多模态理解能力的CogVLM-看图识语义 ,在10余个国际标准图文评测数据集上取得SOTA;代码增强模块Code Interpreter根据用户需求生成代码并执行 ,自动完成数据分析、文件处理等复杂任务;网络搜索增强WebGLM-接入搜索增强 ,能自动根据问题在互联网上查找相关资料并在回答时提供参考相关文献或文章链接。ChatGLM3的语义能力与逻辑能力得到了极大的增强。

智谱AI推出第三代基座大模型ChatGLM3 激活了模型智能体能力

ChatGLM3还集成了自研的AgentTuning技术 ,激活了模型智能体能力,尤其在智能规划和执行方面,相比于ChatGLM2提升了1000% ;开启了国产大模型原生支持工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景。

此外,ChatGLM3本次推出可手机部署的端测模型ChatGLM3-1.5B和 ChatGLM3-3B,支持包括vivo、小米 、三星在内的多款手机以及车载平台 ,甚至支持移动平台上CPU芯片的推理,速度可达20 tokens/s 。精度方面1.5B和3B模型在公开benchmark上与ChatGLM2-6B模型性能接近 。

基于最新的高效动态推理和显存优化技术,ChatGLM3当前的推理框架在相同硬件、模型条件下,相较于目前最佳的开源实现,包括伯克利大学推出的 vLLM 以及Hugging Face TGI的最新版本 ,推理速度提升了2-3倍 ,推理成本降低一倍,每千tokens仅0.5分。

分享到:

温馨提示:以上内容和图片整理于网络,仅供参考,希望对您有帮助!如有侵权行为请联系删除!

友情链接: