百川大模型发布,国产AI助手「百小应」正式上线
目标大模型“超级应用”。
最近几天,国内AI创业公司正在连续刷新大模型的能力上限。
5月22日,百川智能发布了最新一代基座大模型Baichuan4,并推出首款AI助手“百小应”。
相较于1月份发布的Baichuan3,新一代模型在各项能力上均有显著提升。其中,通用能力提升了10%,数学和代码能力分别提高了14%和9%。
在权威的大模型评测机构SuperCLUE的评测中,Baichuan-4大模型在国内排名第一,超越了SenseChatV5。
“在通往AGI的路上,我们需要超级模型与超级应用双轮驱动。这是百川自去年成立以来确立的基本理念。”百川智能创始人、CEO王小川表示,“模型能力和超级应用都非常重要。这次发布是我们在这条道路上的进步。”
本次更新的 Baichun 大模型首次增加了多模态功能。百度表示,新模型在各大评测基准上表现优异,比 Gemini Pro 和 Claude3-sonnet 等多模态模型都领先很多。
尽管带来了多模态能力,但接下来的技术发展规划中,自然语言仍然是重点。王小川表示,大模型的核心是语言智能,推理能力仍然需要突破,而多模态只是对世界的复现,并没有智力。他认为有足够好的逻辑是更加重要的事。他指出今天的大模型自洽性都不够,模型思考缺乏严谨性。他认为长文本只是做大的必要条件,并不是充分条件。他认为模型本身未来更要强调内在的自洽性和推理能力,这两件事并不是靠长窗口去解决的。
在 Baichuan 4 强大能力的基础上,百度智能将搜索技术与大模型深度融合,推出懂搜索、会提问的 AI 助手「百小应」。
百小应不仅能够迅速解答用户的各种疑问,并且还能进行快速阅读和文件整理,辅助创作。它具备多轮搜索和定向搜索的能力,能更精准地理解用户需求,为用户提供专业的知识和丰富的资源。
此外,百小应在回答问题的基础上通过一系列提问帮助用户明确自身需求,从而给出更为准确的答案。
目前,百小应已经在Web端、iOS和Android应用商店同步上线,并提供了链接:ying.baichuan-ai.com/chat。同时,百川智能还宣布开放了Baichuan 4、Baichuan3-Turbo、Baichuan3-Turbo-128k以及Assistant API四款API。所有开发者和企业用户都可以登录百川智能的开发者中心选择并接入相应的API,以便捷高效地体验百川智能新一代模型的强大能力。
开发者体验中心:platform.baichuan-ai.com/playground
新模型实力国内领先
多项功能超越国外主流系统
作为百川智能推出的新一代基座大模型Baichuan 4,在国内权威的大规模语言测评机构SuperCLUE的评估中,其能力位居全国第一。相比上一代大模型Baichuan 3,我们进行了显著提升。
此外,当与国际主流的大语言模型进行比较时,Baichuan4 在处理文科类的中文任务——如知识库检索、长篇文本和创造性的内容生成方面表现得更为出色。
Baichuan 4 在短时间内取得显著突破的原因在于其在训练过程中采用了多项业界领先的优化手段。例如,在预训练阶段,它使用了基于 Model-based+Human-based 的协同数据筛选优化方法,并对长文本建模位置编码科学的 Scaling Law 进行了优化,这有效地提升了模型对数据的利用效率。
在对齐阶段,新模型特别关注了推理、计划和遵循指令的能力。通过损失驱动的数据选取与训练,多阶段爬坡以及多模型参数融合等方式,显著提升了关键指标和稳定性。同时,突破性地引入 RLHF 和 RLAIF 融合的 RLxF 强化学习对齐技术,大幅提升了模型的指令遵循能力。
此外,Baichuan 4 在行业领先的多模态性能上表现尤为出色。在 MMMU、MMBench-EN、CMMMU、MMBench-CN 和 MathVista 等评测基准上,它表现出色,远超 Gemini Pro、Claude3-sonnet 等多模态模型。
首款AI助手「百小应」
这款由百川智能推出的AI产品,其核心在于搜索和提问能力。百川智能认为大模型创造出了全新的物种,赋予了AI伙伴的角色。尽管目前的应用还无法实现如人类一样使用工具、思考和拥有情感的能力,但随着模型能力的不断进步,这些应用将会逐渐具备完整的功能。
为了给用户带来更优质的智能体验,「百小应」巧妙融合了Baichan 4在行业领先的通用能力和百川智能的搜索技术。它具有多步搜索和智能定向搜索的功能,能够逐步解析问题,深入探究核心答案,适用于复杂市场调研和产业分析等场景。
在搜索结果呈现方面,「百小应」不仅在信息总结上不同于其他应用,在展示结构化数据和引用来源时也更为优秀。同时,其定位需求能力的提升使得用户能获得更精准的答案。
此外,对于一些无法明确表达自己需求或者问题过于笼统、抽象的情况,「百小应」会通过反问的方式进行多轮交互,构建个性化解决方案,并提供更准确的答案。
除了搜索和提问功能之外,用户还能通过上传PDF、Word文档或直接输入网页链接(URL)来阅读长篇内容。在Baichuan 4的多模态能力的支持下,它不仅能回答问题,还可以同步处理图片信息,通过语音方式进行交互,从而实现更全面的信息解读。
MaaS 和 AaaS 服务:百川智能的智能化新方案
企业客户需要的是生产力和生产效率的提升,而不是大模型本身。百川智能推出 MaaS+AaaS 服务,结合基础模型(MaaS)和代理服务(AaaS),为企业提供最佳解决方案。
MaaS 版块包含旗舰版和专业版,旗舰版全面开放 Baichuan 4 的能力,包括金融知识和问答能力,相比 GPT3.5 整体效果提升 8.9%。而 AaaS 则提供 Agent 代理服务,通过 Assitants API 连接各种 API,并支持自定义工具调用。
百川智能表示,即日起,新用户可以获得 MaaS 的 1000 万免费 token。Assitants API 是针对 Baichuan 4 开发的 API 接口,支持 Code interpreter、RAG 内建工具,以及自定义工具调用,方便企业接入复杂 API。
未来,百川智能将推出零代码 Agent 创建平台产品,让业务人员通过自然语言创建 Agent,并赋能企业智能化发展。此外,百小应则是百川智能在超级应用领域的重大一步,面向消费端市场。