
2月11日,科大讯飞厚爱发布基于世界产算力老师的星火X2大模子。从X1.5到X2,升级有两大亮点:
1、通用智商全面升级,星火X2全体智商对标国外顶尖模子水平,在数学、推理、话语贯通、智能体等智商上比好意思国外最优;130+多话语概述智商不时普及,拉好意思、东盟等地区重心语种成果保握业界起首水平。
2、依托星火X2的算法打破、行业高质地数据集以及专科念念维链的强化学习,星火行业大模子握续升级,居品专揽决策获取显耀越过。
这次面向关节行业落地的实用化升级,象征着我国基于世界产算力老师的大模子底座在算法和工程翻新方面迈入新阶段。星火X2在竣事通用智商全面升级的同期,愈加专注于种植、医疗、汽车、智能体等高专科性、高体验性场景,起劲于为这些鸿沟提供起首、可靠的手艺决策与复古。
{jz:field.toptypename/}赋能医疗,专科智商握续普及并保握业界起首,个东说念主健康助手各项智商在业界率先通过巨擘评测考据,“讯飞晓医”APP全面升级;
赋能种植,法子级删改、错因定位等手艺进一步扩大全球起首上风,业界首发错因王人集的个性化学习智商,让启发式种植更契合学生念念路,鼓动AI学习机等居品竣事更精确的自主学习闭环,进一步普及孩子学习兴味与学习效用;
面向汽车智能座舱的星火中小尺寸模子同步升级,智能交互实车评测行业全面起首,费解意图成果从透顶不可用达到基本好用,让汽车像老一又友聊天相通精确听懂你的“潜台词”;
星辰Agent平台全新升级,进一步强化了“会念念考能试验”的杰作智能体构建智商。智能体数目依然卓越130万,看成企业级智能体平台,在复杂行业场景任务上进一步惩办用户关节刚需。
据「TMT星球」了解,即日起,星火X2的最新智商可径直在讯飞星火网页版和APP体验,全新API也已上线讯飞盛开平台,握续解放出产力;星火APP5.2.0新版块同步上线,进一步强化了更懂你的AI助手。
星火X2来了,多项中枢智商发扬握续杰出
这次星火X2通用智商全面升级,全体智商对标国外顶尖模子水平,在数学、推理、话语贯通、智能体等智商上比好意思国外最优;同期,星火X2的130+多话语概述智商不时普及,拉好意思、东盟等地区重心语种成果保握业界起首水平,为跨话语种植、医疗与产业专揽提供可靠复古。
星火X2通过量化单台昇腾就业器即可运转。星火X2接收293B MoE疏淡架构,勾通权分量化、低精度KVCache、VTP(Virtual Tensor Parallel)、分层通讯等多种工程化翻新,竣事了国产大EP并行部署,推感性能比拟X1.5普及50%。
星火大模子多尺寸中小模子同步升级,在办公本、翻译机、汽车座舱交互等场景的中枢成果显耀普及。
通用大模子中枢智商成果对比
外部公开高难任务成果对比
*测试聚合来源:基础智商测试集(转化刷新),来自海量果真大模子申请任务脱敏数据,包括讯飞星火APP、API果真确立者场景、以及种植、医疗等行业中枢任务。公开测试集以数学、答题、推理、代码、智能体等外部典型Benchmarks为主。
如故用沿途题来试试成果:
这是2025年11月哈佛-麻省理工数学锦标赛(HMMT)里的沿途英文题目,难倒国内主流模子,但星火X2在分析念念考后,不仅给出了正确谜底,还给出了醒主宗旨题过程。
再来望望星火X2能不行解答西班牙语数学题:
依旧是快速给出醒目解题过程以及正确谜底。
星火X2智商的显耀升级离不开手艺的握续翻新打破,典型使命包括:
训推采样校准强化学习算法
针对MoE大模子RL老师中的训推分散不一致问题,提议老师与推理概率重采样自稳妥校准算法,大幅普及强化学习老师准确率和贯通性。
递归式高难数据合成步伐
针对高难任务数据稀缺问题,筹划多轮迭代式推导的数据合成决策,竣事推理乖张安然矫正与管理,握续构建稀缺型高质地数据,普及模子深度推理准确率。
多阶段RL高吞吐采样步伐
筹划P/D(Prefill/Decoder)两阶段差异的多阶段推理采样决策,惩办国产化平台强化学习高吞吐采样情况下的效用搅扰问题,老师效用普及10%。
就业高性能部署优化算法
通过模子轻量化压缩,完成国产机器的单机大EP并行部署,推感性能比拟星火X1.5普及50%,竣事大模子在国产平台的轻量化落地与高效推理双重打破。
鼓动行业大模子升级更懂你的Al再越过
实用性是磨练大模子智商的硬圭臬。依托星火X2的算法打破、行业高质地数据集以及专科念念维链的强化学习,星火行业大模子握续升级,澳门新浦京游戏下载在种植、医疗、法则、汽车交互、企业智能体专揽等关节场景发扬一新,在功能和成果层面竣事全面升级,“更懂你的AI”再进一步。
赋能医疗 各项智商握续保握显耀起首
星火X2底座赋能医疗,助力星火医疗大模子中枢智商全面普及并握续保握业界起首。基于住户健康档案的智能健康分析、智能报告解读、畅通饮食建议、扶直谐和、智能用药审核等关节任务上,模子智商均显耀超越DeepSeek V3.2、GPT-5.2和Qwen3-Max。
*测试聚合来源:按照《医疗健康行业大模子专揽手艺条件》,基于脱敏果真用户数据及住户健康档案,构建全新测试聚合MedLLM-EHR-EVAL-V2。
星火医疗大模子围绕个东说念主健康助手的各项智商已率先通过上海市医疗大模子专揽检测考据中心评测考据。(备注:上海市医疗大模子专揽检测考据中心为国内首个面向医疗大模子专揽评测和考据的平台,由上海AI实验室牵头打造,华山病院、中山病院、瑞金病院等12所医疗机组成为中心首批考据单元。)
在此基础上,“讯飞晓医”APP各项智商全面升级,多轮主动问诊、多轮咨讨论答、问用药、检查磨练单解读、体检报告单解读等健康参谋任务在业界握续保握显耀起首。
*测试聚合来源:测试聚合基于线上个东说念主健康参谋的果真场景脱敏数据立地抽样。
另外,讯飞晓医的语音交互对话智商亦然本次升级的一个蹙迫特点,接待群众体验。
面向用户的健康刚需,讯飞晓医因为更专科是以更让东说念主省心~
赋能种植 率先竣事错因王人集个性化学习智商
新版块的星火X2底座全面赋能种植,法子级删改、错因定位等手艺进一步扩大全球起首上风。勾通起首的多学科答题及推贤慧商,业界率先发布错因王人集的个性化学习智商。数学法子级删改成果进一步普及,同期支握更精确的错因定位,在答疑上竣事契合学生本东说念主念念路的启发式种植,干系手艺握续保握业界起首,并鼓动专揽生效显耀普及。
*测试聚合来源:测试聚合基于备讲课、考试、功课、学习等果真场景脱敏数据立地抽样。
面向学生自主学习场景,科大讯飞AI学习机在1对1精确学、答疑率领和互动课等成果握续普及。依托更精确的法子级删改智商,会诊精确率、策动合理率和辅学启发性成果起首行业,竣事个性化、启发式、策动性教训,进一步普及孩子学习兴味与学习效用。
赋能汽车 智能座舱交互系统全面升级
基于星火X2升级,在汽车鸿沟,2B、7B、30B-A3等多尺寸中小模子同步升级,助力汽车智能座舱交互系统全面普及,在东说念主东说念主/东说念主机对话判断、费解意图贯通、高情商回应等方面交互体验显耀普及。很是是费解意图交互成果竣事跨越式打破,从透顶不可用普及至基本好用水平,实车评测业内全面起首,勾通星火多模态大模子感知贯通智商,信得过竣事座舱内解放、当然的东说念主机交互体验。
星辰Agent平台和杰作智能体 成果全新升级
星火X2的智能体智商,在万古复杂任务策动、多器具组合调用以及长陡立文等方面均竣事了显耀普及。
星辰Agent平台全新升级,进一步强化了“会念念考能试验”的杰作智能体构建智商。刻下智能体数目依然卓越130万,看成企业级智能体平台,已整合语音交互、语音识别、图像贯通等百余种杰作盛开平台智商,丰富企业级场景专揽器具生态,复古快速构建企业场景中的更复杂、更实用的杰作智能体。
面向企业采购场景的招采智能体,在招标文献合规检测、供应商天禀核验、投标相当行动检测等中枢场景,效用普及超3倍。同期,支握企业像搭积木相通极速定制专属招采各人,专用智能体确立从底本的几天压缩至分钟级,助力企业精确风控、高效降本。
面向行业深度分析的星火行业行家居品,针对动力、农粮等行业的专科商情分析鸿沟进行深度交融,勾通产业图谱推理和分析,显耀裁减幻觉。商情信息知悉及扶直决策时刻从“周”裁减到“天”,为客户快速决策提供实时的手艺复古。
联袂确立者,握续共开国产化大模子茁壮生态
讯飞星火已上线最新的星火X2,握续打造更懂你的AI助手。一键开启语音对话,快速反馈你的需求。很是是面向年青东说念主求职和学习普及需求,本次重心升级了科研助手和求职助手,全过程扶直用户找使命和写论文。
讯飞盛开平台已厚爱上线星火X2 API。讯飞盛开平台新注册确立者不错领取最多100万Tokens免费额度,让模子智商以更低本钱干预果真确立与限制化考据。从模子进化到API限制化盛开,再到果真场景的握续落地,星火X2面向全球超1000万确立者分享更强贯通力与试验力的深度推贤慧商。
星火X2升级,不仅是一次算法和工程的翻新,更是基于世界产算力老师的大模子在惩办行业刚需问题上的跃升。
咱们诚邀每一位用户、确立者、行业伙伴共同体验,在果真的业务场景中磨练实用价值,握续将全栈自主可控的国产大模子推向安全委果、高效贯通的限制化专揽。

备案号: