IT 之家 1 月 21 日音问,阶跃星辰昨日上线了 Step-2 系列话语模子的两款新品 —— 参数目小、性价比更高的 Step-2 mini,以及有利针对本色创作限制推出的模子 Step 文豪版。
IT 之家从官方先容获悉,Step-2 mini 和万亿参数大模子 Step-2 比较,以 3% 傍边的参数目保有了其 80% 以上的模子性能。
与此同期,Step-2 mini 领有更快的生成速率和极高的性价比。在输入 4000 tokens 的情况下,Step-2 mini 的平均首字时延仅 0.17 秒。现在,全球如故不错在阶跃星辰灵通平台调用 Step-2 mini 的 API 接口。输入 1 元 / 百万 token;输出 2 元 / 百万 token。
▲ 网页截图
Step-2 mini 采纳了阶跃星辰自主研发的新式详确力机制架构 —— MFA(Multi-matrix Factorization Attention,多矩阵说明详确力)相称变体 MFA-Key-Reuse,比较于常用的 MHA(Multi-Head Attention,多头详确力)架构,从简了近 94% 的 KV 缓存支出,领有更快的推理速率并大幅裁减了推理资本。
据官方先容,Step-2 文豪版是一款专为翰墨本色创作研发的模子开云(中国)kaiyun网页版登录入口,守旧了 Step-2 的常识储备、对翰墨雄壮的细节把控材干,本性在于具有愈加雄壮的本色创作材干。Step-2 文豪版奋发科罚市面上话语模子过度对皆导致的本色"假大空",短缺新意和真情实感的问题。