MiniMax发布新款开源大模型,称其性价比优于DeepSeek。
6月17日,国内大模型独角兽MiniMax发布世界上第一个开源的大规模混合架构的推理模型MiniMax-M1 ,这也是“MiniMaxWeek”系列发布活动的首个对外发布。
据MiniMax介绍,M1在面向生产力的复杂场景中能力是开源模型中的最好一档,超过国内的闭源模型 ,接近海外的最领先模型,同时又有业内最高的性价比 。
MiniMax披露,M1的优势是支持目前业内最高的100万上下文的输入 ,和闭源模型里面的GoogleGemini2.5Pro一样,是DeepSeekR1的8倍,以及业内最长的8万Token推理输出。
此次MiniMaxM1的最大优势之一体现在成本上。根据M1大模型分析自身的技术优势显示 ,MiniMaxM1采用低成本训练,仅用512块H800GPU三周时间,成本53.47万美元(约385万元) 。
MiniMax称 ,得益于以闪电注意力机制为主的混合架构,从而在计算长的上下文输入以及深度推理的时候显著高效。根据推算,在生成长度为10万tokens的场景下,MiniMax-M1的计算量(FLOPs)为DeepSeekR1的25% ,在长文本处理任务中具备显著优势。
据M1的分析表示,MiniMaxM1的核心优势在于超长上下文处理能力和极低的算力消耗,同时在复杂任务(如工具调用、长文本理解)中表现接近甚至超越DeepSeekR1 ,提供更灵活的API定价策略,尤其适合需要处理百万级token的场景(如法律文档分析 、代码库理解) 。DeepSeekR1则在传统数学推理和编程基准测试中略占优势,但受限于上下文长度和计算效率 ,在长文本任务中明显落后M1。
价格方面,M1在MiniMaxAPP和Web上支持不限量免费使用。在API方面,第一档0-32k的输入长度时 ,输入0.8元/百万token,输出8元/百万token;第二档32k-128k的输入长度时,输入1.2元/百万token ,输出16元/百万token;第三档128k-1M输入长度时,输入2.4元/百万token,输出24元/百万token 。
值得注意的是,DeepSeek已成为大模型厂商对标的“风向标”。此前字节跳动旗下火山引擎最新发布豆包大模型1.6 ,首创按“输入长度 ”区间定价,深度思考、多模态能力与基础语言模型统一价格,称其综合成本只有DeepSeekR1三分之一 ,每生成一条5秒的1080P视频只需3.67元,为行业最低。
不过,被视为集体竞争对手的DeepSeekR1也在持续升级中 。5月29日 ,据DeepSeek公告,DeepSeekR1模型已完成小版本升级,当前版本为DeepSeek-R1-0528。用户通过官方网站、APP或小程序进入对话界面后 ,开启“深度思考”功能即可体验最新版本。API也已同步更新,调用方式不变。
新版DeepSeekR1针对“幻觉”问题进行了优化 。与旧版相比,更新后的模型在改写润色 、总结摘要、阅读理解等场景中 ,幻觉率降低45-50%左右,能够有效地提供更为准确、可靠的结果。
从社交媒体的反馈来看,网友最为关注的是此次DeepSeekR1更新后的思考时间变长。据测评显示,此次DeepSeek单任务处理时长可达30-60分钟 。
杠杆配资网:炒股票哪个平台好-港股IPO火爆!宁德时代首日涨超16% “A+H”上市模式成潮流
多少岁可以炒股票开户:最安全的杠杆炒股平台-中国科研团队发现新稀土矿物“钕黄河矿”
正规股票软件app:中国正规的股票杠杆平台-6月16日东方财富财经晚报(附新闻联播)
股票加杠杆平台:股票配资在线公司-重磅利好!国常会定调 绿色制造风口来袭!12只潜力股曝光
配资实盘平台:配资杠杆比例-小作文蒙对了?巴菲特最新13F表披露建仓15亿美元联合健康
买股票什么平台靠谱:怎么买杠杆股票-央行:6月16日将开展4000亿元买断式逆回购操作
生利配资提示:文章来自网络,不代表本站观点。
...
为贯彻落实党中央关于完善中国特色现代企业制度的战略部署,中办、国办印发《关于完善中国特色现代企业制度的意见》。 意...
记者辛圆据央视新闻周三发布消息,中共中央政治局常委、国务院总理李强4月9日下午主持召开经济形势专家和企...
...
宏景科技5月20日晚间公告,公司近日与“Y公司”签署《智算项目服务合同》,合同总金额为5.97亿元(含税),合同期限...
记者辛圆保护知识产权就是保护创新。3月21日,国家知识产权局、教育部等七部门发布《关于进一步优...
现货黄金突破3240美元/盎司,刷新历史新高,日内涨超2%。...
沪市上市公司资金占用个案进入攻坚化解阶段。5月23日晚,ST东时(603377)、*ST华微(600360)、*ST...