立即注册  找回密码
 立即注册
CeraNetworksBGVM服务器主机交流会员请立即修改密码Sharktech防护
查看: 30|回复: 4

又出来一个大模型 minimax ... 最近速度好快啊

[复制链接]

又出来一个大模型 minimax ... 最近速度好快啊

[复制链接]

41

主题

66

回帖

549

积分

高级会员

积分
549
欢迎新会员

41

主题

66

回帖

549

积分

高级会员

积分
549
2025-3-12 22:29:04 | 显示全部楼层 |阅读模式
本帖最后由 欢迎新会员 于 2025-3-12 22:30 编辑

MiniMax-01开源:新架构开启Agent时代

https://minimaxi.com/news/minimax-01-%E7%B3%BB%E5%88%97

在 MiniMax-01系列模型中,我们做了大胆创新:首次大规模实现线性注意力机制,传统 Transformer架构不再是唯一的选择。这个模型的参数量高达4560亿,其中单次激活459亿。模型综合性能比肩海外顶尖模型,同时能够高效处理全球最长400万token的上下文,是GPT-4o的32倍,Claude-3.5-Sonnet的20倍。

基于业界主流的文本和多模态理解测评结果如下图所示,我们在大多数任务上追平了海外公认最先进的两个模型,GPT-4o-1120以及Claude-3.5-Sonnet-1022。在长文任务上,我们对比了之前长文最好的模型 Google的Gemini。如图(c)所示,随着输入长度变长,MiniMax-Text-01 是性能衰减最慢的模型,显著优于Google Gemini。

回复

使用道具 举报

41

主题

66

回帖

549

积分

高级会员

积分
549
欢迎新会员 楼主

41

主题

66

回帖

549

积分

高级会员

积分
549
2025-3-12 22:33:37 | 显示全部楼层
嗯,还开源了,虽然我看不懂

https://github.com/MiniMax-AI
回复

使用道具 举报

39

主题

369

回帖

1249

积分

金牌会员

积分
1249
hkbbdx

39

主题

369

回帖

1249

积分

金牌会员

积分
1249
2025-3-12 22:40:11 | 显示全部楼层
试了一下,发现还可以
回复

使用道具 举报

41

主题

129

回帖

673

积分

高级会员

积分
673
laox

41

主题

129

回帖

673

积分

高级会员

积分
673
2025-3-12 22:42:27 | 显示全部楼层
哪家公司的?
回复

使用道具 举报

41

主题

66

回帖

549

积分

高级会员

积分
549
欢迎新会员 楼主

41

主题

66

回帖

549

积分

高级会员

积分
549
2025-3-12 22:50:06 | 显示全部楼层

laox 发表于 2025-3-12 22:42

哪家公司的?

稀宇极智科技(MiniMax)
https://www.thepaper.cn/newsDetail_forward_29692389
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|小黑屋|HS2V主机综合交流论坛

GMT+8, 2025-4-3 01:10 , Processed in 0.017337 second(s), 2 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表