优惠论坛

标题: 乐天发布“日本最大高性能 AI 模型”,其配置文件显示基于 DeepSeek V3 架构 [打印本页]

作者: 比推快讯    时间: 2026-3-17 17:47
比推消息, 乐天集团发布开源模型 Rakuten AI 3.0,并称其为“日本最大高性能 AI 模型”。该模型采用 MoE 架构,总参数 6710 亿,每次推理激活 370 亿参数,上下文窗口为 128K,针对日语场景进行优化,在多项日语基准测试中表现优于 GPT-4o。
该模型为日本经济产业省与新能源产业技术综合开发机构(NEDO)推进的 GENIAC 项目成果之一,获得部分算力支持。乐天未披露基础模型来源,仅表示基于开源社区成果构建。
社区在 HuggingFace 模型文件中发现,其 config.json 包含“deepseek_v3”及相关架构字段,且参数规模与上下文配置与 DeepSeek V3 一致,显示该模型或基于 DeepSeek V3 进行日语微调。



风险提示: 本新闻涉及的内容仅供参考,不构成投资建议。依据发布的信息以及所表达的意见行事所造成的一切后果由行事者自负。文章链接




欢迎光临 优惠论坛 (https://www.tcelue.cc/) Powered by Discuz! X3.1