deepseek-v4-flash vs minimax-m2.7

由于不怎么喜欢ds,一直到opencode订阅限时免费用v4 flash才试着蹬了一会儿,没想到我(果然)是大怨种。

给定同一份代码库(python+fastapi后台,vue3前台)和同一份需求,分别让deepseek v4 flash(思考等级high)和minimax m2.7,两个规模和年代相近的模型生成计划。然后让gemini3.1pro做裁判。

我来当裁判的话,m2.7也是逊于v4flash的,minimax刷分嫌疑很重,有些跑分榜超过gemini3flash很多但是实际体验上差了一截。而ds v4 flash已经非常接近互有胜负了。ds的架构思维比较好,在阅读代码的时候也会体现出来,对没有文档的旧代码库理解更透彻(甚至略微强于gemini3flash)。

 

提示词

以上是两个ai针对一样的代码和一样的需求“xxx”提出的两份修改计划,你来裁判哪个比较好,提出详尽的细节代码不作为加分项,侧重考虑宏观层面。

 

例子1

背景:后来加了一个基于谷歌adk的ai agent功能,独立于原有的普通聊天机制和配置,没有从原数据库(带配置界面)中读取模型配置。

需求:将后台agent的大模型配置,包括模型,url,apikey,改成从现有数据库配置项读取

结果:ds胜出

 

暂无评论

发送评论 编辑评论


				
上一篇