Kimi视觉思考版,等不到API,所以暂时网页测了一遍,仅供参考。分数是46分,与GPT4o,豆包,Sonnet在同一级别,低于GLM Zero。Kimi这一版在编程方面改进不大,和先前非思维链版本区别不大,虽然思考了几分钟,但得分率还是不高。数学方面表现中上,中等难度题可以全对,高难度能少量拿分(非思维链版本到此基本全0了),24点...