测试问题 1:What is tomorrow in relation to yesterday’s today?(昨天的当天是明天的什么?) GPT-3.5 回复:Yesterday(昨天) GPT-4 回复:Past(前天) 测试问题 2:There are 9 birds in the tree, the hunter shoots one, how many birds are left in the tree?(树上 9 只鸟,打掉 1 只,还剩几只?) ...
这里可以有很多变种,例如:把昨天改成前天。 测试问题 2:There are 9 birds in the tree, the hunter shoots one, how many birds are left in the tree?(树上 9 只鸟,打掉 1 只,还剩几只?) GPT-3.5 回复:8 只 GPT-4 回复:0 只,其他被吓跑了 这里可以有很多变种,例如:把鸟改成蝴蝶,改成猫头鹰等...
经典RAG很难解决的问题 需要多步处理的RAG场景和Agentic RAG思路#人工智能 #大模型 #gpt4 #openai #上热门🔥 - 文哲谈AI - 大模型咨询于20240829发布在抖音,已经收获了14.6万个喜欢,来抖音,记录美好生活!
得悉菲尔兹奖得主亲自测试GPT-4o并未能成功解决经典过河难题后,整个科技界掀起了一场激烈的讨论。GPT-4o作为最新一代的自然语言处理模型,备受瞩目,然而其在面对这一经典难题时的表现却让人感到意外。过河难题是一个被广泛用于测试AI智能和逻辑推理能力的问题,它有助于评估模型在处理复杂情境时的表现。菲尔兹奖得主在...
M4跑最新Phi4 14B竟比M3快2倍 | 微软最新发布的生成式人工智能模型 Phi-4(14B)在多个基准测试中表现出色,尤其在数学(MATH 80.4%)和代码生成(HumanEval 82.6%)方面,超越了许多更大规模的模型,如 GPT(40B)。由于比较新,ollama libary 还没上架,所以直接在LM Studio找了一个q4_k_版本,还是问经典问题:吕洞宾...
每天抽出30分钟,开启外刊精读之旅。给2024年画下漂亮的结尾🐲课程话题这一季我将精选《经济⛄️人》等外刊,2023-2024年,20大热点话题。东亚家庭、ChatGPT改变教育、跨境电商、独居时代上海猫岛...10篇精读+10篇泛读,经典又有趣...
2024年全新课程外刊精读社·第5季,马上开课啦!请同学们速速入群👭🏻 🐲课程话题 这一季我将精选《经济⛄️人》等外刊, 2023-2024年,20大热点话题。 东亚家庭、ChatGPT改变教育、韩国女性生育罢工、上海猫岛、学历贬值......
凌晨OPENAI宣布大模型GPT4o1发布,新模型据说大幅度增强了推理个数学能力。我也首发来个经典数学问题测试,结果有点失望。#openai #GPT4o1 #GPT4 #大语言模型 #aigc - AIGC创想世界于20240913发布在抖音,已经收获了1672个喜欢,来抖音,记录美好生活!
2024年12月26日DeepSeek宣布上线,并同步开源DeepSeek - V3模型,该模型在数学代码能力和中文知识问答方面超越ChatGPT-4。2025年1月20日,梁文锋发布DeepSeek - R1模型。梁文锋的学习方法也值得家长们引导孩子借鉴:1、暴力穷举法:梁文锋为破解几何难题,自创“坐标系穷举法”,每天花3小时遍历所有辅助线可能。这启示孩子们...
每天抽出30分钟,开启外刊精读之旅。 🐲课程话题 这一季我将精选《经济⛄️人》等外刊, 2023-2024年,20大热点话题。 东亚家庭、ChatGPT改变教育、 跨境电商、独居时代 上海猫岛... 10篇精读+10篇泛读, 经典又有趣,紧跟时事!...