大模型 on 墨然

大模型 on 墨然https://moran.is-a.dev/categories/%E5%A4%A7%E6%A8%A1%E5%9E%8B/Recent content in 大模型 on 墨然Hugozh-cnMon, 15 Dec 2025 18:22:00 +0800评测大模型别只看榜单：我给它出的 30 道“小考卷”https://moran.is-a.dev/posts/llm-evaluation-playbook/Mon, 15 Dec 2025 18:22:00 +0800https://moran.is-a.dev/posts/llm-evaluation-playbook/榜单像体检报告的平均分，真正重要的是：你的业务里它会在哪些题上失手。推理服务别只盯模型：我踩坑后总结的三件小事https://moran.is-a.dev/posts/llm-serving-basics/Sun, 30 Nov 2025 14:06:00 +0800https://moran.is-a.dev/posts/llm-serving-basics/用户觉得“模型不稳定”，很多时候是网关、队列、超时策略在暗地里打架。微调？RAG？还是提示词？我用一张“决策树”把自己救了https://moran.is-a.dev/posts/llm-finetune-rag-prompt/Thu, 06 Nov 2025 09:28:00 +0800https://moran.is-a.dev/posts/llm-finetune-rag-prompt/别一上来就想着“训练一个更懂我的模型”。很多时候，你缺的不是更聪明的模型，而是更清楚的需求。同一句话第二次更快：我终于把 KV Cache 想明白了https://moran.is-a.dev/posts/llm-kv-cache/Wed, 22 Oct 2025 20:18:00 +0800https://moran.is-a.dev/posts/llm-kv-cache/KV Cache 听起来像黑魔法，其实它更像“你翻过的页不需要再翻一次”。上下文窗口这事儿：我怎么让大模型“别忘太快”https://moran.is-a.dev/posts/llm-context-window/Fri, 12 Sep 2025 10:05:00 +0800https://moran.is-a.dev/posts/llm-context-window/我以前总以为模型“记性差”，后来才发现：很多遗忘是我自己喂的内容太乱。