跳到正文
墨然
首页 归档 分类/标签 导航 订阅
关于我 Profile 友链 Friends
统计
音乐
音乐封面
音乐

正在加载歌单…

0:00/0:00

主题色相
首页 归档 分类/标签 导航 订阅 关于 友链 统计
墨然 的头像
墨然

程序猿一枚,喜欢瞎捣鼓 . never stand still

RSS订阅 Email

标签

评测

当前主题下的文章集合。左侧给出上下文,右侧继续探索其他线索。

2items
全部标签
返回标签

标签

评测

按标签归档的文章集合

2篇文章

大模型 2025-12-15 · 1 min read

评测大模型别只看榜单:我给它出的 30 道“小考卷”

榜单像体检报告的平均分,真正重要的是:你的业务里它会在哪些题上失手。
#大模型 #评测 #可靠性
阅读全文
AI 2025-11-24 · 1 min read

我开始给 AI 做“体检”:不是为了挑刺,是为了别被它骗

模型的“自信”不等于正确。做一套小小的评测题库,比吵架更有效。
#AI #评测 #可靠性
阅读全文

Explore

标签
AI13AI Tools9开源7大模型5
#AI#AI Coding#大模型#AI Agent#开发工具#开源#提示词#Claude Code#LLM#RAG

Latest

全部
Codex++:它不是让 Codex 变聪明,而是把 Codex App 的缝补上 06.16 Obsidian 入门:它不是更漂亮的备忘录,而是一套本地知识库 06.07 Graphify:把你的项目变成一张知识图谱,然后问它你没想到的问题 06.02 RTK:我试了下这个“省 token”的小工具,感觉它更像 AI Coding 的消音器 05.28
墨然 © 2025 墨然. Built with Hugo & Tailwind concept.
RSS 订阅 友情链接 相关项目 关于本站