Appearance
AI 使用指南
本区用于说明如何更稳定、更低成本地使用 蛋蛋。
先选对模型
| 场景 | 建议 |
|---|---|
| 日常聊天、翻译、总结 | 选择响应快、价格低的通用模型 |
| 代码生成、复杂推理 | 选择推理或代码能力更强的模型 |
| 长文档分析 | 选择长上下文模型,并控制输入结构 |
| 工具调用 / Agent | 选择明确支持 tool calls 的模型 |
| 向量检索 | 使用 embedding 模型,不要使用聊天模型 |
提示词基本结构
text
角色:你是……
目标:请完成……
输入:……
约束:输出必须……,不要……
格式:用 JSON / 表格 / 分点输出……降低成本的做法
- 不把无关历史消息一直塞进上下文。
- 对长文档先切块或摘要,再进入主任务。
- 能用低价模型完成的任务,不默认用最高价模型。
- 对重复任务加缓存。
- 对失败请求做限次重试,不无限循环。
稳定性建议
- 服务端调用时设置超时时间。
- 对 429、502、503、504 做退避重试。
- 重要任务记录请求体、模型名和错误信息。
- API Key 按应用拆分,避免一个客户端异常耗尽全局额度。
继续阅读:
