AI 使用指南

本区用于说明如何更稳定、更低成本地使用蛋蛋。

先选对模型

场景	建议
日常聊天、翻译、总结	选择响应快、价格低的通用模型
代码生成、复杂推理	选择推理或代码能力更强的模型
长文档分析	选择长上下文模型，并控制输入结构
工具调用 / Agent	选择明确支持 tool calls 的模型
向量检索	使用 embedding 模型，不要使用聊天模型

提示词基本结构

text

角色：你是……
目标：请完成……
输入：……
约束：输出必须……，不要……
格式：用 JSON / 表格 / 分点输出……

降低成本的做法

不把无关历史消息一直塞进上下文。
对长文档先切块或摘要，再进入主任务。
能用低价模型完成的任务，不默认用最高价模型。
对重复任务加缓存。
对失败请求做限次重试，不无限循环。

稳定性建议

服务端调用时设置超时时间。
对 429、502、503、504 做退避重试。
重要任务记录请求体、模型名和错误信息。
API Key 按应用拆分，避免一个客户端异常耗尽全局额度。

继续阅读：