Skip to content

AI 使用指南

本区用于说明如何更稳定、更低成本地使用 蛋蛋。

先选对模型

场景建议
日常聊天、翻译、总结选择响应快、价格低的通用模型
代码生成、复杂推理选择推理或代码能力更强的模型
长文档分析选择长上下文模型,并控制输入结构
工具调用 / Agent选择明确支持 tool calls 的模型
向量检索使用 embedding 模型,不要使用聊天模型

提示词基本结构

text
角色:你是……
目标:请完成……
输入:……
约束:输出必须……,不要……
格式:用 JSON / 表格 / 分点输出……

降低成本的做法

  • 不把无关历史消息一直塞进上下文。
  • 对长文档先切块或摘要,再进入主任务。
  • 能用低价模型完成的任务,不默认用最高价模型。
  • 对重复任务加缓存。
  • 对失败请求做限次重试,不无限循环。

稳定性建议

  1. 服务端调用时设置超时时间。
  2. 对 429、502、503、504 做退避重试。
  3. 重要任务记录请求体、模型名和错误信息。
  4. API Key 按应用拆分,避免一个客户端异常耗尽全局额度。

继续阅读:

蛋蛋文档中心用于说明购买、接入、API 调用和故障排查流程。