两套预设不是功能,是默认值。
ByteSpike 默认给每个账号搭载两套精选模型包 —— 全球版 / 中国版,开账号那一刻已经选好一套生效。我们被问过为什么不直接让管理员第一天就从 30 个模型里挑。这篇说一下原因。
我们做权限模板的第一版没有预设。管理员打开空白编辑器,看到一份 30+ 模型带能力标签的清单,需要自己拼出一套搭配。我们看着四个 pilot 团队打开这个页面,滚动一下,然后关掉了 tab。
不是编辑器难用。是「从零拼一套模型栈」本身是一个真正的工程决策 —— agent 主脑选谁、廉价路由用什么、要不要图像生成、DALL·E 和 Seedream 你更信哪个 —— 打开页面的管理员可能是个财务负责人在给团队 onboarding。一个周二下午,他们就不是做这个决策的合适人。
两个预设,不是二十
我们最后定了两套 —— 全球版和中国版 —— 出于和大多数配置类 UI 一样的理由:再多就不是同一个决策问题。两套时你在选「你在线的哪一边」;五套时你又回到了「几个之间排序」,冷启动问题又出来了。
这个划分不是出于政治考虑。而是「经常一起部署」的模型往往同源 —— 跑英语 SaaS 负载的团队基本会聚到 Claude + GPT + Gemini + DeepSeek;做 PRC 合规或者处理 PII 敏感数据的团队基本会聚到 DeepSeek + Doubao + GLM + Kimi + MiniMax。预设只是把大家本来就在做的事写下来。
四个 bucket,不是九个
每套预设内部,模型按四个产品语言层面的 bucket 分类。不是网关后端返的那八九个细粒度 capability —— 那些适合做账,但不是你给一个非技术同事解释 LLM 在做什么时用的语言。
- 主脑 / Agent core — agent 循环主用的模型。对话、工具调用、推理。选错时真烧钱。
- 识图 / Vision — 读图模型。截图问问题、OCR、配图描述。和主脑配合即可多模态。
- 图像生成 / Image generation — 出图模型。物料预览、广告创意多版本、简单插图。
- 外脑 / Auxiliary — 视频生成、向量、TTS、STT。多模态栈里「有时候需要、但不构成脊柱」的部分。
三个 bucket 太粗(把识图并进主脑,丢掉了「我要 OCR 但不要对话」的场景)。五个有点凑(多出来的那个通常是把 TTS 或视频单拎一行,结果在大多数账号里这行是空的)。四个是我们 onboard 过的每个团队都至少在每格里有内容的最小集合。
预设是叠加,不是上锁
预设是起点,不是合同。先应用全球版,再把廉价对话换成 DeepSeek Flash —— 适合 China-based 团队做英文产品的场景。先应用中国版,再单独给法务岗位加一个 Claude Sonnet —— 适合合规审过的特定职能。自定义模板存为 engineering-pack / marketing-pack / 你叫什么都行;每个成员还可以在模板基础上再加 override。
网关在请求时对三层取交集:组织的可调用模型池 ∩ 分配的模板 ∩ 成员的 override(如果有的话)。最窄的那一层生效。所以预设给你前 80% 的决策;剩下 20% 是针对真实工作流的精修,不是在配置页面里磨洋工。
下一步
我们在跟进三个后续预设面:一套按 per-token 价格排的「Cheap mix」(适合高量分类 / 路由)、一套按 p50 latency 排的「Fast mix」(适合交互式 agent)、以及个人账号级的「personal preset」 —— 你自己命名的搭配,跨项目复用,不需要走团队模板。这些都得等当前两套预设的真实反馈回来再做。把你的意见发给我们。
如果你想看具体的模型列表:console.bytespike.ai/dosia/models 是终端用户视角;console.bytespike.ai/org/templates 是管理员编辑器。