博客
来自网关的工程笔记。
工程决策、模型评测、以及偶尔的有观点的文章。
两套预设不是功能,是默认值。
ByteSpike 默认给每个账号搭载两套精选模型包 —— 全球版 / 中国版,开账号那一刻已经选好一套生效。我们被问过为什么不直接让管理员第一天就从 30 个模型里挑。这篇说一下原因。
5 分钟DOSIA × ByteSpike:一个 Agent,全套能力
做一套营销物料不该开 3 个 app。DOSIA 主脑现在原生具备生图、看图、视频、'换个 LLM 写'这些能力 —— 一次 OAuth 连上 ByteSpike,之后你直接说你要什么。
7 分钟"失败不计费" 到底是怎么实现的
每次 ByteSpike 调用都带一份预扣 credit reservation + 成功才 settle 的 commit。reservation 在 upstream 报错 / 用户 cancel / 网关超时时过期 — 账户账本只在有 asset 或 token 流真到位时扣账。
5 分钟Marketing / Console / Docs —— 为什么 ByteSpike 用一个仓库发三个应用
ByteSpike 站由三个独立应用挂在三个子域名:bytespike.ai 营销、console.bytespike.ai 客户后台、docs.bytespike.ai Mintlify。三者共享 design token、locale、部署策略 —— 但发布节奏、攻击面、bundle 体积差异够大,强行合并的成本比留这条接缝更贵。
5 分钟live channel vs scaffold estimate —— /pricing 表格 badge 到底说什么
/pricing endpoint 表每行带一个小 status badge。"live channel" 是从网关 admin export 拉到的真实定价、我们今天就这价收。"scaffold estimate" 是该 endpoint 通道还没接上时的保守公开 list-price 估算。这条分界是有意暴露给读者的;这里讲为啥。
4 分钟为什么 ByteSpike 自己不做 chat UI
每个多 provider 网关迟早会被问 "你们 chat playground 在哪?" —— 通常紧跟着有人提出要帮我们做。到目前为止我们拒了 5 次。这里讲算账逻辑。
4 分钟Next 15 SSG cache 跑自托管 nginx —— 一次踩坑记录
我们花了一整天盯着 stale 的生产 HTML 才发现:Next 15 默认给每个 prerender 页面发 `s-maxage=31536000`、`export const revalidate = N` 并不改 emit 的 Cache-Control(只改 ISR 后台计时器)、我们自托管的 nginx 对此一无所知。下面是修法。
4 分钟做多 provider 网关,我们踩过的 5 个坑
ByteSpike 第一版不是这个形状。下面 5 个决定是上生产之后被我们回滚的 —— 写下来便宜、亲历贵。
6 分钟5 分钟接入 ByteSpike — 从下载 DOSIA 到第一次对话
5 步、约 5 分钟:装 DOSIA、注册 ByteSpike、生成 API key、在 DOSIA Settings 接好 provider、发出第一条 prompt。结束时你将用一把 key 路由 Claude / GPT / Gemini / DeepSeek,并看到每条请求的成本停在分级以下。
5 分钟DOSIA × ByteSpike — 一支团队、两个产品、一条工作流
DOSIA 是桌面客户端,ByteSpike 是多 provider 网关。两个产品分开发版是刻意为之 —— 但组合起来才是我们团队真正想要的形态:一个账户、一把 key、一份账单、所有前沿模型。
5 分钟一把 key 通图像 / 视频 / 音频 / embedding
ByteSpike 的多模态端点跟文本模型共用同一把 Anthropic 风格 key —— 图像、视频、embedding、rerank。这里讲我们自己在用的 3 个模式,以及让试错很便宜的失败不计费语义。
6 分钟一把 key,两套协议:ByteSpike 为什么让 DeepSeek 同时跑 OpenAI 和 Anthropic 形式
DeepSeek 的 HTTP API 同时支持两套协议。我们用一把 ByteSpike key 包了两个 endpoint,让你的 Agent 代码和 Chat 代码可以用同一个模型,而不用同时拿两份凭证。
4 分钟失败不计费:一句承诺背后的工程量
「失败不计费」写在 footer 里一行字。要让它在九家厂商、两套协议、同步与流式、同步与异步、文字与像素之间都成立 —— 这是几千行代码加一份公开的退款政策。
7 分钟用 ByteSpike 搭建 AI 客服路由系统
如何用 Haiku 做客服分流、Sonnet 写回复、Opus 处理升级,全部在一把 key 后面,成本可预判。
8 分钟双语营销站背后的 13 个排版决定
我们刚刚把 ByteSpike 营销站的 brand v2 完整发出来 —— 新 wordmark、新渐变、新 sparkle motif。看得见的那部分一周就交付了。排版细节做得更久 —— 而你本应该完全察觉不到。下面是真正改了什么,以及为什么。
7 分钟ByteSpike 上线:一把钥匙,调用世界模型
ByteSpike 是一个多模型聚合网关:一把 Anthropic 风格的 key、原生 CJK 计费、公开 rate card。我们做这个,是因为受够了同时维护九套 SDK。
5 分钟ByteSpike vs aireiter / b.ai:网关选择会变在哪里
三家模型网关市场重叠。差别都很具体:怎么认证、怎么计费、谁是一等公民、调用失败后会发生什么。如果我们是用户,下面是我们关心的事。
7 分钟DOSIA + ByteSpike:五个能更快交付的工作流
DOSIA 是我们基于 ByteSpike 做的桌面端 AI 伴侣。两者一起覆盖了「写 prompt 到上线」的整个链路。下面五个具体工作流,是这个组合替你省掉一段手写整合的地方。
8 分钟选对图像 / 视频模型:一份实操指南
ByteSpike 一把 key 后面有 9 个图像模型 + 8 个视频模型。它们不能互换 —— 每个都有自己擅长的题目和不擅长的题目。下面是一个能直接挂模型名的决策树。
7 分钟ByteSpike 路线图:一把 key,调用世界模型
ByteSpike 接下来四个季度往哪走。四个阶段,每个都是具体的功能交付,不是模糊的星辰大海。
6 分钟我们为什么做 ByteSpike
我们认识的每个团队都在用 bash 脚本拼接两三家模型厂商。我们受够了。所以做了一个网关、一把钥匙、一份账单 —— 顺便选了 Anthropic 协议作为主接口,因为那是我们真正愿意写的 API。
6 分钟我们决定不做 chat UI 之后,造了什么
每个 AI 初创公司第二周都在做 chat UI。我们差点也做了 —— 然后数了一下世界上已经有多少个 chat UI,立刻转向:ByteSpike 给 API,DOSIA 给零代码路径,中间什么都不做。这是这个决策带来的连锁影响,以及我们为什么仍然会这么选。
5 分钟23 个端点 · 一把 Key · 中位 80 毫秒开销
ByteSpike 把流量散发到 23 个端点 —— 图像 / 视频 / 文本 / 异步任务全覆盖,前面套一个 Anthropic 形状的 API。有意思的问题不是路由本身,是延迟预算。本文讲我们怎么在保留 OAuth pool 粘性、重试语义、按请求配额计算的同时,把网关中位开销压到 80 毫秒以内。
6 分钟我们押注 Anthropic 协议
我们选 Anthropic Messages API 作为默认协议。这里说为什么 tool_use、cache_control、thinking 是最值得原汁原味保留的 API 表面 —— 以及我们如何 shim 其余协议而不丢精度。
4 分钟DOSIA 双月报 · 2026-04 · ByteSpike 接入 + 五层文件体系上线
4 月是 DOSIA 从单账号客户端长成真正的多租户 agent 宿主的一个月:接入 ByteSpike provider、从会话到企业的五层文件体系、以及把启动耗时砍掉约 30% 的原生二进制 SDK。
6 分钟