Rajio
介绍

什么是 Rajio

Rajio 如何帮助 Agent 完成日语视频字幕翻译。

什么是 Rajio

Rajio 来自日语片假名「ラジオ」,读作 rajio,意思就是 radio。这个名字保留了日语广播的语感,也对应 Rajio 最早想处理的内容:声优广播、访谈和长视频里的日语对话。

Rajio 是给 Agent 使用的日语视频字幕翻译工作流。它不是单纯的「把音频丢给模型翻译」,而是把字幕制作拆成可恢复、可检查、可审校的步骤。

你可以把它理解成一条字幕生产线:

  1. 从视频里提取音频。
  2. 上传音频到转写服务商,得到日语初稿。
  3. 让 Agent 分批校对日语转写,修正人名、术语、断句和时间轴。
  4. 让 Agent 分批翻译成简体中文。
  5. 多轮阅读中文字幕,反复润色表达、断行和观看节奏。
  6. 导出 SRT/ASS 字幕。

适合什么场景

  • 日语声优广播、访谈、直播切片、活动片段。
  • 需要中文观众自然观看的视频字幕。
  • 希望 Agent 能长时间接手,但又不想丢失进度的任务。
  • 需要在自己的会话工作区里留下会话记录、补丁和可复查产物的任务。

为什么需要会话工作区

长视频字幕翻译不会一次完成。Rajio 会把每一步状态写进会话工作区

  • session.toml:当前阶段和输入媒体。
  • description.md:视频上下文、术语、固定译名和疑问。
  • transcript/work/segments.toml:可编辑的日语转写。
  • translation/work/segments.toml:可编辑的中文字幕。
  • patches/:Agent 分批提交的修改。
  • output/:最终字幕文件。

这样中断后可以继续,审校过的阶段也不会被误覆盖。

质量原则

Rajio 的检查只是质量底线,不代表字幕已经好看。真正完成前,Agent 还需要读完整字幕,处理:

  • ASR 识别错误。
  • 人名、节目名、术语和固定梗。
  • 日语语气到中文表达的转换。
  • 中文字幕的长度、断行和观看节奏。
  • 相邻片段之间的上下文一致性。

Agent 如何参与

Rajio 把机械步骤交给 CLI,把需要判断的步骤交给 Agent:

  • CLI 负责会话状态、音频处理、转写请求、文件校验、分段编辑和字幕导出。
  • Agent 负责理解视频上下文、维护术语、拆分审校批次、审查补丁、润色中文和解释例外。
  • 子 Agent 负责分批校对或翻译,主 Agent 负责合并、复查和最终质量判断。

这种分工的目标不是让模型一次性生成完美字幕,而是让长视频字幕任务可以被拆开、暂停、复查和继续。

隐私边界

转写阶段会把音频上传到配置的转写服务商。Agent 在开始转写前应该明确确认你同意这件事。

Rajio 不会把本地视频“悄悄”变成云端任务;真正上传的是转写所需的音频数据,使用哪个服务商取决于你的环境配置。

什么算完成

一个 Rajio 会话完成时,至少应该具备这些结果:

  • rajio check 没有阻塞性的 fatal 或未处理 error
  • 日语转写已经按时间线读过并修正明显识别错误。
  • 中文字幕已经完整读过一遍,不只是逐句直译。
  • 人名、节目名、固定梗和术语在 description.md 里有记录。
  • 必要时导出 SRT/ASS,并说明还有哪些不确定点。

如果只是通过了自动检查,但没有读过字幕正文,它还不能算完成。

不适合什么

  • 完全不希望上传音频到转写服务商的任务。
  • 只想要一段粗略摘要,而不是字幕文件的任务。
  • 没有本地视频或音频路径的任务。
  • 要求跳过人工审校、直接相信整段机器翻译的任务。

本页目录