介绍
什么是 Rajio
Rajio 如何帮助 Agent 完成日语视频字幕翻译。
什么是 Rajio
Rajio 来自日语片假名「ラジオ」,读作 rajio,意思就是 radio。这个名字保留了日语广播的语感,也对应 Rajio 最早想处理的内容:声优广播、访谈和长视频里的日语对话。
Rajio 是给 Agent 使用的日语视频字幕翻译工作流。它不是单纯的「把音频丢给模型翻译」,而是把字幕制作拆成可恢复、可检查、可审校的步骤。
你可以把它理解成一条字幕生产线:
- 从视频里提取音频。
- 上传音频到转写服务商,得到日语初稿。
- 让 Agent 分批校对日语转写,修正人名、术语、断句和时间轴。
- 让 Agent 分批翻译成简体中文。
- 多轮阅读中文字幕,反复润色表达、断行和观看节奏。
- 导出 SRT/ASS 字幕。
适合什么场景
- 日语声优广播、访谈、直播切片、活动片段。
- 需要中文观众自然观看的视频字幕。
- 希望 Agent 能长时间接手,但又不想丢失进度的任务。
- 需要在自己的会话工作区里留下会话记录、补丁和可复查产物的任务。
为什么需要会话工作区
长视频字幕翻译不会一次完成。Rajio 会把每一步状态写进会话工作区:
session.toml:当前阶段和输入媒体。description.md:视频上下文、术语、固定译名和疑问。transcript/work/segments.toml:可编辑的日语转写。translation/work/segments.toml:可编辑的中文字幕。patches/:Agent 分批提交的修改。output/:最终字幕文件。
这样中断后可以继续,审校过的阶段也不会被误覆盖。
质量原则
Rajio 的检查只是质量底线,不代表字幕已经好看。真正完成前,Agent 还需要读完整字幕,处理:
- ASR 识别错误。
- 人名、节目名、术语和固定梗。
- 日语语气到中文表达的转换。
- 中文字幕的长度、断行和观看节奏。
- 相邻片段之间的上下文一致性。
Agent 如何参与
Rajio 把机械步骤交给 CLI,把需要判断的步骤交给 Agent:
- CLI 负责会话状态、音频处理、转写请求、文件校验、分段编辑和字幕导出。
- Agent 负责理解视频上下文、维护术语、拆分审校批次、审查补丁、润色中文和解释例外。
- 子 Agent 负责分批校对或翻译,主 Agent 负责合并、复查和最终质量判断。
这种分工的目标不是让模型一次性生成完美字幕,而是让长视频字幕任务可以被拆开、暂停、复查和继续。
隐私边界
转写阶段会把音频上传到配置的转写服务商。Agent 在开始转写前应该明确确认你同意这件事。
Rajio 不会把本地视频“悄悄”变成云端任务;真正上传的是转写所需的音频数据,使用哪个服务商取决于你的环境配置。
什么算完成
一个 Rajio 会话完成时,至少应该具备这些结果:
rajio check没有阻塞性的fatal或未处理error。- 日语转写已经按时间线读过并修正明显识别错误。
- 中文字幕已经完整读过一遍,不只是逐句直译。
- 人名、节目名、固定梗和术语在
description.md里有记录。 - 必要时导出 SRT/ASS,并说明还有哪些不确定点。
如果只是通过了自动检查,但没有读过字幕正文,它还不能算完成。
不适合什么
- 完全不希望上传音频到转写服务商的任务。
- 只想要一段粗略摘要,而不是字幕文件的任务。
- 没有本地视频或音频路径的任务。
- 要求跳过人工审校、直接相信整段机器翻译的任务。