重构 | Wike's Blog

第一版Timao能跑。但能跑和能用是两回事。 Redis、MySQL、用户认证、订阅支付系统——这些东西对于一个本地桌面应用来说，全是负担。于是重写。第一刀：砍掉Redis 原来用Redis做弹幕缓存、AI分析缓存、会话存储。部署的时候用户得先装Redis。对于一个桌面应用，这很荒谬。弹幕本身就是流式数据，过了就过了，不需要持久化缓存。会话数据用内存字典够了。AI分析结果直接推到前端，不存中间态。 RedisManager砍到只剩一个纯内存实现。整个Redis依赖链全部移除。部署门槛从"装Python + Node.js + Redis + MySQL"变成了"装Python + Node.js"。第二刀：MySQL换成SQLite 同理。一个本地工具，不需要MySQL。 SQLite开WAL模式，并发读写完全够用。数据就是一个文件，拷贝就能迁移，备份就是复制。数据库初始化脚本写好，第一次启动自动建表。用户不需要手动操作任何东西。第三刀：移除用户认证和订阅系统早期设计里有一套完整的用户系统——注册、登录、订阅、支付。因为想做成SaaS。后来想清楚了：直播数据不能上云，这个产品就该是本地的。砍掉用户认证、砍掉订阅、砍掉支付。前端相关的UI全部清理。应用打开就能用，不需要登录任何东西。代码少了，复杂度低了，用户不用关心"我买了什么套餐"。加入：Agent架构砍完了旧的，加新的。原来的AI分析是单体函数调用。弹幕来了，调一次AI，出结果。没有上下文，没有多步推理，没有反馈。重构后引入Agent体系： BaseAgent — 所有Agent的基类，Pydantic AI兼容。统一输入输出格式，自动计时，自动错误处理。 DanmakuAgent — 专门处理弹幕。过滤噪声、识别关键互动、判断哪些弹幕值得主播关注。 VoiceAgent — 语音转写的Agent层。支持多ASR后端切换（SenseVoice、sherpa-onnx、讯飞），运行时可以切，不用重启。 AnalyzerAgent — 高速分析，支持MiniMax做快速判断。不需要深度推理的场景用轻量模型，省时间。 DecisionAgent — 决策Agent，接GLM-5的思考模式。需要深度分析的场景（比如直播节奏判断、话术推荐）用大模型。 ReflectionAgent — 反思Agent，评估其他Agent的输出质量。分析结果先过一遍反思，不靠谱的就重新来。所有Agent通过 workflow_v2 编排。不是串行调用，是按需调度。加入：AI Gateway 2.0 原来调AI就是直接用LangChain的链式调用。一个模型打天下。问题很明显：不同任务需要不同模型。弹幕分析要快，用MiniMax。话术生成要好，用GLM-5。简单判断用轻量模型省钱。 AI Gateway 2.0做的事情：智能路由：根据任务类型自动选模型思考模式：GLM-5的深度推理开关，复杂任务开启，简单任务关闭流式输出：chat_completion走流式，前端实时显示AI生成过程多服务商：智谱GLM、MiniMax、讯飞、豆包、DeepSeek，配置里加一行就能用加入：sherpa-onnx替换FunASR SenseVoice模型之前用FunASR加载。FunASR依赖PyTorch，光PyTorch就几个G。 sherpa-onnx是纯ONNX推理，不需要PyTorch。模型加载快，内存占用低，推理速度不差。迁移之后安装依赖从好几个G砍到几百MB。对于桌面应用的分发来说，这是质的区别。语音转写层做了抽象——transcriber接口统一，底层是FunASR还是sherpa-onnx，上层代码不用关心。 ...