很多 AI 投研项目只停留在”检索文档 + 调用模型”的 RAG Demo 层,放到真实业务中就会遇到并发冲突、报告无法溯源、旧缓存被复用等问题。FinSight-AI 是一个面向股票投研场景的开源 AI 平台,它的价值在于把任务恢复、重复执行控制、版本化缓存、证据追踪和 RAG 评估都纳入了后端架构设计。
开源 AI 投研平台和普通 RAG Demo 的核心区别
大部分 AI 投研演示项目只关心”大模型最后吐出了什么文字”,而 FinSight-AI 关心的是”怎么让这个长流程不出错”。
核心工程栈速览
- 工作流编排:Java 17 + Spring Boot 后端
- AI 侧边车服务:Python + FastAPI
- 存储与检索:PostgreSQL + pgvector(混合检索)
- 并发与队列:Redis + RabbitMQ
- 监控与运维:Docker Compose 一键部署,内置 Prometheus 监控
后端架构:工作流、证据追踪与版本化缓存
在它的后台逻辑中,工作流被严格切分为数据摄取、指标计算、文档索引、情报构建和 AI 报告生成五个阶段。为了防止同一只股票被两个并发请求重复分析,它在数据库层加入了幂等键,并在 Redis 层使用了单飞锁(single-flight lease)配合 Fencing Token。这意味着就算遭遇网络抖动,系统也能从失败断点稳妥重试,而不是让任务挤爆队列。
它比较值得看的地方,是证据追踪和缓存更新机制。FinSight-AI 没有简单按 Prompt 字符串缓存报告,而是用 contextHash、dataSnapshotHash 和 reportVersion 组成版本化缓存键。这样一来,系统不只记住”这次问了什么”,还会记录使用的是哪一版数据、哪一版报告,以及生成时引用了哪些证据片段。
当底层数据快照发生变化时,旧报告就不会被轻易复用,可以减少旧数据误导,也方便开发者追溯 AI 结论到底来自哪些资料。
Docker 部署门槛:本地运行需要什么配置
这东西不是让你双击个安装包就能跑的,它是一个典型的全栈重型架构。
官方提供了一键启动全栈的 Docker Compose 脚本,但这种中间件拉满的架构比较吃资源。完整 Docker 环境建议至少准备 8GB 以上可用内存;如果你是在 macOS 上通过 Docker Desktop、OrbStack 或 Colima 本地测试,又打算同时跑 Ollama 本地模型,16GB 以上内存会更稳一些。
更偏向数据可控的一个设计是,在默认的本地 Demo 环境下,它不强制依赖外部 LLM。即使你没有配置公网 API 或本地的 Ollama 服务,它的 AI sidecar 也会返回确定性的规则分析结果,方便开发者先跑通整套工作流,不会让前端直接白屏报错。
部署和使用前需要注意什么
所以这套项目不适合普通散户拿来找交易信号。它更适合后端开发者、AI Agent 开发者,或者正在研究私有化 AI 研报系统的团队。真正值得看的不是”AI 会不会写一段研报”,而是它怎么处理证据溯源、并发控制、任务恢复和 RAG 评估这些后端问题。
源码、文档与部署入口
🐙 FinSight-AI GitHub 项目主页
查看完整的开源后端代码、微服务架构图,以及 Docker Compose 部署依赖说明。
github.com/juanjuandog/FinSight-AI
📘 FinSight-AI 架构设计文档
进入官方文档,确认状态机调度细节、并发控制策略与 RAG 评估逻辑。
查看架构文档
本文基于 FinSight-AI 公开仓库与文档整理,侧重于 AI Agent 的后端架构选型与工程化拆解。项目生成的结论依赖底层模型与公开数据,本文不构成任何投资或荐股建议。