很多 AI 投研项目只停留在”检索文档 + 调用模型”的 RAG Demo 层,放到真实业务中就会遇到并发冲突、报告无法溯源、旧缓存被复用等问题。FinSight-AI 是一个面向股票投研场景的开源 AI 平台,它的价值在于把任务恢复、重复执行控制、版本化缓存、证据追踪和 RAG 评估都纳入了后端架构设计。

开源 AI 投研平台和普通 RAG Demo 的核心区别

大部分 AI 投研演示项目只关心”大模型最后吐出了什么文字”,而 FinSight-AI 关心的是”怎么让这个长流程不出错”。

核心工程栈速览

  • 工作流编排:Java 17 + Spring Boot 后端
  • AI 侧边车服务:Python + FastAPI
  • 存储与检索:PostgreSQL + pgvector(混合检索)
  • 并发与队列:Redis + RabbitMQ
  • 监控与运维:Docker Compose 一键部署,内置 Prometheus 监控

后端架构:工作流、证据追踪与版本化缓存

在它的后台逻辑中,工作流被严格切分为数据摄取、指标计算、文档索引、情报构建和 AI 报告生成五个阶段。为了防止同一只股票被两个并发请求重复分析,它在数据库层加入了幂等键,并在 Redis 层使用了单飞锁(single-flight lease)配合 Fencing Token。这意味着就算遭遇网络抖动,系统也能从失败断点稳妥重试,而不是让任务挤爆队列。

它比较值得看的地方,是证据追踪和缓存更新机制。FinSight-AI 没有简单按 Prompt 字符串缓存报告,而是用 contextHashdataSnapshotHashreportVersion 组成版本化缓存键。这样一来,系统不只记住”这次问了什么”,还会记录使用的是哪一版数据、哪一版报告,以及生成时引用了哪些证据片段。

当底层数据快照发生变化时,旧报告就不会被轻易复用,可以减少旧数据误导,也方便开发者追溯 AI 结论到底来自哪些资料。

Docker 部署门槛:本地运行需要什么配置

这东西不是让你双击个安装包就能跑的,它是一个典型的全栈重型架构。

官方提供了一键启动全栈的 Docker Compose 脚本,但这种中间件拉满的架构比较吃资源。完整 Docker 环境建议至少准备 8GB 以上可用内存;如果你是在 macOS 上通过 Docker Desktop、OrbStack 或 Colima 本地测试,又打算同时跑 Ollama 本地模型,16GB 以上内存会更稳一些。

更偏向数据可控的一个设计是,在默认的本地 Demo 环境下,它不强制依赖外部 LLM。即使你没有配置公网 API 或本地的 Ollama 服务,它的 AI sidecar 也会返回确定性的规则分析结果,方便开发者先跑通整套工作流,不会让前端直接白屏报错。

部署和使用前需要注意什么

  • 还没有正式版本:FinSight-AI 目前更像一个持续迭代中的开源项目,公开仓库暂无正式 Release。可以拿来学习架构和二次开发,真要接入业务环境,稳定性需要自己再评估。
  • 数据源要自己确认:A 股测试数据依赖公开搜索接口同步,用来跑 Demo 没问题;如果准备做商业化或内部长期使用,数据来源、调用稳定性和授权边界都建议单独核对。
  • 别当成投资建议:它本质上是一套投研系统架构。AI 生成的研报和摘要会受数据质量、模型能力、提示词设计影响,不适合直接当作买卖依据。
  • 所以这套项目不适合普通散户拿来找交易信号。它更适合后端开发者、AI Agent 开发者,或者正在研究私有化 AI 研报系统的团队。真正值得看的不是”AI 会不会写一段研报”,而是它怎么处理证据溯源、并发控制、任务恢复和 RAG 评估这些后端问题。

    源码、文档与部署入口

    🐙 FinSight-AI GitHub 项目主页
    查看完整的开源后端代码、微服务架构图,以及 Docker Compose 部署依赖说明。
    github.com/juanjuandog/FinSight-AI

    📘 FinSight-AI 架构设计文档
    进入官方文档,确认状态机调度细节、并发控制策略与 RAG 评估逻辑。
    查看架构文档

    本文基于 FinSight-AI 公开仓库与文档整理,侧重于 AI Agent 的后端架构选型与工程化拆解。项目生成的结论依赖底层模型与公开数据,本文不构成任何投资或荐股建议。

    声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。