Study Management AI 平台系统开发规格说明书

本说明书面向 Crown Bioscience 生态中负责产品、研发、质量、AI & 数据科学及运营的团队,定义 Study Management 平台的愿景、范围、关键流程、功能模块、AI 能力、数据治理与合规要求,为跨部门协作提供统一的设计与交付基准。

Vision

系统概览

目标与范围

第一阶段聚焦 In-vivo 核心业务,在中国区率先上线“项目数据同步 → AI 报告生成”的闭环体验,实现标准项目的一键式交付,并为图表、分析与模版提供可配置能力,同时保持与 SD 的会话上下文一致。

第二阶段扩展至 In-vitro 与 Biomarker 业务,打造 Protocol Builder 以实现 In-vivo Protocol 自动化配置与交互;第三阶段贯穿 Protocol → Study Execution → 数据监控的全链路,部署面向关键环节的 AI 决策与提醒服务,逐步形成全球可复用的平台能力。

平台需支撑多数据源同步、面向 AI 的数据治理、灵活的模版管理与跨区域部署,为全球业务扩展提供基础。

关键角色

  • Study Director(SD):配置项目参数、上传 protocol、驱动数据确认与报告审核。
  • Bioinformatics & AI 团队:维护 AI 模型、HuPharm 参数模板、统计策略与提示词。
  • IT & DevOps:保障部署、集成、性能监控与灾备运维。
  • 产品运营团队:管理模板、术语库与全球化配置,为后续阶段业务扩展提供支持。
成功指标: 项目配置效率提升 40%、AI 自动分析覆盖率 ≥ 85%、报告交付周期缩短 30%、数据追踪合规率 100%、关键用户满意度 ≥ 4.5/5。
Core Process

核心流程概览

核心流程围绕项目全生命周期展开,采用串联式业务主流程 + 并行数据与合规控制。下图展示四个阶段的主要节点与关键能力:

1项目初始化 & 参数确认
  • Studylog 定期同步项目号、默认参数与基础数据。
  • 系统正式上线前,protocol 通过人工上传;上线后自动解析章节与时态校准。
  • 配置 HuPharm 调用参数,支持在统计分析前后灵活调整。
  • 对标准、简单项目提供一键生成报告入口。
配置管理 文档解析
2项目数据确认
  • 按项目展现表格化数据与图表(BW/TV、Prism 图形等),实时联动更新。
  • 支持隐藏/恢复指定日期、组别或单鼠数据,并保留操作记录。
  • 允许 FLUX/BLI 数据上传替换、组标签标准化,并导出 Prism 兼容数据。
  • 接收 Survival 数据并调用 HuPharm 获取统计分析结果。
数据治理 交互图表
3AI 分析与报告模版
  • AI 生成项目总结、结论与建议,保持单 Study 单会话上下文。
  • 按 SD/客户偏好选择模版,在线编辑章节。
  • 版本管理、差异追踪、Word 导出。
生成式 AI 模版管理
4多模型报表 & 发布
  • 逐一按单模型流程与 SD 确认数据与分析。
  • 整合所有模型结果至统一报告结构,支持双语切换。
  • 签核完成后统一导出与归档。
自动化 合规归档
Requirements

功能规格

1. 项目初始化模块

  1. 项目选择与参数配置:从 Studylog 定期同步项目号、动物分组、默认参数(Reference Group、Randomization Day/Date、Analyse Day),用户可按需编辑并保存参数组合。
  2. Protocol 管理:在自动化解析上线前支持人工上传签署的 PDF/Word;上线后系统解析目录及章节内容,忽略样式但保留层级结构,并自动进行时态转换与术语标准化。
  3. HuPharm 参数:提供预设模型与阈值,可在统计分析前后进行调整;所有变更记录审批日志,保证追踪。
  4. 快速报告:对标准或简单项目提供一键生成报告流程,可在后续环节继续迭代内容。

2. 数据确认模块

  1. 数据可视化:展示 BW/TV 数据表与交互式图表(含 Prism 风格图形),支持多选筛选、数据点注释、异常标记,可导出 Prism 可用数据集。
  2. 数据校准:允许隐藏指定日期、组别或单只动物数据并记录操作痕迹;提供一键恢复与对比视图。
  3. 替换数据:上传标准化 FLUX/BLI Excel 模板,系统验证模板完整性后写入专用数据表,并优先替换对应 TV 数据。
  4. 标签管理:支持自动规范化(规则库)与手动改写,更新后同步至所有相关图表与报告标题。
  5. Survival 分析:收集死亡/终止记录,调用 HuPharm 计算 Kaplan-Meier、Log-rank;结果以图表和统计表展示。
  6. TGI/T:C 分析:基于确认的参数实时调用 HuPharm API,返回统计指标、置信区间及可视化输出。

3. AI 分析与报告模块

  1. AI 项目总结:根据 TGI、Survival、病理及历史数据生成专业总结,遵循 CrownBio 风格;缺失数据时自动调整结论结构,并保持单 Study 单会话的上下文连续性。
  2. 个性化分析:结合客户偏好、历史报告、实验所在地规则生成定制化措辞;支持双语生成与跨版本对比。
  3. 报告模版工作台:推荐默认模版,在线编辑章节标题、顺序与内容,提供版本管理、差异高亮、权限控制。
  4. 数据附录:原始数据表展示于报告末尾,并支持导出为 Excel 附件。
  5. Word 导出:使用标准化 DOCX 模版引擎生成可追溯文件,包含数字签章与水印。

4. 多模型报表模块

  1. 多模型管理:支持批量导入、过滤与状态监控;每个模型按单项目流程与 SD 协作确认数据与结论。
  2. 结果整合:合并各模型关键指标、图表与总结,生成总览与单模型子章节。
  3. 交付输出:统一导出 Word/PDF,附带审批记录与审计日志,支持双语切换。

5. 系统通用能力

UX

用户体验与交互

导航策略

  • 顶级导航按业务阶段划分,侧栏呈现关键任务与状态。
  • 数据确认页面采用多面板布局:左侧条件筛选,中部数据表,右侧图表即时更新。
  • 报告编辑器内嵌模块化章节面板,支持拖拽排序与版本对比。

可用性要求

  • 核心操作 ≤ 3 步完成;系统操作反馈 ≤ 1 秒。
  • 图表交互需提供缩放、下载、注释功能,并支持 Prism 图形样式与数据导出。
  • AI 生成内容支持“接受/编辑/拒绝”与差异标记。

国际化 & 无障碍

  • 界面文案支持中英文实时切换,遵循 CrownBio 术语库。
  • 遵循 WCAG 2.1 AA,颜色对比度 ≥ 4.5:1,所有控件支持键盘访问。
  • 日期、数值格式随区域设定自动调整。

用户支持

  • 内置引导流程,覆盖首次配置、AI 总结、模版导出。
  • 提供上下文帮助中心,集成常见问题、视频示例。
  • 支持在线反馈与问题工单系统。
AI

AI 能力与数据策略

模型目录

Protocol NLP 引擎

识别 protocol 章节结构、提取关键参数并进行时态转换;采用中文/英文双语预训练模型 + 规则校正。

分析总结生成模型

结合 TGI、T:C、Survival、实验条件与历史报告生成专业总结;支持提示词配置与风格调优。

Study 分类模型

基于项目元数据与实验流程自动判断是否标准 Study,为多模型报表提供快速路径。

训练与部署要求

数据治理

Integration

系统集成与数据流

外部系统 数据类型 同步模式 关键控制
Salesforce 项目、客户、联系人、BD 信息 每天增量 + 即时 webhook 字段映射校验、重复项检测、变更审计
ELN 最终 Protocol、实验步骤、原始记录 受控拉取(审批触发) 版本锁定、内容哈希校验、签署验证
Studylog 动物分组、BW/TV 数据、实验事件 准实时(15 分钟轮询) 数据一致性校验、异常告警、回放机制
Cell Data 细胞系信息、批次、存储条件 每日同步 主数据管理(MDM)校验、生命周期追踪
HuPharm API %TGI、%T/C、统计显著性 实时调用 参数版本控制、重试策略、延迟监控
Report 模版库 客户定制模版、标准模版 集中管理,按需推送 模版审批、权限隔离、变更通知

数据同步策略

通过企业级数据总线 (ESB) 或 API 网关实现标准化接入,采用统一的消息格式(JSON + Schema Registry),并通过 CDC/队列确保增量与顺序。

错误处理

所有集成接口需暴露重试策略、失败告警与人工介入流程;提供观测平台对吞吐、失败率、延迟进行监控。

NFR

非功能需求

性能

  • 核心页面首屏加载 ≤ 3 秒,交互延迟 P95 ≤ 1 秒。
  • 支持同时 500 名活跃用户,HuPharm 调用峰值 200 次/分钟。
  • 报表导出任务支持并发队列,平均完成 ≤ 2 分钟。

可靠性

  • 服务可用性 ≥ 99.5%,支持跨区域灾备与自动故障转移。
  • 关键数据每日全量备份,保留 ≥ 7 年。
  • AI 推理服务部署多活架构,具备熔断与降级逻辑。

可维护性

  • 采用微服务 + 事件驱动架构,服务间接口通过 OpenAPI 定义。
  • CI/CD 覆盖单元测试、集成测试、UI 自动化与安全扫描。
  • 配置即代码(Configuration-as-Code),变更需双人审核。

可扩展性

  • 模块化设计,支持新增分析类型、第三方算法接入。
  • 报告模版引擎支持插入客户自定义组件与宏。
  • 数据仓库预留扩展字段与多模数据模型。

监控与告警

  • 建立统一观测平台,覆盖日志、指标、追踪三类数据。
  • 对 AI 相关指标(质量评分、拒绝率)设置阈值告警。
  • 用户操作异常、权限越权实时通知安全团队。

本地化

  • 支持中国、美国、欧洲部署模式,可灵活选择数据落地位置。
  • 时间与货币格式随地区配置;遵循当地法规 (如 GDPR, CSL)。
  • AI 模型策略可区域化,满足不同法规要求。
Compliance

合规、安全与审计

安全策略

  • 采用零信任访问控制,启用 SSO + MFA,关键操作二次验证。
  • 所有数据静态与传输加密(AES-256 & TLS 1.2+),密钥托管于企业 KMS。
  • 分级权限:数据读取、编辑、导出、AI 调用需分别授权。
  • 异常访问检测:引入 UEBA,对异常模式实时阻断。

合规框架

  • 遵循 GLP/GCP 行业规范,记录完整的实验数据修订历史。
  • 满足 GDPR、CCPA 对个人信息的控制要求,提供数据主体访问与删除功能。
  • AI 结果透明化,提供提示词、输入数据范围、生成版本的审计记录。
  • 审计日志不可篡改,保留至少 10 年,可导出至 SIEM 系统。

风险控制

Delivery

交付计划与运营

里程碑规划

阶段一 - In-vivo 核心能力 (第 0-3 月)

完成项目数据同步、协议上传解析、HuPharm 参数配置、数据确认交互与 AI 驱动的报告生成,满足中国区 In-vivo 业务落地。

滚动规划: 后续阶段根据第一阶段达成情况、国际化需求与资源配置实时评估并调整节奏,确保平台扩展与业务优先级保持一致。

运营与支持