Study Management AI 平台系统开发规格说明书

Vision

系统概览

目标与范围

第一阶段聚焦 In-vivo 核心业务，在中国区率先上线“项目数据同步 → AI 报告生成”的闭环体验，实现标准项目的一键式交付，并为图表、分析与模版提供可配置能力，同时保持与 SD 的会话上下文一致。

第二阶段扩展至 In-vitro 与 Biomarker 业务，打造 Protocol Builder 以实现 In-vivo Protocol 自动化配置与交互；第三阶段贯穿 Protocol → Study Execution → 数据监控的全链路，部署面向关键环节的 AI 决策与提醒服务，逐步形成全球可复用的平台能力。

平台需支撑多数据源同步、面向 AI 的数据治理、灵活的模版管理与跨区域部署，为全球业务扩展提供基础。

关键角色

Study Director（SD）：配置项目参数、上传 protocol、驱动数据确认与报告审核。
Bioinformatics & AI 团队：维护 AI 模型、HuPharm 参数模板、统计策略与提示词。
IT & DevOps：保障部署、集成、性能监控与灾备运维。
产品运营团队：管理模板、术语库与全球化配置，为后续阶段业务扩展提供支持。

                成功指标： 项目配置效率提升 40%、AI 自动分析覆盖率 ≥ 85%、报告交付周期缩短 30%、数据追踪合规率 100%、关键用户满意度 ≥ 4.5/5。
            

Core Process

核心流程概览

核心流程围绕项目全生命周期展开，采用串联式业务主流程 + 并行数据与合规控制。下图展示四个阶段的主要节点与关键能力：

1项目初始化 & 参数确认

Studylog 定期同步项目号、默认参数与基础数据。
系统正式上线前，protocol 通过人工上传；上线后自动解析章节与时态校准。
配置 HuPharm 调用参数，支持在统计分析前后灵活调整。
对标准、简单项目提供一键生成报告入口。

配置管理文档解析

2项目数据确认

按项目展现表格化数据与图表（BW/TV、Prism 图形等），实时联动更新。
支持隐藏/恢复指定日期、组别或单鼠数据，并保留操作记录。
允许 FLUX/BLI 数据上传替换、组标签标准化，并导出 Prism 兼容数据。
接收 Survival 数据并调用 HuPharm 获取统计分析结果。

数据治理交互图表

3AI 分析与报告模版

AI 生成项目总结、结论与建议，保持单 Study 单会话上下文。
按 SD/客户偏好选择模版，在线编辑章节。
版本管理、差异追踪、Word 导出。

生成式 AI 模版管理

4多模型报表 & 发布

逐一按单模型流程与 SD 确认数据与分析。
整合所有模型结果至统一报告结构，支持双语切换。
签核完成后统一导出与归档。

自动化合规归档

Requirements

功能规格

1. 项目初始化模块

项目选择与参数配置：从 Studylog 定期同步项目号、动物分组、默认参数（Reference Group、Randomization Day/Date、Analyse Day），用户可按需编辑并保存参数组合。
Protocol 管理：在自动化解析上线前支持人工上传签署的 PDF/Word；上线后系统解析目录及章节内容，忽略样式但保留层级结构，并自动进行时态转换与术语标准化。
HuPharm 参数：提供预设模型与阈值，可在统计分析前后进行调整；所有变更记录审批日志，保证追踪。
快速报告：对标准或简单项目提供一键生成报告流程，可在后续环节继续迭代内容。

2. 数据确认模块

数据可视化：展示 BW/TV 数据表与交互式图表（含 Prism 风格图形），支持多选筛选、数据点注释、异常标记，可导出 Prism 可用数据集。
数据校准：允许隐藏指定日期、组别或单只动物数据并记录操作痕迹；提供一键恢复与对比视图。
替换数据：上传标准化 FLUX/BLI Excel 模板，系统验证模板完整性后写入专用数据表，并优先替换对应 TV 数据。
标签管理：支持自动规范化（规则库）与手动改写，更新后同步至所有相关图表与报告标题。
Survival 分析：收集死亡/终止记录，调用 HuPharm 计算 Kaplan-Meier、Log-rank；结果以图表和统计表展示。
TGI/T:C 分析：基于确认的参数实时调用 HuPharm API，返回统计指标、置信区间及可视化输出。

3. AI 分析与报告模块

AI 项目总结：根据 TGI、Survival、病理及历史数据生成专业总结，遵循 CrownBio 风格；缺失数据时自动调整结论结构，并保持单 Study 单会话的上下文连续性。
个性化分析：结合客户偏好、历史报告、实验所在地规则生成定制化措辞；支持双语生成与跨版本对比。
报告模版工作台：推荐默认模版，在线编辑章节标题、顺序与内容，提供版本管理、差异高亮、权限控制。
数据附录：原始数据表展示于报告末尾，并支持导出为 Excel 附件。
Word 导出：使用标准化 DOCX 模版引擎生成可追溯文件，包含数字签章与水印。

4. 多模型报表模块

多模型管理：支持批量导入、过滤与状态监控；每个模型按单项目流程与 SD 协作确认数据与结论。
结果整合：合并各模型关键指标、图表与总结，生成总览与单模型子章节。
交付输出：统一导出 Word/PDF，附带审批记录与审计日志，支持双语切换。

5. 系统通用能力

双语切换：界面、分析内容与报告模版支持中英文切换，默认随项目 Region 设置。
审计与权限：基于角色的访问控制（RBAC），操作记录、数据版本与审批流程全量追踪。
通知提醒：集成邮件与站内消息，支持关键节点提醒、审批代办、分析完成推送。
配置中心：预置参数、模板、HuPharm 配置集中管理，支持灰度与回滚。

用户体验与交互

导航策略

顶级导航按业务阶段划分，侧栏呈现关键任务与状态。
数据确认页面采用多面板布局：左侧条件筛选，中部数据表，右侧图表即时更新。
报告编辑器内嵌模块化章节面板，支持拖拽排序与版本对比。

可用性要求

核心操作 ≤ 3 步完成；系统操作反馈 ≤ 1 秒。
图表交互需提供缩放、下载、注释功能，并支持 Prism 图形样式与数据导出。
AI 生成内容支持“接受/编辑/拒绝”与差异标记。

国际化 & 无障碍

界面文案支持中英文实时切换，遵循 CrownBio 术语库。
遵循 WCAG 2.1 AA，颜色对比度 ≥ 4.5:1，所有控件支持键盘访问。
日期、数值格式随区域设定自动调整。

用户支持

内置引导流程，覆盖首次配置、AI 总结、模版导出。
提供上下文帮助中心，集成常见问题、视频示例。
支持在线反馈与问题工单系统。

AI 能力与数据策略

模型目录

Protocol NLP 引擎

识别 protocol 章节结构、提取关键参数并进行时态转换；采用中文/英文双语预训练模型 + 规则校正。

分析总结生成模型

结合 TGI、T:C、Survival、实验条件与历史报告生成专业总结；支持提示词配置与风格调优。

Study 分类模型

基于项目元数据与实验流程自动判断是否标准 Study，为多模型报表提供快速路径。

训练与部署要求

采用 CrownBio 内部标注数据集，确保客户与实验数据脱敏处理。
模型训练需通过 MLOps 流水线管理，提供版本控制、性能基准、回滚机制。
推理服务通过 API 暴露，支持负载均衡与熔断；关键指标包括延迟（P95 < 800ms）与可用性（99.5%）。
引入人机协同校验（Human-in-the-loop），关键分析结论需人工确认后才能出现在正式报告中。

数据治理

明确数据分类（公开、内部、机密、受限），按分类控制访问与加密策略。
AI 训练集需记录数据血缘、来源系统、发布时间与审批记录。
对外部供应商 API（如 HuPharm）调用需记录输入参数与返回值快照，以便审计与追踪。

Integration

系统集成与数据流

外部系统	数据类型	同步模式	关键控制
Salesforce	项目、客户、联系人、BD 信息	每天增量 + 即时 webhook	字段映射校验、重复项检测、变更审计
ELN	最终 Protocol、实验步骤、原始记录	受控拉取（审批触发）	版本锁定、内容哈希校验、签署验证
Studylog	动物分组、BW/TV 数据、实验事件	准实时（15 分钟轮询）	数据一致性校验、异常告警、回放机制
Cell Data	细胞系信息、批次、存储条件	每日同步	主数据管理（MDM）校验、生命周期追踪
HuPharm API	%TGI、%T/C、统计显著性	实时调用	参数版本控制、重试策略、延迟监控
Report 模版库	客户定制模版、标准模版	集中管理，按需推送	模版审批、权限隔离、变更通知

数据同步策略

通过企业级数据总线 (ESB) 或 API 网关实现标准化接入，采用统一的消息格式（JSON + Schema Registry），并通过 CDC/队列确保增量与顺序。

错误处理

所有集成接口需暴露重试策略、失败告警与人工介入流程；提供观测平台对吞吐、失败率、延迟进行监控。

NFR

非功能需求

性能

核心页面首屏加载 ≤ 3 秒，交互延迟 P95 ≤ 1 秒。
支持同时 500 名活跃用户，HuPharm 调用峰值 200 次/分钟。
报表导出任务支持并发队列，平均完成 ≤ 2 分钟。

可靠性

服务可用性 ≥ 99.5%，支持跨区域灾备与自动故障转移。
关键数据每日全量备份，保留 ≥ 7 年。
AI 推理服务部署多活架构，具备熔断与降级逻辑。

可维护性

采用微服务 + 事件驱动架构，服务间接口通过 OpenAPI 定义。
CI/CD 覆盖单元测试、集成测试、UI 自动化与安全扫描。
配置即代码（Configuration-as-Code），变更需双人审核。

可扩展性

模块化设计，支持新增分析类型、第三方算法接入。
报告模版引擎支持插入客户自定义组件与宏。
数据仓库预留扩展字段与多模数据模型。

监控与告警

建立统一观测平台，覆盖日志、指标、追踪三类数据。
对 AI 相关指标（质量评分、拒绝率）设置阈值告警。
用户操作异常、权限越权实时通知安全团队。

本地化

支持中国、美国、欧洲部署模式，可灵活选择数据落地位置。
时间与货币格式随地区配置；遵循当地法规 (如 GDPR, CSL)。
AI 模型策略可区域化，满足不同法规要求。

Compliance

合规、安全与审计

安全策略

采用零信任访问控制，启用 SSO + MFA，关键操作二次验证。
所有数据静态与传输加密（AES-256 & TLS 1.2+），密钥托管于企业 KMS。
分级权限：数据读取、编辑、导出、AI 调用需分别授权。
异常访问检测：引入 UEBA，对异常模式实时阻断。

合规框架

遵循 GLP/GCP 行业规范，记录完整的实验数据修订历史。
满足 GDPR、CCPA 对个人信息的控制要求，提供数据主体访问与删除功能。
AI 结果透明化，提供提示词、输入数据范围、生成版本的审计记录。
审计日志不可篡改，保留至少 10 年，可导出至 SIEM 系统。

风险控制

建立变更管理委员会（CCB），重大配置与模型更新需审批。
定期执行渗透测试与 SOC2 Type II 审计，发现问题需在 SLA 内闭环。
提供业务连续性计划（BCP）与灾难恢复演练，确保 RTO ≤ 4 小时，RPO ≤ 30 分钟。

Delivery

交付计划与运营

里程碑规划

阶段一 - In-vivo 核心能力 (第 0-3 月)

完成项目数据同步、协议上传解析、HuPharm 参数配置、数据确认交互与 AI 驱动的报告生成，满足中国区 In-vivo 业务落地。

                滚动规划： 后续阶段根据第一阶段达成情况、国际化需求与资源配置实时评估并调整节奏，确保平台扩展与业务优先级保持一致。
            

运营与支持

建立产品运营团队，负责模板维护、AI 提示词迭代、用户培训。
DevOps 负责 24/7 监控、升级、SLA 管理；提供分级支持响应机制。
定期复盘 KPI（效率、质量、满意度）并驱动持续优化。