Files
ai_soc_sw/review/active/P02-001/task.md
T
tupingr 4184a6d0b5 refactor(architecture): 信息架构重构 — 从"人类导向单体文档"到"AI优先分层架构"
新增四层信息架构:
- Layer 0: 角色工作台 (.ai/roles/) — AI 每天只需读2个小文件
- Layer 1: 路线图看板 (ROADMAP.md) — 人机共享进度
- Layer 2: 阶段上下文 (.ai/phases/) — 按当前阶段加载
- Layer 3: 知识沉淀 (.ai/knowledge/) — 决策/模式/教训自动积累

新增:
- DASHBOARD.md — 人类仪表盘(30秒了解全貌)
- ROADMAP.md — 任务看板+阻塞追踪
- docs/share/ — 对外分享内容层(一鸡多吃)
- docs/使用手册.md — 人+AI使用手册
- .ai/prompts/architecture/ — 补充缺失的架构提示词
- .ai/principles.md — 信息架构设计原则
- review/active/INDEX.md — 任务索引

修改:
- AGENTS.md: 239行→117行,顶部AI跳转
- README.md: 精简聚焦人类读者
- PROJECT_CONTEXT.md: 精简+分层说明
- DECISIONS.md: 替换为跳转存根
- 5个task.md: 添加phase字段

Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
2026-05-25 16:49:36 +08:00

30 lines
610 B
Markdown

# P02-001 - 数据集预处理模块
## 任务信息
- 任务编号: P02-001
- 项目: P02_errlens_training
- 创建时间: 2026-05-22
- 负责人: Dev AI
- 状态: TODO
- 阶段: Phase 1
## 任务描述
实现数据集预处理模块,包括:
1. 数据下载
2. 数据清洗
3. 数据标注
4. 特征提取
## 需求来源
- 模型训练需求文档
## 技术要求
- 支持多线程处理
- 数据格式标准化
- 支持增量更新
## 交付物
- `src/data/download.py` - 数据下载
- `src/data/clean.py` - 数据清洗
- `src/data/label.py` - 数据标注
- `src/data/features.py` - 特征提取