958 B
958 B
P02_errlens_training - 训练流程
训练流程
阶段一:数据准备
# 1. 下载原始数据
python src/data/download.py
# 2. 数据清洗
python src/data/clean.py
# 3. 数据标注(可选)
python src/data/label.py
阶段二:模型训练
# 训练命令
python src/training/train.py \
--data data/train \
--model-base microsoft/codebert-base \
--epochs 10 \
--batch-size 32 \
--lr 2e-5
阶段三:模型评估
# 评估命令
python src/evaluation/evaluate.py \
--model models/best_model \
--data data/test
阶段四:模型导出
# 导出为 ONNX 格式
python src/deployment/export.py \
--model models/best_model \
--output models/exported
评估指标
| 指标 | 说明 | 目标值 |
|---|---|---|
| Precision | 精确率 | >= 0.90 |
| Recall | 召回率 | >= 0.85 |
| F1 Score | F1分数 | >= 0.87 |
| Accuracy | 准确率 | >= 0.92 |