|
|
hai 3 meses | |
|---|---|---|
| __pycache__ | hai 3 meses | |
| README.md | hai 3 meses | |
| recall_eval.py | hai 3 meses | |
| requirements.txt | hai 3 meses |
用于评估“根据用户问题召回仪表板/数据集”的三路召回表现。
id_map.parquet必需字段:
card_idcard_namedashboard_iddashboard_namedataset_iddataset_namebranch_codequestions.txt推荐格式每行一条:
123456\t本月深圳分行存款趋势
234567\t零售客户AUM周报看板
脚本也兼容 card_id,question、card_id|question 和 card_id question。
500 个,以 80% 概率强制放入正确卡片所在仪表板。recall_type=dashboard。recall_type=dataset。命中规则:
dashboard_id 即视为命中。dataset_id 即视为命中。python3 -m pip install -r requirements.txt
python3 recall_eval.py \
--questions-txt ./questions.txt \
--id-map-parquet ./id_map.parquet \
--api-url http://your-recall-api/recall \
--output-dir ./output
output/recall_summary.json:汇总指标output/recall_details.csv:逐题明细,包含第二路/第三路召回结果和错误信息脚本默认使用 POST JSON:
{
"question": "本月深圳分行存款趋势",
"recall_type": "dashboard"
}
返回支持以下常见结构之一:
{"data": [...]}{"items": [...]}{"results": [...]}每条记录至少包含一个可识别的 ID 字段,例如:
dashboard_iddataset_idid