目录

43-树叶分类竞赛技术总结

43-树叶分类竞赛技术总结

目录

1. 比赛结果
2. 结果分析
3. 技术分析
4. 模型方面
5. AutoGluon
6. 总结

1. 比赛结果

176 类，18353 训练样本

165 只队伍参加
- 41 只队伍精度 > 98% (非常好)
- 83 只队伍精度 > 95% (够用)

2. 结果分析

16 只队伍提供了代码：
- Classify Leaves | Kaggle
额外加上 Neko Kiku
- 很多人参考了此代码 simple resnet baseline | Kaggle

3. 技术分析

相比于课程介绍的代码，同学们主要做了下面这些加强：

数据增强，在测试时多次使用稍弱的增强然后取平均
使用多个模型预测，最后结果加权平均
- 有使用 10 种模型的，也有使用单一模型的
训练算法和学习率
清理数据

4. 模型方面

模型多为 ResNet 变种
- DenseNet，ResNeXt，ResNeSt, …
- EfficientNet
优化算法多为 Adam 或其变种
学习率一般是 Cosine 或者训练不动时往下调

5. AutoGluon

15 行代码，安装加训练耗时 100 分钟
- AutoGluon.vision: 0.96+ with 15 lines | Kaggle
精度 96%
- 可以通过定制化提升精度
- 下一个版本将搜索更多的模型超参数
- AG 目前主要仍是关注工业界应用上，而非比赛

6. 总结

提升精度思路：根据数据挑选增强，使用新模型、新优化算法，多个模型融合，测试时使用增强
数据相对简单，排名有相对随机性
在工业界应用中：
- 少使用模型融合和测试时增强，计算代价过高
- 通常固定模型超参数，而将精力主要花在提升数据质量

比赛/学术界：固定数据，调模型

工业界：固定模型，调数据

最近更新于 0001-01-01

comments powered by Disqus