Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2

Kaggle Happywhaleコンペ
優勝解法でのOptuna使用事例
2022/12/10 Optuna Meetup #2
Kenshin Abe (@knshnb)

2
● -2021 東京大学コンピュータサイエンス修士課程
○ 深層学習の研究
○ 競技プログラミング（ICPC, AtCoder, Codeforces, etc.）
● 2021- Preferred Networks エンジニア
○ 半導体・リテール関連のプロジェクト
○ 2022/04- Optuna開発にも携わる
■ TPEの制約付き最適化・CMA-ES with Marginなど
● 2022年のHappywhaleコンペでKaggleを始める
Kenshin Abe / @knshnb

3
● Optunaを使ってKaggleコンペで優勝しました！！
導入
Our team!
(1st / 1588 teams)
https://www.kaggle.com/competitions/happy-whale-and-dolphin/leaderboard

4
● コンペの概要・解法
● Optuna部分の詳細
● 開発者側に回って得た知見
○ コンペで使えばよかった機能
○ 他にKaggleで使えそうな機能
● 終わりに
目次

6
● タスク概要
○ 様々な種類のクジラやイルカの画像から
個体を識別
● 目的
○ 専門家が時間をかけて行っていた個体
識別の自動化により、海洋研究の効率
化・環境保全への貢献
○ 実際にコンペ終了後にホストとシステム
導入に向けてのディスカッション
コンペのタスク
https://www.kaggle.com/competitions/happy-whale-and-dolphin/data

7
● 多クラス（約15,000）
● 不均衡（1サンプルのクラスもたくさん）
● 訓練データに含まれない未知個体を識別する必要性
（”new_individual”と出力）
難しい点

8
● SoftmaxにMarginを持たせクラス内分散を抑える手法
● ここ数年、様々なKaggleコンペで高い性能
○ 1st place solution of “Human Protein Atlas Image Classiﬁcation” by
bestﬁtting, 2019/01
○ 1st place solution of “Google Landmark Recognition” by Dieter, 2021/10
○ 3rd place solution of “Foursquare - Location Matching” by Psi, 2022/07
○ 1st place solution of “Google Universal Image Embedding” by Shihao
Shao, 2022/10
● 一方、性能がマージン・温度の2つのハイパーパラメータに
対してかなり敏感
○ 不均衡データに対応するためのDynamic Marginとい
う手法を採用すると、更にハイパラが増えて調整が大
変に
ベースライン: ArcFace [Deng+, CVPR 2018]
https://arxiv.org/pdf/1801.07698.pdf

9
● 本体Crop + Sub-center ArcFace + Dynamic Margin + k-NN
● ポイント
○ ArcFaceのハイパーパラメータをOptunaにより調整
○ 複数種類のBounding boxを混ぜることによるData augmentation
○ k-NNとlogitを組み合わせたPostprocess
○ 疑似ラベル・アンサンブル
○ その他大量の試行錯誤によるアーキテクチャ・パイプラインの改善
● 詳細
○ Kaggle Discussionへの投稿: https://www.kaggle.com/competitions/happy-whale-and-dolphin/discussion/320192
○ https://github.com/knshnb/kaggle-happywhale-1st-place
○ https://github.com/tyamaguchi17/kaggle-happywhale-1st-place-solution-charmq
1st Place Solution サマリー

10
● ハイパラ最適化自体が大きな差別化要因になることは少なそう
○ データ・もっと大きな粒度のモデリング・学習手法などの改善の方が重要
なことが多い
● （探索結果を見てしまった以上、効果を定量的に測るのも難しい）
● 手間削減により、限られた時間の中で上の重要な部分の試行錯誤に集中で
きたのが大きかった
ハイパラ最適化がどのくらい優勝に貢献したか
ChatGPTによる回答 (https://chat.openai.com/chat)

12
ソースコード: https://github.com/knshnb/kaggle-happywhale-1st-place/blob/master/src/tune.py
● PyTorch Lightning Integration
● 目的関数の軽量化
● RDBStorageを用いた分散最適化
● Optuna Dashboardを用いた可視化
● その他tips・注意点
Optuna部分の詳細

13
● もともとPyTorch Lightningで実装していたので簡単に組み込めた
● 中間値を自動でreportしてくれるので、学習曲線の可視化が可能に
● PrunerはデフォルトのMedianPrunerよりNopPrunerの方が性能が良かった
（MedianPrunerのパラメータ調整の余地あり）
PyTorch Lightning Integration
import optuna
from optuna.integration import PyTorchLightningPruningCallback
def train(..., cfg: Config, trial: Optional[optuna.Trial] = None) -> float:
...
if trial is not None:
callbacks.append(PyTorchLightningPruningCallback(trial, "val/map5"))
...
return trainer.callback_metrics["val/map5"].item()
base_cfg = load_config(...)
def objective(trial: optuna.Trial) -> float:
cfg = copy.deepcopy(base_cfg)
cfg["s"] = trial.suggest_float("s", 10.0, 80.0)
cfg["margin_power"] = trial.suggest_float("margin_power", -0.8, -0.05)
...
return train(..., cfg, trial=trial)
def train(..., cfg: Config):
...
cfg = load_config(...)
train(..., cfg)

14
● 実際の学習はV100 (32GB)を2-4個使って半日程度かかる
● V100 (16GB) 1つで1時間程度で終わるような軽量な目的関数を設定
○ モデルサイズ縮小（eﬃcientnet_b5,6,7 → eﬃcientnet_b1）
○ 画像サイズ縮小（768-1024 → 256）
○ 本体をcropしてresize後のデータをPFIOをつかってキャッシュし、データの
読み込みを高速化
● 100回程度の評価が現実的に
● 得られたパラメータは大きいモデル・画像サイズやパイプライン改善後もうまく
動いたので最後までその値を使用
○ ある程度良いパラメータを求めるのには十分だった
○ 転移学習で調整し直すともっと性能が上がったかも（後述）
目的関数の軽量化

15
● 分散最適化、プログラムの中断・再開が可能に
● Heartbeat機能によりFailしたtrialを検知可能
● RetryFailedTrialCallback.retried_trial_numberでpreemption対応も可能
RDBStorageを用いた分散最適化
storage = optuna.storages.RDBStorage(
url=rdb_url,
heartbeat_interval=60,
grace_period=120,
failed_trial_callback=optuna.storages.RetryFailedTrialCallback(),
)
study = optuna.create_study(storage=storage, ...)

16
● https://github.com/optuna/optuna-dashboard
● webインターフェースなので気軽に使用可能
● 使い方などはc-bataさんの発表参照
● ex. 学習曲線を見て枝刈りが有効かどうか判断
● ex. Importanceが特定のパラメータに偏りすぎて
いると最適化がうまくいきにくい（経験則）ので、
Sliceを見て範囲を狭めるなどして調整
Optuna Dashboardを用いた可視化

17
● PyTorch Lightning Integrationは、現在(v3.0.4)最新版のPyTorch Lightningに
対応していないので1.5.*以前のものを使用
○ 近々対応の予定（PR）
● study.enqueue_trialでデフォルトのパラメータなどを指定できる
● Samplerは以下の理由からTPEを採用
○ カテゴリカル変数にも対応
○ enqueue_trialの結果がその後の探索に使われる
○ cf. Sampler比較表: https://optuna.readthedocs.io/en/stable/reference/samplers/index.html
その他tips・注意点

18
開発者側に回って得た知見

19
● TPEの引数の設定
○ multivariate: 変数間の相関を考慮
○ constant_liar: 並列最適化向けオプション
■ v3.1の修正で性能が向上
○ group: dynamic search spaceでグループごとに変数間の相関を考慮
● Warm Starting CMA-ES（スライド）
○ 似たようなタスクでの評価結果を転用する手法
■ ex. NNの訓練などの重いタスクでデータ数・モデルサイズなどを減ら
した結果を流用
■ ex. 設定を微妙に変えて最適化の試行錯誤を何度もする場合
コンペで使えばよかった機能

20
● LightGBMTuner（ブログ記事）
○ Kaggle Grandmaster（smlyさん）の知見が詰め込まれた、LightGBM専用
のハイパラ最適化ツール
● Dynamic Search Space
○ 探索範囲の変更はかなり自由にできる
○ パラメータの追加・削除・範囲の変更・if文による分岐
○ categoricalのchoicesのみ変更不可
その他Kaggleで使えそうな機能1

21
● [0, 1]の範囲の重み調整
○ アンサンブルの重み調整などに
● Pruning
○ 性能が悪化するケースもあるので注意して使う必要あり（v3でのベンチ
マーク結果）
● CMA-ES with Margin (~v3.1)
○ 離散的な探索空間（intなど）で局所解にハマりにくく
● JournalStorage (~v3.1)
○ SQLサーバーを建てられない環境・面倒な場合
● BruteForceSampler (~v3.1)
○ 同じインターフェースで全探索
その他Kaggleで使えそうな機能2

22
● Kaggleだとハイパーパラメータ調整自体が性能の大きな差別化要因になるこ
とは少ないが、作業の手間削減にOptunaは有用
● Kaggler目線の機能リクエストなども常に募集してます！
終わりに

Making the real world computable

Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2

Similar to Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2 (20)

More from Preferred Networks

More from Preferred Networks (20)

Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2