GDAS.pptx
- 3. Overview
Tương tự như DART, tuy nhiên có sử dụng annealing softmax để
sinh ra one-hot vector trong quá trình concat các toán tử tại mỗi
node.
- 6. Gumbel-Max trick
• Trong đó:
• Ii là node thứ i.
• A là architect parameters.
• ok là sample sinh ra từ Gumbel(0,1).
•