infoShare AI Roadshow 2018 - Tomasz Brzeziński (iTaxi) - Niestandardowe metody Machine Learning: podnoszenie efektywności biznesu przez zastosowanie podejścia symulacyjnego

TOMASZ BRZEZIŃSKI
NIESTANDARDOWE METODY MACHINE LEARNING
Podnoszenie efektywności biznesu przez zastosowanie
podejścia symulacyjnego

Problem: optymalizacja algorytmu wydawania
zleceń

Dostarczyć taksówkę:
•jak najszybciej
•jak najlepszą
•z żądaną stawką za kilometr
•spełniającą dodatkowe wymagania (np. liczba osób)
•tak, aby móc skutecznie zrealizować kolejne zlecenia
Zadanie

Dostarczyć taksówkę:
•jak najszybciej: mediana czasu dojazdu
•jak najlepszą: średni scoring kierowcy
•tak, aby móc skutecznie zrealizować kolejne zlecenia:
reliability ratio (ilość kursów/popyt)
KPI

Problem
•wielokryterialny
•nieliniowy i niesprowadzalny do liniowego
•dyskretny
•niestabilny w czasie
•w warunkach niepewności
Dlaczego to jest trudne?

System cyklicznej poprawy algorytmu

Benchmark (100%) Benchmark (90%) Benchmark (50%) Przegrany (10%) Przegrany (0%)
Kandydat (10%) Pretendent (50%)
Zwycięzca - nowy
benchmark (90%)
Zwycięzca - nowy
benchmark (100%)
Testy A/B

Benchmark (100%)
(50%)
Przegrany (10%) Przegrany (0%)
Kandydat (10%)
Pretendent
(40%)
Zwycięzca -
nowy
benchmark
(80%)
Benchmark
(50
(…)
Kandydat 2
(10%)
Przegrany (0%)
Pretendent
(40%)
(…)
Kandydat 4
(10%)
(…)
Benchmark (100%)
Benchmark
(90%)
Benchmark
(50%)
Przegrany (10%) Przegrany (0%)
Kandydat (10%)
Pretendent
(40%)
Zwycięzca -
nowy
benchmark
(80%)
Benchmark
(50%)
(…)
Kandydat 2
(10%)
Przegrany (0%)
Kandydat 3
(10%)
Pretendent
(40%)
(…)
Kandydat 4
(10%)
(…)
Cykliczne testy A/B
Benchmark (100%)
Benchmark
(90%)
Kandydat (10%)
Benchmark (100%)
Benchmark
(90%)
Benchmark
(50%)
Kandydat (10%)
Pretendent
(40%)
Kandydat 2
(10%)

Nowe rozwiązanie Test w symulatorze
Optymalizacja
parametrów w
symulatorze
Benchmark w teście
A/B
Nowy benchmark/
przegrany
Pretesting w symulatorze
Testowanie w rzeczywistości ma znaczący wpływ na
biznes

A jeśli wyniki w rzeczywistości odbiegają od
symulacji?

Kompletny system
Test w
symulatorze
Testy A/B
Analiza
rozbieżności
Modyfikacja
symulatora

• Symulacja: przybliżone odtwarzanie zjawisk czy zachowań jakiegoś
obiektu za pomocą jego modelu (fizycznego lub matematycznego)
• Model matematyczny: grupa funkcji wiążących ze sobą różne zmienne
i w ten sposób opisujących powiązania między wielkościami
w układzie
Symulacja

Symulacyjne podejście do problemu iTaxi–
założenia/uproszczenia

rozważmy zbiór identycznych sferycznych taksówek…
ze zbiornikiem paliwa o nieskończonej pojemności…
poruszających się ruchem jednostajnym prostoliniowym…
po powierzchni wycinka quasigeoidy…
w celu obsługi identycznych pasażerów…
o stałych i niezmiennych w czasie preferencjach…
składających zamówienia wg rozkładu Poissona…
Jak nie odlecieć?

Uproszczenia:
• Eliminacja zdarzeń tak rzadkich, że nie wpływających na wynik
• Eliminacja wzajemnie znoszących się odchyleń
• Eliminacja nieestymowalnych odchyleń
Nie wolno:
• Uśredniać istotnych zmienności
• Ignorować niestabilności
• Ignorować istotnych korelacji zjawisk
• Zakładać znajomości informacji, których w realnej sytuacji nie mamy
Można rozważyć:
• Uproszczenie (np. uśrednienie) istotnego zjawiska, jeśli strata dokładności jest
rekompensowana szybkością obliczeń
Zasady budowy modelu

Taksówki mają identyczną prędkość
Poruszają się po liniach prostych
Nie ma zleceń grupowych (kilka taksówek)
Nie ma zleceń terminowych
Pasażer nie zmienia swoich decyzji
Uproszczenia

Zjawiska mają określone rozkłady, które muszą być odzwierciedlone:
- rozkład zleceń w przestrzeni i czasie
- rozkład dostępności taksówkarzy w przestrzeni i czasie
- rozkład scoringów
- rozkład cierpliwości pasażerów
- rozkład prawdopodobieństwa odrzucenia zlecenia przez taksówkarza (rozkłady są różne dla
poszczególnych taksówkarzy)
Wielowymiarowe rozkłady nie są dekomponowane na poszczególne wymiary
Poszczególne miasta mają inne charakterystyki
Przejezdność miasta (prędkość poruszania się) zmienia się w czasie i jest niejednorodna w
przestrzeni
W danym momencie nie mamy wiedzy o przyszłości
Poszczególne czynności (zamówienie taksówki, przyjęcie zlecenia przez taksówkarza itp.) trwają
określony czas
Czego nie uprościliśmy?

Rozkłady szacowane metodami analitycznymi:
- rozkład scoringów
- rozkład prawdopodobieństwa odrzucenia zlecenia
przez taksówkarza
Popyt i podaż – symulacja metodami Monte Carlo
Szacowanie rozkładów – główny problem

metoda Monte Carlo
• Stanisław Ulam
• Metoda jest używana do modelowania
procesów zbyt złożonych do obliczania
analitycznego
• Aby zamodelować wynik procesu, losujemy
odpowiednio dużo wielkości
charakteryzujących proces, po czym
dokonujemy przetworzenia algorytmicznego

Dla danego dnia znajdujemy dni „podobne”
Zlecenia ze wszystkich dni podobnych stanowią pulę
losowania
Określamy intensywność popytu
Losujemy (ze zwracaniem) potrzebną liczbę zleceń
Dla danego zlecenia bierzemy jego pełną
charakterystykę (położenie, czas, parametry pasażera)
Zastosowanie Monte Carlo w symulacji popytu

Dla danego dnia znajdujemy dni „podobne”
Pulę losowania stanowią wszystkie sesje dostępności
kierowców
Określamy intensywność podaży
Losujemy (ze zwracaniem) potrzebną liczbę sesji dostępności
Dla danej sesji bierzemy jej pełną charakterystykę (miejsce
pojawienia, czas startu, czas zakończenia, parametry
taksówkarza)
Zastosowanie Monte Carlo w symulacji podaży

•W symulatorze: 12 różnych funkcji, około 1000
zestawów parametrów
•W testach A/B: 9 faz testów, 3 funkcje, łącznie 32
zestawy parametrów
•2 fazy modyfikacji symulatora na podstawie
rozbieżności z rzeczywistością
•Cykliczność: nowy test w (prawie) każdy czwartek
Przeprowadzone testy

Dni robocze
Czas dojazdu
RR
Scoring
Weekend
Czas dojazdu
RR
Scoring
Przykładowe wyniki dla jednego z miast
F1 F2 F3
Dni robocze
Czas dojazdu -7,2% -6,9% -6,1%
RR +3,0% +3,0% -8,5%
Scoring -4,4% -7,7% -4,0%
Weekend
Czas dojazdu -3,2% +0,0% -4,8%
RR -1,5% -1,5% +5,0%
Scoring -3,5% -6,3% +4,0%

Dotychczasowe efekty
•Zmiana średniego scoringu: +0,4%
•Zmiana mediany czasu dojazdu: -8,5%
•Zmiana RR: +7,5%

Dlaczego tak mało?
•Rzeczywistość nieustannie się zmienia
•Optymalne algorytmy są specyficzne dla miast i czasu
•Testy A/B muszą być ostrożne -> określenie istotności
statystycznej zajmuje czas

Plany
•Dynamiczna automatyczna optymalizacja
Prognoza
popytu
Natężenie
ruchu
Wybór funkcji i
parametrów przydziału
taksówki
Prognoza
zmian podaży
Lokalizacja
zlecenia
Obecny stan
podaży

Plany – automatyka testów
• SI (NN lub GA) przeszukuje zakres możliwych algorytmów
przydziału taksówek i testuje je w symulatorze
• Jeśli test istotnie poprawia funkcję celu, automatyczny test
A/B
• Jeśli w teście A/B poprawa jest potwierdzona, test
rozszerzany
• Jeśli w teście A/B poprawa nie jest potwierdzona, alert
(symulator wymaga poprawy)

• Jeśli możesz, przed testowaniem na żywo sprawdź scenariusz w
warunkach laboratoryjnych
• Jeśli problem jest zbyt skomplikowany do rozwiązania analitycznego,
przeprowadź symulację
• Rozbieżności wyników symulacji z wynikami testów A/B są narzędziem
do doskonalenia symulatora
• W zmieniającej się rzeczywistości optymalizacja nigdy się nie kończy
Na wynos

infoShare AI Roadshow 2018 - Tomasz Brzeziński (iTaxi) - Niestandardowe metody Machine Learning: podnoszenie efektywności biznesu przez zastosowanie podejścia symulacyjnego

Recomendados

Recomendados

Mais conteúdo relacionado

Mais de Infoshare

Mais de Infoshare (20)

infoShare AI Roadshow 2018 - Tomasz Brzeziński (iTaxi) - Niestandardowe metody Machine Learning: podnoszenie efektywności biznesu przez zastosowanie podejścia symulacyjnego