Beschaffungsplanung unter unsicherer Verfügbarkeit (procurement planning under uncertain availability)

Markovsches Entscheidungsproblem MDP (Verlustfall)

\(\large (\text{PPUA})~~\left\{~~ \begin{align*} & \begin{aligned} & \rlap{\text{Min.}}\phantom{\text{u. d. N.}} && C(\boldsymbol{q})=\lim_{T\to\infty}\mathbb{E}\Big(\frac{1}{T}\sum_{t=1}^T (\pi\cdot\min\{q_t, Y_t\}+h\cdot\max\{0, X_{t+1}\} +\ k\cdot\delta(q_t)+v\cdot\max\{0, -X_{t+1}\})\Big|X_1=x^a\Big) \end{aligned} \\ & \begin{aligned} & \text{u. d. N.} && X_{t+1}=\min\{\max\{0, X_t\}+\min\{q_t, Y_t\}-D_t, \bar{x}\} & (t=1, 2, \ldots) \end{aligned} \end{align*}\right. \)

Primales lineares Programm zur Lösung der MDP-Formulierung

\(\large (\text{MDP-P})~~\left\{~~ \begin{align*} & \begin{aligned} & \rlap{\text{Min.}}\phantom{\text{u. d. N.}} && \bar{r} \end{aligned} \\ & \begin{aligned} & \text{u. d. N.} && \bar{r} + b_s \ge r(s, a)+\sum_{s'\in\mathcal{S}}p_{ss'}^a\cdot b_{s'} & (s\in\mathcal{S};~a\in\mathcal{A}(s)) \end{aligned} \end{align*}\right. \)

Duales lineares Programm zur Lösung der MDP-Formulierung

\(\large (\text{MDP-D})~~\left\{~~ \begin{align*} & \begin{aligned} & \rlap{\text{Min.}}\phantom{\text{u. d. N.}} && \sum_{s\in\mathcal{S}}\sum_{a\in\mathcal{A}(s)} r(s, a)\cdot\sigma_{sa} \end{aligned} \\ & \begin{aligned} & \text{u. d. N.} && \sum_{s\in\mathcal{S}}\sum_{a\in\mathcal{A}(s)} \sigma_{sa} = 1 \\ & && \sum_{a\in\mathcal{A}(s')}\sigma_{s'a}=\sum_{s\in\mathcal{S}}\sum_{a\in\mathcal{A}(s)} p_{ss'}^a\cdot\sigma_{sa} && (s'\in\mathcal{S}) \\ & && \sigma_{sa}\ge 0 && (s\in\mathcal{S};~a\in\mathcal{A}(s)) \end{aligned} \end{align*}\right. \)
\(\delta\)Indikatorfunktion mit \(\delta(q)=1\), falls \(q>0\), und \(\delta(q)=0\), sonst
\(\pi\)Einkaufspreis bei Lieferant
\(\ast\)\(\sigma_{sa}\)Stationäre Wahrscheinlichkeit von Zustand \(s\) bei Wahl von optimaler Aktion \(a=q(s)\), und \(0\), sonst
\(\mathcal{A}\)Menge der Aktionen \(a\)
\(\ast\)\(b_s\)Bias von Zustand \(s\)
\(\bullet\)\(D_t\sim D\)Zu deckender Bedarf in Periode \(t\)
\(h\)Lagerungskostensatz
\(k\)Bestellfixe Kosten
\(p_{ss'}^a\)Übergangswahrscheinlichkeit von Zustand \(s\) zu \(s'\) bei Wahl von Aktion \(a\)
\(\ast\)\(\boldsymbol{q}\)Stationäre deterministische Politik
\(\ast\)\(q_t\)Bestellmenge in Periode \(t\)
\(r(s, a)\)Reward in Zustand \(s\) bei Wahl von Aktion \(a\)
\(\ast\)\(\bar{r}\)Maximaler Reward pro Stufe
\(\mathcal{S}\)Menge der Zustände \(s\)
\(v\)Fehlmengenkosten pro ME
\(x^a\)Anfangslagerbestand
\(\bullet\)\(X_t\sim X\)Disponibler Bestand zu Beginn von Periode \(t\)
\(\bullet\)\(Y_t\sim Y\)Verfügbarkeit bei Lieferant in Periode \(t\)