Nichtglatte Optimierung
Transcription
Nichtglatte Optimierung
Zentrum Mathematik Technische Universitat Munchen Prof. Dr. Michael Ulbrich Dr. Moritz Simon Sommersemester 2011 Ubungsblatt 6 Nichtglatte Optimierung 1. Motivation für Bundle-Verfahren 2. Ordnung: Sei xk ∈ Rn und γk > 0. (a) Sei f : Rn → R stetig dierenzierbar. Zeigen Sie, dass sk = −γk ∇f(xk ) die eindeutige Losung des folgenden euklidischen Problems ist: minn ∇f(xk )T s + s∈R 1 ksk2 2γk (b) Sei zudem Hk ∈ Rn×n symmetrisch positiv denitiv (\spd"). Zeigen Sie allk gemeiner, dass sk = −γk H−1 ost: k ∇f(x ) folgendes Problem eindeutig l minn ∇f(xk )T s + s∈R 1 T s Hk s 2γk (c) Sei nun f : Rn → R konvex. Erortern Sie, warum es im Zusammenhang mit Bundle-Verfahren vorteilhaft sein konnte, das Problem k min fse Jk (x + s) + s∈Rn 1 T s Hk s 2γk zur Schrittberechnung zu verwenden; dabei versucht man die spd-Matrix Hk derart zu wahlen, dass sie das globale Krummungsverhalten von f in einer Umgebung der Iterierten xk moglichst gut approximiert. 2. Eigenwert-Optimierung: In den Anwendungen tritt oft das Problem auf, den groten Eigenwert einer symmetrischen Matrix zu minimieren. Dazu betrachten wir die Funktion λmax : S n×n → R, A 7→ max vT Av kvk=1 bzgl. der euklidischen Norm. Ferner vereinbaren wir gema X • Y := das \Frobenius-Skalarprodukt" zweier Matrizen X, Y ∈ Rn×n . Pn i,j=1 xij yij (a) Begrunden Sie, dass die Funktion λmax konvex ist. (b) Zeigen Sie, dass fur alle v ∈ Rn und A ∈ S n×n folgendes gilt: vvT • A = vT Av ≤ λmax (A) kvk2 (c) Sei q ein normierter Eigenvektor zum Eigenwert λmax (A). Zeigen Sie, dass dann qqT ein \Frobenius-Subgradient" von λmax in A ist: λmax (B) − λmax (A) ≥ qqT • (B − A) ∀ B ∈ S n×n (d) Seien nun Ai ∈ S n×n fur i = 0, . . . , m. Bestimmen Sie zu jedem t ∈ Rm einen Subgradienten g(t) ∈ Rm der konvexen Verkettung f : Rm → R, t 7→ λmax A0 + Pm i=1 ti Ai . 3. Verallgemeinerte Differentiale: F ur lokal Lipschitz-stetige F : U → ◦ n U = U ⊆ R existiert in jedem x ∈ U das Bouligand-Subdifferential ∂B F(x) := M ∈ Rm×n ∃ (xk ) ⊂ Ud : xk → x, F 0 (xk ) → M , Rm mit wobei Ud ⊆ U die Menge der Dierenzierbarkeitspunkte von F bezeichnet. Das verallgemeinerte Clarke-Differential ist dann ∂cl F(x) := conv ∂B F(x). Fur konvexe Funktionen f : U → R gilt tatsachlich ∂cl f(x) = ∂f(x)T , wobei die Transposition elementweise zu lesen ist. Dies wollen wir abschlieend an der konkaven NCP-Funktion p φ(a, b) ≡ a + b − a2 + b2 von Fischer und Burmeister (daher \FB-Funktion") illustrieren. (a) Zeigen Sie, dass φ : R2 → R eine NCP-Funktion ist: φ(a, b) = 0 ⇐⇒ a, b ≥ 0 und ab = 0. (b) Berechnen Sie das Subdierential ∂f(a, b) von f := −φ fur alle a, b ∈ R. (c) Bestimmen Sie ferner das Bouligand-Subdierential ∂B φ der FB-Funktion und daraus das zugehorige Clarke-Dierential ∂cl φ. Zur Erinnerung: Die Semestralklausur ndet am 18. August 2011 von 10:00 bis 11:00 im MI HS 2 statt. Wir wunschen Ihnen viel Erfolg bei Ihrer Vorbereitung! ,