Permutationsgruppen mit eingeschränkten Fixpunktmengen, ein Zwischenbericht.

Hier sammle ich nur einige Gedanken zu derzeit drei Artikeln von Pretzel und Schleichermacher aus den 70ern die ich derzeit „im Schneckentempo“ durcharbeite.

Pretzel & Schleiermacher, On Permutation Group in Which Nontrivial Elements Fix Two Points or None

Lemma 1,2 und 3 nachvollzogen, sowie Theorem 5. Unklar sind noch die beiden charakterbasierten Beweise Lemma 4 und Theorem 6, in Theorem 6 ist mir nicht klar wieso man |G : M| = p und dass p nicht |M| teilt. Der (nicht charakterbasierte) Beweis von Proposition 7 ist mir auch nicht klar, dort wird eine ähnliche Annahme über den Index von M getroffen, und dass man ein g \in G \setminus M der Ordnung p wählen kann (ich denke mal da steckt auch wieder die Annahme dass p nicht |M| teilt). Nur der erste Satz ist mir klar mit dem weiter unten zitierten Fakt, dass die Sylow 2-Untergruppen genau dann normal sind, wenn das Komplement ungerade Ordnung hat.

Ausführlicher Beweis von Lemma 3: Wir müssen zeigen dass für gT \notin C_U(t)T / T gilt (C_U(t)T/T)^{gT} \cap C_U(t)T/T = T/T bzw. dazu äquivalent C_U(t)^gT \cap C_U(t)T \le T für g \notin C_U(t)T bzw g \notin C_U(t) und das C_U(t)T/T selbstnormalisierend ist. Für g \in C_G(t) ist C_U(t)^g = C_{U^g}(t^g) = C_{U^g}(t) und da C_U(t) \cap C_{U^g}(t) \le U \cap U^g folgt mit den Voraussetzungen an U

1 \ne C_U(t) \cap C_{U^g}(t) \Rightarrow U = U^g

d.h. N_G(C_U(t)) \cap C_G(t) \le N_G(U) \cap C_G(t); die umgekehrte Inklusion ist klar. Ist also g \notin N_G(C_U(t)) \cap C_G(t) so folgt U^g \cap U = 1 und damit C_U(t) \cap C_U(t)^g = 1 und weiter ist wegen T \le C_G(t) mit der Dedekind-Identität

N_G(U) \cap C_G(t) = TU \cap C_G(t) = T(U \cap C_G(t) = TC_U(t)

und damit ist C_U(t) eine T-Untergruppe in C_G(t). Faktorisiert man nun T raus so C_U(t)T/T = N_{C_G(t)}(C_U(t))/T, d.h. das Bild von C_U(t) in der Faktorgruppe stimmt mit seinem Normalisator überein. Sei nun x \in C_U(t)T \cap C_{U^g}(t)T für g C_G(t) \setminus N_G(U). Ein Produkt der Form tu \in TU hat wegen (tu)^2 \in U stets gerade Ordnung. Damit ist entweder x \in U \cap U^g, was sofort x = 1 liefert, oder x = tu = t\hat u^g, also u = \hat u^g, und da g \notin N_G(U) folgt ebenso u = \hat u = 1. In jedem Fall ist also \in T. Insgesamt ist damit gezeigt dass C_U(t)T/T ein Frobeniuskomplement in C_G(t)T/T ist.

Allerdings habe ich hier nicht Lemma 2 benutzt (ebenso in meinem Beweis von Lemma 1 (c) habe nicht Frattini benutzt). Den einzigen Normalteiler denn ich sehe ist T \unlhd C_G(t). Nutzt man nun dass C_U(t) eine T-Untergruppe mit T \cap C_U(t) = 1 ist und wendet Lemma 2(b) an so bekommt man dass C_U(t) ein normales Komplement in C_G(t) besitzt. Vielleicht kann man irgendwie zeigen dass C_{C_U(t)} \le T oder eine der anderen äquivalenten Charakterisierungen für Frobeniusgruppen.

Beiträge:

A character on a subgroup could be written as a difference with some character on the whole group, help on argumentation

If U≤GU≤G has odd order, and NG(U)=TUNG(U)=TU with T=⟨t⟩T=⟨t⟩ an involution. Assertions about S=TU∖TUS=TU∖TU.

If NG(U)=TUNG(U)=TU for T=⟨t⟩T=⟨t⟩ with involution tt, and N∩U≠1N∩U≠1, then G=TUNG=TUN and UNUN is Frobenius group

Let NN be maximal normal subgroup with TU∩N=1TU∩N=1, where TU=NG(U)TU=NG(U). Then NN is nilpotent and contains certain involutions.

If T=⟨t⟩T=⟨t⟩ for an involution tt, MM the normal closure of TT, and U∩M≠1U∩M≠1. Then TM=TGTM=TG.

Why do we have these values of the generalized character when evaluated with the scalar product?

Extending a linear character of UU to TUTU, where TT is generated by an involution normalising U

Normal subgroups in group having a t.i. subgroup which has index two in its normalizer

If MM is normal and M∩U=U′M∩U=U′ for some special subgroup UU, then M/G′M/G′ is a Hall-subgroup of G/G′G/G′.

If MM is normal and M∩U=U′M∩U=U′ for some special subgroup UU, then M/G′M/G′ is a Hall-subgroup of G/G′G/G′.

Sonstige Fakten:

Does a Frobenius group with a pp-group complement necessarily have a normal Sylow 22-subgroup?

If gp∈Ugp∈U for subgroup U≤GU≤G, when does this implies that pp divides the order of g

On Permutation Groups Whose Non-Trivial Elements have at Most Three Fixed Points

Kapitel Eins, The centralizer of a Bruck loop, denke ich soweit verstanden zu haben. Hier habe ich ein paar Notizen zusammengefasst, zu den Behauptung dass eine Bruck-Loop Potenzassoziativ ist, und zu dem Beweis von Theorem 1.3.

Zum Kapitel Zwei. Da G_{\alpha} eine Sylow 2-Untergruppe der Ordnung zwei ist gilt C_G(G_{\alpha}) = N_G(G_{\alpha}), also gibt es mit dem Transferlemma von Burnside ein normales 2-Komplement R. Weiter ist wegen |\Omega| = |G : G_{\alpha}| = |R| dieses regulär, und da \alpha^G = \alpha^{G_{\alpha}R} = \alpha^R transitiv, d.h. R ist ein regulärer Normalteiler. Damit operiert der Punktstabilisator auf R durch Konjugation äquivalent wie auf \Omega, hat also genau drei Fixpunkte, d.h. zentralisiert genau drei Elemente.

Im Beweis von Lemma 2.1, im dritten Paragraphen folgen die Aussagen über H (normal, wenn es Untergruppe wäre) aus G = HT. Das ist nicht ganz einfach zu sehen, siehe:

If GG has odd order, and an automorphism of order 22 centralizing precisely 33 elements, then G=CG(α)⋅{h:hα=h−1}G=CG(α)⋅{h:hα=h−1}.

Weiter ist G = \bigcup_{h \in H} hT disjunkt und H \cap T = 1; denn t \in T\cap H ist äquivalent mit t = t^{-1}, also t^2 = 1, aber T ist zyklisch von der Ordnung drei. Der Rest des Beweises ist mir nicht klar, da hier Sätze über Loops diesem Paper, Glaubermann: On loops of odd order zitiert werden und auch Charaktertheorie eingesetzt wird.

Kapitel Drei, Some known results. Es ist C_G(S) \unlhd N_G(S), entweder indem man sieht dass der Zentralisator der Kern der Abbildung ist welche jedes Element aus N_G(S) auf den durch Konjugation realisierten Automorphismus wirft, oder man rechnet direkt nach:

sg^{-1}xg = g^{-1}\hat sxg = g^{-1}x \hat s g = g^{-1}x g s'

und es ist s = s', da \hat sg = gg^{-1}\hat g = gsg^{-1}g = gs. Siehe auch:

Prove that the centralizer is a normal subgroup. [duplicate]
Prove that the centralizer subgroup is normal in the normalizer subgroup

Das G_1 = \langle a^3, b, c \rangle eine elementarabelsche Gruppe vom Index drei ist muss ich noch nachrechnen. Zu Satz 3.3., der im Beweis steht dass die Gruppen aus für die Ausnahmegruppe maximale Klasse haben (und damit nicht elemetarabelsch) oder metazyklisch sind. Der Beweis von Satz 3.4. ist mir nicht richtig klar, inbesondere der 2. Abschnitt, warum T = M \cap S z.B. metazyklisch or eine drei-Gruppe maximaler Klasse sein soll. Was mir klar ist. Das S/S' elementar-abelsch ist, denn wäre es zyklisch so wäre wegen S' \le \Phi(S) auch S / \Phi(S) zyklisch, und damit würde S selbst nur von einem Element erzeugt, mithin wäre es abelsch, was aber aufgrund der maximalen Klasse (bei dem Argument müsste man aber noch |S| = 9 und abelsch ausschließen, diese Gruppen sind abelsch und haben demnach Klasse eins, aber weil der Exponent zwei ist dennoch maximale Klasse) nicht sein kann.

Zu Satz 3.5. Ich glaube erstmal statt \mbox{det}(A) = 1 sollte da \mbox{det}(A) \ne 0 stehen, ich sehe z.B. nicht warum die Matrix

\begin{pmatrix} -1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{pmatrix}

ausgeschlossen sein sollte, den die Abbildung \varphi(a) = a^{-1}, \varphi(b) = b, \varphi(c) = c
ist ein Automorphismus, denn jedes Element hat ein Urbild (surjektiv), die Homomorphiebedingung gilt nach Definition durch lineare Ausdehnung, und injektiv ist es als surjektive Abbildung auf einer endlichen Menge. Siehe

Automorphisms of non-abelian groups of order 27
Classify groups of order 27
Automorphisms of non-abelian groups of order p^3

im ersten Beitrag wird auch gesagt die Determinante muss nur ungleich Null sein. Das die Homomorphiebedingung gilt ist einfaches nachrechnen, da mit der gewählten neuen Verknüpfung die Gruppe abelsch ist, und es sich wie in einem Vektorraum nachrechnet durch einsetzen. Achso, warum jedes Automorphismus \varphi(a) \in \langle a \rangle folgt da mit den Relationen a im Zentrum liegt, und da G nicht abelsch ist G / Z(G) nicht zyklisch, also |Z(G)| = 3 und wird damit von a erzeugt.

Let GG be a permutation group and R⊴GR⊴G. If GG acts double-transitive on the orbits of RR, then G/R≅A5G/R≅A5 and we have 55 RR-orbits

If Gα≅S4Gα≅S4 and |fix(g)|∈{0,3}|fix(g)|∈{0,3} for g≠1g≠1. Then GG has transitive normal subgroup of index 22.

For a new operation on a finite group of odd order giving a loop structure, when does this also gives a group

Show that |CG(u)|=12|CG(u)|=12 by “counting involutions”

If G=VNG=VN, VV a four group and NN regular normal, then there exists some Sylow subgroup left invariant by V

If GG acts such that fix(g)∈{0,3}fix(g)∈{0,3} for g≠1g≠1, and stabilizers are t.i. subgroups, then the Sylow 33-subgroups have maximal class

Sonstige Fakten:

Do solvable groups have elementary abelian characteristic subgroups?

Die folgenden Beiträge beweisen allesamt, dass wenn N \mbox{ char } G und A / N \mbox{ char } G / N, dass dann auch A \mbox{ char } G. Die verlinkten Beweise nutzen das Korrespondenzprinzip von Normalteilern in Faktorgruppen und der Ausgangsgruppe (auch manchmal 4ter Isomorphiesatz genannt). Aber ich denke man kann es auch direkt beweisen. Sei \varphi : G \to G ein Automorphismus von G. Da \varphi(N) = N ist die Abbildung \overline \varphi(gN) := \varphi(g)N wohldefiniert, denn \varphi(gn) = \varphi(g)\varphi(n) \in \varphi(g)N, d.h. andere Repräsentanten, welche sich nur um ein Element aus N unterscheiden, haben das gleiche Bild. Weiter ist \overline \varphi : G / N \to G/N injektiv, denn

\overline \varphi(gN) = \overline \varphi(hN) \Leftrightarrow \varphi(gh^{-1}) \in N \Leftrightarrow gh^{-1} \in N \Leftrightarrow gN = hN

und surjektiv, denn wählt man zu gN ein h \in G mit \varphi(h) = g so ist \overline \varphi(hN) = \varphi(h)N = gN. Sei nun N \le A (dass N \le A ist wichtig, siehe die verlinkten Beiträge, bzw. dass man ein volles Urbild von den Faktorgruppen nimmt) und a \in A. Dann folgt \varphi(a)N = a'N da A/N charakteristisch in G / N, also \varphi(a) = a'n \in A,
und damit \varphi(A) \le A.

Question on Proof that Op(C/(C∩F(G))=1Op(C/(C∩F(G))=1 for C=CG(F(G))C=CG(F(G)).
Question about characteristic subgroups
Example such that HN/N char G/NHN/N char G/N and N char GN char G, but HH not characteristic in G

Noch eine kurze Notiz. Ist N \unlhd G so folgt AN/N \cap BN/N = (AN \cap BN)/N, oder mit der Projektionsabbildung \pi : G \to G/N dass \pi(A) \cap \pi(B) = \pi(AN) \cap \pi(BN) = \pi(AN \cap BN) mit N = \mbox{ker}(\pi)., d.h. für Untergruppen welche N enthalten ist die Projektionsabbildung unter Schnitt abgeschlossen, siehe auch hier die Isomorphiesätze. Dies finde ich bemerkenswert da für allgemeine Abbildungen kein Abschluss unter Schnitt gilt, dies ist sogar für allgemeine Abbildungen eine charakterisierende Eigenschaft für Injektivität, siehe hier für einen Sammelthread. Aber im Allgemeinen ist \pi(A\cap B) \ne \pi(AN) \cap \pi(BN), siehe zum Beispiel hier. Insbesondere müssen Komplemente in der Faktorgruppe keine Komplemente mehr sein.

Für einen Beweis, sei N \le A,B. Die Inklusion \pi(A\cap B) \le \pi(A) \cap \pi(B) gilt immer. Für die andere sei \pi(a) = x = \pi(b). Dann ist \pi(ab^{-1}) = 1, also ab^{-1} \in N und damit folgt, da N in beiden Untergruppen enthalten, a \in B, b \in A, d.h. x ist Bild mindestens eines Elementes aus A \cap B.

On Permutation Groups in Which Non-Trivial Elements have p Fixed Points or None

If GG acts such that fix(g)∈{0,p}fix(g)∈{0,p} for g≠1g≠1 and N⊴GN⊴G. Then every element outside of NN fixes at most pp NN-orbits.

Properties of point stabilizers of PSL(2,q)

If GG acts so that fix(g)∈{0,p}fix(g)∈{0,p} for g≠1g≠1. Conditions such S∈Sylp(G)S∈Sylp(G) has maximal class.

If GG acts such that fix(g)∈{0,p}fix(g)∈{0,p} for g≠1g≠1, MM maximal with |G:M|=p|G:M|=p, then |M/L|=p|M/L|=p for semiregular L⊴GL⊴G.

If GG is solvable and acts such that fix(g)∈{0,p}fix(g)∈{0,p} for g≠1g≠1 and MM maximal, why is NM(Mα)∈Sylp(M)NM(Mα)∈Sylp(M)?

The uniqueness of the Frobenius representation as handled in textbooks, for example Kurzweil/Stellmacher

The kernel of an action on the orbits of normal subgroup if group acts such that fix(g)∈{0,p}fix(g)∈{0,p} for g≠1

The kernel of an action on blocks, specifically the action on the orbits of normal subgroup

If GG acts such that fix(g)∈{0,p}fix(g)∈{0,p} for g≠1g≠1 and N⊴GN⊴G. Then GαNGαN is normal if we have pp orbits of NN.

If GG is solvable and acts such that fix(g)∈{0,p}fix(g)∈{0,p} for g≠1g≠1 and MM is maximal normal. Then |G/M|=p|G/M|=p.

What does it mean that the Frobenius representation of a group is unique, and what are its consequences

If GG is solvable and acts such that fix(g)∈{0,p}fix(g)∈{0,p} for g≠1g≠1, then maximal normal subgroups are Frobenius groups

What does it mean to say a single element acts semi-regularly

If GG acts such that fix(g)∈{0,p}fix(g)∈{0,p} for g≠1g≠1 and N⊴GN⊴G. Then GG acts on the NN-orbits in the same way.

If GG acts such that each nontrivial element fixes exactly nn points or none, then |Ω|≡n(mod|Gα|)

Extension of A6A6 by outer automorphism of S6

Action of normal subgroup and relation of point stabilizers to normal subgroup

Reasoning about subgroups H≤PSL(2,q)H≤PSL(2,q) based on knowledge about subgroups of normalizers in it

Proof that solvable permutation group whose fixed point set is restricted contains regular normal subgroup or Frobenius group on orbits

Properties of group acting such that each non-trivial element fixes no point or exactly pp points

The order of the normalizer of Sylow subgroup in PSL(2,q)

If GG acts such that each non-trivial element either has no fixed point or exactly two, then there exists fixed-point free involutory map on Ω

Theorem about non-regular group action, where an element fixes no points or exactly pp points

Constructing a group which has fixed-point free element and element with exactly nn fixed points

Funktionen beschränkter Variation als Differenz monotoner Funktionen

Zu einem Intervall {[a,b]} heisst eine Menge {P} von Punkten {P = \{ x_0, x_1, \ldots, x_n \}} mit

\displaystyle  a = x_0 < x_1 < \ldots < x_n = b

eine Partition von {[a,b]}. Die Menge aller Partition von {[a,b]} bezeichnen wir mit {\mathcal P[a,b]}. Es sei eine Funktion {f : \mathbb R\rightarrow \mathbb R} gegeben. Zu {a < b} ist

\displaystyle  V(f; a,b) := \sup_{P = \mathcal P[a,b]} \left\{ \sum_{i=1}^{n} |f(x_{i}) - f(x_{i-1})| \right\}

die Variation auf dem kompakten Intervall {[a,b]}. Ist {V(f; a,b) < \infty} so sagen wir {f} ist von beschränkter Variation auf {[a,b]}, oder die Einschränkung {f_{|[a,b]} : [a,b] \rightarrow \mathbb R} ist eine Funktion von beschränkter Variation. Es sei bemerkt dass wir die genannten Begriffe nur auf kompakten Intervallen betrachten.

Ist {f : \mathbb R \rightarrow \mathbb R} auf {[a,b]} von beschränkter Variation, so auch auf jedem Teilintervall {[c,d] \subseteq [a,b]}. Weiter ist jede Funktion von beschränkter Variation auf {[a,b]} auf diesem Intervall beschränkt, denn wähle zu {a < x < b} die Partition {P = \{ a, x, b \}} dann ist { | f(x) - f(a) | < V(f, [a,b]) < \infty. } Ist {f : [a,b] \rightarrow \mathbb R} monoton steigend, so gilt auf dem Definitionsbereich {V(f; a,b) = f(b) - f(a)} da für jede Partition {P = \{ a = x_0 < x_1 < \ldots < x_n = b \}} gilt

\displaystyle  \sum_{i=1}^n |f(x_i) - f(x_{i-1})| = \sum_{i=1}^n f(x_i) - f(x_{i-1}) = f(-f(x_0)

Ein analoges Resultat besteht für monoton fallende Funktionen.

Lemma: Es sei {f : [a,b] \rightarrow \mathbb R} von beschränkter Variation auf {[a,b]}, dann gilt

  1. {V(f; a, b) = V(f; a, c) + V(f; c, b)} für {c \in [a,b]}, und
  2. die Funktion {x \mapsto V(f; a, x)} ist monoton steigend, und
  3. die Summe zweier Funktionen von beschränkter Variation ist von beschränkter Variation, genauer

    \displaystyle  V(f + g; a,b) \le V(f; a,b) + V(g; a,b).

Beweis: i) Es sei {a \le c \le b}. Ist {P = \{ a = x_0 < x_1 < \ldots < x_n = b \}} eine Partition von {[a,b]}, so gibt es ein eindeutiges {k > 0} mit {x_{k-1} \le c < x_k} und es folgt

\begin{array}{ll}  \sum_{i=1}^n | f(x_i) - f(x_{i-1}) | & \le \sum_{i=1}^{k-1} | f(x_i) - f(x_{i-1}) | + | f(c) - f(x_{i-1}) | + | f(x_i) - f(c) | + \sum_{i=k+1}^n | f(x_i) - f(x_{i-1}) | \\   & \le V(f; a,c) + V(f; c,b) \end{array}

da {\{ x_0, \ldots, x_{k-1}, c \}, \{ c, x_k, \ldots, x_n \}} Partitionen von {[a,c]} und {[c, b]} bilden. Hieraus folgt {V(f; a,b) \le V(f; a,c) + V(f; c,b)}. Für beliebige Partitionen {P = \{ a = x_0 < x_1 < \ldots < x_n = c \}} und {P' = \{ c = x_0' < x_1' < \ldots < x_m' = b \}} von {[a,c]} bzw. {[c, b]} ist, da natürlich {P \cup P'} eine Partition von {[a,b]} ist,

\displaystyle  \sum_{i=1}^n | f(x_i) - f(x_{i-1}) | + \sum_{i=1}^m | f(x_i') - f(x_{i-1}') | \le V(f, a; b).

Dass heisst für jede Partition {P} von {[a,c]} ist bei beliebig, aber fest gewählter Partition {P'} von {[c,b]}

\displaystyle  \sum_{i=1}^n | f(x_i) - f(x_{i-1}) | \le V(f, a; b) - \sum_{i=1}^m | f(x_i') - f(x_{i-1}') |

und damit {V(f, a;c) \le V(f, a; b) - \sum_{i=1}^m | f(x_i') - f(x_{i-1}') |}. Da nun auch {P'} beliebig gewählt war gilt für jede solche Wahl

\displaystyle  \sum_{i=1}^m | f(x_i') - f(x_{i-1}') \le V(f; a,b) - V(f; a,c)

und damit {V(f; c,b) \le V(f, a;b) - V(f; a,c)} da das Supremum die kleinste obere Schranke darstellt.

ii) Sind {x < x'} aus {[a,b]} so folgt mit i) angewandt auf das Intervall {[a,x']} dass {V(f; a, x) + V(f; x, x') = V(f, a, x')}, und weil die Variation immer nichtnegativ folgt die Behauptung. {\square}

iii) Folgt mit {| f(x_i) + g(x_i) - ( f(x_{i-1}) + g(x_{i-1} ) | = | f(x_i) - f(x_{i-1}) + g(x_i) - g(x_{i-1}) | \le | f(x_i) - f(x_{i-1}) | + | g(x_i) - g(x_{i-1}) |}. {\square}

Satz (Jordan, 1881): Eine Funktion ist genau dann von beschränkter Variation, wenn sie sich als Differenz zweier monoton steigender Funktionen darstellen lässt. Anders gesagt, der Raum der Funktionen beschränkter Variation wird von den monotonen Funktionen aufgespannt.

Beweis: i) Es sei {f : [a,b] \rightarrow \mathbb R} von beschränkter Variation auf {[a,b]}. Definiere {u(x) := V(f; a, x)}. Mit obigen Lemma ist dies eine monoton steigende Funktion. Setze {v(x) := u(x) - f(x)}. Dann ist für {a \le x < x' \le b}

\displaystyle   v(x') - v(x) = ( V(f; a,x') - V(f; a,x) ) - ( f(x') - f(x) ) = V(f; x', x) - ( f(x') - f(x) )

und da {V(f; x', x) \ge |f(x') - f(x)|} folgt {v(x') - v(x) \ge 0}, also ist auch {v(x)} monoton steigend.

ii) Es sei {f = u - v}. Da monotone Funktionen von beschränkter Variation sind, ist es mit obigen Lemma auch ihre Differenz.

Mit i) und ii) folgt die Darstellung, da außerdem Summe und skalares Vielfaches von Funktionen beschränkter Variation wieder beschränkte Variation haben, ist die Menge der Funktionen beschränkter Variation ein Vektorraum, welcher von den monotonen Funktionen aufgespannt wird. {\square}

Korollar: Jede Funktion von beschränkter Variation auf {[a,b]} ist dort eine Regelfunktion.

Beweis: Es sei {f} von beschränkter Variation. Dann gibt es {u,v} monoton steigend mit {f = u - v}, und als monotone Funktionen sind diese Regelfunktionen. Es sei {a < x_0 < b}, dann ist {\lim_{x\rightarrow x_0-} f(x) = \lim_{x\rightarrow x_0-} u(x) - v(x) = \lim_{x\rightarrow x_0-} u(x) - \lim_{x\rightarrow x_0-} v(x)}, analog für den rechtseitigen Grenzwert und in den Randpunkten. {\square}

Allerdings ist nicht jede Regelfunktion von beschränkter Variation. Betrachte zum Beispiel {f : [0,1] \rightarrow \mathbb R} mit

\displaystyle  f(x) = \left\{ \begin{array}{ll} x\sin\left( \frac{1}{x} \right) & \textrm{falls } x \ne 0 \\ 0 & \textrm{falls } x = 0. \end{array} \right.

Dann ist {f} stetig auf {[0,1]}, denn für {x \ne 0} ist sie es als Verkettung und Produkt stetiger Funktionen, für {x = 0} folgt dies wegen {-x \le x \sin(1/x) \le x} für {x \in (0,1]} und damit {\lim_{x\rightarrow 0} f(x) = 0}. Weiter setze

\displaystyle  x_n := \frac{1}{n\pi + \frac{\pi}{2}}

dann ist

\displaystyle  \sin(x_n) = (-1)^n

und damit

\displaystyle  \sum_{n=1}^m | f(x_n) - f(x_{n-1}) | = \sum_{n=1}^m | (-1)^n ( x_n + x_{n-1} ) | = \sum_{n=1}^m (x_n + x_{n-1})

also

\displaystyle  \sum_{n=1}^m (x_n + x_{n-1}) \ge \sum_{n=1}^{m-1} x_n = \sum_{n=1}^{m-1} \frac{1}{n\pi + \pi/2} \ge \frac{1}{\pi} \sum_{n=1}^m \frac{1}{n+1}

und die letzte Summe divergiert für {m \rightarrow \infty}, d.h. für eine Verfeinerung der durch {x_0, x_1, \ldots, x_m} gegebenen Partition, da die harmonische Reihe divergiert.

Den Beitrag als PDF-Datei.

Zur Ermittlung des Riemann-Integrals

Es sei {P = \{ a = x_0 < x_1 < \ldots < x_n = b \}} eine Partition des Intervalls {[a,b]}, bezeichne mit {\Delta(P) := \max_{i=1,\ldots,n} (x_i - x_{i-1})} die Unterteilungsfeinheit. Eine beschränkte Funktion {f : [a,b] \rightarrow \mathbb R} heisst Riemann-integriebar mit Integral {\int_a^b f(x) dx}, falls für jedes {\varepsilon > 0} ein {\delta > 0} existiert so dass für jede Partition {P = \{ a = x_0 < x_1 < \ldots < x_n = b \}} mit {\Delta(P) < \delta} gilt

\displaystyle  \left| \int_a^b f(x) dx - \sum_{i=1}^n f(\xi_i) \cdot (x_i - x_{i-1}) \right| < \varepsilon

wobei {\xi_i \in [x_{i-1}, x_i]} für jedes {i = 1,\dots, n} und für eine Zahl {\int_a^b f(x) d x \in \mathbb R}, genannt das Integral von {f} über {[a,b]}. Die Menge der Riemann-integrierbaren Funktionen auf {[a,b]} bezeichnen wir mit {\mathcal R[a,b]}. Diese Definition ist aber recht schwerfällig. Zur Formulierung äquivalenter Bedingungen nennen wir eine Partition {P = \{ a = x_0 < x_1 < \ldots < x_n \}} zusammen mit Zwischenpunkten {\xi_i \in [x_i, x_{i-1}]} für jedes {i \in \{1,\ldots, n\}} eine markierte Partition (engl. tagged partition). Ist {P = \{ a = x_0 < x_1 < \ldots < x_n \}} irgendeine Partition, so heisst

\displaystyle  L(f, P) := \sum_{i=1}^n \inf_{s \in [x_i, x_{i-1})} f(s) \cdot (x_i - x_{i-1})

die Untersumme von {f} zu {P} (engl. upper sum), und

\displaystyle  U(f, P) := \sum_{i=1}^n \sup_{s \in [x_i, x_{i-1})} f(s) \cdot (x_i - x_{i-1})

die Obersumme (engl. upper sum). Eine Partition {P} verfeinert eine andere Partition {P'}, falls {P \supseteq P'} (entsprechend für markierte Partitionen dass nur neue Zwischenpunkte dazukommen, aber die alten erhalten bleiben), und in diesem Fall gilt

\displaystyle  L(f, P') \le L(f, P) \le U(f, P) \le U(f, P').

Darüberhinaus gilt für beliebige Partitionen {P, P'} von {[a,b]} stets {L(f, P) \le U(f, P')}. Eine Menge {A \subseteq \mathbb R} heisst Lebesgue-Nullmenge, falls es zu jedem {\varepsilon > 0} abzählbar viele offene Intervalle {(a_i, b_i)_{i\in \mathbb N}} gibt mit {A \subseteq \bigcup_{i=1}^{\infty} (a_i, b_i)} und {\sum_{i=1}^{\infty} (b_i - a_i) < \varepsilon} (ob man sich hier auf offene oder abgeschlossene Intervalle, oder beide beschränkt ist unwesentlich). Der folgende Satz sei hier ohne Beweis erwähnt.

Satz (Äquivalente Formulierungen für Riemann-integrierbar auf {[a,b]})

  1. (Darboux) Das Supremum der Untersummen über alle Partitionen und das Infimum der Obersummen über alle Partitionen stimmen überein, d.h. es ist

    \displaystyle  \sup_{P} L(f, P) = \inf U(f, P).

    In diesem Fall ist {\int_a^b f(x) dx} der gemeinsame Wert.

  2. Zu jedem {\varepsilon > 0} gibt es eine Partition {P} so dass

    \displaystyle  U(f, P) - L(f, P) < \varepsilon

  3. (“Cauchy-Kriterium für Riemann-Summen“) Zu jedem {\varepsilon > 0} gibt es eine Partition {P} so dass aus {P' \supseteq P} folgt

    \displaystyle  U(f, P') - L(f, P') < \varepsilon

    d.h. für jede Verfeinerung von {P}.

  4. Zu jedem {\varepsilon > 0} gibt es eine Partition {P} so dass für alle Partitionen {P'} mit {P' \supseteq P} und {P' = \{ a = x_0 < x_1 < \ldots < x_n = b \}} gilt

    \displaystyle  \left| s - \sum_{i=1}^n f(\xi_i) \cdot (x_i - x_{i-1}) \right| < \varepsilon

    für beliebige Zwischenpunkte {\xi_i, i = 1,\ldots, n} und eine eindeutig bestimmte Zahl {s}, und in diesem Fall gilt {s = \int_a^b f(x) d x}

  5. Zu jedem {\varepsilon > 0} gibt es eine markierte Partition {P = \{ a = x_0 < x_1 < \ldots < x_n = b \}} mit Zwischenpunkten {Z = \{ \xi_1, \ldots, \xi_n \}} so dass für jede markierte Partition {P' = \{ a = x_0' < x_1' < \ldots < x_m' = b \}} mit Zwischenpunkten {Z' = \{ \xi_i : i=1,\ldots,m \}} so dass {P' \supseteq P} und {Z' \supseteq Z} (d.h. die markierte Partition ist eine Verfeinerung) gilt

    \displaystyle  \left| s - \sum_{i=1}^m f(\xi_i') \cdot (x_i' - x_{i-1}') \right| < \varepsilon

    für eine eindeutig bestimmte Zahl {s}, und in diesem Fall gilt {s = \int_a^b f(x) d x}.

  6. (Lebesgue) Falls die Menge der Unstetigkeiten eine Lebesgue-Nullmenge ist. {\qquad \square}

Ist eine Funktion Riemann-integrierbar, so kann man für jede Folge {P_n = \{ a = x_0^{(n)} < x_1^{(n)} < \ldots < x_{m_n}^{(n)} = b \}} von Partitionen mit {\Delta(P_n) \rightarrow 0} und zugehörigen Zwischenpunkten {\xi_n^{(i)} \in [x_i^{(n)} x_{i-1}^{(n)})} das Integral als Grenzwert von sogenannten Riemann-Summen ausdrücken, d.h. es ist

\displaystyle  \lim_{n\rightarrow \infty} \sum_{i=1}^{m_n} f(\xi_i^{(n)}) \cdot (x_{i}^{(n)} - x_{i-1}^{(n)}) = \int_a^b f(x) dx

was mitunter einfacher auszurechnen ist, denn insbesondere kann man die Zwischenstellen und Intervallgrenzen der Annäherung beliebig wählen (die bekannten Formeln Trapezregel usw. aus der Numerik basieren zum Beispiel darauf). Aber es ist Vorsicht geboten, bevor man dies anwendet ist zu prüfen dass die Funktion auch tatsächlich Riemann-integrierbar ist, wie folgendes Beispiel zeigt.

Beispiel: Die Funktion (charakteristische Funktion der rationalen Zahlen in {[0,1]}) {1_{\mathbb Q} : [0,1] \rightarrow \{0,1\}} mit

\displaystyle  1_{\mathbb Q}(x) = \left\{ \begin{array}{ll} 1 & \textrm{ falls } x \in \mathbb Q \\ 0 & \textrm{ sonst. } \end{array} \right.

ist nicht Riemann-integrierbar. Die rationalen Zahlen liegen dicht in {[0,1]}, und ebenso die irrationalen (sonst hätte man ein Intervall bestehend nur aus rationalen Zahlen, und dies wäre mithin abzählbar), also folgt

\displaystyle  \inf_{s \in I} 1_{\mathbb Q}(s) = 0, \qquad \sup_{s \in I} 1_{\mathbb Q}(s) = 1.

für jedes nicht-entartete (d.h. von positiven Inhalt) Intervall {I}, und damit {L(1_{\mathbb Q}, P) = 0} und {U(1_{\mathbb Q}, P) = b - a = 1} für jede Partition {P}, also ist mit obigen Kriterien die Funktion nicht Riemann-integrierbar. Allerdings ist für jedes {i = 1,\ldots, n}

\displaystyle  1_{\mathbb Q}\left( \frac{1}{2} \frac{(i-1) + i}{n} \right) = 1

und damit

\displaystyle  \lim_{n\rightarrow \infty} \sum_{i=1}^n 1_{\mathbb Q}\left( \frac{1}{2} \frac{(i-1) + i}{n} \right) \cdot \frac{1}{n} = \lim_{n\rightarrow \infty} 1 = 1.

Wählt man dagegegn irrationale Zwischenpunkte {\xi_i} in den Intervallen {[(i-1)/n, i/n]} für {i = 1,\ldots, n}, z.B.

\displaystyle  \xi_n = \frac{i-1}{n} + \frac{\sqrt 2}{2} \cdot \frac{1}{n} < \frac{i}{n}

so hat man

\displaystyle  \lim_{n\rightarrow \infty} \sum_{i=1}^n 1_{\mathbb Q}\left( \xi_i \right) \cdot \frac{1}{n} = \lim_{n\rightarrow \infty} 0 = 0.

d.h. man erhält hier unterschiedliche Werte, je nach Folge von Partitionen und Zwischenpunkten die man wählt. {\square}

Nun zum Beweis der obigen Aussage. Es ist zu zeigen, dass sofern {f : [a,b] \rightarrow \mathbb R} Riemann-integrierbar auf {[a,b]} ist, dass der Grenzwert existiert und dem Riemann-Integral gleicht. Es sei also {f : [a,b] \rightarrow \mathbb R} auf {[a,b]} eine Riemann-integrierbare Funktion. \medskip Ist {P_n} und {\xi_i^{n}} eine Folge von markierten Partitionen wie oben angegeben. Es sei {\varepsilon > 0}, sei {\delta > 0} aus der Defininition der Riemann-Integrierbarkeit. Wegen {\Delta(P_n) \rightarrow 0} gibt es ein {N} so dass für alle {n > N} gilt {\Delta(P_n) < \delta}, d.h. insbesondere

\displaystyle  \left| \sum_{i=1}^{m_n} f(\xi_i^{(n)}) \cdot (x_{i}^{(n)} - x_{i-1}^{(n)}) - \int_a^b f(x) d x \right| < \varepsilon

und damit folgt {\lim_{n\rightarrow \infty} \sum_{i=1}^{m_n} f(\xi_i^{(n)}) \cdot (x_{i}^{(n)} - x_{i-1}^{(n)}) = \int_a^b f(x) dx}.

Beispiel: Wir wollen die Funktion {f(x) = x} auf {[0,1]} integrieren. Da sie stetig ist, ist mit dem Lebesgue-Kriterium {f \in \mathcal R[0,1]}. Damit folgt

\begin{array}{ll}  \int_0^1 x d x & = \lim_{n\rightarrow \infty} \sum_{i=1}^{n} f\left( \frac{i-1}{n} \right) \cdot \frac{1}{n} \\   & = \lim_{n \rightarrow \infty} \frac{1}{n^2} \sum_{i=0}^{n-1} i \\   & = \lim_{n \rightarrow \infty} \frac{1}{n^2} \cdot \frac{(n-1)n}{2} \\   & = \frac{1}{2} \lim_{n\rightarrow \infty} \left( 1 - \frac{1}{n} \right) \\   & = \frac{1}{2}.   \end{array}

Bezeihungsweise für {t \in [0,1]} ist die Funktion {1_{[0,t]} \cdot x} nur an der Stelle {t} unstetig, d.h. ebenso Riemann-integrierbar. Bezeichne mit {\lfloor x \rfloor := \sup\{ k \in \mathbb : k \le x \}} die kleinste ganze Zahl kleinergleich {x}. Dann gilt

\displaystyle  \lim_{n\rightarrow \infty} \frac{\lfloor t n \rfloor}{n} = t

denn {\frac{tn - 1}{n} \le \frac{\lfloor t n \rfloor}{n} \le \frac{tn}{n} = t} und die beiden Schranken gehen beide gegen {t}. Damit

\begin{array}{ll}   \int_0^1 1_{[0,t]} x d x & = \lim_{n\rightarrow \infty} \sum_{i/n \in [0,t]} \frac{i}{n} \cdot \frac{1}{n} \\   & = \lim_{n\rightarrow \infty} \frac{1}{n^2} \sum_{i=0}^{\lfloor tn \rfloor} i \\   & = \lim_{n\rightarrow \infty} \frac{1}{n^2} \frac{\lfloor tn \rfloor (\lfloor tn \rfloor + 1)}{2} \\   & = \frac{1}{2} \lim_{n\rightarrow \infty} \frac{\lfloor t n \rfloor}{n} \cdot \frac{\lfloor t n \rfloor + 1}{n} \\   & = \frac{t^2}{2}   \end{array}

mit den Grenzwertsätzen. {\square}

Bemerkung: Hat man also gezeigt dass eine Funktion Riemann-integrierbar ist, so kann man irgendeine günstige approxmierende Folge wählen und den Grenzwert bestimmen. Tatsächlich liefert die Approximierbarkeit durch Folgen eine weitere Charakterisierung der Riemann-integrierbarkeit. Eine Funktion ist genau dann integrierbar, wenn für jede Folge von markierten Partitionen {P_n} und {\xi_i^{(n)}} mit {\Delta(P_n) \rightarrow 0} gilt dass die Folge der Riemann-Summen gegen einen gemeinsamen Grenzwert konvergiert, und dieser Grenzwert ist dann das Integral. Den Beweis dieser Tatsache überlasse ich als Übung.

Den Beitrag als PDF-Datei.

Regelfunktionen und gleichmäßige Approximation durch Treppenfunktionen

Ist {f_n \rightarrow f} gleichmäßig für stetige {f_n}, so ist {f} ebenso stetig. Für das erste Lemma sei noch einmal kurz ein an einen klassischen Beweis dieser Tatsache erinnert. Sei also {f_n \rightarrow f} gleichmäßig und die {f_n} alle stetig. Es sei {x_0 \in [a,b]}. Wähle ein {n} so dass

\displaystyle | f(x) - f_n(x) | < \varepsilon

für alle {x \in [a,b]} und ein {\delta > 0} so dass für alle {x_0 - \delta < x < x_0 + \delta} gilt {| f_n(x_0) - f_n(x) | < \varepsilon}, dann folgt für eben jene {x \in (x_0 - \delta, x_0 + \delta)}

\displaystyle |f(x) - f(x_0)| \le |f(x) - f_n(x)| + |f_n(x) - f_n(x_0)| + |f_n(x_0) - f(x_0)| \le \varepsilon + \varepsilon + \varepsilon.

Der folgende Beweis funktioniert ähnlich. Wir schreiben {f(x_0+) = \lim_{x \uparrow x_0} f(x) = \lim_{x\rightarrow x_0+} f(x)} für den rechsseitigen und {f(x_0-) = \lim_{x\downarrow x_0} f(x) = \lim_{x\rightarrow x_0-} f(x)} für den linksseitigen Grenzwert von {f} im Punkt {x_0}, sofern dieser existiert. Zur Definition von Regelfunktionen siehe diesen Beitrag.

Lemma: Ist {f_n \rightarrow f} gleichmäßig, und sind die {f_n} Regelfunktionen, dann ist auch {f} eine Regelfunktion und es gilt

\displaystyle f(x_0+) = \lim_{n\rightarrow \infty} f_n(x_0+) \quad\mbox{und}\quad f(x_0-) = \lim_{n\rightarrow \infty} f_n(x_0-).

für {x_0 \in [a,b]}.

Beweis: Zu {a \le x_0 < b} betrachte den rechtsseitigen Grenzwert, der linksseitige wird analog behandelt. Zunächst ist zu zeigen dass die Folge {f_n(x_0+)} tatsächlich konvergiert. Ist {\varepsilon > 0} vorgegeben, so wähle {N} so dass für {n,m \ge N}

\displaystyle | f_n(x) - f_m(x) | < \varepsilon

für jedes {x \in [a,b]}. Wähle nun zu festen {n, m \ge N} ein {\delta > 0} so dass aus {x_0 < x < x_0 + \delta} folgt

\displaystyle | f_n(x_0+) - f_n(x) | < \varepsilon, \qquad | f_m(x_0+) - f_m(x) | < \varepsilon.

Dann ist für {x_0 < x < x_0 + \delta}

\begin{array}{ll}  | f_n(x_0+) - f_m(x_0+) | & \le | f_n(x_0+) - f_n(x) | + | f_n(x) - f_m(x) | + | f_m(x) - f_m(x_0+) | \\  & \le 3\cdot \varepsilon.  \end{array}

und damit ist {\{ f_n(x_0+) \}} eine Cauchyfolge in {\mathbb R}, mithin konvergent, setze {L := \lim_{n\rightarrow\infty} f_n(x_0+)}.

Es sei {\varepsilon > 0} gegeben. Wähle {N'} so dass

\displaystyle | f(x) - f_n(x) | < \varepsilon

für {n \ge N'} und alle {x \in [a,b]}, und {N''} so dass

\displaystyle | f_n(x_0+) - L | < \varepsilon

für {n \ge N''}. Setze {N := \max\{ N', N'' \}}. Weiterhin wähle {\delta > 0} so dass mit {x_0 < x < x_0 + \delta} folgt {| f_N(x_0+) - f_N(x) | < \varepsilon}. Insgesamt hat man also für {x_0 < x < x_0 + \delta}

\displaystyle | f(x) - L | \le | f(x) - f_N(x) | + | f_N(x) - f_N(x_0+) | + | f_N(x_0+) - L | \le 3\varepsilon.

Dass heisst zu jedem {\varepsilon > 0} gibt es ein {\delta} so dass aus {x_0 < x < x_0 + \delta} folgt {| f(x) - L | < \varepsilon}, dies ist aber genau die Definition des rechtsseitigen Grenzwertes {f(x_0+)}, und da dieser eindeutig ist folgt

\displaystyle f(x_0+) = L = \lim_{n\rightarrow\infty} f_n(x_0+). \qquad \square

Dass eingangs erwähnte Resultat, dass sich bei gleichmäßiger Konvergenz die Stetigkeit übertragt, folgt aus obigen.

Korollar: Ist {f_n \rightarrow f} gleichmäßig und sind alle {f_n} stetig, so ist auch die Grenzfunktion {f} stetig.

Beweis: Da die {f_n} stetig ist für alle {x_0 \in (a,b)} {f_n(x_0+) = f_n(x_0-) = f_n(x_0)}, und damit

\displaystyle f(x_0+) = \lim_{n\rightarrow \infty} f_n(x_0+) = \lim_{n\rightarrow \infty} f_n(x_0-) = f(x_0-)

und wegen {f(x_0) = \lim_n f_n(x_0) = \lim_n f_n(x_0-) = f(x_0-)} folgt weiter {f(x_0) = f(x_0-) = f(x_0+)}. {\square}

Noch einmal zum Vergleich mit dem eingangs gebrachten Beweis. In diesem war der Existenzteil für {\lim_{n\rightarrow \infty} \lim_{x\rightarrow x_0} f_n(x)} überflüssig, da hier {\lim_{x\rightarrow x_0} f_n(x) = f_n(x_0)} und {\lim_{n\rightarrow \infty} f_n(x_0) = f(x_0)} nach Voraussetzung, aber wenn die {f_n} nur Regelfunktionen sind müssen die Grenzwerte eben nicht gleich dem Funktionswert sein, und ihre Konvergenz muss separat gezeigt werden, da wir ja nur von den Funktionswerten wissen dass sie konvergieren.

In einenm vorherigen Beitrag haben wir gezeigt dass es zu jedem Punkt und {\varepsilon > 0} eine punktierte Umgebung gibt in der {f} keine Sprünge größer als {\varepsilon} hat, mit einem im Prinzip gleichen Schluss verschärfen wir die Formulierung in folgendem Lemma. Setze hierzu

\displaystyle o(f, (a,b)) := \sup_{s\in (a,b)} f(s) - \inf_{s\in (a,b)} f(s)

die Oszillation der Funktion auf dem Intervall {(a,b)}.

Lemma: Es sei {x_0 \in [a,b]} und {f : [a,b]\rightarrow \mathbb R} eine Regelfunktion. Zu jedem {\varepsilon > 0} gibt es ein {\delta > 0} so dass

\displaystyle o(f, (x_0 - \delta, x_0)) < \varepsilon, \qquad o(f, (x_0, x_0 + \delta)) < \varepsilon.

(Bemerkung, wenn bei {x_0} ein Sprung vorliegt so ist natürlich {o(f, (x_0-\delta, x_0 + \delta) \ge} Sprunghöhe).

Beweis: Es sei {a < x_0 < b} (Randpunkte analog) und {\varepsilon > 0}. Wähle ein {\delta} so dass aus {x_0 - \delta < x < x_0} folgt {| f(x_0-) - f(x) | < \varepsilon/2} und aus {x_0 < x < x_0 + \delta} folgt {| f(x_0+) - f(x) | < \varepsilon/2}, dann ist für {x, x' \in (x_0 - \delta, x_0)}

\displaystyle | f(x) - f(x') | \le |f(x) - A| + |A - f(x')| < \varepsilon

und analog für {x, x' \in (x_0, x_0 + \delta)}. {\square}

Damit haben wir alles zusammen um Regelfunktionen genau als jene Funktionen, welche gleichmäßig durch Treppenfunktionen angenähert werden können, zu charakterisieren.

Satz: Eine Funktion {f : [a,b] \rightarrow \mathbb R} ist genau dann eine Regelfunktion, wenn es zu jedem {\varepsilon > 0} eine Treppenfunktion {\varphi : [a,b] \rightarrow \mathbb R} gibt mit

\displaystyle | f(x) - \varphi(x) | < \varepsilon

für alle {x \in [a,b]}. Dies ist gleichwertig damit dass {\varphi_n \rightarrow f} gleichmäßig für eine Folge von Treppenfunktionen {\varphi_n}.

Beweis: i) Treppenfunktionen sind Regelfunktionen. Mit obigen Lemma ist also auch {f} eine Regelfunktion wenn {\varphi_n \rightarrow f} gleichmäßig für eine Folge von Treppenfunktionen.

ii) Es sei {f : [a,b] \rightarrow \mathbb R} eine Regelfunktion. Setze {\varepsilon_n : = 1/n} und bezeichne zu jedem {x \in [a,b]} mit {\delta_x^n > 0} den Wert aus obigen Lemma so dass

\displaystyle o(f, (x - \delta_x^n, x)) < \varepsilon_n, \qquad o(f, (x, x + \delta_x^n)) < \varepsilon_n.

Dann ist die Familie der Mengen

\displaystyle (x - \delta_x^n, x + \delta_x^n), \quad x \in [a,b]

eine offene Überdeckung von {[a,b]} zu jedem {\varepsilon_n}. Aufgrund der Kompaktheit kann man zu jedem {\varepsilon_n} endlich viele auswählen. Von diesem endlich vielen ausgewählten Intervallen, beachte dass an den Mittelpunkten die Sprünge beliebig groß werden können, und dass diese nicht disjunkt sein müssen. Bezeichne also mit {X^{(n)} := \{ x_1^{(n)}, \ldots, x_{m_n}^{(n)} \}} die Menge der Mittelpunkte der Ausgangsintervalle. Weiter zerlege die Intervalle in disjunkte offene Intervalle, dies geht da der Schnitt zweier offene Intervalle stets ein offene Intervall ist. So erhält man eine endliche Folge disjunkter Intervalle, bezeichne ihre Endpunkte mit {a_{i}, i = 1,\ldots, k}, und nimm an

\displaystyle a_1 < a_2 < \ldots < a_k.

Einige der Endpunkte können aus {X^{(n)}} sein. Betrachte nun die Menge {\{ a_i : i = 1,\ldots, k \} \cup X^{(n)}} und bezeichne ihre Elemente mit {b_i, i=1,\ldots, l} und ordne diese an

\displaystyle b_1 < b_2 < \ldots < b_l.

Dann wissen wir dass {o(f, (b_i, b_{i+1})) < \varepsilon_n}, und nur diese Endpunkte aus der Reihe tanzen. Definiere die Treppenfunktion

\displaystyle \varphi_n(x) = \left\{ \begin{array}{ll} f\left( \frac{b_{i+1} + b_i}{2} \right) & \textrm{falls } x \in (b_i, b_{i+1}) \\ f(b_i) & \textrm{falls } x = b_i \textrm{ fuer ein }i.\end{array}\right.

Sei jetzt {x \in [a,b]} und {b_i < x < b_{i+1}}. Dann ist {\inf_{s \in (b_i, b_{i+1})} f(s) \le \varphi_n(x) \le \sup_{s\in (b_i, b_{i+1})} f(s)} und wegen {\sup_{s\in (b_i, b_{i+1})} - \inf_{s\in (b_i, b_{i+1})} f(s) = o(f, (b_i, b_{i+1}) < \varepsilon_n}

\displaystyle | \varphi_n(x) - f(x) | < \varepsilon_n

und für {x = b_i} ist {\varphi_n(x) = f(x)}. Also ist {\varphi_n \rightarrow f} gleichmäßig. {\square}

Damit ergeben sich direkt ein paar Folgerungen.

Korollar: Jede Regelfunktion ist beschränkt.

Beweis: Wähle eine Treppenfunktion {\varphi} mit {|\varphi(x) - f(x)| < 1}. Da eine Treppenfunktion nur endlich viele Werte annimmt, ist sie beschränkt und zu {x \in [a,b]} folgt

\displaystyle | |\varphi(x)| - |f(x)| | \le |\varphi(x) - f(x)|

was {|f(x)| - |\varphi(x)| \le |\varphi(x) - f(x)|} bzw. {f(x) \le |\varphi(x)| + |\varphi(x) - f(x)}. {\square}

Die Umkehrung gilt natürlich nicht, denn beispielsweise ist die Indikatorfunktion der rationalen Zahlen auf {[0,1]} keine Regelfunktion, wohl aber beschränkt.

Auch eine bereits in gezeigte Behauptung ergibt sich damit recht einfach.

Korollar: Die Anzahl der Unstetigkeitsstellen ist höchstens abzählbar.

Beweis: Es sei {\varphi} eine Treppenfunktion mit

\displaystyle | \varphi(x) - f(x) | < \frac{1}{2n}

für alle {x \in [a,b]}. Es seien {x_1, \ldots, x_k} die Punkte, so dass {\varphi} auf {(x_i, x_{i+1})} für {i=1,\ldots,k-1} jeweils konstant ist, und damit insbesondere stetig. Damit folgt für {x_i < x_0 < x_{i+1}}

\displaystyle \lim_{x \uparrow x_0} | \varphi(x) - f(x) | = \left| \lim_{x\uparrow x_0} \varphi(x) - \lim_{x\uparrow x_0} f(x) \right| = | \varphi(x_0) - f(x_0-) |

und analog für die Annäherung von rechts {| \varphi(x_0) - f(x_0+) |}. Damit {|f(x_0+) - f(x_0-)| \le |f(x_0+) - \varphi(x_0)| + |\varphi(x_0) - f(x_0-)| < 1/n}. Dass heisst nur an den endlich vielen Punkten {x_1,\ldots, x_k} kann {|f(x_0+) - f(x_0-)| \ge 1/n} gelten. Weiter gilt

\begin{array}{ll}  x_0 \textrm{ ist Unstetigkeitsstelle }& ~ \Leftrightarrow | f(x_0+) - f(x_0-) | > 0 \\  & ~ \Leftrightarrow | f(x_0+) - f(x_0-) | > 1/n \textrm{ fuer ein }n \end{array}

d.h. wir haben

\displaystyle \{ x_0 \in [a,b] : x_0 \textrm{ ist Unstetigkeitsstelle } \} = \bigcup_{n=1}^{\infty} \{ x_0 \in [a,b] : |f(x_0+) - f(x_0-)| > 1/n \}

womit die Menge der Unstetigkeitstellen eine abzählbare Vereinigung endlicher Mengen ist, mithin abzählbar. {\square}

Literatur

Blogbeitrag, Über die Unstetigkeitsstellen von Regelfunktionen,
Link

Den Beitrag als PDF-Datei.

Über die Unstetigkeiten sprungstetiger bzw. von Regelfunktionen

Eine Funktion {f : [a,b] \rightarrow \mathbb R} heisst Regelfunktion (oder sprungstetige Funktion) falls

  1. Zu jedem {a < x_0 < b} existiert der links- sowie der rechtsseitige Grenzwert, d.h. es ist {\lim_{x\rightarrow x_0-} f(x) < \infty} und {\lim_{x\rightarrow x_0+} f(x) < \infty}, beide können aber verschieden sein,
  2. Die Grenzwerte in den Randpunkten {\lim_{x \rightarrow a+} f(x)} und {\lim_{x\rightarrow b-} f(x)} existieren.

Eine Funktion {f : [a,b] \rightarrow \mathbb R} heisst stetig bei {x_0 \in [a,b]} falls der Grenzwert {\lim_{x \rightarrow x_0} f(x)} existiert und gleich {f(x)} ist, im Fall {a < x_0 < b} heisst heisst dies dass die beiden einseitigen Grenzwerte {\lim_{x\rightarrow x_0-} f(x), \lim_{x\rightarrow x_0+} f(x)} existieren, und beide gleich {f(x)} sind. Damit ist eine Funktion unstetig bei {a < x_0 < b} falls

  1. beide Grenzwerte existieren, gleich sind, aber ungleich dem Funktionswert,
  2. beide Grenzwerte existieren, aber ungleich sind, in diesem Fall nennt man die Unstetigkeitsstelle eine Sprungstelle (der Funktionswert {f(x)} ist dafür irrelevant),
  3. einer der beiden Grenzwerte nicht existiert (man kann diese Fälle noch weiter ausdifferenzieren, jenachdem ob der Grenzwert uneigentlich existiert oder nicht, siehe Wikipedia:Unstetigkeitsstellen.

Die Fälle {x_0 = a} oder {x_0 = b} werden ähnlich nur unter Betrachtung eines einseitigen Grenzwertes gehandhabt. Für eine Regelfunktion können nur die ersten beiden Fälle auftreten, und umgekehrt treten nur die ersten beiden Fälle auf, d.h. existieren die Grenzwerte in jedem Fall, so liegt eine Regelfunktion vor. Daher auch der Name sprungstetige Funktion, die einzigen Unstetigkeitsstellen sind eben solche isolierten (oder hebbaren) und Sprünge.

Beispiel: Jede monotone Funktion {f : [a,b] \rightarrow \mathbb R} ist eine Regelfunktion. Sei {f} o.B.d.A. monoton steigend. Zum Beweis beachte dass für alle {x_0 \in [a,b]} gilt

\displaystyle \sup_{s \in [a,x_0)} f(s) \le f(x_0) \le \inf_{s \in (x_0,b]} f(s).

Sei nun {x_n \uparrow x} ({x_n \ne x_0} für alle {n}) eine Folge, es ist zu zeigen dass {\lim_{n\rightarrow \infty} f(x_n)} existiert und für jede solche Folge gleich ist. Wir zeigen {\lim_{n\rightarrow \infty} f(x_n) = \sup_{s \in [a,x_0)} f(s)}. Zunächst ist die Folge {(f(x_n))} monoton und durch {f(x_0)} beschränkt, demnach existiert der Grenzwert {A}. Da {x_n \in [a, x_0)} ist {A \le \sup_{s \in [a,x_0)} f(s)}, angenommen {A < \sup_{s \in [a,x_0)} f(s)}. Dann gibt es ein {u \in [a,x_0)} mit {A < f(u) \le \sup_{s \in [a,x_0]} f(s)}. Da aber {x_n \uparrow x_0, x_n < x_0} gibt es ein {N} so dass für alle {n > N} gilt {u < x_n < x_0}, mit der Monotonie ergibt dies

\displaystyle A < f(u) \le f(x_n)

für alle {n > N}, dies widerspricht aber {\lim_{n\rightarrow\infty} f(x_n) = A}, d.h. es muss {A = \sup_{s \in [a,x_0]} f(s)} sein, analog zeigt man dass jede Folge die sich von rechts annähert den Grenzwert {\inf_{s \in (x_0,b]} f(s)} hat. {\square}

Für eine monotone Funktion kann jeder Sprungstelle eine rationale Zahl zugeordnet werden indem man aus der Sprungdifferenz eine solche auswählt, und wegen der Monotonie sind diese alle verschieden. Man hat also eine surjektive Funktion von einer Teilmenge der rationalen Zahlen auf die Menge aller Sprungstellen (oder eine injektive Funktion von den Sprungstellen in die rationalen Zahlen), mithin ist die Menge der Sprungstellen höchstens abzählbar. Dieses Ergebnis wollen wir auf Regelfunktioen ausdehnen.

feststellungAbbildung: Jede Umgebung von {x_0} enthält unendlich viele Punkt, deren Differenz {\ge \varepsilon} zu jedem {\varepsilon < |\lim_{x\rightarrow x_0-} f(x) - \lim_{x\rightarrow x_0+} f(x)|} ist. Der Fall dass es keine Punte gibt deren Differenz {\ge |\lim_{x\rightarrow x_0-} f(x) - \lim_{x\rightarrow x_0+} f(x)|} ist denkbar, wenn die Funktion z.B. links der Stelle {x_0} monoton fallend, und rechts davon ebenso monton fallend verläuft, aus diesem Grund betrachten wir ein {\varepsilon < |\lim_{x\rightarrow x_0-} f(x) - \lim_{x\rightarrow x_0+} f(x)|}.

Feststellung: Es sei {\varepsilon > 0}. Liegt bei {a < x_0 < b} eine Sprungstelle einer Höhe {> \varepsilon} vor, d.h. ist {| \lim_{x \rightarrow x_0+} f(x) - \lim_{x \rightarrow x_0-} f(x)| > \varepsilon}, so gibt es in jeder punktierten Umgebung (d.h. Umgebungen aus denen {x_0} entfernt wird) unendlich viele Punkte deren Differenz {> \varepsilon} ist. Genauer zu jedem {\delta > 0} gibt es {x', x'' \in (x - \delta, x + \delta) \setminus\{x_0\}} mit {|f(x') - f(x'')| > \varepsilon} (und es ist {x' < x_0 < x''} oder {x' > x_0 > x''}).

Beweis: Es sei {\delta > 0} gegeben. Betrachte zwei Folgen {(x_n), (y_n)} mit {x_n \uparrow x_0} und {y_n \downarrow x_0} und {x_n < x_0 < y_n}. Setze {A := \lim_{x\rightarrow x_0+} f(x), B := \lim_{x \rightarrow x_0-} f(x)}. Dann ist {f(x_n) \rightarrow A, f(y_n) \rightarrow B}, sei o.B.d.A. {A < B}. Nach Voraussetzung ist {B - A > \varepsilon}, wähle nun zwei konkrete {x_n, y_n} mit

\displaystyle | f(x_n) - A | < \frac{(B-A) - \varepsilon}{2}, \quad | f(y_n) - B | < \frac{(B-A) - \varepsilon}{2}

welche nach der Definition des Grenzwertes existieren (denn die Punkte {A,B} sind nicht isoliert, also enthält jede Umgebung Punkte der Folge). Dann ist

\begin{array}{ll} | f(x_n) - f(y_n) | & = | f(x_n) - A - (B - A) + B - f(y_n) | \\  & \ge | f(x_n) - A | - | B - A | - | f(y_n) - B | \\  & = (B - A) - ( | f(x_n) - A | + | f(y_n) - B | ) \end{array}

und wegen {| f(x_n) - A | + | f(y_n) - B | < (B-A) - \varepsilon} erhalten wir

\displaystyle | f(x_n) - f(y_n) | > (B-A) - ( (B-A) - \varepsilon ) = \varepsilon. \qquad \square

Diese Feststellung diente nur der Illustration und wird für die folgenden Ausführungen nicht weiter benötigt. Das nächste Lemma geht in den Satz zur Bestimmung der Menge der Unstetigkeiten ein, anschaulich besagt es, gibt es in der Nähe eines Punktes unendlich viele Sprünge größer einer gegebenen Schranke z.B. links eines Punktes, so kann der linksseitige Grenzwert nicht existieren.

Lemma: Ist {\varepsilon > 0} und {x_0 \in [a,b]}. Dann gibt es eine Umgebung von {x}, so dass in dieser, außer möglicherweise bei {x_0} selbst, keine Sprungstellen einer Höhe {\ge \varepsilon} existieren, d.h. es gibt ein {\delta > 0} so dass alle Sprünge in {(x - \delta, x + \delta) \cap [a,b] \setminus \{ x_0 \}} eine Höhe {< \varepsilon} haben.

Beweis: Es sei {\varepsilon > } und {a < x < b} (die Randpunkte analog). Setze {A := \lim_{x\rightarrow x_0-} f(x), B := \lim_{x\rightarrow x_0+} f(x)}, dann gibt es {\delta > 0} so dass für alle {x \in (x_0 - \delta, x_0)} gilt {|f(x) - A| < \varepsilon/2} und {x \in (x_0, x_0 + \delta)} analog {|f(x) - B| < \varepsilon/2}, d.h. ist z.B. {x', x'' \in (x_0 - \delta, x_0)} so folgt

\displaystyle |f(x') - f(x'')| \le |f(x') - A| + |f(x'') - A| < \varepsilon

d.h. in {(x_0 - \delta, x_0)} kann keine weitere Sprungstelle einer Höhe {> \varepsilon} existieren (denn sonst gäbe es in einer Umgebung dieser zwei Punkte mit einem Abstand {> \varepsilon}. Analog gibt es keine in {(x_0, x_0 + \delta)} {\square}

Satz: Jede Regelfunktion {f : [a,b] \rightarrow \mathbb R} auf einem kompakten Intervall besitzt höchstens abzählbar viele Sprungstellen, d.h. sie ist fast überall hebbar stetig (d.h. alle weiteren Unstetigkeitsstellen sind hebbare Unstetigkeiten).

Beweis: Angenommen zu einem {\varepsilon > 0} gibt es unendlich viele Sprungstellen {\{ x_n \}} einer Höhe {\ge \varepsilon}. Dann hat die Menge {\{ x_n \}} wegen der Kompaktheit des Intervalls einen Häufungspunkt {x^*} in {[a,b]}. Nach obigen Lemma gibt es eine Umgebung von {x^*}, so dass in dieser keine Sprungstellen einer Höhe {\ge \varepsilon} existieren, andererseits gibt es aber in jeder Umgebung von {x^*} eine Sprungstelle {x_n} einer Höhe {\ge \varepsilon} da {x^*} Häufungspunkt dieser Sprungstellen ist. Dieser Widerspruch zeigt dass es keinen solchen Punkt geben kann, mithin dass es nicht unendlich viele Sprungstellen einer Höhe {\ge \varepsilon} geben kann. Da es zu jeder Sprungstelle ein {k} gibt so dass dessen Höhe {\ge 1/k} ist folgt dass die Menge

\displaystyle \bigcup_{k=1}^{\infty} \{ x_0 \in [a,b] : | \lim_{x\rightarrow x_0-} f(x) - \lim_{x \rightarrow x_0+} f(x) | \ge 1/k \}

sämtliche Sprungstellen enthält, und wegen obigen Bemerkungen sind die einzelnen Mengen über die vereinigt wird endlich. Also liegt eine abzählbare Vereinigung endlichher Mengen vor, und eine solche Menge ist selbst abzählbar. {\square}

Satz: Jede Regelfunktion {f : [a,b] \rightarrow \mathbb R} auf einem kompakten Intervall besitzt höchstens abzählbar viele Unstetigkeitstellen, inklusive der hebbaren Unstetigkeiten.

Beweis: Analog zu Sprungstellen kann man zeigen, dass es zu einer gegebenen Schranke nur endlich viele hebbare Unstetigkeitspunkte gibt, so dass der Funktionswert größer als der Grenzwert (links und rechtsseitig gleich) ist, gibt. Das Lemma gilt auch weitesgehend analog, die Beweis übertragen sich. Insgesamt ist also die Menge der Sprungstellen und der hebbaren Unstetigkeiten höchstens abzählbar. {\square}

Bemerkung: Wir haben Regelfunkionen nur auf kompakten Intervallen definiert, man kann sich aber leicht vorstellen wie man diese Definition auf ganz {\mathbb R} ausdehnen kann, allerdings ist in obigen Satz die Eigenschaft eines kompakten Intervalls wesentlich eingegangen, betrachte zum Beispiel (positive Rechteckschwingung)

\displaystyle f = \sum_{i=1}^{\infty} 1_{[2n, 2n+1]}

oder {g = \sum_{i=1}^{\infty} n\cdot 1_{[2n, 2n+1]}} als ein unbeschränktes Beispiel.

Den Beitrag als PDF-Datei.

Korrektur, Beweis der Adhärenz-Formel

In dem Beweis der Formel {\mbox{Adh}(L^*) = L^* \mbox{Adh}(L) \cup L^{\omega}} in meinem Beitrag Notiz zur Dyck- oder Klammersprache hatte ich einen Fehler, dank an Prof Dr. Ludwig Staiger dass er mich darauf hingewiesen hat. Ich zitiere den fehlerhaften Teil:

Nun verfahren wir induktiv, sei {{\xi = w_1\cdots w_i \eta}} mit {{w_i \in L}} konstruiert. Da {{\eta \notin \mbox{Adh}(L)}} gibt es ein Präfix {v} welches keine Vervollständigung in {L} besitzt, anderenfalls besitzt {w_1 \cdots w_i \eta} aber eine in {L^*}, analog wie oben muss in {v} ein Wort aus {w_{i+1} \in L} als Präfix auftauchen, ansonsten hätte man auch eine Vervollständigung in {L}, setze {\xi = w_1 \cdots w_i w_{i+1} \eta'} wobei {\eta'} den hinteren Teil von {\eta} bezeichnet.

Der Fehler liegt in dem Satz “muss in {v} ein Wort aus {w_{i+1} \in L} als Präfix auftauchen“, im Induktionsanfang klappt dieser Schluss noch, aber induktiv klappt er nichtmehr, da das Präfix aus {L^*} die Grenze zwischen {w_i} und {\eta} nicht erhalten braucht, sondern es kann eine ganz neue Zerlegung resultieren. Hierzu ein Beispiel, definiere

\displaystyle  v_1 := 01, \quad v_{n+1} := v_n^{n+1} 0^{n+1} 1

dann ist

\displaystyle  v_2 = 0101001, \quad v_3 = (0101001)^3 0001

und so weiter. Es gilt jeweils {v_1 \sqsubset v_2 \sqsubset v_3 \sqsubset \ldots} und damit existiert ein unendliches Wort {\xi} als Grenzwert dieser Folge. Natürlich kann man {\xi = (v_k)^k \eta} schreiben, man kann diese Zerlegung aber nicht unter Erhaltung von {(v_k)^k} über {\eta} “ausdehnen“. Genauer ist {\xi \notin \{ v_i \}^{\omega}}. Denn angenommen wir hätten eine Zerlegung {\xi = v_k \cdot \tau}. Dann ist {v_{k+1} \sqsubset v_k \cdot \tau} und mit {v_{k+1} = v_k^{k+1} 0^{k+1} 1} folgt {v_k^k 0^{k+1}1 \sqsubset \tau}. Allerdings ist {\tau \notin \{ v_i \}^{\omega}}. Denn angenommen dem wäre doch so, dann sieht man dass es ein {v_i} geben muss mit {v_k^k 0^{k+1}1 \sqsubseteq v_i}, hieraus folgt aber {v_k^k = u\cdot v_{k}^{k+1}} nach Konstruktion der {v_i}, ein Widerspruch.

Die Formel stimmt aber dennoch, einen alternativen Beweis werde ich in Kürze veröffentlichen.

Der Beitrag als PDF-Datei.

Notiz zu Dynkin-Systemen

Definition: Ein Dynkin-System {\mathcal D} über {X} ist ein Mengensystem, d.h. {\mathcal D \subseteq \mathcal P(X)}, derart dass

  1. die Grundmenge enthalten ist, {X \in \mathcal D},
  2. es abgeschlossen unter Komplementen ist

    \displaystyle  A \in \mathcal D \Rightarrow A^C \in \mathcal D

  3. es abgeschlossen unter paarweise disjunkter abzählbarer Vereinigung ist

    \displaystyle  \{ A_i \} \subseteq \mathcal D \mbox{ disjunkt} \Rightarrow \biguplus_{i=1}^{\infty} A_i \in \mathcal D.

Satz: Ein Mengensystem {\mathcal D} über {X} ist genau dann ein Dynkin-System falls

  1. es die Grundmenge enthält: {X \in \mathcal D},
  2. es unter relativen Komplementen abgeschlossen ist, d.h.

    \displaystyle A,B \in \mathcal D, A \subseteq B \Rightarrow B - A \in \mathcal D

  3. es unter abzählbaren, aufsteigenden Mengensystemen abgeschlossen ist

    \displaystyle  \{ A_i \} \subseteq \mathcal D \mbox{ mit } A_i \subseteq A_{i+1} \Rightarrow \bigcup_{i=1}^{\infty} A_i \in \mathcal D.

Beweis: 1) Sei {\mathcal D} Dynkin-Sytem über {X}. i) ist klar, zu ii) sei {A,B \in \mathcal D} mit {A \subseteq B}. Das ist äquivalent mit {A \cap B = A}, also {A \cap (B^C) = (A \cap B) \cap B^C = A \cap \emptyset = \emptyset} und damit ist {A \cup B^C \in \mathcal D} als disjunkte Vereinigung, weiter ist {B - A = (B \cap A^C) = (B^C \cup A)^C \in \mathcal D}. Für ii) sei {\{ A_i \}} eine Folge von Mengen mit {A_i \subseteq A_{i+1}}. Definiere {B_1 := A_1} und {B_{i+1} := A_{i+1} - A_i}. Die Mengen {\{ B_i \}} sind paarweise disjunkt, denn sei {i < j} dann ist {A_i \subseteq A_j} und damit induktiv {A_i \cap B_j = \emptyset} also {B_i \cap B_j = \emptyset}. Weiterhin

\displaystyle  \bigcup_{i=1}^{\infty} A_i = \bigcup_{i=1}^{\infty} B_i.

Denn sei {x \in \bigcup_{i=1}^{\infty} A_i} dann ist {x \in A_j} für ein minimales {j}, also {x \in B_j} da {j} minimal, die andere Richtung der Inklusion ist klar. Damit also {\bigcup_{i=1}^{\infty} A_i = \bigcup_{i=1}^{\infty} B_i \in \mathcal D}.

2) Gelte nun i),ii) und iii) für {\mathcal D}. Wir zeigen dass es sich dann um ein Dynkin-System handelt. Die Eigenschaften 1) und 2) sind klar. Zu 3) sei {\{ A_i \}} eine Folge paarweise disjunkter Mengen. Wir zeigen zunächst dass endliche Vereinigungen disjunkter Mengen aus {\mathcal D} in {\mathcal D} liegen. Seien dazu {A,B \in \mathcal D} disjunkt. Dann ist {A \uplus B = (B^C - A)^C \in \mathcal D} wegen ii) und damit induktiv jede endliche Vereinigung. Setze nun {B_1 := A_1, B_2 := A_2 \cup A_1, B_3 := A_3 \cup B_2 = A_3 \cup A_2 \cup A_1} usw. Dies liefert eine Folge {\{ B_i \}} mit {B_i \subseteq B_{i+1}} und wegen {\bigcup_i A_i = \bigcup_i B_i \in \mathcal D} folgt iii). {\square}

Definition Ein Mengensystem {\mathcal D} über {X} heisst durchschnittsstabil (oder {\pi}-System) falls für alle {A,B \in \mathcal D} auch {A \cap B \in \mathcal D}.

Ein durschnittsstabiles Mengensystem ist induktiv unter beliebigen endlichen Schnitten abgeschlossen.

Satz: Ein Dynkin-System {\mathcal D} über {X} ist genau dann {\sigma}-Algebra wenn es durchschnittsstabil ist.

Beweis: 1) Sei {\mathcal D} eine {\sigma}-Algebra, dann sieht man leicht dass es Dynkin-System und durchschnittsstabil ist. 2) Sei nun umgekehrt {\mathcal D} ein durchschnittsstabiles Dynkin-System. Wir müssen noch zeigen dass es unter beliebigen abzählbaren Vereinigungen abgeschlossen ist, sei dazu {\{ A_i \}} eine beliebige Folge von Mengen aus {\mathcal D}. Die Folge {B_i := A_1 \cup \ldots \cup A_i} bildet eine aufsteigende Folge von Mengen, die wegen dem Abschluss unter endlichen Schnitten alle in {\mathcal D} liegen, damit {\bigcup_i B_i \in \mathcal D} und wegen {\bigcup_i A_i = \bigcup_i B_i} folgt der Abschluss unter beliebiger Vereinigung. {\square}

Sei {\mathcal A} ein beliebiges Mengensystem über {X}, dann ist das von {\mathcal A} erzeugte Dynkin-System das kleinste Dynkin-System welches {\mathcal A} umfasst. Da die Potenzmenge stets ein Dynkin-System und der Schnitt von beliebigen Dynkin-System wieder ein Dynkin-System ergibt existiert das erzeugte Dynkin-System für jedes Mengensystem und ist eindeutig bestimmt.

Satz: Sei {\mathcal A} ein durchschnittsstabiles Mengensystem über {X}. Dann ist das erzeugte Dynkin-System ebenfalls durchschnittsstabil, und mit obigen Satz gleich der erzeugten {\sigma}-Algebra.

Beweis: Sei {\mathcal A \subseteq \mathcal P(X)} durchnittsstabil. Bezeichne mit {\mathcal D(\mathcal A)} das von {\mathcal A} erzeugte Dynkin-System. Sei {A \in \mathcal D(\mathcal A)} beliebig, setze

\displaystyle  \Gamma_A := \{ B \in \mathcal D(\mathcal A) : A \cap B \in \mathcal D(\mathcal A) \}.

Dann ist {\Gamma_A} ein Dynkin-System über {X}, i) ist klar, für ii) sei {C \subseteq D} mit {C,D \in \Gamma_A}. Dann ist {(D - C) \cap A = D \cap C^C \cap A = D \cap ( A \cap (C^C \cup A^C) ) = (D \cap A) \cap (C \cap A)^C = (D\cap A) - (C\cap A)} und wegen {C\cap A \subseteq D\cap A} und {C\cap A, D\cap A \in \mathcal D(\mathcal A)} ist {(D - C) \cap A = (D\cap A) - (C\cap A) \in \mathcal D(\mathcal A)}, also {D - C \in \Gamma_A}. Zu iii) sei {\{ B_i \}} eine Folge in {\Gamma_A} mit {B_i \subseteq B_{i+1}}. Dann ist {\{ B_i \cap A \}} eine Folge in {\mathcal D(\mathcal A)} und wegen {B_i \cap A \subseteq B_{i+1} \cap A} und {\bigcup_i (B_i\cap A) = (\bigcup_i B_i) \cap A} folgt {\bigcup_i B_i \in \Gamma_A}.

Für {A \in \mathcal A} ist {\mathcal A \subseteq \Gamma_A} da {\mathcal A} durchschnittsstabil, und da {\Gamma_A} ein Dynkin-System folgt {\mathcal D(\mathcal A) \subseteq \Gamma_A}. Dass heisst für alle {B \in \mathcal D(\mathcal A)} folgt {B \cap A \in \mathcal D(\mathcal A)} bei {A \in \mathcal A}, oder anders gesagt für alle {A \in \mathcal A} und {B \in \mathcal D(\mathcal A)} gilt {A \cap B \in \mathcal D(\mathcal A)}, oder {\mathcal A \subseteq \Gamma_B}. Dass heisst für beliebiges {B \in \mathcal D(\mathcal A)} ist {\mathcal D(\mathcal A) \subseteq \Gamma_B}, d.h. aus {C \in \mathcal D(\mathcal A)} folgt {B \cap C \in \mathcal D(\mathcal A)}, oder anders gesagt {\mathcal D(\mathcal A)} ist durchschnittsstabil, also eine {\sigma}-Algebra.

Damit liegt die von {\mathcal A} erzeugte {\sigma}-Algebra in {\mathcal D(\mathcal A)}. Andererseits ist jede {\sigma}-Algebra auch ein Dynkin-System, damit liegt {\mathcal D(\mathcal A)} in der von {\mathcal A} erzeugten {\sigma}-Algebra, also stimmen beide Mengensysteme überein. {\square}

Das Dokument als PDF-Datei.