PDE1 - Distributioner
Partial Differential Equations handlar om följande:
1) Distributioner
2a) Elliptiska differentialekvationer
2b) Paraboliska differentialekvationer
2c) Hyperboliska differentialekvationer
I detta inlägg gör den linjära algebran sitt inträde på scenen, och den kommer återkomma regelbundet i framtiden. Tyvärr är chanserna små för den som inte har grundläggande förståelse för linjär algebra att förstå något förutom första delen av detta inlägg.
Detta inlägg blev också längre än jag hade tänkt mig, men det är inte lika långt som förra och det är i princip allt jag vill ha sagt om hela denna kurs. Resten får bara en kort omnämning senare.
Exempel på distributioner
Distributioner är en generalisering av vanliga funktioner. Detta betyder att distributioner är ungefär samma sak som funktioner, i den mening att de beter sig ungefär likadant, men att de omfattar lite fler saker än vanliga funktioner.
Den klassiska exemplet på en distribution är delta-funktionen δ(x), som löst uttryckt uppfyller:
* δ(x) = 0 för alla x ≠ 0.
* δ(0) = ∞.
* ∫-∞∞ δ(x) dx = 1, dvs den oändliga spiken i x = 0 är precis så hög att totala arean under grafen blir 1.
Delta-funktionen kan användas för att plocka ut enstaka funktionsvärden, genom formeln ∫ δ(x)f(x) dx = f(0), eller generellt ∫ δ(x-a)f(x) dx = f(a).
Delta-funktionen är också praktisk att använda när man vill beskriva något samlat i en enda punkt:
* Om du har ett snöre (densitet a) med en punktformad massa (massa b) i punkten 0 så kan den sammanlagda densiteten skrivas som ρ(x) = a + bδ(x).
* Om du väljer ett tal slumpmässigt enligt proceduren "Singla en slant. Om krona, välj 0.5; Om klave, välj ett tal likformigt i intervallet mellan 0 och 1." kan sannolikhetsfördelningen skrivas som f(x) = (1 + δ(x-0.5))/2.
* Derivatan av Heavisides stegfunktion H, som uppfyller H(x) = 0 för x < 0 och H(x) = 1 för x > 1, är just delta-funktionen: Förändringen i H är noll överallt, förutom i x = 0 där funktionen tar ett enhetssteg uppåt.
Delta-funktionen är dock ingen riktig funktion, eftersom den inte antar något reellt värde i x = 0 (och det är komplicerat att utvidga de reella talen för att tillåta oändliga värden), och Heavisides stegfunktion har egentligen ingen derivata i x = 0 - den är ju inte ens kontinuerlig där. Tack vare distributioner kan vi dock säga att derivatan av H är δ, åtminstone i distributionell mening.
Sammanfattning av linjär algebra
Linjär algebra handlar om vektorer och skalärer. För närvarande räcker det med att låta skalärerna vara reela tal. Det finns två operationer:
* Addition: vektor + vektor = vektor.
* Multiplikation med skalär: skalär * vektor = vektor.
Exempel:
* Pilar i rummet. Pilarna har riktning och längd, men kan flyttas runt hur som helst. Summan av två pilar får man genoma att lägga den ena pilen efter den andra och dra pilen som går från första pilens början till den andra pilens slut. Multiplikation med skalär multiplicerar pilens längd med skalären utan att ändra dess riktning.
* Rummet Rn av n-tuplar x = (x1, x2, ..., xn) av reella tal, för något fixt positivt heltal n. Addition och multiplikation sker komponentvis, så att exempelvis (1,2,3) + (0,100,a) = (1,102,a+3) och -1*(0,100,a) = (0,-100,-a).
* Funktioner. Om f och g är två funktioner definierar vi summan h=f+g genom h(x)=f(x)+g(x) för alla x. Om f är en funktion och λ en skalär definierar vi produkten h=λf genom h(x)=λ·f(x) för alla x.
Givet ett vektorrum kan man definiera en inre produkt (a.k.a. skalärprodukt), som kan skrivas på många olika sätt, exempelvis vektor * vektor = skalär, (vektor, vektor) = skalär, eller <vektor, vektor> = skalär. Jag kommer använda mig av den sista formen.
Exempel:
1) Standardskalärprodukten i pil-exemplet är <x,y> = |x|·|y|·cosθ, där |x|, |y| är längden av pilarna x, y och θ är vinkeln mellan dem.
2) Standardskalärprodukten i Rn är <x,y> = x1y1 + x2y2 + ... + xnyn.
3) Standardskalärprodukten för reella funktioner är <f,g> = ∫ f(x)g(x) dx, där integralen tas över alla x.
Slutligen vill jag påminna om att det finns linjära funktioner mellan vektorrum, och att en linjär funktion som skickar vektorer till skalärer kallas en linjär funktional. Ett exempel på en linjär funktional på R3 är F(x) = x1+x2-x3.
Definitionen av en distribution
Till att börja med ska jag deklarera att jag istället för att vara rigorös (dvs ha tydliga påståenden och bevis) kommer vifta en massa med händerna (dvs vara motsatsen till rigorös). Jag tror att de flesta läsare kommer finna de övergripande idéerna mer intressanta än de petiga detaljerna.
Och istället för att behandla distributioner (dvs generaliserade funktioner) tänker jag generalisera vektorer.
Grundidén kommer från observationen att man i viss mån kan para ihop vektorer med linjära funktionaler: Om a är en vektor så är den motsvarande funktionalen Fa(v) = <a,v> linjär.
Exempel: I R3 motsvarar funktionalen F(x) = x1+x2-x3 vektorn (1,1,-1), eftersom <(1,1,-1),x> = x1+x2-x3. I ett vektorrum av funktioner motsvarar F(f) = ∫ f(x) dx vektorn (funktionen) g(x) = 1, eftersom <f,1> = ∫ f(x) dx.
I Hilbert-rum, som är en viss klass av vektorrum där bland annat alla ändligdimensionella vektorrum ingår, finns det en vektor till varje linjär funktional, dvs för varje F finns ett a sådant att F = Fa. I övriga rum är detta dock inte nödvändigtvis sant - några linjära funktionaler blir över.
Det är lätt att visa, med hjälp av skalärproduktens egenskaper, att den funktion som skickar vektorn a till den motsvarande funktionalen Fa är linjär. Detta innebär att vektorer och linjära funktionaler beter sig ungefär likadant, så vi definierar "generaliserad vektor" till att betyda "linjär funktional".
En distribution är alltså officiellt en linjär funktion som skickar funktioner till reella tal. Delta-distributionen är egentligen en funktional F given av F(f) = f(0), inte en funktion δ(x) sådan att Fδ(f) = <δ,f> = f(0).
Operationer på distributioner
Nu när vi har generaliserat vektorerna vill vi också generalisera operationer på dem. Närmare bestämt vill vi kunna ta en linjär funktion som skickar vektorer till vektorer, och ge en motsvarande linjär funktion som skickar generaliserade vektorer till generaliserade vektorer. Exempelvis vill vi kunna säga vad derivatan av en distribution är.
Vi går tillbaks till vanliga vektorer, och noterar att vissa linjära funktioner L har något som kallas adjunkt: en linjär funktion L* sådan att <L(x),y> = <x,L*(y)> för alla x,y.
Exempel:
* Om vi tittar på kolonnvektorer, så är en matris A en linjär funktion. Dess adjunkt A* är helt enkelt dess transponat, ty <Ax,y> = (Ax)Ty = xTATy = <x,ATy>.
* Om vi tittar på reella funktioner vars alla derivator går mot noll då x går mot någon oändlighet, är deriveringsoperatorn d/dx en linjär funktion. Dess adjunkt är -d/dx, ty enligt partiell integration gäller ∫ f'(x)g(x) dx = [f(x)g(x)] - ∫ f(x)g'(x) dx = ∫ f(x)(-g'(x)) dx, där allting går från -∞ till ∞.
Om vi återigen låter Fa beteckna den generaliserade vektor som motsvarar vektorn a, så är det vettigt att definiera L(Fa) = FL(a). (Slappt uttryckt betyder detta att om a ≈ F så är L(a) ≈ L(F).) Då följer att L(Fa)(x) = FL(a)(x) = <L(a),x> = <a,L*x> = Fa(L*(x)).
Nu definierar vi helt enkelt operationer på alla generaliserade vektorer så: Om L är en linjär funktion med adjunkt L* och F är en generaliserad vektor så är L(F) den generaliserade vektor som uppfyller L(F)(x) = F(L*(x)) för alla x.
En något upplysande men även något förvirrande notation är att definiera <F,x> = F(x) för linjära funktionaler F och vektorer x. Då kan man sammanfatta de viktigaste formlerna som följer:
* <Fa,x> = <a,x> [dvs a ≈ Fa]
* <L(F),x> = <F,L*(x)> [samma som adjunkt-formeln]
Som avslut beräknar vi derivatan av Heavisides stegfunktion H(x):
< dH/dx, f > =
= < H, (d/dx)*f > [Definitionen av operation på distributioner]
= < H, -df/dx > [Adjunkten av d/dx är -d/dx]
= ∫ -H(x)f'(x) dx [Definitionen av inre produkt]
= ∫0∞ -f'(x) dx [H(x) = 0 för x < 0, H(x) = 1 för x > 0]
= [-f(x)]0∞ [Integrera!]
= -f(∞) + f(0)
= f(0) [Vi antar att f går mot 0 då x går mot oändligheten.]
= < δ, x >
Alltså är dH/dx = δ, QED.
1) Distributioner
2a) Elliptiska differentialekvationer
2b) Paraboliska differentialekvationer
2c) Hyperboliska differentialekvationer
I detta inlägg gör den linjära algebran sitt inträde på scenen, och den kommer återkomma regelbundet i framtiden. Tyvärr är chanserna små för den som inte har grundläggande förståelse för linjär algebra att förstå något förutom första delen av detta inlägg.
Detta inlägg blev också längre än jag hade tänkt mig, men det är inte lika långt som förra och det är i princip allt jag vill ha sagt om hela denna kurs. Resten får bara en kort omnämning senare.
Exempel på distributioner
Distributioner är en generalisering av vanliga funktioner. Detta betyder att distributioner är ungefär samma sak som funktioner, i den mening att de beter sig ungefär likadant, men att de omfattar lite fler saker än vanliga funktioner.
Den klassiska exemplet på en distribution är delta-funktionen δ(x), som löst uttryckt uppfyller:
* δ(x) = 0 för alla x ≠ 0.
* δ(0) = ∞.
* ∫-∞∞ δ(x) dx = 1, dvs den oändliga spiken i x = 0 är precis så hög att totala arean under grafen blir 1.
Delta-funktionen kan användas för att plocka ut enstaka funktionsvärden, genom formeln ∫ δ(x)f(x) dx = f(0), eller generellt ∫ δ(x-a)f(x) dx = f(a).
Delta-funktionen är också praktisk att använda när man vill beskriva något samlat i en enda punkt:
* Om du har ett snöre (densitet a) med en punktformad massa (massa b) i punkten 0 så kan den sammanlagda densiteten skrivas som ρ(x) = a + bδ(x).
* Om du väljer ett tal slumpmässigt enligt proceduren "Singla en slant. Om krona, välj 0.5; Om klave, välj ett tal likformigt i intervallet mellan 0 och 1." kan sannolikhetsfördelningen skrivas som f(x) = (1 + δ(x-0.5))/2.
* Derivatan av Heavisides stegfunktion H, som uppfyller H(x) = 0 för x < 0 och H(x) = 1 för x > 1, är just delta-funktionen: Förändringen i H är noll överallt, förutom i x = 0 där funktionen tar ett enhetssteg uppåt.
Delta-funktionen är dock ingen riktig funktion, eftersom den inte antar något reellt värde i x = 0 (och det är komplicerat att utvidga de reella talen för att tillåta oändliga värden), och Heavisides stegfunktion har egentligen ingen derivata i x = 0 - den är ju inte ens kontinuerlig där. Tack vare distributioner kan vi dock säga att derivatan av H är δ, åtminstone i distributionell mening.
Sammanfattning av linjär algebra
Linjär algebra handlar om vektorer och skalärer. För närvarande räcker det med att låta skalärerna vara reela tal. Det finns två operationer:
* Addition: vektor + vektor = vektor.
* Multiplikation med skalär: skalär * vektor = vektor.
Exempel:
* Pilar i rummet. Pilarna har riktning och längd, men kan flyttas runt hur som helst. Summan av två pilar får man genoma att lägga den ena pilen efter den andra och dra pilen som går från första pilens början till den andra pilens slut. Multiplikation med skalär multiplicerar pilens längd med skalären utan att ändra dess riktning.
* Rummet Rn av n-tuplar x = (x1, x2, ..., xn) av reella tal, för något fixt positivt heltal n. Addition och multiplikation sker komponentvis, så att exempelvis (1,2,3) + (0,100,a) = (1,102,a+3) och -1*(0,100,a) = (0,-100,-a).
* Funktioner. Om f och g är två funktioner definierar vi summan h=f+g genom h(x)=f(x)+g(x) för alla x. Om f är en funktion och λ en skalär definierar vi produkten h=λf genom h(x)=λ·f(x) för alla x.
Givet ett vektorrum kan man definiera en inre produkt (a.k.a. skalärprodukt), som kan skrivas på många olika sätt, exempelvis vektor * vektor = skalär, (vektor, vektor) = skalär, eller <vektor, vektor> = skalär. Jag kommer använda mig av den sista formen.
Exempel:
1) Standardskalärprodukten i pil-exemplet är <x,y> = |x|·|y|·cosθ, där |x|, |y| är längden av pilarna x, y och θ är vinkeln mellan dem.
2) Standardskalärprodukten i Rn är <x,y> = x1y1 + x2y2 + ... + xnyn.
3) Standardskalärprodukten för reella funktioner är <f,g> = ∫ f(x)g(x) dx, där integralen tas över alla x.
Slutligen vill jag påminna om att det finns linjära funktioner mellan vektorrum, och att en linjär funktion som skickar vektorer till skalärer kallas en linjär funktional. Ett exempel på en linjär funktional på R3 är F(x) = x1+x2-x3.
Definitionen av en distribution
Till att börja med ska jag deklarera att jag istället för att vara rigorös (dvs ha tydliga påståenden och bevis) kommer vifta en massa med händerna (dvs vara motsatsen till rigorös). Jag tror att de flesta läsare kommer finna de övergripande idéerna mer intressanta än de petiga detaljerna.
Och istället för att behandla distributioner (dvs generaliserade funktioner) tänker jag generalisera vektorer.
Grundidén kommer från observationen att man i viss mån kan para ihop vektorer med linjära funktionaler: Om a är en vektor så är den motsvarande funktionalen Fa(v) = <a,v> linjär.
Exempel: I R3 motsvarar funktionalen F(x) = x1+x2-x3 vektorn (1,1,-1), eftersom <(1,1,-1),x> = x1+x2-x3. I ett vektorrum av funktioner motsvarar F(f) = ∫ f(x) dx vektorn (funktionen) g(x) = 1, eftersom <f,1> = ∫ f(x) dx.
I Hilbert-rum, som är en viss klass av vektorrum där bland annat alla ändligdimensionella vektorrum ingår, finns det en vektor till varje linjär funktional, dvs för varje F finns ett a sådant att F = Fa. I övriga rum är detta dock inte nödvändigtvis sant - några linjära funktionaler blir över.
Det är lätt att visa, med hjälp av skalärproduktens egenskaper, att den funktion som skickar vektorn a till den motsvarande funktionalen Fa är linjär. Detta innebär att vektorer och linjära funktionaler beter sig ungefär likadant, så vi definierar "generaliserad vektor" till att betyda "linjär funktional".
En distribution är alltså officiellt en linjär funktion som skickar funktioner till reella tal. Delta-distributionen är egentligen en funktional F given av F(f) = f(0), inte en funktion δ(x) sådan att Fδ(f) = <δ,f> = f(0).
Operationer på distributioner
Nu när vi har generaliserat vektorerna vill vi också generalisera operationer på dem. Närmare bestämt vill vi kunna ta en linjär funktion som skickar vektorer till vektorer, och ge en motsvarande linjär funktion som skickar generaliserade vektorer till generaliserade vektorer. Exempelvis vill vi kunna säga vad derivatan av en distribution är.
Vi går tillbaks till vanliga vektorer, och noterar att vissa linjära funktioner L har något som kallas adjunkt: en linjär funktion L* sådan att <L(x),y> = <x,L*(y)> för alla x,y.
Exempel:
* Om vi tittar på kolonnvektorer, så är en matris A en linjär funktion. Dess adjunkt A* är helt enkelt dess transponat, ty <Ax,y> = (Ax)Ty = xTATy = <x,ATy>.
* Om vi tittar på reella funktioner vars alla derivator går mot noll då x går mot någon oändlighet, är deriveringsoperatorn d/dx en linjär funktion. Dess adjunkt är -d/dx, ty enligt partiell integration gäller ∫ f'(x)g(x) dx = [f(x)g(x)] - ∫ f(x)g'(x) dx = ∫ f(x)(-g'(x)) dx, där allting går från -∞ till ∞.
Om vi återigen låter Fa beteckna den generaliserade vektor som motsvarar vektorn a, så är det vettigt att definiera L(Fa) = FL(a). (Slappt uttryckt betyder detta att om a ≈ F så är L(a) ≈ L(F).) Då följer att L(Fa)(x) = FL(a)(x) = <L(a),x> = <a,L*x> = Fa(L*(x)).
Nu definierar vi helt enkelt operationer på alla generaliserade vektorer så: Om L är en linjär funktion med adjunkt L* och F är en generaliserad vektor så är L(F) den generaliserade vektor som uppfyller L(F)(x) = F(L*(x)) för alla x.
En något upplysande men även något förvirrande notation är att definiera <F,x> = F(x) för linjära funktionaler F och vektorer x. Då kan man sammanfatta de viktigaste formlerna som följer:
* <Fa,x> = <a,x> [dvs a ≈ Fa]
* <L(F),x> = <F,L*(x)> [samma som adjunkt-formeln]
Som avslut beräknar vi derivatan av Heavisides stegfunktion H(x):
< dH/dx, f > =
= < H, (d/dx)*f > [Definitionen av operation på distributioner]
= < H, -df/dx > [Adjunkten av d/dx är -d/dx]
= ∫ -H(x)f'(x) dx [Definitionen av inre produkt]
= ∫0∞ -f'(x) dx [H(x) = 0 för x < 0, H(x) = 1 för x > 0]
= [-f(x)]0∞ [Integrera!]
= -f(∞) + f(0)
= f(0) [Vi antar att f går mot 0 då x går mot oändligheten.]
= < δ, x >
Alltså är dH/dx = δ, QED.
Kommentarer