Benfords lag
Idag höll Terence Tao en föreläsning för TMS om universalitet, vilket jag förstod som när ett system med många komplicerade mikroskopiska beteenden uppvisar enkla makroskopiska beteenden. Som exempel tog han universums atomer under gravitationslagen, vars makroskopiska beteende (bildandet av galaxer och kluster) vi förstår mycket väl trots att vi inte har en chans att följa varenda enskild atom. Ett annat exempel är kroppslängd, som följer en enkel normalfördelning trots (eller tack vare) att det finns en massa komplicerade faktorer som bidrar.
En intressant grej han tog upp är Benfords lag, som säger att begynnelsesiffran på tal i allmänhet är exempelvis en etta med 30% sannolikhet, men en nia endast i 5% av fallen. Som exempel har Wikipedia en graf över vilka begynnelsesiffror fysikaliska konstanter har:
En praktisk applikation för Benfords lag är att detektera påhittade eller manipulerade siffror, eftersom förfalskarna sällan ser till att de har rätt fördelning för begynnelsesiffrorna. På detta sätt har man kunnat avslöja såväl bokföringsbrott som valfusk.
Benfords lag gäller i allmänhet för storheter som utsätts för multiplikativa förändringar. Då är det rimligt att 1 är mycket vanligare 9 som begynnelsesiffra, eftersom den relativa skillnaden mellan 1... och 2... är 100%, medan skillnaden mellan 9... och 10... bara är 10%.
(För övrigt hörde jag nyligen ett webbradioprogram som diskuterade att barn ursprungligen räknar logaritsmiskt, så att skillnaden mellan 1 och 2 upplevs som större än skillnaden mellan 9 och 10. Om man ber dem sätta ut mitten mellan 1 och 9 anger de alltså 3 istället för 5. Detta försvinner sedan när barnet lär sig räkna 1, 2, 3, ...)
Föreläsaren drog sedan ett skämt, som gick ut på att Benfords lag även gäller för födelsedata. Som bevis frågade han publiken:
Vilka här har ett födelsedatum som börjar på 1? Ungefär 30%.
Vilka här har ett födelsedatum som börjar på 9? Ungefär 5%.
Vilka här har en födelsemånad som börjar på 9? Ungefär 5%.
Till sist brast det dock, när han frågade:
Vilka här har ett födelseår som börjar på 1?
En intressant grej han tog upp är Benfords lag, som säger att begynnelsesiffran på tal i allmänhet är exempelvis en etta med 30% sannolikhet, men en nia endast i 5% av fallen. Som exempel har Wikipedia en graf över vilka begynnelsesiffror fysikaliska konstanter har:
En praktisk applikation för Benfords lag är att detektera påhittade eller manipulerade siffror, eftersom förfalskarna sällan ser till att de har rätt fördelning för begynnelsesiffrorna. På detta sätt har man kunnat avslöja såväl bokföringsbrott som valfusk.
Benfords lag gäller i allmänhet för storheter som utsätts för multiplikativa förändringar. Då är det rimligt att 1 är mycket vanligare 9 som begynnelsesiffra, eftersom den relativa skillnaden mellan 1... och 2... är 100%, medan skillnaden mellan 9... och 10... bara är 10%.
(För övrigt hörde jag nyligen ett webbradioprogram som diskuterade att barn ursprungligen räknar logaritsmiskt, så att skillnaden mellan 1 och 2 upplevs som större än skillnaden mellan 9 och 10. Om man ber dem sätta ut mitten mellan 1 och 9 anger de alltså 3 istället för 5. Detta försvinner sedan när barnet lär sig räkna 1, 2, 3, ...)
Föreläsaren drog sedan ett skämt, som gick ut på att Benfords lag även gäller för födelsedata. Som bevis frågade han publiken:
Vilka här har ett födelsedatum som börjar på 1? Ungefär 30%.
Vilka här har ett födelsedatum som börjar på 9? Ungefär 5%.
Vilka här har en födelsemånad som börjar på 9? Ungefär 5%.
Till sist brast det dock, när han frågade:
Vilka här har ett födelseår som börjar på 1?
Kommentarer