Sampling without a frame


Project leader


Funding source

Swedish Research Council - Vetenskapsrådet (VR)


Project Details

Start date: 01/11/2013
End date: 31/12/2016
Funding: 2400000 SEK


Description

När man vill bilda sig en uppfattning om någon "parameter" i en befolkning, må vara partipolitisk preferens, inställning till A-kassans nivå, medellängd eller annat, brukar detta göras genom att en slumpvis vald grupp från populationen ifråga väljs ut och undersöks. I det vanligaste fallet görs urvalet slumpmässigt på ett sätt så att varje individs urvalssannolikhet är välbestämd (oftast lika för alla). I denna situation finns kände statistiska metoder för att "skatta" parametern ifråga. Mer specifikt, om alla individer väljs ut med samma sannolikhet och man är intresserad av populationens medellängd skattas denna med den observerade meddellängden bland de uppmätta längderna i urvalet. Det finns även väl kända metoder för att kvantifiera graden av osäkerhet i denna skattning med konfidensintervall (ju fler som mäts ju minde blir intervallet). I andra fall när en population undersöks finns ingen möjlighet att göra ett slumpmässigt urval med kända urvalssannolikheter. Som exempel kan nämnas när narkomaner i Stockholm undersöks genom ´´uppsökande" verksamhet, när tidigt smittade i ett nytt smittoutbrott undersöks, eller när opinionsmätningar görs genom telefonuppringning. I dessa fall går det inte att på förhand precisera sannolikheten med vilket individer kommer med i urvalet och i sådana fall finns inga allmänt gällande statistiska metoder. Innevarande projekt syftar till att utarbeta metoder att skatta populationsparametrar just i det fallet när urvalet inte gjorts slumpmässigt med givna urvalssannolikheter. Specifikt kommer 3 situationer studeras. Det första är vid s.k. respondent-driven sampling-undersökningar som görs i svåråtkomliga populationer (ex kriminella, narkomaner, ...) genom att individer skickar vidare frågorna anonymt till deras bekanta i populationen ifråga. Här är problemet att individer med många bekanta blir överrepresenterade i urvalet vilket kan ge systematiska skattningsfel om detta inte beaktas. Den andra situationen är när man vill dra slutsatser om en ny sjukdom (senast gällde det den nya influensan) genom att observera tidigt smittade individer. Även här är problemet att socialt aktiva individer är överrepresenterade, men även att dessa individer tenderar att ha ovanligt korta latensperioder m.m., och om inte dessa aspekter tas i beaktande kommer slutsatserna om smittan att bli felaktiga (vilket också inträffade med den nya influensan). Den tredje situationen handlar om en specifik datainsamling från Västra Götaland om ungdomars sexualvanor, där intervjuerna gjorts frivilligt bland personer som besökt ungdomsmottagningar för att testa sig mot könssjukdomar - en på intet sätt representativ grupp ungdomar. Hur kan informationen från dessa individuer användas för att uttala sig om potentiella möjligheter att minska smittspridning av t ex klamydia bland ungdomar i gemen? I projektet kommer olika statistiska metoder att användas tillsammans med matematiska slumpmodeller för att beskriva sociala nätverk för att konstruera nya skattningsmetoder som sedan skall bevisas vara effektiva under vissa givna förutsättningar. Projektet kommer resultera i inomvetenskapliga publikationer men också vända sig utåt, t ex med artiklar om hur man effektivast kan minska smittspridning av könssjukdomar bland ungdomar i Sverige.

Last updated on 2017-24-03 at 12:09