Becslés
Az adatgyűjtések, vizsgálatok, kutatások egyik eredménytípusa, amikor nem egy egzakt, pontos adatot, eredményt közlünk, hanem valamilyen bizonytalanságot is hordoz a végső adat, eredmény.
A piackutatások, elemzések kimeneteként kétféle eredménytípus születhet meg: léteznek olyan mérések, amikor az alkalmazott technológia segítségével az összes lehetséges adatpontot azonosítottuk, megmértük (kérdeztük), és az eredmény ily módon (függetlenül az alkalmazott elemzési módszertől) teljes körű és mindenre kiterjedő – ezeket nevezzük mérésnek, megmért adatoknak. Ilyenek lehetnek pl. egy osztály átlagos testmagassága vagy súlya, ha mindenkit meg tudtunk mérni, esetleg hazánk lakónépessége egy népszámlálás elvi időpontjában.
A másik esetben nem minden esetet, körülményt vagy helyzetet tudunk mérni vagy azonosítani, így nem az összes pontot mérjük. Ezekben az esetekben becslésről beszélünk, hiszen nem bizonyos, hogy pontosan a méréssel egyező az eredmény – csak közelíti azt.
A becslésnek, mint statisztikai alapfogalomnak többféle értelme, típusa létezik: vannak olyan becslések, amelyek egy-egy helyzetet, esetet igyekeznek meghatározni, ezeket hívjuk pontbecslésnek. Ilyenkor sok-sok adatvételi, mérési pontból hiányzik 1-1, és annak az értékét pótoljuk, határozzuk meg. A pontbecslések során a leggyakrabban használt megoldások között találjuk az átlaggal való helyettesítést vagy éppen a leggyakrabban mért értékkel való becslést.
Más esetben már a teljes sokaságra igyekszünk meghatározni valamely adatot, mutatót oly módon, hogy nem minden tagjától gyűjtöttük be a mérési adatot. Ilyenkor a kulcskérdés a becsléssel kapcsolatban annak pontossága, minősége.
A becslés pontosságának két mérőszáma van, ez pedig az ún. szignifikanciaszint és a konfidenciaintervallum. Minden becslés pontossága attól függ, hogy milyen válaszadói körben (mennyire érvényes a válaszadók sokfélesége) és milyen mintanagyság mellett (a teljes válaszadói kör mekkora részét megmérve) történt az adatgyűjtés.
A becslés minőségében a szignifikanciaszint azt mutatja meg, hogy 100 egymás után ismétlődő vizsgálat esetén legalább hány alkalommal kapunk hasonló eredményt – ha valaki kutatási jelentéseket olvas, akkor jellemzően vagy 95%-os vagy 97%-os szignifikanciaszinteket talál. A konfidenciaintervallum pedig azt mutatja meg, hogy az eredmény a megadott szignifikanciaszint mellett milyen tartományban mozoghat.
Például 1000 fő megkérdezése esetén egy dichotóm (igen-nem választ lehetővé tevő) kérdésre adott becslésünk 95%-os szignifikanciaszint mellett +/–1,96%-os pontosságú lesz, míg 99%-os pontosságot elvárva a válasz +/–2,58. Vagyis ha azt mértük 1000 embernél, hogy 63%-nak van autója a háztartásban, akkor 100 adatgyűjtésből legalább 95 esetben 61,04% és 64,96% közé esik az érték, amennyiben a mintavétel, adatgyűjtés valamennyi egyéb szabályát helyesen végezzük el.
Mindezeknek viszont van egy kulcsfontosságú következménye. Ha például két terméket megmér egy vizsgálat és az A termék 49,5%-os kedveltséget mutat, míg a B termék esetében ez 50,5%, akkor felelős elemző nem állíthatja, hogy B termék kedveltebb, mint A, mert a két mért érték azonos konfidenciaintervallumba esik nagyrészt, így számos megismételt kutatásban a sorrend megfordulhat.
Utoljára szerkesztve: 2021. július 28.