Pentru că adesea ne sunt oferite rezultatele unor sondaje de opinie și statistici care ne interesează, este util să cunoaștem unele aspecte esențiale ale cercetării, pentru a ne face o părere informată despre cifrele pe care le primim. Un astfel de aspect esențial este eșantionul reprezentativ. Pentru că, în mod surprinzător, nu este nevoie să includem toată populația vizată într-o cercetare, ci doar o parte, parte care se numește eșantion. Dacă numărul de oameni necesari pentru o cercetare este calculat corespunzător, rezultatele sunt relevante și ne putem baza pe ele.
Ce este eșantionarea?
În cazul sondajelor de opinie, eșantionarea este o procedură prin care se determină, în vederea desfășurării unei activități de cercetare, un număr specific de subiecți dintr-un grup mai mare de persoane care au în comun anumite caracteristici.
Grupul poate fi unul restrâns (de exemplu, clasa a VII-a B dintr-o școală, caracteristica comună fiind apartenența la clasa respectivă) sau poate avea un număr foarte mare de persoane (de exemplu, toți elevii de clasa a VII-a din România, ale căror caracteristici comune sunt: țara în care sunt elevi și anul de studiu).
Eșantionarea se face prin metode validate științific și are scopul de a obține rezultate relevante statistic pentru grupul cercetat, fără a recurge la activitatea laborioasă, costisitoare și adesea imposibilă de a aborda toți membrii grupului.
Este simplu să întrebăm toți elevii dintr-o clasă când preferă să meargă într-o excursie, iar răspunsurile lor sunt în mod evident relevante pentru clasa respectivă (și doar pentru clasa respectivă), dar, pentru a afla părerea tuturor elevilor din țară legat de perioada perfectă pentru organizarea de excursii școlare, trebuie eșantionare.
Cum se determină numărul de persoane dintr-un eșantion reprezentativ?
Unul dintre aspectele importante ale eșantionării este determinarea corectă a numărului de persoane necesar.
Dacă eșantionul este prea mic raportat la populația cercetată, rezultatele pot prezenta anomalii și pot oferi o imagine trunchiată sau chiar eronată asupra subiectului cercetării. Dacă eșantionul este prea mare, cercetarea devine mult prea costisitoare.
Așa că, pentru a reduce costurile de cercetare și pentru a păstra, în același timp, relevanța rezultatelor, au fost determinate științific metode de calcul pentru a afla numărul de persoane necesar pentru un eșantion corect, raportat la populația cercetată.
Pentru cei care nu doresc să se apuce de calcule, este disponibil un calculator automat, aici: https://www.calculator.net/sample-size-calculator.html;
Pentru cei care vor să înțeleagă exact cum se face acest calcul, iată, mai jos, formula completă, care ține cont de:
- dimensiunea populației care face obiectul cercetării, adică numărul total de persoane despre care vrem să aflăm anumite aspecte. (De exemplu, numărul de elevi din România în anul școlar 2020-2021)
- marja de eroare, adică posibilitatea de eroare admisibilă, exprimată procentual (5%, adică 0.05; 3%, adică 0.03 ș.a.), care se ia astfel în calcul, și care indică *intervalul* de încredere.
- *nivelul* de încredere (diferit de *intervalul* de încredere), care primește un scor Z, adică o valoare critică a distribuției normale la nivelul de încredere necesar, scor care nu mai trebuie calculat, pentru că este disponibil în trusa de lucru a statisticianului într-un tabel. (De exemplu, pentru un nivel de încredere de 90%, scorul Z este de 1.645, pentru 95% – 1.96, pentru 99% – 2.576 etc.)
- deviația standard, un aspect ceva mai tehnic, care anticipează cam cât de diferite vor fi răspunsurile primite față de medie. (O deviație standard de 0.5 este folosită în general.)
Formule pentru calculul unui eșantion reprezentativ
Unde:
- N = dimensiunea populației
- Z = scorul Z corespunzător nivelului de încredere
- p = deviația standard
- e = marja de eroare
- n = eșantionul
Notă – Pentru simplificarea calcului și deoarece diferența la rezultat este foarte mică, nesemnificativă, pentru toate populațiile care depășesc 100,000 de persoane, eșantionul se poate calcula folosind N = 100,000, și nu numărul exact.
Formula poate părea copleșitoare, dar această parte se repetă: Z²*p*(1-p)/e² și poate fi calculată prima, pentru simplificare. Datorită diferențelor mici între numărul obținut așa și cel calculat cu formula completă, adesea se folosește doar această parte a formulei pentru o determinare rapidă a eșantionului necesar, mai ales în cazurile în care nu se cunoaște dimensiunea populației, dar se știe că este mai mare de 100,000.
Așadar, dacă notăm cu n1, această parte importantă din formula completă devine:
n1 = Z²*p*(1-p)/e²,
iar formula completă devine astfel:
n = N*[n1/(N–1+n1)]
Exemplu
Pentru determinarea dimensiunii eșantionului necesar pentru o populație de 2,800,000 de elevi (numărul de elevi români în anul școlar 2020-2021), cu marjă de eroare de 3%, se face următorul calcul, de unde obținem că un eșantion reprezentativ este de 1.067 persoane.
n = 100,000 * { [1.96²*0.5*(1-0.5)/0.03²] / {100,000–1+[1.96²*0.5*(1-0.5)/0.03²]} }
n1 = 1.96²*0.5*(1-0.5)/0.03² = 1067;
Putem folosi acest număr ca eșantion sau putem calcula în continuare si obținem 1.056 de persoane.
În încheiere, este de notat că, pentru cercetări pe populații mai mari de 100,000 de persoane, la marje de eroare de 3% sunt reprezentative eșantioane mici, 1067 de persoane fiind suficiente pentru a oferi o concluzie relevantă statistic cercetătorilor.
În cazul populațiilor reduse numeric, eșantioanele corect determinate sunt proporțional mai mari față de cele necesare pentru studierea populațiilor numeroase. De exemplu pentru o populație de 1000 de persoane, pentru o marjă de eroare de 5%, eșantionul necesar este de 278 de persoane (27.8%); la o populație de 500 de persoane, pentru o marjă de eroare de 5%, eșantionul necesar este de 218 de persoane (43,6%).
Articol de Alina Voinea – preluat de pe www.asociatia-supra.ro cu acordul autoarei