Valabilitatea mijloacelor de evaluare. Cum să remediați cele mai frecvente greșeli. Modalități de stabilire a validității

Validitatea în esență este o caracteristică complexă care include, pe de o parte, informații despre dacă tehnica este potrivită pentru a măsura pentru ce a fost creată și, pe de altă parte, care sunt eficacitatea, eficiența și utilitatea sa practică.

Verificarea validității unei metodologii se numește validare.

Pentru a efectua validarea pragmatică a unei tehnici, adică pentru a-i evalua eficacitatea, eficiența, semnificația practică, se utilizează de obicei un criteriu extern independent - un indicator al manifestării proprietății studiate în Viata de zi cu zi. Un astfel de criteriu poate fi performanța academică (pentru teste de abilități de învățare, teste de realizare, teste de inteligență) și realizările de producție (pentru metode orientate către profesional), precum și eficacitatea activităților reale - desen, modelare etc. (pentru teste de specialitate). abilități), aprecieri subiective(pentru teste de personalitate).

4 tipuri de criterii externe:

criterii de performanță (acestea pot include, cum ar fi cantitatea de muncă efectuată, performanța academică, timpul petrecut în formare, rata de creștere a calificărilor etc.);
criterii subiective (cuprind diverse tipuri de răspunsuri care reflectă atitudinea unei persoane față de ceva sau cineva, opinia, opiniile, preferințele acestuia; de obicei criteriile subiective sunt obținute cu ajutorul interviurilor, chestionarelor, chestionarelor);
criterii fiziologice (se folosesc la studierea influenței mediu inconjuratorși alte variabile situaționale asupra corpului și psihicului uman; se măsoară frecvența pulsului, tensiunea arterială, rezistența electrică a pielii, simptomele de oboseală etc.);
criteriile accidentelor (utilizate atunci când scopul studiului se referă, de exemplu, la problema selectării pentru muncă a persoanelor care sunt mai puțin susceptibile la accidente).

Valabilitatea empirică.

Dacă, în cazul validității conținutului, testul este evaluat pe cheltuiala experților (care stabilesc corespondența itemilor testului cu conținutul subiectului de măsurare), atunci validitatea empirică se măsoară întotdeauna folosind corelația statistică: corelarea a două se calculează o serie de valori - scoruri la test și indicatori pe parametrul extern ales ca criteriu de valabilitate.

Validitatea constructiei.

Validitatea constructului se referă la constructul teoretic în sine și implică căutarea factorilor care explică comportamentul de susținere a testelor. Ca tip special, validitatea de construct a fost canonizată într-un articol al lui Cronbach și Meehl (1955). Autorii au evaluat folosind acest tip de validitate toate studiile de testare care nu vizau în mod direct prezicerea unui criteriu relevant. Studiul conținea informații despre constructele psihologice.

Validitatea conținutului.

Valabilitatea conținutului necesită ca fiecare articol, sarcină sau întrebare aparținând unui anumit domeniu să aibă șanse egale de a fi testat într-un test. Validitatea conținutului evaluează coerența conținutului testului (sarcini, întrebări) cu aria de comportament măsurată. Testele, compilate de două echipe de dezvoltare, sunt efectuate pe un eșantion de subiecți. Fiabilitatea testului este calculată prin împărțirea articolelor în două părți, rezultând un indice de validitate a conținutului.

Valabilitate „predictivă”.

Valabilitatea „predictivă” este, de asemenea, determinată de un criteriu extern destul de fiabil, dar informațiile despre acesta sunt colectate la ceva timp după test. Un criteriu extern este de obicei capacitatea unei persoane, exprimată într-un fel de evaluare, pentru tipul de activitate pentru care a fost selectată pe baza rezultatelor testelor de diagnosticare. Deși această tehnică este cel mai în concordanță cu sarcina tehnicilor de diagnosticare - prezicerea succesului viitor, este foarte dificil de aplicat. Precizia prognozei este invers legată de timpul specificat pentru o astfel de prognoză. Cu cât trece mai mult timp după măsurare, cu atât este mai mare numărul de factori care trebuie luați în considerare atunci când se evaluează semnificația prognostică a tehnicii. Cu toate acestea, este aproape imposibil să luați în considerare toți factorii care influențează predicția.

Valabilitate „retrospectivă”.

Se determină pe baza unui criteriu care reflectă evenimente sau starea calității din trecut. Poate fi folosit pentru a obține rapid informații despre capacitățile predictive ale tehnicii. Astfel, pentru a verifica măsura în care rezultatele testelor de aptitudini bune corespund învățare rapidă, puteți compara evaluările anterioare ale performanței, opiniile experților din trecut etc. la indivizii cu indicatori de diagnostic de curent ridicat și scăzut.

Valabilitate convergentă și discriminantă.

Strategia de includere a anumitor itemi în test depinde de modul în care psihologul definește constructul diagnostic. Dacă Eysenck definește proprietatea „nevrotism” ca fiind independentă de extraversie-introversie, atunci aceasta înseamnă că chestionarul său ar trebui să conțină aproximativ în mod egal itemi cu care ar fi de acord introvertiții nevrotici și extrovertiții nevrotici. Dacă în practică se dovedește că testul va fi dominat de itemi din cadranul „Nevrotism-Introversie”, atunci, din punctul de vedere al teoriei lui Eysenck, aceasta înseamnă că factorul „nevrotism” se dovedește a fi încărcat cu un irelevant. factor - „introversie”. (Exact același efect are loc dacă eșantionul devine deformat - dacă conține mai mulți introvertiți nevrotici decât extrovertiți nevrotici.)

Pentru a evita astfel de dificultăți, psihologii ar dori să se ocupe de indicatori empiric (articole) care informează în mod clar doar un factor. Dar această cerință nu este niciodată îndeplinită de fapt: fiecare indicator empiric se dovedește a fi determinat nu numai de factorul de care avem nevoie, ci și de alții - irelevant pentru sarcina de măsurare.

Astfel, pentru factorii care sunt definiți conceptual ca fiind ortogonali cu ceea ce este măsurat (care apar în toate combinațiile), autorul testului trebuie să utilizeze o strategie de echilibrare artificială în selectarea elementelor.

Corespondența itemilor cu factorul de măsurat asigură validitatea convergentă a testului. Echilibrarea elementelor cu factorii irelevanți asigură validitatea discriminantă. Din punct de vedere empiric, se exprimă în absența unei corelații semnificative cu un test care măsoară o proprietate independentă conceptual.

Valabilitate

Unul dintre cele mai importante caracteristici tehnici si teste de psihodiagnostic, unul dintre criteriile principale pentru calitatea acestora. Acest concept este aproape de conceptul de fiabilitate, dar nu este complet identic.

Problema validității se pune în cursul dezvoltării și aplicării practice a unui test sau tehnici, atunci când este necesar să se stabilească o corespondență între gradul de exprimare a proprietății de personalitate de interes și metoda de măsurare a acesteia. Validitatea se referă la ceea ce măsoară un test sau o tehnică și cât de bine o face; Cu cât sunt mai valide, cu atât reflectă mai bine calitatea () pentru care au fost create. Cantitativ, validitatea poate fi exprimată prin corelații ale rezultatelor obținute cu ajutorul unui test sau tehnică cu alți indicatori, de exemplu, cu succesul realizării activității relevante. Valabilitatea poate fi justificată în moduri diferite, cel mai adesea în mod complex. Sunt utilizate și concepte suplimentare de validitate conceptuală, criterială, constructivă și de altă natură - cu propriile modalități de a-și stabili nivelul. Cerința validității este foarte importantă, iar multe plângeri cu privire la teste sau alte tehnici de psihodiagnostic sunt asociate cu îndoiala validității lor. De exemplu, validitatea unei măsuri de inteligență depinde de:

1 ) din definiția conceptului de inteligență, care reprezintă unul sau altul concept al acestui fenomen;

2 ) privind alcătuirea sarcinilor de testare elaborate conform acestui concept;

3 ) din criterii empirice.

Conceptele diferite necesită o compoziție diferită a sarcinilor, astfel încât problema validității conceptuale este importantă. Cu cât sarcinile corespund mai mult conceptului de inteligență dat de autor, cu atât putem vorbi cu mai multă încredere despre validitatea testului conceptual. Corelarea unui test cu un criteriu empiric indică validitatea sa posibilă în raport cu acel criteriu. Determinarea validității unui test necesită întotdeauna să se pună întrebări suplimentare: validitate pentru ce? cu ce scop? dupa ce criteriu? Deci, conceptul de validitate se referă nu numai la test, ci și la criteriul de evaluare a calității acestuia. Cu cât coeficientul de corelație dintre test și criteriu este mai mare, cu atât este mai mare validitatea. Dezvoltarea analizei factoriale a făcut posibilă crearea unor teste care sunt valabile în raport cu factorul identificat. Numai testele testate pentru validitate pot fi utilizate în orientarea profesională, selecția profesională și cercetarea științifică.

Dicționar al unui psiholog practic. - M.: AST, Harvest. S. Yu Golovin. 1998.

Valabilitate

Gradul în care avem încredere că un test, o măsurătoare sau un experiment îndeplinește de fapt funcția pentru care este destinat. Acest termen foarte general este folosit în diverse moduri în psihologie. În timpul experimentului putem evalua:

1. Valabilitate internă: efectul observat se datorează într-adevăr manipulării experimentale? În experimentele lui Milgram privind supunerea față de autoritate, concluziile trase nu puteau fi considerate valide dacă participanții nu credeau că primesc de fapt un șoc electric.

2. Valabilitate externă: Chiar dacă un experiment are succes, rezultatele sale pot să nu se aplice altor persoane sau în alte situații. Experimente în domeniu Psihologie sociala sunt adesea criticate pentru că se bazează pe studenții voluntari americani și folosesc metode de laborator în studiu (vezi și Valabilitate ecologică).

Când determinăm validitatea unui test sau măsurători, folosim unul dintre următoarele criterii:

1. Validitate facială: testul măsoară de fapt ceea ce este destinat să măsoare? De exemplu, un test de dezvoltare mentală poate arăta exact așa cum era de așteptat pentru teste de acest tip ( grad înalt validitate aparentă) sau să fie deghizat în altceva (validitate aparentă scăzută).

3. Valabilitate concomitentă (concurentă): validitatea testului poate fi verificată. comparându-l cu deja metode existente măsurători. De exemplu. noul test de inteligență poate fi comparat cu un alt test. a cărui validitate este deja cunoscută și dovedită. Dacă performanța participanților la un nou test se potrivește cu performanțele lor la alt test, atunci noul test are și valabilitate.

4. Validitate predictivă: poate fi folosit testul pentru a prezice sau calcula performanța pe un alt criteriu? Testele utilizate în scopuri de selecție trebuie să aibă o bună validitate predictivă.

5. Validitatea constructului: testul este folosit pentru a măsura în mod adecvat un construct teoretic – adică testul IQ măsoară efectiv IQ-ul? Dacă acesta este cazul, atunci testul ar trebui să aibă caracteristici care să permită participanților să-l efectueze în conformitate cu nivelul lor de dezvoltare intelectuală.

Psihologie. ȘI EU. Dicționar de referință / Transl. din engleza K. S. Tkacenko. - M.: PRESA CORECTĂ. Mike Cordwell. 2000.

Sinonime:

Vedeți ce este „validitatea” în alte dicționare:

valabilitate- reliability Dicţionar de sinonime ruse. validitate substantiv, număr de sinonime: 8 adecvare (18) ... Dicţionar de sinonime

Valabilitate- Validitate ♦ Validité Un sinonim pentru adevăr folosit în logică, mai precis, echivalentul său formal. O concluzie este considerată validă (adevărată) dacă reprezintă o trecere de la adevărat la adevărat (de la adevărul premiselor la adevărul concluziei)... Dicţionarul filozofic al lui Sponville

Valabilitate- de la fr. validă în statistică este legalitatea și fiabilitatea sursei informațiilor, fiabilitatea metodologiei de colectare și obținere a datelor, inclusiv pentru cercetarea economică. Dicţionar de termeni de afaceri. Akademik.ru. 2001... Dicţionar de termeni de afaceri

VALABILITATE- [Dicționar de cuvinte străine ale limbii ruse

VALABILITATE- (din latină validus strong, strong) engleză. valabilitate; limba germana Validitate/Gulltigkeit. Validitatea și adecvarea instrumentelor de cercetare (concepte operaționalizate, operații de măsurare și experimente). antinazi. Enciclopedie...... Enciclopedia Sociologiei

Valabilitate- Fiabilitatea informațiilor, absența erorilor în acestea din cauza inexactității metodologiei de colectare a datelor alese. Dicționar terminologic de termeni bancar și financiari. 2011… Dicţionar financiar

VALABILITATE- (din franceza valide legal, valid) în raport cu informațiile statistice inițiale utilizate în cercetarea economică: fiabilitatea informațiilor, absența erorilor în aceasta din cauza inexactității metodologiei de colectare a datelor alese. Reisberg...... Dicționar economic

valabilitate- și, f. validitate f. lat. validus. Valabilitate, legalitate, pondere, valabilitate; deţinere forță juridică. Komlev 1992. || Capacitatea de a forma un sistem de semne coerent. Bart Ce este critica? // B. 272. Calitatea originalului... ... Dicționar istoric al galicismelor limbii ruse

Valabilitate- (validitate în limba engleză) o măsură a măsurii în care metodologia și rezultatele cercetării corespund sarcinilor atribuite. În special, validitatea este considerată un concept fundamental în psihologia experimentală și psihodiagnostic. Ca în... ... Wikipedia

Valabilitate- calitatea unei metode de cercetare psihologică, exprimată în conformitatea acesteia cu ceea ce a fost inițial destinat să studieze și să evalueze. * * * (lat. validus puternic, sănătos) fiabilitate în ceea ce privește conformitatea cu adevărul, realitatea,... ... Dicţionar Enciclopedic de Psihologie şi Pedagogie

Cărți

Personalitatea unui politician. Teoria și metodologia portretului psihologic, Nikolai Mitrofanovich Rakityansky. Această publicație rezumă experiența națională și străină în construirea unui portret psihologic al personalității unui politician. Istoria fenomenului și conceptul de portret psihologic și...

Validitatea testului (din engleza valid - adecvat) este un criteriu de calitate a testului folosit pentru a determina gradul de fiabilitate al masurarii proprietatii mentale, calitatii, fenomenului pe care doresc sa il masoare folosind acest test.

Există mai multe tipuri de validitate a testului:

validitatea de construcție a testului,
validitatea de criteriu a testului,
validitatea conținutului testului,
validitatea predictivă a testului etc.

Valabilitatea celor mai bune teste, exprimate prin coeficienți de corelație (liniar, de rang, etc.) este 0,3-0,8. Din păcate, există cazuri când testele sunt aplicate fără a le testa. Ca urmare, se dovedește că sunt inutile sau chiar dăunătoare. Valabilitatea unui test este un indicator al gradului de eficacitate a acestuia. Se schimbă în mod natural în funcție de populația de oameni care sunt testați și de natura activităților lor viitoare. Același test poate fi foarte valabil pentru o situație, inutil pentru alta și dăunător pentru o a treia.

Testează validitatea constructului

un criteriu de calitate a testului utilizat la măsurarea oricărui fenomen mental complex care are o structură ierarhică, care din această cauză este imposibil de măsurat cu un singur act de testare. Astfel, psihodiagnosticarea inteligenței este imposibilă fără o definiție preliminară a conceptului de „inteligență” și a structurii sale. Gradul de corespondență a înțelegerii și definiției noastre preliminare a inteligenței cu posibilitatea reală a unui anumit test, gradul de corespondență a structurii inteligenței cu structura testului este t.c. Acesta are ca scop determinarea acurateței măsurării unor tipuri complexe, stabile de comportament, trăsături de personalitate și fenomene mentale.

Valabilitatea de criteriu a testului

un criteriu pentru calitatea unui test, cu ajutorul căruia putem judeca aspectul psihicului unui individ care ne interesează în prezent și viitor. Pentru a-l determina este necesar să se compare rezultatele testelor cu nivelul de dezvoltare al trăsăturii care se măsoară, calitatea personalității în practică. De exemplu, pentru un test de abilități tehnice, principalul criteriu de determinare a acestora va fi activitati tehnice specialiști specifici, evaluarea abilităților tehnice ale acestora cu ajutorul experților care cunosc bine subiectele de destul de mult timp sub aspectul care ne interesează. Evaluarea ar trebui să fie dată pe o scară ordinală, de intervale sau de raport. În cele mai bune teste din. conform criteriului, măsurat prin coeficientul de corelație, variază de la 0,3 la 0,8. Utilizarea testului este justificată dacă valabilitatea conform criteriului rămâne 0,2-0,25.

Valabilitatea conținutului testului

un criteriu de calitate a testului utilizat pentru a determina dacă acesta corespunde zonei fenomenelor mentale măsurate. V.t.k. arată cât de complet acoperă testul setul de parametri măsurați în studiu. Dacă, de exemplu, trebuie să utilizați un test pentru a verifica pregătirea matematică a unui candidat universitar, atunci testul propus ar trebui să includă sarcini matematice, a căror rezolvare necesită cunoașterea tuturor ramurilor de matematică studiate în liceu. Astfel, gradul în care structura acestei probe corespunde structurii programului de discipline matematice studiate la școală este validitatea de conținut a acestei probe. Desigur, testele cu o valabilitate diferită în conținut sunt destinate examinării persoanelor care au absolvit universități.

Valabilitatea predictivă a testului

criteriul de calitate al testului utilizat pentru a prezice natura evoluției parametrului măsurat în viitor. Una dintre cele mai neajunsuri semnificative a unor astfel de teste este că nu iau în considerare dezvoltarea neuniformă a parametrului măsurat în oameni diferiti in viitor. Acest tip de valabilitate este deosebit de valoros din punct de vedere practic.

Valabilitatea experimentului

un criteriu pentru calitatea unui experiment, gradul de acuratețe a acestuia, în funcție de care concluziile obținute pe parcursul derulării acestuia pot fi extinse la întreaga populație. V.e. vă permite să determinați cât de generale pot fi concluziile obținute prin studierea unui eșantion limitat în timp și volum. Există o distincție între validitatea internă și cea externă a unui experiment.

Valabilitatea externă a experimentului

un criteriu pentru calitatea unui experiment, în funcție de care concluzii despre o anumită tendință, modele de dezvoltare a unor fenomene mentale specifice, personalități, tipuri de activități etc. poate fi extins la alte fenomene etc. în acest domeniu sau în altul. În limbajul matematicii, aceasta poate fi formulată după cum urmează: în ce măsură tiparele unei anumite submulțimi sunt caracteristice întregii mulțimi. Pentru a determina limitele de aplicare a constatărilor experimentale, este necesar să se determine w.e.v.

Valabilitatea internă a experimentului

un criteriu pentru calitatea unui experiment utilizat pentru a determina gradul de fiabilitate a unei tendințe sau model identificate ca urmare a unui experiment care este caracteristic unei anumite unități dintr-o mulțime sau unui întreg subset de elemente ale populației generale. Să spunem, în timp ce studiau gradul de influență al luminii asupra eficienței activităților de producție ale țesătorilor, psihologii au descoperit o dependență statistică a eficienței muncii lor de frecvența modificărilor luminii. Care este principalul factor în creșterea eficienței activității: o schimbare a iluminatului, atenția experimentatorilor, comportamentul special al managerilor în timpul experimentului sau alți factori? În acest caz, psihologii au ajuns la concluzia: apariția tinerilor cercetători bărbați în atelierul în care lucrau femeile a fost motivul creșterii productivității muncii lor. Dar ipoteza despre creșterea productivității muncii de țesut în funcție de schimbările de iluminare ar fi putut fi acceptată. V.e.v. arată în ce măsură variabila independentă (productivitatea muncii) este legată de variabila dependentă (iluminat). Strict conduită științifică experiment psihologic implică determinarea validității acestuia.

Valabilitate– acesta este unul dintre criteriile de bază în psihodiagnostica testelor și metodelor, care determină calitatea acestora, apropiată de conceptul de fiabilitate. Este utilizat atunci când trebuie să aflați cât de bine măsoară o tehnică exact spre ce vizează în consecință, cu cât este mai bine afișată calitatea studiată, cu atât este mai mare valabilitatea acestei tehnici;

Problema validității se pune mai întâi în procesul de elaborare a materialului, apoi după aplicarea unui test sau a unei tehnici, dacă este necesar să se afle dacă gradul de exprimare a caracteristicii de personalitate identificate corespunde metodei de măsurare a acestei proprietăți.

Conceptul de valabilitate se exprimă prin corelarea rezultatelor obținute ca urmare a aplicării unui test sau tehnici cu alte caracteristici care sunt și ele studiate și poate fi argumentată și cuprinzător, folosind tehnici și criterii diferite. Se folosesc diferite tipuri de validitate: conceptuală, constructivă, criterială, de conţinut, cu metode specifice de stabilire a gradului de fiabilitate a acestora. Uneori criteriul de fiabilitate este cerinta obligatorie să verifice metodele de psihodiagnostic dacă acestea ridică îndoieli.

La cercetare psihologică avea valoare reală, trebuie să fie nu numai validă, ci și de încredere în același timp. Fiabilitatea permite experimentatorului să aibă încredere că valoarea studiată este foarte aproape de valoarea adevărată. Și un criteriu valid este important pentru că indică faptul că ceea ce este studiat este exact ceea ce intenționează experimentatorul. Este important de menționat că acest criteriu poate implica fiabilitate, dar fiabilitatea nu poate implica validitate. Valorile de încredere pot să nu fie valide, dar cele valide trebuie să fie de încredere, aceasta este întreaga esență a cercetării și testării de succes.

Validitatea este în psihologie

În psihologie, conceptul de validitate se referă la încrederea experimentatorului că a măsurat exact ceea ce a dorit folosind o anumită tehnică și arată gradul de coerență dintre rezultate și tehnica însăși în raport cu sarcinile stabilite. O măsurătoare validă este una care măsoară exact ceea ce a fost conceput pentru a măsura. De exemplu, o tehnică care vizează determinarea ar trebui să măsoare temperamentul, și nu altceva.

Validitatea în psihologia experimentală este un aspect foarte important. indicator important, care asigură fiabilitatea rezultatelor, iar uneori este cea mai problematică. Un experiment perfect trebuie să aibă o valabilitate impecabilă, adică trebuie să demonstreze că efectul experimental este cauzat de modificări ale variabilei independente și trebuie să fie complet în concordanță cu realitatea. Rezultatele obţinute pot fi generalizate fără restricţii. Dacă vorbim de gradul acestui criteriu, atunci se presupune că rezultatele vor corespunde obiectivelor.

Verificare valabilitate realizat în trei moduri.

Evaluarea validității conținutului se realizează pentru a afla nivelul de corespondență dintre metodologia utilizată și realitatea în care se exprimă în metodologie proprietatea studiată. Există și o astfel de componentă ca evidentă, numită și validitate facială, ea caracterizează gradul de conformitate a testului cu așteptările celor evaluați. În majoritatea metodologiilor, se consideră foarte important ca participantul la evaluare să vadă o legătură evidentă între conținutul procedurii de evaluare și realitatea obiectului de evaluare.

Evaluarea validității constructelor se realizează pentru a obține gradul de validitate pe care testul măsoară efectiv acele constructe care sunt specificate și valide științific.

Există două dimensiuni pentru a construi validitatea. Prima se numește validare convergentă, care verifică relația așteptată dintre rezultatele unei tehnici cu caracteristicile altor tehnici care măsoară proprietățile originale. Dacă sunt necesare mai multe metode pentru a măsura o caracteristică, atunci decizie rațională Ar fi necesar să se efectueze experimente cu cel puțin două metode, astfel încât la compararea rezultatelor, găsirea unei corelații pozitive ridicate, se poate pretinde un criteriu valid.

Validarea convergentă determină probabilitatea ca scorul unui test să varieze în funcție de așteptări. A doua abordare se numește validare discriminantă, ceea ce înseamnă că tehnica nu trebuie să măsoare nicio caracteristică cu care teoretic nu ar trebui să existe o corelație.

Verificare valabilitate, poate fi, de asemenea, bazată pe criterii ea, ghidată de metode statistice, determină gradul de conformitate a rezultatelor cu criterii externe predeterminate. Astfel de criterii pot fi: măsuri directe, metode independente de rezultate sau valoarea indicatorilor de performanță semnificativi din punct de vedere socio-organizațional. Validitatea de criteriu include, de asemenea, validitatea predictivă; Și dacă se dovedește că această prognoză se realizează în timp, atunci tehnica este valabilă predictiv.

Valabilitatea testului este

Un test este o sarcină standardizată, ca urmare a aplicării sale, se obțin date despre starea psihofiziologică a unei persoane și proprietățile sale personale, cunoștințele, abilitățile și abilitățile sale.

Valabilitatea și fiabilitatea testelor sunt doi indicatori care determină calitatea acestora.

Valabilitatea testului determină gradul de corespondență a calității, caracteristicii sau proprietății psihologice studiate cu testul prin care sunt determinate.

Valabilitatea unui test este un indicator al eficacității și aplicabilității sale la măsurarea caracteristicii cerute. Testele de cea mai înaltă calitate au o valabilitate de 80%. La validare, trebuie luat în considerare faptul că calitatea rezultatelor va depinde de numărul de subiecți și de caracteristicile acestora. Se pare că un test poate fi fie foarte fiabil, fie complet invalid.

Există mai multe abordări pentru a determina validitatea unui test.

Atunci când se măsoară un fenomen psihologic complex care are o structură ierarhică și nu poate fi studiat folosind un singur test, se folosește validitatea de construct. Ea determină acuratețea studiului fenomenelor psihologice complexe, structurate și trăsăturilor de personalitate măsurate prin testare.

Valabilitatea bazată pe criterii este criteriul de testare prin care se determină fenomenul psihologic studiat în în prezentși prognozarea caracteristicilor acestui fenomen în viitor. Pentru aceasta, rezultatele obținute în timpul testării sunt corelate cu gradul de dezvoltare a calității fiind măsurat în practică, evaluându-se abilități specifice într-o anumită activitate. Dacă validitatea testului are o valoare de cel puțin 0,2, atunci utilizarea unui astfel de test este justificată.

Valabilitatea predictivă– un criteriu prin care se poate prezice natura dezvoltării calității studiate în viitor. Acest criteriu de calitate a testului este foarte valoros când este privit din latura practica, dar pot exista dificultăți, deoarece este exclusă dezvoltarea neuniformă a acestei calități la diferite persoane.

Fiabilitatea testului este un criteriu de testare care măsoară nivelul de consistență al rezultatelor testelor în cadrul studiilor repetate. Se determină prin testare secundară după o anumită perioadă de timp și calculând coeficientul de corelație al rezultatelor obținute după prima și după a doua testare. De asemenea, este important să se țină seama de particularitățile procedurii de testare în sine și de structura socio-psihologică a eșantionului. Același test poate avea o fiabilitate diferită, în funcție de sexul, vârsta și statutul social al subiecților. Prin urmare, fiabilitatea poate avea uneori inexactități și erori care apar din procesul de cercetare în sine, astfel că se caută modalități de reducere a influenței anumitor factori asupra testării. Se poate afirma că testul este fiabil dacă este de 0,8-0,9.

Valabilitatea și fiabilitatea testelor sunt foarte importante deoarece definesc testul ca instrument de măsurare. Când fiabilitatea și validitatea sunt necunoscute, testul este considerat nepotrivit pentru utilizare.

Există, de asemenea, un context etic în măsurarea fiabilității și validității. Acest lucru este deosebit de important atunci când rezultatele testelor au implicații pentru deciziile de salvare a vieții oamenilor. Unii sunt angajați, alții sunt eliminați, unii studenți trec unități de învățământ, în timp ce alții trebuie să-și termine studiile mai întâi, unii primesc un diagnostic și tratament psihiatric, în timp ce alții sunt sănătoși - toate acestea sugerează că astfel de decizii sunt luate pe baza studiului unei evaluări a comportamentului sau a abilităților speciale. De exemplu, o persoană solicitant de loc de muncă, trebuie să susțină un test, iar punctajele sale sunt indicatori decisivi atunci când aplică pentru un loc de muncă, află că testul nu a fost suficient de valid și de fiabil, va fi foarte dezamăgit.

Valabilitatea metodologiei este

Valabilitatea unei tehnici determină corespondența a ceea ce este studiat prin această tehnică cu ceea ce anume se intenționează să studieze.

De exemplu, dacă o tehnică psihologică care se bazează pe auto-raport informat este atribuită să studieze o anumită calitate a personalității, o calitate care nu poate fi evaluată cu adevărat de persoana însuși, atunci o astfel de tehnică nu va fi valabilă.

În cele mai multe cazuri, răspunsurile pe care subiectul le dă întrebărilor despre prezența sau absența dezvoltării acestei calități la el pot exprima modul în care subiectul însuși se percepe pe sine sau cum și-ar dori să fie în ochii altor persoane.

Validitatea este, de asemenea, o cerință de bază pentru metodele psihologice de studiere a constructelor psihologice. Există o mulțime tipuri diferite acest criteriu și nu există încă o singură opinie cu privire la modul de denumire corectă a acestor tipuri și nu se știe căror tipuri specifice trebuie să corespundă tehnica. Dacă tehnica se dovedește a fi invalidă extern sau intern, nu se recomandă utilizarea acesteia. Există două abordări ale validării metodei.

Abordarea teoretică se dezvăluie prin a arăta cât de adevărat metodologia măsoară exact calitatea pe care cercetătorul a venit și este obligat să o măsoare. Acest lucru este dovedit prin compilarea cu indicatorii aferenti și cei în care conexiunile nu ar putea exista. Prin urmare, pentru a confirma un criteriu valid teoretic, este necesar să se determine gradul de legături cu o tehnică înrudită, adică un criteriu convergent și absența unei astfel de conexiuni cu tehnici care au o bază teoretică diferită (validitate discriminantă).

Evaluarea validității unei tehnici poate fi cantitativă sau calitativă. Abordarea pragmatică evaluează eficacitatea și semnificația practică a tehnicii, iar pentru implementarea acesteia se folosește un criteriu extern independent, ca indicator al apariției acestei calități în viața de zi cu zi. Un astfel de criteriu, de exemplu, poate fi performanța academică (pentru metode de realizare, teste de inteligență), evaluări subiective (pentru metode personale), abilități specifice, desen, modelare (pentru metode cu caracteristici speciale).

Pentru a demonstra validitatea criteriilor externe, se disting patru tipuri: criterii de performanță - acestea sunt criterii precum numărul de sarcini îndeplinite, timpul petrecut în pregătire; criteriile subiective se obțin împreună cu chestionare, interviuri sau chestionare; fiziologic – ritmul cardiac, tensiunea arterială, simptomele fizice; criterii aleatorii – utilizate atunci când scopul are relevanță sau influență caz concret sau circumstante.

La alegerea unei metodologii de cercetare, aceasta are teoretice și semnificație practică determinarea sferei de aplicare a caracteristicilor studiate ca o componentă importantă a validităţii. Informațiile conținute în numele tehnicii nu sunt aproape întotdeauna suficiente pentru a judeca domeniul de aplicare a acesteia. Acesta este doar numele tehnicii, dar există întotdeauna mult mai multe ascunse sub ea. Un bun exemplu ar fi tehnica corecturii. Aici, domeniul de aplicare al proprietăților studiate include concentrarea, stabilitatea și viteza psihomotorie a proceselor. Această tehnică oferă o evaluare a severității acestor calități la o persoană, se corelează bine cu valorile obținute din alte metode și are o bună validitate. În același timp, valorile obținute în urma testului de corecție sunt supuse unei influențe mai mari a altor factori, în privința cărora tehnica va fi nespecifică. Dacă utilizați un test de probă pentru a le măsura, validitatea va fi scăzută. Rezultă că prin determinarea domeniului de aplicare a metodologiei, un criteriu valid reflectă nivelul de validitate al rezultatelor cercetării. Cu un număr mic de factori însoțitori care influențează rezultatele, fiabilitatea estimărilor obținute în metodologie va fi mai mare. Fiabilitatea rezultatelor este de asemenea determinată folosind un set de proprietăți măsurate, importanța acestora în diagnosticarea activităților complexe și importanța afișării metodologiei subiectului de măsurare în material. De exemplu, pentru a îndeplini cerințele de validitate și fiabilitate, metodologia atribuită selecției profesionale trebuie să analizeze o gamă largă de indicatori diferiți care sunt cei mai importanți în obținerea succesului în profesie.

Tipuri de valabilitate

Un criteriu valabil poate fi de mai multe tipuri, în funcție de ce anume se urmărește.

Validitatea internă determină măsura în care o intervenție determinată experimental a provocat modificări într-un anumit experiment.

Valabilitatea internă este determinată de relațiile dintre variabile independente și dependente și trece prin proceduri specifice care determină fiabilitatea constatărilor dintr-un studiu dat. Se spune că există un criteriu intern atunci când se știe în mod sigur că există o relație cauză-efect între variabilele independente și dependente.

Valabilitatea studiului este determinată de influența factorilor situaționali necontrolați asupra fenomenului studiat dacă acesta este ridicat, atunci acest criteriu va fi scăzut; Valabilitatea internă ridicată a unui studiu este un semn distinctiv al cercetării de calitate.

Validitate externa rezumă constatările unei populații, situații și alte variabile independente. Capacitatea de a transfera rezultatele obținute într-un studiu în viața reală depinde de cât de mare și de bună este validitatea externă.

De foarte multe ori, validarea externă și cea internă se contrazic, deoarece dacă o valabilitate crește, atunci această valoare poate afecta performanța celeilalte. Cea mai bună opțiune este să alegeți modele experimentale care oferă două tipuri de acest criteriu. Acest lucru este deosebit de important în cazul cercetărilor în care generalizarea rezultatelor în anumite situații practice este importantă.

Valabilitatea conținutului este aplicabilă acelor teste în care o anumită activitate este pe deplin modelată, în primul rând sub aspectul legat de subiect. Rezultă că însuși conținutul metodologiei reflectă principalele aspecte ale constructului psihologic. Dacă această caracteristică are o structură complexă, atunci toate elementele incluse în ea trebuie să fie prezente în metodologia însăși. Un astfel de criteriu valid este determinat folosind un control sistematic asupra conținutului, trebuie să arate gradul de acoperire a întregului eșantion pentru parametrii măsurați. Pe baza acestui fapt, ar trebui efectuat un test empiric al metodologiei în conformitate cu ipotezele acesteia. Fiecare sarcină sau întrebare din zona alocată ar trebui să aibă șanse egale de a fi inclusă în sarcinile de testare.

Valabilitatea empirică determinată prin corelație statistică, adică se calculează corelația scorurilor la test și a indicatorilor parametru extern, ales ca criteriu de valabilitate.

Validitatea constructiei se referă la un construct teoretic ca unul separat și este inclus în căutarea factorilor care explică comportamentul uman atunci când se efectuează un test sau o tehnică.

Tipul predictiv de validitate este determinat de prezența unui criteriu extern foarte fiabil, deși informațiile despre acesta sunt colectate prin anumit timp după terminarea testului. Asa de criteriu extern poate fi capacitatea individului de a efectua un anumit tip de activitate pentru care a fost selectat pe baza rezultatelor măsurătorilor psihodiagnostice. Acuratețea prognozei în acest criteriu valabil este în direcția opusă cu timpul dat pentru prognoză. Și cu cât trece mai mult timp după studiu, cu atât mai mulți factori vor fi luați în considerare pentru a evalua valoarea predictivă a testului. Deși este aproape imposibil să luați în considerare absolut toți factorii disponibili.

Valabilitatea retrospectivă determinat de un criteriu care reflectă evenimente sau starea unei proprietăți din trecut. Poate fi folosit pentru a obține cunoștințe despre aspectele predictive ale tehnicii. Foarte des, în astfel de teste, evaluările dezvoltării abilităților sunt comparate în valoarea lor trecută și în momentul de față se calculează cât de eficiente au devenit rezultatele.

Valabilitate ecologică arată că un organism, datorită unor caracteristici ereditare, determinate genetic sau dobândite, este pregătit să demonstreze diverse forme de comportament în diverse contexte sau în diferite habitate. Acțiunile unui organism pot avea succes într-un timp și loc, dar nu atât de reușite sau deloc într-un alt timp și loc.

Valabilitatea ecologică este confirmată dacă rezultatele studiului pot fi confirmate sau aplicate corespunzător în cercetarea de teren. Problema cercetării de laborator este transferabilitatea adecvată a rezultatelor obţinute la condiţii viata reala, asupra activităților zilnice ale individului, care durează în mod natural. Dar nici aceasta nu este confirmarea finală a rezultatelor ca fiind valabile din punct de vedere ecologic, deoarece presupune și generalizare la alte condiții și circumstanțe. Adesea, studiile sunt învinuite pentru validitatea ecologică slabă, dar întregul motiv este incapacitatea de a replica studiul în viața reală.

Toate dicţionarele Dicţionar auto Dicţionar arhitectural Dicţionar astronomic Enciclopedie biblică Dicţionar de afaceri Dicţionar biografic Dicţionar mare de contabilitate Dicţionar de jeans Dicţionar culinar Dictionar medical Dicţionar marin Dicţionar tipărit Dicţionar politic Dicţionar psihologic Dicţionar religios Dicţionar sexologic Dicţionar de jargonul hoţilor Dicţionar de nume geografice Dicţionar Dahl Dicţionar Efremova Dicţionar de nume Dicţionar de cuvinte străine Dicţionar de jargon informatic Dicţionar de staţiuni Dicţionar de plante medicinale Dicţionar de logică Dicţionar de măsuri Dicţionar al modei Dicţionar al argoului tineretului Dicţionar al popoarelor Dicţionar al numismatului Dicţionar al lui Ojegov Dicţionar al artei Dicţionar al designului peisajului Dicţionar al mitologiei Dicţionar al numelor de familie ruse Dicţionar al simbolurilor Dicţionar al sinonimelor Dicţionar al unităţilor frazeologice Dicţionar al epitetelor Dicţionar al construcţiilor Dicţionar explicativ al lui Uşakov Dicţionar financiar Enciclopedic dicţionar Enciclopedia lui Collier Dicţionar etimologic Vasmer Dicţionar etnografic

Ce este Validitatea? Semnificația și interpretarea cuvântului validnost, definiția termenului

1) Valabilitate- (din latină validus - puternic, puternic) - engleză. valabilitate; limba germana Validitate/Gulltigkeit. Validitatea și adecvarea instrumentelor de cercetare (concepte operaționalizate, operații de măsurare și experimente).

2) Valabilitate- (din latină validus - puternic, puternic) - validitatea și adecvarea instrumentelor de cercetare (concepte operaționalizate, operații de măsurare și experimente). V. logic (V. intern) - gradul de interconectare și deductibilitate reciprocă a variabilelor și indicatorilor. V. empiric (V. extern) - gradul de corespondență al variabilelor și indicatorilor cu datele empirice.

3) Valabilitate- validitatea și adecvarea scopului instrumentelor și metodelor de cercetare, conceptelor și experimentelor.

4) Valabilitate- - principalul indicator al calității măsurării în cercetarea sociologică, reflectând gradul de corespondență a datelor de măsurare cu obiectul măsurării.

5) Valabilitate- - corespondenţa dintre scopurile şi mijloacele de măsurare sociologică; Doar măsurătorile fără scop sunt pe deplin valabile.

6) Valabilitate- - o măsură a adecvării metodelor utilizate în sociologia aplicată pentru rezolvarea anumitor probleme de cercetare, a gradului de corespondență a variabilelor și indicatorilor cu datele empirice, care permite obținerea unor rezultate fiabile, reprezentative și de încredere ale cercetării sociologice, precum și evitarea erorilor sistematice.

7) Valabilitate- este principala caracteristică a calității măsurării în sociologie, una dintre componentele fiabilității informațiilor sociologice. Se face o distincție între teoretic (conceptual) și empiric (validitate bazată pe criterii).

8) Valabilitate- (fiabilitatea) indică gradul de corectitudine, veridicitate a datelor prezentate, menite să confirme ipoteza.

9) Valabilitate- - 1. Un indicator al calității metodei, capacitatea acesteia de a produce rezultate care să reflecte în mod adecvat fenomenul studiat, i.e. exact rezultatele pentru care este destinat (metoda V.). 2. O măsură a corespondenței unei teorii cu datele empirice, capacitatea de a face predicții rezonabil de precise bazate pe teorie (teoria V). 3. O măsură a conformității rezultatelor cu realitatea studiată, sau mai precis, cu ideile despre realitate (V. rezultate). În acest articol, V. este discutat în primul sens. În știința pozitivistă, se face o distincție între măsurare, proceduri experimentale interne și externe și inferență statistică. B. proceduri de măsurare Măsurarea se referă la procesul de legătură a unui concept teoretic cu una sau mai multe variabile latente, iar acestea din urmă cu variabile observate. În teoria clasică, rezultatul măsurării include două componente necorelate: adevărată și eronată. Se fac ipoteze cu privire la erorile de măsurare, sub care comportamentul erorilor devine cunoscut. B. a unei proceduri de măsurare este o măsură a corespondenței sale cu constructul care se măsoară. Cel mai adesea se evaluează V. criterii (numite adesea empiric), constructiv, convergent și discriminant. metode auxiliare Unitățile lui V. folosesc o trecere în revistă a literaturii pe această temă, evaluări ale experților . Criteriul de criteriu al unei proceduri de măsurare se apreciază prin apropierea legăturii (corelația) statistică dintre rezultatele măsurate și criteriul extern. Astfel, criteriul V. al scalei de conducere înseamnă că indicatorul obţinut se corelează cu un indicator obţinut independent, de exemplu, date sociometrice. O indicare a unui criteriu de criteriu implică nu numai un mesaj despre coeficientul de corelație dintre indicatorii de testare și un indicator extern, ci și despre toate circumstanțele studiului: cum și în ce situație a fost măsurat criteriul, pe ce eșantion a fost studiat studiul. efectuate etc. Criteriile pot fi actuale (măsurate simultan folosind o procedură validată) și prognostice. V. predictiv este foarte de dorit pentru metodele de măsurare orientate practic. Dezavantajele abordării sunt dificultățile în selectarea unui criteriu și riscul de a măsura un criteriu invalid, ceea ce reduce semnificativ coeficientul de corelație rezultat. Atât comportamentul evaluat, cât și criteriul se pot schimba în timp, iar eșantioanele pot fi părtinitoare. Dacă cercetătorul ar găsi un criteriu perfect, crearea unei proceduri de măsurare ar deveni redundantă. În acest sens, paradoxul formulat de J. Kelly este de înțeles: valoarea unei metode este capacitatea ei de a furniza informații deja cunoscute. Dependența testului criteriu de proprietățile criteriului și imposibilitatea de a găsi un indicator obiectiv satisfăcător în multe domenii de cunoaștere reduc semnificativ valoarea testului criteriu ca indicator al calității procedurii de măsurare. V. constructivă se stabilește prin relația statistică dintre indicatorii acestei proceduri și alte metode care măsoară un construct înrudit. Ipotezele despre relațiile statistice sunt formulate înainte de a fi testate, pe baza unei teorii de fond. Validarea constructelor este un proces îndelungat și nicio corelație empirică nu poate garanta validitatea măsurării. Teoretic, se postulează o relație între constructe, se evaluează corelația dintre indicatorii acestor constructe, iar pe baza datelor obținute se revizuiesc relațiile așteptate teoretic dintre constructe sau dintre constructe și indicatori. Se selectează un nou construct (sau un nou indicator, sau o nouă teorie despre relația dintre constructe) și procesul se repetă din nou. Ambele constructe se pot dovedi a fi nelegate. Acest lucru se întâmplă atunci când metodele de măsurare care apar sub același nume sunt construite pe baze teoretice diferite. Alte probleme sunt asociate cu situațiile în care indicatorul măsurat utilizat pentru validarea procedurii nu este măsurat în mod valid; același indicator măsoară simultan diferite constructe; erorile de măsurare sunt corelate. Dacă cercetătorul este sigur că schema structurala corect (nu există relații între indicatori și constructe străine, iar corelația dintre erorile de măsurare este zero), el/ea poate găsi corelația dintre constructe, corectată pentru nefiabilitatea indicatorilor. Pentru a evalua o procedură constructivă de măsurare a V., este adesea utilizată analiza factorială a indicatorilor. Acest nume se referă la o gamă largă de tehnici de reducere a dimensionalității datelor în care un număr mic de variabile latente (factori) sunt extrase din multe variabile măsurate. Numărul și interpretabilitatea teoretică a factorilor sunt interpretate ca o măsură a V. a metodei de măsurare, iar încărcările factoriale ale variabilelor măsurate sunt interpretate ca o măsură a V. a indicatorilor. O încărcare a factorilor este o măsură standardizată a relației structurale dintre un factor comun (variabilă latentă) și un indicator. Este adesea definită ca corelația dintre un factor și o variabilă. Metodele larg cunoscute de analiză factorială (de exemplu, analiza axelor principale) este o procedură exploratorie, i.e. nu permite testarea ipotezelor statistice, iar rezultatul analizei este determinat semnificativ solutii tehnice, care este acceptat de cercetător. În acest sens, capacitățile metodei ca mijloc de validare sunt limitate. Pentru a reduce caracterul arbitrar al analizei factorilor, se utilizează validarea încrucișată: eșantionul este împărțit aleatoriu în jumătate, factorii sunt extrași pe o jumătate a eșantionului, iar justificarea și stabilitatea soluției factorilor sunt verificate pe cealaltă jumătate. Conceptele de V. convergent și discriminant au fost introduse de D. Campbell și D. Fiske ca doi indicatori interrelaționați ai fiabilității unei metode. V. convergent necesită „convergența” (corelație înaltă) a constructelor înrudite, V. discriminant necesită absența corelațiilor între măsurătorile constructelor neînrudite. Acest concept este implementat mai strict într-o abordare cunoscută ca abordarea „multe trăsături, multe metode” sau MTMM (multe trăsături, multe metode). Esența sa este că mai multe proprietăți sunt măsurate prin mai multe metode. Între indicatorii aceleiași proprietăți măsurați folosind metode diferite, ar trebui să existe corelații mari și corelații scăzute între indicatorii diferitelor proprietăți măsurate folosind aceeași metodă. A treia condiție este ca primul set de coeficienți de corelație să îl depășească pe al doilea. Există, de asemenea, metode statistice mai riguroase pentru analiza matricei de corelație a MCMM. ÎN anul trecut Ecuațiile structurale au câștigat popularitate, în special analiza factorială de confirmare, care, în conformitate cu un model de fond, descompune covarianțele de măsurare în componente asociate cu influența metodelor, proprietăților și erorilor. Coeficienții structurali rezultați sunt interpretați ca indicatori ai V. V. ai metodei experimentale Gama de concepte asociate cu evaluarea experimentului V. (și a rezultatelor experimentale) a fost dezvoltată de metodologii postpozitiviști în anii 1960 (D. Campbell, T. Cook,). J. Stanley etc.). În tradiția epistemologică care datează de la J.S Mill și care leagă cauzalitatea cu manipularea, un adevărat experiment cu atribuirea aleatorie a subiecților la condiții este văzut ca singurul mijloc de a testa în mod convingător ipotezele cauzale. Din acest punct de vedere, afirmațiile cauzale din științele neexperimentale (sociologie) sunt ilegitime. Precedenta temporala a cauzei presupuse (variabila independenta) a efectului (variabila dependenta) ca una dintre conditiile unei relatii cauzale intr-un experiment este asigurata prin manipularea si masurarea consecintelor acestuia. O altă cerință pentru inferența cauzală care este mai dificil de satisfăcut este absența unor explicații alternative plauzibile. V. intern este înțeles ca fiind încrederea că variabila independentă X este cea care servește ca principală cauză a variabilității sistematice a valorilor variabilei dependente Y, adică. nu există alte variabile care să medieze relația dintre X și Y. Nu suntem în măsură să garantăm validitatea experimentului, dar ținând cont de caracteristicile procedeului de cercetare utilizat, putem identifica și elimina principalele cauze ale invalidității. Campbell și Stanley au propus o clasificare a motivelor declinului intern B. Istoria (fondul) este evenimentele care au avut loc între X și Y și ar putea afecta covarianța acestora. Schimbările naturale sunt modificări ale stării interne a subiecților care nu sunt asociate cu influența lui X, cum ar fi oboseala, creșterea, învățarea. Efectul sculei este asociat cu modificări nedorite ale procedurilor de măsurare ( avarii tehnice, oboseala observatorului). Efect regresie statistică (alunecare spre medie) apare atunci când grupurile experimentale și/sau de control sunt selectate pe baza valorilor extreme ale indicatorilor relevanți; din motive statistice, până la momentul celei de-a doua măsurători valorile maxime ale indicatorilor vor scădea, iar valorile minime vor crește. Selecția grupului ca cauză a invalidității este asociată cu selecția non-aleatorie (neechivalentă) a subiecților sau a altor unități de cercetare. Uzura („mortalitatea experimentală”) se referă la pierderea neuniformă și non-aleatorie a participanților la studiu. Interacțiunea selecției cu alți factori descrie o situație în care subiecții selectați nealeatoriu au antecedente personale diferite, tendință la oboseală, abandonuri etc. Selecția internă este evaluată calitativ prin gradul de abatere a procedurii de cercetare de la un caz ideal. Acest lucru se aplică și proiectelor de cercetare neexperimentală, în care noi amenințări sunt adăugate la lista de motive pentru scăderea validității. V. externă caracterizează gradul de generalizare a rezultatelor obţinute la alte populaţii şi contexte. Replicarea cu succes a studiului este o condiție importantă pentru evaluarea validității teoriilor și ajută la clarificarea gamei de adecvare a acestora din urmă. Una dintre strategiile de realizare a V. externă este şi identificarea şi eliminarea motivelor responsabile de apariţia aleatorie a rezultatului. Acesta este, în special, efectul reactiv (influența procedurii inițiale de măsurare asupra comportamentului subiecților) și interferența reciprocă a influențelor experimentale. Alte strategii se bazează pe utilizarea unui design experimental randomizat cu o singură măsurătoare post-studiu (care elimină efectul reactiv); reducerea riscului de influență a experimentatorului (de exemplu, reducerea la minimum a contactului dintre experimentator și subiect, creșterea numărului de cercetători sau o metodă dublu-orb, atunci când cercetătorul nu știe care dintre subiecți este expus la ce influențe până la final a experimentului); mărirea V. ecologică (realismului) studiului. Un rol metodologic important în susținerea cercetării științifice îl joacă reproducerea cu expansiune, atunci când fiecare replicare ulterioară a unui experiment implică modificări minore procedurale. V. inferență statistică V. inferență statistică înseamnă îndeplinirea unui set de condiții care reduc probabilitatea unei decizii statistice incorecte cu privire la ipoteza nulă (despre egalitatea unui parametru cu o anumită valoare sau corespondența unui model statistic cu datele) obţinut) sau amploarea efectului. Principala metodă de luare a deciziilor statistice în ultimele decenii a fost testarea semnificației statistice, i.e. despre egalitatea unui parametru cu o anumită valoare. Pentru aceasta se folosesc criteriile z, t, F, x2 etc. Se compară valoarea obţinută empiric a criteriului cu cea critică, iar pe baza acestei comparaţii se respinge sau nu ipoteza nulă. Astfel, decizia este de natură binară (da sau nu). În acest proces, se poate face una dintre cele trei erori: respingerea incorectă a unei ipoteze nule adevărate (eroare de tip I, alfa), acceptarea incorectă a unei ipoteze alternative adevărate (eroarea de tip II, beta) și formularea incorect de ipoteze statistice, de ex. Este incorect să traducem întrebarea de cercetare în limbaj statistic. Amenințările la adresa V. inferența statistică sunt numeroase și de natură diferită. Utilizarea indicatorilor invalidi (secțiunea acestui articol Validitatea procedurilor de măsurare) nu face posibilă interpretarea cu încredere a rezultatelor obținute. Utilizarea unor variabile măsurate nesigur conduce la o subestimare semnificativă a statisticilor obținute. O clasă mare de amenințări la adresa V. inferența statistică este asociată cu formularea incorectă a modelului. În special, cel mai faimos modele liniare sunt selectate atunci când ipotezele lor subiacente sunt încălcate: relația dintre variabile este neliniară, sunt prezente valori extreme, varianțele variabilei dependente pentru diferite niveluri ale variabilei independente sunt inegale, variabilele sunt măsurate mai grosier decât este cerut de model , valorile lipsă ale variabilelor nu sunt distribuite aleatoriu. Pachetele standard de analiză statistică oferă metode de diagnosticare a încălcărilor ipotezelor modelului. Erorile conceptuale mai complexe sunt făcute din cauza desemnării incorecte a variabilelor ca independente sau covariabile, alegerii incorecte a modelelor pentru măsuri dependente (repetate) sau independente, efecte fixe sau aleatorii. Când comparăm mai multe medii sau evaluează semnificația mai multor corelații, cercetătorii nu iau întotdeauna în considerare inflația erorii de tip I: de exemplu, pentru variabile j obținem corelații k = j(j - 1)/2, iar probabilitatea de obținere aleatorie a cel puțin un coeficient de corelație semnificativ, alphatot , este egal cu 1 - (1 - alfa)k. Utilizarea prea multor variabile cu un număr mic de observații (respondenți) creează „suprafitting” a modelului, când modelul descrie perfect datele eșantionului, dar este inadecvat pentru a descrie populația. Mulți greșeli simple inferența statistică se datorează combinației bizare și mecanice a două abordări diferite la o soluție statistică - Fisher și Neyman-Pearson. Ultima abordare subliniază importanța puterii de testare pentru evaluarea semnificației. Astfel, rezultatul se poate dovedi a fi nesemnificativ statistic din motive legate de puterea insuficientă a metodei: efecte experimentale slabe, un eșantion mic sau eterogen, măsurarea nesigură a variabilelor, o valoare excesiv de mică a erorii de prim tip. Semnificația statistică este probabilitatea ca un rezultat să se datoreze întâmplării într-un eșantion de o dimensiune dată, dar nu spune nimic despre dimensiunea efectului. Orientările moderne recomandă raportarea în publicații nu numai a indicatorului de semnificație (p), ci și a valorilor efectului (indicatorii tipici sunt r-ul lui Pearson, t-ul lui Student, d-ul lui Cohen, g-ul lui Higges, nu2 pentru analiza varianței etc.). Alte alternative la deciziile binare cu privire la semnificația statistică sunt intervalele de încredere, statisticile bayesiene și, mai general, replicarea augmentată și meta-analiză. V. în cercetarea calitativă V. în cercetarea calitativă nu poate fi evaluată prin metodele clasice descrise mai sus. O serie de autori arată primitivitatea abordărilor existente de evaluare a V. și a „criteriologiei” în general (T. Schwandt, J. Smith). În același timp, respingerea ideii de fiabilitate/autenticitate, spre deosebire de obiectivitatea discreditată, pare prea radicală chiar și pentru cercetătorii postmoderni. Prin urmare, alți autori (E. Guba, I. Lincoln, S. Kvale, S. Mishler) încearcă să reformuleze criteriile tradiționale de validitate, făcându-le mai puțin pozitiviști. Sunt discutate noi proceduri de stabilire a fiabilității: validarea comunicativă (participarea subiecților la discuția rezultatelor; implicarea colegilor în discuție), validarea procedurală (acuratețea, minuțiozitatea și completitudinea notelor de teren sau a datelor obținute; descrierea completă, echilibrată și transparentă a rezultatelor, deschis la alte interpretări; părere de la colegi; reverificarea concluziilor asupra altor fragmente din materialul obţinut) etc. Printre alte abordări de justificare a fiabilității rezultatelor, trebuie menționată stabilirea gradului de plauzibilitate ca evaluare a cunoștințelor dobândite din perspectiva cunoștințelor existente; încrederea (credibilitatea) ca evaluare și înțelegere colectivă a rezultatelor, ținând cont de natura fenomenului și de circumstanțele observării acestuia; înrădăcinată în date, încorporată în contextul programului de cercetare (fiabilitatea), care se bazează pe studiul și evaluarea atentă a aspectelor procedurale; sensibilitatea ca abilitatea cercetătorului de a vedea problema socialași contribuie la rezolvarea acesteia; Autenticitatea ontologică și educațională - capacitatea de a crește conștiința participanților la cercetare (în primul caz) și a mediului lor (în al doilea); autenticitatea catalitică ca influență asupra programe sociale, contribuind la îmbunătățirea calității vieții populației studiate. Autorii postmodernişti discută despre concepte şi principii fundamental noi de fundamentare a cunoaşterii: validarea ironică (J. Baudrillard), neopragmatică (J.-F. Lyotard), rizomatică (J. Derrida). N. Denzin a fundamentat metoda triangulației ca o alternativă radicală la abordările tradiționale de validare. Triangularea este utilizarea combinată și îmbogățită reciproc a diferitelor metode, metodologii, date, teorii și/sau cercetători. Multiplicitatea abordărilor și tehnicilor este concepută pentru a slăbi restricțiile epistemologice, a depăși granițele stabilite și a dezvălui noi aspecte ale fenomenului. De menționat că ideea de triangulare [a adevărului] a fost generată în post-pozitivism (D. Campbell), unde a fost înțeleasă ca o anumită procedură, un set de trucuri utile: pe lângă intervievarea oamenilor „obișnuiți”. , intervievați experți; împărțiți aleatoriu eșantionul de subiecți în jumătate și analizați datele separat; excludeți o variabilă din analiză și vedeți cum se schimbă modelul; validați constructul folosind abordarea „multe trăsături - multe metode” etc. Pentru a evita asocierile nedorite cu pozitivismul, etnograful postmodern L. Richardson, într-un spirit radical, abandonează ideea de triangulație și oferă o altă metaforă atractivă - un cristal, nu un triunghi, cristalizare, nu triunghiulare. Un cristal creează, refractează și distorsionează simultan, are mai multe fațete și niciuna dintre fațetele sale nu este mai fiabilă decât oricare alta. Ca și cunoașterea, un cristal crește și se descompune. Abordarea metaforică a problemei fundamentarii cunoștințelor și aprecierii calității acesteia nu este întâmplătoare. Este conceput pentru a distruge abordările bazate pe criterii și ideile despre standarde. Cercetarea socială are valoare numai atunci când oferă oportunități egale de a vorbi cu reprezentanții diferitelor grupuri, creează versiuni la fel de probabile și suprimă interpretările dominante, „corecte”. S.V. Sivukha

10) Valabilitate- (validitate) - gradul în care o măsurătoare, un indicator sau o metodă de colectare a datelor are proprietatea de a fi cât mai corect sau adevărat pe cât poate fi estimat. De exemplu, dacă o măsură psihologică, cum ar fi un test de inteligență, este considerată validă, atunci aceasta înseamnă că este adecvată pentru măsurarea a ceea ce ar trebui să măsoare. Când se spune că anchetele sociale au adus date valide, se crede că acestea sunt o reflectare fidelă a fenomenului studiat (de exemplu, proiecția comportamentului electoral al populației studiate). Adică metoda de revizuire are valabilitate. mier. Credibilitate. În practică, în sociologie și în științele sociale în general, relația dintre indicatori și măsuri, pe de o parte, și conceptele acceptate care stau la baza acestora, pe de altă parte, este adesea contestată (vezi Statistici oficiale; Măsurarea prin decret).

Valabilitate

(din latină validus - puternic, puternic) - engleză. valabilitate; limba germana Validitate/Gulltigkeit. Validitatea și adecvarea instrumentelor de cercetare (concepte operaționalizate, operații de măsurare și experimente).

(din latină validus - puternic, puternic) - validitatea și adecvarea instrumentelor de cercetare (concepte operaționalizate, operații de măsurare și experimente). V. logic (V. intern) - gradul de interconectare și deductibilitate reciprocă a variabilelor și indicatorilor. V. empiric (V. extern) - gradul de corespondență al variabilelor și indicatorilor cu datele empirice.

validitatea și adecvarea scopului instrumentelor și metodelor de cercetare, conceptelor și experimentelor.

Principalul indicator al calității măsurării în cercetarea sociologică, reflectând gradul de corespondență a datelor de măsurare cu obiectul măsurării.

Corespondența între scopurile și mijloacele de măsurare sociologică; Doar măsurătorile fără scop sunt pe deplin valabile.

O măsură a adecvării metodelor utilizate în sociologia aplicată pentru rezolvarea anumitor probleme de cercetare, a gradului de corespondență a variabilelor și indicatorilor cu datele empirice, care permite obținerea unor rezultate fiabile, reprezentative și de încredere ale cercetării sociologice, precum și evitarea erorilor sistematice.

– principala caracteristică a calității măsurării în sociologie, una dintre componentele fiabilității informațiilor sociologice. Se face o distincție între teoretic (conceptual) și empiric (validitate bazată pe criterii).

(fiabilitatea) indică gradul de corectitudine și adevăr al datelor prezentate, menite să confirme ipoteza.

1. Un indicator al calității metodei, capacitatea acesteia de a produce rezultate care să reflecte în mod adecvat fenomenul studiat, i.e. exact rezultatele pentru care este destinat (metoda V.). 2. O măsură a corespondenței unei teorii cu datele empirice, capacitatea de a face predicții rezonabil de precise bazate pe teorie (teoria V). 3. O măsură a conformității rezultatelor cu realitatea studiată, sau mai precis, cu ideile despre realitate (V. rezultate). În acest articol, V. este discutat în primul sens. În știința pozitivistă, se face o distincție între măsurare, proceduri experimentale interne și externe și inferență statistică. B. proceduri de măsurare Măsurarea se referă la procesul de legătură a unui concept teoretic cu una sau mai multe variabile latente, iar acestea din urmă cu variabile observate. În teoria clasică, rezultatul măsurării include două componente necorelate: adevărată și eronată. Se fac ipoteze cu privire la erorile de măsurare, sub care comportamentul erorilor devine cunoscut. B. a unei proceduri de măsurare este o măsură a corespondenței sale cu constructul care se măsoară. Mai des decât altele, se evaluează V. criteriu (deseori numit empiric), constructiv, convergent și discriminant. Ca metode auxiliare pentru stabilirea V., sunt utilizate rezumarea literaturii de specialitate și evaluările experților. Criteriul de criteriu al unei proceduri de măsurare se apreciază prin apropierea legăturii (corelația) statistică dintre rezultatele măsurate și criteriul extern. Astfel, criteriul V. al scalei de conducere înseamnă că indicatorul obţinut se corelează cu un indicator obţinut independent, de exemplu, date sociometrice. O indicare a unui criteriu de criteriu implică nu numai un mesaj despre coeficientul de corelație dintre indicatorii de testare și un indicator extern, ci și despre toate circumstanțele studiului: cum și în ce situație a fost măsurat criteriul, pe ce eșantion a fost studiat studiul. efectuate etc. Criteriile pot fi actuale (măsurate simultan folosind o procedură validată) și prognostice. V. predictiv este foarte de dorit pentru metodele de măsurare orientate practic. Dezavantajele abordării sunt dificultățile în selectarea unui criteriu și riscul de a măsura un criteriu invalid, ceea ce reduce semnificativ coeficientul de corelație rezultat. Atât comportamentul evaluat, cât și criteriul se pot schimba în timp, iar eșantioanele pot fi părtinitoare. Dacă cercetătorul ar găsi un criteriu perfect, crearea unei proceduri de măsurare ar deveni redundantă. În acest sens, paradoxul formulat de J. Kelly este de înțeles: valoarea unei metode este capacitatea ei de a furniza informații deja cunoscute. Dependența testului criteriu de proprietățile criteriului și imposibilitatea de a găsi un indicator obiectiv satisfăcător în multe domenii de cunoaștere reduc semnificativ valoarea testului criteriu ca indicator al calității procedurii de măsurare. V. constructivă se stabilește prin relația statistică dintre indicatorii acestei proceduri și alte metode care măsoară un construct înrudit. Ipotezele despre relațiile statistice sunt formulate înainte de a fi testate, pe baza unei teorii de fond. Validarea constructelor este un proces îndelungat și nicio corelație empirică nu poate garanta validitatea măsurării. Teoretic, se postulează o relație între constructe, se evaluează corelația dintre indicatorii acestor constructe, iar pe baza datelor obținute se revizuiesc relațiile așteptate teoretic dintre constructe sau dintre constructe și indicatori. Se selectează un nou construct (sau un nou indicator, sau o nouă teorie despre relația dintre constructe) și procesul se repetă din nou. Ambele constructe se pot dovedi a fi nelegate. Acest lucru se întâmplă atunci când metodele de măsurare care apar sub același nume sunt construite pe baze teoretice diferite. Alte probleme sunt asociate cu situațiile în care indicatorul măsurat utilizat pentru validarea procedurii nu este măsurat în mod valid; același indicator măsoară simultan diferite constructe; erorile de măsurare sunt corelate. Dacă cercetătorul este încrezător că proiectarea structurală este corectă (nu există relații între indicatori și constructele străine, iar corelația dintre erorile de măsurare este zero), el/ea poate găsi corelații între constructe, corectate pentru nefiabilitatea indicatorilor. . Pentru a evalua o procedură constructivă de măsurare a V., este adesea utilizată analiza factorială a indicatorilor. Acest nume se referă la o gamă largă de tehnici de reducere a dimensionalității datelor în care un număr mic de variabile latente (factori) sunt extrase din multe variabile măsurate. Numărul și interpretabilitatea teoretică a factorilor sunt interpretate ca o măsură a V. a metodei de măsurare, iar încărcările factoriale ale variabilelor măsurate sunt interpretate ca o măsură a V. a indicatorilor. O încărcare a factorilor este o măsură standardizată a relației structurale dintre un factor comun (variabilă latentă) și un indicator. Este adesea definită ca corelația dintre un factor și o variabilă. Metodele larg cunoscute de analiză factorială (de exemplu, analiza axelor principale) este o procedură exploratorie, i.e. nu permite testarea ipotezelor statistice, iar rezultatul analizei este determinat semnificativ de deciziile tehnice luate de cercetător. În acest sens, capacitățile metodei ca mijloc de validare sunt limitate. Pentru a reduce caracterul arbitrar al analizei factorilor, se utilizează validarea încrucișată: eșantionul este împărțit aleatoriu în jumătate, factorii sunt extrași pe o jumătate a eșantionului, iar justificarea și stabilitatea soluției factorilor sunt verificate pe cealaltă jumătate. Conceptele de V. convergent și discriminant au fost introduse de D. Campbell și D. Fiske ca doi indicatori interrelaționați ai fiabilității unei metode. V. convergent necesită „convergența” (corelație înaltă) a constructelor înrudite, V. discriminant necesită absența corelațiilor între măsurătorile constructelor neînrudite. Acest concept este implementat mai strict într-o abordare cunoscută ca abordarea „multe trăsături, multe metode” sau MTMM (multe trăsături, multe metode). Esența sa este că mai multe proprietăți sunt măsurate prin mai multe metode. Ar trebui să existe corelații mari între indicatorii aceleiași proprietăți măsurați folosind metode diferite și corelații scăzute între indicatorii diferitelor proprietăți măsurați folosind aceeași metodă. A treia condiție este ca primul set de coeficienți de corelație să îl depășească pe al doilea. Există, de asemenea, metode statistice mai riguroase pentru analiza matricei de corelație a MCMM. Ecuațiile structurale au câștigat popularitate în ultimii ani, în special analiza factorilor de confirmare, care descompune covarianțele de măsurare în componente asociate cu efectele metodei, proprietăților și erorii conform unui model de fond. Coeficienții structurali rezultați sunt interpretați ca indicatori ai V. V. ai metodei experimentale Gama de concepte asociate cu evaluarea experimentului V. (și a rezultatelor experimentale) a fost dezvoltată de metodologii postpozitiviști în anii 1960 (D. Campbell, T. Cook,). J. Stanley etc.). În tradiția epistemologică care datează de la J.S Mill și care leagă cauzalitatea cu manipularea, un adevărat experiment cu atribuirea aleatorie a subiecților la condiții este văzut ca singurul mijloc de a testa în mod convingător ipotezele cauzale. Din acest punct de vedere, afirmațiile cauzale din științele neexperimentale (sociologie) sunt ilegitime. Precedenta temporala a cauzei presupuse (variabila independenta) a efectului (variabila dependenta) ca una dintre conditiile unei relatii cauzale intr-un experiment este asigurata prin manipularea si masurarea consecintelor acestuia. O altă cerință pentru inferența cauzală care este mai dificil de satisfăcut este absența unor explicații alternative plauzibile. V. intern este înțeles ca fiind încrederea că variabila independentă X este cea care servește ca principală cauză a variabilității sistematice a valorilor variabilei dependente Y, adică. nu există alte variabile care să medieze relația dintre X și Y. Nu suntem în măsură să garantăm validitatea experimentului, dar ținând cont de caracteristicile procedeului de cercetare utilizat, putem identifica și elimina principalele cauze ale invalidității. Campbell și Stanley au propus o clasificare a motivelor declinului intern B. Istoria (fondul) este evenimentele care au avut loc între X și Y și ar putea afecta covarianța acestora. Schimbările naturale sunt modificări ale stării interne a subiecților care nu sunt asociate cu influența lui X, cum ar fi oboseala, creșterea, învățarea. Efectul instrumentului este asociat cu modificări nedorite ale procedurilor de măsurare (defecțiuni tehnice, oboseala observatorului). Efectul regresiei statistice (alunecare spre medie) se observă atunci când grupurile experimentale și/sau de control sunt selectate pe baza valorilor extreme ale indicatorilor relevanți; din motive statistice, până la momentul celei de-a doua măsurători valorile maxime ale indicatorilor vor scădea, iar valorile minime vor crește. Selecția grupului ca cauză a invalidității este asociată cu selecția non-aleatorie (neechivalentă) a subiecților sau a altor unități de cercetare. Uzura („mortalitatea experimentală”) se referă la pierderea neuniformă și non-aleatorie a participanților la studiu. Interacțiunea selecției cu alți factori descrie o situație în care subiecții selectați nealeatoriu au antecedente personale diferite, tendință la oboseală, abandonuri etc. Selecția internă este evaluată calitativ prin gradul de abatere a procedurii de cercetare de la un caz ideal. Acest lucru se aplică și proiectelor de cercetare neexperimentală, în care noi amenințări sunt adăugate la lista de motive pentru scăderea validității. V. externă caracterizează gradul de generalizare a rezultatelor obţinute la alte populaţii şi contexte. Replicarea cu succes a studiului este o condiție importantă pentru evaluarea validității teoriilor și ajută la clarificarea gamei de adecvare a acestora din urmă. Una dintre strategiile de realizare a V. externă este şi identificarea şi eliminarea motivelor responsabile de apariţia aleatorie a rezultatului. Acesta este, în special, efectul reactiv (influența procedurii inițiale de măsurare asupra comportamentului subiecților) și interferența reciprocă a influențelor experimentale. Alte strategii se bazează pe utilizarea unui design experimental randomizat cu o singură măsurătoare post-studiu (care elimină efectul reactiv); reducerea riscului de influență a experimentatorului (de ex. , minimizarea contactelor dintre experimentator și subiect, creșterea numărului de cercetători sau o metodă dublu-orb, când cercetătorul nu știe care dintre subiecți este expus la ce influențe până la finalul experimentului); mărirea V. ecologică (realismului) studiului. Un rol metodologic important în susținerea cercetării științifice îl joacă reproducerea cu expansiune, atunci când fiecare replicare ulterioară a unui experiment implică modificări minore procedurale. V. inferență statistică V. inferență statistică înseamnă îndeplinirea unui set de condiții care reduc probabilitatea unei decizii statistice incorecte cu privire la ipoteza nulă (despre egalitatea unui parametru cu o anumită valoare sau corespondența unui model statistic cu datele) obţinut) sau amploarea efectului. Principala metodă de luare a deciziilor statistice în ultimele decenii a fost testarea semnificației statistice, i.e. despre egalitatea unui parametru cu o anumită valoare. Pentru aceasta se folosesc criteriile z, t, F, x2 etc. Se compară valoarea obţinută empiric a criteriului cu cea critică, iar pe baza acestei comparaţii se respinge sau nu ipoteza nulă. Astfel, decizia este de natură binară (da sau nu). În acest proces, se poate face una dintre cele trei erori: respingerea incorectă a unei ipoteze nule adevărate (eroare de tip I, alfa), acceptarea incorectă a unei ipoteze alternative adevărate (eroarea de tip II, beta) și formularea incorect de ipoteze statistice, de ex. Este incorect să traducem întrebarea de cercetare în limbaj statistic. Amenințările la adresa V. inferența statistică sunt numeroase și de natură diferită. Utilizarea indicatorilor invalidi (secțiunea acestui articol Validitatea procedurilor de măsurare) nu face posibilă interpretarea cu încredere a rezultatelor obținute. Utilizarea unor variabile măsurate nesigur conduce la o subestimare semnificativă a statisticilor obținute. O clasă mare de amenințări la adresa V. inferența statistică este asociată cu formularea incorectă a modelului. În special, modelele liniare mai familiare sunt alese atunci când ipotezele lor subiacente sunt încălcate: relația dintre variabile este neliniară, sunt prezente valori extreme, varianțele variabilei dependente pentru diferite niveluri ale variabilei independente sunt inegale, variabilele sunt măsurate mai grosier decât este cerut de model, valorile variabilelor lipsă nu sunt distribuite aleatoriu. Pachetele standard de analiză statistică oferă metode de diagnosticare a încălcărilor ipotezelor modelului. Erorile conceptuale mai complexe sunt făcute din cauza desemnării incorecte a variabilelor ca independente sau covariabile, alegerii incorecte a modelelor pentru măsuri dependente (repetate) sau independente, efecte fixe sau aleatorii. Când comparăm mai multe medii sau evaluează semnificația mai multor corelații, cercetătorii nu iau întotdeauna în considerare inflația erorii de tip I: de exemplu, pentru variabile j obținem corelații k = j(j - 1)/2, iar probabilitatea de obținere aleatorie a cel puțin un coeficient de corelație semnificativ, alphatot , este egal cu 1 - (1 - alfa)k. Utilizarea prea multor variabile cu un număr mic de observații (respondenți) creează „suprafitting” a modelului, când modelul descrie perfect datele eșantionului, dar este inadecvat pentru a descrie populația. Multe erori simple în inferența statistică se datorează confundării fanteziste și mecanice a două abordări diferite ale deciziei statistice – Fisher și Neyman-Pearson. Ultima abordare subliniază importanța puterii de testare pentru evaluarea semnificației. Astfel, rezultatul se poate dovedi a fi nesemnificativ statistic din motive legate de puterea insuficientă a metodei: efecte experimentale slabe, un eșantion mic sau eterogen, măsurarea nesigură a variabilelor, o valoare excesiv de mică a erorii de prim tip. Semnificația statistică este probabilitatea ca un rezultat să se datoreze întâmplării într-un eșantion de o dimensiune dată, dar nu spune nimic despre dimensiunea efectului. Orientările moderne recomandă raportarea în publicații nu numai a indicatorului de semnificație (p), ci și a valorilor efectului (indicatorii tipici sunt r-ul lui Pearson, t-ul lui Student, d-ul lui Cohen, g-ul lui Higges, nu2 pentru analiza varianței etc.). Alte alternative la deciziile binare cu privire la semnificația statistică sunt intervalele de încredere, statisticile bayesiene și, mai general, replicarea augmentată și meta-analiză. V. în cercetarea calitativă V. în cercetarea calitativă nu poate fi evaluată prin metodele clasice descrise mai sus. O serie de autori arată primitivitatea abordărilor existente de evaluare a V. și a „criteriologiei” în general (T. Schwandt, J. Smith). În același timp, respingerea ideii de fiabilitate/autenticitate, spre deosebire de obiectivitatea discreditată, pare prea radicală chiar și pentru cercetătorii postmoderni. Prin urmare, alți autori (E. Guba, I. Lincoln, S. Kvale, S. Mishler) încearcă să reformuleze criteriile tradiționale de validitate, făcându-le mai puțin pozitiviști. Sunt discutate noi proceduri de stabilire a fiabilității: validarea comunicativă (participarea subiecților la discuția rezultatelor; implicarea colegilor în discuție), validarea procedurală (acuratețea, minuțiozitatea și completitudinea notelor de teren sau a datelor obținute; descrierea completă, echilibrată și transparentă a rezultatelor, deschis la alte interpretări; sensibilitate la feedback-ul colegilor; Printre alte abordări de justificare a fiabilității rezultatelor, trebuie menționată stabilirea gradului de plauzibilitate ca evaluare a cunoștințelor dobândite din perspectiva cunoștințelor existente; încrederea (credibilitatea) ca evaluare și înțelegere colectivă a rezultatelor, ținând cont de natura fenomenului și de circumstanțele observării acestuia; înrădăcinată în date, încorporată în contextul programului de cercetare (fiabilitatea), care se bazează pe studiul și evaluarea atentă a aspectelor procedurale; sensibilitatea ca abilitatea cercetătorului de a vedea o problemă socială și de a contribui la rezolvarea acesteia; Autenticitatea ontologică și educațională - capacitatea de a crește conștiința participanților la cercetare (în primul caz) și a mediului lor (în al doilea); autenticitatea catalitică ca influență asupra programelor sociale care contribuie la îmbunătățirea calității vieții populației studiate. Autorii postmodernişti discută despre concepte şi principii fundamental noi de fundamentare a cunoaşterii: validarea ironică (J. Baudrillard), neopragmatică (J.-F. Lyotard), rizomatică (J. Derrida). N. Denzin a fundamentat metoda triangulației ca o alternativă radicală la abordările tradiționale de validare. Triangularea este utilizarea combinată și îmbogățită reciproc a diferitelor metode, metodologii, date, teorii și/sau cercetători. Multiplicitatea abordărilor și tehnicilor este concepută pentru a slăbi restricțiile epistemologice, a depăși granițele stabilite și a dezvălui noi aspecte ale fenomenului. De menționat că ideea de triangulare [a adevărului] a fost generată în post-pozitivism (D. Campbell), unde a fost înțeleasă ca o anumită procedură, un set de trucuri utile: pe lângă intervievarea oamenilor „obișnuiți”. , intervievați experți; împărțiți aleatoriu eșantionul de subiecți în jumătate și analizați datele separat; excludeți o variabilă din analiză și vedeți cum se schimbă modelul; validați constructul folosind abordarea „multe trăsături - multe metode” etc. Pentru a evita asocierile nedorite cu pozitivismul, etnograful postmodern L. Richardson, într-un spirit radical, abandonează ideea de triangulație și oferă o altă metaforă atractivă - un cristal, nu un triunghi, cristalizare, nu triunghiulare. Un cristal creează, refractează și distorsionează simultan, are mai multe fațete și niciuna dintre fațetele sale nu este mai fiabilă decât oricare alta. Ca și cunoașterea, un cristal crește și se descompune. Abordarea metaforică a problemei fundamentarii cunoștințelor și aprecierii calității acesteia nu este întâmplătoare. Este conceput pentru a distruge abordările bazate pe criterii și ideile despre standarde. Cercetarea socială este valoroasă doar atunci când oferă șanse egale reprezentanților diferitelor grupuri de a vorbi, creează versiuni la fel de probabile și suprimă interpretările dominante, „corecte”. S.V. Sivukha