Baza wiedzy

Jak i czym mierzyć?

Jak wybrać narzędzie do badania naukowego, czyli jak zbadać dokładnie to, co chcę zbadać? Kwestionariusze i skale pomiarowe.

Każdy początkujący badacz, planując swoje badanie naukowe staje w pewnym momencie przed wyborem narzędzi, dzięki którym zdobędzie dane przybliżające go do odpowiedzi na postawione pytania badawcze. Warto zaznaczyć, że zanim w procesie planowania badania dojdziemy do etapu wyboru narzędzi badawczych, mamy już za sobą szereg działań oraz ogrom wiedzy dotyczącej tematyki, którą chcemy pogłębić. Zarówno sformułowanie problemu badawczego, jak i krytyczny przegląd literatury, określenie celów szczegółowych badania, czy też postawienie hipotez badawczych przybliża nas do wyboru konkretnych narzędzi. Krytyczny przegląd literatury jest niezwykle ważny przed zaplanowaniem metodologii, gdyż poszerza naszą wiedzę o możliwych narzędziach, które były już wykorzystywane przez innych badaczy oraz o tym, czy narzędzia stosowane w innych badaniach dały badaczom pełne odpowiedzi na zadane pytania badawcze. Na tym etapie również zwykle staje się oczywiste, czy spośród wszystkich dostępnych narzędzi istnieje takie, które będzie mierzyć dokładnie to, co chcemy zmierzyć. Jeśli nie, warto wówczas pomyśleć o stworzeniu własnego narzędzia badawczego.

Kwestionariusze

Kwestionariusz jest jednym z narządzi wykorzystywanych w tzw. samoocenie (ocenie własnej). Dane zgromadzone dzięki kwestionariuszom są podobne do informacji uzyskanych podczas wywiadów (najczęściej wykorzystywane w badaniach jakościowych), jednak nie dają możliwości pozyskania dodatkowych informacji w kwestiach dyskusyjnych. Z drugiej strony, dane uzyskane dzięki kwestionariuszom łatwiej skategoryzować oraz poddać analizie. Kwestionariusze mogą służyć zarówno do oceny faktów związanych z osobą badaną, ale także innymi osobami z jej otoczenia. Mogą oceniać wydarzenia, opinie, poziom wiedzy, intencje, postawy oraz wiele innych zmiennych.

Różne są również formy dystrybucji oraz uzupełniania kwestionariuszy. Pytania mogą być zadawane uczestnikom badania zarówno bezpośrednio, jak i telefonicznie. Wówczas, po udzieleniu ustnej odpowiedzi to badacz uzupełnia dane. Osoby badane mogą również wypełniać kwestionariusz samodzielnie. Dystrybucja kwestionariuszy może odbywać się bezpośrednio, czyli wprost do rąk osób badanych w formie wydrukowanej lub w formie elektronicznej za pośrednictwem adresu e-mai lub Internetu. Ta ostatnia forma jest coraz częściej wykorzystywana w badaniach, gdyż pozwala dotrzeć do większego grona uczestników badania. Ułatwia także transfer danych do zbiorczej bazy.

Początkującym badaczom często wydaje się, że samodzielne skonstruowanie kwestionariusza jest bardzo proste, jednak w rzeczywistości zaprojektowanie kwestionariusza, który będzie zbierał dane pomocne w odpowiedzi na postawione pytania badawcze, wymaga dużego wysiłku.

Jest kilka typów pytań, które można umieścić w kwestionariuszu. Najprostszym i najbardziej popularnym typem są pytania zamknięte, czyli takie, w których odpowiedzi są narzucone przez autora kwestionariusza (np. „tak”, „nie” lub więcej wariantów odpowiedzi). Takie pytania mogą mieć formę pytań jednokrotnego oraz wielokrotnego wyboru. W samodzielnym konstruowaniu pytań niezwykle ważne jest przemyślenie wariantów odpowiedzi. Częstym a zarazem niedopuszczalnym błędem jest to, kiedy warianty odpowiedzi nie dopełniają się wzajemnie lub się na siebie nakładają.

Błąd: Wiek a. <18 b. 18-29 c. 29-49 d. 49-69 e. >69

Poprawny wariant: Wiek a. <18 b. 18-29 c. 30-49 d. 50-69 e. >69

Powyższy przykład jest poważnym błędem metodologicznym, gdyż uniemożliwia badaczowi poprawną interpretację danych. Badacz w takim przypadku nie ma pewności, którą odpowiedź zaznaczyły osoby w wieku 29 lub 49 lat. Tym samym w analizie zależności pomiędzy wiekiem badanych a innymi zmiennymi niemożliwe jest prawidłowe wnioskowanie.

Innym typem pytania, które pojawia się w kwestionariuszach jest pytanie otwarte, czyli takie pytanie, które daje badanym możliwość odpowiedzi własnymi słowami. Dane pochodzące z pytań otwartych nie są jednorodne i łatwe do interpretacji. Badacz musi włożyć mnóstwo pracy zanim będzie można je poddać analizie statystycznej. Między innymi dlatego nie są rekomendowane w badaniach na dużych populacjach.

W kwestionariuszach nierzadko pojawiają się pytania warunkowe. Są to pytania, które prowadzą badanego przez określone warunki, czyli dedykowane są tylko tym osobom z grupy badanej, które te warunki spełniają.

Np.

Czy w ostatnim tygodniu zdarzyło Ci się pominąć dawkę leku na nadciśnienie tętnicze?
Tak
Nie
Jeśli w pytaniu 1 odpowiedziałeś „Tak”, proszę określ ile razy z ciągu ostatniego tygodnia zdarzyło Ci się pominąć dawkę leku, jeśli odpowiedziałeś „Nie”, przejdź do następnego pytania.
Raz
Dwa razy
Trzy razy
Cztery razy
Więcej niż cztery razy

Pytania demograficzne (inaczej socjo-demograficzne lub metryczne) są niezbędne w każdym kwestionariuszu i służą przedstawieniu charakterystyki grupy badanej. Mogą mieć one formę zamkniętą lub otwartą oraz mogą się różnić w zależności od przyjętych w badaniu celów. Najczęściej są to pytania o wiek, płeć, wykształcenie, miejsce zamieszkania, rodzaj wykonywanej pracy itp. Wśród tych pytań mogą się znaleźć pytania służące sprawdzeniu czy osoba badana na pewno spełnia kryteria włączenia. Na przykład jeśli do badania włączamy tylko osoby z orzeczeniem o niepełnosprawności, lub tylko osoby po przeszczepieniu nerki, takie pytanie może się znaleźć w tej części kwestionariusza. Wówczas badacz ma pewność, że jeśli w toku badania kwestionariusz wypełniła osoba po przeszczepieniu wątroby, a nie nerki dane z tego kwestionariusza nie zostaną włączone do analizy.

W samodzielnym konstruowaniu kwestionariusza ważne jest trzymanie się określonego planu. Po zapoznaniu się z literaturą dotyczącą postawionego problemu badawczego, kolejnym krokiem powinno być określenie specyfikacji kwestionariusza, czyli ustalenie zasadniczych treści, które kwestionariusz ma obejmować. Jest to o tyle trudne, iż w toku konstruowania pytań często pojawia się pokusa, aby nieco odbiec od głównego nurtu tematycznego, ponieważ wydaje się, że kolejne pytanie może przynieść dodatkową istotną wiedzę. Jest to jednak mylne spostrzeżenie, gdyż zwiększanie ilości pytań wydłuża jednocześnie czas wypełniania kwestionariusza przez osoby badane. To skutkuje znużeniem, brakiem skupienia, pomijaniem ostatnich części oraz brakiem rzetelności w odpowiadaniu na pytania. Im dłuższy kwestionariusz tym niższa jakość odpowiedzi. Ponadto dodanie pytań spoza założonego zakresu tematycznego może zaburzyć interpretację danych, gdyż nie w pełni identyfikuje dodatkowe zmienne. Na przykład konstruując kwestionariusz o nawykach żywieniowych zespół badawczy pokusi się o dodatkowe pytanie oceniające aktywność fizyczną. Może ono na tyle nieprecyzyjnie ocenić zmienną, że w analizie statystycznej okaże się kompletnie nieprzydatne. Wówczas, jeśli w celach badania jest ocena zależności pomiędzy nawykami żywieniowymi a poziomem aktywności fizycznej badanych, warto wykorzystać dodatkowe, standaryzowane narzędzie, które będzie oceniać poziom aktywności fizycznej w sposób precyzyjny oraz rzetelny. Na etapie wyboru pytań oraz wariantów odpowiedzi w tworzonym kwestionariuszu, po raz kolejny przydatny okazuje się przegląd literatury. Mimo dużej wiedzy na badany temat, perspektywa badacza może zaburzyć ogólny pogląd, bowiem każdy badacz ma już jakieś swoje doświadczenia oraz przekonania. Przegląd literatury umożliwia chociażby uwzględnienie wszystkich możliwych wariantów odpowiedzi, o których badacz nie pomyślał.

Kolejnym krokiem jest ułożenie pytań w logiczną całość w taki sposób, aby nie rozpraszały uwagi osoby badanej. Warto wówczas zastanowić się, czy zadane pytania się wzajemnie dopełniają i czy na pewno dane zebrane w kwestionariuszu będą odpowiadać na założone pytania badawcze. Pewne pytania mogą sugerować odpowiedź na inne, dlatego należy przemyśleć ich kolejność. Następnie należy przeanalizować wszystkie pytania oraz warianty odpowiedzi pod kątem prawidłowej interpretacji pytań oraz kompletności wariantów odpowiedzi. Do tego procesu warto zaangażować zespół ekspertów, który nie brał udziału w tworzeniu wstępnej wersji kwestionariusza. Pytania muszą być zrozumiałe dla uczestników badania, a ich interpretacja powinna być spójna z interpretacją badacza. W tym celu warto przetestować zaprojektowany kwestionariusz na małej grupie badanej (tzw. badanie pilotażowe), dając uczestnikom możliwość komentowania, wpisywania uwag oraz dyskutowania o interpretacji poszczególnych pytań.

Każdy kwestionariusz powinien zawierać słowo wstępne kierowane do osób badanych. Należy w nim wyjaśnić cel badania i uzasadnić potrzebę przeprowadzenia badania. Warto określić przybliżony czas wypełnienia pojedynczego arkusza kwestionariusza, poinformować do kogo kierowane jest badanie oraz umieścić dane badaczy. Niezbędna jest informacja o tym, czy dane zbierane są anonimowo, a jeśli nie, to w jaki sposób zostaną zanonimizowane. Często badacze w tym miejscu wstawiają informację, że wypełnienie kwestionariusza oznacza świadomą zgodę na udział w badaniu.

Wybierając do badania kwestionariusze standaryzowane, opublikowane w literaturze, warto w pierwszej kolejności wybierać takie, które dostępne są w wersji językowej odpowiadającej językowi, którym posługują się uczestnicy badania. Warto również wybrać kwestionariusz, który został walidowany w warunkach, w których będzie przebiegać planowane badanie (np. w warunkach polskich, na grupie pacjentów geriatrycznych itp.). Czasami różnice kulturowe lub demograficzne między populacją, na której testowano oryginalną wersję kwestionariusza a populacją, którą planuje się włączyć do badania są na tyle duże, że kwestionariusz należy zmodyfikować. Każdorazowo przed wykorzystaniem kwestionariusza do badania należy uzyskać zgodę autorów lub właściciela praw autorskich w przypadkach, kiedy nie należą one do autora kwestionariusza. Jeśli planujemy przetłumaczyć kwestionariusz, taka zgoda powinna obejmować również tłumaczenie. Bez zgody autora lub właściciela praw autorskich nie wolno modyfikować kwestionariusza.

Skale

Skale są bardziej precyzyjnym narzędziem do pomiaru badanego zjawiska niż kwestionariusze. Większość skal wykorzystywana w badaniach z zakresu nauk o zdrowiu została opracowana do opisywania zmiennych psychospołecznych. Nie jest to jednak regułą, gdyż znamy skale opisujące zmienne fizjologiczne, jak ból czy wydolność fizyczną. Z matematycznego punktu widzenia, ocena pojedynczej pozycji na skali obarczona jest dużym błędem losowym oraz systematycznym, dlatego zazwyczaj wynikiem skali oceniającej jakąś zmienną jest suma jej poszczególnych pozycji. Przykładem jednej z najczęściej stosowanych skal w badaniach z zakresu nauk o zdrowiu jest skala Likerta. Składa się z kilku deklaratywnych stwierdzeń wyrażających opinię badanego na dany temat w formie stopniowania. Oryginalna wersja skali obejmowała pięć stopni odpowiedzi, którym przypisano wartości od 1 do 5. Najbardziej negatywnej odpowiedzi przypisano 1, natomiast najbardziej pozytywnej – 5. W tej skali badany najczęściej ocenia poziom zgodności jego przekonań do określonego stwierdzenia (np. zdecydowanie nie zgadzam się, nie zgadzam się, nie mam zdania, zgadzam się, zdecydowanie się zgadzam), częstotliwość jakiegoś zjawiska lub czynności (np. nigdy, rzadko, czasami, często, cały czas, nieustannie), czy też własną ocenę (np. bardzo negatywnie, negatywnie, pozytywnie, bardzo pozytywnie). Skalę Likerta stosuje się w wersjach od 4- stopniowej do 7-stopniowej. Zastosowanie skali z nieparzystą liczbą wariantów odpowiedzi jest dyskusyjne, gdyż daje badanym możliwość odpowiedzi neutralnej, czyli uniknięcia jasnego wyboru wariantu pozytywnego lub negatywnego. Dodatkowo w pytaniach z wykorzystaniem skali Likerta, stosuje się częściowe odwrócenie skali, aby utrzymać czujność osoby badanej. Gdy skala składa się z kilkunastu pytań, osoba badana może po którymś z pytań zacząć przewidywać, że pozytywna lub negatywna odpowiedź jest konsekwentnie podawana w prawej lub lewej kolumnie oraz z automatu zaznaczać odpowiedzi bez zapoznania się z treścią pytań. Odwrócenie znaczenia pytań z pozytywnego na negatywny lub odwrotnie zmusza badanych do dokładnego czytania każdego sformułowania, co daje badaczowi uzyskanie bardziej rzetelnych odpowiedzi. W podsumowaniu takiej skali część pytań jest odwrotnie punktowana i zamiast 5 punktów, przyznaje się 1 punkt.

Innym przykładem skal jest wizualne skala analogowa (ang. Visual Analog Scale – VAS). Służy najczęściej do pomiaru wielkości, siły, intensywaności doznań lub uczuć osoby badanej. Wykorzystuje się ją do pomiaru bólu, nastroju, niepokoju, chęci sięgnięcia po papierosa (głodu nikotynowego), nasilenia objawów klinicznych itp. Jest to pionowa lub pozioma linia długości 10 cm zakończona ogranicznikami oraz wskazówką co one oznaczają (np. brak bólu oraz najgorszy ból, jaki możesz sobie wyobrazić).

Jakość narzędzi pomiarowych

Każde standaryzowane narzędzie charakteryzuje się określonymi właściwościami psychometrycznymi, które zostały ocenione wskutek walidacji narzędzia pomiarowego. Do podstawowych właściwości psychometrycznych zalicza się rzetelność oraz trafność, na które z kolei składają się kolejne elementy. W ocenie rzetelności narzędzia bierze się pod uwagę jego stabilność oraz zgodność wewnętrzną. Stabilność, czyli stopień, w jakim narzędzie podaje podobne wyniki w dwóch kolejnych pomiarach. Do oceny stabilności służy tzw. estymacja stabilności bezwzględnej, inaczej test-retest. Polega ona na dwukrotnym wypełnieniu kwestionariusza przez tę samą grupę badanych w niedługim odstępie czasu. Miarą stabilności narzędzia jest współczynnik korelacji pomiędzy wynikami dwóch kolejnych pomiarów. Przyjmuje on wartości pomiędzy 0,00 a 1,00. Za satysfakcjonujący uznaje się wynik 0,70, natomiast najbardziej preferowany przez badaczy jest wynik większy niż 0,80. Zgodność wewnętrzna wskazuje, w jakim stopniu pozycje testowe odnoszą się do tego samego kontekstu. Inaczej, czy na pewno wszystkie pozycje oceniają tę samą cechę. Miarą takiej zgodności jest współczynnik α-Cronbacha. Przyjmuje on wartości między 0,00 a 1,00. Im wyższa jest jego wartość, tym dokładniejszy pomiar, czyli większa zgodność wewnętrzna. Gdy skala lub test zawiera dane dychotomiczne np. (tak lub nie), wówczas lepszą miarą zgodności wewnętrznej będzie formuła Kudera-Richardsona 20 (KR20). Wysoki wskaźnik (np. > 0,90) będzie odzwierciedlał wysoką zgodność wewnętrzną. Trafność oceniana jest za pomocą trafności fasadowej, treściowej, teoretycznej oraz kryterialnej. Trafność fasadowa ocenia, czy zastosowane narządzie zostało wybrane adekwatnie do celu badania, ale z punktu widzenia badanych. Trafność treściowa dotyczy stopnia, w jakim treści zawarte w instrumencie będą odzwierciedlać zbiór treści dotyczących cechy, którą test powinien zbadać. Ten rodzaj trafności jest szczególnie ważny we wszystkich narzędziach oceniających wiedzę. Wówczas należy określić, czy i w jakim stopniu pytania zawarte w teście stanowią próbę reprezentatywną wszystkich możliwych pytań oceniających wiedzę na dany temat. W takiej ocenie bierze udział niezależny zespół ekspertów i na podstawie ich opinii obliczany jest wskaźnik ważności treści (współczynnik korelacji W-Kendalla). Najważniejszym rodzajem trafności jest trafność teoretyczna, która ocenia zgodność pomiędzy wynikiem testu a wartością cechy, do której badania test został skonstruowany. Czyli ocena czy narzędzie na pewno ocenia cechę, którą powinno badać. Jedną z metod oceny tego rodzaju trafności jest analiza korelacji badanej zmiennej z inną zmienną, której zależność została dobre potwierdzona. Trafność kryterialna dotyczy stopnia, w jakim wyniki zastosowanego narzędzia wiążą się z jakimś zewnętrznym kryterium. Miarą trafności kryterialnej jest współczynnik korelacji pomiędzy wynikiem testu a wartością zmiennej kryterialnej zmierzonej za pomocą innego narzędzia, ale na tej samej grupie badanej.

Przykłady standaryzowanych skal i kwestionariuszy

Nazwa w kolejności alfabetycznej	Co ocenia?	Czy występuje polska wersja językowa?	Źródło
Bazylejska Skala Oceny Adherencji do Leczenia Immunosupresyjnego (ang. BAASIS)	Adherencję do leczenia immunosupresyjnego	Nie	University of Basel, Leuven-Basel Research Group, Institute of Nursing Science, Department Public Health, University of Basel, Switzerland, 2005. Permission & conditions to use the BBAASIS© can be obtained from: http://baasis.nursing.unibas.ch/ or sabina.degeest@unibas.ch
Hiszpański Kwestionariusz do Oceny Nawyków, Postaw oraz Zrozumienia Ekspozycji na Światło Słoneczne "Kwestionariusz Plażowy"(ang. Spanish Questionnaire to Evaluate Habits, Attitudes, and Understanding of Exposure to Sunlight: “The Beach Questionnaire")	Ocena zachowań profilaktycznych w pierwotnej profilaktyce nowotworów skóry	Nie	de Troya-Martín M, Blázquez-Sánchez N, Rivas-Ruiz F, Fernández-Canedo I, Rupérez-Sandoval A, Pons-Palliser J, Perea-Milla E. Validación de un cuestionario en español sobre comportamientos, actitudes y conocimientos relacionados con la exposición solar: <> [Validation of a Spanish questionnaire to evaluate habits, attitudes, and understanding of exposure to sunlight: "the beach questionnaire"]. Actas Dermosifiliogr. 2009 Sep;100(7):586-95. Spanish. PMID: 19715643.
Kwestionariusz Prężności Rodzinnej Walsh (Walsh Family Resilience Questionnaire - WFRQ-PL)	Rezyliencję opartą o interakcje rodzinne	Tak	Nadrowska N, Błażek M, Lewandowska-Walter A, Błażek W, Zdun-Ryżewska A. Walsh Family Resilience Questionnaire-Polish Adaptation (WFRQ-PL). Int J Environ Res Public Health. 2022 Apr 1;19(7):4197. doi: 10.3390/ijerph19074197. PMID: 35409879; PMCID: PMC8998248.
Kwestionariusz psychofizycznych determinant udziału w życiu społecznym i zawodowym (ang. The Determinants of Professional Activity after Kidney and Liver Transplantation Questionnaire - DPATQ)	Adaptację posttrnsplantacyjną oraz psychofizyczne determinanty udziału pacjentów po przeszczepieniu wątroby lub nerki w aktywności zawodowej	Tak	Wesolowska-Gorniak K, Gierus J, Wojtowicz M, Bugajska J, Czarkowska-Paczek B. Determinants of Professional Activity After Kidney and Liver Transplantation: Questionnaire Development and Validation. Transplant Proc. 2019 Apr;51(3):651-664. doi: 10.1016/j.transproceed.2018.12.001. Epub 2018 Dec 6. PMID: 30979448.
Międzynarodowy Kestionariusz Oceny Aktywności Fizycznej (ang. International Physical Activity Questionnaire - IPAQ)	Poziom aktywności fizycznej	Tak	Biernat E., Stupnicki R., Gajewski A.K.: Międzynarodowy Kwestionariusz Aktywności Fizycznej (IPAQ) ‒ wersja polska. Wychowanie Fizyczne i Sport. 2007; 51(.1):47‒54.
Skala Postaw Rodzicielskich Chroniących Dzieci podczas COVID-19 (z ang. Parental Attitude Scale-Protecting Children during COVID-19 - PAS-CV19S)	Postawy rodziców dzieci wobec profilaktyki przeciw infekcjom podczas pandemii COVID-19	Nie	Gerçeker GÖ, Özdemir EZ, Özdemir B, Bektaş M. Development of the parental attitude scale-protecting children during COVID-19 and the relationship between parental attitudes and fear of COVID-19. J Pediatr Nurs. 2022 Jan-Feb;62:113-120. doi: 10.1016/j.pedn.2021.09.007. Epub 2021 Sep 8. PMID: 34561130; PMCID: PMC8423811.
Żywienie – Polska wersja Holenderskiego Kwestionariusza Zachowań Żywieniowych	Zachowania Żywieniowe	Tak	Malesza M.: Th e adaptation of the Dutch Eating Behavior Questionnaire – psychometric properties in a polish sample. Current Psychology 2019.

Autorka: dr n. o zdr. Katarzyna Wesołowska-Górniak, WUM

Źródła:

Gray J.R., Grove S.K.,Sutherland S.: Burns and Grove’s the Practice of Nursing Research Appraisal, Synthesis, and Generation of Evidence. St. Louis, Missouri, Elsevier 2017.
Serafin L, Sak-Dankosky N, Wesołowska-Górniak K, Formela M, Badania naukowe w pielęgniarstwie : ocena, synteza i tworzenie dowodów naukowych w praktyce pielęgniarskiej, Wrocław : Edra Urban & Partner; 2022
Ebert J.F., Huibers L., Christensen B., Christensen M.B. Paper- or Web-Based Questionnaire Invitations as a Method for Data Collection: Cross-Sectional Comparative Study of Differences in Response Rate, Completeness of Data, and Financial Cost. J. Med. Internet Res. 2018;20:e24. doi: 10.2196/jmir.8353.
Uhlig C.E., Seitz B., Eter N., Promesberger J., Busse H. Efficiencies of Internet-based digital and paper-based scientific surveys and the estimated costs and time for different-sized cohorts. PLoS ONE. 2014;9:e108441. doi: 10.1371/journal.pone.0108441.
Fronczyk K.: Psychometria. Podstawowe zagadnienia. Warszawa, Vizja Press, 2009.
Kuder, G.F., Richardson, M.W.: Th e theory of the estimation of test reliability. Psychometrika 1937; 2: 151–160.

Platforma edukacyjno - rozwojowa dla pielęgniarek

Wyszukiwanie

Jak i czym mierzyć?