Amarengo

Articles and news

Latent Trait Theory and Attitude Scaling: the Use of Information Functions For Item Selection

ABSTRACT-dit expository paper demonstreert het nut van Latent Trait Theory based procedures for purposes of attitude scaling. In het bijzonder wordt aangetoond dat verschillende items verschillende hoeveelheden “informatie” (of onderscheidingsvermogen) leveren voor verschillende attitude niveaus. Daarom kunnen items worden gekozen op basis van hun vermogen om informatie te verstrekken op specifieke standniveaus. Ook kan redundantie worden verminderd door items met vergelijkbare informatie te elimineren.

citaat:

Wagner Kamakura and Rajendra R. Srivastava (1982),” Latent Trait Theory and Attitude Scaling: the Use of Information Functions For Item Selection”, in NA – Advances in Consumer Research Volume 09, eds. Andrew Mitchell, Ann Abor, MI: Association for Consumer Research, pagina ‘ s: 251-256.

Advances in Consumer Research Volume 9, 1982 Pages 251-256

LATENT TRAIT THEORY AND ATTITUDE SCALING: THE USE OF INFORMATION FUNCTIONS FOR ITEM SELECTION

Wagner Kamakura (student), University of Texas at Austin

Rajendra R. Srivastava, Universiteit van Texas in Austin

ABSTRACT –

deze expository paper toont het nut van latente Trait Theory based procedures voor attitude scaling. In het bijzonder wordt aangetoond dat verschillende items verschillende hoeveelheden “informatie” (of onderscheidingsvermogen) leveren voor verschillende attitude niveaus. Daarom kunnen items worden gekozen op basis van hun vermogen om informatie te verstrekken op specifieke standniveaus. Ook kan redundantie worden verminderd door items met vergelijkbare informatie te elimineren.

inleiding

traditionele schaalprocédés op basis van betrouwbaarheidsmaten hebben in de literatuur voor marketingonderzoek de meeste aandacht gekregen voor “attitude scaling”, zoals blijkt uit de artikelen in het speciale nummer van het Journal of Marketing Research on measurement (februari 1979). Bij deze procedures wordt uitgegaan van een constante standaardfout bij de meting langs het standcontinuüm, d.w.z. dat de betrouwbaarheid alleen de algehele efficiëntie van de schaal over alle standniveaus aangeeft. Hoewel de correlatie van een item met de schaal (bijvoorbeeld van een variabele met de factorscore) kan helpen bij het kiezen van items die het meest bijdragen aan de schaal, is het moeilijk te ontcijferen of deze items bijdragen aan het onderscheidingsvermogen aan de hoge of lage uiteinden van de attitude schaal. Bovendien bieden traditionele procedures geen maatstaf voor de specifieke bijdrage van elke responscategorie voor de meetnauwkeurigheid. Bijvoorbeeld, voor Likert-type items, geeft “strongly agree” meer informatie dan “agree”, gezien het item, langs de attitude schaal? Verder leidt de Alfa-betrouwbaarheidscoëfficiënt tot paradoxale regels om te beslissen welke items, of hoeveel items, in de schaal moeten worden opgenomen: (a) items die onderling sterk met elkaar verband houden, moeten worden gekozen om de betrouwbaarheid te verhogen, en (b) items met een lage onderlinge correlatie, maar met een hoge correlatie met de belangrijkste eigenschap die wordt gemeten, moeten worden opgenomen om de validiteit te vergroten.

ten slotte werden de “don’ t know” (DK) – responscategorieën traditioneel gehanteerd door de gemiddelde waarde (voor alle respondenten) of de middelste categorie op een bipolaire schaal te vervangen om een moeilijke beslissing weer te geven (Coombs en Coombs, 1977). Er is ook enig onderzoek uitgevoerd om te bepalen of DK-reacties ontstaan als gevolg van responsstijl gerelateerd aan de kenmerken van de respondent (Converse 1977, Francis and Busch 1975, Innes 1977). In het algemeen, echter, onderzoek naar de behandeling van DK ‘ s is zeer beperkt: we weten niet veel over hoe te behandelen “weet niet” reacties.

In dit artikel presenteren we benaderingen die gebaseerd zijn op latente Trait theorie die de onderzoeker in staat stellen om items te selecteren op basis van hun discriminant vermogen langs het attitude continuüm (dus als een onderzoeker in het bijzonder geïnteresseerd is in het vergroten van de nauwkeurigheid op bepaalde niveaus van attitude, bijvoorbeeld in het middenbereik om “schakelbare” vooruitzichten te identificeren, kan hij/zij dit doen door het aantal items te verhogen die discriminant vermogen bieden op die niveaus). Een bijkomend voordeel van deze benaderingen is de behandeling van DK als nominale antwoorden, waardoor de categorie kan worden vertegenwoordigd door verschillende posities langs likert-type metingen, afhankelijk van de post. Zoals in de volgende paragraaf wordt besproken, levert dit aanvullende informatie op die normaliter verloren gaat door DK ‘ s te behandelen als ontbrekende waarden en mogelijk verkeerd wordt weergegeven door ze te behandelen als gemiddelde of middelste categorieën.

LATENT TRAIT THEORY

in deze paragraaf onderzoeken we de basis Latent Trait modellen voor dichotoom items en de latere uitbreidingen voor het polychotoom geval. Deze modellen zijn voornamelijk gebaseerd op de stochastische benadering voor mentale meting, geïntroduceerd door Lord (1952) en Rasch (1960) in de vroege jaren 60.

modellen voor dichotome responsen

de theorie ontwikkeld door Lord (1952) is een variant op Lazerfeld ‘ s (1954) “latente Structuurtheorie” beperkt tot een enkele dimensie, waar individuen worden geplaatst langs een trait/attitude continuüm, en de kans dat ze positief reageren op een dichotoom item hangt af van de positie van het item ten opzichte van de positie van het individu op dezelfde dimensie.

Rasch (1960) gebruikte een soortgelijke benadering, maar modelleerde de waarschijnlijkheid van positieve reacties als een logistieke functie van de eigenschap/houding van het individu en de kenmerken van het item, in plaats van een normale Ogive functie zoals gebruikt door Lord. Door zijn eenvoud en computationele voordelen heeft het logistieke Model meer aandacht gekregen in de literatuur dan het normale Ogive-Model. Een belangrijke uitbreiding van Rasch ‘ s logistieke Model is het 2-Parameter logistieke Model afgeleid door Birnbaum (1968), dat de mogelijkheid omvat dat items niet alleen verschillen op hun positie op het trait/ attitude continuüm, maar ook in hun vermogen om onderscheid te maken op verschillende niveaus van dat continuüm

in zijn 2-Parameter Logistic Binary Response (BR) Model Birnbaum definieert de waarschijnlijkheid van een gegeven individu j beantwoorden van een item I positief als een logistieke functie van de eigenschap of attitude van het individu, en de item kenmerken, zodat,

pij = 1 (1)

1+e-ai (bi-0j)

waarbij,

Pij = waarschijnlijkheid van individuele J beantwoordend item i met een positieve respons

0j = attitude niveau voor individuele j

bi = positieparameter voor item i

ai = discriminatieparameter voor item i

na de oorspronkelijke conceptualisatie van Rasch plaatste dit model ook items i en individuen j in hetzelfde attitudecontinuüm. De Positieparameter bi voor item i wordt gedefinieerd als de positie van het item in het attitudecontinuüm, wat zou resulteren in een 50% kans op een positieve respons. Voor een individuele houding 0j gelijk aan de parameterpositie bi, de exponent in Eq. 1 wordt null, en de waarschijnlijkheid van individuele J beantwoorden item i positief resulteert in Pij = 1/2.

de discriminatieparameter voor een gegeven item i wordt gedefinieerd als de maximale helling van de logistische functie (ook wel Item Characteristic Curve (ICC) genoemd) gedefinieerd in Eq. 1. De maximale helling van een logistische kromme vindt plaats bij een standniveau 0j dat gelijk is aan de positie van het item bi, d.w.z. in het middelpunt zoals weergegeven in Figuur 1. En, hoe steiler de helling (hoe hoger de waarde van de discriminatieparameter ai) van een item, hoe beter het discrimineert onder respondenten met attitude niveaus 0j in de buurt van de positieparameter bi omdat een kleine variatie in attitude zal worden gedetecteerd door een grote variatie in de waarschijnlijkheid van positieve respons. De lezer zal merken dat wanneer de helling ai = ¦, de item karakteristieke curve wordt weergegeven door een rechte lijn die Pi: = 0,50, dat wil zeggen, een 50-50 kans op een positieve respons, ongeacht de houding 0j van de respondent.

de definitie van itemparameters kan beter worden begrepen in Figuur 1, waarbij de punten 1 en 3 respectievelijk in het lagere en hogere standbereik worden geplaatst, terwijl punt 2 in het middelste bereik wordt geplaatst. Dus, alleen individuen met een hoge attitude niveaus ij zal het eens zijn met punt 3, omdat het noodzakelijk is om een houding hoger dan b3 voor een waarschijnlijkheid van positieve respons groter dan 50%. Aan de andere kant zullen alleen personen met een lage houding het niet eens zijn met punt 1. Ook kan de lezer gemakkelijk zien dat punt 3 de hoogste discriminerende macht heeft, aangezien een lichte variatie van houding 0j rond de positie b3 resulteert in een grote verandering van de waarschijnlijkheid van bijna nul naar bijna een.

figuur 1

ITEM CHARACTERISTIC CURVES (I. C. C.): 2-PARAMETER LOGISTIC MODEL (BINARY)

een belangrijke bijdrage van Birnbaum, naast zijn uitbreiding van het Rasch-model, is het concept van de Informatiefunctie (IF), dat een indicatie geeft van de meetnauwkeurigheid voor elk standniveau of voor elk item op een schaal. De informatie die door een voorwerp op een bepaald standniveau Oo wordt doorgegeven, wordt door Birnbaum gedefinieerd als omgekeerd evenredig met het kwadraat van de lengte van de interne asymptotische betrouwbaarheid voor de schatting van Oo, of recht evenredig met het kwadraat van de helling van het ICC op standniveau Oo. Voor het BR-Model heeft Birnbaum aangetoond dat de informatie die door een item i van een bepaald bekwaamheidsniveau wordt doorgegeven, kan worden berekend met

Ii(0j) = 2/Pij (1-Pij)) (2)

waarbij P ‘ ij de helling is van de logistieke kromme op vaardigheidsniveau 0j.

het begrip informatie houdt dus rechtstreeks verband met de discriminatieparameter ai, en voor het 2-parametermodel zal een meer discriminerend item meer informatie opleveren, met zijn maximum op de itempositie bi. In Figuur 2 worden de Informatiefuncties van dezelfde items in Figuur 1 uitgezet, en men kan gemakkelijk zien dat Voor het meer onderscheidende item (punt 3) de Informatiefunctie hogere niveaus bereikt en de piek optreedt bij de positieparameter b3.

FIGUUR 2

INFORMATIEFUNCTIES: 2-PARAMETER logistisch MODEL

een belangrijk kenmerk van het BF, zoals gedefinieerd door Birnbaum, is zijn additieve eigenschap; de informatie die door verschillende items op een gegeven standniveau wordt verzonden, kan worden toegevoegd om de totale informatie te verkrijgen die door de schaal op dat standniveau wordt verzonden. Zo is het mogelijk de bijdrage van elk item en de totale door de schaal verstrekte informatie te evalueren. Bovendien geeft de IF de maximale nauwkeurigheid aan die voor elk item op elk niveau van de stand kan worden bereikt, in tegenstelling tot de traditionele betrouwbaarheidsmaten die over het hele bereik worden berekend. Dus, het toevoegen van items met dezelfde kenmerken (item positie bi, item discriminatie ai) zal de nauwkeurigheid alleen in de houding bereik al gedekt door de items te verbeteren, zonder verbetering op andere niveaus van houding.

daarom lost het concept van de Informatiefunctie het betrouwbaarheidsdilemma op dat eerder in dit artikel werd genoemd. Het biedt objectieve middelen voor het selecteren van items voor een schaal, volgens de doelstelling van de onderzoeker. Als een politicus geà nteresseerd was in het identificeren van kiezers met onzekere politieke houdingen, die vatbaar zouden kunnen zijn voor attitudeveranderingen, zou de schaal zich moeten concentreren op items die zich in het middenbereik bevinden.

Models for Polychotomous Responses

Samejima ‘ s (1969) Ordered (Graded) Response (OR) Model biedt een polychotomous uitbreiding voor het geval dat er twee of meer geordende categorieën zijn. Bijvoorbeeld, in het geval van een item gescoord op een schaal van 1 tot 3, twee item response curves kunnen worden gebruikt om de voorwaardelijke (op attitude niveau j) waarschijnlijkheid van het reageren op een bepaalde categorie in een fase-wijze te beschrijven. In de eerste fase worden functies verkregen om de respons in de eerste categorie versus een hogere categorie weer te geven (1 vs.2 of 3), en voor een respons in de eerste en tweede categorie versus de derde (1 en 2 vs. 3). Deze responsfuncties worden weergegeven door de curven in Figuur 3. De tweede fase bestaat er slechts in de opeenvolgende responsfuncties van elkaar af te trekken om de gewenste responskansen voor elke categorie te verkrijgen. Merk op dat de waarschijnlijkheden voor de extreme categorieën worden verkregen door de responsfuncties af te trekken van 1.0 en 0.0. Dan in Figuur 3, voor een individu met standniveau 0j, is de kans om te reageren met categorieën 1, 2 en 3 respectievelijk 0,17, 0,63 en 0,20. De responsfuncties in Figuur 3 kunnen gemakkelijk worden gemodelleerd als:

Fijp = 1

1+e-ai (bip-0j)

waarbij: Fijp-waarschijnlijkheid dat een persoon j met houding 0j reageert op item i Met categorie p of beter. Net als in het binaire model kan ai worden geïnterpreteerd als het onderscheidend vermogen van item i en bip als de positie van de pth-categorie van item i op het attitudecontinuüm.

de Informatiefunctie werd door Samejima gedefinieerd op een manier die gelijkwaardig is aan de formulering van Birnbaum. Het OR-model biedt één Informatiefunctie voor elke responscategorie van het item. Daarom kan de bijdrage van elke responscategorie van een item aan de meetnauwkeurigheid op elk standniveau worden beoordeeld. De IF ‘ s kunnen worden opgeteld over categorieën voor een item om een maat van de items informatiewaarde te bieden. Bovendien maakt Samejima ‘ s of Model geen metrische aannames over de responscategorieën; het interval tussen responscategorieën is niet “a priori” vastgelegd en kan zelfs variëren voor verschillende items. Zelfs de aanname van rangorde over responscategorieën wordt versoepeld in het Nominal Response (NR) Model ontwikkeld door Bock (1972). Bock ontwikkelde zijn model als een polychotomisch logit-model, waarin de keuze van een responscategorie voor een bepaald item wordt uitgelegd als een functie van item-categorieparameters en het attitudeniveau van het individu. De modelformulering, hoewel wat complexer, lijkt sterk op het binaire model. Dit komt omdat een ratingschaal van 3 categorieën kan worden weergegeven door 2 binaire ratingschalen of, in het algemeen, een ratingschaal van n categorie kan worden weergegeven door (n-l) binaire schalen. Bock ’s model biedt ICC’ s en IF ‘ s voor elke nominale respons categorie die kan worden geïnterpreteerd op een manier vergelijkbaar met het binaire model. Bijvoorbeeld, het ICC voor elke categorie (voor een bepaald item) vertegenwoordigt de waarschijnlijkheid dat een respondent met een bepaalde houding zal reageren met die categorie.

figuur 3

voorbeeld van een gegradeerd RESPONSMODEL met drie categorieën

het belangrijkste voordeel van het NR-Model ten opzichte van het OR-Model is dat, aangezien er geen aanname wordt gedaan over de volgorde van de responscategorieën, hun relatieve volgorde wordt bepaald door de gegevens zelf en kan variëren voor verschillende posten. Bijgevolg is het nuttig als er geen “logische” of intuïtieve volgorde van de responscategorieën is, zoals het gebeurt met “Weet niet”, “geen mening” en “geen antwoord” reacties.

methodologie en analyse

de gegevens die worden gebruikt om het gebruik van latente Trait Theory voor attitude scaling te illustreren, zijn de “anomia” – schaal (Srole, 1956) die is ontleend aan de enquête van de National Opinion Research Council (NORC) voor 1973. Anomia wordt gezien als een individuen gegeneraliseerde, doordringende gevoel van sociale malintegratie of “zelf-naar-anderen vervreemding.”De schaal is eendimensionaal en bestaat uit 9 items in Tabel 1, en drie responscategorieën (mee eens, oneens, weet niet). 400 gevallen werden willekeurig geselecteerd uit de totale steekproef van ongeveer 1200. Een grotere steekproef was niet nodig voor de nauwkeurigheid van de berekening en zou alleen de rekentijd/ – kosten hebben opgeblazen. Het gebruikte algoritme was het LOGOG programma (Kolakowski and Bock, 1973). De analyses en resultaten worden gepresenteerd om te illustreren: (1) item selectie op basis van informatie functies, en (2) behandeling van don ‘ t know reacties.

eerst worden de gegevens geanalyseerd door middel van het binaire model dat DK ‘ s als ontbrekende waarden behandelt. De afgeleide parameters worden gebruikt om ICC ’s en IF’ s te ontwikkelen. deze curves worden gebruikt om te illustreren dat (1) itemposities variëren langs het attitudecontinuüm, dat wil zeggen, items informatie geven op verschillende attitude niveaus, (2) items kunnen duplicatief of redundant zijn, dat wil zeggen, dezelfde informatie geven, en (3) items met lagere hellingen minder informatie geven.

TABEL 1

ANOMIA-SCHAAL

1. Naast gezondheid is geld het belangrijkste in het leven

2. Soms vraag je je af of iets meer de moeite waard is

3. Om geld te verdienen zijn er geen goede verkeerde manieren meer, alleen gemakkelijke en harde manieren

4. Vandaag de dag moet iemand zo goed als voor vandaag leven en morgen voor zichzelf laten zorgen

5. In spits van wat sommige mensen zeggen, wordt de lot (situatie en conditie) van de gemiddelde man slechter, niet beter

6. Het is niet eerlijk om een kind ter wereld te brengen met de manier waarop de dingen voor de toekomst kijken

7. De meeste ambtenaren zijn niet echt geïnteresseerd in de problemen van de gemiddelde man

8. Tegenwoordig weet een persoon niet echt op wie hij kan rekenen

9. De meeste mensen geven niet echt om wat er gebeurt met de volgende felloe

bron: Srole, L. (1956),” Social Integration and Certain Corollaires, ” American Sociological Review, 21, 709-16.

de resultaten van het binaire model worden ook vergeleken met Alfafactoranalyse (gebaseerd op Cronbach ‘ s alpha) om de overeenkomsten en verschillen tussen latente Trait benaderingen en traditionele schaling technieken te illustreren.

ten tweede worden polychotoommodellen geschat waarbij DR ‘ s worden behandeld als middelste waarden en vervolgens als nominale responsen. In het laatste geval kunnen DK ‘ s “zweven”, d.w.z. een hoge, middelste of lage categorische positie hebben. Het effect van de behandeling van DR ’s op informatie wordt weergegeven in twee illustratieve gevallen waarin het respectievelijk passend en ongepast zou zijn om DR’ s als middelste of gemiddelde waarden te behandelen.

resultaten

selectie van Items met behulp van Informatiefuncties

de eerste twee kolommen op Tabel 2 geven goodness-of-it statistieken weer (Chi-kwadraat en significantieniveau z) voor Birnbaum ’s 2-Parameter logistische Model, toegepast op de 9-item Anomia schaal, met Don’ t Knows sleutel als ontbrekende waarden. De geschatte item positie parameters bi ’s en discriminatie parameters ai’ s worden weergegeven in Tabel 2 en de overeenkomstige ICC ’s en IF’ s worden weergegeven in de figuren 4 en 5. Uit de ICC ‘ s in Figuur 4 en de positieparameters bi in kolom 3 en 4 in Tabel 2 blijkt dat de 9 punten zich concentreren op het bereik van houdingen tussen b8 = -1.1 en b3 = 1.6. Daarom zal deze schaal de beste meetnauwkeurigheid bieden op dit bereik van houdingen (aangezien elk item zijn maximale informatie in de buurt van zijn positie bi verstrekt). Door ICC ‘ s te vergelijken kan men zien dat de punten 5 en 7 enigszins overbodig zijn (b5 = -.588, b7 = -.562; a5 = 1,132, a7 = 1,032), die het grootste deel van hun informatie op hetzelfde niveau van houding. De IF ‘ s in Figuur 5 bevestigen deze redundantie, met de punten 5 en 7 met dezelfde vorm, met een piek op hetzelfde standniveau. Ook hebben items 2 en 4 soortgelijke ICC ’s en IF’ s.

tabel 2

ITEM PARAMETER: 2-PARAMETER logistisch MODEL – (weet niet als ontbrekende waarden)

figuur 4

I. C. C. Voor ANOMIA-ITEMS: Binair MODEL

figuur 5

Informatiefuncties voor ANOMIA-ITEMS: binair MODEL

Figuur 5 toont ook een duidelijk onderscheid tussen de items 1 tot en met 4, die weinig informatie geven, en de items 5 tot en met 9, die een piek hebben bij hogere waarden (ant hogere ai-waarden). Dit verschil tussen de twee reeksen posten bevestigt de resultaten van de Alfafactoranalyse die op dezelfde gegevens is uitgevoerd (waarbij DK als ontbrekende waarden wordt behandeld). Alfafactoranalyse resulteerde in de afleiding van slechts één factor (eigenwaarde = 3.14) op basis van de elleboogregel. De factor belastingen voor items 1 tot en met 9 waren, respectievelijk, -0.004, 0.028, 0.074, 0.073, 0.330, 0.560, 0.418, 0.422, 0.495, het is gemakkelijk te zien dat de punten 5 tot en met 9 die hogere Factorbelasting hebben ook hogere pieken voor hun overeenkomstige Informatiefuncties hebben (Figuur 5). Het lijkt erop dat ofwel de procedure (Alfafactor of latente eigenschap) zou dezelfde items voor de schaal te selecteren. Echter, de IF ‘ s verstrekt door de latente Trait procedure geven de attitude niveaus waar de items zijn het meest informatief. Zoals blijkt uit Figuur 5 geeft punt 8 de hoogste informatie bij lage standniveaus, terwijl punt 6 meer informatie geeft bij hoge niveaus. Daarnaast stelt het IF De onderzoeker in staat om redundante items (5 en 7; 2 en 4) te identificeren, die niet zouden worden gedetecteerd door betrouwbaarheidsmaatregelen. Het lijkt nuttig om punt 5 (Punt 7 heeft een lagere helling/IF-piek) te behouden als het doel is de redundantie van de posten te verminderen. Dit zou echter ook de meetnauwkeurigheid rond standniveau 0j = -0,57 verlagen.

behandeling van niet-bekende Responscategorieën

het OR-Model met DR tussen “Disagree” en “Agree” werd toegepast op de anomia-schaal. Om deze restrictieve aanname te vermijden, werd het NR-model op dezelfde gegevens toegepast. Of de 9 items in de schaal, alleen items 3 en 9 resulteerde in de categorisering van DR ‘ s aan de lagere extreme (dat wil zeggen, in de bestelling DK, oneens, eens). Om het effect aan te tonen van het beschouwen van DR als een middelste categorie presenteren we de ICC ‘ s afgeleid van het NR model voor items 7 en 9 in Figuur 6. Naarmate de anomia toeneemt, neemt de kans op overeenstemming met de posten 7 en 9 toe. Bij een toename van anomia neemt de kans op onenigheid echter eentonig af voor Rubriek 7, terwijl deze eerst toeneemt en vervolgens afneemt voor rubriek 9. Tot slot, de kans op het beantwoorden niet weten neemt toe als anomia afneemt voor item 9, terwijl het heeft een maxima op een intermediair niveau voor item 7 aangeeft dat DR is “besteld” als een middelste categorie voor item 7 en een lagere extreme categorie voor item 9.

gezien de “bestellingen” op basis van het NR-model zouden we verwachten dat het OR-model net zo goed voor item 7 en niet helemaal zo goed voor item 9 tarief. In het laatste geval (punt 9) zou het afdwingen van DK als middelste categorie tot verlies van informatie leiden. Dit wordt duidelijk geïllustreerd door de BF ‘ s voor de posten 7 en 9 die overeenkomen met BR -, OR-en NR-modellen in Figuur 7. Voor item 7 verhoogt de opname van DR als middelste categorie de informatie die door het item wordt verzonden in vergelijking met het binaire model dat DR als ontbrekende gegevens behandelt. De versoepeling van de aanname van rangorde in het NR-model verbetert de informatie niet ten opzichte van of-model, wat kan worden beschouwd als een indicatie dat DR inderdaad een middelste categorie is. Voor punt 9 resulteert de opneming van DR als middelste categorie ook in een verbetering van de informatie die door het item wordt doorgegeven. Echter, wanneer het NR Model wordt gebruikt (wat resulteert in een lage extreme positie voor DR ’s zoals eerder vermeld), wordt nog meer informatie verkregen, niet alleen op de piek maar ook op ow attitude niveaus waar de kans op DK responsen toeneemt. Dit geeft aan dat nuttige informatie (of onderscheidingsvermogen) verloren gaat aan de lage kant van de attitude schaal door een extreme (lage) waarde DK respons te behandelen als ontbrekende gegevens of als de middelste categorie. Natuurlijk zou het moeilijk zijn om DR at the low extreme a priori te definiëren. Opgemerkt moet worden dat het NR-model gewoon de positie van de categorie DK kiest om de “waarheid te verkrijgen.”Als het ICC voor DK echter een klein bereik heeft, is het waarschijnlijk dat het gemiddelde consistent is voor alle respondenten die zijn bemonsterd. Als de curve wordt uitgespreid betekent DK verschillende dingen voor verschillende personen

figuur 6

I. C. C. voor de posten 7 en 9: geordend RESPONSMODEL – (D. K. in het midden)

conclusies

dit expository paper dient ter illustratie van het gebruik van latente Trait theorie gebaseerde procedures voor attitude scaling. In het bijzonder kunnen de karakteristieke curven en Informatiefuncties van het item nuttig zijn voor de selectie van items in de schaalconstructie. Latente Trait theorie modellen kunnen nuttiger zijn dan traditionele schalen technieken omdat ze niet alleen metingen van item informatie waarde, maar ook metingen van de attitude niveaus waarop items waarschijnlijk het grootste onderscheidende vermogen hebben. Deze maatregelen kunnen worden gebruikt om overbodige of duplicatieve items te verwijderen en/of om de nauwkeurigheid van de schaal bij de gewenste standniveaus bewust te vergroten.

figuur 7

vergelijking van Informatiefuncties-posten 7 en 9

daarnaast kunnen reacties op meerdere categoriewaarderingsschalen worden geanalyseerd aan de hand van het nominale Responsmodel dat metingen levert van bijdragen van elke responscategorie van elk item op elk standniveau, in plaats van een algemene meting van de relatie tussen afzonderlijke items en de schaal. Het nominale Responsmodel vereist geen metrische aannames over de gegevens en de categorieën “weet niet”, “geen mening” en “geen antwoord” kunnen worden geschaald en worden gebruikt als informatiebronnen voor de meting van de houding. Zoals getoond (voor items 7 en 9),” weet niet ” reacties kunnen bijdragen aan de meetnauwkeurigheid en hun bijdrage kan optreden bij verschillende bereiken van houding, afhankelijk van het item.

ten slotte dient te worden vermeld dat de op latente Trait theorie gebaseerde procedures andere voordelen hebben die in dit document niet worden besproken. De kalibratieprocedures zijn onafhankelijk van de specifieke gebruikte items (item-free stand scaling) evenals het monster (sample-free scale calibration) zoals besproken door Wright (1968). Zodra de parameters voor elke samenstelling van de postcategorie zijn vastgesteld, is het ook mogelijk om “op maat gesneden” procedures te ontwikkelen voor het verzamelen van gegevens die voor andere monsters kunnen worden gebruikt. Als een respondent het bijvoorbeeld niet eens is met een item met een lage positieparameter (bi) langs een attitudecontinuüm, zal het niet erg nuttig zijn om items met hogere positieparameters te beheren. Dit aspect zou steeds belangrijker moeten worden met de komst van interactieve, geautomatiseerde gegevensverzamelingsprocedures. Het is te hopen dat dit document de impuls zal geven tot een verhoogd gebruik van latente Trait theorie gebaseerde houding scaling procedures die meer objectieve schaal constructie criteria leveren.Birnbaum, A. (1968),” Some Latent Trait Models and Their Use in Inferring An Examinee ’s Ability,” in F. M. Lord and L R. Novick (eds.), Statistische theorieën van mentale testscores, (lezen, massa.: Addison-Wesley).

Bock, R. V. (1972), “Estimating item Parameters and Latent Ability When Categories Are Scored in Two or More Nominal Categories,” Psychometrika, 37, 29-51.Converse, J. (Winter, 1977),” Predicting No Opinion on the Polls, ” Public Opinion Quarterly, 40, 515-30.Coombs, C. S. and Coombs, L. (Winter 1977),” Don ’t Know Item ambiguïteit or Respondent Uncertainty,” Public Opinion QuarterlY, 40, 457-514.Francis, J. and Busch, L. (Summer, 1975),” What We Know About ‘I Don’ t Knows’, Public Opinion Quarterly, 39, 207-18.

Innes, J. M. (1977), “Extremity and ‘don’ t Know ‘ Setts in Questionnaire Responses,” British Journal of Social and Clinical Psychology, 16, 9-12.Kolakowski, D. and Bock, R. D. (1973), Maximum Likelihood Item Analysis and Test Scoring: Logistic Model for Multiple Item Responses (Ann Arbor, Michigan: National Educational Resources Inc. 5.Lazarfeld, P. F. (1954)” A Conceptual Introduction to Latent Structure Analysis, “in Mathematical Linking In The Social Sciences, (Glencoe, Illinois: Free Press

Lord, F. M. (1952),” A Theory of Test Scores, ” psychometrische Monograph No. 7, Psychometrika Society.Rasch, F. (1960), Probabilistic Models for Some Intelligence and achievement Tests (Kopenhagen: Danish Institute for Educational Research).Samejima, F. (1969),” Estimation of Latent Ability Using a Response Pattern of Graded Scores, ” Psychometrika Monograph Supplement, No.17.Srole, L. (1956),” Social Integration and Certain Corollaries, ” American Sociological Review, 21, 709-16.

Wright, B. D. (1968),” Sample-Free Test Calibration and Person Measurement, ” Proceedings of the 1967 Invitational Conference on Testing Problems (Princeton, N. J. : Educational Testing Services), 85-101.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.