Por el Psic. Fernando Reyes Baños

Analizar las respuestas que un grupo de sujetos da a los reactivos de una prueba tiene la función de ayudar a mejorar ésta, debido a que con la revisión de sus reactivos puede determinarse cuán efectivos son cada uno de ellos para medir el atributo que la prueba pretende medir como un todo.

Para las pruebas de rendimiento escolar (los exámenes que se aplican en el salón de clases) no hay, generalmente, criterios con los cuales poder determinar la validez de los reactivos (que implicaría, como es de suponerse, la correlación entre el porcentaje de sujetos que contestan correctamente cada reactivo con alguna medida de criterio externo), motivo por el cual, se utiliza un procedimiento denominado de consistencia interna con el que se sustituye el criterio externo por las calificaciones totales de la misma.

El propósito de analizar los reactivos de una prueba de rendimiento escolar es que los reactivos que se seleccionen para su versión definitiva sean indicadores adecuados de lo que la prueba mide como un todo; para ello, cada uno de los reactivos que integran la prueba deberá evaluarse para determinar cuán difíciles son y en qué grado sirven para diferenciar entre quienes presentan un rendimiento alto y bajo en la prueba, lo cual será posible, gracias al cálculo de sus índices de dificultad y de discriminación.


Índices de dificultad (Idf) y de discriminación (Idc) [1]

Mientras que Idf señala la proporción de personas que respondieron correctamente el reactivo de una prueba, Idc indica qué tan bien discrimina cada reactivo de la prueba entre las personas con un buen desempeño general en ella y aquellas que tuvieron un desempeño deficiente. Veamos a continuación, más detenidamente, cada uno de estos índices.

Idf tiene un rango de 0.00 a 1.00. Cuando el Idf de un reactivo es igual a 0.00 significa que ningún sujeto lo contestó correctamente, mientras que si el Idf de un reactivo es igual a 1.00, significa que éste fue respondido por todos los sujetos correctamente. ¿Cuál es el valor óptimo de Idf? Eso depende, principalmente, de dos factores: los propósitos de la prueba y la cantidad de opciones de respuesta de sus reactivos. Por ejemplo: si la prueba busca identificar un porcentaje reducido de estudiantes que represente a quienes tuvieron el mejor aprovechamiento durante un curso escolar, entonces la prueba debe tener un grado de dificultad tal que Idf tenga un valor medio bajo; en cambio si el propósito de la prueba es abarcar también a un reducido porcentaje de quienes obtuvieron un aprovechamiento por debajo de la media, entonces convendría que Idf tuviera un valor más elevado. Otro ejemplo: dependiendo de la cantidad de opciones de respuesta que tengan los reactivos, estos serán más o menos difíciles, o para decirlo con mayor precisión: “a mayor número de opciones de respuesta, mayor grado de dificultad del reactivo”; por ello, si un reactivo tiene sólo dos opciones de respuesta tendrá, en promedio, 0.85 de dificultad, uno con tres opciones tendrá 0.77 de dificultad, uno de cuatro opciones 0.74, uno de cinco 0.69, etc.

Idc mide la efectividad de un reactivo para discriminar entre quienes obtienen calificaciones altas y bajas en una prueba. Cuanto mayor sea Idc, mayor será la efectividad del reactivo para discriminar entre los estudiantes con calificaciones altas y bajas en la prueba como un todo, de manera que cuando Idc vale 1 (situación, ciertamente, muy improbable), significa que todos los estudiantes del grupo con mejor rendimiento en las calificaciones totales de la prueba y ninguno del grupo con el más bajo rendimiento respondió el reactivo correctamente. Pero, ¿cuál es el valor óptimo de Idc? Generalmente, se considera que un reactivo tiene un valor adecuado de Idc si éste es igual o mayor a 0.30; hay que considerar, no obstante, que Idf y Idc no son índices independientes y que el valor mínimo aceptable de Idc variará según sea el valor de Idf. Respecto al valor que puede adoptar Idc se han propuesto diferentes clasificaciones de rangos para interpretar la efectividad que presentan los reactivos de una prueba para discriminar. La Tabla 1 es un ejemplo de estas clasificaciones:


Idc = de .60 a 1.00

Muy buena discriminación

Idc = de .40 a .59

Buena discriminación

Idc = de .20 a .39

Moderada discriminación (Debe mejorarse el reactivo)

Idc = de - .19 a .19

No discrimina (El reactivo debe mejorarse o eliminarse)

Idc = de -.20 a -1.00

Fuerte discriminación negativa (Es necesario revisar el reactivo para identificar problemas: ¿Está mal la clave?, ¿Permite dos respuestas correctas?, etc.



Un caso práctico

Como parte de las prácticas que realizamos a nivel universitario en una materia donde se revisa, principalmente, el aspecto técnico de los instrumentos de medición en psicología y educación se solicita a los estudiantes analizar los índices de dificultad y de discriminación de algunas pruebas de rendimiento escolar con el propósito de valorar, desde el punto de vista estadístico, en qué casos los reactivos de esta clase de pruebas deben ser aceptados, rechazados o revisarse, nuevamente, para su mejora.

A continuación se presenta, paso a paso, cómo se calcula Idf y Idc para una prueba de rendimiento escolar de 9 reactivos [2] aplicada a 14 estudiantes, tomando como materia prima el ejercicio realizado por los alumnos Ana Iris Bello Acevedo, Vannessa del Rocío Hernández Manzanarez y Ricardo Alberto Islas Páez, todos ellos alumnos de la carrera de psicología de la UAA.

1. Con una matriz como la que se muestra en la Tabla 1, se anota el puntaje que los estudiantes obtuvieron en cada uno de los 9 reactivos, asignando 1 a las respuestas correctas y 0 a las respuestas incorrectas y procurando que la posición que ocupen los sujetos se ordene, de forma descendente, de acuerdo al total de respuestas correctas que cada uno obtuvo en la prueba, de tal suerte que el sujeto A sea quien tenga el mayor puntaje, en este caso 9 (equivalente al total de reactivos de la prueba), el sujeto B quien tenga el mismo o menor puntaje, y así sucesivamente, hasta llegar al sujeto N, con un puntaje de 2, el cual, lo posiciona en el último lugar de la matriz. Nótese que en la Tabla 2 estamos incluyendo una columna con “TP” [3] (Total Puntaje) como encabezado, para anotar el total de respuestas correctas que cada estudiante obtuvo en los 9 reactivos.

SUJETOS

REACTIVOS

TP

1

2

3

4

5

6

7

8

9

A

1

1

1

1

1

1

1

1

1

9

B

1

1

1

1

1

1

1

1

1

9

C

1

1

1

1

1

1

1

1

1

9

D

1

1

1

1

1

1

1

1

1

9

E

1

1

1

1

1

1

1

1

1

9

F

1

1

1

1

1

1

1

1

1

9

G

1

1

1

1

1

1

1

1

0

8

H

0

1

1

1

1

1

1

1

1

8

I

0

0

1

1

1

1

1

1

0

6

J

1

1

1

0

1

1

1

0

0

6

K

1

1

0

0

1

1

1

1

0

6

L

0

1

1

0

1

1

0

0

1

5

M

1

0

0

0

1

1

0

0

0

3

N

0

0

1

0

1

0

0

0

0

2

Tabla 2



2. Una vez que vaciamos, contabilizamos y ordenamos esta información en la matriz, debemos dividir la población que contestó los reactivos de la prueba en 3 grupos: a) El grupo superior, constituido por quienes obtuvieron el mayor número de respuestas correctas en la prueba; b) El grupo intermedio, formado por quienes tuvieron un rendimiento promedio en la prueba; y c) El grupo inferior, compuesto por quienes obtuvieron el menor número de respuestas correctas en la prueba; para hacer esta división y obtener estos tres grupos, se sugiere aplicar la siguiente fórmula: N x 27 / 100, donde N es el número total de sujetos que presentaron la prueba y 27 equivale al porcentaje que, de manera convencional, suele darse a los grupos superior e inferior.

En el caso que nos ocupa ahora, la población que contestó los reactivos de la prueba está integrada por 14 sujetos, siendo el resultado igual a 4, porque 14 x 27 / 100 = 3.78, que redondeado es igual a 4; por tanto, nuestros grupos superior e inferior están constituidos por los 4 primeros estudiantes de la matriz (sujetos A, B, C y D) y por los últimos 4 estudiantes (sujetos K, L, M y N), respectivamente. Pero, ¿qué pasa con el grupo intermedio? Para la obtención de Idf y Idc no necesitamos utilizar el 46% restante, correspondiente a quienes obtuvieron un rendimiento promedio, porque lo que nos interesa es discriminar entre quienes obtuvieron calificaciones altas y bajas en la prueba como un todo.

La matriz, después de determinarse los grupos superior e inferior de la población que contestó los reactivos, debe quedar como se demuestra en la Tabla 3:


Sujetos

Reactivos

PC

Grupos

1

2

3

4

5

6

7

8

9

A

1

1

1

1

1

1

1

1

1

9

SUPERIOR

B

1

1

1

1

1

1

1

1

1

9

C

1

1

1

1

1

1

1

1

1

9

D

1

1

1

1

1

1

1

1

1

9

E

1

1

1

1

1

1

1

1

1

9


F

1

1

1

1

1

1

1

1

1

9


G

1

1

1

1

1

1

1

1

0

8


H

0

1

1

1

1

1

1

1

1

8


I

0

0

1

1

1

1

1

1

0

6


J

1

1

1

0

1

1

1

0

0

6


K

1

1

0

0

1

1

1

1

0

6

INFERIOR

L

0

1

1

0

1

1

0

0

1

5

M

1

0

0

0

1

1

0

0

0

3

N

0

0

1

0

1

0

0

0

0

2

Tabla 3




3. Para determinar Idf, se recomienda aplicar la siguiente fórmula:

(A + B) / N

Donde:

A es el número de respuestas incorrectas del grupo superior en un reactivo,
B es el número de respuestas incorrectas del grupo inferior en un reactivo y
N es el número total de sujetos que integran el grupo superior e inferior.

Para saber qué reactivo será aceptado, rechazado o considerado como candidato para otra revisión, cada reactivo deberá ser valorado de acuerdo a un criterio de aceptación determinado, que en nuestro caso (por ser una prueba de rendimiento escolar), un criterio adecuado sería: si el resultado se encuentra entre 0.20 y 0.80, entonces el reactivo será aceptado.

En nuestro caso, la aplicación de la fórmula (A - B) / N en cada reactivo de la prueba y la valoración de los mismos de acuerdo al criterio de aceptación establecido arrojaría como resultado una matriz como la que se muestra en la Tabla 4:


Índices de dificultad (Idf)

Reactivos

Fórmula para calcular el Idf

¿Cumple con el criterio (0.20-0.80)?

1

(0 + 2) / 8 = 0.25

SI

2

(0 + 2) / 8 = 0.25

SI

3

(0 + 2) / 8 = 0.25

SI

4

(0 + 4) / 8 = 0.5

SI

5

(0 + 0) / 8 = 0

NO

6

(0 + 1) / 8 = 0.125

NO

7

(0 + 3) / 8 = 0.375

SI

8

(0 + 3) / 8 = 0.375

SI

9

(0 + 3) / 8 = 0.375

SI

Tabla 4




4. Para determinar Idc, se recomienda aplicar la siguiente fórmula:

(A - B) / (N / 2)

Donde

A es el número de respuestas correctas del grupo superior en un reactivo,
B es el número de respuestas correctas del grupo inferior en un reactivo y
N es el número total de sujetos pertenecientes a los grupos superior e inferior.

Nuevamente, cada reactivo deberá ser valorado de acuerdo a un criterio de aceptación determinado. El criterio para valorar cada reactivo y determinar si debemos aceptarlo, rechazarlo o considerarlo candidato para otra revisión será, en nuestro caso, que el valor de Idc sea, en cada reactivo, superior a 0.

La matriz que presentamos en la Tabla 5 es el resultado de aplicar la fórmula (A - B) / (N / 2) a cada reactivo de la prueba y de valorar estos de acuerdo al criterio de aceptación que establecimos en esta ocasión:


Índices de discriminación (Idc)

Reactivos

Fórmula para calcular el Idc

¿Cumple con el criterio (Superior a 0)?

1

(4 - 2) / (8 / 2) = 0.5

SI

2

(4 - 2) / (8 / 2) = 0.5

SI

3

(4 - 2) / (8 / 2) = 0.5

SI

4

(4 - 0) / (8 / 2) = 1

SI

5

(4 - 4) / (8 / 2) = 0

NO

6

(4 - 3) / (8 / 2) = 0.25

SI

7

(4 - 1) / (8 / 2) = 0.75

SI

8

(4 - 1) / (8 / 2) = 0.75

SI

9

(4 - 1) / (8 / 2) = 0.75

SI

Tabla 5



5. Falta todavía lo más importante. Hasta ahora sólo hemos hecho, por separado, el cálculo de Idf y Idc y la valoración de acuerdo a un criterio de aceptación para cada uno de los reactivos de la prueba, pero falta que comparemos los resultados que obtuvimos con ambos índices y las valoraciones que hicimos de cada reactivo según el criterio de aceptación que elegimos, con el propósito final de determinar si cada reactivo es un buen indicador del atributo que la prueba mide como un todo. Para ello basta con posicionar, uno junto a otro, los resultados que obtuvimos y decidir si aceptamos, rechazamos o consideramos que deben volverse a revisar cada uno de los reactivos de la prueba, de acuerdo a las siguientes consideraciones:

SI + SI = SI, el reactivo se acepta
SI + NO o NO + SI = NO, el reactivo debe revisarse nuevamente
NO + NO = NO, el reactivo se rechaza

La Tabla 6 muestra cómo queda está última etapa en el caso que hemos estado revisando:


Reactivos

Idf y valoración

Idc y valoración

Valoración final

1

0.25

SI

0.5

SI

SI

2

0.25

SI

0.5

SI

SI

3

0.25

SI

0.5

SI

SI

4

0.5

SI

1

SI

SI

5

0

NO

0

NO

NO

6

0.125

NO

0.25

SI

NO

7

0.375

SI

0.75

SI

SI

8

0.375

SI

0.75

SI

SI

9

0.375

SI

0.75

SI

SI

Tabla 6



De acuerdo a los resultados que tenemos en la tabla anterior, podemos concluir que de los reactivos analizados:

a) Los reactivos 1, 2, 3, 4, 7, 8 y 9 podemos aceptarlos porque cumplen con los criterios que establecimos con relación al grado de dificultad y de discriminación que tales reactivos deben tener.
b) El reactivo 5, en cambio, debemos rechazarlo porque no cumple con tales criterios de acuerdo a los resultados que obtuvimos en el análisis final
c) Finalmente el reactivo 6, por el análisis efectuado, debe revisarse nuevamente si queremos incluirlo, posteriormente, entre los reactivos con un nivel aceptable de dificultad y de discriminación.


Analizar, estadísticamente, los reactivos de una prueba de rendimiento escolar permite mejorar la prueba en cuanto al grado de dificultad y fineza discriminativa que resulta conveniente que ésta posea, pero, evidentemente, estos procedimientos atienden solamente a un aspecto de la construcción más adecuada de esta clase de instrumentos. Para tener una visión más general acerca de este proceso se sugiere al lector consultar el artículo La examinación escolar: teoría y práctica para su aplicación normal, publicado en este mismo blog.


Notas

[1] En algunos casos Idf y Idc pueden encontrarse como p y D, respectivamente.
[2] Es necesario aclarar que los 9 reactivos correspondientes a esta “prueba”, originalmente, formaban parte de una prueba más extensa (de 40 reactivos) que, para fines prácticos y didácticos, fue dividida y sus partes distribuidas entre varios equipos para su análisis estadístico. El análisis que se presenta en este artículo es el resultado de uno de esos trabajos.
[3] Originalmente, en lugar de “TP”, teníamos “PC”, es decir, Puntaje Crudo, que en psicometría hace referencia a las calificaciones que se obtienen, directamente, de las pruebas después de su aplicación, sin someterlas a ninguna clase de transformación estadística, como por ejemplo, convertirlas a puntajes z, Z, T, etc.


Referencias
  • Canudas González, Matilde (2005). Manual para el Curso-taller Estrategias para la Evaluación en la Educación Superior. México: Asociación Nacional de Universidades e Instituciones de Educación Superior.
  • Aiken, Lewis R. (1996). Tests psicológicos y evaluación. México: Prentice Hall.
  • Anastasi, A. (1998). Tests psicológicos. Madrid: Aguilar.
  • Brown F. (1998). Principios de la medición en psicología y educación. México: El Manual Moderno.

7 Comentarios:

Elda Valdez dijo...

Resumen: La revisión de los reactivos puede determinar cuán efectivos es cada respuesta de un grupo de sujetos. Para las pruebas de rendimiento escolar no hay criterios con los cuales se pueda determinar la validez de los reactivos, por lo cual se utiliza un procedimiento denominado de consistencia interna.

Índices de dificultad (Idf) y de discriminación (Idc):
(En algunos casos Idf y Idc pueden encontrarse como p y D, respectivamente).

La Idf señala la proporción de personas que respondieron correctamente el reactivo de una prueba. Idf tiene un rango de 0.00 a 1.00. Para determinar Idf, se aplica la siguiente fórmula: (A + B) / N Dónde: A es el número de respuestas incorrectas del grupo superior en un reactivo, B es el número de respuestas incorrectas del grupo inferior en un reactivo y N es el número total de sujetos que integran el grupo superior e inferior. Si el resultado se encuentra entre 0.20 y 0.80, entonces el reactivo será aceptado.

La Idc indica qué tan bien discrimina cada reactivo de la prueba entre las personas con un buen desempeño general en ella y aquellas que tuvieron un desempeño deficiente. Idc mide la efectividad de un reactivo para discriminar entre quienes obtienen calificaciones altas y bajas en una prueba. Cuanto mayor sea Idc, mayor será la efectividad del reactivo. Para determinar Idc, se recomienda aplicar la siguiente fórmula: (A - B) / (N / 2). Dónde: A es el número de respuestas correctas del grupo superior en un reactivo, B es el número de respuestas correctas del grupo inferior en un reactivo y N es el número total de sujetos pertenecientes a los grupos superior e inferior. El criterio para valorar cada reactivo y determinar si debemos aceptarlo, rechazarlo o considerarlo candidato para otra revisión será que el valor de Idc sea, en cada reactivo, superior a 0.

Los reactivos de una prueba de rendimiento escolar permiten mejorar la prueba en cuanto al grado de dificultad y fineza discriminativa que resulta conveniente que ésta posea.

Mi opinión: Se me hacen muy interesante este tipo de artículos, esto de los índices de dificultad y de discriminación se me hace muy útil y una manera muy fácil para analizar los reactivos y saber de qué manera se puede evaluar la dificultad que hay en ellos, también a que personas se le puede aplicar diferenciando el rendimiento ya sea bajo o alto de cada quien. Esto me servirá en la materia de medición y evaluación psicológica ya que voy a poder valorar desde un punto de vista estadístico los reactivos que pueden ser aceptados o rechazados.

Dony Tamayo dijo...

resumen: Analizar las respuestas que un grupo de sujetos da a los reactivos de una prueba tiene la función de ayudar a mejorar ésta, debido a que con la revisión de sus reactivos puede determinarse cuán efectivos son cada uno de ellos para medir el atributo que la prueba pretende medir como un todo.

El propósito de analizar los reactivos de una prueba de rendimiento escolar es que los reactivos que se seleccionen para su versión definitiva sean indicadores adecuados de lo que la prueba mide como un todo; para ello, cada uno de los reactivos que integran la prueba deberá evaluarse para determinar cuán difíciles son y en qué grado sirven para diferenciar entre quienes presentan un rendimiento alto y bajo en la prueba, lo cual será posible, gracias al cálculo de sus índices de dificultad y de discriminación



Índices de dificultad (Idf) y de discriminación (Idc) [1]

Mientras que Idf señala la proporción de personas que respondieron correctamente el reactivo de una prueba, Idc indica qué tan bien discrimina cada reactivo de la prueba entre las personas con un buen desempeño general en ella y aquellas que tuvieron un desempeño deficiente. Veamos a continuación, más detenidamente, cada uno de estos índices.
Idc mide la efectividad de un reactivo para discriminar entre quienes obtienen calificaciones altas y bajas en una prueba. Cuanto mayor sea Idc, mayor será la efectividad del reactivo para discriminar entre los estudiantes con calificaciones altas y bajas en la prueba como un todo, de manera que cuando Idc vale 1 (situación, ciertamente, muy improbable), significa que todos los estudiantes del grupo con mejor rendimiento en las calificaciones totales de la prueba y ninguno del grupo con el más bajo rendimiento respondió el reactivo correctamente




Mi opinión: Los análisis de reactivos es un tema muy interesante y aparte que tiene mucha utilidad ya que estos nos sirven para saber la exactitud que se obtiene de cualquier análisis y son muy fáciles nos pueden indicar como son de difíciles y nos ayudan para diferenciar entre quienes presentan un rendimiento alto y bajo en la prueba y así no tener ningún problema . Estos podemos utilizar con cualquier tipo de análisis.

Socorro Mera dijo...

Resumen:
Analizar las respuestas que un grupo de sujetos da a los reactivos de una prueba tiene la función de ayudar a mejorar ésta.
El propósito de analizar los reactivos de una prueba de rendimiento escolar es que los reactivos que se seleccionen para su versión definitiva sean indicadores adecuados de lo que la prueba mide como un todo.

Índices de dificultad (Idf) y de discriminación (Idc):

Mientras que Idf señala la proporción de personas que respondieron correctamente el reactivo de una prueba, Idc indica qué tan bien discrimina cada reactivo de la prueba entre las personas con un buen desempeño general en ella y aquellas que tuvieron un desempeño deficiente.

El Idf tiene un rango de 0.00 a 1.00. Cuando el Idf de un reactivo es igual a 0.00 significa que ningún sujeto lo contestó correctamente, mientras que si el Idf de un reactivo es igual a 1.00, significa que éste fue respondido por todos los sujetos correctamente.
¿Cuál es el valor óptimo de Idf? Eso depende, principalmente, de dos factores: los propósitos de la prueba y la cantidad de opciones de respuesta de sus reactivos. Por ejemplo: si la prueba busca identificar un porcentaje reducido de estudiantes que represente a quienes tuvieron el mejor aprovechamiento durante un curso escolar, entonces la prueba debe tener un grado de dificultad tal que Idf tenga un valor medio bajo.

Idc mide la efectividad de un reactivo para discriminar entre quienes obtienen calificaciones altas y bajas en una prueba. Cuanto mayor sea Idc, mayor será la efectividad del reactivo para discriminar entre los estudiantes con calificaciones altas y bajas en la prueba como un todo, de manera que cuando Idc vale 1 (situación, ciertamente, muy improbable), significa que todos los estudiantes del grupo con mejor rendimiento en las calificaciones totales de la prueba y ninguno del grupo con el más bajo rendimiento respondió el reactivo correctamente.

Los reactivos de una prueba de rendimiento escolar permiten mejorar la prueba en cuanto al grado de dificultad y fineza discriminativa que resulta conveniente que ésta posea.

Opinión: Es interesante la manera en como se puede realizar este tipo de clasificaciones y análisis de reactivos para mejorar las pruebas, saber cuales son correctas y cuales no. En lo personal se me hizo algo tediosa la manera para sacar dichos resultados, no difícil ya que te indica paso a paso con las formulas, pero si algo tediosa. Imagino que esto nos servirá en la clase de medición y evaluación y nosotros podremos llevar a cabo este tipo de clasificaciones :)

Sarahi Rosas dijo...

Resumen: Analizando las respuestas que un grupo de sujetos da a los reactivo de una prueba tiene como su fusión ayudar a mejorarla ya que con la revisión de sus reactivos puede determinarse cuanto de efectivos son cada uno de ellos para medir el atributo de lo que la prueba pretenda medir.
Para las pruebas de rendimiento escolar como en un examen, no hay generalmente criterios con los cuales se pueden determinar la validez de los reactivos que implicara la correlación entre el porcentaje de sujetos que contestan correctamente cada reactivo, con alguna medida de criterio externo por el cual se utiliza un procedimiento denominado de consistencia interna con el que se sustituye el criterio externo por las calificaciones totales de la misma.
Índices de dificultad idf y de discriminación idc
Idf señala las porción de personas que contestan correctamente el idc indica que tan bien discrimina cada reactivo de la prueba entre las personas con un buen desempeño general en ellas y aquellas que tuvieron un desempleo deficiente.
Opinión: Me parece muy interesante analizar respuestas de un grupo de sujetos que da a los reactivos de una prueba así se determina cuanto de efectivos son cada uno de ellos, en lo personal a mí esto me estimula a estudiar y a dar lo mejor de mí para irme superando y así las cosas me salgan mejor, esto me hace sentir más realizada como alumna y a seguir en la meta que me he propuesto.

rebeca flores dijo...

Resumen: Analizar las respuestas que un grupo de sujetos da a los reactivos de una prueba tiene la función de ayudar a mejorar ésta, debido a que con la revisión de sus reactivos puede determinarse mas efectivos son cada uno de ellos para medir el atributo que la prueba pretende medir como un todo.

El propósito de analizar los reactivos de una prueba de rendimiento escolar es que los reactivos que se seleccionen para su versión definitiva sean indicadores adecuados de lo que la prueba mide como un todo.

Índices de dificultad (Idf) y de discriminación (Idc)

Idf señala la proporción de personas que respondieron correctamente el reactivo de una prueba.

Idc indica qué tan bien discrimina cada reactivo de la prueba entre las personas con un buen desempeño general en ella y aquellas que tuvieron un desempeño deficiente.

Idf tiene un rango de 0.00 a 1.00. Cuando el Idf de un reactivo es igual a 0.00 significa que ningún sujeto lo contestó correctamente, mientras que si el Idf de un reactivo es igual a 1.00, significa que éste fue respondido por todos los sujetos correctamente.

Idc mide la efectividad de un reactivo para discriminar entre quienes obtienen calificaciones altas y bajas en una prueba. Cuanto mayor sea Idc, mayor será la efectividad del reactivo para discriminar entre los estudiantes con calificaciones altas y bajas en la prueba como un todo, de manera que cuando Idc vale 1 , significa que todos los estudiantes del grupo con mejor rendimiento en las calificaciones totales de la prueba y ninguno del grupo con el más bajo rendimiento respondió el reactivo correctamente.

Mi opinion: Es interesante el articulo en analizar las respuestas de una prueba ya sea de un grupo o del sujeto.
Se puede evaluar los reactivos en dificultad de cada prueba.
Tambien se pueden evaluar el rendimiento escolar esta prueba mide como un todo e indicar que rendimiento es mas alto o bajo .

helen zavala dijo...

Analizar las respuestas que un grupo de sujetos da a los reactivos de una prueba tiene la función de ayudar a mejorar ésta, debido a que con la revisión de sus reactivos puede determinarse cuán efectivos son cada uno de ellos para medir el atributo que la prueba pretende medir como un todo.

Para las pruebas de rendimiento escolar (los exámenes que se aplican en el salón de clases) no hay, generalmente, criterios con los cuales poder determinar la validez de los reactivos (que implicaría, como es de suponerse, la correlación entre el porcentaje de sujetos que contestan correctamente cada reactivo con alguna medida de criterio externo), motivo por el cual, se utiliza un procedimiento denominado de consistencia interna con el que se sustituye el criterio externo por las calificaciones totales de la misma.

El propósito de analizar los reactivos de una prueba de rendimiento escolar es que los reactivos que se seleccionen para su versión definitiva sean indicadores adecuados de lo que la prueba mide como un todo.
ndices de dificultad (Idf) y de discriminación (Idc) [1]

Mientras que Idf señala la proporción de personas que respondieron correctamente el reactivo de una prueba, Idc indica qué tan bien discrimina cada reactivo de la prueba entre las personas con un buen desempeño general en ella y aquellas que tuvieron un desempeño deficiente. Veamos a continuación, más detenidamente, cada uno de estos índices.

Idf tiene un rango de 0.00 a 1.00. Cuando el Idf de un reactivo es igual a 0.00 significa que ningún sujeto lo contestó correctamente, mientras que si el Idf de un reactivo es igual a 1.00, significa que éste fue respondido por todos los sujetos correctamente. ¿Cuál es el valor óptimo de Idf? Eso depende, principalmente, de dos factores: los propósitos de la prueba y la cantidad de opciones de respuesta de sus reactivos.
Idc mide la efectividad de un reactivo para discriminar entre quienes obtienen calificaciones altas y bajas en una prueba. Cuanto mayor sea Idc, mayor será la efectividad del reactivo para discriminar entre los estudiantes con calificaciones altas y bajas en la prueba como un todo, de manera que cuando Idc vale 1 (situación, ciertamente, muy improbable), significa que todo.
Como parte de las prácticas que realizamos a nivel universitario en una materia donde se revisa, principalmente, el aspecto técnico de los instrumentos de medición en psicología y educación se solicita a los estudiantes analizar los índices de dificultad y de discriminación de algunas pruebas de rendimiento escolar con el propósito de valorar, desde el punto de vista estadístico, en qué casos los reactivos de esta clase de pruebas deben ser aceptados, rechazados o revisarse, nuevamente, para su mejora.

mi opinión: creo que es muy interesante el tema , ya que muchas alguna ves nos preguntamos el como le hacen los maestro o aplacadores para poder calificar un examen. y te das cuenta que existen tablas donde hay valores ya dados y como es que todo tiene una razón de ser. para la valoración de una calificación y el conocimiento de una persona, si su calificación es arriba del promedio y es baja.

Angelica dijo...

Resumen: El propósito de analizar los reactivos de una prueba de rendimiento escolar es que los reactivos que se seleccionen para su versión definitiva sean indicadores adecuados de lo que la prueba mide como un todo; para ello, cada uno de los reactivos que integran la prueba deberá evaluarse para determinar cuán difíciles son y en qué grado sirven para diferenciar entre quienes presentan un rendimiento alto y bajo en la prueba, lo cual será posible, gracias al cálculo de sus índices de dificultad y de discriminación.

Índices de dificultad (Idf) y de discriminación (Idc) [1]

Mientras que Idf señala la proporción de personas que respondieron correctamente el reactivo de una prueba, Idc indica qué tan bien discrimina cada reactivo de la prueba entre las personas con un buen desempeño general en ella y aquellas que tuvieron un desempeño deficiente.
Idf tiene un rango de 0.00 a 1.00. Cuando el Idf de un reactivo es igual a 0.00 significa que ningún sujeto lo contestó correctamente, mientras que si el Idf de un reactivo es igual a 1.00, significa que éste fue respondido por todos los sujetos correctamente. ¿Cuál es el valor óptimo de Idf? Eso depende, principalmente, de dos factores: los propósitos de la prueba y la cantidad de opciones de respuesta de sus reactivos.
Idc mide la efectividad de un reactivo para discriminar entre quienes obtienen calificaciones altas y bajas en una prueba. Cuanto mayor sea Idc, mayor será la efectividad del reactivo para discriminar entre los estudiantes con calificaciones altas y bajas en la prueba como un todo, de manera que cuando Idc vale 1 (situación, ciertamente, muy improbable), significa que todos los estudiantes del grupo con mejor rendimiento en las calificaciones totales de la prueba y ninguno del grupo con el más bajo rendimiento respondió el reactivo correctamente. Pero, ¿cuál es el valor óptimo de Idc? Generalmente, se considera que un reactivo tiene un valor adecuado de Idc si éste es igual o mayor a 0.30; hay que considerar, no obstante, que Idf y Idc no son índices independientes y que el valor mínimo aceptable de Idc variará según sea el valor de Idf.

Opinión:Resulta interesante el analizar las respuestas que un grupo de sujetos da a los reactivos de una prueba tiene la función de ayudar a mejorar ésta, debido a que con la revisión de sus reactivos puede determinarse cuán efectivos son cada uno de ellos para medir el atributo que la prueba pretende medir.



El contenido plasmado en este blog es producto de la reflexión de su autor, de sus colaboradores y de los pensadores que en él se citan. Cualquier semejanza con la realidad o alguna ficcón literaria, televisiva, psicótica paranoide o de cualquier otra índole es mera coincidencia

Periplos en red busca crear espacios intelectuales donde los universitarios y académicos expresen sus inquietudes en torno a diferentes temas, motivo por el cual, las opiniones e ideas que expresan los autores no reflejan necesariamente las de Periplos en red , porque son responsabilidad de quienes colaboran para el blog escribiendo sus artículos.



Periplos en Red

Grab this Headline Animator

 
Ir Abajo Ir Arriba