Estatus científico del test de Rorschach

Weiner (1997) plantea que el Test de Rorschach, cuando es administrado y codificado con el Sistema Comprehensivo, goza de un adecuado estatus científico ya que satisface requerimientos psicométricos tales como concordancia entre codificadores, razonable confiabilidad, validez y datos normativos; todos ellos considerados indicadores de la solidez psicométrica de cualquier instrumento de medida.

Concordancia entre codificadores
En lo que se refiere a la concordancia entre los codificadores, entendida como el grado de asociación entre codificaciones realizadas entre jueces expertos, Exner (1993, c.p. Weiner, 1997) propone que todas las variables codificadas en el Sistema Comprehensivo pueden ser confiablemente puntuadas. Los niveles de acuerdo encontrados excedieron el 90% para Localización, Pares, Populares y Z; son un tanto más bajos para Calidad Formal y categorías de Contenidos; y disminuye aproximadamente a un 80% para Determinantes y Códigos Especiales. En este orden ideas, Ritzler (1995) afirma que cada variable en el Sistema Comprehensivo ha demostrado tener una concordancia sustancial entre codificadores.

McDowell y Acklin (1996) reportaron una media general de concordancia del 87%. Similarmente, Meyer (1997), plantea que el Sistema Comprehensivo tiene una excelente concordancia entre jueces, con valores estimados de los kappa de Cohen que varían entre 0.72 y 0.96, teniendo una media de 0.86. Más recientemente, Acklin, McDowell, Verschell y Chan (2000) indicaron que codificadores bien entrenados y experimentados pueden aplicar la mayoría de los códigos de una manera consistente; específicamente, sus resultados plantean que el 41% mostró valores kappa en el rango de excelente concordancia (k ≥ 0.81), 36% mostró valores kappa en el rango de concordancia sustancial (de k = 0.61 hasta 0.81) y 25% mostró valores kappa en el rango de concordancia inaceptable (k < 0.61). La media y la mediana de los valores kappa de todos los códigos en la muestra de sujetos no pacientes estuvieron en el rango superior de concordancia sustancial, y fueron de 0.726 y 0.776, respectivamente.

Por otro lado, cuando en el estudio de Acklin y cols. (2000) se analizó el grado de concordancia entre codificadores que evaluaban a una muestra clínica se obtuvo que el 47% mostró valores kappa en el rango de excelente concordancia (k ≥ 0.81), 44% mostró valores kappa en el rango de concordancia sustancial (de k = 0.61 hasta 0.81) y 9% mostró valores kappa en el rango de concordancia inaceptable (k < 0.61). La media y la mediana de los valores kappa de todos los códigos en la muestra clínica estuvieron en el rango superior de concordancia sustancial, y fueron de 0.784 y 0.798, respectivamente.

En contraste, Hunsley y Bailey (1999) aseguran que aunque existe evidencia que muchas de las principales variables usadas en el Sistema Comprehensivo pueden tener concordancia, las investigaciones que respaldan esta evidencia son cuestionables. Los autores argumentan que debe ser buscada una metodología más apropiada para evaluar el acuerdo en la codificación entre jueces. Sin embargo, tal como señaló Viglione (1999), han sido demostrados en la mayoría de los estudios acuerdos en la concordancia entre jueces adecuados independientemente del método para evaluarlo.

Adicionalmente, Hunsley y Bailey (1999) expresaron preocupación en relación a que la codificación confiable depende de las habilidades de codificar de los evaluadores y cuestionan, en consecuencia, la concordancia en la práctica clínica de rutina. En defensa, Weiner (2001a) sostiene que cualquier error individual que puede cometer un evaluador en la codificación habla de su falta de habilidad más que un problema psicométrico intrínseco del Rorschach y sus criterios de codificación. Además, el manual de codificación del Rorschach para el Sistema Comprehensivo de Exner provee detallados criterios para codificar y una extensa parte de ejercicios prácticos de codificación.

Otras críticas en relación a la concordancia entre codificadores las materializan Wood, Lilienfeld, Nezworski y Garb (2001), quienes plantean que el monto de concordancia de muchas puntuaciones del Sistema Comprehensivo es considerablemente más bajo de lo que se había asumido inicialmente y que algunas variables tienen un nivel de concordancia entre codificadores que es cuestionable para el trabajo clínico o forense. Sin embargo, Viglione y Hilsenroth (2001) sostienen que los datos empíricos respaldan la concordancia entre jueces, debido a que la gran mayoría de las variables estructurales (95%) son codificadas con una concordancia buena o excelente; además, estos autores proponen que variables tales como Calidad Formal, Códigos Especiales, Proporción Forma – Color, Sombreados, Calidad Evolutiva (DQv y DQv/+) y algunas categorías de Contenido podrían ser mejoradas. Similarmente, Meyer, Hilsenroth, Baxter, Exner, Fowler, Pers, y Resnick (2002) observaron medianas y medias de concordancia entre jueces de 0.92 y 0.90, respectivamente; de las 164 variables examinadas en dicha investigación, el 95% cumplió con los criterios de correlación de excelente concordancia y ninguna mostró tener poca concordancia.

Un reciente estudio de Viglione y Taylor (2003) brindó apoyo empírico a la concordancia entre codificadores. En este sentido, sus resultados confirman la fuerte evidencia empírica de los estudios que apoyan concordancia entre codificadores del Rorschach, cuando se realiza tanto por personas bien entrenadas como por diversos grupos de investigadores y clínicos. Para dicho autor, la concordancia es especialmente fuerte y consistente para las variables que son usadas por la mayoría de los clínicos para la interpretación.

Un problema cercano a la concordancia entre codificadores es el relativo a la precisión en la codificación, entendiendo esto último como la existencia de cierto estándar de qué constituye la única codificación correcta para una respuesta dada. En este sentido, Guarnaccia, Dill, Sabatino, y Southwick (2001) sostienen que el total de precisión en la codificación, tanto para evaluadores estudiantes como profesionales, se encuentra cerca de niveles aceptables en sujetos no pacientes. Además, en algunas categorías, la media de precisión en la codificación no estaba muy lejos del límite crítico (80%). Por otro lado, el total de precisión en la codificación en las respuestas de los sujetos pacientes fue muy pobre. El hecho de que tanto profesionales como estudiantes cometan más errores con sujetos pacientes se puede deber a que las respuestas de los sujetos pacientes contienen verbatum más vagos e imprecisos y una alta concentración de códigos especiales. También es evidente, en estos hallazgos, una variación en el nivel de dificultad en la codificación de algunas categorías sobre otras. De esta manera, los determinantes, FQ, y los códigos especiales fueron los más susceptibles de error; por otro lado, la codificación es más precisa en la Localización, DQ, Pares, Populares y Z. En consecuencia, los autores sugieren que altos niveles de error pueden existir en la codificación con el uso del Sistema Comprehensivo y puede ser necesario elaborar un entrenamiento estándar para asegurar codificaciones precisas.

Confiabilidad
Como se planteó anteriormente, un segundo requerimiento para el estatus científico de un instrumento es un nivel adecuado de confiabilidad, el cual se refiere a la consistencia de las puntuaciones obtenidas por las mismas personas cuando se las examina en distintas ocasiones con el mismo test (Anastasi y Urbina, 1998). En relación a esto, la confiabilidad del Rorschach ha sido documentada en una serie de estudios re-test tanto con niños como con adultos, con un intervalo del re-test que oscila entre 7 días y 3 años. Específicamente, en los 100 adultos no pacientes que fueron examinados después de 3 años, se encontró que 13 variables mostraron coeficiente de estabilidad de 0.80 o más (Zf, Lambda, M, Ma, FC, SumC, Proporción Afectiva, SumT, SumV, X+%, Índice de egocentrismo, Sum6 y EA); otras 6 variables tuvieron coeficientes de estabilidad superiores a 0.70, éstas son: Número de respuestas (R), Mp, CF+C, Populares, FM y es (Exner y Weiner, 1995, c.p. Weiner 1997).

Acorde con lo expuesto, Viglione (1999) concluyó en su estudio que la gran mayoría de las variables y configuraciones del Sistema Comprehensivo del Rorschach han mostrado coeficientes de confiabilidad significativos. Incluso, algunos críticos del Rorschach han afirmado que la mayoría de las variables del Sistema Comprehensivo tienen una adecuada confiabilidad test-retest (Hunsley y Bailey, 1999).

Garb, Wood, Nezworski, Grove y Stejskal (2001) critican que aún cuando el Sistema Comprehensivo tiene al menos 125 variables, Exner y sus colegas han reportado coeficientes test-retest sólo para 51 variables. Por otro lado, Viglione y Hilsenroth (2001) explican que la gran mayoría de las variables del Sistema Comprehensivo con una consistencia temporal fuerte, son variables centrales en la interpretación y, de las 51 variables identificadas por Garb y cols. (2001) con coeficientes test-retest, el 90% (46 variables) son centrales. Asimismo, Viglione y Hilsenroth (2001) comentan que la gran mayoría de las variables sin coeficientes de confiabilidad test-retest identificados por Garb y cols. (2001) no están incluidas en proporciones, índices, porcentajes y derivaciones centrales y la mayoría tienen una interpretación secundaria.

Recientemente, Gronnerod (2003) investigó la estabilidad temporal en el Rorschach y los resultados mostraron altos niveles de confiabilidad general. Los niveles de estabilidad combinados no ponderados para un período de más de 3 años van de 0.68 a 0.73; cuando los modelos de regresión fueron usados para predecir los niveles de estabilidad, los valores predichos estuvieron entre 0.77 a 0.97 para retest inmediatos y variaron de 0.65 a 0.90 después de 5 años; el patrón que emerge en este modelo indica niveles de estabilidad de 0.80 y más, lo que es sustancial.

Validez
La validez de una prueba también se considera un requerimiento psicométrico que da cuenta de su estatus científico. De manera general, Hunsley y Bailey (1999; 2001) sostienen que el Rorschach es un test con poco o ningún criterio o constructo de validez. No obstante, los estudios meta-analíticos realizados por Hiller, Rosenthal, Bornstein, Berry y Brunell-Neuleib (1999) y Rosenthal, Hiller, Bornstein, Berry y Brunell-Neuleib (2001) revelan lo contrario. Específicamente, se puede hablar de validez utilizando como criterios otras pruebas, un diagnóstico psiquiátrico, o bien, criterios objetivos.

a) Validez de criterio relacionada con otras pruebas de personalidad.
En lo referente a la relación entre el Rorschach y otras pruebas, Meyer (1992) plantea que la estructura factorial del Rorschach es distinta a las dimensiones Extraversión-Afecto positivo y Neuroticismo-Afecto negativo; estas dos dimensiones se han convertido en los paradigmas más ampliamente aceptados para el estudio de la personalidad y el humor con medidas de auto-reporte. Aunque algunos pueden considerar estos hallazgos como una crítica de la validez del Rorschach, Meyer (1992) argumenta que las medidas de auto-reporte cubren sólo ciertos aspectos limitados de la personalidad, del funcionamiento emocional y sugiere que la información de las medidas de auto-reporte no debería ser utilizada en los estudios de validez criterial del Rorschach.

Para Weiner, la validez del Rorschach fue confirmada en una serie de estudios de revisiones meta-analíticas que condujeron Parker, Hanson y Hunsley (1988, c.p. Weiner 1997). Así, el coeficiente de validez convergente estimado fue de 0.41 para el Rorschach y 0.46 para el MMPI, no existiendo diferencias estadísticamente significativas entre estos valores.

En una comparación meta-analítica de coeficientes de validez de criterio relacionados entre el MMPI y el Rorschach (Hiller y cols., 1999), se encontró que ambos instrumentos tienen una magnitud del efecto de la validez sustancial (Media no ponderada r = 0.30 y 0.29 para el MMPI y el Rorschach respectivamente). Aunque con valores inferiores al estudio de Parker y cols. (1988, c.p. Weiner 1997), tiene en común con el estudio de Hiller y cols. (1999) que la validez estimada tanto para el MMPI como para el Rorschach no eran significativamente diferentes una de otra.

Este mismo estudio de Hiller y cols. (1999), arroja que el MMPI tiene coeficientes de validez más grandes que el Rorschach en estudios que usan medidas de auto-reporte como variables de criterio (Media no ponderada r = 0.39 y 0.23 para el MMPI y el Rorschach respectivamente).

Por otro lado, Meyer, Riethmiller, Brooks, Benoit y Handler (2000) sugieren que la validez convergente del Rorschach y los constructos del MMPI-2 parece ser parcialmente una función de cómo el paciente interactúa con las pruebas. En este sentido, cuando los pacientes se aproximan a cada prueba de manera similar, constructos conceptualmente alineados tienden a correlacionar positivamente, cuando los pacientes se aproximan a cada test en forma opuesta, constructos conceptualmente alineados tienden a correlacionar negativamente; finalmente, cuando los estilos de interacción con los test son ignorados, constructos conceptualmente alineados tienden a no correlacionar.

Bornstein (2001) arguye que, aunque correlaciones modestas entre el Rorschach y puntuaciones de cuestionarios o entrevistas han sido presentados como evidencia en contra de la validez convergente del test, para él lo contrario también es cierto: algunos hallazgos sostienen la validez discriminante de la medida.

Por su parte, Wood y cols. (2001), plantean que una determinada medida de un constructo debería correlacionar con otras medidas del mismo constructo. No obstante, Bornstein (2001) argumenta que una falta de correlación con otras medidas constituye evidencia positiva de validez discriminante. Tal posición, según Wood y cols.(2001), permite encontrar virtualmente cualquier hallazgo correlacional para ser interpretado como sustento de validez del Rorschach; en este sentido, una correlación positiva puede ser interpretada como evidencia de validez convergente, mientras que una correlación nula o modesta puede ser interpretada como evidencia de validez discriminante. Por tanto, si resultados contrarios pueden ser interpretados como sustento del Rorschach, entonces es imposible para el estudio “falsear”, desde un punto de vista popperiano, hipótesis concernientes a la validez del Rorschach.

b) Validez de criterio asociada a diagnósticos psiquiátricos
En cuanto a la relación entre el Rorschach y los diagnósticos psiquiátricos, Weiner (1997) establece que el Sistema Comprehensivo del Rorschach provee índices de esquizofrenia (SCZI) y de depresión (DEPI) que pueden ser útiles en la identificación de estas dos condiciones, siempre que ellos no sean usados de una manera actuarial descontextualizada, sino a la luz de numerosos requisitos y consideraciones especiales. Es decir, algunas puntuaciones del Sistema Comprehensivo están relacionadas con diagnósticos psiquiátricos y pueden ser utilizadas para propósitos diagnósticos.

Al evaluarse la validez con el diagnóstico psiquiátrico como variable de criterio, el estudio meta-analítico de Hiller y cols. (1999) apunta que el MMPI tiene coeficientes de validez más altos que el Rorschach (Media no ponderada r = 0.37 y 0.18 para el MMPI y el Rorschach respectivamente). Posteriormente, Weiner (2000) plantea que el conocimiento acerca del funcionamiento de la personalidad obtenido a partir del Rorschach puede contribuir a la formulación diagnóstica, pero las asociaciones entre los índices del Rorschach y las categorías diagnósticas psicométricamente poco firmes, no son esperadas. A su vez, sugiere que el Rorschach no es un test diagnóstico sino un instrumento de evaluación de la personalidad diseñado con la intención de medir aspectos estructurales y dinámicos de la misma.

Adicionalmente, ante las críticas de los adversarios del Rorschach, Weiner (2000) asegura que no se debería estar preocupado si el Rorschach muestra sólo modestas correlaciones con los trastornos del Diagnostic and Statistical Manual of Mental Disorders (4th ed. [DSM-IV]; American Psychiatric Association, 1994). Esta aseveración se apoya en la idea de que el DSM-IV es un esquema de clasificación inferencial que: a) constituye una abstracción, más que una conducta real; b) consta de diagnósticos ampliamente variables en su confiabilidad y validez; y c) trata como categorías una multitud de dimensiones y condiciones que se solapan, incluyendo la mayoría de los diagnósticos del Eje II. Dado que el DSM-IV es un esquema nosológico inferencial psicométricamente poco firme ya que involucra criterios y definiciones que cambian de una revisión a la otra, lo que es interesante e importante en la práctica clínica y en la investigación es si la evaluación con el Rorschach puede identificar de manera precisa puntos fuertes y débiles de la personalidad que tienen implicaciones en el plan de tratamiento.

En este mismo orden de ideas, para Bornstein (2001), los esfuerzos para evaluar la validez y la utilidad del Rorschach, utilizando el grado en el cual las puntuaciones se asocian con los diagnósticos y síntomas del DSM-IV son equivocados e inapropiados. De esta manera, el Rorschach no es una herramienta diagnóstica y sus resultados no deberían correlacionar fuertemente con los criterios del DSM-IV debido a que los diagnósticos están basados en auto-reportes. El criterio diagnóstico del DSM-IV es problemático en muchos aspectos y, además, los procesos psicológicos medidos por el Rorschach están relacionados sólo indirectamente con los síntomas del DSM-IV. Aún cuando el Rorschach no es una herramienta diagnóstica “per se”, puede ser de mucho valor al hacer predicciones en el encuadre clínico; esto es especialmente cierto para aquellas predicciones que se centran en procesos psicológicos que son inaccesibles al reporte verbal. En tales situaciones, el Rorschach puede ser superior a las medidas de auto-reporte tradicionales.

Wood, Lilienfeld, Garb y Nezworski (2000a, 2000b) concluyeron que a pesar de unos pocos hallazgos positivos, el Rorschach ha demostrado poca validez como una herramienta diagnóstica. Aunque Wood y cols. (2000a) comparten con Bornstein (2001) y Weiner (2000) que el Rorschach no está relacionado con la mayoría de los diagnósticos psiquiátricos, estos últimos interpretan este hecho de manera muy diferente, pues para ellos, los hallazgos negativos no despiertan dudas acerca de la validez del Rorschach; sin embargo, Wood y cols. (2000a) no comparten esta suposición, tomando dichos hallazgos negativos como evidencias de una menor validez del test.

En un análisis histórico realizado por Wood y cols.(2000a), señalan que por muchos años, todos los expertos en Rorschach sostuvieron que era una medida válida para el diagnóstico psiquiátrico y que Exner daba nombres a muchos índices del Sistema Comprehensivo que implicaban una utilidad diagnóstica (SCZI, DEPI y OBS). Además, estos autores insinúan que sólo ahora, cuando las investigaciones han mostrado evidencia negativa, Bornstein (2001) y Weiner (2000) asumen que el test no debería realmente estar relacionado con los diagnósticos. En consecuencia, Wood y cols. (2000a) plantean que numerosos hallazgos negativos referentes al Rorschach y los diagnósticos psiquiátricos tienen mucho que decir a los psicólogos acerca de la validez y utilidad del Rorschach.

Con respecto a las correlaciones existentes entre el MMPI y el Rorschach con los diagnósticos del DSM-IV, Weiner (2000) expresa que el MMPI muestra correlaciones más altas con las categorías del DSM-IV que el Rorschach, ya que a diferencia de éste último, el MMPI fue derivado empíricamente en diferentes grupos diagnósticos y eso involucra el mismo tipo de metodología de auto-reporte que los clínicos emplearon en usar descripción de síntomas para determinar un diagnóstico del DSM-IV.

c) Validez de criterio asociada a variables conductuales
Weiner (2001a) plantea que la validez de un instrumento debería ser juzgada principalmente por sus correlaciones con variables observables más que inferidas como los instrumentos de medición de personalidad. De hecho, Viglione (1999) enfatizó en su estudio la importancia de validar el Rorschach con variables conductuales o criterios de la vida real. En este sentido, al evaluarse la validez con variables objetivas como criterio, el estudio meta-analítico de Hiller y cols. (1999) apunta a que el Rorschach tiene coeficientes de validez significativamente más grandes que el MMPI (Media no ponderada r = 0.37 y 0.20 para el Rorschach y el MMPI respectivamente).

Datos Normativos
Finalmente, los datos normativos constituyen un último requerimiento psicométrico para la consideración del estatus científico de un instrumento de medida; en este sentido, el Sistema Comprensivo provee estadísticos descriptivos detallados para cada una de sus variables en diversas muestras, entre ellas 700 adultos no pacientes, estratificados por distribución geográfica y por nivel socioeconómico en Estados Unidos; 1390 niños y adolescentes no pacientes separados por edad de los 5 a los 16 años; grupos de pacientes psiquiátricos adultos, que incluye 320 esquizofrénicos hospitalizados, 315 pacientes depresivos hospitalizados, 440 pacientes externos con diagnósticos inespecificados y 180 pacientes externos con trastornos caracteriales (Exner, 1994).

REFERENCIAS

Acklin, M., McDowell, C., Verschell, M., y Chan, D. (2000). Interobserver agreement, intraobserver agreement, and the Rorschach Comprehensive System. Journal of Personality Assessment. 74 (1) 15 – 47.

Anastasi, A. y Urbina, S. (1998). Test Psicológicos. Séptima Edición. México: Prentice Hall.

Bornstein, R. (2001). Clinical utility of the Rorschach inkblot method: Reframing the debate. Journal of Personality Assessment. 77 (1), 39 – 47.

Exner, J., Jr. (1994). El Rorschach. Un sistema comprehensivo: Fundamentos básicos. Volumen 1. Tercera edición. Madrid: Rorschach Workshop Psimática.

Garb, H., Wood, J., Nezworski, M., Grove, W., y Stejskal, W. J. (2001). Toward a resolution of the Rorschach controversy. Psychological Assessment, 13 (4) 433 – 448.

Gronnerod, C. (2003). Temporal stability in the Rorschach Method: A meta – analytic review. Journal of Personality Assessment. 80 (3), 272 – 293.

Guarnaccia, V., Dill, C., Sabatino, S. y Southwick, S. (2001). Scoring accuracy using the comprehensive system for the Rorschach. Journal of Personality Assessment. 77 (3), 464 – 474.

Hiller, J., Rosenthal, R., Bornstein, R., Berry, D., y Brunell-Neuleib, S. (1999). A comparative meta-analysis of Rorschach and MMPI validity. Psychological Assessment, 11 (3), 278 – 296.

Hunsley, J., y Bailey, J. (1999). The clinical utility of the Rorschach: Unfulfilled promises and an uncertain future. Psychological Assessment, 11 (3), 266 – 277.

Hunsley, J., y Bailey, J. (2001). Whither the Rorschach. Psychological Assessment, 13 (4), 472 – 485.

McDowell, C. y Acklin, M. (1996). Standardizing procedures for calculating Rorschach interrater reliability: Conceptual and empirical foundations. Journal of Personality Assessment. 66, 308 – 320.

Meyer, G., (1992). The Rorschach’s factor structure: A contemporary investigation and historical review. Journal of Personality Assessment. 59 (1), 117 – 136.

Meyer, G., (1997). Assessing reliability: Critical corrections for a critical examination of the Rorschach Comprehensive System. Psychological Assessment. 9 (4), 480 – 489

Meyer, G., Hilsenroth, M., Baxter, D., Exner, J., Fowler, J., Pers, C., y Resnick, J. (2002). An examination of interrater reliability for scoring the Rorschach Comprehensive System in eight data sets. Journal of Personality Assessment, 78, 219-274.

Meyer, G., Riethmiller, R., Brooks, R., Benoit, W. y Handler, L. (2000). A replication of Rorschach and MMPI-2 convergent validity. Journal of Personality Assessment. 74 (2), 175 – 215.

Ritzler, B. (1995). Putting your eggs in the content analysis basket: A Response to Aronow, Reznikoff, and Moreland. Journal of Personality Assessment. 64 (2), 229 – 234.

Rosenthal, R., Hiller, J., Bornstein, R., Berry, D., y Brunnell-Neuleib, S. (2001). Meta-analytic methods, the Rorschach, and the MMPI. Psychological Assessment. 13 (4), 449 – 451.

Viglione, D. (1999). A review of recent research addressing the utility of the Rorschach. Psychological Assessment. 11 (3), 251 – 265.

Viglione, D. y Hilsenroth, M. (2001). The Rorschach: Facts, Fictions and Future. Psychological Assessment. 13 (4), 452 – 471.

Viglione, D. y Taylor, N. (2003). Empirical support for interrater reliability of Rorschach Comprehensive System coding. Journal of Clinical Psychology. 59 (1), 111 – 121.

Weiner, I. (1997). Current Status of the Rorschach Inkblot Method. Journal of Personality Assessment. 68 (1), 5 – 19.

Weiner, I. (2000). Using the Rorschach properly in practice and research. Journal of Clinical Psychology. 56 (3), 435 – 438.

Weiner, I. (2001a). Advancing the science of psychological assessment: The Rorschach Inkblot Method as exemplar. Psychological Assessment. 13 (4), 423 – 432.

Wood, J., Lilienfeld, S., Garb, H. y Nezworski, M. (2000a). The Rorschach Test in clinical diagnosis: A critical review, with a backward look at Garfield (1947). Journal of Clinical Psychology. 56 (3), 395 – 430.

Wood, J., Lilienfeld, S., Garb, H. y Nezworski, M. (2000b). Limitations of the Rorschach as a diagnostic tool. Journal of Clinical Psychology. 56 (3), 441 – 448.

Wood, J., Lilienfeld, S., Nezworski, M., y Garb, H., (2001). Coming to grips with negative evidence for the Comprehensive System for the Rorschach. Journal of Personality Assessment. 77 (1), 48 – 70.

Prohibida la reproducción de cualquiera de los contenidos de forma parcial o total sin el consentimiento por escrito del autor. Citar como: Valentiner, A. (2010) Estatus científico del test de Rorschach. [Documento WWW]. http://articulos-psico-accion.blogspot.com.es/