EVALUACIÓN Y SELECCIÓN DE PERSONAL

EVALUACION DE LA PERSONALIDAD NORMAL

(Nicolás Seisdedos en "La evaluación psicológica en el año 2000")

Introducción

En la conducta humana se pueden observar un conjunto de factores invariables que determinan la existencia de diferencias individuales; estos factores tienen una peculiar manera de manifestarse y son conocidos con los nombres de aptitudes. rasgos de personalidad. Actitudes, etc. En cada uno de estos campos se han ido definiendo unas entidades de tipo general y otras de tipo específico que modulan y caracterizan la peculiar manera de comportarse de cada individuo.

Al principio algunos autores han puesto en duda la existencia e importancia de los rasgos o factores de personalidad para determinar esas diferencias individuales. Así, por ejemplo, Thorndike ha señalado que "no hay rasgos amplios y generales de la personalidad, entidades consistentes de la conducta que, caso de existir, se manifestarían en la forma de una conducta estable y coherente, sino unos hábitos independientes y específicos de conectarse estímulos y respuestas " .

Otros autores (como Mischel, 1971) se han inclinado por una orientación situacionista, en el sentido de que la situación contribuye más que los rasgos de personalidad a determinar las diferencias individuales en el comportamiento humano.

Sin embargo, es abrumador el cúmulo de investigaciones, de artículos y de libros que durante las últimas décadas han mostrado la existencia de unas entidades denominadas rasgos de personalidad que determinan, en un cierto grado, la conducta del individuo en esas situaciones; no se niega la existencia e importancia de éstas, pero el peso primordial hay que darlo a esos componentes que denominamos personalidad. Es verdad que los autores no se ponen de acuerdo sobre la denominación de los rasgos, sobre su estructura interna, sobre su posición jerárquica en el análisis de la conducta o sobre su peso relativo en determinadas actividades (laborales, escolares, etc.) de la persona; también es cierto que. aunque se han diseñado varios modos de medirlos, la fiabilidad y la validez de tales medidas arrastran una significativa proporción de error. No obstante, esa medida de la personalidad está resultando muy valiosa. que no es lo mismo que válida, en muy diferentes ámbitos de la labor del psicólogo.

En nuestro país tenemos ya una substancial batería de instrumentos, orientados a medir una amplia gama de variables de personalidad y el presente capítulo intenta hacer una revisión de la medida de la personalidad que puede hacerse a partir de los instrumentos españoles existentes.

1. Instrumentos, tests y variables de personalidad.

Hace poco más de veinte años se publicó una obra con el ambicioso título de "Tests empleados en España" (TEA et al. 1975). Tenía la intención do recoger información técnica y bibliográfica sobre instrumentos psicológicos de medida. Se invitó a 12 editores y distribuidores a que describieran. en la forma de una ficha técnica en una o varias páginas, los tests que por entonces podía emplear el profesional español, y se logró una relación de 133 instrumentos diferentes cuyas fichas fueron redactadas por 23 profesionales de la psicología.

Entre esos instrumentos los había de rendimiento, pedagógicos, neurológicos, de intereses y adaptación, de aptitudes e inteligencia y 14 eran de personalidad; es decir, un 10,5% de aquellos instrumentos de 975 estaban destinados a medir los rasgos que ahora nos ocupan. Además, como un instrumento psicométrico puede contener más de un test (por ejemplo, el CEP es un único test, pero el 16PF ofrecía en 1975 dos tests independientes: las Formas A y B), y como en cada test se puede obtener más de una variable (en el CEP se obtienen 5 y en el 16PF-A hasta 22). Se hizo el recuento del contenido de "Tests empleados en España" en relación a la medida de la personalidad y se observó que el psicólogo español podía disponer de 14 instrumentos, que contenían 17 tests y permitían medir 114 variables.

Naturalmente, el lector habrá comprendido que entre esas 114 variables algunas estaban repetidas, porque distintos instrumentos intentan medir una misma variable (por ejemplo, la extraversión o la ansiedad), aunque con distinto enfoque o, al menos, con distinto material.

La mayor parte de aquel intrumental de 1975 destinado a medir rasgos de personalidad era de procedencia extranjera, fruto de la adaptación de instrumentos afamados; pero también los había ya de producción propia, de autores españoles.

Después, con el paso de los años, se han creado o adaptado nuevos instrumentos y el número de los existentes ha aumentado; sin embargo, también es verdad que algunos tests de 1975 han desaparecido, por quedarse obsoletos o, lamentablemente, por falta de una atención técnica o de tipo editorial. Para conocer los datos de esta tarea de creación o adaptación en el momento actual, hemos buscado una obra de la que poder sacar datos estadísticos.

La publicación más ambiciosa en esta línea podría ser el Catálogo de TEA Ediciones, que en su edición de 1997, sin tanto detalle de información técnica y criterios de utilización como la obra de 1975, incluye un conjunto de 245 productos de tipo psicométrico (I). Entresacados los destinados a medir rasgos de personalidad y analizados con los mismos criterios descritos en los párrafos anteriores se observa en dicho Catálogo la existencia de 66 instrumentos que comprenden 79 tests y que permiten la medida de 565 variables de personalidad.

Para tener una visión comparativa de cómo está actualmente la medida de la personalidad en cuanto a instrumentación. el cuadro que viene a continuación presenta. en paralelo y en forma de frecuencia absoluta (fr) y porcentaje (%) sobre el total existente, lo observado en 1975 y en 1997, veintidós años después.

AÑO	INSTRUMENTOS		TESTS		VARIABLES
AÑO	fr	%	fr	%	fr	%
1975	14	10,5	17	4,1	114	18,0
1997	66	26,9	79	15,3	565	46,3

El cambio ha sido substancial: la medida de la personalidad ocupa ahora algo más de la cuarta parte de los instrumentos y casi la mitad de las variables existentes en el ámbito psicométrico español. El lector interesado en un mayor detalle de estos datos puede consultar uno de los capítulos de "Psicología del trabajo y gestión de recursos humanos" (Seisdedos, 1997). Sin embargo, para comprender el porqué de alguno de los enfoques que vienen a continuación, con -

(En la obra "Tests y Documentos Psicológicos" (TEA Ediciones, 1996) puede encontrarse una información más completa. aunque no tan actualizada, de la mayoría de los instrumentos).

viene que se especifique aquí cuánto de ese instrumental es fruto de la adaptación y cuánto de la creación española.

El usuario español de estos instrumentos puede estar orgulloso al saber que desde 1975 ha aumentado significativamente la proporción de la producción y creación española; pero también debe saber que todavía el 72,7% de los instrumentos reseñados en el cuadro anterior son de origen extranjero; dicho desde otro ángulo, el 86.4% de los tests son fruto de una adaptación y de las 565 variables existentes el 84, 9% han nacido en otra cultura.

Atendiendo al tipo de estímulo, todos estos instrumentos de medida de la personalidad podían clasificarse en dos grandes grupos: a) los de tipo autoinforme (cuestionarios, inventarios y listas de palabras) y b) los de tipo proyectivo, neurológico o clínico. Pues bien, la gran mayoría (el 70%) pertenece al primer grupo: hay 46 instrumentos de tipo autoinforme. Es el tipo de medida mas empleado entre los usuarios españoles, No es de extrañar, pues normalmente este instrumento es de aplicación colectiva y resulta más económico, sobre todo cuando el grupo de examinandos es muy numeroso. Sin embargo, por ser de tipo autoinforme, la medida es más vulnerable a los errores consubstanciales a toda medida psicológica. Pero dejemos este aspecto. que se tratara en otro apartado de este capítulo.

Todos los instrumento recogidos en el cuadro 1 que viene en un apartado posterior son de tipo autoinforme; casi todos tienen la denominación de cuestionario.

2. Características de la medida de las variables de personalidad

Una vez revisado el instrumental que para medir personalidad dispone el usuario español (y siempre teniendo como fuente principal de información el citado Catálogo de 1997), hemos observado la existencia de 66 instrumentos con los que se pueden apreciar hasta 565 variables; al menos, eso es lo que dicen los manuales de esos instrumentos. Con las denominaciones de esas variables se alude a rasgos de contenido muy dispar, desde uno muy general (y por tanto polivalente y ambiguo ), hasta uno más específico o simple (y por tanto aplicable sólo a un área muy concreta de la conducta); entre los primeros podría estar la extraversión y entre los segundos el estrés laboral asistencial; el primer rasgo, la extraversión es a su vez un conglomerado de variables y está implicado en muy diferentes conductas humanas. mientras que el segundo sólo aparece en profesiones laborales de asistencia a otras personas; el primero es medido por la mayoría de los cuestionarios o inventarios de personalidad (que también miden otras variables), mientras que el segundo es propio de muy pocos tests y, en algunos casos, es la única variable que mide ese test .

Si como apéndice de este capítulo elaborásemos una relación con las 565 variables medidas por los cuestionarios españoles, algunas estarían repetidas y como etiqueta diferencial tendríamos que añadir el nombre del instrumento: escala de extraversión (E) del CEP, escala de extra versión (polo bajo de Si) del MMPI, factor de segundo orden de extraversión del 16PF, dimensión global de extraversión del CPI, etc. Entre los 21 instrumentos reseñados en la figura 3 hay 13 que incluyen una medida de la variable. factor o dimensión de extraversión.

No es corriente que un profesional conozca y emplee los 66 instrumentos, en parte porque algunos sólo son aplicables a un determinado grupo de la población en la que no trabaja ese profesional: a adultos o a niños, o a niños de 6 a 8 años, o a adolescentes que hablen catalán, etc., o porque exigen una formación o experiencia (como las técnicas proyectivas) que no poseen todos los profesionales.

Sin embargo, tal vez el lector que haya empleado varios de esos tests habrá observado, con extrañeza, que no siempre se da concordancia entre lo medido por dos de esas variables. aunque parezcan tener la misma entidad. Es probable que el soporte teórico de ambos instrumentos o tests sea diferente, pero a nuestro parecer la razón puede estar también, y a la vez, en la profundidad del tipo de medida que se logra. Vamos a intentar explicar esto con los resultados de una experiencia llevada a cabo hace bastantes años, aunque en la explicación no aportemos ahora los pertinentes datos estadísticos (que están archivados en alguna polvorienta carpeta del despacho).

En aquella ocasión tres compañeros tenían que hacer fuera de Madrid un proceso de selección de personal administrativo entre 60 candidatos que tenían un nivel medio alto de formación académica; la batería selectiva contaba con un cuestionario de personalidad (el CEP de Pinillos). La recogida de respuestas a las diez láminas del test proyectivo de Rorschach y una entrevista personal. El Rorschach era posteriormente valorado a ciegas por una cuarta persona, un experto en esa técnica. En la batería parecía haber tres tipos de enfoque de medida: el de autoinforme (conocido en la literatura como dato Q o de cuestionario ), el de tipo proyectivo (manchas de tinta) y el de observación en la entrevista (dato L del inglés life).

Así pues, propusimos a los compañeros hacer una comparación de los resultados de los tres tipos de medida sobre dos variables muy conocidas: la extraversión y el control emocional. Al terminar cada entrevista, los compañeros deberían cumplimentar sobre cada candidato un impreso muy simple indicando en una escala de 1 a l0 el grado de extraversión y de control emocional que habían observado; de este modo se tenían los datos L de los 60 candidatos en una escala cuantitativa sobre las dos variables. Empleando un impreso similar, se pidió también al experto en Roschach que valorara en una escala de l0 puntos a los candidatos a partir del análisis de las respuestas recogidas, con lo cual quedaban cuantificados los resultados de una técnica proyectiva (resultados que vamos a llamar datos P). Resultó más fácil trasladar a esa escala de l0 puntos las puntuaciones del cuestionario CEP en las escalas E (extraversión) y C (control), para tener los datos Q de la muestra.

Cuando se calculó la matriz de correlaciones entre los datos de los tres enfoques, los índices se alejaron mucho de lo esperado: había muy poca o nula correlación y parecía como si la extraversión apreciada por el cuestionario fuera algo distinto de lo observado en la entrevista y como si la estabilidad emocional medida por el cuestionario tuviera poco que ver con lo que podía deducirse de la técnica proyectiva.

En aquel momento se nos ocurrieron dos hipótesis con la esperanza de poder contrastarlas en el futuro:

a. La personalidad se estructura en forma de tres capas situadas a distinto nivel de profundidad en el individuo. Algo así como la epidermis, la mesodermis y la endodermis. Los datos de observación, es decir la entrevista, habrían captado y medido la capa, exterior, algo que nos ponemos y quitamos de acuerdo con las circunstancias o situaciones. Los datos Q o cuestionario habrían apreciado unos rasgos más propios de una capa media. algo más estable y constante en la conducta. La técnica proyectiva habría entrado a una capa más profunda, a descubrir unos rasgos que no siempre están en consonancia y relación con los de las otras dos capas, en parte porque pueden no ser conscientes. Es probable que los extravertidos a nivel de , endodermis no lo sean, o al menos en esa intensidad, en sus rasgos mesodérmicos y se manifiesten de diferente manera en su capa exterior. La figura 1 presenta esas tres capas en la estructura de la personalidad de una persona.

Figura 1: Representación gráfica de las capas de la personalidad

b. No existe acuerdo entre lo que entienden por extraversión o por control emocional diferentes enfoques psicométricos, diferentes autores de instrumentos de medida o diferentes usuarios de éstos. En ocasiones la denominación apunta hacia una estructura superior (compuesta, a su vez, por otras dimensiones secundarias tales como la sociabilidad y la impulsividad) y en otras se define una variable simple.

Estas hipótesis son sólo tentativas; quizás en el futuro sea posible planificar una experiencia en la que se controlen otras variables que permitan confirmar o rechazar las hipótesis propuestas.

En cualquiera de los casos, a la postre, parece como si no se hubiera cumplido lo que está subyacente en la definición de la validez de un test, por lo menos desde el punto de vista del profesional que lo usa; éste observa que "no se ha medido lo que él cree que debe medir", aunque ese profesional no pueda demostrar que "no ha medido lo que el test dice medir" ¿qué es lo que ha dicho que mide? y ¿quién lo ha dicho y le ha puesto la etiqueta?

Así pues, la validez de las medidas de personalidad es uno de esos puntos obscuros y débiles de la psicometría, y más en los instrumentos de tipo autoinforme que ahora estamos revisando. Ha sido frecuentemente un tema polémico, repetidas veces encontrado en las publicaciones sobre las aplicaciones prácticas de este tipo de medida. Se pone en duda la importancia de rasgos específicos de la personalidad y su influencia en las diferencias individuales, sobre todo cuando la conclusión de las investigaciones ha sido que las medidas de estos rasgos contribuyen en muy pequeño grado a la varianza de la conducta humana.

Sin embargo, en contra de esto último se ha afirmado que cuando se admite que esta conducta es muy compleja y que los factores causales de una determinada situación son múltiples, parece obvio que uno solo de esos rasgos de personalidad sólo pueda responder de una pequeña parcela de varianza específica y se ha razonado (Eysenck, 1976) en los términos que vienen en los dos párrafos siguientes.

Supongamos que, para explicar una conducta específica (v. gr. la de un determinado profesional), se hubiera determinado un total de diez factores que pudieran dar cuenta de toda la varianza no atribuible a errores aleatorios. que cinco de esos factores fueran de origen situacional o ambiental y que los otros cinco estuvieran relacionados con la personalidad; es probable además que algunos de esos factores provoquen un efecto de interacción que influya en la varianza de la citada actividad profesional; por ejemplo. se sabe que A y B son factores que influyen en la conducta, pero puede darse el hecho de que cuando están juntos A y B provoquen un efecto especial independiente de A y de B.

Por otro parte, se podría dar el hecho de que cada uno de esos diez factores pudiesen contribuir con un 10% de la varianza no debida a errores aleatorios. y si estos factores fueran independientes (no relacionados entre sí), entonces los diez darían cuenta de la varianza total no aleatoria de la actividad profesional. Por tanto, no parece desalentador si en una investigación se concluye que un rasgo de personalidad sólo contribuye al 10% de la varianza común y hay muchos estudios en los que el porcentaje es mayor.

En consecuencia, se podría pensar que la tarea del investigador es buscar esas otras nueve variables que puedan ayudar a controlar y explicar la conducta específica objeto de estudio. No parece razonable esperar que un solo rasgo de personalidad pueda explicar toda esa conducta. y menos aún en situaciones no experimentales, donde no es posible controlar muchas variables.

Tal vez la figura 2 ilustre cómo coopera cada una de las variables de la persona ( actitudes, aptitudes, personalidad. etc.) para que una conducta (la citada actividad laboral específica) sea efectiva y tenga éxito.

Figura 2: Esquema ilustrativo de la covarianza entre diversas medidas de la conducta y la actividad laboral.

El dibujo intenta representar que las aptitudes (a la izquierda) pueden tener componentes comunes con esa actividad (el área de solape entre la elipse de las aptitudes y la figura central), y que eso común sea la validez de las aptitudes para predecir el rendimiento laboral (el 10% aludido en los párrafos anteriores). De igual forma, la personalidad (a la derecha) puede tener componentes o varianza común con la conducta laboral en una cuantía aproximada de otro 10% y decimos otro porque normalmente entre las aptitudes y la personalidad no hay ningún componente o área común. Y esto mismo puede ocurrir con los conocimientos académicos que el sujeto ha adquirido. El esquema de valores que aporta y con los cuales se mueve para cumplir los requisitos laborales, las actitudes y las experiencias previas (laborales o de cualquier tipo) que el sujeto posee y pone en ejercicio para desarrollar con efectividad las exigencias del puesto de trabajo. Es verdad que todavía quedan zonas o varianza de lo laboral que no están explicadas por los seis conjuntos de variables que incorpora la figura 2. Podrían ser esos aspectos situacionales a que se aludía en los párrafos anteriores y que el investigador puede determinar y controlar para hacer más efectiva su explicación de esa conducta.

Tal vez la conclusión de todo lo anterior pudiera ser el constatar que una conducta está definida por un cúmulo de variables y que la personalidad sólo puede explicar dicha conducta en una cuantía pequeña, pero lo suficientemente importante como para intentar su medida.

3. El átomo de medida, el elemento

El maestro que fue de muchos de nosotros, M. Yela, definía un test como "una situación problemática, previamente dispuesta y estudiada, a la que el sujeto ha de responder siguiendo ciertas instrucciones y de cuyas respuestas se estima, por comparación con las de un grupo normativo la calidad, índole o grado de algún aspecto de su personalidad".

La definición parece más ajustada (por lo de "situación problemática") a un test destinado a medir una aptitud como aspecto o rasgo de la persona: pero es aplicable también a los instrumentos que miden rasgos más propiamente llamados de personalidad (como la dominancia o la extraversión). Sea cual fuere su intención de medida, esa situación problemática puede estar constituida por un solo problema o muchos pequeños problemas; Vela prefería denominar elemento a este reactivo o entidad más simple. en vez de usar el término ítem a que nos tiene acostumbrados la literatura anglosajona.

El átomo de medida o elemento de esa gran mayoría de tests que constituyen el instrumental del profesional español para medir personalidad. es una palabra (los adjetivos o sustantivos de los inventarios del tipo de relación de palabras) o una frase muy sencilla. En algunas ocasiones esta frase ha sido redactada en forma de pregunta o cuestión y de ahí que este tipo de instrumentos sea conocido como cuestionario.

Cuando visitamos al médico a causa de alguna dolencia, este profesional nos hace algunas preguntas o nos deja una relación de posibles malestares para que señalemos los que son ciertos en nuestro caso y a partir de las respuestas o anotaciones intenta un diagnóstico. Si sólo hace una pregunta, es poco probable que llegue a un buen diagnóstico (a no ser que además tenga sobre la mesa los resultados de una analítica o de otras pruebas).

De manera similar, cuando un profesional de recursos humanos desea conocer el modo de ser o comportamiento de un candidato para ver su ajuste a una determinada actividad laboral, le hace algunas preguntas y de las respuestas recogidas infiere un determinado tipo de personalidad; muchas entrevistas tienen esta finalidad: hacer algunas preguntas y analizar las respuestas. Parece obvio que si este profesional hace muchas preguntas su diagnóstico será más fiable. Cuando el seleccionador o entrevistador tiene mucha experiencia sabe qué preguntas son más adecuadas para poder determinar el modo de ser del candidato a partir de unas respuestas específicas.

Desde una visión tal vez muy simple, todo cuestionario de personalidad podría ser ese conjunto de preguntas que ha resultado muy eficaz en el pasado. Se puede contestar a ellas con un Sí o un No, con un Verdadero o Falso, o mediante una escala de grados en los que la persona está de acuerdo o desacuerdo con lo expresado en la pregunta. Teniendo en cuenta estas alternativas de respuesta, no parece necesario que la frase esté redactada en forma de pregunta; puede estarlo en la forma de una aseveración de una conducta muy específica y la persona contesta con una de las alternativas de respuesta sobre su contenido.

De la misma manera que el médico puede indagar sólo sobre un síntoma o síndrome específico o intentar una valoración general de la salud del paciente, los instrumentos que estamos revisando (inventarios o cuestionarios) pueden tener una intencionalidad de medida muy concreta (medir un rasgo muy específico de la personalidad), o bien ser más ambiciosos e intentar la medida de muchos aspectos de la conducta.

En el primer caso sólo se mide una variable, y en el segundo se aprecia un número relativamente grande de variables; además, así como los síntomas se agrupan para definir un síndrome más amplio, los resultados cuantitativos de estas variables de personalidad se pueden agrupar mediante fórmulas de ponderación para medir rasgos más generales en la estructura de la conducta. rasgos que son conocidos como dimensiones globales o factores (porque normalmente han sido derivados y definidos mediante técnicas factoriales).

Naturalmente esta distinta intencionalidad condiciona el número de elementos o cuestiones que contiene un instrumento de medida. Parece lógico suponer que si se desea medir más variables, el instrumento ha de ser más largo y contener más elementos. Parece también obvio (aunque es necesaria una demostración de ello) que cuantos más elementos existan para medir una variable, más fiable será la medida. Sin embargo, no parece sensato diseñar un cuestionario con miles de elementos; además de lo costoso de su creación y normalización, parece poco viable que las personas o candidatos puedan cumplimentarlos, aunque se empleen varias sesiones. Tampoco parece sensato pretender que un instrumento mida mucho y bien con unos pocos elementos.

4. Instrumentos existentes para medir la personalidad

En el cuadro 1 se presentan esquemáticamente 21 instrumentos del tipo de cuestionario existentes en nuestro país. Están ordenados de mayor a menor por el número de elementos que contienen. Además del nombre (sólo las siglas por las que son conocidos), se indica el número de variables que aprecia, el número de factores que pueden obtenerse, el ámbito de aplicación (1 = niños, 2 = adolescentes y 3 = adolescentes y adultos), y el número de elementos. A la derecha. un histograma de barras ilustra gráficamente la longitud aproximada de cada instrumento.

El lector puede observar la existencia de instrumentos muy diversos en cuanto a las variables que miden ya las unidades o elementos que los componen. Vamos a detenernos en alguno de ellos y en alguna de sus características métricas desde el ángulo de la unidad de medida, el elemento.

El más largo es el MMPI. Está formado por más de 500 frases no interrogativas que cubren un amplio campo de conductas y materias: salud, sistema nervioso, sensibilidad, familia, hábitos, ocupaciones, educación, actitudes, afectos, fobias, estados de ánimo, etc.

El sujeto tiene que catalogar su contenido como verdadero, falso o no sabría decir. En principio. en la versión española se pueden medir 19 variables (4 de validación, 10 básicas y 5 adicionales); pero existen otras muchas escalas, más de 200, cuyas variables podrían obtenerse a partir de las respuestas a ese medio millar de frases. No obstante, el uso de estas nuevas escalas exigiría que se normalizaran o tipificaran sus resultados en la población española.

En general, las escalas del MMPI están formadas por muchos elementos (la Sc o esquizofrenia contiene 78 elementos, más que algunos de los instrumentos reseñados en la figura 3), y la variabilidad de los resultados en muestras españoles es grande, lo cual hace que las escalas sean bastante discriminativas de las categorías psiquiátricas a las que apuntan las variables existentes.

Por otra parte, para interpretar estos resultados conviene que el lector recuerde que hay mucho solape entre las escalas: es verdad, y de todos es sabido, que las variables de personalidad están bastante relacionadas entre sí, pero esto lo es en mayor medida en el MMPI, porque un mismo elemento puede puntuar en más de una escala, es decir que hay varios elementos comunes entre algunas de las escalas. Con todo, todavía hay elementos en este cuestionario que no puntúan en ninguna de las 19 escalas o variables citadas y han sido y son potencialmente válidos para desarrollar nuevas escalas.

Cuadro 1: Algunos cuestionarios de personalidad aplicables (Apl.) en niños (1), adolescentes (2) y adultos (3).

Aunque es ideal que un elemento puntúe en una sola escala o variable (para conseguir una mayor independencia de las factores que se miden), no debe extrañar el solape aludido en el párrafo anterior; siguiendo con el símil del profesional médico, la fiebre o las náuseas pueden ser indicios ( añadir puntuación) para llegar al diagnóstico de más de una enfermedad.

Desde su mismo nacimiento, la intencionalidad del MMPI ha sido de tipo clínico; a diferencia de otros instrumentos (con los que ha sido comparado, desde posiciones críticas, como es el caso del 16PF de Cattell y del EPQ de Eysenck). Fue elaborado por un comité de profesionales reunido con fines de clasificación psiquiátrica. sin un modelo concreto de la personalidad que lo sustentase.

El Dr. Eysenck critica este hecho y se pregunta cómo es que "un test como el MMPI ha sido tan ampliamente usado en USA y ocupa un pedestal tan alto en la literatura de aplicaciones empíricas, (porque) no hay duda de que desde un punto de vista científico el MMPI se sustenta en arenas movedizas. Esencialmente intenta replicar en un grado bastante aceptable de semejanza el sistema de diagnóstico empleado por los psiquiatras norteamericanos" (Eysenck, 1976).

Esta podría ser una de la razones por las que, en ocasiones, no se obtienen relaciones muy significativas entre sus diagnósticos y criterios extra-psicológicos. En esta línea crítica se ha señalado que idénticos casos de desequilibrio mental han sido diagnosticado como esquizofrénicos en una proporción cinco veces mayor por los psiquiatras americanos que por los psiquiatras británicos.

En parte, el problema surge del hecho de que en ambas culturas se han empleado los mismos baremos, los que originariamente desarrolló la Universidad de Minnesota hacia 1949. Es probable que los diferentes índices de clasificación vengan de una inadecuada tipificación; vamos a ver si podemos aportar alguna explicación comentando unos pocos datos cuantitativos en el párrafo siguiente.

Normalmente, para definir una desviación psicológica con un buen nivel de confianza se emplea como criterio de clasificación en puntuaciones T, las que emplea el MMPI. un valor de 70 (lo cual supone un alejamiento de dos desviaciones típicas. Es decir, que por encima de ese valor crítico de 70 sólo queda un 2,5% de sujetos si la distribución de la población tiene la forma de una curva normal).

Pues bien, si contando con la muestra de tipificación española del MMPI, compuesta por 1.108 varones y 1.278 mujeres, recogida entre los años 1975 y 1979 y el perfil de los esos sujetos se hubiese obtenido con los baremos originales americanos, el 43,0% de los varones y el 25,4% de las mujeres hubiesen sido clasificados como esquizofrénicos.

Esperemos que la salud mental de los españoles no esté tan baja. Para tranquilizarnos, hemos aplicado los baremos españoles a la citada muestra y analizado su distribución. Los datos ahora son más alentadores: sólo supera la puntuación crítica T de 70 un 10,1% de los varones y un 2,8% de las mujeres de aquella muestra.

5. Adaptación y tipificación

Lo señalado en el párrafo anterior viene a indicar la importancia que tiene la tipificación para interpretar los resultados de un instrumento de medida de la personalidad, tanto en aquel que ha nacido en la misma cultura que lo emplea como cuando el instrumento proviene de otro entorno cultural. En este segundo caso es muy necesaria una adaptación, tanto de los elementos que lo componen como de los resultados que pueden obtenerse.

En la figura 3 se han descrito someramente 21 instrumentos que, en su conjunto, contienen 3.276 elementos; aproximadamente, el 90% de esas frases, cuestiones o adjetivos provienen del extranjero, de otras lenguas y culturas. Conocer este hecho puede plantear la duda de si ese contenido o redacción se comporta, desde un punto de vista métrico, de la misma manera que en los estudios y análisis originales. Si hay algunas diferencias eso afectará las puntuaciones directas que se obtengan y se invalidarán los baremos o tablas de interpretación que hayan diseñado los autores originales.

Cuando en 1994 se introdujo en nuestro país el 16PF-5 (última de las creaciones de Cattell), se repitieron muchos de los análisis originales para definir y explicar el comportamiento de los 170 elementos de personalidad y 15 de razonamiento que contiene esta nueva Forma del 16PF (en la figura 1 no se alude en particular a ninguna de las Formas existentes ya en España). Uno de los resultados de aquellos estudios fue la elaboración de unos baremos nacionales a partir de varios miles de casos españoles.

Aunque a nivel de puntuaciones y factores este nuevo 16PF-5 se comporta de manera similar a como lo hacía en origen, ya como estaba acostumbrado el psicólogo español con las otras cuatro Formas, sus átomos de medida pueden desviarse, y de hecho lo hacen en ocasiones, de su comportamiento en muestras originales.

Hay instrumentos que son más sensibles que otros cuando se los intenta mover de unas culturas a otras. Esto no parece afectar tanto a los tests que miden un aspecto aptitudinal como el razonamiento con elementos gráficos, pero lo dicho es claramente aplicable a los cuestionarios de personalidad :

1.- Porque intentan apreciar modos de ser en los que la cultura ha ido modelando determinadas estructuras que, en ocasiones, llegan a comportarse como verdaderos estereotipos que los sujetos de esa cultura repiten sistemáticamente (aunque también es verdad que el nivel actual de comunicación internacional entre las culturas occidentales está unificando enfoques específicos ante determinadas conductas).

2. Porque son "autoinformes" y el sujeto introduce su subjetividad en el momento de responder a esos elementos o cuestiones que conforman los citados instrumentos.

Por todo ello es muy conveniente que el proceso de adaptación analice, si es posible, la incidencia cultural en los distintos componentes del test. En el caso del 16PF-5 que nos está sirviendo de ejemplo, se han comparado las respuestas de todos los sujetos españoles de la muestra experimental con los datos USA disponibles en aquella fecha, 1994, así como con los obtenidos en la tipificación británica que en ese momento estaba también llevando a cabo la adaptación del instrumento desde el inglés americano al inglés europeo (Seisdedos, 1994).

Se han encontrado similitudes y diferencias de todo tipo entre las 170 cuestiones de personalidad que incluye el 16PF-5. En ocasiones, una cuestión se ha comportado de forma similar en las tres culturas, pero en otras se han observado muy notables diferencias que parecen apuntar a características peculiares de una determinada cultura. Para ejemplificar estas notables diferencias se toma la cuestión que tiene la siguiente redacción y alternativas de respuesta:

"Como afición agradable prefiero:

A. hacer o reparar algo,

B. ? (no estoy seguro o término medio),

C. trabajar en grupo en una tarea comunitaria".

Manteniendo controlada la variable sexo. el análisis de las frecuencias relativas (porcentajes sobre el número de sujetos de cada grupo) ha ofrecido los siguientes resultados:

CULTURA	VARONES			MUJERES			TOTAL
CULTURA	A%	B%	C%	A%	B%	C%	A%	B%	C%
GBRETAÑA	76,1	11,1	12,8	49,0	17,4	33,6	61,4	14,5	24,1
USA	70,5	7,8	21,6	33,4	10,6	56,0	54,2	9,1	36,7
ESPAÑA	29,2	5,3	65,5	32,0	3,7	64,3	29,7	5,0	65,3

Este elemento puntúa en la variable Afabilidad; se conceden 2 puntos a la alternativa C y 1 punto a la intermedia B. A la vista de los resultados. y atendiendo sólo a la alternativa C, tanto las mujeres británicas (en un 33,6%) como las norteamericanas (en un 56,0%) parecen tener esta característica en mayor grado que los varones (12,8% y 21,6%, respectivamente ), pero esto no se observa en las mujeres españolas que obtienen un porcentaje (64,3%) muy similar al de los varones (65,5%). En los más de tres millares de casos de la muestra de tipificación española. los dos sexos muestran una atención semejante a las tareos comunitarias.

Pero lo destacable desde un punto de vista cultural en la adaptación española de este elemento es que las mujeres, y en mucha mayor medida los varones, destacan de los otras dos culturas en este síntoma de Afabilidad.

Atendiendo a la muestra total, la atención a las tareas comunitarias se da en una cuarta parte (24,1 %) entre los británicos, en un tercio (36,7%) entre los norteamericanos y en los dos tercios (65,1%) entre los españoles. Los varones españoles superan a los varones británicos en un 52,7% (y las mujeres en un 30,7%) en sus respuestas a la alternativa C.

Otro dato a destacar es la mayor seguridad (menor porcentaje de respuestas B) de los españoles ante este contenido: en la muestra total no supera el 5% (y en las mujeres desciende más) el porcentaje de sujetos que tiene dudas sobre el tema.

Esta tendencia, aunque no tan exagerada, se observa en los otros 10 elementos o cuestiones que puntúan en Afabilidad (aunque hay que señalar que. en el conjunto de los elementos. las mujeres superan a los varones en las tres culturas). Por ejemplo, en el tema "Me satisface y entretiene cuidarme de las necesidades de los demás (Verdadero)", los varones españoles superan a los británicos y norteamericanos en un 30,3% y un 28,5%, respectivamente, mientras que las mujeres lo hacen en un 15,8% y un 11,7%, respectivamente.

El resumen de estos análisis es que entre los 170 elementos de personalidad que constituyen el 16PF-5, hay un porcentaje elevado de cuestiones que presentan diferencias significativas con las otras dos culturas y esas diferencias aconsejan un tratamiento especial de las respuestas y puntuaciones que se obtengan del instrumento en las aplicaciones a sujetos españoles. Y, en consecuencia, se justifica la necesidad de una adaptación.

En principio, el concepto de adaptación parece obvio cuando se piensa que un test debe adaptar sus contenidos e instrucciones a los sujetos a los que va destinado; así lo tiene en cuenta el autor que adapta el material de los elementos. su lenguaje y su dificultad. a los sujetos a los que va a ser aplicado.

Sin embargo, esta consideración puede olvidarse cuando el test proviene de otra cultura o de otra lengua; si proviene de otra cultura, pero con igual lengua, a veces se pasa por alto que el lenguaje o las situaciones que plantea no son exactamente los mismos en ambos contextos culturales; si en la cultura de origen el test nació con otra lengua, el "traslado" del test al país de destino exige algo más que una buena traducción de los contenidos de los elementos; es necesaria una buena adaptación y, en ocasiones, tan laboriosa y costosa como lo fueron las fases de su primitivo construcción.

Por otra parte, uno de los aspectos importantes de la definición de Yela citada en un apartado anterior, es el hecho de que cuando se tienen las respuestas de un sujeto a esos reactivos o elementos, es necesario compararlas con las de un grupo normativo para poder interpretarlas; esta base comparativa (el baremo) es el resultado de la tipificación. Sin esa base, no es fácil hablar de la "calidad, índole o grado" del rasgo apreciado que señala la citada definición.

Una misma medida, la estatura de Gulliver (2), puede dar como resultado que Gulliver sea un gigante (en el país de los enanos) o un enano (en el país de los gigantes). Es probable que, en el caso de los tests de personalidad, cada país deba exigir una tipificación y unos baremos comparativos apropiados a esa cultura.

Unos baremos muy generales (por ejemplo, los obtenidos con las estaturas de todos los españoles, incluidos los niños) pueden resultar poco apropiados para estimar el desarrollo de Juan, adolescente madrileño, pero tal vez no sea necesario exigir una excesiva especificación en la constitución de unos baremos (por ejemplo, los elaborados únicamente con los varones de 14 a 18 años, nacidos en la década de los 70 en familias madrileñas de nivel socioeconómico medio).

Por otra parte, cuando se usan baremos muy específicos se corre el riesgo de calificar con resultados distintos a personas que poseen rasgo medio de igual grado.

Veamos otro ejemplo: Juan y Luisa, son candidatos a un puesto de auxiliar administrativo en un banco, y han obtenido igual resultado directo, 24 puntos, en un test de comprensión verbal. Para su integración podemos emplear un único baremo de población general (elaborado con las personas que normalmente acuden a solicitar puestos de trabajo), en el que ambos candidatos se sitúan por encima de la media y obtienen una misma puntuación derivada centil (por ejemplo, un 60).

Si sabemos que Juan procede de una zona rural y no tiene más que estudios primarios, podríamos querer compararlo con un baremo elaborado sólo con casos de zona rural y con estudios primarios y en este baremo sus 24 puntos directos podrían equivaler a un centil 70 (probablemente esa mejor dotación de Juan le ha impulsado a dejar la zona rural y acudir a la capital a buscar trabajo).

Por otra parte, si Luisa, que ha nacido y seguido estudios medios en la capital, es comparada con un baremo elaborado con sujetos de sus mismas características, puede alcanzar sólo una puntuación centil de 50 (porque sus 24 puntos es el promedio que han obtenido los sujetos con características similares a las de Luisa).

Por tanto, si la intención última de la medida está en el proceso selectivo para el banco, no parece apropiado emplear dos puntuaciones centiles distintas para sujetos que poseen en igual grado la comprensión verbal necesaria para el puesto de trabajo.

La adaptación y la tipificación son, por tanto, dos tareas que se deben cuidar con mucho mimo, tanto el constructor de un test como el profesional que quiere utilizarlo en otro contexto cultural. Son dos lujos de la psicometría muy necesarios, y probablemente indispensables, a los que el presente capítulo pretende sensibilizar con la revisión de la medida de la personalidad.

6. DESEABILIDAD SOCIAL DISTORSIÓN O MANIPULACIÓN DE LA IMAGEN

Cada tipo de datos obtenidos en psicometría contiene una serie de factores instrumentales y de error que le son peculiares. Entre los que afectan a los instrumentos de tipo cuestionario de personalidad se pueden citar la deseabilidad social (tendencia a atribuirse valoraciones socialmente apetecibles), la aquiescencia (inclinación a asentir o negar frecuentemente el contenido de los elementos) y el sabotaje deliberado (de ese sujeto que, por los motivos que sea, rehúsa cooperar en el examen).

Algunos instrumentos han incluido entre sus escalas una o varias medidas correctoras de esas fuentes de error y en los manuales de los tests se dan instrucciones al respecto. En este momento nos vamos a detener en la deseabilidad social, por ser uno de las fuentes de error más señaladas de modo crítico en la medida de la personalidad mediante cuestionarios.

Esta variable ha sido denominada distorsión motivacional o manipulación de la imagen en los cuestionarios 16PF; en el MMPI se introdujo la escala L ( del inglés lie, o falta de sinceridad). además de las escalas F, K y la diferencia F-K (desarrollada por Gough, 1956) y posteriormente se han diseñado escalas de deseabilidad social (no adaptadas aún en España); muchas de esas medidas han sido objeto de numerosos análisis con datos españoles (Seisdedos. 1988).

Por eso, ahora nos vamos a centrar en un análisis comparativo aprovechando datos recientes.

En la construcción original del MMPI (Hathaway y McKinley, 1940) intervino también como coautor H. G. Gough. Quien, con posterioridad e independencia de la Universidad de Minnesota, elaboró el CPI; en la construcción de éste empleó un enfoque distinto sin la pretensión de una clasificación psiquiátrica; Gough tiene a gala que la mayoría de sus escalas son de tipo popular (las llama folk scales). porque miden esas conductas que las personas corrientes denominan con esos mismos términos (por ejemplo, su escala de dominancia intenta reflejar lo que todo el mundo entiende como propio de una persona dominante).

Dado que Gough intervino en el MMPI y en elCPI, no es de extrañar que haya algunos elementos que se repiten con la misma redacción en ambos instrumentos. Además, el MMPI ha tenido recientemente una revisión con el nombre MMPI-2 (con 567 elementos) y en éste hay un porcentaje bastante elevado de elementos que se repiten en relación con el MMPI; en estos momentos se está terminando la adaptación española de este MMPI-2 y ya disponemos de muestras nacionales que han contestado a sus elementos y se pueden realizar estudios comparativos.

En los estudios originales americanos todos los elementos de estos tres cuestionarios (CPI, MMPI y MMPI-2) han sido evaluados por su deseabilidad social con un índice que va de 1 a 10. Naturalmente, cuando un elemento tiene un índice bajo de deseabilidad los sujetos tienden a negar su contenido y sólo se da un porcentaje pequeño de respuestas verdadero, mientras que los de índice, elevado suelen presentar porcentajes de atracción muy altos.

De todos los elementos comunes en los tres cuestionarios hemos elegido una pareja con índice bajo (-I) y otra pareja con índice alto (+I); son los siguientes:

a) poco deseables:

-I1. No tengo ninguna esperanza en el porvenir.

-I2. Siendo muchacho, me echaron de clase una o más veces, por hacer travesuras.

b) muy deseables:

+I1 .En mi vida diaria hay muchas cosas que me resultan interesantes.

+I2. Nunca he tenido tropiezos con la ley.

En los dos cuadros que vienen a continuación se recogen los resultados del análisis de estos elementos en nueve muestras (A-I). En el primero se indican las muestras o grupos de sujetos de ambos sexos (V y M) de los tests. En el segundo se presentan los índices de deseabilidad social estimados en muestras americanas en cada sexo (V = varones, M = mujeres); luego se da el porcentaje de sujetos que en cada sexo y muestra, han contestado afirmativamente a esos cuatro elementos.

GRUPO	V	M	TEST	DESCRIPCIÓN DEL GRUPO
A	1000	1000	CPI	Tipificación USA, 1975
B	736	493	CPI	Tipificación España, 1992
C	677	129	CPI	Proceso selección España, 1995
D	1118	1278	MMPI	Tipificación España, 1992
E	677	129	MMPI	Proceso selección España, 1995
F	1462	1138	MMPI-2	Tipificación USA, 1989
G	542	870	MMPI-2	Tipificación España casos normales, 1995
H	340	309	MMPI-2	Tipificación España casos normales, 1995
I	1631	200	MMPI-2	Proceso selección España, versión en catalán, 1995

Los dos elementos poco deseables lo son también en las muestras españolas, pero no en el mismo grado; entre los españoles es mayor el porcentaje de sujetos que admiten esas conductas poco deseables, sobre todo la de haber hecho travesuras en el pasado y en mayor medida los varones. Es curioso observar que esta conducta ha tenido menor atracción en el CPI que en el MMPI y cómo la admiten más los sujetos del grupo de casos clínicos: lo más probable es que ello sea debido a que en la obtención de las muestras del CPI también se acudió preferentemente a procesos de selección en el grupo de tipificación (que hace descender el porcentaje de aceptación de esa conducta cuan- do se es candidato para un puesto de trabajo).

ITEM	DESEABILIDAD		CPI						MMPI				MMPI-2
	DESEABILIDAD		A		B		C		D		E		F		G		H		I
	V	M	V	M	V	M	V	M	V	M	V	M	V	M	V	M	V	M	V	M
-I1	2,2	2,0	8	7	1	1	3	3	11	14	21	21	5	4	27	35	0	0	9	9
-I2	3,0	2,5	14	7	31	37	32	22	62	42	58	38	17	7	51	32	66	47	47	35
+I1	7,5	7,7	72	76	93	91	96	96	84	83	96	97	86	82	65	50	92	81	81	78
+I2	7,8	8,0	58	78	90	93	85	91	77	92	87	91	59	84	60	86	93	87	87	95

Los dos elementos muy deseables tienen unos índices de atracción muy elevados y, en mayor medida, entre los sujetos españoles. Esto viene a indicar cómo la deseabilidad social influye efectivamente en las respuestas de los sujetos a los elementos de un cuestionario y más aún cuando hay componentes situacionales (como el ser candidato en un proceso de selección) que pueden acentuar dicho efecto.

Más importante para la intención de este capítulo es que los datos apuntan a diferencias culturales que aconsejan, una vez más, la necesidad de una adaptación de los elementos y una tipificación de las puntuaciones directas, sobre todo cuando se obtienen de los cuestionarios de personalidad que provienen de otra cultura.

7. Conclusión

La medida de la personalidad mediante cuestionarios o inventarios en nuestro país es posible gracias a la existencia de una gama relativamente amplia de instrumentos. Sin embargo, junto a las ventajas que ofrecen (bajo coste, tiempos cortos de aplicación y su uso con grupos para disponer de información muy variada), es necesario reconocer las limitaciones que inevitablemente les acompañan (poca fiabilidad y validez, sobre todo por ser más vulnerables a factores consustanciales a su característica de ser un autoinforme).

El usuario de este tipo de instrumental debe tener siempre presente esas limitaciones cuando quiera aprovecharse de las ventajas aludidas. En este sentido, tal vez pudiera reducir alguna de sus limitaciones si le dedicase más tiempo (es decir, si empleara instrumentos más largos) y lograse una mejor disposición del sujeto para contestar con sinceridad, pues, de este modo, podría aumentar la fiabilidad y validez.

Es verdad que esta validez es baja, porque unas pocas variables de personalidad explican relativamente poco de la conducta del sujeto en determinadas actividades (sobre todo las laborales), en las que juegan un mayor papel otros rasgos de la conducta (aptitudes, conocimientos, experiencias, etc.). No obstante, se ha demostrado que su validez puede ser significativa cuando, para explicar esa conducta concreta, se dispone también de información adicional sobre esos otros rasgos de la conducta.

Dado que una buena parte del instrumental disponible es de procedencia extranjera, el usuario debe ser profesionalmente muy crítico con la calidad de la adaptación empleada para su puesta a punto en nuestro país; este proceso debe asegurar que "mide lo que dice medir" de modo similar a como lo hace en la cultura de origen.

Finalmente, además de esa fiabillidad y validez, es necesario atender al tipo y calidad de la tipificación de que dispone el usuario. Es decir, las características de los sujetos que constituyeron la muestra normativa. Para una buena interpretación de los resultados puede ser tan bueno un baremo general como uno específico.

En uno u otro caso no hay que olvidar que, a la postre, y con palabras del profesor Yela, con esos resultados sólo "se estima. por comparación con los de un grupo normativo, la calidad, índole o grado de algún aspecto de su personalidad" y el resultado nunca será una etiqueta inamovible.

BIBLIOGRAFÍA

Cattell, R.B.; Cattell, A.K.S. y Cattell, H.E.P. (1995): 16PF-5. TEA Ediciones. S.A., Madrid.

Eysensk, H.J. (1976): Models of personality. En The Measurement of Personality. MTP, Lancaster y Londres.

Gough, H.G. (1947): Simulated patterns on the MMPI. Journal Abnorm. Soc. Psychol., 2, 23-27.

Hathaway, S.R. y McKinley, J.C. (1940): A multiphasic personality schedule: Construction of the schedule. Journal Psychol., 10, 249-254.

Mischel, W. (1971): Introduction to personality. Holt, Rinehart and Winston, Nueva York.

Sarason, I.G.; Smith, R.E. y Diener, E. (1976): Personality Research: Components of Variance Attribuable to the Person and the Situation. En Eysenk, H.J: The Measurement of Personality. MTP, Lancaster y Londres.

Salgado, J.F. y Rumbo, A. (1997): Personality and Job Performance in Financial SeNices Managers. International Journal of Selection and Assessmen, 5, 2 91-100.

Seisdedos, N. (1988): Selección, cuestionarios y distorsión motivacional. Revista de Psicología del Trabajo y de las Organizacio nes 4, 3-33.

Seisdedos, N. (1994): 16PF Applications of the Fifth Edition in Organizations, Selection and Development (Cross-cultural analyses at three leve/s) Mesa de Trabajo en el 23° Congreso Internacional de Psicología Aplicada, Madrid.

Seisdedos, N. (1997): Psicologia del trabajo y gestión de recursos humanos. Gestión 2000, Barcelona.

TEA Ediciones et al. (1975): Tests empleados en España. TEA Ediciones. S.A., Madrid.

TEA Ediciones (1997): Test y Documentos Psicológicos. TEA Ediciones. S.A., Madrid.