Evaluacion Del Personal

201

description

psicología

Transcript of Evaluacion Del Personal

Page 1: Evaluacion Del Personal
Page 2: Evaluacion Del Personal
Page 3: Evaluacion Del Personal

EVALUACIÓN DEL PERSONAL Los métodos a elegir

Page 4: Evaluacion Del Personal
Page 5: Evaluacion Del Personal

CLAUDE LEVY-LEBOYER

EVALUACIÓN DEL PERSONAL Los métodos a elegir

Page 6: Evaluacion Del Personal

Título original: «EVALUATION DU PERSONNEL: Quelles méthodes choisir? Claude LEVY-LEBOYER.

Traducción autorizada del francés por la editorial: Les Editions d'Organisation

© Les Editions d'Organisation, 1990 © Ediciones Díaz de Santos, S. A., 1992

Juan Bravo, 3-A. 28006 MADRID (España)

Reservados todos los derechos. «No está permitida la reproducción total o parcial de este libro, ni su tratamiento informático, ni la transmisión de ninguna forma o por cualquier medio, ya sea electrónico, mecánico, por fotocopia, por registro u otros métodos, sin el permiso previo y por escrito de los titulares del Copyright».

I.S.B.N. en lengua francesa: 2.7081.1065.9 I.S.B.N. en lengua española: 978-84-87189-95-1 Depósito Legal: 36.888-1991

Diseño de Cubierta: Estuart, S. A. (Madrid) Traducción: Diorki, S. A. (Madrid) Fotocomposición: FER, S. A. (Madrid) Impresión: LAVEL, S. A. Humanes (Madrid)

Page 7: Evaluacion Del Personal

Contenido

Prólogo............................................................................................. IX Introducción ................................................................................... XIII

PRIMERA PARTE. COMO ELEGIR UN MÉTODO DE EVA- LUACIÓN ...................................................................................... 1

1. El análisis del trabajo, una etapa esencial................................. 3 2. Calificando al personal: ¿cómo definir de manera concreta el

éxito profesional? ...................................................................... 17 3. Cualidades métricas de los métodos de evaluación .................... 35 4. La toma de decisiones y evaluación de su utilidad .................... 59

SEGUNDA PARTE. MÉTODOS DE EVALUACIÓN .................. 75

5. El «trío clásico»: referencias, curriculum vitae y entrevistas ... 83 6. Aptitud cognitiva y aptitudes específicas .................................. 107 7. Los tests de personalidad y sus limitaciones ............................... 127 8. Pruebas profesionales y tests de situación.................................. 145

RESUMEN PRACTICO Y CONCLUSIONES. DIEZ RESPUES- TAS A DIEZ PREGUNTAS QUE SE PLANTEAN LOS RES- PONSABLES DE TOMAR DECISIONES...................................... 163

Bibliografía citada............................................................................. 173

Bibliografía básica en español .......................................................... 181

VII

Page 8: Evaluacion Del Personal
Page 9: Evaluacion Del Personal

Prólogo

El libro que tiene en sus manos da respuestas. Versa sobre la evalua- ción del personal. A través de sus páginas encontrará estrategias, métodos, resultados, líneas de actuación. No divaga, va al grano.

Cuando una persona envía su curriculum vitae a una empresa, no quiere que le tomen el pelo. Un puesto de trabajo y su futuro están en juego. Espera recibir un sí o un no debidamente sustentado y argumentado.

Cuando una empresa anuncia una vacante, no lanza los dados sobre el conjunto de curriculum vitae recibidos. Un puesto de trabajo y un buen funcionamiento está en juego. Espera quedarse con el mejor candidato y, normalmente, se empeña a fondo en conseguirlo.

Cuando el INEM evalúa los potenciales de empleo de las personas que están en paro, no juega a la Bono Loto con los códigos de identificación de los candidatos. Cumple una función social a través de sus prestaciones. El perfil ocupacional de los demandantes de empleo tiene que encajar con el que se define en la oferta de empleo recibida. Ha de atender las necesi- dades de las empresas y de los parados, sin marearlos.

¿Cómo comprobar el grado de solvencia de los procesos de recluta- miento y selección del personal que están en vigor en una entidad? Esta es la gran cuestión que se aborda en este libro.

Va dirigido a empresarios, directivos, personas que buscan trabajo o que quieren cambiar de empleo, líderes sindicales, psicólogos del trabajo y de las organizaciones, sociólogos y trabajadores sociales de empresa, gra- duados sociales, altos funcionarios, parlamentarios, etc. Plantea una cues- tión de gran peso en sociedad contemporánea. La selección de personal es un asunto muy serio como para dejarlo en manos de aficionados.

La sociedad española está invirtiendo mucho dinero público en la creación y fomento del empleo. Qué menos que exigir que el procedi- miento seguido en la elección de la persona idónea sea justo, correcto y equitativo. De no ser así, se bonifica el favoritismo y el amiguismo con cargo a los impuestos que aportan los ciudadanos.

Este libro expone una serie de métodos científicos y tecnológicos que permiten comprobar en qué medida una empresa, pública o privada, uti- liza unos procedimientos de selección que sean convincentes, seguros y certeros.

IX

Page 10: Evaluacion Del Personal

X EVALUACIÓN DEL PERSONAL

En España co-existen dos tradiciones que merece la pena mencionar: la jurídica y la científica. Existen otras dos, la del enchufe o la de la improvisación, que están tipificadas como delito: hay malversación de fondos públicos en beneficio propio, hay prevaricación o se atenta contra los derechos fundamentales de los trabajadores. Sobre todo cuando el contratante o el contratado obtienen deducciones fiscales o se acogen a bonificaciones específicas en las cotizaciones a la seguridad social. Su persecución debería ser mucho más contundente, ya que en la actualidad existen pocos cauces abiertos para que el lesionado defienda sus intereses. Se exige muy pocas contraprestaciones a los Departamentos de Personal por las mejoras que obtienen a través de ciertos sistemas de contratación bonificados.

La tradición jurídica y la tradición científica parten de un mismo supuesto: cualquier persona que se presente a un proceso de selección ha de ser evaluada equitativa y rigurosamente. La tradición del enchufe y la de la improvisación van por libre en lo que a este supuesto básico se refiere.

La tradición jurídica se desarrolla a partir de un segundo supuesto. La prueba que permitirá evaluar a los candidatos tiene que ser idéntica para todos y ha de administrarse en condiciones de igualdad. Opera desde una óptica determinista. Se rige por lo que está previsto en la convocatoria. Ha de cumplirse exactamente aquello que prescribe la normativa. Quie- nes obtengan las puntuaciones más altas cubrirán las vacantes, siguiendo un orden de prelación descendente. Dicho ejercicio lo elabora en secreto una comisión. Esta acuerda, por sí misma, contenidos, ponderaciones, decisiones. Los miembros de tales comisiones se comprometen a actuar con talante honesto. Nunca tienen que demostrar que la prueba que ela- boraron predice un buen rendimiento de la persona en los cometidos que ha de afrontar en el nuevo puesto. Se atienen a lo legislado. Resueltas las posibles apelaciones, la comisión deja de existir. Nadie revisa posterior- mente en qué medida estas comisiones han seleccionado candidatos que cumplen con sus obligaciones y trabajan de modo eficiente.

La tradición científica da un paso más allá, basándose además en un tercer supuesto. Asume la responsabilidad de poder demostrar, de modo fehaciente, que los candidatos seleccionados están a la altura de las exi- gencias del puesto y que, al menos a corto y medio plazo, constituyen un personal eficaz. Opera desde una óptica probabilista. Optimiza sólo aque- llos enfoques que han dado buen resultado en ocasiones anteriores. Las pruebas que se utilicen para evaluar al personal han de predecir cotas de rendimiento medio o alto en el puesto. Además, admite revisiones de fondo. Es decir, se compromete a demostrar empíricamente que hay un nexo real entre la decisión positiva adoptada y la actuación laboral del candidato o candidata. Se sirve, para ello, de la investigación continuada

Page 11: Evaluacion Del Personal

PROLOGO XI

a partir de los datos disponibles. Incluso años después de haber concluido la selección, se sigue comprobando si las pruebas funcionan, evalúan, predicen y permiten tomar decisiones acertadas. La tradición científica se somete al dictamen de expertos nacionales e internacionales. Se compa- ran y escudriñan pruebas, se debaten enfoques y estrategias, se aquilatan resultados y predicciones. Cuando las minorías consideran que han sido maltratadas en un proceso de selección, la tradición científica colabora para analizar si las pruebas que han sido aplicadas lesionan o no los intereses de dichas minorías. El autor o autores de las pruebas, y quienes tomaron decisiones sirviéndose de ellas, tienen que demostrar la idonei- dad de las mismas. En caso negativo, los jueves cuentan con el informe pertinente que puede sustentar la oportuna sentencia y sanción. En oca- siones entraña la incorporación en plantilla de quienes han sido maltrata- dos o compensaciones económicas por los perjuicios causados.

La profesora Claude Levy-Leboyer expone en este libro qué métodos, estrategias e instrumentos utiliza la tradición científica a la hora de eva- luar al personal y tomar decisiones respecto a su idoneidad para un puesto de trabajo en una organización dada. Entra a fondo en un tema delicado pero, al mismo tiempo, de gran exigencia para el mantenimiento de la democracia industrial. El libro da respuestas. La empresa que quiere cu- brir vacantes y las personas que se presentan como candidatos o candida- tas pueden verificar si el procedimiento que se sigue es justo, equitativo y correcto. Es decir, si la decisión final permite detectar qué persona actua- rá de modo eficiente en el puesto y en la unidad para la que fue contrata- da. La selección de personal no queda en manos de unos aficionados que rehusan responsabilidades de lo que ocurran cuando el proceso de selec- ción haya concluido.

Llegados a este punto hay que aclarar qué se entiende por evaluación del personal. Con frecuencia se suscitan malentendidos que es preciso dejar aparcados. El más común consiste en confundir evaluación con va- loración del personal.

Etimológicamente, los términos Evaluation en francés y Evaluación en español, quedaron acuñados en torno al siglo XIV y XV. Provienen ambos del verbo latino «valere» que significaba «ser fuerte, vigoroso, potente, robusto, tener fuerza, vigor».

En su uso actual tiene varias acepciones. Conviene pasar revista a las mismas ya que permite aclarar gran parte de los contenidos que se abor- dan en este libro.

1. Evaluar significa medir, es decir, asignar mediciones de suerte que a dos cantidades iguales corresponda el mismo número y a dos cantidades desiguales números distintos. Se evalúa cuando se otorgan, objetivamente,

Page 12: Evaluacion Del Personal

XII EVALUACIÓN DEL PERSONAL

puntuaciones a una persona en un examen, una prueba, un ejercicio, una actuación laboral, etc. Prevalece, pues, un enfoque cuantitativo en la eva- luación.

2. Evaluar significa determinar el grado de congruencia entre los re- sultados y los objetivos que se persiguen en un proceso de selección. Ello implica tener claro qué tipo de empleados eficaces se quiere tener y qué tipo de empleados han sido contratados. Permite combinar enfoques cuantitativos (por ejemplo, correlaciones) y cualitativos.

3. Evaluar significa contar con el dictamen de uno o varios expertos que aquilate en qué medida el proceso de selección ha sido justo, correcto y equitativo. Se basa en un juicio global de índole cualitativo. Es una labor de peritaje.

4. Evaluar significa acumular y tener actualizados los datos que per- miten comprobar si el proceso de selección está siendo efectivo y útil de cara a las necesidades y objetivos de la entidad y de los trabajadores. Estos datos pueden ser de carácter cuantitativo y cualitativo.

5. Evaluar significa cuestionarse periódicamente el sentido y propósi- to de la labor profesional que se está llevando a cabo a través de los distintos procesos de selección que se diseñan e implantan. Es un enfoque que se sustenta en el debate, la confrontación, la negociación y el consen- so entre la dirección de recursos humanos, los líderes sindicales y los expertos en evaluación del personal.

En este libro, las cinco acepciones afloran al estudiar cada uno de los métodos científicos y tecnológicos que están contrastados. La persona que es experta en evaluación del personal sabe adentrarse y sacar partido de las implicaciones que se derivan de cada una de estas cinco acepciones. Sólo así puede demostrar que domina el tema en profundidad. El aficionado ha oído campanas, pero no sabe dónde ni cómo integrarlas.

La valoración del personal tiene que ver con el reconocimiento, esti- ma, aprecio que se atribuye a los méritos y aportaciones de una persona en su puesto de trabajo o en la unidad a la que está asignada. Desemboca en un sistema de retribuciones, ascensos o compensaciones que se im- planta en la entidad para retribuir a cada cual según sus méritos. Etimoló- gicamente, proviene del término latino «valor» y conlleva la atribución de un precio o valor a la labor realizada. En definitiva, permite determinar cuál es la valía de esa persona en el seno de la organización o en el mercado laboral.

La evaluación del personal y la valoración del personal son, pues, dos enfoques y dos momentos claramente diferenciados en una dirección es- tratégica y competitiva de los recursos humanos. El meollo de este libro gira en torno a la evaluación del personal como tema central. Los meto-

Page 13: Evaluacion Del Personal

PROLOGO XIII

dos y enfoques que sustentan una adecuada valoración del personal apare- cen coyunturalmente en algunos pasajes, pero no constituye el eje central de esta obra.

La doctora Claude Levy-Leboyer es una psicóloga del trabajo y de las organizaciones de reconocido prestigio internacional. Desde 1982 a 1990 ha sido presidenta de la Asociación Internacional de Psicología Aplicada, creada en 1919. Es miembro fundador de la Red Europea de Psicólogos del Trabajo y de las Organizaciones (ENOP). Desde 1980, anualmente, esta red de profesores e investigaciones (2-4 por país) se reúne y pasa revista al estado de la cuestión en los desarrollos más recientes de este ámbito de conocimiento experto. Preside la sección 49 del Centro Nacio- nal de Investigaciones Científicas (CNRS) de Francia. Ha sido directora del Instituto de Psicología de la Universidad Rene Descartes de París V y vicepresidenta de dicha Universidad. Forma parte del comité editorial de numerosas revistas internacionales de esta especialidad y de otras afines.

En España ya se han publicado dos libros suyos: Psicología de las Organizaciones y Psicología Ambiental. Ha publicado numerosos libros. De ellos merece la pena destacar el Tratado de Psicología del Trabajo (en francés) y un volumen en inglés que analiza, desde la perspectiva psicoso- cial, el fenómeno del vandalismo en la sociedad contemporánea. Con frecuencia viene a España a impartir conferencias, cursos o a implicarse en reuniones de trabajo. Es, pues, una investigadora y una profesional de primera línea. El libro que tiene en las manos es su obra más reciente. En el panorama internacional, la última novedad sobre el tema.

Prof. José M. Prieto Facultad de Psicología Universidad Complutense Madrid, 7 de septiembre 1991

Page 14: Evaluacion Del Personal
Page 15: Evaluacion Del Personal

Introducción

La importancia del factor humano en la gestión de empresas y organi- zaciones, cualesquiera que sean sus dimensiones, su ámbito propio y su campo de actividad, es algo evidente que nadie pone en tela de juicio. Las decisiones referentes a la selección, la dirección de una carrera profesio- nal, la designación para un puesto o incluso la orientación hacia una formación determinada son de capital importancia, tanto para la organi- zación como para el individuo. En este terreno, los errores se pagan caros, en tiempo, en trabajo y en dinero. Esos errores son, además, una de las principales fuentes de desmoralización, desmotivación e insatisfacción.

Cualquier decisión relacionada con un individuo supone una valora- ción de sus aptitudes, de sus conocimientos adquiridos y, muchas veces, también de su personalidad y de sus cualidades sociales. Ello equivale a decir que, en este aspecto, lo acertado de la decisión depende de la calidad de la valoración y, por tanto, de lo adecuado que sean los métodos utiliza- dos para juzgar la capacidad de adaptación del individuo al puesto o función al que se le destina, y para evaluar las posibilidades de éxito que tiene en la formación o en la carrera que inicia. Así pues, tiene su impor- tancia conocer los métodos que se utilizan actualmente en Francia para llevar a cabo tales evaluaciones.

Algunos artículos de prensa han destacado recientemente el carácter, muchas veces irracional, de algunas prácticas actuales, como la morfo- psicología, el perfil astrológico, la numerología, incluso la videncia y la radiestesia. Todos estos métodos tienen dos puntos en común: por un lado, se apoyan en tipologías caducas y, sobre todo, en un procedimiento no objetivo en el que la creencia y la afirmación usurpan el lugar de las pruebas y de la objetividad. Resulta difícil saber si tales prácticas son frecuentes. En una encuesta mediante entrevistas realizada con 60 gabine- tes de selección y 42 servicios de empresa, M. L. Bruchon-Schweitzer (1989) sólo detecta su utilización en los gabinetes de selección. Entre las personas consultadas, el 12 % aseguran emplear la morfo-psicología, un 8 % la astrología y un 6,5 % recurren a otras prácticas irracionales. Aun- que seguramente habrá que suponer que estas cifras están por debajo de la realidad, ya que no está nada claro que todas las personas encuestadas hayan confesado la situación real.

XV

Page 16: Evaluacion Del Personal

XVI EVALUACIÓN DEL PERSONAL

¿Cuáles son los métodos más frecuentes? Sin duda, la entrevista ocupa el primer lugar, tanto en la encuesta antes citada, según la cual la entrevis- ta se utiliza en más de nueve selecciones de cada diez, como en una encuesta telefónica realizada por nosotros con los 200 primeros grupos franceses de la lista publicada en 1986 por el diario «Les Echos». Además, la entrevista suele utilizarse como método único: en nuestra encuesta telefónica con las empresas, hemos podido comprobar que en el 84 % de los casos la selección de altos ejecutivos se basa únicamente en una entre- vista y un curriculum vitae. Lo mismo sucede con el 78 % de los mandos intermedios y con el 35 % de personal no ejecutivo. ¿Quién lleva a cabo esas entrevistas? En el 79 % de los casos, algún miembro del departamen- to de personal; en el 68 % de los casos se celebra además una entrevista con el jefe del departamento en cuestión. La mayor parte de nuestros encuestados no podía precisar con claridad si las entrevistas eran realiza- das por personas formadas para ese trabajo. Y menos aún si existía un guión para la entrevista, o incluso una distribución de preguntas entre las diferentes personas encargadas de realizar las entrevistas.

Según la encuesta de M. L. Bruchon-Schweitzer, los restantes métodos mencionados se practican con menor frecuencia siempre acompañados de algún otro. La grafología se utiliza en el 33 % de los gabinetes y en el 21 % de las empresas, en la primera criba, pero siempre asociada al exa- men de la carta del candidato y de su curriculum vitae. Un examen grafo- lógico más profundo forma parte del 72 % de los exámenes que siguen a una primera criba en los gabinetes y en el 31 % de los casos estudiados en la propia empresa. Los tests de personalidad se citan en 4-6 pruebas de cada diez; los de aptitud se emplean en el 38 % de las empresas consulta- das, de manera sistemática, en el 74 % de manera ocasional y en el 25 % de los gabinetes de selección (sistemáticamente) y, ocasionalmente, en el 55 %. Las pruebas profesionales, los tests proyectivos y las referencias figuran con los índices de utilización más bajos.

Este cuadro coincide bastante con el que describe, para la industria inglesa, la reciente encuesta de Sneath, Takur y Medjunck y la de Ro- bertson y Makin: las entrevistas se utilizan en el 81 % de los casos, el curriculum vitae y las referencias en el 67 %, los test cognitivos y los de personalidad en un 5 y un 4 %, respectivamente, y, con menos frecuencia aún, un centro de valoración. Robertson deduce que esta situación resulta inquietante, ya que los métodos que constituyen el fundamento de la valoración del potencial humano en la industria son precisamente los que, dentro del conjunto de las numerosísimas investigaciones publicadas al respecto, resultan menos valiosos y menos válidos.

¿Cómo y sobre qué se eligen los métodos empleados? Muchas seleccio- nes y valoraciones son realizadas por gabinetes externos. Este es el caso

Page 17: Evaluacion Del Personal

INTRODUCCIÓN XVII

(según nuestra encuesta telefónica) de aproximadamente la mitad de nuestros interlocutores, con mucha más frecuencia en las empresas de menos de 100 personas (el 97 %) que en las grandes (el 27 %). Ahora bien, parece como si, una vez confiado el trabajo de selección a un gabinete, no se quiere saber con precisión las técnicas que éste emplea, ni de dónde las saca, y menos aún cómo se comprueban y qué cualificación poseen las personas que las llevan a cabo.

Cuando el propio departamento de personal es el que asume los pro- cedimientos de valoración, ¿cómo se explica la elección de tal o cual técnica? En nuestra encuesta, se citaron cuatro motivos que enumeramos por orden de frecuencia: en primer lugar, la aceptabilidad del método utilizado por parte de las personas que han de ser sometidas a él. Ese es el principal argumento para limitarse a las entrevistas y para emplear la grafología. En segundo lugar, el coste, sin que se establezca, por lo demás, comparación alguna con la evaluación de la utilidad de las informaciones recogidas ni de los costes de los errores. En tercer lugar, la intuición, la sensación de que el método utilizado es satisfactorio, el hecho de que nadie se queje de él y, una vez más, sin que se pueda aportar un balance preciso.

Sin embargo, existe una amplia gama de métodos destinados a realizar una valoración de los individuos con vistas a su trabajo. Es más, existen criterios precisos que permiten «valorar la valoración» y quedarse sólo con los métodos adecuados. Es cierto, como algunos de nuestros interlo- cutores apuntaron, que la conducta humana es compleja y difícil de pre- ver. Pero también es cierto que las empresas, que se enfrentan diariamen- te a decisiones en cuanto a personal, no pueden esperar a que aparezca en el mercado un método ideal, ni tienen tiempo de leer la importante bi- bliografía �por lo demás muy técnica y muchas veces publicada en in- glés, en revistas especializadas� que los psicólogos dedicados al campo laboral producen sobre estos temas. Seguramente estas no son razones suficientes para resignarse a la falta de rigor, ni para anteponer la intui- ción a las pruebas ni para dejarse guiar por métodos irracionales.

De hecho, las empresas que hemos encuestado deseaban efectivamen- te disponer de las informaciones y conocimientos necesarios para poder elegir los métodos más adecuados para cada caso. Por otro lado, las nue- vas posibilidades que aporta la informática para el análisis de datos, junto a la creciente importancia, desde el doble punto de vista social y financie- ro, de la gestión de los recursos humanos, han hecho avanzar en esta última década no sólo los métodos de evaluación, sino también la refle- xión teórica sobre los criterios de elección de tales métodos.

Algunos encuentros internacionales y numerosas publicaciones en in- glés han dado cuenta de estos recientes progresos, pero en Francia no son

Page 18: Evaluacion Del Personal

XVIII EVALUACIÓN DEL PERSONAL

suficientemente conocidos. El presente libro está destinado a colmar esa laguna, tratando de aportar una respuesta a las siguientes preguntas:

� ¿De qué métodos disponemos para valorar el potencial humano? � ¿Qué criterios se pueden aplicar para elegir entre esos métodos? � ¿Qué tipo de informaciones aportan los métodos existentes y cómo

deben utilizarse? No se trata de un libro de «recetas», sencillamente porque en este

campo no existen recetas milagrosas. Lo que sí existen son unas reglas fundamentales que, si se aplican, garantizan la calidad de los métodos, así como el respeto de los principios éticos fundamentales. Este libro se sitúa en el plano de las reglas y de los principios. Se dirige, ante todo, a los jefes de empresa, a los jefes de personal y a los responsables de alto nivel que estén preocupados por elegir bien unos métodos de evaluación adaptados a cada uno de sus problemas, dentro de unas condiciones de equidad y de objetividad, y reservándose la posibilidad de controlar de manera perma- nente la calidad de los métodos utilizados. No se trata en absoluto de una guía práctica y chapucera para hacer uno mismo la evaluación del propio personal.

Aunque para muchos lectores pueda suponer un esfuerzo real de asi- milación de nuevas ideas, comenzaremos exponiendo los principios y los conceptos que es preciso conocer para elegir uno o varios métodos de valoración y para valorar la calidad de la valoración, es decir, calibrar su pertinencia y utilidad. Luego trazaremos un cuadro tan completo como nos sea posible de las diferentes categorías de métodos existentes, indican- do lo que sepamos de su significación y de su valor, se trate o no de métodos creados por psicólogos. No existe razón alguna, en efecto, para no aplicar las mismas exigencias tanto a unos como a otros, por lo cual no vamos a proporcionar un catálogo de tests o cuestionarios, ni siquiera de métodos de observación. Pero sí trataremos de mostrar cómo las reglas del método experimental se aplican a la evaluación, y que la validez pre- dictiva de las técnicas de evaluación (es decir, la correlación existente entre el pronóstico hecho, con tales técnicas, por un lado, y, por el otro, la propia realidad), así como su validez de contenido (es decir, su coherencia y significación), han de desempeñar un papel central como criterios del valor de los métodos empleados.

Dicho lo cual, por más cuidado que se ponga en elegir esos métodos y por más cualidades que posean sus usuarios, no hay que esperar de ellos más de lo que pueden dar. Lo que determina el comportamiento del hombre en su trabajo no se puede describir mediante unas simples ecua- ciones. Cualquier conducta es el complejo resultado de cualidades indivi- duales y de factores situacionales que afectan al puesto de trabajo, a la

Page 19: Evaluacion Del Personal

INTRODUCCIÓN XIX

política de personal de la organización en su conjunto, incluso al entorno económico, técnico y social que envuelve a dicha organización. El si- guiente diagrama da una imagen muy simplificada, pero bastante clara, de ese doble determinismo.

Es cierto que los caracteres individuales, las aptitudes, la competencia adquirida, los rasgos de personalidad y las cualidades sociales representan factores esenciales de la eficacia individual dentro de la organización. Pero es preciso también que la organización sepa sacar partido de esas cualidades, sobre todo que sepa ofrecer a su personal unas condiciones laborales satisfactorias y que sepa crear un marco y un clima propicios para la motivación y la implicación en el trabajo.

El presente trabajo se refiere esencialmente a los métodos destinados a evaluar a los individuos; no es, pues, el lugar adecuado para detallar la naturaleza, el modo de acción y el efecto de los factores situacionales. No obstante, conviene recordar su importancia, ya que ello supone que, en ningún caso, el conjunto de las variables individuales (las que miden los métodos que vamos a exponer y discutir) puede explicar de manera cabal el comportamiento y la eficacia de los individuos dentro de las organiza- ciones.

Así pues, hay que tener presente que lo que pueda aportar un método de evaluación está limitado por el rol de los factores individuales dentro de la vida profesional. La descripción de las características de un indivi- duo, por muy precisa que sea, sólo permite formular un pronóstico o dar un consejo en función de un determinado puesto, de una situación, de un servicio o de una organización determinados. ¿Qué quiere decir esto en concreto? Que una persona que resulte ineficaz, o inadaptada, o incluso del todo incompetente en un sitio, tal vez en otro sea eficaz, sociable y capaz de utilizar su saber. Asimismo, pretender la selección de un colabo- rador «motivado» no significa nada, ya que nadie está «motivado» sin más en una tarea o situación. Ciertos contextos laborales estimulan la

Page 20: Evaluacion Del Personal

XX EVALUACIÓN DEL PERSONAL

motivación de algunos, pero no consiguen el fervor de otros, incluso algu- nos puestos están tan mal definidos que no motivan a nadie.

En resumen, hacer una buena evaluación, adoptar decisiones funda- das sobre un balance correcto del potencial humano, no representa más que una parte �esencial, desde luego� de la política de personal. Y el hecho de utilizar bien una evaluación es tan importante como el preocu- parse por la calidad de dicha evaluación. Ambos imperativos son comple- mentarios: tanto para utilizar un potencial humano como para elegir un método de evaluación, hay que comprender, evidentemente, su significa- ción, y por tanto, conocer bien en qué se basa.

El objetivo de este libro es el que determina su plan: una primera parte para atender los principios, los conceptos y los instrumentos que permiten elegir los métodos de evaluación más adecuados, y una segunda parte para pasar revista a los métodos de evaluación existentes, su contenido y su valor, utilizando las nociones definidas en la primera parte.

Los métodos de evaluación han de adaptarse a la naturaleza de los puestos y al contenido de las funciones, de manera que la primera parte comienza con un capítulo sobre el análisis del trabajo. Contiene asimismo un capítulo sobre las calificaciones profesionales y los «criterios» del éxi- to. En efecto, para verificar la pertinencia de las decisiones pasadas y, por tanto, la calidad de los métodos utilizados para elaborar las evaluaciones que sirvieron para adoptar esas decisiones, hay que hacer un seguimiento regular de las mismas, es decir, confrontarlas con la realidad de los he- chos. Todo ello supone la necesidad de describir los comportamientos profesionales y de hacerlo con todo rigor y objetividad. Un tercer capítu- lo, más abstracto, define las cualidades métricas esenciales de cualquier técnica de evaluación e indica las diferentes maneras de medirlas. El cuar- to capítulo aborda los delicados problemas planteados por la adopción de una decisión a partir de un determinado número de informaciones inde- pendientes entre sí y por la estimación de la utilidad de los métodos em- pleados.

En la segunda parte, presentaremos los grupos de métodos sobre los que existen estudios críticos, investigaciones fundamentales y balances serios. Abordaremos los clásicos «tests psicológicos» y los más recientes métodos, así como los centros de evaluación; los más tradicionales, como la entrevista y el cuestionario biográfico, o los más discutidos, como los cuestionarios de personalidad. Prevalecerá en todos los casos el mismo tratamiento: examinar todos los métodos desde el punto de vista de su viabilidad, de sus cualidades métricas, de su demostrada importancia, de la utilidad de la información que aportan y de su valor de predicción.

Page 21: Evaluacion Del Personal

PRIMERA PARTE

Cómo elegir un método de evaluación

La elección de un método de evaluación que permita la descripción del potencial humano, así como la predicción precisa del comportamien- to individual en una determinada situación laboral, no es una operación concreta, sino un complejo proceso que consta de tres etapas sucesivas y que puede, prolongarse a posteriori mediante un balance. Cada una de esas etapas se estudia en sendos capítulos de esta primera parte.

El primero se refiere al análisis del trabajo. Cada puesto, cada función, ofrecen unas características particulares que es preciso saber identificar. ¿Significa esto que hay que elegir un método o un grupo de métodos diferentes para cada oficio o cada puesto? Es lo que se venía creyendo desde hace tiempo. Los resultados de las investigaciones llevadas a cabo en los últimos diez años, sobre todo en los Estados Unidos, demuestran que existen «familias ocupacionales» suficientemente homogéneas como para poder utilizar los mismos métodos cuando la valoración afecta a ocupaciones de una misma familia. Así pues, el análisis del trabajo tiene un doble objetivo, dentro de la perspectiva que aquí nos ocupa: por un lado, definir las exigencias de cada puesto; por otro, tratar de encuadrar dicho puesto dentro de un conjunto coherente constituido por toda una «familia ocupacional».

Para controlar el valor de los métodos utilizados, hay que poder com- parar con la realidad las informaciones predictivas que estos aportan, es decir, con el comportamiento profesional observado en el trabajo cotidia- no. Esto supone saber valorar, por una parte, el rendimiento del trabajo de manera discriminatoria, fiable y objetiva y, por otra, concretar esa valoración en forma de «criterios» de éxito profesional. Estos instrumen- tos ofrecen un doble interés, ya que sirven asimismo para darse cuenta de las calificaciones profesionales necesarias para la gestión de las carreras profesionales. El segundo capítulo estará dedicado a la evaluación del éxito profesional, piedra angular de cualquier validación de los métodos destinados, precisamente, a predecir ese éxito.

1

Page 22: Evaluacion Del Personal

2 EVALUACIÓN DEL PERSONAL

El tercer capítulo tal vez sea el más importante de esta obra. También es el más abstracto, ya que en él se definirán las cualidades métricas que han de poseer los métodos de evaluación, así como las técnicas que per- miten medir esas cualidades. Aun cuando ello represente un esfuerzo de atención, quienes utilicen métodos de evaluación del potencial humano deberían conocer estas exigencias métricas, ya que poseen un carácter sine qua non: verificar que un método posee las cualidades métricas funda- mentales debe ser la primera condición para elegir un método de evalua- ción.

Toda evaluación lleva tiempo y requiere ciertas competencias. Tam- bién la construcción de unos métodos de evaluación y su control. Así pues, es preciso saber utilizarlas eficazmente para adoptar decisiones, es decir, saber realizar una síntesis de informaciones diversas y muchas veces llenas de matices para adoptar una decisión casi siempre dual: sí o no. También hay que preocuparse por la utilidad, tanto en el plano humano como en el plano de la rentabilidad, de los métodos empleados para adop- tar tales decisiones. El capítulo 4 se ocupará de los actuales conocimientos en ese campo y de sus consecuencias en el terreno práctico.

Page 23: Evaluacion Del Personal

1

El análisis del trabajo, una etapa esencial

El análisis del trabajo constituye la primera etapa del desarrollo de un procedimiento de evaluación. Es, además, una etapa de capital importan- cia. En efecto, hay dos campos conceptualmente distintos, el de las activi- dades laborales y el que se refiere a las aptitudes y características huma- nas. El análisis del trabajo es el que proporciona los datos precisos para establecer conexiones entre ambos campos. Lo ideal sería llegar a consti- tuir una clasificación común para las actividades laborales, las aptitudes y características requeridas y los métodos para medirlas. A falta de esta «multitaxonomía», habrá que utilizar en cada caso un análisis del trabajo con objeto de poner a punto una estrategia que permita vincular estos campos entre sí.

En este sentido, el análisis del trabajo habrá de permitir precisar lo que hay que predecir, es decir, los aspectos del trabajo (comportamiento o rendimiento) que resultan básicos para la buena marcha de la tarea o la realización de la función para deducir de ahí las características individua- les necesarias y requeridas. También debería permitir dicho análisis des- cribir las relaciones que eventualmente puedan existir entre los diferentes aspectos del trabajo, entre las diferentes características requeridas y, final- mente, entre ambos sistemas.

El análisis del trabajo se utiliza en otros terrenos, sobre todo en el de la ergonomía, con fines específicos diferentes. Dentro del marco que aquí nos interesa, es decir, el de la evaluación del personal, puede tener tres objetivos distintos y que se sitúan a diferentes niveles de intervención.

� El análisis de tareas puede utilizarse directamente para elaborar unas pruebas profesionales o pruebas «situacionales» que posteriormente sirvan como técnicas de evaluación.

� El análisis de tareas puede asimismo facilitar un cúmulo de infor- maciones que posteriormente servirán para elegir unos indicadores ade-

3

Page 24: Evaluacion Del Personal

cuados entre las técnicas de evaluación existentes, ya que corresponderán a aspectos esenciales de la tarea analizada.

� Finalmente, el análisis de tareas puede servir para crear familias ocupacionales e identificar los elementos comunes que caracterizan las ocupaciones o las funciones de una misma familia. Tal clasificación, si está correctamente hecha, ofrece numerosas ventajas. Más adelante vere- mos que puede servir para identificar unos indicadores de éxito profesio- nal común para una misma familia. También puede servir de base para los planes de formación y movilidad cuando la evolución de las condicio- nes tecnológicas o económicas exija cambios de destino entre el personal.

¿A dónde debe conducir el análisis del trabajo? O dicho en otros tér- minos, qué es lo que ha de contener el documento que resulte de dicho análisis? El contenido tipo de una descripción de puesto o función consta de seis epígrafes distintos (Smith y Robertson, 1986):

1. Todo lo que permita la identificación del puesto o función: desig- nación exacta, lugar donde se desarrolla el trabajo, número de personas que desempeñen el mismo puesto o función.

2. Los objetivos concretos del puesto o función, es decir, su situación dentro de la organización y de su organigrama.

3. Las responsabilidades de la persona titular del puesto o función, es decir, qué es lo que tiene que hacer y el tipo de resultados que de ella se esperan. Tales responsabilidades pueden referirse tanto a fabricación de productos como a prestación de servicios. Si es preciso, habrá que detallar la calidad que se exige, así como los instrumentos o los medios técnicos que conviene emplear, que el titular del puesto deberá conocer a fondo. Si el puesto o la función implican el establecimiento de una jerarquía o la formación de personal, habrá que precisar el número de personas encua- dradas, el grado de responsabilidad que supondrá su selección, su trabajo y la gestión de su carrera. Si el puesto o función implican responsabilida- des de orden financiero, es necesario detallarlas (su naturaleza, el nivel de decisión y control...). Finalmente, habrá que precisar también el apoyo y el control que el titular del puesto tendrá por parte de su superior.

4. Relaciones con las demás personas. No sólo habrá que mencionar las personas con las que el titular del puesto mantendrá un contacto regu- lar, sino también el contenido de sus relaciones: manejo de información, asistencia técnica, órdenes que se han de impartir o recibir, etc. Si el trabajo implica la animación de equipos o de grupos, habrá que especifi- carlo también. Si el puesto implica contactos con los clientes, deberán describirse con la mayor precisión.

5. Condiciones físicas del trabajo: este apartado se refiere sobre todo a la descripción del trabajo del personal de producción y servicio. En él

4 EVALUACIÓN DEL PERSONAL

Page 25: Evaluacion Del Personal

EL ANÁLISIS DEL TRABAJO, UNA ETAPA ESENCIAL 5

hay que incluir la descripción del lugar de trabajo, los horarios, la natura- leza y las exigencias físicas de las tareas y, eventualmente, los riesgos que acarreen.

6. Condiciones de remuneración y promoción: salarios y ventajas, retiros y pensiones, existencia de primas o bonos y su forma de atribu- ción, normas respecto a faltas de asistencia al trabajo, posibilidades de promoción o de cambio y de desarrollo profesional.

MÉTODOS

Los métodos de análisis del trabajo no son de por sí específicos de los diferentes objetivos antes descritos. En cada caso, habrá que elegir el mé- todo en función de las posibilidades que ofrezca la situación del trabajo, el tiempo de que se disponga y la naturaleza de la tarea en sí.

El análisis puede orientarse más bien hacia el trabajo o hacia el traba- jador. En el primer caso, es básicamente un análisis descriptivo y contem- pla ante todo las tareas que el trabajador debe efectuar; en el segundo caso, en cambio, el análisis permite describir las actividades que el traba- jador pone en marcha para que esas tareas se cumplan efectivamente y sus normas mediante el análisis de conductas operativas y poniendo en evidencia las reglas de actuación del operario (Sperandio, 1984).

La diferencia entre ambas estrategias no parece revestir mayor impor- tancia, en la medida en que el resultado final del análisis del trabajo, en cuanto paso previo a la evaluación profesional, desembocará en una lista de exigencias del puesto o función. Efectivamente, será preciso, en ambos casos, en un momento dado, deducir las características individuales que se requieren, ya sea a partir de la lista de tareas o de la lista de actividades que se han de poner en juego. No obstante, parece que en los trabajos publicados se percibe una preferencia hacia las descripciones que «se orientan hacia el trabajador», ya que proporcionan un cuadro de compor- tamiento más general y menos ligado a las características técnicas específi- cas de cada puesto. En contrapartida, el análisis del trabajo «orientado hacia la tarea» representa un paso previo muy fecundo, si se pretende reunir muestras específicas de situaciones o comportamientos, que servi- rán más adelante de base para desarrollar pruebas profesionales y «tests de situación».

El método más directo y más utilizado para realizar un análisis del trabajo consiste en interrogar a las personas en sus puestos, así como a sus mandos, por medio de una entrevista abierta. Las ventajas de este método radican en su flexibilidad y en su fácil puesta en práctica. Muchas veces, permite obtener informaciones interesantes y que van más allá de la des-

Page 26: Evaluacion Del Personal

6 EVALUACIÓN DEL PERSONAL

cripción, sobre todo en cuanto a la forma en que la tarea y sus dificultades son apreciadas por los operarios (de Keyser y otros, 1970). No obstante, requiere tiempo y las informaciones reunidas son difíciles de analizar sistemáticamente. La entrevista puede realizarse también con un grupo de interlocutores competentes. Estas entrevistas de grupo pueden parecer más ricas de contenido, debido a las interacciones entre los miembros del grupo, pero son difíciles de organizar y no siempre es posible controlar el impacto de algún miembro del grupo con gran influencia sobre el resto.

Es posible hacer que la entrevista y sus resultados sean más sistemáti- cos utilizando un cuestionario o una lista de control. Ambos exigen una profunda preparación, que comienza con la lectura de todos los docu- mentos existentes respecto a las responsabilidades y actividades de los puestos y funciones a analizar y continúa muchas veces con una entrevis- ta preparatoria con los mandos, para precisar cuáles son las actividades más frecuentes, las más importantes y, eventualmente, las necesarias des- de el puntó de vista de la seguridad y del valor añadido. Pueden mejorarse los cuestionarios y listas de control dándoles forma cuantitativa, es decir, haciendo evaluar cada una de las actividades o características necesarias mediante un baremo cifrado que permitirá, en caso necesario, tratar los datos de manera estadística.

Este trabajo puede iniciarse sin tener que partir de cero. En efecto, algunas investigaciones llevadas a cabo, sobre todo en los Estados Unidos, han permitido elaborar cuestionarios exhaustivos que son sistemáticos en la medida en que representan los resultados de análisis factoriales realiza- dos sobre un gran número de actividades y descripciones. El PAQ (Posi- tion Analysis Questionnaire, Cuestionario para el análisis de puestos)* de McCormick es, probablemente, el más conocido y más antiguo entre este tipo de cuestionarios. Contiene 189 descripciones de actividades reagru- padas en cinco categorías, que se obtuvieron de la siguiente forma: con la colaboración de 70 empresas industriales, McCormick logró reunir des- cripciones de 536 puestos diferentes. El trabajo de análisis para cada pues- to fue realizado de forma separada por dos personas diferentes y se calcu- laron las correlaciones entre los resultados obtenidos por ambas. Estas correlaciones son elevadas, ya que van de 74 a 89. Las 536 descripciones se dividieron luego al azar en dos grupos de 268 puestos cada grupo, haciéndose sobre cada uno de ellos, y de manera independiente, sendos análisis. Los resultados de ambos análisis muestran una gran coherencia entre sí, permitiendo reagrupar las informaciones contenidas en las des- cripciones iniciales en cinco categorías:

* N. del T. Existe una adaptación española del PAQ, realizada por el prof. F. Fuentes, de la Facultad de Psicología de la Universidad de la Laguna, Tenerife.

Page 27: Evaluacion Del Personal

� Decisión, comunicación, actividades sociales. � Actividades cualificadas. � Actividades físicas y condiciones laborales relacionadas con ellas. � Utilización de equipos o vehículos. � Tratamiento de la información. El PAQ no se funda solamente en una investigación exhaustiva y bien

dirigida, sino que la presentación material del cuestionario lo hace parti- cularmente preciso. Efectivamente, cada aspecto a calificar está descrito de manera detallada y todos los puntos de la escala de calificación están definidos por un comportamiento que sirve de base de comparación para el calificador.

Otro cuestionario desarrollado más recientemente por Fleishman y Quaintance (1984) no se refiere a las actividades efectuadas en el puesto analizado, sino a la descripción directa de las aptitudes, capacidades cog- nitivas, sensoriales, físicas y psicomotoras que entran en juego. Cada esca- la se divide en siete puntos. La presencia o ausencia del rasgo calificado (en una escala del 1 al 7) es objeto de una definición precisa, definiéndose concretamente tres de los puntos de la escala para guiar al analista. Por ejemplo, para poder valorar el rasgo comprensión verbal, se dan tres ejemplos:

� Comprender completamente un contrato de seguros. � Comprender un artículo de periódico sobre una fiesta local. � Comprender una tira de cómic. Para algunas aptitudes, fue necesario dotar al analista de un «árbol de

decisión». Por ejemplo, si estima que la rapidez de ejecución no es impor- tante para la tarea descrita, se limita a pasar sin más al punto siguiente. En caso contrario, tiene que decir además si también importa la precisión. Según su respuesta, se le van haciendo preguntas diferentes y más concre- tas sobre el ritmo de los movimientos, su rapidez, la coordinación de los miembros, etc.

Cualquiera que sea la modalidad de elaboración de los cuestionarios y listas utilizados para analizar el trabajo, éstos han de ser fiables. La noción de fiabilidad será objeto de una definición precisa en el capítulo 3. Por ahora, decir que el cuestionario ha de ser fiable significa simplemente que no debe estar contaminado por fuentes sistemáticas de error y, por tanto, que debe medir exclusivamente aquello que se quiere medir.

La fabilidad de los cuestionarios se controla procediendo a tres tipos de verificación que corresponden a tres cuestiones.

� El análisis del mismo puesto, hecho dos veces por el mismo analis- ta, ¿permite obtener resultados constantes?

EL ANÁLISIS DEL TRABAJO, UNA ETAPA ESENCIAL 7

Page 28: Evaluacion Del Personal

8 EVALUACIÓN DEL PERSONAL

� El análisis del mismo puesto, hecho por dos analistas diferentes que utilicen el mismo método, ¿facilita resultados constantes?

� El análisis de varios puestos idénticos, hecho por el mismo analista y el mismo método, ¿obtiene resultados constantes?

Las conclusiones de los numerosos estudios realizados sobre estos puntos vienen a coincidir. Si el analista está bien formado y el cuestiona- rio correctamente elaborado, se obtienen en efecto correlaciones elevadas entre las descripciones repetidas a lo largo del tiempo, las llevadas a cabo por analistas diferentes y las realizadas sobre puestos idénticos (Smith y Robertson, 1986).

Desgraciadamente, no siempre se puede disponer de tiempo para ela- borar una lista de control o un cuestionario. Además, se pueden utilizar otros métodos, en especial el de llevar un diario y analizar su contenido, el método de la observación directa y el llamado método de los «incidentes críticos».

El principio del diario personal es muy simple. Basta con que el titular de un puesto anote en una hoja en blanco todo cuanto hace durante su jornada laboral. Evidentemente, este procedimiento no se adapta a las tareas repetitivas, ni a los trabajos manuales, ni en general a las categorías profesionales cuyos titulares no tengan la costumbre de expresarse por escrito. Este método presenta además otros problemas: es difícil controlar el nivel de detalle de las descripciones, así como evitar que exista alguna distorsión introducida por cada persona en función de algo que juzgue importante. Aparte de esto, el análisis de los datos recogidos es delicado y la clasificación de las tareas descritas muchas veces resulta difícil. En este sentido, puede ser útil preparar un gráfico con una lista de actividades dispuestas en columnas y unos segmentos horarios dispuestos en líneas, y pedir a los individuos que punteen a intervalos regulares la actividad que estén ejecutando.

También la observación directa del trabajo parece fácil de realizar, aunque exija tiempo, por cuanto se realiza en tiempo real. Además, per- mite poner de relieve actividades que parecen tan evidentes a la persona que las realiza que se olvida de señalarlas. Sin embargo, la observación directa no siempre resulta fructífera, sobre todo en los casos en que una parte importante del trabajo es mental y, por tanto, difícil de observar, o cuando el ritmo demasiado rápido del trabajo hace imposible la observa- ción. Finalmente, el observador no siempre es lo suficientemente compe- tente como para efectuar una observación exhaustiva. Para paliar esta última dificultad, se pueden elaborar unos gráficos de observación siste- mática en la que se utilice un vocabulario convenido, aunque en ese caso es preciso que los observadores estén preparados para manejarlo. Tam-

Page 29: Evaluacion Del Personal

bien resulta muy útil interesarse por los rastros de la actividad, tales como errores, frecuencia de utilización de las diferentes comandos y funciones (Karnas, 1987).

El análisis del trabajo puede recurrir también al método de los «inci- dentes críticos» de Flanagan (1954). Se trata del método más antiguo de análisis del trabajo, ideado por Flanagan durante la Segunda Guerra Mundial para detectar las causas de los errores de pilotaje durante la formación de pilotos. En lugar de contentarse con las vagas razones esgri- midas por los instructores, Flanagan les pidió que describieran muy con- cretamente y de forma precisa los incidentes críticos que se consideraban como errores, es decir, indicando qué es lo que había originado el inciden- te, qué es lo que había hecho el piloto, cuáles eran las consecuencias, etc. Cuando se utiliza el método de los incidentes críticos para realizar un análisis del trabajo, se recogen gran número de descripciones concretas de comportamiento que desempeñan un papel decisivo en la calidad del trabajo efectuado. La relación de esos incidentes críticos permite, tras analizar su contenido, tener efectivamente en cuenta importantes aspec- tos del trabajo, aunque a veces proporciona una descripción incompleta y difícil de aprovechar.

En resumidas cuentas, no existe ningún método que sea en principio superior a otro. Habrá que elegir en cada caso el método o métodos de análisis del trabajo de una manera realista y acorde con el problema en cuestión. La calidad de los resultados obtenidos depende de la fiabilidad de los métodos y del trabajo de comparación entre análisis, entre analistas y entre puestos idénticos, tal como se ha descrito antes para los cuestiona- rios, quizás con cada uno de los métodos. Evidentemente, la fiabilidad de los métodos será tanto más sólida cuanto mejor formados estén los analis- tas y cuanto más utilicen un vocabulario común cuyo significado haya quedado bien precisado.

UTILIZACIÓN DEL ANÁLISIS DEL TRABAJO

Los resultados del análisis del trabajo se pueden emplear de tres mane- ras diferentes.

La primera consiste en utilizar el cuadro descriptivo de los cometidos laborales para construir directamente técnicas de evaluación originales, constituidas de hecho por muestras de tareas efectuadas en el puesto o función. Esta manera de proceder ofrece una validez aparente y una vali- dez de predicción nada desdeñables. En la segunda parte, describiremos algunas de esas realizaciones, sobre todo las entrevistas en situación, los tests de situación y los centros de evaluación cuya validez media supera

EL ANÁLISIS DEL TRABAJO, UNA ETAPA ESENCIAL 9

Page 30: Evaluacion Del Personal

10 EVALUACIÓN DEL PERSONAL

0,40 y puede llegar hasta 0,55, según comprobaciones recientes (Schmidt y otros, 1984, Smith y Robertson, 1989).

Un artículo de Schmidt y Ostroff (1986) brinda un ejemplo concreto sobre la manera en que puede realizarse un análisis del trabajo para dar origen a un método de evaluación. La primera etapa consiste en utilizar simultáneamente varias técnicas de análisis del trabajo para establecer una lista de tareas, con el concurso de los titulares del puesto o función. Unas sesiones de trabajo en común permiten establecer la lista de conoci- mientos, aptitudes y capacidades necesarias y valorar su importancia. A partir de ese documento, se pueden elaborar unas situaciones-tests que viene a ser ejercicios complejos de índole profesional que cuentan con métodos de evaluación precisos, cuyas cualidades métricas (fiabilidad, va- lidez de contenido con relación a la lista inicial, etc.) son verificadas. Es evidente que este modo de elaboración no exime de realizar una estudio de su validez predictiva.

Un procedimiento más clásico es el de utilizar la descripción obtenida del trabajo para confeccionar una lista de las características necesarias para ocupar el puesto o función analizados. Dicha lista será sometida seguidamente a un paralelismo con los métodos de evaluación existentes y susceptibles de medir esas características. Existen unas clasificaciones de métodos de evaluación que servirán de marco a su presentación en la segunda parte y que facilitan el arduo proceso que va del análisis del trabajo a la elaboración de una serie de pruebas adecuadas. Como es lógico, estas pruebas deberán ser sistemáticamente comprobadas en cuan- to a indicadoras de criterios de éxito profesional.

Otra forma de utilizar el análisis del trabajo, más reciente y de enorme interés, se sitúa' dentro del marco de la teoría de la generalización de la validez, que expondremos más adelante, al mismo tiempo que los demás problemas suscitados por la validez. ¿De qué manera la teoría de la «vali- dez generalizable» conlleva el que se utilice el análisis del trabajo? Hemos de volver un poco la vista atrás para comprenderlo mejor. En 1966, Ghi- selli llevó a cabo una síntesis de los trabajos publicados sobre la capacidad predictiva de los tests de evaluación utilizados en las empresas. Contraria- mente a lo que se hubiera podido sospechar, demostró que los resultados obtenidos con los mismos tests y para las mismas ocupaciones, pero en empresas diferentes, no mantenían una coherencia entre sí. Un test pre- dictivo en una situación no seguía siéndolo en otro contexto. Ghiselli llegó a sí a la conclusión de que la validez predictiva de los tests era «situacional». Por tanto, habría que elaborar un proceso de evaluación específico, para cada puesto o función, y comprobarlo mediante una pos- terior comparación entre predicción/éxito profesional. Todo ello hacía muy arduo el desarrollo racional de un método de evaluación. En efecto,

Page 31: Evaluacion Del Personal

establecer la validez predictiva es una tarea larga y difícil, ya que exige un grupo relativamente numeroso de personas que ejerzan idénticas funcio- nes.

Como mostraremos en el capítulo tercero, las conclusiones pesimistas de Ghiselli carecían en realidad de fundamento. Las investigaciones que él sintetizó eran de muy distinta calidad, y un análisis estadístico más riguroso ha demostrado que la validez predictiva no se limita a una ocu- pación o puesto específico, sino que se extiende a todo un grupo de profe- siones. Tales conclusiones son de capital importancia para el estudio cien- tífico y objetivo de la evaluación de adultos y la gestión de carreras. En efecto, en tal caso, el análisis del trabajo no es ya la primera etapa de un largo proceso de comprobación, sino el instrumento que permitirá encua- drar el puesto o función analizados dentro de un conjunto de ocupaciones más amplio para el que ya se conocen indicadores válidos. Este encuadra- miento dentro de un grupo de ocupaciones, así como la puesta en marcha del «meta-análisis» que permiten definir las categorías entre los métodos de evaluación cuya validez es generalizable a todo un grupo de ocupaciones o puestos, supone, evidentemente, que existen unas clasificaciones racio- nales de puestos y empleos, todo lo cual da un nuevo interés al análisis del trabajo como herramienta para constituir una clasificación de las ocupa- ciones.

CLASIFICACIÓN DE LAS OCUPACIONES

Pearlman (1980) pasó revista en un artículo muy completo a los dife- rentes métodos utilizados para clasificar las ocupaciones y profesiones, describiendo su utilización dentro del marco de los problemas de evalua- ción y de validación de los predictores. La elección de un método de clasificación depende de los objetivos que se persigan y del uso que se desee hacer de la clasificación obtenida. Ahora bien, ese uso puede ser muy heterogéneo: orientación profesional, programa racional de forma- ción, gestión de carrera, sistema de salario, análisis estadísticos de los datos acumulados... por no citar más que algunos ejemplos.

Cualquiera que sea el uso a que se las destine, todas las clasificaciones se fundan en criterios que son las características descriptivas de las tareas y ocupaciones que integran el conjunto a clasificar. Estas características pueden ser muy variadas y referirse, por ejemplo, a los intereses de las personas que ejerzan diferentes ocupaciones, al tipo de producto fabrica- do y también al nivel de responsabilidad, a las aptitudes requeridas, etc.

Todos estos «indicadores», que son otras tantas características escogi- das para servir de base a una taxonomía, han de cumplir tres exigencias:

EL ANÁLISIS DEL TRABAJO, UNA ETAPA ESENCIAL 11

Page 32: Evaluacion Del Personal

12 EVALUACIÓN DEL PERSONAL

1. Deben ser objetivos y definibles de una manera operativa. 2. Deben ser evaluables, al menos de una manera dicotómica (se da

o no se da la característica en cuestión), y ser susceptibles de una evalua- ción más precisa.

3. Es necesario poder formular dicha evaluación de manera que sea posible establecer una comparación entre las opiniones de varios jueces.

Los indicadores utilizados con mayor frecuencia pertenecen a cuatro categorías principales que se refieren a:

� La naturaleza general del puesto. � Los resultados del trabajo realizado. � Las conductas implicadas en el trabajo. � Las aptitudes y cualidades requeridas para ejercerlo. Las clasificaciones difieren también según el método aplicado para

llevarlas a cabo. Fleishman (1975) precisó las reglas que han de respetarse para que una taxonomía resulte aceptable. El sistema elegido debe ser exhaustivo, es decir, debe aplicarse a todos los puestos y ocupaciones y ha de ser exclusivo, es decir, que un puesto o una ocupación sólo puede pertenecer a una familia. Las familias ocupacionales pueden obtenerse de dos maneras diferentes: utilizando una clasificación racional o bien recurrien- do a procedimientos estadísticos o cuantitativos. Dentro de la primera categoría, podemos citar, por ejemplo, la clasificación ocupacional reali- zada por el INSEE en Francia*. Dentro del segundo grupo no existe nin- gún ejemplo francés que se haya publicado. No obstante, investigadores americanos han llevado a cabo clasificaciones de ocupaciones, con base estadística, apoyándose en un análisis factorial de los indicadores descrip- tivos, en un análisis por conglomerados o incluso en un análisis de la varianza. Desgraciadamente, las clasificaciones logradas mediante estos diferentes métodos no coinciden por completo entre sí, por lo que sigue abierto el debate sobre cuál o cuáles podrían ser los métodos más idóneos. En realidad, es posible que no exista un método mejor que los demás, en el sentido de que la calidad del método depende de lo que se pretenda ha- cer.

Dentro del marco de los problemas que aquí nos interesan, habremos de preguntarnos, pues, qué indicadores y qué método convienen más para la puesta en práctica de la «generalización de la validez». Recordemos qué es lo que entendemos por tal: el hecho de que sea posible asociar estudios concretos de validación para obtener muestras más amplias y, no

* N. del. T. En España, el INEM, cuenta con el oportuno sistema de clasificación ocupa- cional.

Page 33: Evaluacion Del Personal

obstante, homogéneas. Estos agolpamientos permitirán después, ante un nuevo problema de evaluación, precisar si los estudios de validación ante- rior se aplican o no al puesto o función analizados, permitiendo por tanto determinar la posibilidad de generalizar los resultados de un estudio de validez a otros puestos y a otras organizaciones. Dicho con otras palabras, y volviendo a la fórmula de Pearlman, se trata de crear familias de puestos y funciones de tal índole que «la validez específica de los métodos de evaluación sea generalizable dentro de la familia, pero no entre familias diversas».

Las investigaciones enumeradas por Pearlman y más recientemente por Algera (1987) demuestran que la validez de las técnicas de evaluación es generalizable dentro de las familias de puestos y funciones que se cons- tituyen a partir de análisis del trabajo, ya se basen estos en el contenido de las tareas o en las características individuales requeridas, o incluso en la naturaleza general del trabajo. ¿Es superior alguno de estos tres indicado- res a los demás? Pearlman (1980), lo mismo que Schmidt y otros (1981), defienden la postura de que todo análisis del trabajo realizado a escala «molecular» permite constituir familias que resultan diferentes de las que se obtienen con análisis más globales. Tal enfoque agrupa puestos que parecen diferentes cuando sólo se centra el interés en la naturaleza global de las tareas, descrita de manera muy sumaria, puestos que en realidad están muy próximos cuando se toman en consideración los procesos puestos en práctica por el trabajador o, mejor aún, las características re- queridas para ejecutar la tarea.

Para apuntalar su tesis, Schmidt y otros (1980) efectuaron una síntesis de numerosos estudios de validación que afectaban a un total de 368.000 personas activas en el conjunto del sector de trabajos administrativos y demostraron que las técnicas válidas para predecir el éxito profesional son las mismas para todo el sector, a pesar de la variedad de tareas efectuadas. Más aún, Hunter (1987) defiende ahora un modelo más ambicioso, según el cual la medida de las aptitudes cognitivas, o, dicho en otras palabras, del funcionamiento intelectual, permitiría predecir eficazmente el éxito profesional en la mayor parte de las ocupaciones y profesiones, y ello por dos razones distintas, que se solapan: porque esas aptitudes son necesarias para cualquier aprendizaje y para cualquier adquisición de nuevas consig- nas de trabajo y también porque guardan una correlación con el rendi- miento, una vez controlado el papel de los conocimientos adquiridos.

En cambio, Algera (1987) y Kemery (1982) ponen en tela de juicio la capacidad del meta-análisis para detectar las variaciones situacionales de la validez, así como lo acertado de las clasificaciones por familias basadas en criterios excesivamente amplios. Es posible que la verdad se encuentre a medio camino entre ambas posturas. En efecto, resulta muy probable

EL ANÁLISIS DEL TRABAJO, UNA ETAPA ESENCIAL 13

Page 34: Evaluacion Del Personal

14 EVALUACIÓN DEL PERSONAL

que existan grupos de ocupaciones (los ejecutivos, por ejemplo) para los que la validez predictiva de las aptitudes cognitivas es relativamente débil, por un lado porque las pruebas cognitivas diferencian poco a los indivi- duos entre sí a partir de un cierto nivel jerárquico y, por otro lado, porque hay otras características que determinan de manera relativamente más marcada el éxito profesional cuando se trata de puestos con un alto grado de responsabilidad.

Aun cuando este doble debate sobre los métodos para reunir criterios de validez y sobre la manera de formar familias de puestos y funciones, dentro de las cuales sean válidas las mismas técnicas, no haya llegado todavía a conclusiones indiscutibles, es evidente que no se puede pasar por alto y que habría que hacer nuevos esfuerzos, sobre todo en Francia y en los países francófonos, para reunir, por una parte, los datos suscepti- bles de ser homologados, y, para establecer, por otra parte, familias de puestos y funciones fundadas en criterios claros y pertinentes. Este enfo- que del problema de la validación de técnicas de evaluación como indica- dor de las conductas profesionales cobra especial relieve por cuanto cada día aparecen nuevas ocupaciones y ninguna carrera se limita al ejercicio de una sola e idéntica función durante toda la vida. Para acertar en las reorientaciones que ello implica, hay que saber con precisión en qué me- dida el éxito de una primera experiencia profesional permite prejuzgar el éxito en algún otro puesto y, por tanto, conocer las aptitudes y caracterís- ticas individuales que se precisan para triunfar en grupos homogéneos de actividad.

EL ANÁLISIS DEL TRABAJO HA DE APORTAR INFORMACIÓN SOBRE:

1. Identificación del puesto. 2. Su objetivo. 3. Responsabilidades del titular o titulares. 4. Sus relaciones con las restantes personas. 5. Condiciones físicas del trabajo. 6. Condiciones salariales y profesionales.

No hay duda de que el análisis del trabajo representa el fundamento de cualquier método de evaluación predictiva. Es una suerte que los re- cientes estudios que acabamos de mencionar llamen de nuevo la atención sobre esta etapa capital de la evaluación y sobre la necesidad de proseguir investigaciones que permitan desarrollar métodos y precisar modelos destinados a mejorar el proceso que va del análisis del trabajo a la enu- meración de características requeridas y a su posterior medición den- tro del marco de las decisiones que afectan al personal. Siguiendo a

Page 35: Evaluacion Del Personal

Algera (1987), podríamos definir los temas en torno a los cuales deberían ordenarse las futuras investigaciones, así como su aplicación sobre el te- rreno.

1. El debate sobre validez específica o validez generalizable no está zanjado. Posiblemente, la validez de los métodos de evaluación no sea tan específica como se ha creído durante mucho tiempo, sino que aún estén por determinar las condiciones de su posible generalización. Para llegar más lejos en este problema crucial, tal vez habría que volver, con los medios informáticos de que ahora disponemos, a un análisis más preciso del panel de los factores situacionales y de su peso en la varianza de las correlaciones entre predictores y comportamiento profesional. Sobre todo, sería deseable que esos factores situacionales no se traten sólo nega- tivamente, como «varianza residual» anónima, sino que se identifiquen y evalúen de manera que quede bien perfilado su papel como modulador de la relación entre contenido del trabajo y características individuales.

2. Los esquemas de descripción y análisis de tareas se refieren casi por completo al comportamiento aparente, el que se ve, y descuidan la investigación �difícil, sin duda� que permitiría describir la naturaleza de los procesos mentales que entren en juego. Estos son cada vez más importantes, a medida que el progreso tecnológico hace que las tareas sean progresivamente más complejas e impliquen más el tratamiento de información y menos la ejecución de simples tareas mecánicas.

3. No se debe subestimar el hecho de que, en el proceso de desarrollo de los métodos de evaluación, el análisis del trabajo es la etapa en que la colaboración entre los psicólogos y el personal de la empresa es más estre- cha y, sobre todo, interactiva. Mediante las cuestiones que suscita, el psicólogo da a los cuadros directivos y a los trabajadores ocasión de expli- citar qué es lo que esperan unos de otros. Por ello, la confrontación entre las diferentes descripciones del trabajo ofrecidas por unos y por otros, así como el análisis estadístico de los juicios que emiten sobre la importancia y frecuencia de las diferentes conductas profesionales, representan mucho más que un mero estudio de fiabilidad. En efecto, es el medio para poner de relieve no sólo los puntos de acuerdo, sino también los puntos sobre los que existe un claro desacuerdo o un amplio abanico de opiniones diversas. Es evidente que no se pueden desarrollar métodos de evaluación con una validez de predicción elevada si no se ha llegado a un acuerdo preciso sobre lo que se trata de predecir. De ahí la importancia del proble- ma al que dedicaremos el próximo capítulo, el de los criterios que se adoptarán para representar el éxito profesional y que se confrontarán con los predictores en el proceso de validación.

EL ANÁLISIS DEL TRABAJO, UNA ETAPA ESENCIAL 15

Page 36: Evaluacion Del Personal

16 EVALUACIÓN DEL PERSONAL

EN RESUMEN:

Ventajas e inconvenientes de los diferentes métodos de análisis del trabajo

Métodos de análisis del trabajo

Entrevista individual

Entrevista de grupo

Cuestionario

Lista de control

Diario personal

Observación directa

Incidentes críticos

Ventajas

Fácil de organizar

Rica en informaciones

Se pueden utilizar cues- tionarios ya existentes Fácil manejo

Método familiar para to- dos Fácil en apariencia

Se centra en las causas del éxito

Inconvenientes

Información difícil de analizar sistemáticamente

Hay fenómenos de grupo que interfieren con la reco- gida de datos

Exige una formación

Las respuestas si/no simplifi- can la realidad Resulta pesado

Se omite lo que no es obser- vable Suele ser incompleto

Page 37: Evaluacion Del Personal

2

Calificando al personal:

¿cómo definir de manera concreta el éxito profesional?

LOS PROBLEMAS

El análisis del trabajo sirve para describir la naturaleza de las tareas confiadas al personal de las empresas y para precisar las características individuales que se requieren para que un determinado individuo se adapte a un puesto de trabajo y saque adelante las funciones que la orga- nización le confíe.

Es la primera etapa de la puesta en marcha de un programa de evalua- ción, cuando éste comporta la elección de métodos adecuados para adop- tar decisiones relativas a la gestión del potencial humano. Después segui- rán otras etapas. En efecto, la validez de los métodos de evaluación se basa en una comparación entre el diagnóstico que ha servido de base a la toma de cualquier tipo de decisión (selección, promoción, reorientación, formación...) y la realidad ulterior, es decir, el hecho de que se demuestre (o no) posteriormente que tal decisión estaba justificada. Esta ardua tarea de seguimiento de las decisiones y de apreciación de los métodos de eva- luación, a través de la calidad del pronóstico a que dieron lugar, no puede llevarse a cabo para cada una de las numerosas operaciones de gestión del personal. Veremos más adelante que es posible prescindir de esa tarea de seguimiento aprovechando algunas investigaciones anteriores. Pero es ne- cesario realizarla cuando se tiene intención de utilizar un método o un conjunto de métodos nuevos, o cuando el progreso tecnológico, o incluso la reorganización de las actividades de la empresa, suponen la creación de puestos de trabajo completamente nuevos.

La comprobación de un método destinado a evaluar las características

17

Page 38: Evaluacion Del Personal

18 EVALUACIÓN DEL PERSONAL

individuales no es, en definitiva, más que una comparación entre dos apreciaciones: el pronóstico sobre el que se fundó la decisión, por un lado, y el éxito ulterior en el puesto o función, por el otro. Supone, pues la capacidad de describir con precisión, y si es posible medir, el éxito profe- sional.

El principio parece sencillo. En realidad, suscita problemas de medi- ción muy delicados. En efecto, los criterios de éxito profesional desempe- ñan un papel crucial en este proceso. Es preciso que posean las cualidades de fiabilidad, de realismo y de discriminación que se pide a las técnicas de predicción: sería absurdo negar un marchamo de calidad a una técnica de evaluación so pretexto de que predice mal unos indicadores de éxito pro- fesional que, de por sí, no son fiables, realistas, ni discriminatorios. Así pues, la confianza que se pueda depositar en los estudios de validez pre- dictiva depende de la calidad de los criterios. Además, los indicadores de éxito profesional, aun cuando vengan siendo empleados por la empresa desde hace tiempo, no hay que aceptarlos sin previo examen. La jerarquía comparte muchas veces estereotipos sobre el éxito profesional frente a los cuales conviene adoptar una actitud crítica. Un análisis sistemático de los criterios y de su significación, así como el estudio de validación, permite muchas veces hacer avanzar y actualizar la definición de lo que la empre- sa espera de sus asalariados. En efecto, el hecho de establecer una correla- ción entre las evaluaciones que se refieren a características individuales específicas y los comportamientos profesionales precisos permite profun- dizar en la significación de las informaciones aportadas por los métodos de evaluación, así como precisar los aspectos de las conductas profesiona- les tenidas en cuenta en las calificaciones.

Dicho en otras palabras, llevar a buen término un procedimiento de validación obliga a reconsiderar los procedimientos de calificación profe- sional de que hace uso la organización. Ese esfuerzo de clarificación siem- pre resulta rentable, ya que las calificaciones profesionales representan un importante aspecto de la gestión del personal por otras razones ajenas al estudio de la validez.

En primer lugar, la definición de los objetivos de la organización ha de traducirse, a nivel individual, en una definición de objetivos personales que concreten lo que la organización espera de cada cual. Ello implica la traducción de los objetivos globales en programas individuales que den una definición concreta y fechada de qué es lo que constituye el éxito profesional de cada uno. Operaciones que, por lo demás, no son ni mu- cho menos inútiles. En efecto, cuando se pasa de los objetivos globales, definidos a escala de servicio o departamento, a objetivos individuales, es necesario cambiar de registro y precisar las conductas y actividades que deberá llevar a cabo el individuo para cumplir con su cuota dentro de los

Page 39: Evaluacion Del Personal

CALIFICANDO AL PERSONAL 19

objetivos colectivos. Buena ocasión esa para comprobar qué caminos di- ferentes pueden desembocar en idénticos resultados y que, aunque el acuerdo tenga lugar en el seno de la jerarquía en lo que respecta a los objetivos colectivos, no siempre se consigue ese acuerdo a escala de la índole exacta de los comportamientos y actividades exigidos o esperados. Por ello, cualquier tentativa para definir en concreto unos indicadores de éxito profesional permite sacar a la luz divergencias de opinión sobre los comportamientos que conducen al éxito, así como tratar de solucionar dichas contradicciones.

En segundo lugar, la definición de las necesidades en cuanto a forma- ción, así como la elaboración de planes individuales de formación, son en gran medida tributarias de la capacidad de dar un contenido concreto al éxito profesional. El análisis de tareas pone de relieve lo que los anglosajo- nes simbolizan mediante las siglas KSAPS: Knowledge, Skills and Aptitu- des (Conocimientos, capacidades y aptitudes requeridas). Confrontando estos datos con las calificaciones profesionales, es posible detectar las la- gunas a cubrir y establecer programas de formación que se adapten a las posibilidades individuales y también a las necesidades organizativas.

Así pues, las calificaciones profesionales representan un instrumento de gestión importante. Y la elección de un indicador de éxito profesional, así como la construcción de un método de calificación, no sólo plantean problemas técnicos, sino también algunos problemas teóricos fundamen- tales.

El primero de ellos afecta a la multidimensionalidad o globalidad del criterio del éxito profesional. A este respecto, las opiniones han experi- mentado alguna variación. En los años cincuenta, el empleo de un indica- dor global y único del éxito profesional parecía ser la condición sirte qua non del desarrollo de métodos eficaces de evaluación. Diez años más tarde, los especialistas, enfrentados a la complejidad de la noción de éxito profesional y a la variedad de sus componentes, cambiaron de parecer y pusieron en marcha indicadores múltiples.

De hecho, cualquier análisis detallado del éxito y de las conductas profesionales muestra que muchas veces se puede obtener el mismo nivel de éxito mediante estrategias diferentes, entre las que sería difícil señalar cuál es la mejor. Además, cuando se procede al análisis factorial de los datos resultantes de la utilización de una escala de calificación profesional de criterios múltiples, no se suele obtener un factor único, ya que la mayor parte de las tareas son complejas y sus finalidades son diversas. En tales condiciones, buscar a toda costa un criterio único de éxito profesio- nal lleva a simplificar exageradamente la predicción del éxito, así como la comprobación de los métodos de evaluación. Un ejemplo clásico de esta dificultad lo hallamos en un estudio de Seashore (1963) sobre los repartí-

Page 40: Evaluacion Del Personal

20 EVALUACIÓN DEL PERSONAL

dores de una cadena de grandes almacenes. Este investigador reunió las calificaciones profesionales de 975 repartidores y cinco aspectos diferentes de su trabajo: productividad, eficacia, número de accidentes, absentismo y errores cometidos en el trabajo. Los resultados muestran que esos cinco criterios son independientes unos de otros, ya que la máxima correlación obtenida (entre el número de errores y la eficacia) sólo alcanza 0,32. Es evidente que el puesto de trabajo en cuestión no se presta a una califica- ción profesional única, sino que incluye aspectos distintos, medidos por indicadores diferentes.

Sin embargo, hay casos en los que es necesario recurrir a un criterio único, bien sea obtenido directamente como tal, o bien como resultado de la combinación de criterios heterogéneos. Este tipo de criterio global re- sulta indispensable cuando la evaluación profesional tenga que servir de base para una decisión o elección entre diversas eventualidades. En reali- dad, las mismas informaciones pueden utilizarse paralelamente, ya sea de forma conjunta para las necesidades de la gestión, ya sea de forma múlti- ple con miras a establecer diagnósticos o a llevar a cabo actividades de in- vestigación.

Cuando se combinan calificaciones profesionales independientes para elaborar un criterio único, puede resultar útil ponderar las diferentes cali- ficaciones, teniendo en cuenta la importancia de cada una con respecto a los imperativos de la organización. Volviendo al ejemplo antes citado de Seashore, es posible que la puntualidad en las entregas sea un elemento esencial de la política comercial de la organización. En tal caso, ese indi- cador debería recibir un peso mayor que los otros en la elaboración de un criterio compuesto. Además, la utilización de un criterio compuesto acaso se complique por la existencia de factores de éxito profesional que ofrez- can especial importancia, hasta el punto de no poder ser compensados por otras cualidades. Tal podría ser el caso, por ejemplo, de la compren- sión verbal, que, para ciertas tareas, no podrá verse compensada, si su nivel es muy bajo, por otras cualidades, como por ejemplo la sociabilidad o la habilidad manual. El empleo de indicadores, y sobre todo el método de los umbrales múltiples que expondremos más adelante como algorit- mo de toma de decisión, permite tener en cuenta estos imperativos.

Otro problema teórico importante se refiere a la naturaleza dinámica del triunfo profesional. El comportamiento o rendimiento de los indivi- duos varía en función de su antigüedad en el puesto; así, se califica de forma diferente a un empleado recién ascendido que a un veterano. Tam- bién los objetivos y prioridades de las organizaciones varían en función de sus políticas comerciales, de los imperativos legales o de las nuevas tecno- logías. En tal caso, la misma ficha de calificación adoptará un significado diferente, ya que se refiere implícitamente a objetivos diferentes. Hay un

Page 41: Evaluacion Del Personal

CALIFICANDO AL PERSONAL... 21

tercer factor de variación cuya importancia no hay que subestimar, aun cuando resulte menos evidente. La estabilidad de los indicadores en el tiempo puede ser relativamente débil, incluso cuando se trata de datos objetivos sobre la producción. Esto resulta especialmente cierto en las primeras semanas de actividad en un nuevo puesto, ya que la producción reflejará el nivel de adaptación del sujeto, mientras que su productividad algún tiempo más tarde estará determinada por otras variables individua- les. En fin, las relaciones entre los diferentes aspectos de un criterio com- puesto pueden cambiar significativamente en el tiempo, sobre todo a me- dida que se vaya desarrollando el aprendizaje de la nueva tarea.

Un último problema, no menos importante: la contaminación del criterio, es decir, el hecho de que la variación interindividual de las califi- caciones profesionales refleje en realidad las diferencias en las condiciones de trabajo, más que las diferencias entre los propios individuos. La pro- ducción, por ejemplo, puede verse influida por la calidad del equipamien- to que se ponga a disposición del obrero, por la calidad del entorno del trabajo, y también por la información recibida y por las modalidades de remuneración que se le apliquen. Es evidente que no hay que comparar criterios de éxito profesional aparentemente idénticos sin tener en cuenta estas fuentes de contaminación.

Podríamos resumir estas observaciones afirmando que se debe distin- guir (Schneider y Schmidt, 1986) el criterio perfecto �teórico� del éxito profesional del criterio real. Ambos tienen, por fortuna, una parte común, que funda la pertinencia del criterio real. No obstante, ningún criterio, por bueno que sea, se corresponde con el criterio perfecto, y siempre hay algún aspecto del éxito profesional que se pasa por alto. De manera simé- trica, todo criterio real se ve contaminado por variables ajenas al éxito profesional individual. El diagrama de la página siguiente ilustra de ma- nera simbólica lo que acabamos de afirmar.

MÉTODOS*

¿Qué métodos permiten obtener información sobre el rendimiento y sobre el grado de éxito o de fracaso profesional? Se distinguen tradicional- mente dos categorías, según se trate de indicadores objetivos o subjetivos. Contrariamente a lo que cabría pensar, los indicadores subjetivos �bási- camente las fichas de calificación� son, con mucho, los más utilizados.

* N. del T. Puede encontrarse una revisión actualizada de estos métodos en la Tesis Doctoral de J. M. Gil Vega, «La evaluación del rendimiento laboral en puestos de trabajo informativos, Madrid, Universidad Autónoma, 1990.

Page 42: Evaluacion Del Personal

22 EVALUACIÓN DEL PERSONAL

Sin embargo, la medición directa del comportamiento en el trabajo debe- ría ser, a simple vista, el indicador de éxito profesional más pertinente y menos discutido. Y este tipo de índices debería ser el más fácil de cuantifi- car y adaptar a las diversas actividades profesionales. Así, se puede enu- merar la cantidad de facturas hechas durante la semana, el número de piezas producidas, el número de contratos firmados, el volumen de ven- tas... También es posible captar la realidad del rendimiento a través de los errores cometidos: errores de inspección al final de una cadena, errores de situación por parte de los controladores que vigilan desde lo alto, errores de lectura de radiografías, tasas de piezas defectuosas, etc.

Desgraciadamente, estos indicadores de rendimiento son más difíciles de obtener de lo que parece y la información que aportan sobre la calidad del trabajo es menos fiable de lo que cabría pensar. Ante todo, porque la producción y el comportamiento profesional dependen de factores inde- pendientes de los esfuerzos y características individuales. Las tareas indus- triales se basan cada vez más en trabajos de mantenimiento o de vigilan- cia de máquinas automatizadas, y el obrero o el técnico no ejercen excesiva influencia sobre la producción. Además, cuando resulta posible obtener cifras de producción en cantidad o en calidad, hay que verificar cuidadosamente su fiabilidad, es decir, su coherencia en un período de tiempo bastante prolongado, sin lo cual se corre el riesgo de fundar la

Page 43: Evaluacion Del Personal

CALIFICANDO AL PERSONAL:... 23

evaluación de los individuos en muestras de producción no representati- vas del conjunto de su comportamiento en el trabajo.

Por último, y de forma muy especial, hay muchos oficios, tareas y funciones que no se prestan en absoluto a la cuantificación de la produc- ción, tal es el caso, sobre todo, de la mayor parte de las profesiones libera- les, de los cargos ejecutivos, de los oficios relacionados con el servicio o la investigación... Claro que con un poco de imaginación se pueden hallar índices de producción tales como el número de publicaciones, de patentes o de invitaciones a coloquios para los investigadores, el cociente de avan- ce para los ejecutivos (relación entre la edad media de los ejecutivos de igual nivel y la edad cronológica del ejecutivo evaluado), el porcentaje de cuota alcanzado en las profesiones relacionadas con la venta, o incluso los comportamientos observados (número de visitas, número de gestiones o de llamadas telefónicas por día). No obstante, en todos estos casos, el indicador sólo dará una visión parcial del conjunto de las actividades profesionales. Sobre todo, resulta muy difícil evaluar estos datos con rela- ción a unas normas de rendimiento, de manera que se puedan distinguir los «buenos» de los «medianos» y de los «mediocres». Máxime por cuan- to cualquier norma de este tipo debería fijarse teniendo en cuenta factores externos que determinen la producción (competencia, ritmo de trabajo, etc.), lo que hace que los indicadores de éxito profesional sean difícilmen- te comparables entre sí.

Una segunda categoría de indicadores objetivos puede extraerse de los comportamientos individuales, como las ausencias, la puntualidad, la inestabilidad profesional («turnover») o incluso la promoción profesional y la evolución de los salarios. Una vez más, cada uno de estos índices constituye un problema específico que dificulta su utilización.

El absentismo es un indicador importante para la organización debido a los costes y disfunciones que lleva consigo. Las investigaciones muestran que es un fenómeno complejo, no ligado a las aptitudes y competencias, sino provocado o reforzado en parte por una insatisfacción en el trabajo. Hay otros parámetros que se combinan con un bajo grado de satisfacción para determinar el absentismo: condiciones de vida (responsabilidades familiares y duración del transporte), nivel de implicación en el trabajo y presión ejercida, eventualmente, por las normas del grupo al que pertene- ce el trabajador. Existen diferentes índices, lo que complica aún más el empleo del absentismo como criterio: el número total de ausencias, el número total de días de ausencia y el número total de ausencias justifica- das por razones médicas. También se pueden tener en cuenta las ausen- cias muy cortas (un día o media jornada), que serían reflejo, en mayor medida que las demás ausencias, de una baja satisfacción y poco interés por el trabajo. Este último indicador sería asimismo el más fiel, es decir, el

Page 44: Evaluacion Del Personal

24 EVALUACIÓN DEL PERSONAL

más constante en el tiempo. Pero hay que subrayar que, si se quiere utilizar el absentismo como criterio de adaptación profesional, la fiabili- dad de los índices de absentismo que, como veremos más adelante, influ- ye directamente en el cálculo de la validez, es siempre bastante débil. Por ello, sólo deberán tomarse en consideración los índices de absentismo laboral correspondientes a un período de tiempo bastante prolongado.

La inestabilidad profesional o turnover puede representar también un coste importante para la organización, debido a los gastos de selección y formación del personal que entraña una rotación demasiado rápida del mismo. Se trata de un indicador que refleja la índole de las condiciones del trabajo y también la existencia de aptitudes individuales precisas. Por otro lado, si se quiere considerar este problema desde el punto de vista de la organización, la marcha de personal puede ser algo deseable cuando se trata de personas poco competentes y de bajo rendimiento, y puede ser muy lamentable cuando se trata de empleados de alto rendimiento. El problema de la empresa debe plantearse entonces de manera diferente. No se trata tanto de predecir la inestabilidad de los individuos en su empleo, cuanto de crear unas condiciones de trabajo y de carrera tales que el personal más competente y eficaz no sienta la tentación de marcharse. En este sentido, un índice global de «turnover» no siempre tiene el mismo significado.

El ritmo de avance profesional representa otro indicador del éxito, aunque también hay que utilizarlo con precaución, ante todo porque las organizaciones tienen políticas diferentes de selección y promoción, in- cluso cuando forman parte de un mismo convenio colectivo. Además, porque en una misma organización las condiciones económicas y el pro- greso tecnológico pueden acelerar o ralentizar considerablemente el desa- rrollo de la empresa o de alguno de sus sectores, y con ello el ritmo de los avances individuales. Es muy frecuente que la rapidez en el des- arrollo de una carrera dependa más del año de incorporación, es decir, del auge económico y del progreso técnico del que se ha beneficiado el sector en cuestión, que de las características del individuo.

Por lo general, todos los indicadores «objetivos» del éxito profesional han de utilizarse con cierta precaución. Antes de elaborar con ellos unos criterios que sirvan de referencia para comprobar las técnicas de evalua- ción utilizadas para establecer pronósticos, y antes de utilizarlos en el marco de la gestión del personal, hay que examinar sus relaciones exactas con los diferentes aspectos de la tarea o función aislados por el análisis del trabajo. También hay que asegurarse de que no estén contaminados por parámetros de la organización independientes de las características indivi- duales que se quieren medir y verificar que su fidelidad sea satisfactoria.

Dado que estas dos exigencias �pertinencia, fidelidad� rara vez son

Page 45: Evaluacion Del Personal

CALIFICANDO AL PERSONAL 25

satisfechas por los indicadores «objetivos» de los resultados del trabajo, son los indicadores subjetivos los que ofrecen en la realidad cotidiana los métodos más utilizados para describir y medir el éxito individual y la calidad de la contribución de cada uno a los objetivos de la organización �y ello cualquiera sea el uso que se pretenda hacer de esas calificaciones: cálculo de primas sobre el salario, plan de movimientos de personal, asig- nación de puestos en régimen de formación, o incluso comprobación de técnicas predictivas.

Existen varios métodos diferentes para llevar a cabo estas evaluaciones subjetivas. El más simple, y de hecho muy poco utilizado en la actualidad, consiste en clasificar entre sí a las personas que se van a calificar. Habría tres posibilidades: que cada directivo clasifique a cuantos empleados ten- ga bajo sus órdenes; que la clasificación se base en una comparación sistemática por parejas de todo el personal afectado; o bien que la clasifi- cación se realice mediante un reparto obligado en cinco grupos.

La clasificación simple puede hacerse con un criterio global o repetirse con dimensiones independientes entre sí y que permitan describir el com- portamiento profesional. En todos los casos, se trata de un método que sólo se puede concebir para un número reducido de personas. Una mane- ra de ayudar al calificador consiste en hacerle elegir previamente al mejor y al peor de sus subordinados; luego el calificador vuelve a la lista con el resto de los nombres y elige de nuevo al peor y al mejor, y así sucesiva- mente hasta que todo el mundo quede clasificado. En el método de com- paración por parejas, se constituyen todas las parejas posibles con el fin de comparar a los individuos, designando en cada caso al mejor en cuanto al rasgo que se trata de calificar. Se calcula luego para cada individuo el porcentaje de comparaciones en las que ha sido juzgado el mejor. Ni qué decir tiene que este procedimiento sólo se adecúa a los grupos pequeños: el número de comparaciones (n (n-l)/2) crece rápidamente con n, el nú- mero de individuos que se clasifican. Señalemos que existen unas tablas para transformar los porcentajes en notas estándar, lo que permite efec- tuar comparaciones entre servicios diversos. Finalmente, la clasificación puede hacerse mediante un reparto forzado en grupos cuyo número de componentes se haya fijado a priori. En general, se pide al calificador que distribuya a sus subordinados en cinco grupos; los mejores y los peores abarcarían el 10 % del total, un grupo medio tendría el 40 % del total y dos grupos intermedios supondrían el 20 % cada uno.

Las investigaciones realizadas sobre estos métodos han mostrado que son muy fieles y útiles cuando sólo se busca una clasificación global del personal. Está claro que no se les puede pedir más de lo que pueden dar, es decir, una clasificación global y no específica.

Si se desean descripciones más precisas de los comportamientos profe-

Page 46: Evaluacion Del Personal

26 EVALUACIÓN DEL PERSONAL

sionales, es obligado recurrir a las escalas de calificación. Cualesquiera que sean la forma y el principio elegidos, el procedimiento mismo de hacer que unos individuos evalúen a otros presenta fuentes de error difíci- les de eliminar: la indulgencia, el efecto halo y el efecto de tendencia cen- tral.

La importancia que cabe conceder a cada calificación depende de la indulgencia del calificador que la ha otorgado. Por ejemplo, es posible que un calificador exigente no utilice jamás el calificativo de «excelente» o la nota máxima, mientras que otro, mucho más tolerante, no empleará prácticamente la parte baja de la escala, es decir, las notas bajas o los apelativos descalificadores. Por ello, aún cuando exista correlación entre ambas, las escalas de notas asignadas a los mismos empleados por esas dos personas no coincidirán ni se podrán considerar equivalentes. Para tratar de remediar esos desfases, se puede hacer que las calificaciones se esta- blezcan fijando de antemano el porcentaje de personas calificadas que ha de entrar obligadamente en cada sector de la escala de calificación. Este procedimiento no evita que cada nota posea una significación diferente para cada uno de los calificadores concedidos. De ahí la utilidad de tratar de mejorar la definición de cada uno de los niveles, haciendo que sean lo más concretos posible.

El efecto halo se refiere a la dificultad con que tropiezan los calificado- res de juzgar de manera analítica e independiente los diferentes puntos de la ficha de calificación. En efecto, suele ocurrir que el calificador se forme una imagen global de la persona a la que tiene que evaluar, imagen que puede ser favorable o desfavorable. Esa impresión general puede tener suficiente fuerza como para influir en el mismo sentido todas las notas que vaya incluyendo en los diferentes apartados de la ficha de califica- ción. Hay varias formas de contrarrestar este efecto halo. La más eficaz consiste en formar a los encargados de calificar para el trabajo que van a realizar, poniéndoles en guardia contra la importancia de la primera im- presión, haciéndoles ver la existencia del halo y animándoles a realizar ejercicios de calificación destinados a aprender a calificar, de manera in- dependiente y sobre la base de observaciones específicas, los diferentes aspectos del comportamiento y del rendimiento sobre los que han de pronunciarse. También se puede atenuar el efecto halo mediante la utili- zación de procedimientos de calificación que obliguen a los jueces a eva- luar a todos los individuos bajo un aspecto, antes de pasar al siguiente, en vez de calificar a cada individuo bajo todos los aspectos a la vez. La definición precisa de los puntos que se van a calificar, el hecho de que se refieran a aspectos concretos y diferentes de las tareas laborales también contribuye a disipar el halo.

El error de la tendencia central se debe a las dificultades con que

Page 47: Evaluacion Del Personal

tropiezan los calificadores para efectuar correctamente el trabajo que se espera de ellos. Al no saber bien cómo calificar, ya sea porque no han aprendido a hacerlo, porque no tienen suficiente información útil, em- plean preferentemente los escalones medios, lo que reduce evidentemente la dispersión de las calificaciones. Una de las maneras de luchar contra tal defecto consiste en utilizar, como ficha de calificación, listas con descrip- ciones de comportamientos (check-list), con lo cual basta con puntear las descripciones pertinentes y pasar por alto las demás. Todas las descripcio- nes, procedentes del análisis del trabajo, habrán sido previamente evalua- das por jueces competentes, desde el punto de vista de su contribución al éxito profesional y a los objetivos de la organización. Esto permite atri- buir a cada descripción un valor cifrado, que el calificador desconoce, y calcular una o varias notas a partir de las descripciones punteadas. Se puede incluso mejorar este sistema, proponiendo a los encargados de cali- ficar, no una lista a puntear libremente, sino unas opciones obligadas, es decir, grupos de tres o cuatro descripciones entre las que habrá que elegir una sola. Las investigaciones realizadas a este respecto demuestran que la mejor presentación consiste en agrupar las descripciones en tandas de cuatro, pidiendo a los encargados de la calificación que elijan dos, hacien- do que sean los expertos los que juzguen el valor de cada descripción en función de su importancia para el éxito dentro del puesto en cuestión. Proponemos un ejemplo de calificación procedente de una lista de des- cripciones de empleados de banca en contacto con el público.

Elija dos de las cuatro descripciones siguientes: a) Conversa con los clientes sobre cuestiones que no tienen que ver con

el trabajo. b) No quita nunca la palabra al cliente. c) Deja cualquier otro trabajo cuando hay un cliente esperando en su venta-

nilla. d) Verifica los documentos (cheque, transferencia) que le entrega el cliente.

Por atractivo que parezca, este método no deja de tener sus inconve- nientes. Ante todo, tal vez sea muy difícil hallar descripciones que se sitúen al mismo nivel valorativo para el encargado de calificar, incluso discriminando a los buenos de los malos empleados. Aparte de eso, los ejecutivos encargados de calificar no quieren hacerlo a ciegas, sin saber qué significado se dará a lo que ellos digan de sus subordinados. Habría que añadir, desde otro punto de vista, que esas calificaciones no pueden utilizarse para mantener una ulterior entrevista con los empleados sin divulgar el valor y el peso dado a cada descripción, lo que invalidaría la lista para una segunda ocasión. Además, no hay que menospreciar el

CALIFICANDO AL PERSONAL 27

Page 48: Evaluacion Del Personal

28 EVALUACIÓN DEL PERSONAL

cúmulo de trabajo necesario para determinar el valor de las diferentes descripciones y su capacidad para discriminar a los buenos elementos de los malos.

En definitiva, las fichas de calificación representan el método más frecuente para calificar al personal en empresas y administraciones. Su elaboración, así como el análisis de los datos que permiten captar, no siempre se hacen, por desgracia, con el cuidado necesario. Existen, sin embargo, diversas maneras de proceder, cuyas cualidades varían y que han sido objeto de interesantes estudios. La escala de calificación más simple se denomina «escala gráfica», porque presenta una lista de rasgos a calificar que se traducen en una recta segmentada en fragmentos iguales. A partir de este principio básico, existen numerosas variantes en función de cómo se definan cada epígrafe y cada punto de la escala. Las definicio- nes pueden ser breves, como en el siguiente ejemplo referido a las relacio- nes de un empleado de banca con la clientela:

La definición de la característica valorada puede ser mucho más preci- sa, como en el ejemplo siguiente.

Relaciones con los clientes (disponibilidad y ecuanimidad ante la clientela; cortesía y paciencia; capacidad para personalizar los servicios prestados).

La definición de cada uno de los puntos de la escala puede ser mucho más detallada y ello en forma tan variada como muestran los siguientes ejemplos:

Relaciones con los clientes

Page 49: Evaluacion Del Personal

Blanz y Ghiselli (1972) propusieron un método más perfeccionado, que implica un análisis mucho más profundo de las descripciones de comportamiento y que se realiza en las siguientes etapas:

1. Las descripciones de comportamiento se establecen tras un análi- sis del trabajo.

2. Dichas descripciones son reagrupadas por un panel de expertos en dimensiones coherentes (relación con los clientes, competencia, rapidez, conciencia profesional, por ejemplo).

3. Los expertos eligen tres descripciones, para cada dimensión, que correspondan a un comportamiento satisfactorio, mediano o insatisfactorio

4. Todas las descripciones se mezclan para formar una ficha de cali- ficación.

En esta ficha de calificación, el calificador cuenta con tres opciones para cada descripción de comportamiento, según juzgue a la persona cali- ficada mejor que la descripción dada, peor que dicha descripción o piense que se ajusta a ella. Una escala numérica permitirá calcular la puntuación correspondiente a cada una de las dimensiones iniciales. Este método tiene la ventaja de poner de relieve las eventuales incoherencias que haya en cada calificación para poder ponerlas en conocimiento de la persona encargada de calificar. Si los errores se repiten en los mismos puntos, tratándose de jueces distintos, habrá que revisar la elección de las descrip- ciones o la manera en que están redactadas.

En ese mismo sentido se han desarrollado otros dos procedimientos para la elaboración de fichas de calificación: las escalas de comportamien- to, que suelen designarse en las publicaciones anglosajonas con las siglas BARS (Behaviorally Anchored Rating Scales)* y las escalas de observa- ción, BOS (Behavioral Observation Scales)**.

* N. del. T. Escalas de calificación mediante escalones comportamentales. ** Escalas de observación comportamental.

Relaciones con los clientes

CALIFICANDO AL PERSONAL 29

Page 50: Evaluacion Del Personal

30 EVALUACIÓN DEL PERSONAL

Las BARS fueron propuestas por Smith y Kendall en 1963. Con el fin de mejorar la fiabilidad de las calificaciones, utilizan el método de los incidentes críticos de Flanagan, lo que permite la elaboración de fichas de calificación en las que cada escalón corresponde a un comportamiento realmente observado sobre el terreno. La construcción de tal escala de comportamiento se desarrolla en cuatro etapas:

1. Unos expertos (los mandos afectados, personas que hayan ejerci- do o ejerzan actualmente la función en cuestión) identifican y definen los aspectos esenciales de la actividad o función, aspectos que constituirán las dimensiones de la futura ficha de calificación.

2. El grupo de expertos reúne ejemplos concretos de comportamien- to que caracterizan a las personas que ejercen la actividad en cuestión, considerándola como satisfactoria, mediana o mediocre. Estos comporta- mientos se reagrupan según los aspectos identificados en 1) para consti- tuir las descripciones de escalones sobre las dimensiones a calificar.

3. Todas las descripciones de escalones se trasladan a fichas, que se mezclan como se haría con una baraja de cartas, de manera que su vincu- lación con alguna de las dimensiones definidas en 1) desaparezca. Un segundo grupo de expertos valida esas descripciones, y las atribuye a cada una de las dimensiones de la lista inicial. Si una descripción de comporta- miento no es asignada correctamente a «su» dimensión, se rechaza o su redacción se discute y se mejora.

4. Los expertos atribuyen un valor numérico a cada descripción, se- gún su contribución a la dimensión que representa. Esto permite elaborar una escala final con una definición para cada dimensión y unas descrip- ciones de comportamiento concretas para cada escalón de la ficha de calificación. Aparte de esto, sólo se mantiene un escalón cuando existe un acuerdo entre los expertos sobre su significación, acuerdo que se traduce en una débil varianza de los valores numéricos asignados por los expertos. Cada escalón recibe entonces un peso que corresponde a la media de esos valores.

Este conjunto de operaciones puede parecer largo y pesado. Requiere, además, que se pueda reunir los paneles de expertos competentes y dispo- nibles. Hecha esta salvedad, el método ofrece indudables ventajas. Ante todo, la escala así elaborada está fabricada por sus futuros usuarios. Ade- más, el proceso de elaboración de la ficha de calificación permite poner de relieve, y tal vez resolver, los desacuerdos que pudieran existir y obliga asimismo a eliminar las descripciones vagas, estereotipadas y sin una sig- nificación concreta. Por ejemplo, no se podrá utilizar la escala para decir de un empleado de banca que sus relaciones con la clientela son malas, sin explicar en concreto por qué y de qué manera.

Page 51: Evaluacion Del Personal

Volviendo al ejemplo precedente, la dimensión «relaciones con la clientela» del empleado de banca se describirá de la siguiente manera:

«Las relaciones con la clientela constituyen un aspecto importante del trabajo de la persona que está detrás de una ventanilla. No sólo abarcan la ejecución de los servicios requeridos por el cliente, sino también la infor- mación de la clientela y las explicaciones necesarias para que los clientes puedan comprender las diversas operaciones bancarias.»

El escalón más elevado de esta dimensión corresponderá a la siguiente descripción:

«Pone gran atención en aconsejar a los clientes y se hace cargo de sus problemas. Se muestra siempre paciente y dispuesto a dar las explicaciones necesarias, incluso a los clientes difíciles. Procura reducir el tiempo de espe- ra ante la ventanilla y adelantarse a las necesidades de los clientes.»

El escalón más bajo correspondería a la siguiente descripción:

«Suele ser motivo de incidentes con los clientes, por mala voluntad o incompetencia. Parte del principio de que el cliente no tiene por qué com- prender las operaciones efectuadas.»

Latham y Wexley (1977) propusieron una variante (las BOS, Behavior Observation Scales) para responder a dos de las críticas formuladas contra las BARS por los usuarios. Por un lado, cada encargado de calificar no siempre ha podido observar a todas las personas que califica en todos los comportamientos que abarca la ficha de calificación. Por ello, su califica- ción se basa tanto en la observación directa como en la manera en que él supone que se comportaría la persona juzgada si se viera en la situación descrita. Por otro lado, las fichas de calificación así redactadas son largas, prolijas y su mera lectura requiere un tiempo excesivo, si se desea hacerlo con meticulosidad. Las BOS se elaboran de la misma manera que las BARS, pero se presentan de forma diferente. Por un lado, cada escalón está constituido por un único comportamiento realmente observable; por otro lado, el encargado de calificar sólo tiene que indicar si ese comporta- miento es frecuente o raro en la persona que está valorando. El siguiente ejemplo, referido de nuevo a las relaciones de los empleados de banca con sus clientes, permitirá hacernos una idea de la presentación de las BOS.

Latham (1979) demostró que era posible utilizar un análisis factorial para definir, a partir de calificaciones elaboradas mediante una BOS, las dimensiones fundamentales de los puestos para los que ha de efectuarse

CALIFICANDO AL PERSONAL 31

Page 52: Evaluacion Del Personal

una valoración del personal. Además, los datos aportados por este tipo de ficha de calificación pueden utilizarse, más fácilmente que los demás, en las entrevistas de feedback.

Este método, lo mismo que los demás, no deja de tener sus inconve- nientes. Sobre todo, y a pesar de la naturaleza muy concreta del trabajo que se pide a los encargados de la calificación, éstos tienen que recurrir a lo que recuerdan de los comportamientos observados y no sólo a la obser- vación directa. Y el proceso cognitivo de almacenamiento y tratamiento de la información exigido por la memorización de series de observación en períodos de tiempo relativamente dilatados puede deformar la reali- dad.

A pesar de las críticas expresadas contra casi todos los métodos exami- nados para elaborar unos criterios de éxito profesional y unos sistemas de calificación profesional, no debemos concluir este capítulo con un tono demasiado pesimista. Es cierto que evaluar a otra persona resulta una tarea sumamente ardua. Pero el esfuerzo de reflexionar sobre la manera en que puede hacerse tal evaluación y de poner en práctica métodos racio- nalmente justificados y meticulosamente elaborados, implica numerosas consecuencias positivas para la empresa. En efecto, hemos visto de pasada que ese trabajo permite desarrollar un consenso entre los mandos en cuanto a los objetivos y medios a fijar, y que puede hacer más eficaz la

32 EVALUACIÓN DEL PERSONAL

Relaciones con los clientes

Page 53: Evaluacion Del Personal

CALIFICANDO AL PERSONAL:... 33

entrevista que suele seguir a las calificaciones. Además, los ejecutivos formados para la calificación profesional y que han adquirido conciencia de sus dificultades metodológicas y prácticas, tendrán una exigencia igual frente a los métodos de evaluación utilizados para pronosticar el futuro comportamiento profesional. Esas cualidades métricas son las que descri- biremos en el siguiente capítulo.

RESUMEN:

Ventajas e inconvenientes de los criterios de éxito profesional

Criterios de éxito profesional

Indicadores de producción

Indicadores del comporta- miento

Calificaciones por parte de los mandos

Ventajas

Objetivos, cuantificables

Objetivos, cuantificables

Comparables para pues- tos diferentes; la for- mación de quienes han de calificar y el formato de los formularios au- menta su fiabilidad

Inconvenientes

Poco fieles, a menudo poco controlables por el indivi- duo

Complejos, a menudo deter- minados por factores ex- ternos

Subjetivos, a menudo costo- sos en tiempo

Page 54: Evaluacion Del Personal
Page 55: Evaluacion Del Personal

3

Cualidades métricas de los métodos de evaluación

Ya se trate de tests psicológicos, de observación sistemática del com- portamiento en situaciones normalizadas, o de cualquier otra técnica, los métodos propuestos para evaluar a los individuos y predecir cuál será su rendimiento en situaciones laborales futuras, son ciertamente numerosos. Cada día que pasa aparecen otros nuevos, cuyas bondades airea evidente- mente su inventor. ¿Cómo orientarse? ¿A quién creer? ¿Cómo evaluar los propios métodos de evaluación? Desde luego, no porque el método parez- ca válido por simple intuición (error que se comete con frecuencia), ni tampoco porque contenga preguntas que a primera vista parezcan más relacionadas con la profesión en cuestión.

En realidad, no es posible recomendar ningún método de una forma general. En cambio, hay métodos que deberían desecharse radicalmente, por no poseer las cualidades métricas esenciales y, especialmente, porque- no proporcionan informaciones fieles independientes de quién los utilice ni constantes cuando se los utiliza en diferentes ocasiones. Nadie se aven- dría a medir con un metro que se dilatara por el calor, ni nadie sería cliente de un laboratorio de análisis que diese resultados contradictorios sobre el número de glóbulos rojos en unas mismas muestras examinadas con sólo veinticuatro horas de intervalo. La misma exigencia métrica debe aplicarse a los métodos de evaluación de las personas.

Un método de evaluación, aunque sea «fiable», no tiene por qué ser el más indicado para todos los problemas que encontramos en la gestión del personal. El valor de cada método depende de la situación, del problema planteado y de las condiciones en que se haya de hacer una predicción o tomarse una decisión. Para ser más exactos, hay que elegir el método de evaluación en función de dos parámetros (aparte de su fiabilidad): su sensibilidad y su poder de discriminación con respecto a la población afectada; su significación y su validez con respecto a las características requeridas, que el análisis del trabajo habrá permitido precisar.

35

Page 56: Evaluacion Del Personal

36 EVALUACIÓN DEL PERSONAL

En este capítulo expondremos lo que se entiende por fiabilidad y por discriminación, presentaremos los métodos que permiten establecer y uti- lizar las normas, haciendo una confrontación de los mismos, y definire- mos los diferentes tipos de validez y los métodos estadísticos que permi- ten medirlos.

FIABILIDAD

La fiabilidad es la primera de las cualidades métricas que debe poseer un método de evaluación. Se trata de la reproductibilidad de una serie de observaciones (o de una serie de preguntas), reproductibilidad que, nor- malmente, viene garantizada por la coherencia interna de esas series de observaciones o interrogantes.

En concreto: ¿qué se quiere decir con esto? Tomaremos de F. Landy (1985) el siguiente ejemplo: queremos verificar el tamaño de una serie de árboles que hemos plantado en el jardín y para ello los medimos una primera vez. Esta primera serie de medidas nos permitirá clasificar los árboles del más pequeño al más grande; dispondremos así de una serie de valores absolutos y de una clasificación. Supongamos que, algunas sema- nas más tarde, volvemos a tomar esas medidas y que comparamos las dos series obtenidas. Si los resultados se acercan mucho en cuanto a valor absoluto y categoría, podremos sacar tres conclusiones:

1. Los árboles no han cambiado de tamaño entre ambas mediciones. 2. Nuestro instrumento de medida es correcto. 3. Lo hemos utilizado bien. Por el contrario, si las dos series de medidas dan una misma clasifica-

ción, pero con valores absolutos diferentes, la conclusión que sacaremos es que el instrumento y su uso eran correctos, sólo que los árboles han crecido todos en la misma proporción.

Finalmente, si obtenemos dos series de medidas distintas, tanto desde el punto de vista de la categoría asignada a cada árbol en la clasificación como desde el punto de vista de su tamaño en centímetros, no podremos sacar conclusión alguna, ya que no sabremos si la disparidad entre ambas series se debe a:

1. Un mal instrumento de medida. 2. Una mala utilización de ese instrumento. 3. El hecho de que la variable medida es realmente inestable, pues

ciertos árboles han crecido más que otros. En todo caso, si tenemos la certeza de haber utilizado un instrumento

fiable y de haberlo utilizado correctamente, sólo será posible la tercera

Page 57: Evaluacion Del Personal

CUALIDADES MÉTRICAS DE LOS MÉTODOS DE EVALUACIÓN 37

interpretación. Así pues, es de suma importancia disponer de unos méto- dos de evaluación cuya fiabilidad haya sido verificada, de modo que el resultado obtenido no varíe en función de la persona que utiliza el méto- do, y que utilicemos esos métodos correctamente, es decir, respetando unas reglas de aplicación normalizadas.

Hay tres formas diferentes de medir la fiabilidad de un método de evaluación. No facilitan exactamente la misma información, por lo que es conveniente conocer los tres procedimientos y la significación de los re- sultados que proporcionan.

El método test-retest consiste en utilizar la misma técnica dos veces consecutivas, en las mismas condiciones y sobre el mismo grupo de indi- viduos. La fiabilidad viene representada por la correlación calculada entre ambas series de medidas o ambas series de observaciones así obtenidas. Por ejemplo, se puede hacer repetir la misma prueba de cálculo mental con una semana de intervalo, o hacer rellenar por dos veces el mismo cuestionario de personalidad, o incluso hacer anotar la estabilidad emo- cional por un grafólogo en dos ocasiones distintas sobre una misma mues- tra de escritura. Todos estos ejemplos demuestran que el método test- retest resulta trabajoso, exige una buena disposición por parte de los individuos, supone que éstos no tratan de recordar sus anteriores respues- tas y que los resultados obtenidos en segunda instancia no se benefician de un cierto aprendizaje conseguido en la primera sesión.

El segundo método trata de evitar las dificultades del primero. Se refiere sobre todo a los métodos psicológicos, ya que consiste en elaborar dos versiones equivalentes (llamadas formas paralelas) del test o del cues- tionario, meticulosamente construidas, de manera que el contenido, la forma y la dificultad de las preguntas sean parejos. Se puede entonces utilizar las dos formas, en ocasiones distintas, con los mismos individuos y calcular la correlación entre ambas series de resultados. En este caso, una escasa correlación y, por tanto, una escasa fiabilidad, puede deberse al hecho de que el muestreo de preguntas, en las dos formas consideradas equivalentes, es en realidad disparejo y de que estas dos formas no cubren exactamente el mismo terreno. Así, un cuestionario dirigido a los lectores de la presente obra para comprobar los conocimientos adquiridos tras su lectura podría abarcar unas 300 preguntas. Hacer que se responda a 300 preguntas y corregirlas es una tarea larga y fastidiosa. También podría elaborarse un cuestionario más corto de unas 40 preguntas extraídas al azar y distribuidas en dos listas, «A» y «B», con 20 preguntas cada una. Si las puntuaciones obtenidas por los mismos individuos en las mitades A y B de ese cuestionario no guardan una correlación, es que el terreno inicial cubierto por las 300 preguntas no está bien definido y que, en realidad, se comparan dos subáreas diferentes, heterogéneas y mal muestreadas.

Page 58: Evaluacion Del Personal

38 EVALUACIÓN DEL PERSONAL

La coherencia interna de una técnica de evaluación es una condición esencial de su fiabilidad. La manera más sencilla de medirla consiste en dividir en dos partes el método de evaluación, de manera que se obtengan dos puntuaciones distintas y calcular su correlación. Existen varias posibi- lidades para realizar esta división en dos: comparar las puntuaciones obte- nidas en las 20 primeras preguntas y en las 20 últimas, o también las puntuaciones correspondientes a la primera, la tercera, la quinta y todas las preguntas impares con las puntuaciones correspondientes a todas las preguntas pares. Cuando se trata de una tarea, o de observación del com- portamiento, se pueden comparar, por ejemplo, los errores producidos en los 10 primeros minutos de cada hora con los observados en el transcurso de los 10 minutos siguientes. Esta manera de medir la fiabilidad interna (y por tanto la coherencia de la medida) tiene algunos inconvenientes. La correlación obtenida subestima la fiabilidad real, ya que las dos mitades comparadas son más cortas que la prueba completa; y las pruebas cortas, más vulnerables a los errores de muestreo, son menos fiables que las largas. La fórmula de Spearman-Brown (que damos en el anexo) permite corregir esta subestimación. Además, la manera de repartir una serie de preguntas o una serie de medidas puede llevar a resultados absurdos cuan- do preguntas de la misma índole se agrupan (por ejemplo, todas las divi- siones de un test de cálculo mental) y corren el riesgo de hallarse todas en una sola de las mitades del test o cuestionario.

Hay otros indicadores de coherencia interna que dan medidas de la fiabilidad muy próximas a la obtenida mediante el método de las formas paralelas y evitan sus inconvenientes. El principio consiste en calcular las correlaciones entre cada ítem y la puntuación total. Este método se elabo- ró pensando en los tests psicológicos, pero también puede utilizarse para todo tipo de pruebas o series de observaciones, con tal de que haya unas subpuntuaciones cuya homogeneidad se trata de medir. Existen, evidente- mente, tantas correlaciones como ítems o subpuntuaciones. Como la me- dia de una serie de correlaciones no posee significación estadística alguna, Kuder y Richardson (1937) postularon que todos los ítems son paralelos, es decir, tienen la misma media y la misma varianza y propusieron una fórmula que permite calcular la fiabilidad cuando test, cuestionarios u observaciones dan lugar a calificaciones dicotómicas (acertado/falso). El coeficiente alfa de Cronbach (1951) permite calcular la fiabilidad interna cuando cada ítem o cada subpuntuación es objeto de calificación en va- rios puntos. Ambas fórmulas se facilitan en el anexo.

Page 59: Evaluacion Del Personal

CUALIDADES MÉTRICAS DE LOS MÉTODOS DE EVALUACIÓN 39

DISCRIMINACIÓN

Se trate de informaciones cualitativas o cuantitativas, es evidente que los métodos de evaluación deben proporcionar informaciones que discri- minen a los candidatos entre sí. Es de sentido común. No se pueden clasificar unas candidaturas en razón de la formación si todos los candida- tos proceden de la misma escuela, ni en razón de la edad si todos han nacido el mismo año. Habrá al menos que mejorar la información tenien- do en cuenta, por ejemplo, el puesto con que salieron de la escuela o el día de su nacimiento. De esa misma manera, si en un ejercicio puntuado de 1 a 5 la mitad de los individuos obtiene la nota 3 y los demás se reparten entre las notas 2 y 4, la media procurada por este único ejercicio será menos discriminatoria que otra obtenida mediante un test de 20 pregun- tas y en el que los mismos candidatos puedan dar de 1 a 19 respuestas acertadas, según una distribución conforme a la curva de Gauss. La figu- ra III-1 ofrece una imagen de estos dos ejemplos para un grupo de 50 personas. Lo que en concreto queremos decir es que no se puede aceptar un método que proporcione informaciones no discriminatorias para el tipo de candidatos que se quiere examinar. Es preciso que un test, un cuestionario o un examen no sean ni demasiado fáciles (en cuyo caso todo el mundo lo haría bien), ni demasiado difíciles (en cuyo caso nadie acertaría), para que dichas pruebas aporten informaciones útiles cuando se trata de diferenciar a los candidatos entre sí.

PARA QUE SIRVE UN BAREMO NORMATIVO

No basta con que un método de evaluación sea discriminatorio. Es preciso además disponer de unas normas sobre ese método y el tipo de candidatos que hay que examinar. En la práctica hay que enfrentarse muchas veces a pequeños grupos que suponen muestras no representati- vas de un conjunto más amplio. Por ejemplo, si queremos seleccionar una mecanógrafa o una cajera, podemos recibir cinco candidaturas que po- sean una cualificación idéntica, pero que tal vez se sitúen a niveles dife- rentes dentro de su grupo. Sus puntuaciones en una prueba de cálculo mental, por ejemplo, serán difíciles de interpretar si no disponemos de unas normas que permitan comparar sus resultados con los de un grupo representativo, suficientemente importante, y que posea las mismas ca- racterísticas que ellas desde el punto de vista de la formación y de la expe- riencia.

Aun cuando un candidato obtenga un elevado número de respuestas correctas en una prueba o una nota elevada en una observación de com-

Page 60: Evaluacion Del Personal

40 EVALUACIÓN DEL PERSONAL

Figura III-l. Ejemplos de pruebas discriminatorias y no discriminatorias.

portamental o en una prueba profesional, esa información nada significa por sí sola. Lo mismo que una puntuación baja o una evaluación medio- cre. Notas, puntuación y evaluación han de compararse con unas normas establecidas para un grupo de referencia adecuado. Esas normas de refe- rencia son las que demuestran que el instrumento o método utilizados son discriminatorios para el grupo en cuestión, y, sobre todo, que en cada aplicación individual del mismo método van a permitir situar a cada persona que se evalué relacionándola con su grupo de referencia.

¿Cómo se presentan en concreto las normas o el contraste de una

Page 61: Evaluacion Del Personal

CUALIDADES MÉTRICAS DE LOS MÉTODOS DE EVALUACIÓN 41

prueba determinada? Se trata de los resultados obtenidos por un grupo de referencia suficientemente importante y que se traducen en forma de cen- tiles o de puntuación estándar.

Un centil indica el nivel o rango de una puntuación, es decir, el por- centaje de personas dentro del grupo de referencia que obtiene una pun- tuación más baja que la persona que ha obtenido la puntuación que se trata de interpretar. Si, por ejemplo, una de las candidatas mecanógrafas obtiene el centil 60 en una prueba de ortografía, eso significa que el 60 % de las personas que tienen su misma cualificación han obtenido una nota inferior a la suya.

Cuando el análisis del trabajo permite sugerir que un método de eva- luación es pertinente para una función determinada, pero que esa prueba no ha dado lugar al establecimiento de normas para el grupo en conside- ración, es necesario establecerlas antes de cualquier aplicación. Lo que significa que habrá que hacer la prueba a un grupo adecuado y transfor- mar los resultados obtenidos en centiles para facilitar su empleo.

Además, la utilización de contrastes en centiles debe hacerse de mane- ra competente y sobre todo teniendo en cuenta el hecho de que los centi- les son rangos y que los intervalos entre esos niveles o rangos no son iguales. Así, pequeñas diferencias en puntuaciones brutas en el centro de la distribución se traducirán en fuertes distanciamientos en centiles, y sucederá a la inversa en los extremos de la misma distribución (ver figura III-2). En el anexo se indica el método a seguir para establecer un contraste en centiles.

Hay otras maneras más complejas de presentar las normas. Las pun- tuaciones típicas son desviaciones de la media, expresadas en relación con la desviación típica de la distribución en puntuaciones directas, considera- das por unidad. Si M es la media, X la nota que se quiere transformar y s la desviación típica, la puntuación típica Z es igual a [X-M]/s. Será pues positiva si el sujeto supera la media de su grupo y negativa en caso contra- rio. Como la transformación es lineal, la forma de distribución de las pun- tuaciones típicas es la misma que la de las puntuaciones directas. Y, debido a su modalidad de cálculo, la distribución en puntuaciones típicas posee la ventaja de tener una media igual a 0 y una desviación típica igual a 1.

Los estaninos son el resultado de una transformación que da una nueva distribución de media igual a 5 y una desviación típica igual a 2. Las puntuaciones T tienen una media de 50 y una desviación típica de 10. En los casos de tests psicológicos, estas diversas normas son suministradas en general para los principales grupos de referencia con la documentación que acompaña los tests. Suelen presentarse en forma de tablas de conver- sión que permiten, mediante una lectura directa, transformar una pun- tuación directa en una puntuación normalizada.

Page 62: Evaluacion Del Personal

42 EVALUACIÓN DEL PERSONAL

Figura III-2. Reparto en puntuaciones brutas, en centiles y en notas estándard

La utilización de normas permite saber dónde se sitúa un determinado individuo dentro de su grupo de referencia y qué representa, siempre en relación con el grupo de referencia, la diferencia observada entre las pun- tuaciones de dos o tres candidatos aislados. También tienen otra ventaja. Cuando varias de las pruebas a que se ha sometido el mismo individuo han sido objeto de la misma transformación en puntuaciones normaliza- das, esas puntuaciones se vuelven directamente comparables entre sí y pueden presentarse incluso bajo la forma de perfiles cuya lectura resulta más cómoda, perfiles que pondrán claramente de manifiesto los puntos fuertes y débiles de un individuo con relación a su grupo de referencia. Este tipo de perfil puede elaborarse también para un solo test o cuestiona- rio que dé lugar a múltiples puntuaciones, como es el caso de los tests de intereses y de los cuestionarios de personalidad.

ESTRATEGIAS Y TÉCNICAS DE VALIDACIÓN

No basta con que una técnica de evaluación sea fiable y discriminato- ria, es preciso además que sea pertinente, es decir, que proporcione infor- maciones útiles para la decisión que haya que adoptar. Tal utilidad se puede definir desde dos puntos de vista distintos, según que se verifique si las informaciones obtenidas corresponden a las características requeridas

Page 63: Evaluacion Del Personal

CUALIDADES MÉTRICAS DE LOS MÉTODOS DE EVALUACIÓN 43

para el puesto o función, definidas mediante análisis del trabajo; o según se proceda a una verificación experimental de la capacidad predictiva de tales técnicas, comparando el pronóstico que ellas permitieron establecer con el éxito profesional posterior, medido mediante criterios adecuados.

Está claro que esta definición de validez otorga un carácter relativo al análisis del trabajo hecho para una función o puesto determinados; relati- vo a los conceptos y teorías que definen el objeto a medir; relativo a la comparación con los resultados profesionales de un puesto o función de- terminados.

Debido precisamente a que la noción de validez es relativa y está en función del método utilizado para establecerla, suelen distinguirse tres «tipos» de validez.

� La validez predictor/criterio, que se define por la relación entre el (o los) predictores y el (o los) criterios de éxito profesional. Se llama concurrente cuando predictores y criterios se toman a un mismo tiempo, a título experimental, y predictiva cuando transcurre cierto tiempo entre la evaluación mediante los predictores y la ulterior descripción del éxito pro- fesional.

� La validez de contenido, que corresponde al grado en que una técnica de evaluación muestrea el ámbito de los comportamientos para los que se desea establecer un pronóstico.

� La validez de constructo, que representa la capacidad que tiene un método de evaluación para medir la variable psicológica que debe juzgar y de hacerlo de acuerdo con un modelo teórico existente.

En realidad, esta clasificación de los diversos tipos de validez han originado discusiones, a veces confusas, entre los especialistas en psicolo- gía diferencial y complica sin justificación alguna los esfuerzos de los psicólogos cuando quieren (como en el presente caso) demostrar la im- portancia de la validez a unos ejecutivos ansiosos de saber cómo elegir los métodos de evaluación adecuados. Aparte de esto, estas distinciones son completamente artificiales y cabría pensar que todas las vías para demos- trar la validez de una técnica de evaluación confluyen en desarrollar su validez de contenido (Guión, 1977, 1987 y Tenopyr, 1977). La validez de constructo (y por tanto, el cuidado y el método empleados para elaborar una técnica de evaluación) representa una noción central, ya que permite controlar las hipótesis sobre los conceptos que explican el comportamien- to humano y las teorías que dan cuenta de su organización. En este senti- do, estudiar la validez de contenido supone una etapa necesaria para cons- truir una técnica de evaluación, ya que permite asegurarse de que los tests y las demás técnicas abarcan suficientemente un ámbito significativo del comportamiento. Reunir algunos datos sobre la validez predictiva, exami-

Page 64: Evaluacion Del Personal

44 EVALUACIÓN DEL PERSONAL

narlos de manera critica, permite aportar informaciones complementarias sobre el contenido de las técnicas, visto bajo la perspectiva de lo que se puede válidamente inferir a partir de los resultados que aportan.

Empezaremos, pues, describiendo los métodos que permiten evaluar la validez de contenido y construir unas técnicas que sirvan para mejorar al máximo la validez de constructo, sobre todo el análisis de ítems. Des- cribiremos luego las etapas que llevan a la evaluación de la validez predic- tores/criterios y los métodos de cálculo que la afectan. Este enfoque de la validez es muy exigente y su viabilidad plantea problemas específicos que describiremos más adelante. Además, y por varias razones que es preciso conocer, las técnicas realmente válidas no siempre se muestran como tales cuando se examina su validez predictiva. Razón de más para fundar el valor de un método de evaluación en su validez de constructo y en la adecuación de su contenido a su objetivo. Esa es también una de las razones que han llevado a un grupo de investigadores americanos a anali- zar las fuentes de error en las etapas del cálculo de la validez predictiva y a proponer un método que permita tener en cuenta estos errores, corregir- los y generalizar una validez específica para grupos homogéneos de ocu- paciones, profesiones o empleos. Este enfoque se basa también en la utili- zación del análisis del trabajo como medio de agrupar ocupaciones afines desde el punto de vista de sus exigencias humanas y como instrumento para incluir tal o cual puesto o empleo en unas familias de ocupaciones previamente constituidas.

Este proceso supone en su conjunto un importante progreso para la evaluación de adultos en el mundo laboral. Nos hemos ocupado de ello desde la perspectiva del análisis del trabajo y de la constitución de fami- lias de ocupaciones. En el presente capítulo abordaremos la generaliza- ción de la validez, cuando describamos el método estadístico de adición de datos y los postulados en que se basa. Más adelante, volveremos sobre lo mismo para describir los resultados que este método ha permitido obte- ner, sobre todo en lo que respecta a la validez de las pruebas del funciona- miento cognitivo.

La validez de contenido se refiere a la calidad del muestreo de los comportamientos relacionados con un rendimiento determinado. Es, pues, fuertemente tributaria del análisis del trabajo antes descrito. Y su- pone que:

a) Se describa con claridad el rendimiento profesional. b) Se formulen correctamente los objetivos de la técnica de evalua-

ción. c) Se haga de manera adecuada el muestreo del campo profesional

(Schneider y Schmitt, 1986).

Page 65: Evaluacion Del Personal

CUALIDADES MÉTRICAS DE LOS MÉTODOS DE EVALUACIÓN 45

El procedimiento a seguir para asegurarse de que una técnica en curso de elaboración poseerá una validez de contenido satisfactoria suele incluir las siguientes etapas:

1. Un análisis del trabajo que permita precisar los conocimientos, aptitudes, capacidades o comportamientos que sean esenciales, que se puedan describir y, de ser posible, cuantificar, y que estén relacionados con la tarea profesional.

2. La elaboración del método de evaluación (test, cuestionario, ob- servación, guía de entrevista...), procurando que se corresponda con los resultados del análisis del trabajo.

3. Evaluación de la pertinencia de la técnica con relación a la activi- dad profesional en cuestión; Lawshe (1975) propuso un coeficiente que permite hacer una síntesis de la opinión de varios expertos sobre la perti- nencia de cada ítem o prueba del método de evaluación.

La validez de contenido está esencialmente relacionada con el proble- ma del muestreo del ámbito a evaluar. Por ejemplo, si queremos medir el nivel de un grupo de secretarias en inglés comercial, tendremos que elabo- rar un cuestionario o un examen representativos de lo que entendemos por inglés comercial. La pertinencia de esta muestra de preguntas será juzgada globalmente por uno o varios expertos. O bien puede establecerse a partir de una definición muy precisa del ámbito a evaluar, de la even- tual división de ese ámbito en partes coherentes y de un muestreo siste- mático y planificado de esas diversas partes. Este procedimiento permite asimismo, si se recurre a varios expertos, identificar (y resolver) posibles desacuerdos entre ellos, desacuerdos que de otro modo no se hubieran evidenciado. Sucede con frecuencia, efectivamente, que diferentes miem- bros de la cadena de mando no tienen la misma idea de los medios o cualidades necesarios para lograr un determinado objetivo.

Este procedimiento plantea a veces dificultades. Si bien es relativa- mente fácil definir el objetivo de un método de evaluación, así como el ámbito a que se refiere en el caso de pruebas de conocimientos o habilida- des motrices, resulta más difícil cuando se aborda el funcionamiento cog- nitivo y más aún cuando se trata de la personalidad.

La noción de validez de constructo permite llegar más lejos. Entra en juego siempre que «haya de interpretarse un test como medida de una cualidad o atributo que no esté operacionalmente definido» (Cronbach y Meehl, 1955). Esto significa que hay dos categorías de evaluación. Por un lado, las que se bastan a sí mismas porque resulta fácil definir el campo que deben abarcar. Tal es el caso, por ejemplo, de una prueba profesional; basta con que concuerde correctamente con las actividades del empleo correspondiente, con que sea fiable y discriminatoria para que pueda uti-

Page 66: Evaluacion Del Personal

46 EVALUACIÓN DEL PERSONAL

lizarse como fuente de evaluación. No ocurre lo mismo cuando se trata de una técnica, test o cualquier otra prueba destinada a medir una cualidad, como la inteligencia, la fluidez verbal o la memoria, o incluso un rasgo de la personalidad, como la sociabilidad, la simpatía o la confianza en sí mismo. En efecto, el objeto de la medición es, en ese último caso, una noción abstracta, relacionada con una teoría psicológica y definida por ella. Por ejemplo, estudiar la validez de constructo de un test de inteligen- cia supone preguntarse si el test en cuestión mide bien el concepto de inteligencia según lo hayamos definido, lo cual supone una representa- ción teórica de la inteligencia que se ha utilizado para inferir la medida de inteligencia a partir de una determinada prueba. Por ello, cuando se mide la validez de constructo, se valida a un mismo tiempo el test, el concepto que mide y la teoría de ese concepto.

Existen tres métodos para medir la validez de constructo. El más sen- cillo consiste, en verificar que la nueva técnica de evaluación da unos resultados que guardan correlación con los obtenidos mediante técnicas más experimentadas que se sabe bien lo que miden. Por ejemplo, puede haber razones para pensar que la rapidez en solucionar problemas aritmé- ticos representa una medida de la inteligencia. Para verificarlo, habrá que estudiar las correlaciones entre esta prueba y otros tests más antiguos y conocidos, y también asegurarse de que no refleje sobre todo el nivel de escolaridad o incluso la facilidad para manejar números. Este tipo de procedimiento resulta muy útil cuando se quiere sustituir una prueba individual por una prueba en grupo o cuando se quiere reemplazar un test largo por otro más corto, todo ello sin perder capacidad de información.

Un segundo método, más complicado, permite tener en cuenta simul- táneamente una serie de correlaciones entre varios tests, cuestionarios o pruebas. Se trata del análisis factorial, que permite aislar y definir los factores capaces de dar cuenta de las relaciones que existen entre varias medidas. Tomemos de Smith y Robertson (1986) el siguiente ejemplo: queremos saber qué es lo que miden las calificaciones atribuidas a un grupo de individuos por parte de la persona que ha mantenido con ellos una entrevista de selección. Para ello, podemos acumular sobre los mis- mos individuos no sólo la calificación posterior a la entrevista, sino tam- bién los resultados de unos tests de inteligencia, de personalidad, de flui- dez verbal, así como indicadores sociométricos e informaciones biográficas. Todas las correlaciones posibles entre estos datos se llevarán a una tabla de correlación y el análisis factorial de esa tabla permitirá aislar los factores que dan cuenta de la varianza de cada test o de cada informa- ción. Así, en el citado ejemplo, se obtendrían probablemente un factor de inteligencia, un factor de sociabilidad, un factor de fluidez verbal y un factor de experiencia profesional. Las correlaciones (o «saturación») entre

Page 67: Evaluacion Del Personal

CUALIDADES MÉTRICAS DE LOS MÉTODOS DE EVALUACIÓN 47

cada factor y las calificaciones dadas tras la entrevista permitirán conocer la suma de la varianza de esas notas explicadas por esos cuatro factores, así como la parte en que interviene cada uno dé ellos. Este método es muy útil, pero exige un número de individuos bastante elevado y el interés de los resultados depende, evidentemente, de la elección y de la diversidad de variables presentes en las diferentes pruebas y que se introducen en el análisis factorial.

El análisis factorial puede asimismo aplicarse al conjunto de subpun- tuaciones de una única prueba. Supongamos que un test de inteligencia está compuesto por 10 pruebas distintas que utilizan problemas, series a completar y razonamientos lógicos de diversa índole. El análisis factorial de esas 10 puntuaciones puede revelar una fuerte heterogeneidad o, por el contrario, la existencia de un factor general importante, común al conjun- to de esas 10 pruebas, aun cuando no explique toda la varianza. Está claro que esa composición factorial aclarará la ulterior utilización de los resul- tados obtenidos, puntuación global o subpuntuaciones.

El cuarto procedimiento, denominado «multirrasgos-multimétodos», se debe a Campbell y Fiske (1959) y consiste básicamente en mostrar que tests diferentes, que midan el mismo factor o el mismo concepto, guardan correlación entre sí, pero no con tests que midan otros rasgos o factores, y ello aun cuando esos tests utilicen los mismos métodos. Tomaremos esta vez de J. J. Bernier (1984) el siguiente ejemplo. Tres tests A, B y C miden el liberalismo, el nivel de cultura y la alienación. Cada test, pasado por los mismos individuos, consta de tres partes que utilizan métodos diferentes (elegir una respuesta; decir si una afirmación es verdadera o falsa; comple- tar frases). Los resultados obtenidos permiten calcular todas las correla- ciones posibles entre estas nueve series de variables. Si se obtienen fuertes correlaciones entre las medidas del mismo rasgo con métodos diferentes, hay validez convergente: métodos diferentes miden bien la misma varia- ble. Si se obtienen correlaciones más fuertes entre las medidas de rasgos diferentes por el mismo método, hay validez divergente: la varianza de las medidas se debe al método, no al contenido de los tests.

Cuando los resultados de estos diferentes métodos de estimación de la validez de constructo dan resultados insuficientes, habrá que saber por qué y, para ello, se deberá proceder a un análisis más afinado de la técnica de evaluación, hecho a nivel de los ítems que la componen. Estos ítems pueden ser de muy diversa índole: preguntas, problemas, escalas de acti- tudes, casillas de una plantilla de evaluación...

El análisis de ítems consiste en calcular la correlación entre cada ítem y la puntuación total, de modo que se verifique la coherencia interna de los ítems de una misma prueba o de una parte considerada homogénea de la prueba, y en estudiar la distribución de las puntuaciones totales. Los

Page 68: Evaluacion Del Personal

48 EVALUACIÓN DEL PERSONAL

ítems cuya correlación con la puntuación total sea débil habrán de ser eliminados o mejorados o redactados en forma diferente, por ejemplo. De igual manera, si la frabilidad interna de la prueba es insuficiente, habrá que quedarse sólo con los ítems que contribuyen a la homogeneidad del test. Finalmente, se deberán eliminar (o retorcar) los ítems que sean de- masiado difíciles, demasiado fáciles, o no discriminatorios (sobre todo en el caso de las escalas de actitudes). Una manera práctica de desterrar estos ítems «parásitos» consiste en establecer unas curvas de ítems que mues- tren en abscisa las puntuaciones de todo el test y en ordenada el porcenta- je de éxito del ítem para cada categoría de puntuación global.

Los procedimientos de cálculo de la validez de constructo y de la validez de contenido corresponden a una concepción de la validez relacio- nada con la manera en que se ha desarrollado el método de evaluación, con la idea implícita de que la medida obtenida es válida si representa efectivamente lo que se desea medir. Esta manera de proceder implica la necesidad de conocer bien lo que hay que medir o describir para obtener una predicción precisa y exacta, lo que no siempre ocurre. Habrá enton- ces que considerar la validez bajo su aspecto predictivo y verificar empíri- camente que la predicción realizada se ha visto confirmada. Cuando me- dimos una aptitud, un rasgo de personalidad o unos conocimientos adquiridos, es porque tenemos la intención de inferir a partir de dicha medida el comportamiento de los individuos en una situación profesional determinada. Dicho con otras palabras, lo que nos interesa es la validez de la relación entre la evaluación y el comportamiento ulterior y no sólo la validez del test, aun cuando una sea condición de la otra.

La comparación entre pronóstico y realidad puede hacerse de diversas maneras, aun cuando en todos los casos el principio sigue siendo el de comparar con un criterio de éxito profesional el pronóstico formulado con el método que se pretende validar. Cuando la técnica a validar se aplica a personas empleadas de las que es posible obtener informaciones profesionales, se obtiene un índice de validez concurrente. Este procedi- miento tiene la ventaja de proporcionar resultados inmediatos, pero tiene algunos inconvenientes. Por un lado, la población sobre la que se ha reunido información no es representativa de lo que sería un eventual grupo de candidatos: en efecto, ya ha tenido lugar una criba previa en el momento de la selección y también luego, por las personas que abando- nan al no dar un nivel satisfactorio o no estar ellas mismas satisfechas. Por otro lado, los candidatos a un puesto, sometidos a pruebas de evalua- ción, se sienten desde luego más motivados que aquellos a quienes se les pide que se presten a realizar estas pruebas para una investigación a poste- riori. Finalmente, las diferencias detectadas entre los individuos pueden deberse a los conocimientos adquiridos con la experiencia profesional,

Page 69: Evaluacion Del Personal

CUALIDADES MÉTRICAS DE LOS MÉTODOS DE EVALUACIÓN 49

por lo que no se observarían tales diferencias en el caso de personas que no se hubieran beneficiado de esa experiencia previa.

La validez predictiva permite sortear algunos de estos inconvenientes, ya que prevé un intervalo de tiempo entre la recogida de informaciones predictivas y la recogida de informaciones criterio. Existen varias posibili- dades dentro de este esquema general según se contrate a todos cuantos han pasado la prueba a validar, o sean seleccionados basándose en algún sistema ya conocido, al azar o con ayuda del propio método que se pre- tende verificar, o incluso que se proceda a una validación a posteriori buscando en los dossiers de personas activas los resultados de pruebas pasadas con anterioridad. En realidad, y a pesar del valor teórico del procedimiento, que consiste en hacer pasar las técnicas de evaluación previamente y a título experimental, a fin de analizar luego los resultados en tiempo real, la validez predictiva no se puede poner en práctica más que en las grandes organizaciones, en las que se puede reclutar a todos los candidatos y asignarlos luego a puestos diferentes, y en situaciones como en el caso del ejército, donde las evaluaciones se refieren a toda una categoría de edad. En la mayoría de los casos, se suele rondar más bien el esquema en que sólo una parte de los candidatos es seleccionada o llevada a la situación para la que se hizo el pronóstico (formación, promoción...).

Resumiendo cuanto llevamos dicho, la viabilidad del proceso destina- do a establecer la validez predictiva es escasa. Suele ocurrir que por falta de una muestra homogénea suficientemente amplia, por falta de tiempo o incluso por no poderse obtener unos criterios fiables de éxito profesional, no es posible llevar a cabo satisfactoriamente esta comparación entre pre- dictor y criterio.

La validez predictiva tiene otro inconveniente; puede ocurrir que téc- nicas de evaluación válidas no aparezcan como tales cuando se someten al proceso de validez predictiva, y ello por dos tipos de razones, relaciona- das unas a la muestra de individuos sobre la que se ha calculado la vali- dez, y las otras al criterio del éxito profesional.

Si se ha reducido voluntariamente la muestra, ya sea porque no se ha mantenido a las personas de muy bajo nivel, o bien porque se ha promo- cionado a los mejores, la variable criterio tendrá escaso valor como clasifi- cador y la correlación predictor/criterio se verá muy disminuida. La po- blación se selecciona a veces al comienzo, por ejemplo, porque el reclutamiento sólo se dirige a personas que hayan alcanzado un determi- nado nivel de escolarización. En tal caso, se verá reducida la dispersión de puntuaciones en la prueba de evaluación, lo que dará como resultado que también disminuya el coeficiente que representa la correlación predictor/ criterio. También puede suceder que la prueba sólo sea válida para un determinado segmento de población. Por ejemplo, la evaluación del fun-

Page 70: Evaluacion Del Personal

50 EVALUACIÓN DEL PERSONAL

cionamiento cognitivo podrá predecir con eficacia el éxito profesional en un determinado puesto, pero sólo cuando se trate de personas que, sin formación previa para dicho puesto, deberán recibirla antes de comenzar a trabajar en él.

Las deficiencias del criterio también reducen artificialmente la validez predictiva. Si el criterio no posee fiabilidad suficiente, se estará comparan- do una variable fiable con una variable determinada por parámetros no controlados. Esto no es algo inverosímil: el éxito profesional, como recor- dábamos en la introducción, depende de factores no individuales, tales como la actitud de los mandos, el estilo de inserción empresarial, la cali- dad del material utilizado. Finalmente, el criterio es casi siempre un dato más complejo que cada una de las pruebas utilizadas como indicador; no hay que esperar, pues, obtener coeficientes de correlación muy elevados entre cada predictor y un criterio, sencillamente porque un predictor sólo puede explicar un segmento restringido de la varianza del criterio.

Estos inconvenientes justifican el interés que ofrecen dos prometedo- ras alternativas, que han sido objeto de recientes trabajos y de un debate teórico que aún permanece abierto: la validez sintética y la generalización de la validez.

La validez sintética es, en realidad, un concepto relativamente antiguo que ha vuelto a reclamar la atención, como atestigua el artículo de síntesis publicado por Mossholder y Arwey en 1984. Desde 1920, Link había sugerido, para describir con precisión las exigencias de un puesto de tra- bajo, que se aplicaran los tests a las personas que ocupaban esos puestos, que se calculara la media de los resultados obtenidos y que se tomaran esos datos como base para establecer un perfil de las aptitudes necesarias para el puesto en cuestión. Dicho con otras palabras, la validez sintética consiste en deducir la validez de los instrumentos de evaluación para un puesto determinado a partir «de un análisis lógico del puesto de trabajo en elementos, de la búsqueda de instrumentos válidos en relación con dichos elementos y de la combinación en un todo de cada validez aislada» (Balma, 1959). Se da una validez sintética siempre que se reconstituya la validez global a partir de la validez de pruebas aisladas, con relación a aspectos aislados del puesto de trabajo. Esto supone que:

1. Exista un parámetro psicológico único susceptible de describir cada aspecto relevante del puesto de trabajo.

2. Existan instrumentos que permitan medir esos parámetros. 3. Exista correspondencia entre la puntuación obtenida con estas

técnicas y el rendimiento en el trabajo. La principal ventaja de la validez sintética consiste en que se puede

aplicar a muestras pequeñas y, por tanto, se puede utilizar en empresas

Page 71: Evaluacion Del Personal

CUALIDADES MÉTRICAS DE LOS MÉTODOS DE EVALUACIÓN 51

pequeñas o para puestos con pocos titulares. Además, el método resulta económico en cuanto a tiempo y, una vez puesto en marcha, permite adaptar los programas de evaluación al cambio de contenido o de exigen- cias de los puestos de trabajo. No hay que insistir en la importancia de este último punto en una época en que la evolución de las actividades profesionales y de la tecnología avanza velozmente. Finalmente, los datos aportados por el procedimiento de validación sintética permiten analizar los procesos responsables del rendimiento laboral.

Me Cormick y cols, trataron de demostrar de forma original la solidez de las bases en que se asienta este método. Su estudio se fundó en un análisis sistemático, del trabajo, realizado mediante un cuestionario (el PAQ, Position Analysis Questionnaire), que contiene descripciones co- rrespondientes a los comportamientos laborales más diversos. Varios aná- lisis factoriales de ese cuestionario, fundados en el análisis de puestos o en perfiles de comportamiento, permitieron a Me Cormick y a su equipo aislar las dimensiones fundamentales de estas descripciones. Cuando dis- pongamos de los instrumentos que permitan predecir cada una de las componentes de esos puestos de trabajo, la utilización del PAQ debería constituir una base de partida suficiente para elaborar toda una serie de pruebas predictivas.

Con el fin de probar la solidez de su procedimiento, Me Cormick y sus colaboradores invirtieron el procedimiento clásico de validación. Los re- sultados obtenidos mediante el GATB (General Aptitude Test Battery) realizado por personas activas en diferentes puestos de trabajo fueron utilizados como variables a predecir, mientras que las dimensiones de su puesto, descritas mediante el PAQ, se consideraban como indicadores. El valor medio de las correlaciones obtenidas alcanza 0,63. Claro está que este método tiene el inconveniente de asimilar la permanencia en un puesto de trabajo con el éxito profesional, al suponer que los trabajadores tienden a permanecer en puestos compatibles con sus aptitudes �lo que no ha sido ni mucho menos demostrado. Pero no es menos cierto que la validez sintética representa, en el plano conceptual, un enfoque muy inte- resante que debería atraer la atención de cuantos se plantean problemas de decisión dentro de un contexto tecnológico cambiante, en el que los puestos evolucionan con rapidez y en el que aparecen con frecuencia nuevas funciones. No obstante, quedan muchos problemas técnicos por resolver si realmente queremos utilizar este modelo de validación, sobre todo en lo que respecta a los instrumentos de análisis del trabajo y a las pruebas que presentan validez con relación a los elementos de las tareas analizadas. El hecho de que todas las investigaciones que han empleado la validez sintética hayan sido llevadas a cabo en Estados Unidos, dentro de grandes organizaciones que son propietarias de las técnicas y que sólo han

Page 72: Evaluacion Del Personal

52 EVALUACIÓN DEL PERSONAL

permitido publicar una descripción general de los procedimientos y de los resultados, abre un camino a seguir, sin que dispongamos de los instru- mentos necesarios.*

La validez sintética representa, pues, una posible solución a los proble- mas de viabilidad que hacen que el proceso de validez predictiva sea difícil de aplicar. El «meta-análisis» y la noción de generalización de la validez permiten abordar este problema de modo diferente, ya que se trata de una técnica que corrige los errores metodológicos fruto de las insuficiencias del criterio y de la muestra.

Se han venido haciendo esfuerzos de síntesis desde hace tiempo para tratar de aislar alguna validez media con respecto a un método de evalua- ción o a un puesto de trabajo determinado. Los resultados han sido siem- pre desalentadores. Así, Ghiselli (1966, 1973) y Dunnette (1972) mostra- ron que las medias de los coeficientes de validez son débiles y que la variabilidad de los resultados es, en cambio, bastante elevada. Efectiva- mente, Ghiselli señalaba ya en 1959 que «las medias de los coeficientes de validez están falseadas por la variabilidad de los tests y de los criterios... por el hecho de que la varianza de las aptitudes varía a su vez en grupos laborales diferentes..., lo que implica errores que hacen subestimar los coeficientes de validez». Schmidt y Hunter dieron un paso más en ese mismo sentido al desarrollar un procedimiento que permite tener en cuenta errores en el cálculo de la validez predictiva. Partieron de un análi- sis sistemático de errores vinculados a cuatro puntos.

1. El tamaño de la muestra: las correlaciones se suelen calcular sobre muestras de 40 a 60 individuos, lo que las hace muy inestables, como demostraron Schmidt y otros (1985) con 63 «seudomuestras» de 68 indi- viduos, extraída cada una al azar de una población de 1.456 empleados de correos.

2. La fiabilidad del criterio: en general, los estudios de validación se preocupan de la fiabilidad del predictor, pero descuidan la fiabilidad del criterio, cuando sabemos que las calificaciones profesionales tienen una fiabilidad media del orden de 0,60.

3. La reducida varianza de la muestra disponible, tanto desde el punto de vista de los métodos que se comprueban como desde el punto de vista del criterio profesional.

4. La fiabilidad de los métodos de predicción, que varía igualmente de una investigación a otra.

* N. del T. En España tales técnicas e instrumentos están disponibles desde luego hace mucho tiempo a través de entidades como TEA Y MEPSA, que cuentan con oficinas en casi todas las Comunidades Autónomas.

Page 73: Evaluacion Del Personal

CUALIDADES MÉTRICAS DE LOS MÉTODOS DE EVALUACIÓN 53

Estas cuatro fuentes de inexactitud aumentan la varianza de error de los coeficientes de validez. Si consideramos una serie de investigaciones de validación predictor/criterio para las que las cuatro fuentes de inexacti- tud antes descritas se presentan en grados diversos, es posible que esto explique la variabilidad observada de los coeficientes de correlación que representan la validez, mientras que, en condiciones ideales, el coeficiente de correlación sería siempre el mismo.

El proceso de generalización de la validez consiste en estimar la va- rianza de los coeficientes de correlación que cabe atribuir a las cuatro fuentes de error antes mencionadas. Tras la corrección, la varianza resi- dual de los coeficientes de correlación observados en gran número de estudios corresponde a la varianza que se observaría si el número de individuos fuera elevado y si la fiabilidad del criterio, la fiabilidad del predictor y la varianza fueran en todo momento equivalentes a la media de las fiabilidades y las varianzas reales.

Si la varianza residual resulta nula, ello significaría que no hay varia- ción de la validez a través de los estudios de los que se hace balance. Los coeficientes de validez varían sólo en apariencia y porque las condiciones experimentales son imperfectas.

Este procedimiento permite asimismo obtener una validez media corregida. Los primeros trabajos de Schmidt y Hunter versaron precisa- mente sobre los datos presentados por Ghiselli. Demostraron que, tras una corrección, la validez «verdadera» es dos veces más elevada que las validez observada (Schmidt y Hunter, 1977).

De todos modos, la varianza residual, tras la corrección, no siempre es nula. Schmidt y Hunter atribuyen este hecho a la existencia de tres fuen- tes de inexactitud que es imposible calibrar: la contaminación del criterio (es decir, el hecho de que las personas que elaboran los criterios de éxito profesional conozcan las puntuaciones que los individuos han obtenido con los predictores), los errores materiales de cálculo o transcripción de datos, las diferencias de contenido entre los predictores, aun cuando estos midan las mismas variables. Esto plantea un problema previo: ¿cuándo es la varianza residual lo bastante débil como para que se pueda considerar la validez como generalizable? Schmidt y Hunter propusieron la regla del 75 %. Si las cuatro fuentes de inexactitud tenidas en cuenta explican el 75 % de la varianza observada de los coeficientes de validez, se puede admitir que las tres fuentes de inexactitud que no son tenidas en cuenta explican el 25 % restante. Esto significa que la validez es generalizable cuando el error sobre la varianza es igual a por lo menos el 75 % de la varianza observada de las valideces.

Schmidt y Hunter y otros psicólogos han efectuado síntesis sobre estu- dios de validación predictor/criterio para familias de ocupaciones (traba-

Page 74: Evaluacion Del Personal

54 EVALUACIÓN DEL PERSONAL

jos de oficina, ocupaciones del ejército, técnicos, programadores) y tam- bién para categorías de tests definidos por su contenido (Schmidt y Hunter, 1978; Trattner, 1985; Hunter y Hunter, 1984).

Teoría, método y aplicación del proceso propuesto por Schmidt y Hunter han sido objeto de diversas críticas. Se les ha reprochado, sobre todo, que se apoyaran en estimaciones frágiles de la no-fiabilidad y de la restricción de dispersión de la muestra. Pero el argumento no parece sos- tenerse. En efecto, Hitsch (1984) calculó el error sobre la varianza de los coeficientes de validez en el caso de una serie de estudios en los que los documentos eran muy completos, mostrando que esas fuentes de inexac- titud explicaban efectivamente el 79 % de la varianza. Desde otro punto de vista, Algera (1985) critica las clasificaciones de ocupaciones como arbitrarias, y ello a pesar de las precauciones adoptadas por los autores americanos que se basaron en el inventario oficial de ocupaciones. Final- mente, se ha subrayado el hecho de que la validez de un predictor siempre está limitada por su fiabilidad, que nunca es perfecta, y que, por tanto, no tiene justificación hablar de validez «real», la cual se obtendría si la fiabi- lidad fuera perfecta. Eso es cierto, pero no es eso exactamente lo que supone el proceso de generalización de la validez, que no hace más que explicar la disparidad observada entre coeficientes de correlación por la desigual fiabilidad de predictores y criterios.

Por lo demás, el esfuerzo de síntesis sistemática y racional propuesto por Schmidt y Hunter posee el mérito de haber hecho evolucionar las actitudes y prácticas de los psicólogos especialistas en evaluación. Ha lla- mado la atención de quienes se ven obligados a realizar un estudio de validación predictor/criterio sobre la importancia del tamaño de la mues- tra, y la de quienes publican esos resultados sobre la necesidad de dar informaciones completas y precisas sobre la fiabilidad de los predictores y de los criterios y sobre la representatividad de las muestras.

Los resultados que aporta el procedimiento de generalización de la validez permiten asimismo hacer avanzar la reflexión teórica e integrar los datos procedentes de la validez predictor/criterio con los aportados por la validez de contenido. Uno de los peligros de las investigaciones sobre la evaluación de adultos en el mundo laboral consiste en que tales investigaciones estén fuertemente dominadas por un afán de eficacia. Desde el punto de vista práctico, lo importante no es lo que se mide o lo que se describe, sino la calidad de la predicción de un criterio de éxito profesional estrechamente vinculado a los objetivos de la organización. Por eso mismo, muchas veces sólo se buscan métodos de evaluación que «funcionen», sin preocuparse demasiado por saber lo que miden, ni si lo hacen de manera eficaz.

La nueva vía abierta por la investigación de la validez generalizable

Page 75: Evaluacion Del Personal

CUALIDADES MÉTRICAS DE LOS MÉTODOS DE EVALUACIÓN 55

vuelve a plantear el problema. El objetivo es, sin duda, extraer el carácter general, con relación a un conjunto de puestos o empleos, de las cualida- des de un predictor. Pero al hacer esto, nos vemos impelidos, como he- mos visto en el capítulo primero, a profundizar en los métodos de análisis del trabajo para tratar de crear unas familias de ocupaciones, y también a reunir informaciones lo bastante coherentes y completas como para poder saber no sólo si los predictores «funcionan», sino también por qué funcio- nan. Y es justamente eso lo que permite justificar seguidamente el agru- pamiento de profesiones que ha sido objeto de una generalización de la validez.

Más adelante veremos, por ejemplo, que Hunter y Hunter (1984) mostraron que la validez de las pruebas de funcionamiento cognitivo está en función de la complejidad de las tareas y puestos en cuestión. Por una parte, parece que los tests cognitivos son validos para todos los oficios, cualesquiera que sean. Por otra parte, su validez aumenta con la compleji- dad de la tarea, mientras que la validez de las pruebas psicomotrices disminuye con la complejidad de la tarea. La confirmación de estos resul- tados, su aplicabilidad a otros países que no sean los Estados Unidos, sobre todo desde el punto de vista de la formación técnica y de la selec- ción en el sistema escolar, son evidentemente del mayor interés.

Existen otros problemas teóricos muy interesantes que conciernen a las variables intermedias entre predictores y criterios, sobre todo el papel desempeñado por los conocimientos adquiridos y la experiencia en la tarea. Por ejemplo, ¿en qué medida la validez general de las pruebas cog- nitivas se explica por la utilización directa de las capacidades cognitivas en el ejercicio de la tarea o por el hecho de que faciliten la adquisición sistemática de conocimientos adquiridos mediante la experiencia en el trabajo?

Así pues, se pueden elegir y utilizar métodos de evaluación de una manera racional, y ello recurriendo a procedimientos diferentes, adapta- dos a las características de la situación. En algunos casos, se puede realizar una validación predictor/criterio; en otros casos, será preferible recurrir solamente a la validez de contenido, o incluso al análisis del trabajo, junto a una síntesis de los estudios de validación realizados ulteriormente. No es de recibo, por razones deontológicas y por razones de eficacia, resignar- se a unos métodos de evaluación cuyas cualidades métricas y significación se desconozcan.

Page 76: Evaluacion Del Personal

56 EVALUACIÓN DEL PERSONAL

EN RESUMEN

Sólo se debe utilizar un método de valoración si se cumplen las siguientes condiciones:

� Que aporte informaciones, es decir, que sea discriminatorio para el grupo estudiado o el grupo profesional al que pertenezca la persona examinada. � Que abarque un campo claramente definido de conocimientos o aptitudes, o incluso que corresponda a un concepto psicológico definido por un modelo teórico claro y fundado. � Que sea fiel, es decir, que proporcione informaciones coherentes y constantes. � Que sea válido, es decir, que las informaciones que aporte sean pertinentes, en el sentido de que se correspondan con lo que se pretende medir y que esa relación quede objetivamente demostrada.

ANEXO

Fórmula de Spearman-Brown. Objetivo: estimar la Habilidad en función de la longitud de un test.

Siendo: r = la Habilidad observada, rn = la fíabilidad estimada. n = la ratio entre la longitud real del test y la longitud del nuevo test

para el cual se calcula la estimación.

Fórmula KR de Kuder-Richardson y alpha de Cronbach. Objetivo: medir la coherencia interna de un test.

Page 77: Evaluacion Del Personal

Siendo: n = el número de ítems del test. Vx = varianza del test completo. ΣVi = la suma de las varianzas de los ítems. p = proporción de quienes pasan el ítem. q = 1- p Σpq= la suma p x q.

Cuando las preguntas del test sólo prevean dos respuestas posibles (si/no) o incluso cuando se trate de cuestiones cuyas respuestas se regis- tren en términos de verdadero o falso, la varianza de cada ítem es igual a pq, siendo p el porcentaje de respuestas válidas y q = 1 � p.

Método para calcular los centiles (haremos normativos)

� Hacer un cuadro de las puntuaciones en el test y del número de individuos que obtiene cada puntuación (frecuencia).

� Calcular las frecuencias acumuladas. � Los centiles están constituidos por la proporción de individuos que

obtienen una puntuación inferior a otra dada. Como toda puntuación es discreta, hay que determinar las frecuencias acumuladas en el punto me- dio, añadiendo a cada frecuencia acumulada la mitad de la frecuencia correspondiente a la puntuación siguiente: se obtiene así la frecuen- cia acumulada corregida.

� Dividir las frecuencias acumuladas corregidas por el número total de individuos y redondear los resultados para obtener los centiles.

CUALIDADES MÉTRICAS DE LOS MÉTODOS DE EVALUACIÓN 57

Page 78: Evaluacion Del Personal
Page 79: Evaluacion Del Personal

4

La toma de decisiones y evaluación de su utilidad

No basta con elegir correctamente los métodos de evaluación adecua- dos y válidos. Hay que saber además cómo utilizar las informaciones que proporcionan para adoptar una decisión. ¿Cómo se pasa de la recogida de informaciones pertinentes a la toma de decisión? Ese es el primer proble- ma que trataremos en este capítulo. ¿Cómo evaluar la calidad y la utilidad de las decisiones adoptadas, teniendo en cuenta todos los parámetros de la situación? ¿Es posible evaluar los métodos de evaluación, incluso compa- rar su coste y su valor para los individuos y para la organización? Ese es el segundo problema que trataremos en el presente capítulo. Dicho en otras palabras, trataremos de mostrar cómo pasar de las informaciones a las decisiones y de las decisiones al examen de su utilidad.

LA TOMA DE DECISIONES

Cualesquiera que sean los métodos seguidos para evaluar a los candi- datos, y ya se trate de una selección, de una promoción o de una forma- ción profesional, son varias las informaciones que tienen que servir de base para adoptar una decisión. Existen varias maneras de reunir esas informaciones, conocidas unas bajo el nombre de síntesis clínica, otras recurriendo a un método psicométrico La síntesis clínica implica que un experto tenga conocimiento del conjunto del dossier y saque su conclu- sión personal. En cambio, el método psicométricio se basa en una formu- lación matemática destinada a tener en cuenta de la manera más eficaz posible los diferentes elementos de la decisión. El debate sobre el valor respectivo de cada uno de estos métodos ha tenido muy ocupados a los psicólogos industriales desde los años sesenta, sin que sirvieran, por lo demás, para modificar lo que es práctica común y cotidiana en los servi- cios de personal. En efecto, parece algo establecido que los métodos psico-

59

Page 80: Evaluacion Del Personal

métricos son más precisos y facilitan unas decisiones más coherentes en- tre sí, mientras que la síntesis clínica es evidentemente algo más subjetivo. Lo cual no quita que, en la mayoría de los casos, sea este último proceso de toma de decisiones el que se emplea. Para colmo, en los raros casos en que los servicios de personal y gabinetes consultivos recurren a un cálculo preciso para llevar a cabo la integración de datos, éste no suele reposar sobre bases tan sólidas y claras como sería de desear. Esto es una pena ya que hay que conocer bien las diferentes alternativas, sus ventajas e incon- venientes, si no quiere uno exponerse a utilizar mal o insuficientemente informaciones de calidad.

La síntesis clínica puede ser realizada por un solo experto o ser resulta- do de una discusión entre varias personas que tuvieron la posibilidad de interrogar al candidato o candidatos. Permite integrar en la decisión in- formaciones numéricas, puntuaciones en el test, por ejemplo, junto con datos cualitativos, impresiones sacadas de la entrevista, cartas de referen- cias, etc. Nada impide, además, realizar la síntesis clínica de informacio- nes que abarquen datos cualitativos y evaluaciones numéricas e integra- das para formar una sola puntuación global, incluso una predicción de éxito formulada en forma de porcentaje de posibilidades de éxito.

La síntesis clínica en sus diferentes formas es la manera más frecuente de actuar. Hay dos razones que explican posiblemente su empleo. Ante todo, da la imagen de ser un proceso humanizado, frente a la idea de una decisión basada en un simple cálculo, lo cual remitiría un poco a la nada feliz imagen de personas manipuladas mediante ordenador. Además, la síntesis subjetiva se basa en la experiencia y la intuición: por tanto, no tiene necesidad de justificarse de manera rigurosa. En cambio, el hecho de atribuir ponderaciones precisas a las diferentes puntuaciones y evaluacio- nes obtenidas por los candidatos incita a los descontentos con la decisión a rehacer los cálculos con ponderaciones diferentes y a rechazar así las bases de las decisiones que les afectan.

Existen varios métodos psicométricos, desde el más sencillo al más complejo. El más sencillo consiste en sumar todas las notas obtenidas, habiendo tomado la precaución de darles una misma escala. Ello equivale a otorgar el mismo valor a todas las pruebas, es decir, a todos los aspectos que se tienen en cuenta para llevar a cabo la evaluación. Si existiera alguna razón para pensar que unas cualidades son más importantes que otras, se puede optar por darles un valor mayor, multiplicando algunas puntuaciones por un coeficiente, como suele ocurrir en los exámenes universitarios. Cuando se tienen indicaciones claras sobre la validez de las diversas pruebas que dan origen a puntuaciones transformadas, por ejem- plo, cuando se conocen las correlaciones entre puntuaciones en el test y cifras de producción, se pueden calcular esas ponderaciones de forma más

60 EVALUACIÓN DEL PERSONAL

Page 81: Evaluacion Del Personal

LA TOMA DE DECISIONES Y EVALUACIÓN DE SU UTILIDAD 61

rigurosa. Es preciso entonces proceder a un cálculo de regresión múltiple, lo que permitirá obtener estadísticamente la combinación óptima de pon- deraciones para predecir los resultados profesionales.

La ventaja de este cálculo se debe al hecho de que tiene en cuenta no sólo las relaciones entre cada uno de los predictores y el criterio, sino también las eventuales interrelaciones de los predictores entre sí, permi- tiendo, en tal caso, maximizar la capacidad predictiva con relación al criterio, minimizando la relación entre predictores. Pero la regresión múltiple tiene también un gran inconveniente: supone que las deficien- cias individuales en algún determinado aspecto pueden compensarse con las cualidades en otro. Para ilustrar este punto, reproducimos a continua- ción las puntuaciones de tres personas ficticias en tres tests, uno de apti- tud verbal (X), otro de comprensión mecánica (Y) y otro de inteligencia (Z). La regresión múltiple atribuye un coeficiente de 2 al test X, de 3 al test Y y de 5 al test Z.

PUNTUACIÓN TOTAL

La puntuación final, obtenida tras ponderación, es prácticamente la misma para las tres personas, pero podemos observar que la baja puntua- ción de Andrés en aptitud verbal se ve compensada por su éxito en com- prensión mecánica, así como la baja puntuación de Santiago en compren- sión mecánica se ve compensada por la puntuación media de los otros dos tests. Ahora bien, podría ocurrir que en el puesto para el que se está haciendo la selección fueran necesarios un nivel mínimo de aptitud verbal y de comprensión mecánica. Habrá entonces que comenzar el examen de puntuaciones buscando todos aquellos que no han obtenido el nivel míni- mo que se juzga necesario, y ello en cada una de las aptitudes o caracterís- ticas en cuestión: este método, que puede utilizarse como una primera fase antes de tomar en consideración la suma de las puntuaciones, se conoce con el nombre de umbrales múltiples.

En definitiva, podríamos resumir diciendo que existen varias maneras de pasar de la recogida de información sobre los individuos a la toma de decisiones que les afecten, y que no existe una manera de proceder que se imponga sistemáticamente en todos los casos. Entran en consideración, sobre todo, el tipo de decisión a adoptar, el número de personas examina-

Page 82: Evaluacion Del Personal

62 EVALUACIÓN DEL PERSONAL

das y el número de puestos a cubrir, así como el nivel del empleo o em- pleos. Conviene además recordar que las decisiones que afectan a los pro- blemas de personal se suelen adoptar de una manera secuencial. Por ejemplo, la incorporación va seguida de una orientación hacia una forma- ción específica, que se sigue a su vez de una decisión sobre el destino final. O bien, una primera serie de informaciones respecto a las características esenciales, competencia, edad, experiencia, aptitudes fundamentales, por ejemplo, se utiliza con umbrales múltiples para efectuar una primera criba, que irá seguida de una recogida de informaciones más profundas y normal- mente más costosas de obtener. Evidentemente, todas las etapas son impor- tantes y si en la primera criba se rechaza a los mejores candidatos, las etapas de evaluación ulterior no podrán compensar ese error de partida.

Para llegar, pues, a unas decisiones de buena calidad, hay que utilizar bien técnicas fiables y válidas. En realidad, el problema del responsable de personal no es calcular coeficientes de correlación, sino incorporar y pro- mover a personas que cumplan las exigencias de los puestos a cubrir, es decir, eliminar las malas opciones y no rechazar las buenas. Dicho con otras palabras, tiene que reducir al mínimo los «falsos positivos» (errores de selección, de destino o de orientación) y los «falsos negativos» (rechazo de candidatos que habrían sido un acierto). Se encuentra, pues, frente a una situación en la que puede evaluar el coste de la recogida y tratamien- to de las informaciones que permiten o permitirían evitar eso �y, por tanto, calcular la utilidad de los diversos métodos para reunir informa- ción, tratarla y adoptar una decisión.

Reflexionar sobre los aspectos económicos de la evaluación es algo tan necesario como estudiar la rentabilidad de cualquier otra inversión. Pero aquí se añade un aspecto humano básico que no se puede traducir en cifras: ya hemos insistido en varias ocasiones sobre la idea de que una evaluación bien realizada hace un servicio al agente o empleado evaluado, evitando que se le confíen responsabilidades que pudieran abocarle a una situación de fracaso, o, al contrario, haciendo aflorar un potencial desa- provechado que él mismo ignoraba. Preocuparse por la utilidad financie- ra de la evaluación en la empresa no dispensa de cuidar su calidad huma- na: cualquier decisión ha de comunicarse al interesado en el curso de una entrevista en la que pueda hacer preguntas y solicitar cuantas explicacio- nes desee recibir. Ninguna evaluación ha de hacerse sin que los interesa- dos se puedan informar, si así lo desean, sobre las decisiones que están en juego, así como sobre los estudios que justifican la elección de las técnicas utilizadas. De hecho, la experiencia demuestra que todo el mundo quiere información sobre sí y desea sacar partido a la presencia de un interlocu- tor competente y discreto con el que poder discutir sus problemas profe- sionales y laborales.

Page 83: Evaluacion Del Personal

LA TOMA DE DECISIONES Y EVALUACIÓN DE SU UTILIDAD 63

Ahora bien, esta utilidad humana de la evaluación, por primordial que sea, no quita el que haya que reflexionar sobre su utilidad financiera. Ya hemos visto hasta qué punto la elaboración y la validación de técnicas de evaluación pueden ser procesos largos y costosos; también hemos visto que la elaboración de estas técnicas se ha ralentizado en Francia, hasta el punto de que métodos poco válidos aventajan a las técnicas más fundadas y exigentes. ¿Cómo se puede evaluar la evaluación, calcular su utilidad financiera, incluso comparar, en este sentido, diferentes métodos de eva- luación?

UTILIDAD DE LOS MÉTODOS DE EVALUACIÓN

Cualquier decisión supone un coste (el precio pagado para reunir la información y sintetizarla). Cualquier decisión supone también una utili- dad, caracterizada por el ulterior balance de los efectos de la decisión o decisiones adoptadas. Las decisiones relativas al personal pueden adoptar- se utilizando diversos métodos. Comparar la utilidad de estos métodos supone un proceso básico para decidir su utilización. Este proceso supone que se cumplan varias condiciones. Ante todo, hay que poder comparar diferentes métodos o diferentes procesos que sirvan de base a la decisión, y ello aun cuando se compare con el método actual una simulación que hubiera consistido en sacar los nombres al azar. Es preciso igualmente que se cuente con datos precisos sobre cada método (validez, número de personas afectadas, coste). Es preciso, en fin, elaborar datos respecto a la importancia que tiene para la organización la calidad de las decisiones, importancia traducida, a poder ser, en términos financieros. En otras palabras, el análisis de la utilidad de un método de evaluación no se limita a estimar la validez de dicho método, representada por la correlación entre un «predictor» y un «criterio». Claro está que si el método no tiene validez alguna, es inútil. Pero lo contrario no siempre es verdad: el hecho de ser válido no lo hace forzosamente útil, ya que existen, para determi- nar su utilidad, otros factores que describiremos seguidamente.

El análisis de la utilidad puede efectuarse siempre que la organización haya de adoptar decisiones de selección: selección de candidatos a incor- porar, decisión de destinar algunos miembros del personal a un ciclo de formación o de promoción. Este tipo de análisis tiene un evidente interés en caso de que las decisiones afecten a un gran número de personas, cuando resulten costosas y siempre que puedan volver a repetirse.

El método más sencillo (aunque no el más realista) para calcular la utilidad consiste en hacer pasar el examen de evaluación cuya utilidad se desea conocer, sin servirse de los resultados, a la espera de poder obtener

Page 84: Evaluacion Del Personal

64 EVALUACIÓN DEL PERSONAL

datos sobre el trabajo de los recién incorporados y en diseñar un cuadro de doble entrada que ponga en relación el predictor y el criterio. Un ejemplo de esto es el que damos en la figura IV-1, que representa la posi- ción de un grupo de individuos en lo que respecta al predictor (tests pasados en la selección, por ejemplo) y el criterio (unidades de produc- ción, por ejemplo). En la figura, una línea vertical marca la frontera entre quienes habrían sido rechazados y los admitidos, si se hubiera utilizado el predictor. Una línea horizontal indica el límite que distingue a las perso- nas cuyo trabajo se ha estimado posteriormente satisfactorio y las demás. Simplemente descontando quienes se hallan por debajo de la barra crite- rio, obtendremos la precisión de la selección sin utilizar el predictor. En la figura IV-1 es de un 53 %. Podemos descontar a continuación a aquellos que habrían sido aceptados si se hubiera utilizado el predictor, y de este número de aceptados, el número de selecciones satisfactorias. En el ejem- plo de la figura IV-1, la tasa de selección acertada es de un 70%. La utilidad del predictor resulta así fácil de cifrar: el porcentaje de «buenas» incorporaciones ha pasado de un 53 % (sin predictor) a un 70 % (con pre- dictor).

Figura IV-1. Comparación entre predictor y criterio.

Page 85: Evaluacion Del Personal

LA TOMA DE DECISIONES Y EVALUACIÓN DE SU UTILIDAD 65

El mismo tipo de cuadro puede hacerse, naturalmente, para otras de- cisiones. Si, por ejemplo, el problema planteado se refiere al ingreso en un ciclo de formación y si el criterio está constituido por el éxito en el exa- men de clausura de esa formación, se podrá comparar, por ejemplo, la tasa de fracaso cuando la decisión se adopta según el parecer del jefe de servicio con la tasa de fracaso cuando la decisión supone una síntesis del parecer de los mandos y de las notas obtenidas en una serie de tests. Además, al conocerse el coste de la formación, será posible cifrar el bene- ficio eventualmente asociado a una mejor selección y compararlo con el coste del examen que utiliza la batería de tests. Evidentemente, sólo se tratará en ese caso de un beneficio financiero. El beneficio resultante de los fracasos evitados y de tener en cuenta sus efectos psicológicos y la desmotivación de los individuos no puede ser objeto de una estimación precisa, pero no por eso se puede menospreciar.

Esta labor resulta enojosa y difícil de llevar a la práctica. Para calcular la utilidad de una decisión, se puede reemplazar el cuadro representado en la figura IV-1 por el coeficiente de correlación entre el predictor y el criterio. En realidad, el problema es otro: se refiere a las condiciones en las que se ha realizado la evaluación, condiciones que determinan la utili- dad de los métodos empleados. Para precisar lo que queremos decir con ello, pongamos otro ejemplo. En la figura IV-2, para simplificar la lectura,

Figura IV-2. Validez del predictor y tasa de rechazo.

Page 86: Evaluacion Del Personal

66 EVALUACIÓN DEL PERSONAL

no hemos representado ya a cada persona por un punto correspondiente a su posición en el eje de abcisas (indicador) y en el eje de ordenadas (crite- rio), conformándonos con esbozar los contornos de la nube de puntos. Supongamos que la validez del predictor (representada por un coeficiente de correlación con el criterio) es de 0,50. Supongamos también que la tasa de éxito en el empleo es de 50 %, es decir, que cuando no se utiliza el predictor cuya utilidad queremos calcular, una decisión de cada dos resul- ta errónea. Es evidente que al optar por rechazar a los candidatos cuya puntuación en el indicador sea inferior a Xa, se disminuye la tasa de decisiones erróneas. Pero el examen de la figura muestra asimismo que la elección del umbral es importante: si se es más exigente y el umbral de rechazo está en Xb, no se producirá ninguna decisión errónea. Además de esto, si la tasa de éxito en el empleo, sin utilizar un método de evaluación, es muy baja (Yb en la figura IV-3, que corresponde a un 20 % de éxito solamente), el número de «falsos positivos» aumenta y el número de «falsos negativos» disminuye para un mismo umbral Xa, y ello sin que la validez del método de evaluación sea puesta en tela de juicio.

La utilidad de un método de evaluación está, pues, en función de tres parámetros.

Figura IV-3. Validez del predictor y tasa de éxito en el puesto.

Page 87: Evaluacion Del Personal

LA TOMA DE DECISIONES Y EVALUACIÓN DE SU UTILIDAD 67

1. La validez del método, traducida por lo general en un coeficiente de correlación. La utilidad es nula si la validez es nula. Pero hay métodos de validez relativamente baja que pueden ser útiles, teniendo en cuenta los otros dos parámetros.

2. El porcentaje de decisiones correctas adoptadas sin la utilización del método de evaluación o incluso la tasa de «éxito» o de «buen» rendi- miento. ¿Qué quiere decir esto en concreto? Si todos los candidatos no seleccionados son en general satisfactorios, si todas las decisiones se han adoptado ya de manera correcta o incluso si no hay mayor diferencia entre el obrero mejor y el peor, un método de evaluación, aun cuando sea válido, será de escasa utilidad. Y al contrario, será muy apreciado si exis- ten fuertes diferencias entre las personas empleadas y si la ausencia de una selección previa se tradujera en una fuerte tasa de fracaso o en un rendi- miento insuficiente.

3. El número de personas a aceptar con relación al número de candi- datos. Por ejemplo, cuando se examinan 1.000 candidaturas para desig- nar a los tres elegidos que formarán parte del próximo vuelo espacial, el método de selección (de validez equivalente) es más útil que cuando hay que aceptar a un 90 % de candidatos que se presenten a un puesto de ingeniero informático. Incluso métodos con validez inferior a 0,20 pue- den servir cuando la tasa de selección es inferior al 10 %.

Concretamente, esto significa que la utilidad de un método de evalua- ción será mayor si la organización dispone para cualquier puesto a cubrir de un elevado número de candidatos, y que será menor si todos los candi- datos son de gran calidad.

El análisis precedente muestra que el coeficiente de correlación por sí solo no es indicador suficiente de la utilidad de un método de evaluación. Quienes poseen conocimientos de estadística suelen confundir la utilidad de un método caracterizado por una correlación predictor-criterio r con el coeficiente de determinación r2 que indica el porcentaje de la varianza del criterio explicado por el predictor. La utilidad está evidentemente en fun- ción de r, pero corresponde a la mejora de los valores del criterio (canti- dad o calidad de la producción, por ejemplo) para el conjunto de la pobla- ción considerada, tal como se representa en la figura IV-4, y no la capacidad del predictor para anunciar por adelantado una clasificación entre sí de los seleccionados «buenos». La confusión procede de los para- digmas experimentales, en los que el investigador trata de explicar con precisión las variaciones individuales. No sucede esto con las decisiones en materia de personal: la utilidad de un método sólo debe reflejar su capacidad de adoptar un máximo de decisiones acertadas.

El método de cálculo que acabamos de describir es evidentemente útil cuando se duda entre adoptar o modificar un sistema de toma de decisio-

Page 88: Evaluacion Del Personal

Figura IV-4. Mejora de los valores del criterio. Distribución de los resultados profesionales de dos grupos con puntuaciones diferentes en los tests.

nes. Aparte de esto, existen desde hace tiempo tablas que permiten leer directamente el porcentaje de decisiones acertadas en función de la vali- dez del predictor, de la tasa de selección y de la tasa de éxito sin interven- ción del predictor. Estas tablas muestran de qué modo se ve afectada la calidad de la decisión cuando se desplaza el umbral de rechazo (X en la fig. IV-2) o cuando varía la tasa de éxito (Y en la fig. IV-3). Tienen la ventaja, con relación a la enumeración detallada de decisiones correctas y erróneas antes descrita, que no necesitan tener en cuenta «falsos negati- vos» sobre los que en general no se posee información, ya que se les ha rechazado. Permiten, pues, calcular la utilidad sin recurrir a experiencias gratuitas, «sólo por ver», en el momento que se conoce la validez predic- tor-criterio.

Se puede afinar más. Esta manera de proceder, lo mismo que el cálcu- lo directo, presenta algunos inconvenientes. Ante todo, el pretender hacer la dicotomía en un grupo de obreros, de empleados o incluso de mandos, separando a los «buenos» de los «malos», suele ser una simplificación exagerada de la realidad. Productividad o calidad se presentan más bien como variables continuas y resulta difícil trazar una frontera estricta entre las decisiones «correctas» y las «erróneas».

Naylor y Shine (1965) pusieron remedio a esta dificultad, elaborando unas tablas que dan el aumento de rendimiento en función de la validez del predictor, de la tasa de selección y de la varianza del rendimiento representada por la relación entre la producción del mejor y del peor empleado. Ghiselli y Brown simplificaron más aún la utilización de esas tablas, presentándolas en forma de diagrama (que se reproduce en la fig. IV-5). Para utilizar este diagrama, hay que situar la tasa de selección

68 EVALUACIÓN DEL PERSONAL

Page 89: Evaluacion Del Personal

LA TOMA DE DECISIONES Y EVALUACIÓN DE SU UTILIDAD 69

Figura IV-5. Diagrama de Ghiselli y Brown (1).

(1) Fuente: E. E. Ghiselli y C. W. Brown: Personnel and Industrial Psychology, MacGraw Hill, 1955.

Pie de texto: Ratio of best to poorest worker - relación de productividad entre el

mejor y el peor empleado. Percent selected = tasa de selección. Percent improvement in proficiency = Mejora de la producción en por-

centaje. Validity = validez. Cómo utilizar este diagrama: localizar la tasa de selección en el eje

horizontal y proyectar dicho valor sobre la curva correspondiente al coefi- ciente de correlación que representa la validez. Proyectar sobre la escala vertical que indica la relación de productividad. En el diagrama se pone un ejemplo. Corresponde a una validez de 0,60, una tasa de selección de 30 % y una relación de productividad de 4/1.

Page 90: Evaluacion Del Personal

70 EVALUACIÓN DEL PERSONAL

(número de personas a admitir en relación con el número total de candi- datos) en el eje horizontal, proyectar el punto obtenido, esta vez horizon- talmente, sobre el eje que indica la relación entre el rendimiento del me- jor y el del peor.

Por desgracia, no siempre es posible medir objetivamente la produc- ción en términos de número de piezas fabricadas o duración de las opera- ciones, y suele resultar imposible caracterizar objetivamente el valor para la organización de un miembro del personal. El problema de la traduc- ción a términos financieros del beneficio que se espera de una decisión acertada respecto al personal fue abordado por Brogden en 1946, luego por Cronbach y Gleser (1965), Schmidt, Hunter y Pearlman (1982) y más recientemente por Boudreau (1989), desde perspectivas diferentes.

Brogden propone calcular el beneficio unido a la utilidad de un proce- dimiento de evaluación, teniendo en cuenta los cuatro valores siguientes:

r = validez representada por el coeficiente de correlación predictor/ criterio.

Y = desviación típica de la productividad del personal. Z = nivel medio de los candidatos seleccionados, traducido en pun-

tuaciones típicas en el predictor. C = coste del examen de evaluación por candidato. P = porcentaje de personas admitidas, promovidas o seleccionadas

con relación al número de candidatos examinados. Lo que se traduce en la siguiente fórmula, que representa la utilidad

del indicador. C

beneficio = (r.y.z.) � P

Esta fórmula sólo ha despertado durante algún tiempo un interés pu- ramente académico, sin que se siguieran aplicaciones prácticas. Efectiva- mente, permite a lo sumo plantear cuestiones de este tipo: ¿resulta razo- nable gastar 1.200.000 pts., por año para examinar a 50 personas, con vistas a una selección para mejorar con una desviación típica la producti- vidad con relación a lo que sería sin el examen? Por no mencionar el hecho de que muchos directores de personal tal vez no sepan a ciencia cierta qué es una desviación típica: resulta difícil transformar un beneficio medio en desviaciones típicas respecto a un criterio teórico en términos de beneficio financiero.

Sin embargo, el modelo de Brodgen tiene el mérito de llamar la aten- ción sobre lo que antes dijimos de pasada: un test puede tener verdadera utilidad, aun cuando su validez sea baja, con tal de que no suponga gran- des gastos de examen. Dicho en otras palabras, la decisión de emplear tal

Page 91: Evaluacion Del Personal

LA TOMA DE DECISIONES Y EVALUACIÓN DE SU UTILIDAD 71

o cual método debe adoptarse en función de las características de la situa- ción del empleo, del contenido de las tareas y de su dificultad. Además, tal decisión ha de ser fruto de una comparación entre diferentes procesos de toma decisión. Siempre valdrá la pena emplear un determinado méto- do si los demás modelos posibles ofrecen una utilidad menor.

Muestra también el interés que tiene conocer, de la manera más realis- ta y concreta posible, el valor de cada empleado para la organización, la distribución de esos valores y su varianza en grupos de puestos o empleos homogéneos. Durante mucho tiempo, la evaluación financiera atribuible al hecho de poseer un personal con alto rendimiento se consideraba algo imposible de calcular, lo que hacía que los psicólogos no pudieran demos- trar la utilidad financiera de sus métodos.

Recientemente, Schmidt y Hunter propusieron una nueva forma de realizar este cálculo (1982). Partieron de la idea de que la jerarquía res- ponsable de los mandos intermedios en una determinada categoría de puestos era capaz de evaluar la productividad del personal sometido a su responsabilidad, así como las diferencias existentes entre los mejores y los peores entre sus subordinados. Así pues, en un primer momento, pidieron a los mandos que hicieran una evaluación financiera del valor de un empleado medio, de un empleado excelente y de un empleado mediocre. Si bien tal evaluación resultaba algo poco habitual para las personas inte- rrogadas, un cuestionario les sugería que pensaran en el coste que supon- dría para la organización tener que adquirir en el exterior los bienes o servicios prestados por el personal evaluado. Además, para ayudar a los ejecutivos en esta estimación, los empleados excelentes eran definidos como pertenecientes al 15 % de los mejores, y los mediocres, como perte- necientes al 15 % de los peores, en una clasificación jerárquica de todos los empleados bajo sus órdenes. ¿Por qué esas cifras?, porque correspon- den a los valores iguales a la media más o menos una desviación típica dentro de una distribución normal (ver fig. III-2). De manera que, con estos datos, sería posible calcular la desviación típica que caracteriza la dispersión de los «valores financieros» de una categoría de empleados para la organización.

Las estimaciones dadas por los ejecutivos son objeto de medias que permiten calcular el valor financiero asociado a una mejor selección. Por ejemplo, Schmidt y otros (1980) llevaron a cabo este trabajo para unos programadores y demostraron que la diferencia de valor financiero para la organización entre un programador excelente y un programador me- dio, así como entre un programador medio y uno mediocre, era de 10.000 dólares anuales. De forma más general, basándose en varios estudios de este tipo, y para poder hacer una estimación precisa de la utilidad de un método de valoración, Hunter y Schmidt indican que la desviación típica

Page 92: Evaluacion Del Personal

72 EVALUACIÓN DEL PERSONAL

(es decir, lo que diferencia en términos financieros al empleado excelente del empleado medio, o incluso al mediocre del medio) se sitúa entre el 40 y el 70 % del salario correspondiente, y la diferencia entre el mediocre y el excelente equivale aproximadamente a la totalidad del salario. Boudreau (1989) discute esas cifras, basándose en más de 60 investigaciones sacadas de la bibliografía existente y para las cuales la desviación típica es mucho más variada, ya que va de menos del 20 % a más del 100 %. Seguramente, sería bastante útil efectuar un meta-análisis sobre este punto y realizar este mismo tipo de estudios fuera de los Estados Unidos.

Estas estimaciones han sido criticadas por apoyarse en bases demasia- do subjetivas. Sin embargo, una reciente investigación ha comparado esti- maciones referentes a vendedores de seguros con sus cifras de venta real y han demostrado que ambos índices se hallan muy próximos (Bobko y Karren, 1982). Otra investigación, realizada asimismo en una compañía de seguros, comparaba las estimaciones referentes a los jefes de servicio que tratan los dossiers de solicitudes de indemnización con los datos obje- tivos referentes a su productividad, confirmando, también en este caso, la pertinencia de las estimaciones (Ledvinka y Simonet, 1983).

Las diversas investigaciones realizadas por Schmidt y Hunter median- te su método de estimación dan resultados insospechados. Por ejemplo, calcularon el beneficio que obtendría la policía de Filadelfia si utilizara tests psicológicos y lo estimaron en 18 millones de dólares por año. El mismo método aplicado por estos autores al Gobierno Federal de los Estados Unidos ofrecía como resultado un ahorro de 16 billones de dóla- res anuales...

El interés suscitado por los trabajos de Schmidt y Hunter ha reavivado la reflexión sobre los modelos económicos y los procedimientos para me- dir la utilidad de los exámenes de evaluación. Boudreau (1989), por ejem- plo, afirma que habría que tener en cuenta los efectos que podría tener la utilización de un método más riguroso de selección sobre el tamaño y las características de las poblaciones de candidatos. Además, el modelo pro- puesto sería muy escueto. Sobre todo, no contabiliza el hecho de que el crecimiento de la productividad puede acarrear costes secundarios �ma- yor compra de materias primas, primas más elevadas, por ejemplo. Omite también el impacto fiscal sobre un beneficio más elevado. Finalmente, no basta con tener en cuenta el beneficio en un grupo de empleados durante un solo año, y Boudreau propone un modelo dinámico que integre la duración media de renovación del personal: los programas de toma de decisiones referentes al personal son elaborados para su aplicación en varias ocasiones, durante cierto número de años y no una sola vez, de forma concreta, y se refieren a personal que forme parte de la organiza- ción durante más de un año.

Page 93: Evaluacion Del Personal

LA TOMA DE DECISIONES Y EVALUACIÓN DE SU UTILIDAD 73

¿Con cuáles de estos esfuerzos de formalización y de estimación racio- nal nos podríamos quedar? Con tres aspectos, al menos. Ante todo, no existe incompatibilidad entre el hecho de mantener una política de rela- ciones humanas preocupada por el bienestar y la satisfacción del propio personal y la preocupación por adoptar decisiones, respecto a ese perso- nal, que sean tan pertinentes como sea posible, y de adoptarlas sin un coste exagerado con respecto al beneficio que de ellas se obtiene. Se trata de un terreno en el que los objetivos individuales y los de la organización pueden coincidir: los fracasos individuales, la mala orientación, la incapa- cidad para asumir responsabilidades son algo tan dañino para la buena marcha de la organización como para el equilibrio y la confianza de los individuos en sí mismos.

En segundo lugar, es posible elaborar datos relativamente precisos y objetivos sobre la contribución de cada cual a la organización y calcular el coste y el beneficio obtenido con el empleo de métodos que, por lo demás, se han comprobado escrupulosamente. Elegir un método de evaluación porque sea barato o porque parezca intuitivamente válido, sin preocupar- se de su eficacia, es una prueba de mala gestión. En ese sentido, no hay que olvidarse de tener en cuenta el precio de coste de las entrevistas tradicionales. Aun cuando se confíen a ejecutivos no especializados que las lleven a cabo aparte de su trabajo normal, las entrevistas requieren tiempo y cuestan dinero a la empresa.

Finalmente, hay que desconfiar de las afirmaciones infundadas de tal o cual inventor de métodos milagrosos de evaluación. Una de las razones de la actual moda de métodos peregrinos es sin ninguna duda el aplomo con que sus inventores «venden» su mercancía, ensalzando sin la menor prueba sus cualidades y virtudes. Mientras tanto, claro está, los psicólogos elaboran penosamente métodos complicados de estimación, lo cual no es óbice para no seguir sus esfuerzos de objetividad y su preocupación por la prueba: la responsabilidad moral que acompaña a cualquier decisión en materia de personal debería imbuir una especial ansia de rigor en quienes han de adoptar tales decisiones.

Page 94: Evaluacion Del Personal

74 EVALUACIÓN DEL PERSONAL

DOS EJEMPLOS EN CIFRAS DE LA APLICACIÓN DE LA FOR- MULA DE BRODGEN PARA CALCULAR EL BENEFICIO QUE SE PUEDE ESPERAR UN MÉTODO DE VALORACIÓN (POR EMPLEADO SELECCIONADO Y AÑO.)

Primer ejemplo

Y (dispersión de la distribución del criterio de éxito profesional, o incluso, en el presente caso, la diferencia en francos entre la produc- ción de un agente medio y la de un buen agente)���.. 200.000 Pts. r (coeficiente de correlación que expresa la validez de los tests con relación al criterio de éxito profesional) .......................... 0,40

Z (media en nota estándar de las puntuaciones de los candidatos selec- cionados) .............................................................................. 7

C (coste de un examen por candidato)������. 12.000 Pts. P (tasa de selección) ............................................................ 50 %

Beneficio = (200.000 x 0,40 x 7) - (12000/0,50) = 536.000 Pts.

Segundo ejemplo

Y (dispersión de la distribución del criterio de éxito profesional, o incluso, en el presente caso, la diferencia en francos entre la produc- ción de un agente medio y la de un estupendo agente) . 100.000 Pts. r (coeficiente de correlación que expresa la validez de los tests con relación al criterio de éxito profesional) ............................ 0,30

Z (media en nota estándar de las puntuaciones de los candidatos selec- cionados) ............................................................................. 6

C (coste de un examen por candidato) ....................... 12.000 Pts. P (tasa de selección) ............................................................ 50 %

Beneficio = (100.000 x 0,30 x 6) - (12.000/0,50)= 156.000 F

Page 95: Evaluacion Del Personal

SEGUNDA PARTE

Métodos de evaluación

Hemos consagrado la primera parte a exponer los principios y méto- dos que permiten apreciar las cualidades de un método de evaluación. El objetivo que no hay que perder de vista es conseguir la adecuación entre las características del individuo y la exigencia del puesto de trabajo. Para ello, es evidente que las decisiones deben basarse en métodos fiables y válidos. No obstante, estos métodos no se pueden emplear de manera automática, como si la decisión tuviera que salir de un ordenador. La evaluación es un proceso que se desarrolla en el tiempo, que implica unos agentes, que utiliza una serie de informaciones. Implica tanto al individuo como a la organización, ya que es preciso, a la vez, que los encargados de tomar la decisión por parte de la organización valoren al individuo y que este individuo se forme una imagen correcta de lo que la organización espera de él y de lo que él puede esperar de la organización.

En este sentido, hay que subrayar que ni el proceso de evaluación ni los responsables del mismo están al servicio exclusivo de la organización. Por un lado, porque toda evaluación y toda decisión en cuanto a carrera profesional comporta una parte de orientación y de consejo individual, por otro lado porque un error de decisión resulta tan oneroso para la organización como para el individuo que sufre el fracaso. Aparte de esto �y nadie que haya participado en este tipo de acciones nos llevaría la contraria� todo individuo busca información sobre sí mismo y aprove- cha gustoso cualquier ocasión de discutir con un tercero informado, com- petente y neutral su potencial, sus experiencias y su porvenir. Las investi- gaciones sobre el desarrollo de la «madurez profesional» han demostrado que ésta era producto de una doble exploración de la realidad social y profesional, por un lado, y de uno mismo, por el otro, exploración que se lleva a cabo al hilo de experiencias laborales y se basa en la observación e interpretación de los resultados obtenidos.

La evaluación de los individuos y las decisiones en materia de carrera profesional representan un proceso en varias etapas y suponen un diálogo entre la organización y el individuo. Este diálogo debe dar lugar a contac- tos personales con la jerarquía, lo cual no quita que el conjunto del proce-

75

Page 96: Evaluacion Del Personal

76 EVALUACIÓN DEL PERSONAL

so carezca de valor si no se basa en métodos fiables, válidos y transparen- tes, es decir, cuya significación y valor puedan demostrarse y, si viene al caso, explicarse a quien se somete a ellos. Además, los métodos utilizados deben ser objetivos, es decir, no deben introducir arbitrariedad en los juicios y decisiones, ni vicios que pudieran llevar a privilegiar injustifica- damente tal o cual grupo social. Cuando se trata de un diagnóstico médi- co, cualquier paciente entiende muy bien que el médico necesite informa- ciones fiables y objetivas sobre los parámetros biológicos pertinentes. Nadie aceptaría la idea de que el número de glóbulos rojos o blancos en su sangre variase según se analizaran con el método X o Y, o según fuera fulano o mengano quien realizara la prueba. Por otro lado, la síntesis de esas informaciones biológicas requiere del médico unas cualidades perso- nales y una experiencia. Lo misrno sucede cuando se trata de hacer el diagnóstico del potencial individual. La calidad del diagnóstico depende tanto de la calidad de las informaciones como del uso que de ellas se haga. Así pues, en esta segunda parte describiremos el arsenal de métodos con que contamos y lo que sabemos de su pertinencia, de sus cualidades mé- tricas y de sus condiciones de empleo.

Toda evaluación tiene tres tipos de objetivos, básicamente: el balance de aptitudes, de competencias y de la personalidad. Son, claro está, tres grupos de características individuales importantes para el éxito profesio- nal. Pero hay que insistir en que de nada sirven si falta la motivación. En otro lugar hemos recordado (Levy-Leboyer, 1984) que el valor del traba- jo, el esfuerzo y el deseo de triunfar representan condiciones sine qua non de la eficacia profesional. Ahora bien, la motivación de los individuos en su trabajo no se mide como característica individual, sino que se constru- ye. Seleccionar personas motivadas o tratar de pronosticar su motivación futura es algo que carece de sentido. Cualquiera de nosotros se siente motivado por ciertas actividades y por ciertos objetivos, pero no «motiva- do» sin más. Por el contrario, un individuo que no se sienta motivado por su trabajo será un deportista, un empedernido coleccionista o se entregará de lleno a una actividad política.

Se puede llegar más lejos en este análisis. Aun cuando no sea el objeto de la presente obra, recordemos que en otro lugar hemos señalado, apo- yándonos en la «teoría de la instrumentalidad», que la motivación en el trabajo depende de tres factores, cada uno de los cuales tiene un papel insustituible: no habrá motivación y, por tanto, no habrá esfuerzo ni acción, si no se dan expectación, instrumentalidad y valencia.

Expectación: es la convicción que tiene el individuo de que es capaz, si se lo propone, de conseguir el objetivo que se le ha encomendado. Sin expectación, no habrá esfuerzo, ya que éste se vería como algo estéril y condenado de antemano.

Page 97: Evaluacion Del Personal

MÉTODOS DE EVALUACIÓN 77

Instrumentalidad: es la representación que tiene el individuo de lo que va a suponerle (salario, ventajas financieras, prestigio, oportunidad, etc.) su éxito en el trabajo que realiza para la organización.

Valencia: es el valor, siempre para el individuo, de lo que le aporta el éxito profesional.

Es evidente que ningún trabajador se sentirá motivado si no ve clara- mente de qué modo van asociados su trabajo y lo que la organización le da como contrapartida. Le «da» en el más amplio sentido: ventajas mate- riales, promociones, pero también satisfacciones de toda índole, sensación de estar realizándose en su trabajo, aprecio de sí mismo a raíz del trabajo realizado. Es evidente también que si la organización «da» en este inter- cambio algo distinto a lo que la persona desea, la motivación quedará es- terilizada.

La motivación se desarrolla y se mantiene a través de «recompensas internas y externas» que la organización distribuye, esto lo admite todo el mundo. Pero también depende en mucho de lo que antes hemos llamado expectativas, y que se refiere a la imagen propia, a la confianza en sí mismo. Construimos nuestras expectativas (es decir, la manera en que percibimos nuestras propias aptitudes y competencias) al hilo de nuestras experiencias, nuestros éxitos y nuestros fracasos. Las evaluaciones recibi- das, de una manera formal o informal, por parte de los demás, de los superiores, de los colegas, desempeñan un papel central en este proceso. De ahí la importancia que cabe atribuir a la «recuperación» de las infor- maciones recogidas en toda evaluación. Ya se trate de un examen de ingreso, de una investigación de potencial o de una evaluación en el curso de la carrera profesional, el hecho mismo de evaluar a alguien nunca es un proceso neutro a los ojos de esa persona. El comentario de los resulta- dos en una charla posterior a la evaluación no sólo representa una obliga- ción ética para el psicólogo encargado de la evaluación, sino también una necesidad para la organización, si quiere desarrollar la necesaria confian- za en sí mismos de sus miembros.

Así pues, la organización debe crear las motivaciones de su personal. Dar a cada cual tareas suficientemente exigentes como para que el éxito les permita crear una imagen de sí mismos positiva, asegurar la formación necesaria, poner de relieve los aciertos: todo ello favorecerá el desarrollo de unas expectativas adecuadas.

En el marco de los problemas que aquí nos interesan, hay que resu- mir, pues, que la motivación desempeña un papel sine qua non como factor determinante del esfuerzo, de la voluntad de triunfar, y por tanto de los resultados en el trabajo, y que es la organización la que tiene que crear las condiciones favorables para su desarrollo. Desgraciadamente, no siempre ocurre así. Por paradójico que pueda parecer a simple vista, pue-

Page 98: Evaluacion Del Personal

78 EVALUACIÓN DEL PERSONAL

de suceder que individuos correctamente seleccionados, encargados de tareas que dominan, se sientan desmotivados por las condiciones labora- les y por el clima de la organización hasta el punto de resultar improducti- vos. Por ello, la validez representada por la correlación entre el predictor y el criterio está matizada por la capacidad de la organización para utilizar el potencial latente del individuo, tal y como habían señalado los predic- tores. En definitiva, habría que resumir diciendo que el mejor de los predictores no servirá de nada si el personal no está ubicado en las mejo- res condiciones. Si bien es cierto que el mal operario tiene siempre malas herramientas, no es menos cierto que, sin buenas herramientas, el mejor operario no podrá haber un buen trabajo.

Una vez hechas estas salvedades, podemos abordar ya lo que será el objetivo central de esta segunda parte: ¿qué indicadores se utilizan y qué confianza se puede otorgar a las informaciones que proporcionan? Dicho en otros términos, ¿cuáles son sus cualidades métricas y cuál es su signifi- cación, en el sentido que hemos dado a dichos términos en la primera parte? Hay que decir que la investigación en Francia sobre estos proble- mas es muy escueta. Mientras se consagran enormes esfuerzos �por lo demás, con toda justicia� a la elaboración de instrumentos diagnósticos en psicopatología y a los métodos destinados a describir el desarrollo del bebé y del niño, ningún laboratorio del sector público se dedica a este tipo de problemas aplicados al mundo laboral del adulto. Cierto es que los servicios de psicología de las grandes organizaciones del sector público o privado realizan investigaciones, elaboran y comprueban los instrumen- tos que necesitan, pero claro está, no publican sus resultados y mantienen la confidencialidad de sus métodos. También es cierto que los editores de tests hacen todo lo posible por recoger y controlar datos sobre contrasta- ción y validez de las técnicas que ponen en marcha. Pero la mayor parte de los métodos empleados en Francia no son más que recetas empíricas que no se basan en ninguna investigación fundamental y que muchas veces no son más que la traducción de técnicas elaboradas en otras partes, generalmente en los Estados Unidos, sin que sus cualidades métricas ha- yan sido controlada para poblaciones diferentes.

Además, ya se trate de una selección interna o externa, la evaluación se basa casi siempre en un reducido número de fuentes de información: una o varias entrevistas, referencias sobre el comportamiento en anterio- res puestos, en todo caso, y un cuestionario o dossier sobre el curriculum vitae del candidato. Suele suceder que los responsables de la gestión de una carrera profesional tengan la sensación de que las informaciones de que disponen resultan insuficientes. Muchas veces, esta sensación se debe a algún caso particular, a algún error que les ha impresionado, más que a un control sistemático de la fiabilidad y la validez de las informaciones en

Page 99: Evaluacion Del Personal

MÉTODOS DE EVALUACIÓN 79

las que basan sus decisiones. Tratan entonces de completar los datos de que disponen recurriendo a otro tipo de informaciones que les parecen (por mera intuición) atractivos, como el examen de la grafía, el signo astrológico, la fecha y hora de nacimiento, o incluso parámetros biológi- cos, como grupo sanguíneo, o anatómicos como la morfología del cráneo y del rostro. El valor diagnóstico y predictivo de todos estos datos no se basa más que en la firme convicción de sus adeptos. Pero las convicciones no sirven para demostrar nada. No basta con que la información permita diferenciar a los individuos entre sí para poder predecir su comporta- miento ulterior. El empleo de métodos que no se basan en ningún modelo teórico, cuyas cualidades métricas no están demostradas y cuyos autores alegan que no se pueden someter a controles experimentales, es algo que suscita problemas en cuanto a su eficacia y su el plano ético.

En este sentido, el análisis grafológico constituye un problema aparte, ante todo porque, como ya hemos indicado en la introducción, en Fran- cia se emplea mucho. Además, porque la escritura es resultado de un comportamiento y difiere según los individuos: nada obsta, en principio, a que el producto de ese comportamiento, es decir, el acto de escribir, sea objeto de clasificaciones precisas y a que esas clasificaciones sirvan) de base a algún diagnóstico, e incluso a algún pronóstico aislado. Aunque habría que explicar las razones por las que se piensa que la escritura contiene alguna información sobre la personalidad. Y, sobre todo, esta hipótesis sobre la significación de la escritura no exime desde luego de estudiar la fiabilidad y la validez del análisis grafológico. Los escasos estu- dios realizados sobre este problema, y que han sido objeto de una revisión reciente y exhaustiva (M-L-Bruchon-Schweitzer, 1987), no apoyan con- clusiones optimistas. La fiabilidad entre los calificadores o el acuerdo entre los grafólogos a los que se sometió una misma muestra de escritura, sólo son elevados cuando los grafólogos pertenecen a la misma corriente (escuela de los trazos, escuela gestaltista, psicoanálisis grafológico). De los 26 estudios citados que exploraron las relaciones entre personalidad y escritura, sólo 5 dejan entrever conexiones interesantes. Es posible que un reagrupamiento sistemático de los signos gráficos, obtenidos en condicio- nes constantes y llevado a cabo mediante instrumentos de tratamiento de datos como el análisis factorial, suponga un camino prometedor. En la actual situación, no se ha hecho ese trabajo y nada hay que justifique el extendido uso de la grafología. De los cuatro estudios existentes que po- nen en relación el análisis de la escritura y diferentes criterios de éxito profesional, tres demuestran que el análisis grafológico no tienen validez alguna y el cuarto no resulta fiable, en la medida en que el grafólogo disponía de una autobiografía de los individuos. En definitiva, no hay que rechazar categóricamente el análisis de la escritura como fuente de infor-

Page 100: Evaluacion Del Personal

80 EVALUACIÓN DEL PERSONAL

marión para las decisiones referentes a la selección y gestión de carreras profesionales, pero justo es observar la ausencia de investigaciones que tiendan a mejorar la objetividad y la fiabilidad de los índices descriptivos, su agrupamiento en factores coherentes que permitan analizar su signifi- cado psicológico, así como su contenido (en el sentido que hemos dado al término en el capítulo sobre las cualidades métricas) y su validez.

En cambio, existen en Estados Unidos y en los demás países de Euro- pa, y en cantidad considerable, diversas investigaciones sobre los tests psicológicos y los métodos más clásicos, como la entrevista, los cuestiona- rios biográficos y las pruebas profesionales. Algunos de estos trabajos son teóricos: análisis de la estructura de las aptitudes, modelo de las relaciones entre los comportamientos observados y lo que explica esas relaciones, por ejemplo. Otras investigaciones se han desarrollado como respuesta a problemas prácticos, cuando había que hallar soluciones para realizar alguna selección, interna o externa, hacer balances de potencial o bien organizar ciclos de formación. Estas investigaciones han avanzado mucho en la última década y muchas de las lecciones que aportan son extensibles a países distintos de aquellos en que se llevaron a cabo.

Trataremos de ofrecer una síntesis de estos trabajos y hacer un balance de los mismos en los cuatro capítulos de esta segunda parte. Lo más cómodo para el lector hubiera sido ofrecerle un capítulo sobre las aptitu- des, otro sobre las competencias y sus mediciones y un tercer capítulo sobre la personalidad. Por desgracia, ningún método abarca estrictamente uno solo de estos objetivos, que son la medida de las aptitudes, de las competencias y la descripción de la personalidad. Así pues, hemos preferi- do comenzar por lo que más se utiliza: el «trío clásico», formado por las referencias, el curriculum vitae y las entrevistas. Trataremos de mostrar que las referencias rara vez son fiables; intentaremos describir las condi- ciones para que las entrevistas resulten útiles y cómo hacer para que las informaciones sobre el pasado profesional sean pertinentes. Un segundo capítulo estará consagrado a la medición de aptitudes, tests de funciona- miento cognitivo cuya importancia y validez general son ya conocidas y tests de aptitudes específicas, respecto a los cuales demostraremos que nunca miden una sola aptitud. En un tercer capítulo, examinaremos lo que se suele reunir bajo el epígrafe común de «tests de personalidad». Se trata de cuestionarios en los que los individuos son invitados a describirse a sí mismos y responder a preguntas sobre su comportamiento habitual, y de tests llamados «proyectivos». Demostraremos que, a pesar de su inte- rés para la investigación y para la clínica, los cuestionarios son de escasa validez y trataremos de explicar las razones de tal hecho. Las técnicas proyectivas, útiles en psicología patológica y en psiquiatría, no han dado resultados mucho más interesantes, aunque algunas pistas deberían dar

Page 101: Evaluacion Del Personal

MÉTODOS DE EVALUACIÓN 81

origen a nuevas investigaciones. Finalmente, en un último capítulo, des- cribiremos las diferentes categorías de pruebas profesionales y de tests de situación, en especial los centros de evaluación, para subrayar su interés y describir sus condiciones de utilización.

Page 102: Evaluacion Del Personal
Page 103: Evaluacion Del Personal

5

El «trío clásico»: referencias, curriculum vitae y entrevistas

El empleo de tests psicológicos y de otras técnicas destinadas a descri- bir la capacidad y las características de los candidatos a un puesto de trabajo, varía enormemente según cada país, según cada empresa, incluso según los servicios o departamentos dentro de una misma organización. Pero hay tres fuentes de información que son utilizadas prácticamente por todos y en todas partes: las referencias, los curriculum vitae o cuestio- narios biográficos y los informes elaborados mediante entrevistas indivi- duales.

Por otro lado, los candidatos se muestran favorables a la recogida y utilización de este tipo de información. Antes que someterse a test cuyos principios no suelen entender bien o a otros métodos que se les pueden antojar discutibles, prefieren que su futuro patrón esté bien informado de lo que ya han llevado a cabo y se entreviste con ellos para formarse una opinión «directa» y sin intermediarios. Además, tanto para los candidatos como para su futuro patrón, es una ocasión preciosa para intercambiar información: en este sentido, la clásica «entrevista de incorporación» debe considerarse como un diálogo y no como un interrogatorio, en el que las informaciones sólo circularan en un solo sentido. Hay que añadir, en fin que las personas de la organización encargadas de adoptar decisio- nes que afecten al personal quieren, con toda razón, disponer de datos concretos y no tener que fundar sus decisiones en resultados de exámenes o incluso en puntuaciones numéricas.

Referencias e informaciones biográficas adquieren suma importancia en épocas de fuerte tasa de paro. En efecto, las convocatorias de candida- tos suelen comportar un elevado número de respuestas que necesitan una primera criba. Esta criba se realiza casi siempre mediante dossiers, es decir, básicamente mediante informaciones escritas que acompañan a la candidatura. En numerosos casos, los candidatos que hayan «sobrevivi- do» a esta primera criba son convocados a una entrevista, que suele supo-

83

Page 104: Evaluacion Del Personal

84 EVALUACIÓN DEL PERSONAL

ner una segunda barrera. Es evidente que, si se hacen mal estas sucesivas selecciones, es decir, si se rechazan las candidaturas mejores y más ade- cuadas a los empleos a cubrir, la calidad de las últimas etapas de la eva- luación jamás permitirá redimir los errores del pasado. Así pues, tiene su importancia saber si esas fuentes de información son pertinentes, conocer su validez y analizar su significación con el mismo cuidado que se pondrá en los métodos más sofisticados elaborados por los psicólogos y de los que nos ocuparemos en los capítulos siguientes.

Esta evaluación del «trío clásico» (M. Cook, 1988) formado por las referencias, las informaciones biográficas y las entrevistas adquiere espe- cial importancia por cuanto bajo la misma etiqueta se esconden en reali- dad informaciones obtenidas de manera diversa. Las personas que las proporcionan, que las interpretan y adoptan decisiones no suelen contar con consigas precisas que puedan aplicar lo que no les impide tener una cierta idea de la manera en que deben tratar tales informaciones, idea que ni se explícita ni se discute con otros colegas para elaborar una filosofía común.

Referencias, biografía y entrevistas deben considerarse, como todas las demás técnicas utilizadas para evaluar y predecir el éxito profesional, des- de el triple punto de vista de su validez (cualidad sine qua non), de su viabilidad (teniendo en cuenta viciamientos indeseables y consecuencias dañinas) y de su significación (hemos visto en la primera parte que no basta con comprobar la validez de una técnica, hay que saber también a qué se debe dicha validez). El análisis crítico de estas técnicas y de su valor habrá de tener igualmente en cuenta su papel en los procesos socia- les que constituyen la incorporación, el traslado, la formación, etc.).

Además, cada una de esas fuentes de información se apoya en una base teórica (aún cuando quienes las emplean se preocupen poco por eso), que es necesario explicitar y, si fuera preciso someter a examen.

Cualquier referencia es, efectivamente, el resultado de una impresión elaborada por un individuo sobre otro. Habrá que preguntarse, pues, cómo se forma esta percepción del otro y, sobre todo, qué capacidad tiene la persona evaluada para hacerse notar por los demás, para ser popular, y qué papel desempeña la pertenencia a grupos sociales comunes.

La entrevista es una situación social en la que los dos protagonistas aportan sus prejuicios personales y su representación de las cualidades necesarias para triunfar. Además, casi siempre se dan dos funciones. Por un lado, recoger informaciones específicas sobre el candidato, por otro, formarse sobre él una opinión global. ¿En qué medida puede ser objetiva la evaluación que de ahí se siga?

Utilizar informaciones biográficas, y por tanto, referidas al pasado del individuo, para adoptar una decisión relativa a su futuro implica suponer

Page 105: Evaluacion Del Personal

EL «TRIO CLASICO»: REFERENCIAS... 85

la existencia de una coherencia interna del comportamiento. En otras palabras, se acepta que las conductas pasadas constituyen una buena base para la predicción de las conductas futuras. Genio y figura hasta la sepul- tura: ¿hasta qué punto puede aceptarse este refrán como base de una deci- sión?

Todas estas cuestiones hay que planteárselas y deberían ser objeto de investigaciones precisas. Desgraciadamente, y a pesar de que referencias, entrevistas y dossier biográfico se utilizan con amplia profusión, son po- cos los investigadores que se han interesado de manera activa por los problemas que acabamos de plantear. Los únicos datos existentes nos llegan de los países anglosajones y no son precisamente recientes, lo cual no impide que sus resultados sean aleccionadores y que ofrezcan cierto interés para el lector español.

Hay que señalar una notable excepción a ese desinterés general: la renovación de los métodos de recogida y explotación de datos biográficos, con un verdadero esfuerzo por tratarlos de manera sistemática, tratando de comprender mejor su significación. También en ese caso, y aun cuan- do las investigaciones existentes se hayan realizado en una cultura y en un contexto económico y social diferentes, los resultados obtenidos pueden atravesar las fronteras.

Empezaremos examinando el valor y las condiciones de utilización de las referencias, que por lo demás se emplean al menos en un 90 % de las decisiones que afectan al personal. Hay pocas investigaciones recientes sobre el tema, y esto ocurre tanto en Europa como en otros lugares, a pesar de la amplia utilización de las referencias en la vida diaria de los servicios de personal y de selección, incluso de las universidades y escue- las profesionales. La síntesis hecha hace unos diez años por Muchinsky sigue siendo válida y la utilizaremos ampliamente aquí.

¿De qué se trata? De recoger indicaciones entre las personas que cono- cen bien al candidato (profesores, colegas, antiguo patrón, etc.) En reali- dad, estas informaciones se persiguen con los objetivos diferentes:

1. Verificar las informaciones facilitadas por el propio candidato en cuanto a sus diplomas, actividad anterior, etc.

2. Conseguir la opinión de alguien que le conozca bien respecto a sus posibilidades de triunfar en el puesto o formación a que se presenta. ¿Sobre qué aspecto del candidato se suelen pedir informaciones? Encues- tas ya añejas mencionan la necesidad de recoger opiniones sobre la perso- nalidad y en especial, sobre la honradez, sobre las cualidades sociales y la capacidad de trabajar en equipo. Se espera que las referencias aporten indicaciones sobre el comportamiento diario del candidato, mientras que durante la entrevista y durante los tests se observa un comportamiento

Page 106: Evaluacion Del Personal

86 EVALUACIÓN DEL PERSONAL

excepcional, en una situación estresante, y durante la cual es posible que el candidato esté realizando un esfuerzo desusado.

¿Quedan satisfechas estas expectativas? ¿Se consiguen informaciones fiables? ¿Cómo se forma realmente la percepción del otro que se traduce en forma de referencias? Las investigaciones realizadas sobre estas cues- tiones llevan a conclusiones insospechadas. Un interesante estudio fue llevado a cabo por Pérez y García (1962). Estos autores analizaron el contenido de 625 cartas de referencia enviadas con motivo de una convo- catoria para cubrir puestos de ingeniero. Utilizaron 170 adjetivos que extrajeron de ellas para confeccionar una lista que se sometió a 200 man- dos para que puntuasen los adjetivos que describían a su «mejor» ingenie- ro y al menos bueno. El análisis factorial realizado sobre este material permitió aislar cinco factores diferentes: cooperación, rapidez mental, ur- banidad, energía y fiabilidad. El factor que mejor distingue a los «buenos de los menos buenos» es la rapidez mental, y los dos factores que menos discriminan, la cooperación y la urbanidad. Los autores concluyen que cuando se quiere indicar que un candidato está escasamente cualificado para el puesto al que aspira, la gente se limita a decir que es un buen chico, sociable y muy educado.

Las personas que facilitan las referencias no saben muchas veces qué es lo que se pretende de ellas. Además, suelen respetar unas reglas sociales de tolerancia e indulgencia. La misma incertidumbre afecta a la elección de personas a quien pedir referencias: ¿se pedirán a los colegas?; ¿a los anti- guos profesores?; ¿a los mandos directos? Algunas investigaciones citadas por Muchinsky indican que, en realidad, esa elección no tiene mayor importancia, ya que la validez de las predicciones formuladas en las refe- rencias es uniformemente débil. Parece, no obstante, que la mejor validez (y aún así modesta) es la que se obtiene cuando las informaciones proce- den del superior inmediato del candidato, posiblemente porque él es quien tiene verdaderamente ocasión de observarle en situaciones varia- das.

En un estudio sobre la fiabilidad de las referencias, es decir, sobre el acuerdo de los autores de las referencias entre ellos mismos, Baxter y otros (1982) hacen algunas críticas más concretas. Compararon las refe- rencias dadas por diferentes personas sobre diferentes candidatos y obtu- vieron mayores correlaciones entre las referencias facilitadas por la misma persona sobre candidatos diferentes que entre las referencias dadas por diferentes personas sobre el mismo candidato. Dicho con otras palabras, las referencias dicen más de la persona que las da que de la persona afec- tada...

En tales condiciones, nada tiene de chocante que los diferentes estu- dios de validez consignados por Muchinsky sean también decepcionantes,

Page 107: Evaluacion Del Personal

EL «TRIO CLASICO»: REFERENCIAS... 87

yendo, según expresión del propio autor, «de lo inaceptable a lo medio- cre». Esto se explica por la escasa fiabilidad de las referencias, pero tam- bién por su reducida varianza. En la mayoría de los casos, las evaluacio- nes están impregnadas de indulgencia y las personas que facilitan las referencias tienden a subrayar los puntos fuertes del candidato y a silen- ciar sus puntos débiles. El hecho de que sean los propios candidatos quie- nes muchas veces elijan y designen las personas a las que se puede pedir referencias posiblemente tenga algo que ver con esto.

Estas observaciones críticas permiten suponer que tal vez se podrían mejorar las cualidades predictivas de las referencias eligiendo a las perso- nas más adecuadas para facilitarlas y proporcionándoles los instrumentos de evaluación pertinentes.

Hay tres condiciones esenciales para que la información facilitada sea útil. Sería preciso que cualquier demanda de referencias incluyera, en primer lugar, preguntas sobre estos tres puntos, de manera que las perso- nas no competentes no se sientan obligadas a responder cuando no sepan muy bien qué decir. En efecto, no se pueden ni se deben esperar referen- cias fiables de alguien que no ha tenido suficientes ocasiones de observar a la persona en cuestión, ni de alguien que no posea la competencia técnica necesaria para juzgar sus resultados ni, finalmente, de alguien que no tenga ganas de dar referencias o no se sienta motivado para hacerlo. La formulación de las preguntas destinadas a pedir referencias varía mu- cho y no es sistemática. Se pueden plantear cuestiones precisas, apoyadas en informaciones biográficas recogidas (por ejemplo: el candidato señala que dejó su empresa el pasado mes de junio a petición propia: ¿Es eso cierto?). O se pueden hacer preguntas más generales. (¿Por qué se marchó el candidato? ¿Qué impresión general tiene de su trabajo?) Se pueden facilitar listas más detalladas en las que puntear las series de rasgos a subrayar o incluso situaciones y comportamientos (como en las fichas de calificación descritas al principio).

Además, las referencias pueden solicitarse por carta o por teléfono. Es evidente que estas dos maneras de abordar la cuestión proporcionan in- formaciones diferentes. El teléfono permite llegar más lejos, ya que se puede mantener el diálogo hasta conseguir la información pertinente. Por otro lado, una vacilación a la hora de contestar puede ser muy elocuente y puede servir como punto de partida para una relación profesional más personal («Comprendo que le moleste hablarme de esto..., pero segura- mente se enfrenta usted al mismo problema que yo...)

Un estudio ya antiguo muestra que el esfuerzo por elaborar unas fi- chas de referencia adecuadas puede resultar muy provechoso. Carroll y Nash (1972) confeccionaron una lista de descripciones de comportamien- to destinada a reducir la indulgencia en las referencias. Las descripciones

Page 108: Evaluacion Del Personal

88 EVALUACIÓN DEL PERSONAL

estaban agrupadas por parejas y se había tomado la precaución de que las dos descripciones de cada par tuvieran la misma «cota de deseabilidad social» para quienes facilitaban las referencias. Había que elegir una sola de las dos descripciones de cada pareja. El resultado, comparado con el rendimiento ulterior de 122 empleados de oficina, permitió obtener una correlación de 0,64 entre referencias y calificaciones, correlación muy por encima del mediocre 0,20 que representa el máximo conseguido en los demás estudios.

Hay que subrayar, pues, cuatro puntos sobre el empleo de referencias como fuente de decisión en materia de gestión de personal.

1. Son necesarias, al menos porque demuestran a los candidatos que su actividad pasada se examina con seriedad.

2. Sólo constituyen una fuente pertinente de información cuando los métodos empleados son cuidadosamente elaborados y sometidos al mis- mo tipo de estudio de validación que los restantes métodos de evaluación.

3. Sólo se debe preguntar a cada persona aquello que sepa y que esté dispuesto a decir; en algunos casos, esa disposición se puede estimular mediante una información sobre la utilidad de las referencias solicitadas.

4. En cualquiera de los casos, las referencias deberían utilizarse más para eliminar candidaturas inadecuadas que para tratar de predecir más afinadamente la calidad y el nivel de rendimiento.

El segundo integrante tradicional del «trío clásico» el curriculum vitae, es fácil de conseguir y aparentemente fácil de interpretar. Aporta informa- ción sobre la biografía del candidato y sobre sus realizaciones en el pasa- do. En realidad, en la mayoría de los casos, las personas encargadas de leer los CV y evaluar las candidaturas no disponen de ninguna regla ni principio que les permita decidir sobre el valor de pronóstico de tal o cual información. Cada cual desarrolla entonces unas ideas a priori o fundadas en su propia experiencia, lo que entraña un doble inconveniente: por un lado, el mismo CV leído por dos personas distintas será evaluado de manera diferente; por otro lado, a falta de un análisis sistemático de la validez predictiva de las informaciones biográficas, es imposible decidir, quién de los dos tiene más razón.

Un esfuerzo por lograr una mayor objetividad consiste en comprobar las informaciones biográficas, comparándolas con el rendimiento y con el posterior comportamiento profesional. Dicha comparación permite des- arrollar unos inventarios biográficos cuyas respuestas se ponderarán luego de forma que se llegue a asignar una «puntuación biográfica» correspon- diente a la predicción de un determinado nivel de éxito profesional. Este modo de proceder no es nada nuevo. En Estados Unidos, el Carnegie Tech Bureau of Salemanship creó así un inventario biográfico ponderado

Page 109: Evaluacion Del Personal

EL «TRIO CLASICO»: REFERENCIAS... 89

para seleccionar vendedores de seguros de vida, que fue más tarde tomado y mejorado por la LIAMA (Life Insurance Management Association). La versión 7 del cuestionario incluye un centenar de preguntas biográficas y la puntuación que permite obtener guarda correlación con el ulterior ni- vel de venta de los agentes seleccionados (r = 0,40). La LIAMA celebró recientemente su millonésimo inventario biográfico, sin dejar de prose- guir con los estudios de control y mejora del inventario. Concretamente, las investigaciones efectuadas mostraron que un ítem aislado podía tener una considerable validez. Así por ejemplo, el hecho de haber suscrito uno mismo un seguro de vida antes de la incorporación guardaba correlación con el volumen ulterior de venta. También se observó que la relación entre el criterio de éxito y la información biográfica puede ser relativa- mente compleja. Así, la relación edad/éxito profesional suele ser curvilí- nea, lo mismo que la relación entre el nivel de educación y el éxito, para un determinado empleo.

Este ejemplo, demostrativo y bien conocido, ha sido imitado, aunque no tanto como cabía esperar. No obstante, la utilización de un inventario biográfico tiene al menos una ventaja: los candidatos no pueden saber qué tratamiento se dará a sus respuestas y por ello no pueden hacer trampa. Además, este tipo de inventario ha resultado ser especialmente válido y útil para la predicción del éxito profesional de vendedores y también de los oficios más variados: empleados de oficina, investigadores, oficiales de policía, etc.

El inventario biográfico ponderado es sin duda un procedimiento me- jor que el de evaluar sin consigna precisa alguna los curriculum vitae. No obstante, sigue siendo un instrumento relativamente tosco, que no se basa en ningún análisis del trabajo y de sus exigencias. Se puede mejorar más elaborando unas fichas biográficas en las que cada pregunta, considerada «cerrada», vaya seguida de una serie de respuestas a elegir. La puesta a punto de este tipo de fichas exige una preparación minuciosa en seis etapas.

1. Elección del criterio de predicción con relación al cual se van a ponderar las respuestas. Tal criterio podría ser, por ejemplo, el número de accidentes causados por los distribuidores, la duración de la permanencia en cada empleo, el volumen de ventas, el número de los artículos publi- cados, etc.

2. Identificación de los grupos diferenciados según el criterio escogi- do (por ejemplo, distribuidores rara vez accidentados, frecuentemente ac- cidentados y muy frecuentemente accidentados, empleados que llegan a concluir su contrato y empleados que no llegan a su final; investigadores por debajo de la media de publicaciones y por encima de la media de pu- blicaciones, etc.).

Page 110: Evaluacion Del Personal

90 EVALUACIÓN DEL PERSONAL

3. Elección razonada de los ítems del inventario biográfico más sus- ceptibles de estar relacionadas con el criterio.

4. Elección de respuestas que se ofrecerán a los individuos. 5. Análisis de las respuestas de los diferentes grupos formados según

el criterio y ponderación de las respuestas en función de las diferencias observadas entre los grupos.

6. Contra validación en forma de aplicación experimental a un nue- vo grupo de individuos, calculando una puntuación global para cada indi- viduo.

Se puede ir aún más lejos. Las fichas biográficas constituyen un avan- ce con relación a los inventarios, pero carecen de base teórica. Se trata de procedimientos empíricos, fundados en el mejor de los casos en un some- ro análisis del trabajo, sin una verdadera hipótesis sobre aquello que pue- da explicar el nexo entre los elementos aislados de la biografía y el com- portamiento profesional futuro. Un investigador americano, Owens (1976), puso de relieve que era preciso ir más allá de la simple constata- ción de una correlación y comprender por qué existen relaciones entre las informaciones biográficas y el posterior comportamiento profesional. Propuso un modelo teórico para justificar el empleo de informaciones biográficas. Por intuición, pensamos que la mejor manera de predecir cómo se va a comportar un individuo en su nuevo empleo es saber cómo se ha comportado antes. Dicho con otras palabras, nos imaginamos, con razón o sin ella, que existe una coherencia comportamental y que cada persona se va a seguir comportando como siempre lo ha hecho. Owens trata de afinar más aún, poniendo de relieve que las informaciones bio- gráficas (o «biodata») no son sólo una colección de datos aislados, sino que representan un banco de datos organizados que permite definir al individuo a través de los acontecimientos de su vida pasada, utilizando posteriormente esa definición para predecir su conducta futura. Y que esas muestras de comportamiento, si están bien elegidas y son correcta- mente evaluadas, serán a la vez más predictivas y mejor aceptadas como base de predicción del éxito profesional posterior que los «signos» revela- dores de aptitudes y de la personalidad, como son los tests y otras pruebas puntuales.

Un buen ejemplo de este enfoque nos lo suministra una investigación de Neiner y Owens, en la que los autores trataron de mostrar que existía una continuidad inteligible entre la tipología trazada a partir de elementos biográficos característicos de una promoción de estudiantes y los elemen- tos biográficos recogidos sobre ellos siete años más tarde. Comparando ambas series de informaciones aparece una coherencia, sobre todo en lo que concierne a la orientación religiosa, los roles sociales, los intereses y

Page 111: Evaluacion Del Personal

EL «TRIO CLASICO»: REFERENCIAS... 91

las relaciones interpersonales: a medida que la existencia permite acceder a nuevas actividades, la biografía individual se desarrolla e integra esos nuevos datos. Así, podría hablarse más bien de estabilidad o de coherencia que de predicción, ya que se observa, a través del tiempo, no una repeti- ción, sino la continuidad de unos mismos comportamientos y actitudes.

Un investigador (Hough, 1984) ha ido más lejos aún en esa misma dirección, desarrollando un método de evaluación fundado en unos infor- mes realizados por los propios candidatos sobre sus realizaciones en el pasado. Para predecir el éxito en una profesión jurídica, este autor utiliza a la vez un análisis del trabajo mediante el método de los incidentes críticos de Flanagan, y destinado a subrayar las dimensiones principales de la actividad profesional asociadas a la calidad del trabajo, y la evalua- ción sistemática de acontecimientos de su vida pasada hecha por los pro- pios sujetos. Procedió de la siguiente manera: un grupo de 33 juristas redactaron unas descripciones de incidentes «críticos, característicos de un comportamiento eficaz o de un comportamiento ineficaz en el trabajo. Dichos incidentes fueron sometidos a un análisis de contenido para ex- traer sus perfiles generales. Un contraexamen permitió verificar la perti- nencia de esos perfiles (hacer investigaciones, utilizar los propios conoci- mientos, planificar y organizar, escribir, comunicarse oralmente, pleitear con seguridad, trabajar de manera independiente y estar motivado por el propio trabajo). Esto permitió desarrollar un inventario en el que los sujetos eran invitados a describir sus realizaciones pasadas que mejor mostraran sus capacidades y aptitudes para cada una de las dimensiones en cuestión. Esas descripciones fueron seguidamente valoradas por unos «jueces» independientes, a quienes se facilitaron descripciones precisas y concretas de la significación de cada dimensión, así como ejemplos de descripciones que correspondieran a diferentes escalones de la ficha de puntuación. Los resultados obtenidos demostraron que los evaluadores estaban bastante de acuerdo. Por otro lado, las evaluaciones no estaban asociadas a las medidas psicológicas tradicionales que se habían obtenido independientemente para los sujetos y mostraban una correlación con una evaluación ulterior de su éxito profesional (r = 0,25). Aunque esta correlación no parezca muy elevada, el hecho de que las indicaciones proporcionadas sean independientes de los resultados en los tests clásicos permite pensar que el inventario es susceptible de aumentar la validez de estas técnicas.

Podríamos resumir, pues, diciendo que la utilización de informacio- nes biográficas, cuando se interpretan de manera objetiva y tras un estu- dio de validez, aporta elementos serios para la predicción del éxito profe- sional y la toma de decisiones en materia de gestión de personal.

Diversos balances de investigaciones que han tratado de utilizar este

Page 112: Evaluacion Del Personal

92 EVALUACIÓN DEL PERSONAL

tipo de métodos y calibrar su eficacia confirman esta postura. La primera ventaja de los inventarios biográficos es el hecho de que son bien acepta- dos, fáciles de cumplimentar y que no cuesta mucho interpretarlos una vez realizados los estudios previos. De todos modos, se ha criticado su empleo, poniéndose en duda la sinceridad de los individuos. Es cierto que la mayoría de los candidatos tratarán presumiblemente de dar buena sen- sación, con lo que sus respuestas corren el riesgo de sufrir una deforma- ción en el sentido de apuntar hacia «lo socialmente deseable». De hecho, varias investigaciones muestran que los candidatos tienden a prolongar la duración de sus anteriores empleos y a indicar unos salarios en el pasado superiores a la realidad. Una investigación llegó incluso a medir la tasa de «trampa» por parte de los encuestados al introducir una pregunta capcio- sa: en un inventario destinado a electricistas, se les preguntaba si conocían un cierto aparato... que no existía. Una tercera parte respondió que sí. Preguntas así pueden servir como termómetros de engaño. Por otro lado, conviene no olvidar que los candidatos no saben cuál es el peso predictivo de las diferentes preguntas, ni siquiera cuáles de ellas serán tenidas en cuenta, lo que hace más difícil que puedan deformar sus respuestas.

Este esfuerzo de comprobación sistemática de todos los elementos bio- gráficos se vuelve a veces contra las buenas intenciones de sus autores. En efecto, tener en cuenta variables como la edad, el estado civil o el sexo de los candidatos introduce una discriminación abusiva y criticable. A fin de cuentas, sólo deberían adoptarse como elementos para la toma de deci- sión que sean «modificables»: esa es, en cualquier caso, la postura que prevalece en Estados Unidos, donde cualquier otro procedimiento es con- denado como fuente de una desigualdad fundamental ante el empleo. Aun cuando en Francia no se lleve este tipo de delito a los tribunales, resulta muy difícil defender la idea de que las mujeres o las personas relativamente mayores, por ejemplo, hayan de ser descartadas sistemáti- camente de tal o cual empleo. En todo caso, y si está probado que una determinada categoría de personal rara vez tiene éxito en ese puesto, se les puede aconsejar que no mantengan su candidatura, pero no descartarlos de manera sistemática.

Esta postura de prudencia se justifica además por la validez de los inventarios biográficos. La síntesis más reciente (Reilly y Chao, 1982) resume 58 investigaciones rigurosas desde el punto de vista metodológico y constata un coeficiente de correlación medio de 0,35, mezclando crite- rios y profesiones. Las correlaciones más altas se dan entre la veteranía o permanencia en el empleo y en los puestos administrativos y mandos in- termedios.

¿Qué podemos sacar en conclusión de todo esto? Ante todo, que los cuestionarios biográficos aportan, sin duda, informaciones pertinentes (y

Page 113: Evaluacion Del Personal

EL «TRIO CLASICO»: REFERENCIAS... 93

que habría que proseguir las investigaciones sobre la «coherencia conduc- tual»). De todos modos, su utilización sólo puede ser válida con ciertas condiciones. El peso de cada dato recogido ha de calibrarse mediante investigaciones objetivas y el escrutinio de las respuestas debe hacerse sobre la base de reglas muy precisas. Además, es de esperar que este tipo de predicción evolucione con el tiempo y se asegure un control regular de la validez. Además, los datos biográficos no deberían utilizarse jamás como base única de decisiones. Ante todo, porque su validez, aún cuando sea apreciable, no es suficiente para ello; en segundo lugar, porque no se les debe tomar en consideración sin tratar de comprender mejor su signi- ficación. Y es precisamente el hecho de tener en cuenta simultáneamente informaciones basadas en métodos diferentes lo que permite explotar los datos biográficos no «a ciegas», sino de manera coherente. Finalmente, no hay que desechar la recogida de informaciones biográficas a cada uno de los candidatos en todos aquellos casos en que se trate de cualidades difíciles de evaluar por otra vía, como ocurre, por ejemplo, con las cuali- dades sociales.

El tercer elemento del «trío clásico» lo constituye la entrevista. Se trata sin duda del más utilizado de todos los métodos de evaluación y también del menos conocido. Aunque existan numerosas investigaciones �en su mayoría anglosajonas� sobre la entrevista, su significación y validez, poco sabemos de lo que en realidad ocurre en la mayoría de las entrevistas de evaluación y sobre todo, sólo conocemos una pequeña par- te de los métodos realmente utilizados para juzgar a los candidatos en una entrevista.

Los procedimientos para llevar a cabo una entrevista son muy varia- dos. Algunas sólo durarán cinco minutos, otras, una o dos horas. Algunas son individuales; en otras, el candidato tiene que enfrentarse a dos o más personas. A veces, la persona que pregunta se muestra amable y trata que su interlocutor se sienta a gusto; en otros casos, se muestra deliberada- mente indiferente y agresiva para poner en tensión a su interlocutor. Ocu- rre a veces que el entrevistador recibe de su organización una lista de preguntas a formular o bien una lista de puntos sobre los que tiene que juzgar al candidato. También puede ocurrir que sólo se le pida su opinión sobre la contratación del candidato. Lo que se espera de la entrevista es igualmente variopinto: una impresión general o una descripción más de- tallada. Incluso hay casos en los que varios entrevistadores se reparten las tareas y cada uno se ocupa de un tema concreto.

Por otro lado, la entrevista tiene dos funciones distintas: por un lado, obtener informaciones precisas sobre el candidato (y en tal caso, sirve para completar el cuestionario biográfico o curriculum vitae), por otro lado, llegar a una «impresión» sobre el mismo para adoptar una decisión.

Page 114: Evaluacion Del Personal

94 EVALUACIÓN DEL PERSONAL

En líneas generales, resulta verdaderamente curioso el profuso empleo que se hace de la entrevista, si se tiene en cuenta el elevado número de investigaciones que demuestran sus puntos débiles como instrumento para pronosticar el éxito profesional: su escasa fiabilidad, su falta de vali- dez, su fuerte sensibilidad a sesgos y distorsiones. Cada vez escasean más las investigaciones sobre la validez de la entrevista ya que se tiene la firme persuasión de que ya no hace falta demostrar su falta de validez.

En tal caso, ¿por qué se sigue utilizando prácticamente cada vez que hay que adoptar alguna decisión respecto al personal?

Podrían aducirse tres respuestas.

1. La entrevista es realmente válida, pero sólo en ciertos aspectos concretos de la evaluación y, sobre todo, en aquellos aspectos �como las cualidades sociales� que los tests clásicos no delimitan adecuadamente. En este sentido, la entrevista constituye una muestra de comportamiento y así debe considerarse.

2. La entrevista no es válida, pero continúa prodigándose porque cumple otras funciones diferentes a la predicción. Concretamente sirve para matizar los datos biográficos, para permitir a los candidatos plantear preguntas sobre la empresa y el empleo, para establecer con el candidato una relación personal, y, eventualmente, para «venderle» el puesto a cu- brir. No hay que olvidar, en efecto, que habrá casos en los que será el candidato quien seleccione un empleo, lo mismo que la empresa busca a alguien que le convenga.

3. La entrevista no es válida, pero las personas que la utilizan no están muy convencidas de ello. En tal caso, habría que saber cómo se explica esta ilusión de validez y hacer de manera que los entrevistados reciban una formación adecuada sobre los métodos de evaluación y ma- yor información sobre la validez de su juicio. Es muy posible, por lo demás, que se observe una desigualdad de las valideces «individuales»; o dicho en otras palabras, que algunas personas emitan juicios más válidos que otras. También eso habría que analizarlo y sacar conclusiones.

Las investigaciones más recientes sobre la entrevista han tenido en cuenta las observaciones que acabamos de esbozar, ya que estudian, no sus cualidades métricas, sino el conjunto del proceso de decisión que se basa en la entrevista, utilizando los datos de la investigación en psicología social sobre los procesos que entran en juego en nuestra percepción del otro.

Se pueden utilizar sus resultados para mejorar el valor de la clásica entrevista. Comenzaremos, pues, resumiendo los trabajos que muestran la ausencia de fiabilidad y de validez en la entrevista, para describir a continuación los análisis sobre la toma de decisiones y elaboración de

Page 115: Evaluacion Del Personal

EL «TRIO CLASICO»: REFERENCIAS... 95

juicios sobre los demás. Acabamos con algunos consejos concretos res- pecto a las reglas a seguir para mejorar la entrevista y con la descripción de una interesante variante, «la entrevista en situación». Hay que destacar que, con este proceder, trataremos de evitar el peligro de traducir en consejos para los demás la excelente opinión que se suele tener de la propia manera de actuar: lo mismo aquí que en todas las demás posturas defendidas en este libro sólo presentaremos aquellos puntos que creemos justificados mediante pruebas objetivas.

Fiabilidad y validez de la entrevista

La escasa fiabilidad de los juicios fundados en la entrevista no es nada nuevo. Ya en 1911, Binet señalaba el desacuerdo existente entre las eva- luaciones de la inteligencia hechas a partir de entrevistas llevadas a cabo por tres maestros diferentes con el mismo niño. Las revisiones más re- cientes del tema concuerdan con esta visión pesimista. Wagner (1949) analizó 25 artículos en los que se daba información sobre la fiabilidad de la entrevista, medida por la correlación entre las evaluaciones de los dife- rentes entrevistadores. Citaba coeficientes que iban de 0,23 a 0,97 con la mediana en 0,57. Quince años más tarde, Ulrich y Trumbo (1965) señala- ban la escasa fiabilidad, en especial cuando la entrevista no estaba estruc- turada, es decir, cuando el entrevistador no disponía de un esquema preestablecido para dirigir las preguntas. Tal diversidad de resultados qui- zá se explique por el hecho de que no se refieren al mismo tipo de datos. En las investigaciones en las que se comparan las descripciones que hacen del sujeto diferentes entrevistadores, los coeficientes de fiabilidad son ele- vados. Por ejemplo, Reynolds (1979) hizo calificar a candidatos oralmen- te interpelados por tres entrevistadores diferentes sobre siete puntos con- cretos. Las correlaciones iban desde 0,54 a 0,66. Pero el resultado cambia cuando se pide a los entrevistadores que evalúen a esos candidatos de manera más cualitativa que descriptiva. Poniendo un ejemplo concreto, posiblemente se logrará un alto grado de consenso sobre el hecho de que el candidato mantiene actividades en diversas organizaciones ajenas a su trabajo. Pero si el juicio solicitado incluye una opinión del entrevistador sobre el valor predictivo, favorable o desfavorable, de esas actividades, el desacuerdo será importante, probablemente porque el juicio solicitado hace intervenir implícitamente una teoría sobre las causas del triunfo pro- fesional.

Así pues, el desacuerdo entre los entrevistadores es tanto más acusado cuando se les pide un juicio y no una mera descripción. Hay otras fuentes de varianza que explican la escasa fiabilidad. Guión (1965) señala tres: la

Page 116: Evaluacion Del Personal

96 EVALUACIÓN DEL PERSONAL

situación en que se pone al candidato, la experiencia del entrevistador y el método utilizado para conducir la entrevista. En efecto, el candidato pue- de sentirse a gusto o estar tenso por la manera en que se le recibe, y más o menos motivado por la actitud del entrevistador hacia él. Además, los entrevistadores poco curtidos suelen ser menos coherentes en su manera de llevar la entrevista y son relativamente influenciables. Por el contrario, los experimentados desarrollan estrategias personales no validadas para juzgar a sus «clientes». Así, uno de ellos, citado por Guión, tenía por costumbre decir que no tenía silla en su despacho. De los diferentes com- portamientos posibles (decir que no tiene silla, esperar sin decir nada, salir para buscar otra silla, o sentarse en el borde de la mesa), el entrevistador consideraba que el último era el «mejor>. Desde luego, poner a las perso- nas interrogadas en una situación estándar y observar su comportamiento constituye una estrategia válida y que se ha sistematizado con el nombre de entrevista «en situación». Pero dar a priori un valor positivo a alguno de los comportamientos, sólo puede apoyarse en un seguimiento sistemá- tico, y no en la intuición del entrevistador ni en un análisis superficial de las motivaciones que justifican los diferentes comportamientos. Final- mente, el procedimiento utilizado, el tipo y contenido de las cuestiones, el orden en que se plantean, etc. influyen sin duda en el tipo de resultados. En definitiva, se podría resumir diciendo que la fiabilidad de las entrevis- tas de evaluación realizadas por jueces diversos suele ser muy débil por- que casi nunca se hace nada para que sea más elevada.

Tampoco hay que extrañarse si los coeficientes de validez no dan resultados mucho más brillantes. Ulrich y Trumbo (1965) señalan que las valideces enumeradas en su revista sobre el tema raramente superaban el 0,30. Dunnete revisó todos los estudios de validez de los pronósticos fun- dados en entrevistas en diferentes puestos de la industria del petróleo: la r promedio no pasaba de 0,13. Reilly y Chao, en su reciente síntesis, actua- lizan esas cifras sin mejorar los resultados, ya que la r promedio a que llegan es de 0,19. Hunter y otros (1984), empleando el procedimiento estadístico que ellos mismos prepararon para hacer una síntesis de resulta- dos referidos a un mismo problema, encuentran un r global de 0,11 entre la evaluación fundada en entrevistas y los resultados profesionales.

No obstante, algunos autores han tratado de defender las cualidades predictivas de la entrevista, señalando los típicos defectos de los estudios de validez. En primer lugar, nunca se valida sólo la entrevista, ya que el entrevistador tiene siempre un dossier sobre la persona que recibe. Por eso mismo, los estudios de validación no pueden aislar lo que pertenece a la entrevista en sí y lo que se debe a informaciones sacadas del dossier. Otra cosa más importante aún, los criterios de triunfo profesional suelen de por sí tener escasa fiabilidad. En realidad, eso apenas influye en el

Page 117: Evaluacion Del Personal

resultado: en la investigación de Hunter citada en el párrafo anterior, la corrección introducida para tener en cuenta la escasa fiabilidad de los criterios sólo hace subir el r global de 0,11 a 0,14. Otro defecto clásico de los estudios de validez es el hecho de que se realicen exclusivamente sobre personas realmente contratadas, lo cual reduce la dispersión de las varia- bles predictivas y posiblemente también de los criterios. También en ese caso, Hunter introduce una corrección, pero con ello el resultado sólo sube de 0,14 a 0,22. En una palabra, podríamos resumir diciendo que la validez predictiva de las evaluaciones fundadas en entrevistas es muy dé- bil, y que ello es tanto más cierto cuando las evaluaciones poseen el carácter general de una predicción del éxito global en una actividad deter- minada.

Vale la pena citar una última investigación, porque en ella se han tenido en cuenta todas las críticas metodológicas antes reseñadas (Zedek y otros, 1983). Además, los autores no sólo han estudiado las correlaciones entre las evaluaciones proporcionadas por 10 entrevistadores sobre 131 individuos utilizando la misma parrilla de calificación a 19 aspectos, sino que además han realizado comparaciones detalladas de los resultados fa- cilitados por cada uno de los diferentes entrevistadores. De esta manera, han podido demostrar que todos los entrevistadores elaboran su juicio utilizando la misma estrategia, en el sentido de que todos basan su deci- sión final en un reducido número de aspectos o dimensiones. No obstante las dimensiones utilizadas por cada entrevistador son algo personal, lo que explica posiblemente la falta de acuerdo entre los jueces en el caso de las entrevistas. La validez calculada con relación a las notas profesionales asignadas 6 y 12 semanas después de la incorporación no es significativa, a pesar de que la correlación entre esas dos series de criterios de éxito profesional es bastante elevada (r = 0,51).

Estos resultados muestran bien a las claras que limitarse a calcular validez global sin tratar de comprender lo que ocurre durante la entrevis- ta, sobre todo sin analizar el proceso cognitivo que conduce a la evalua- ción y a la toma de decisión, no permite avanzar ni definir unos procedi- mientos susceptibles de mejorar la entrevista o, eventualmente, de limitar su papel a lo que sea capaz de predecir con verdadera eficacia. En otras palabras, es posible que ciertas descripciones recogidas durante la entre- vista sean útiles y pertinentes, pero dado que, en la mayoría de los casos, la entrevista se utiliza para tomar una decisión global o formular un pro- nóstico general sobre las posibilidades de éxito del candidato en un deter- minado puesto, o en una determinada formación, resulta escasamente válida. Lo cual no significa que la entrevista deba ser totalmente descarta- da, pero si se desea conocer con exactitud el valor de la entrevista como base de decisión, no basta con reconocer su escasa validez, y menos aún

EL «TRIO CLASICO»: REFERENCIAS... 97

Page 118: Evaluacion Del Personal

98 EVALUACIÓN DEL PERSONAL

con hacer caso omiso de ella, hay que analizar el proceso de toma de decisión en cuanto tal, ver que es lo que pudiera falsearlo y, finalmente, tratar de mejorar ese proceso, dotándolo de mayor rigor y formando a los entrevistadores.

Cómo se elabora un juicio sobre otra persona

Es este un problema de gran actualidad al que se dedican numerosas investigaciones, aunque por desgracia no ocurra así en Francia con la frecuencia deseable. Los resultados de estas investigaciones son especial- mente interesantes por cuanto se pueden interpretar dentro del marco de los modelos de «atribución». En efecto, la entrevista, incluso si su objeti- vo es una evaluación, constituye una interacción social que implica roles muy precisos y en el que cada uno interpreta el comportamiento del otro, atribuyéndole unas causas específicas, vinculadas al carácter individual o a la situación. El análisis del mecanismo de estas atribuciones arroja luz sobre la génesis de las opiniones sobre los demás que se elaboran en el transcurso de la entrevista.

Estos trabajos se refieren a tres aspectos del proceso:

� la manera en que el entrevistador trata las informaciones; � el papel desempeñado por las actividades y sentimientos persona-

les de cada entrevistador; � la interpretación de los comportamientos observados durante la

entrevista.

Existen numerosos estudios recientes sobre estos trabajos publicados en revistas inglesas o americanas. Para mayor detalle, remitiremos al lec- tor a las síntesis de N. Schmitt (1976), de Arvey y Campion (1982) y al artículo de Herriott (1981) sobre la teoría de la atribución aplicada a la entrevista de selección de personal.

Las investigaciones sobre la manera en que son tratadas las informa- ciones recogidas durante la entrevista y en que dichas informaciones ex- perimentan integración para llegar a una decisión, se han centrado en tres aspectos principales:

� La sucesión de acontecimientos durante la entrevista y, sobre todo, lo que acontece antes y después de adoptarse la decisión.

� El respectivo papel de las informaciones verbales y no verbales. � El papel desempeñado por el eventual contraste entre los sucesivos

candidatos.

Page 119: Evaluacion Del Personal

EL «TRIO CLASICO»: REFERENCIAS... 99

Al contrario de lo que podría pensarse, la decisión final se produce muy pronto durante la entrevista, con frecuencia en el primer tercio de la misma, a veces en los primeros minutos. Parece que las decisiones en sentido positivo se adoptan antes que las decisiones negativas. En la géne- sis de esta evaluación global que justifica la decisión, el orden en que el entrevistador recibe las diferentes informaciones tiene su importancia. Efectivamente, se observa un efecto de «primacía», es decir, que las pri- meras informaciones tienen un peso relativamente mayor. Además, las primeras impresiones pesan más en la decisión que las informaciones de los hechos recibidas durante la entrevista. En fin, si observamos con deta- lle el comportamiento y las intervenciones del entrevistador una vez to- mada la decisión, veremos que pone menos atención, que habla más él que candidato y que, en el caso de que la decisión sea favorable, dedica su tiempo más bien a «venden» el puesto o la formación a su interlocutor.

Las informaciones aprovechadas por el entrevistador pertenecen a dos órdenes. Por un lado, las respuestas dadas por el candidato a las preguntas planteadas y, en general, todo lo que diga durante la entrevista; por otro lado, las informaciones no verbales. Las investigaciones realizadas pare- cen indicar que las observaciones del comportamiento (no verbal) son importantes, aunque existirían importantes diferencias individuales sobre este punto, diferencias que podrían explicar el escaso acuerdo entre diver- sas valoraciones basadas en entrevistas. Los comportamientos que más se tienen en cuenta se refieren a la dirección de la mirada (el hecho de mirar al interlocutor a la cara y mantenerle la mirada es un factor favorable), la presencia de sonrisas y movimientos de cabeza, que se interpretan como signos de relajación, y el hecho de hablar con voz muy baja y apenas modulada, lo que revelaría una falta de confianza en uno mismo. Por supuesto, eso son sólo prejuicios, tal vez con cierto fundamento, pero sin confirmación, por más que estén muy extendidos.

En la mayoría de los casos, los entrevistadores reciben a una serie de candidatos de forma consecutiva. ¿Se produce algún efecto de contraste? Dicho en otras palabras, ¿se juzga más favorablemente al candidato que se presenta después de dos entrevistas desastrosas? ¿Y más desfavorable- mente al candidato que tiene la mala fortuna de presentarse detrás de un fuera de serie? La cuestión está sobre el tapete: los resultados de las inves- tigaciones sobre este punto no resultan claras y es bastante posible, por lo demás, que los entrevistadores bien formados sepan evitar este escollo.

Estas observaciones nos hacen pensar que las decisiones basadas en entrevistas podrían alcanzar mayor validez si todas las entrevistas se lleva- ran con igual ritmo y contenido y si todos los entrevistadores recibieran idéntica formación. Las actitudes y sentimientos personales de los entre- vistadores parecen introducir un sesgo determinado en su calificación y

Page 120: Evaluacion Del Personal

100 EVALUACIÓN DEL PERSONAL

decisión. Se ha podido observar que, en general, tienen prejuicios contra las mujeres, salvo en casos en que éstas posean una gran cualificación o sean candidatas a puestos mayoritariamente ocupados por mujeres. Tam- bién es verdad que ocurre lo contrario, es decir, que los hombres que se presentan a empleos tradicionalmente desempeñados por mujeres son asi- mismo víctimas de una prevención negativa. Las personas disminuidas son evaluadas con un prejuicio desfavorable por su minusvalía, aunque contrarrestado por cierto prejuicio favorable debido a la motivación que se les atribuye al presentarse a pesar de su desventaja. Finalmente, y esto es muy importante, existe un efecto de similitud que produce una inclina- ción positiva hacia cualquier persona que presente alguna semejanza con el entrevistador (de sexo, edad, origen étnico, formación, etc.).

Los prejuicios no son las únicas causas de distorsión e inexactitudes en los juicios que se forman durante la entrevista. En efecto, muchas investi- gaciones indican que los entrevistadores elaboran normas sobre los «bue- nos» y «malos» candidatos. Las más de las veces, tales representaciones del candidato ideal difieren según cada entrevistador, lo que puede igual- mente explicar el escaso acuerdo entre ellos. Esta imagen del «buen» candidato corresponde, por un lado, a una representación personal de la manera acertada de ejecutar el trabajo exigido, y por otro lado, a unas teorías implícitas sobre la personalidad. Efectivamente, al no tener siem- pre informaciones lo bastante precisas sobre el contenido y las obligacio- nes de los puestos para cuya provisión se realiza la entrevista, los entrevis- tadores se hacen una idea con frecuencia inadecuada del trabajo a realizar. Además, sus ideas implícitas sobre la personalidad les lleva a asociar, de manera muy peculiar en ellos, por un lado, los comportamien- tos observables durante la entrevista y por otro, los comportamientos profesionales esperados, y ello en el marco de una clasificación de los comportamientos y de los rasgos de personalidad. Al tratarse de teorías implícitas, no son contestadas ni discutidas y, a falta de una encuesta o de una formación específica sobre este punto, los desfases entre los entrevis- tadores no se ponen de manifiesto, lo que contribuye aún más a acrecen- tar el desacuerdo entre los diversos juicios.

En todos estos puntos se puede ir más allá de la simple descripción de vicios y contradicciones. En efecto, las investigaciones experimentales en psicología social han permitido desarrollar modelos y precisar reglas sobre la percepción y la evaluación de los demás en situaciones sociales. Tales reglas y modelos se pueden aplicar a la situación de entrevista y permiten reconstruir el mecanismo de evaluación que en ella tiene lugar (Herriott, 1981).

Como vimos antes, la percepción del otro se realiza a partir de obser- vaciones del comportamiento en una situación social conforme a un pro-

Page 121: Evaluacion Del Personal

EL «TRIO CLASICO»: REFERENCIAS... 101

ceso llamado «de atribución». Esto quiere decir que atribuimos el com- portamiento observado en los demás a unas causas específicas. Tales causas se pueden clasificar en dos categorías, según vayan asociadas a las características individuales o a la situación en que se encuentra la perso- na. En otras palabras, la percepción del otro y los juicios que se forman sobre él responden a un doble proceso: no tomar en consideración las conductas que se consideran como determinadas por la situación y, en cambio, atribuir ciertos comportamientos observados a causas individua- les, es decir, a rasgos o disposiciones que se infieren en el individuo eva- luado.

En este sentido, resulta evidentemente muy importante saber cómo se realiza en la entrevista la atribución del comportamiento a causas situa- cionales o a causas individuales. Todos los comportamientos observados en los demás los percibimos como «normales», habida cuenta de la situa- ción (es decir, explicables por las características y exigencias de la situa- ción), o bien como atípicos (es decir, explicables por los caracteres singu- lares del individuo observado), lo cual explica que todos nos atengamos a unas expectativas específicas sobre lo que es normal o raro y atípico en una situación dada. Este mecanismo cognitivo funciona en las situaciones de entrevista en las que el entrevistador recibe e interroga a un candidato para un determinado puesto: partiendo de la base de su anterior experien- cia, de la cultura de la empresa y de sus normas personales, espera que el candidato se comporte de una manera determinada.

Las reglas que se desprenden de este análisis han sido verificadas me- diante numerosas investigaciones experimentales. Estas indican bien a las claras que la atribución se hace en función de lo que se juzga como relevante del individuo o de la situación y de lo que se considera como normal o como atípico. Para precisar más, si el comportamiento del en- trevistado se juzga poco habitual, si no se ha producido frecuentemente en la experiencia que el entrevistador tiene de este tipo de entrevistas, se atribuirá a los caracteres propios del individuo y la percepción del candi- dato se inferirá a partir del comportamiento observado. Por el contrario, si el comportamiento se juzga acorde con el rol del candidato, no se tendrá en cuenta al elaborar la descripción del individuo, de que el entre- vistador considerará que es la situación la que ha inducido tal comporta- miento y no la personalidad del individuo. Esto resulta particularmente cierto en lo que respecta al comportamiento no verbal, considerado como más espontáneo y menos controlado por el individuo. Por ejemplo, algu- nas investigaciones sobre el contacto ocular han mostrado que, en gene- ral, el hecho de mirar al interlocutor a los ojos se interpreta como señal de confianza en uno mismo. Pero tal atribución se verá matizada por lo que se espera del candidato: el entrevistador valorará como más baja la con-

Page 122: Evaluacion Del Personal

102 EVALUACIÓN DEL PERSONAL

fianza en sí misma cuando se trata de personas de estatus elevado que evitan la mirada de su interlocutor que cuando se trata de personas de un estatus modesto. Así mismo, se ha podido demostrar experimentalmente que si las primeras atribuciones han permitido al entrevistador pergeñar una caracterización del individuo que tiene ante sí, durante el resto de la entrevista dará prioridad a las observaciones que le permitan confirmar su hipótesis, más que desmentirla.

Cómo mejorar la entrevista

Al comienzo de nuestra exposición sobre la entrevista como medio de evaluación, señalábamos que existe una aparente contradicción entre su escasa validez y su amplia utilización, y habíamos adelantado tres razones para explicar tal contradicción. Está claro que la primera de esas razones es válida: la entrevista se sigue utilizando porque tiene otras funciones. Representa la posibilidad de un contacto social dentro del proceso de decisión, contacto que humaniza dicho proceso, da ocasión al candidato de expresarse e informarse y le da asimismo la impresión de haber sido juzgado «por sí mismo», tal y como se presenta, y no a partir de signos o resultados cuya interpretación le resultan un misterio. En otras palabras, la entrevista sigue y seguirá utilizándose porque posee una fuerte validez a los ojos de los candidatos. Tiene además la ventaja de estar aparentemen- te al alcance de cualquiera, en el sentido de que charlar con alguien y hacerse una idea de él es una actividad cotidiana y familiar. Ya hemos visto que la elaboración de un juicio, por habitual que sea, no deja de suponer prejuicios, sistemas de valor y de interpretación idiosincrática que hacen de la evaluación de los demás un procedimiento tan frecuente como poco objetivo.

La segunda razón aducida en apoyo del empleo de la entrevista es que se la supone capaz de medir algo que escapa a las técnicas de evaluación, como, las cualidades sociales, los intereses y la motivación. Resulta difícil pronunciarse sobre la validez de la entrevista en lo que respecta a estos puntos concretos, de que las investigaciones que hemos resumido han tratado de validar la decisión surgida de la entrevista, pero no la evalua- ción de rasgos precisos. Por lo cual, y aun en el caso de que la entrevista fuera válida en estos aspectos, no se debería utilizar en casos en los que no resulte válida, es decir, para proporcionar un juicio global de adecuación al puesto, ni en aquellos casos en que las cualidades sociales, los intereses y la motivación desempeñen un papel secundario para el éxito profesio- nal.

Nos queda la tercera explicación, según la cual la entrevista y los

Page 123: Evaluacion Del Personal

EL «TRIO CLASICO»: REFERENCIAS... 103

juicios que sustenta se consideran como válidos cuando en realidad no lo son. Esto ocurre probablemente en la mayoría de los casos. Lo que equi- valdría a decir, para terminar con este punto, que la entrevista es necesa- ria en el procedimiento de toma de decisión en materia de personal, que seguirá siendo utilizada y que, por ello, conviene realizar las entrevistas en las mejores condiciones posibles y prevenir a quienes las hacen o utilizan sus resultados sobre las limitaciones de las evaluaciones que se hacen mediante ellas.

Como aquel personaje de Moliere que hablaba en prosa sin saberlo, diariamente llevamos a cabo entrevistas y evaluaciones, lo cual no signifi- ca que los procesos que implican sean simples y transparentes. El diagra- ma adjunto trata de representar de forma concisa todos los factores que entran en juego y en interacción en la elaboración de una opinión sobre los demás en el transcurso de la entrevista: es evidente que los factores «parásitos», en el sentido de que son independientes de las cualidades propias del individuo sometido a juicio, son muy numerosos, difíciles de aislar y más aún de controlar.

Page 124: Evaluacion Del Personal

104 EVALUACIÓN DEL PERSONAL

No obstante, una representación más precisa de los procesos sociales y cognitivos que actúan en la entrevista permitirá formular algunos conse- jos que deberían dotarla de mayor validez y mejorar el grado de acuerdo entre los diversos calificadores. Estos consejos se refieren a la elección y formación de los entrevistadores y los medios de que debe dotárseles.

1. Sería muy deseable «seleccionar a los seleccionadores». Desde lue- go, no es nada fácil; no obstante, conservar al menos algún rastro de las evaluaciones y compararlas sistemáticamente con la realidad, permitiría que no se siguieran confiando entrevistas y evaluaciones a quienes se equivoquen de manera y grave y frecuentemente.

2. Más deseable aún sería formar a los entrevistadores y no seguir considerando esto como la cosa más natural del mundo, algo que no necesita enseñarse. ¿En qué consistiría dicha formación? Ante todo, es preciso que las personas que han de realizar las entrevistas estén informa- das de la índole de vicios y deformaciones que acabamos de exponer someramente, así como de los procesos cognitivos que entran en juego en la evaluación. Mas aún, habría que hacerles participar en un juego de roles que les permitiera tomar conciencia de sus fallos y prejuicios perso- nales. A un nivel más técnico, es preciso enseñarles la utilización de fichas de calificación, los defectos y límites de estas fichas y la manera de sosla- yarlos. Finalmente, habría que enseñarles a escuchar y a observar y tam- bién a dejar que el candidato se exprese y haga preguntas.

3. Ya hemos señalado hasta qué punto son variados los medios que las organizaciones ponen a disposición de quienes tienen a su cargo reali- zar entrevistas con el personal. Sería deseable que recibieran todas las informaciones necesarias. El sentido común exige proporcionarles una descripción exacta y precisa de las exigencias del puesto a proveer, o de la formación para la que se está reclutando gente, así como de las posibilida- des futuras de hacer carrera. Es evidente, aunque no siempre se tiene en cuenta, que si el conjunto de entrevistadores no posee la misma informa- ción, el juicio de cada entrevistador sobre los candidatos «buenos» y «ma- los» estará en desacuerdo con el de los demás. En ese mismo sentido, hay que entregar a los entrevistadores una lista de los puntos a evaluar. Hay dos posibles estrategias: o bien facilitar la misma lista a varios entrevista- dores, para luego contrastar sus juicios, o repartir entre ellos temas dife- rentes para luego hacer una síntesis de sus observaciones. En todo los casos, es importante que la entrevista esté tan estructurada como sea posible, es decir, que el entrevistador disponga de una lista de los puntos a cubrir, en un determinado orden, incluso de una lista de preguntas que se deben plantear, aun cuando esas preguntas no se configuren de manera cerrada, sino que constituyan una simple guía para la entrevista.

Page 125: Evaluacion Del Personal

EL «TRIO CLASICO»: REFERENCIAS... 105

Todas las investigaciones (Cook, 1988) indican que las entrevistas son más fiables y precisas cuando están estructuradas, es decir, cuando el entrevistador utiliza una lista de preguntas a las que debe responder el candidato (por ejemplo: ¿qué deportes practica usted?) y una lista de pre- guntas que debe plantearse a sí mismo a propósito del candidato (por ejemplo, el entorno familiar del candidato ¿estimula o no su motivación para el trabajo?). La entrevista «en situación» va más lejos (Latham y otros, 1980). En este método, para redactar el guión de la entrevista se busca apoyo en los «incidentes críticos» que describen situaciones sacadas de la realidad y que caracterizan comportamientos eficaces o ineficaces dentro del puesto a cubrir. Esos incidentes están redactados de manera que representen situaciones en las que el candidato habrá de decir cómo reaccionaría y porqué. Por otro lado, los mandos habrán preparado una tabla de evaluación de las diferentes respuestas a cada situación, respues- tas que podrán así ser evaluadas por los entrevistadores de manera cohe- rente. Los datos experimentales referentes a este procedimiento indican que es bastante fiable y que resulta razonablemente válido con relación a las evaluaciones dadas por los mandos.

Un interesante ejemplo que combina la entrevista estructurada y la entrevista en situación ha sido recientemente desarrollado y meticulosa- mente probado por Campioni y otros (1988). Tras un análisis del trabajo destinado a identificar los conocimientos, aptitudes y capacidades reque- ridas para el puesto a cubrir, y tras haber hecho que un panel de expertos de importancia relativa elaboraran una serie de preguntas, éstas se plan- tearon de idéntica manera a todos los candidatos. Estas preguntas se refe- rían a conocimientos necesarios para el trabajo que habrían de desempe- ñar y a casos hipotéticos ante los cuales el candidato tenía que indicar el comportamiento que hubiera adoptado. Todas las entrevistas fueron rea- lizadas por la misma persona, asociada a otros dos «jueces» que no hacían preguntas. El acuerdo entre los calificadores fue muy elevado (r = 0,88) y la correlación con un criterio de éxito profesional constituido por una escala de observaciones fue de 0,40 y de 0,56, tras la corrección para restringir la dispersión y no-fiabilidad del criterio. Aparte de esto, se die- ron fuertes correlaciones entre los resultados de esta entrevista y los obte- nidos mediante tests escritos de inteligencia y de aptitud, lo que permite a los autores subrayar el fuerte componente cognitivo de este tipo de entre- vistas.

El «trío clásico» �referencias, CV y entrevista» seguirá siendo por mucho tiempo un factor central en los procedimientos de evaluación en materia de gestión de personal. Pero hay que ser conscientes de que no se les puede pedir demasiado y de que hay que emplearlos de manera ade- cuada. Las organizaciones que nunca han tratado de comprobar sus mé-

Page 126: Evaluacion Del Personal

106 EVALUACIÓN DEL PERSONAL

todos de evaluación no sabrán, posiblemente, hasta qué punto se debe confiar en dichos métodos y cómo se pueden mejorar. Tampoco sabrán cuáles son sus límites, ni la manera de completar dichos métodos recu- rriendo a otras técnicas que enseguida describiremos en el siguiente capí- tulo.

Page 127: Evaluacion Del Personal

6

Aptitud cognitiva y aptitudes específicas

Un poco de historia nos ayudará a comprender los problemas que plantea la noción de aptitud. En 1796, Maskelyne, astrónomo del Real Observatorio de Greenwich, despidió a su asistente, Kinnerbrook, porque éste anotaba las estrellas que pasaban por el campo de su telescopio un segundo después que su patrón. Semejante fallo sólo podía deberse, según Maskelyne, a una falta de atención. Veinte años más tarde, otro astróno- mo del mismo observatorio, Bessel, notó igualmente diferencias entre las observaciones hechas por los miembros de un equipo de astrónomos en- cargados de realizar unas mismas observaciones. Vio que las diferencias eran estables y propias de cada individuo. Para subrayar bien su naturale- za, las llamó «ecuaciones personales» y mostró que la medida de esta ecuación personal en una situación de prueba permitía predecir la calidad futura de las observaciones astronómicas. Eso es justamente lo que noso- tros tratamos de hacer: medir unas características personales estables y que arrojen alguna predicción sobre el comportamiento profesional.

En realidad, Bessel también había observado que un mismo astróno- mo tenía unos tiempos de reacción que variaban ligeramente de un mo- mento a otro, pero decidió que esas variaciones resultaban desdeñables en comparación con las diferencias entre distintos individuos. Habría que esperar todavía cincuenta años para que se distinguieran claramente la diferencias inter e intraindividuales, para que Galton presentara el primer sistema racional que permitía clasificar a las personas según su «eminen- cia» y mostrara que todas las aptitudes humanas están distribuidas según una curva «normal», lo que permite caracterizar a cada individuo según su rango dentro de una distribución.

Siguiendo los pasos de Galton, en el primer laboratorio de psicología experimental creado por Wundt en Leipzig en 1880, varios investigadores trataron de aplicar estas nociones teóricas y medir las diferencias indivi- duales referentes a la capacidad de aprendizaje. Dentro de la tradición de

107

Page 128: Evaluacion Del Personal

108 EVALUACIÓN DEL PERSONAL

la ecuación personal y dentro de la perspectiva de los trabajos de psicolo- gía sensorial llevados a cabo por Wundt, estos primeros «test mentales» eran medidas de tiempos de reacción, de sensibilidad del tacto, visual y auditiva, de fuerza y de rapidez motriz. La elección injustificada de los tests utilizados explica el total fracaso de aquella primera tentativa: los colaboradores de Wundt no consiguieron poner de manifiesto una rela- ción entre sus tests psicomotores y sensoriales, por un lado, y los resulta- dos escolares de niños y adolescentes, por otro (Ebbinghaus, 1897).

Por aquella misma época, Binet comenzaba sus investigaciones sobre niños con dificultades escolares. Enseguida se alzó contra la utilización de tests sensoriales y motores para explicar actividades mentales cuya com- plejidad insistía en subrayar. Abundando en la necesidad de estudiar la memoria, la imaginación, el razonamiento y la atención, Binet comenzó a analizar el trabajo escolar y a elaborar unas tareas similares a las que se le presentaban al niño en la escuela. Los resultados obtenidos le llevaron a pensar que era posible medir la aptitud mental con ayuda de esos ejerci- cios, con el fin de predecir los resultados escolares de los niños examina- dos. En 1905 se publicó el primer test de Binet, treinta ejercicios reunidos bajo el nombre de escala métrica de inteligencia, e inmediatamente fue utilizado en las escuelas parisinas. Esta primera tentativa suscitó el mayor interés por parte de la comunidad científica internacional. Sobre todo, constituyó la primera etapa en el largo y penoso camino de medir las diferencias individuales en aptitud. El tiempo demostraría que, una vez más, los franceses supieron ser pioneros, pero no supieron o no pudieron sacar partido del paso dado.

¿Qué tiene de innovadora la obra de Binet? Ante todo, el hecho de implicar la definición del concepto de aptitud y mostrar la utilidad de medirla. Las aptitudes son características que diferencian a los individuos entre sí; si se sabe medirlas, se podrán predecir los resultados ulteriores en el aprendizaje o ejecución de una tarea que las haga entrar en juego. El interés de este enfoque no se limita, claro está, al período escolar. La vida profesional está hecha de sucesivos aprendizajes; y el progreso tecnológico no ha hecho sino aumentar la importancia de la capacidad de aprender. Uno de los méritos de Binet fue haber comprendido, a través de las difi- cultades que tuvo para medir las aptitudes mentales, que para poder ejer- cerse, todas las aptitudes deben desarrollarse mediante la formación y movilizarse mediante la experiencia. Las consecuencias de este hecho son capitales para la valoración del potencial humano en el mundo laboral. Efectivamente, como bien supo ver Binet, no se puede medir una aptitud independientemente de la tarea que la utiliza, es decir, independiente- mente de otras aptitudes que entran simultáneamente en juego, ni tampo- co independientemente de las adquisiciones del aprendizaje. De hecho,

Page 129: Evaluacion Del Personal

APTITUD COGNITIVA Y APTITUDES ESPECIFICAS 109

las aptitudes desempeñan un triple papel en el cumplimiento de las activi- dades profesionales. Por un lado intervienen en la formación inicial, para la que representan una de las condiciones esenciales, y por otro facilitan la progresiva adquisición de conocimientos aportados por la experiencia so- bre la marcha. Las aptitudes, finalmente, son factores importantes de la buena realización de esas tareas, en la medida en que éstas suponen unas actividades mentales.

El éxito de Binet no se debió sólo a la novedad de sus concepciones, sino también al método que utilizó para explorar esa tierra incógnita. Analizó con cuidado las tareas escolares e indagó sistemáticamente qué tests permitían diferenciar a los buenos alumnos de los alumnos con pro- blemas. Esto le permitió avanzar paso a paso, aprendiendo de los errores, quedándose sólo con las pruebas o con las mediciones que mostraban una correlación con los resultados escolares, y ello sin prejuicios, es decir, ensayando todo lo que le parecía que podía ser interesante, tanto el volu- men del cráneo como los rasgos de escritura. Con ello, pronto se dio cuenta de que los alumnos brillantes eran superiores en todos los «tests», o dicho de otro modo, que los resultados obtenidos con las pruebas que preparaba para distinguir a los alumnos buenos de los malos guardaban una fuerte correlación. O, todavía de modo más concreto, que un mismo factor, la inteligencia, intervenía de forma importante en todas las tareas escolares y en todas las tareas del test.

Los primeros resultados obtenidos por Binet siguen siendo fundamen- tales. Ante todo, mostró que las pruebas de captación sensorial, así como aquellas que ponen en juego funciones simples, como la rapidez de reac- ción, no estaban vinculadas al funcionamiento mental (ahora diríamos al funcionamiento cognitivo), y propuso un concepto de inteligencia (no sólo, según su célebre boutade, «lo que miden los tests») como la capaci- dad de adaptar el propio comportamiento para alcanzar el fin perseguido y hacer una crítica de ese mismo proceso. Antes de Binet, la inteligencia se concebía más bien como un haz de facultades, entre las cuales figura- ban el razonamiento, la memoria, la atención y también la discrimina- ción sensorial, facultades que no guardan vínculos evidentes con nuestras actividades cotidianas. Binet comprobó, que resultaba imposible medir estas diferentes facultades de manera aislada, ya que cualquier tarea pone siempre en juego varias aptitudes. Decidió además valorar las aptitudes mediante los resultados observados en la ejecución de las tareas tipo tests, sin tratar de medir la contribución específica de cada una, sino más bien con la idea de que la inteligencia participa en el éxito de todas las activida- des mentales.

El éxito de Binet, tanto en Francia como en el extranjero, sobre todo en Estados Unidos, fue tan inmediato como notable. Los tests que había

Page 130: Evaluacion Del Personal

110 EVALUACIÓN DEL PERSONAL

preparado con sus colaboradores fueron traducidos, adaptados y constras- tados en todos los países. Pero, ¿qué relación hay entre estos esfuerzos de un médico que se enfrenta a unas dificultades escolares y lo que aquí nos interesa, es decir, medir las aptitudes de los adultos? La relación es direc- ta: cuando al comienzo de la Primera Guerra Mundial se encargó a los oficiales americanos que formaran y entrenaran a los civiles movilizados y que distribuyeran entre ellos las tareas y funciones requeridas para el buen funcionamiento de un ejército en guerra, se inspiraron en los tests de Binet para crear una prueba de inteligencia general, denominada «Army alpha». Fue un instrumento de especial utilidad, dado que la ma- yoría de los hombres movilizados eran inmigrantes recientes, con un bajo nivel de escolaridad o, en el mejor de los casos, con un nivel difícil de evaluar, y muchos de ellos sólo entendían algunas palabras de inglés.

El Army alpha estaba compuesto por preguntas de cultura general, razonamientos simples y tareas que ponían en juego la capacidad para ejecutar consignas y manejar cifras. Fue utilizado para una población muy amplia, muy diversificada y sobre la cual se tenían en conjunto pocas informaciones pertinentes respecto a las aptitudes, y, por tanto, muy pocos medios para predecir las posibilidades de un futuro éxito. Ya vimos en el capítulo cuarto que hay otros factores distintos a la validez que pueden determinar la utilidad de un test y, más en general, de una prueba de evaluación. Es evidente que el Army alpha fue utilizado en condiciones especialmente favorables, ya que se tenía muy pocas infor- maciones que permitieran adoptar decisiones urgentes, y porque la pobla- ción afectada era muy diversa. Lo que está claro es que si el método en sí hubiera sido ineficaz, el conjunto de la operación habría terminado con un fracaso. Cosa que no ocurrió: no sólo se cumplieron las promesas de los tests, sino que las comparaciones hechas entre los resultados obtenidos por diversos grupos profesionales permitieron observar diferencias lógicas e importantes entre esos grupos. Estos resultados fueron ampliamente descritos y comentados en la prensa y se presentaron como pruebas de la validez de ese test en concreto y de los tests de inteligencia en general.

Esta experiencia de la utilización dentro de una escala y unas condi- ciones excepcionales de un único y mismo test, permitió aportar dos nue- vos datos: la prueba de la eficacia de los tests como medio de pronosticar el éxito profesional y el hecho de que los resultados de los tests de inteli- gencia son fuertemente dependientes del nivel de educación alcanzado por los individuos sometidos a la prueba.

Con la vuelta a la vida civil, los oficiales que habían sido testigos de estos esfuerzos y de su provecho sacaron la conclusión de que los tests de inteligencia podían ser sumamente útiles para predecir los resultados es- colares y los resultados profesionales. De ahí toda una serie de trabajos

Page 131: Evaluacion Del Personal

APTITUD COGNITIVA Y APTITUDES ESPECIFICAS 111

que permitieron el desarrollo de numerosos tests nuevos, de estudios so- bre su significación y de investigaciones fundamentales y aplicadas sobre las aptitudes, su estructura, su significación y la validez de los métodos que permiten medirlas.

¿De qué problemas se trata? Para mejor entenderlo, volvamos por un momento a la historia para ver cómo unas necesidades sociales imperio- sas (las de los alumnos de la escuela primaria francesa primero, las de los reclutas del ejército americano más tarde) obligaron a poner el carro de- lante de los bueyes, es decir, a fabricar instrumentos y aplicarlos antes de disponer de un modelo teórico y de unas definiciones claras sobre lo que se quería medir.

Binet, como antes vimos, se dio cuenta de que sus «buenos» alumnos sacaban con éxito prácticamente todas las tareas que les proponía, y que, por el contrario, los «malos» alumnos no tenían éxito en ninguna de ellas. De ahí le vino la idea de que, a pesar de su diversidad, los diferentes ejercicios que integraban su test permitían medir una aptitud mental fun- damental. Claro que resultaba imposible medir siempre solamente esta aptitud general, pero también estaba claro que los demás aspectos, inevi- tables, de la tarea, los otros factores del éxito, eran algo desdeñable y apenas suponían una especie de «ruido de fondo» dentro de la medición. Tras la Guerra del 14, aleccionados por el éxito obtenido y al que antes nos referíamos, los psicólogos multiplicaron el número y diversidad de pruebas a las que sometieron simultáneamente a grupos importantes de adultos situados en el umbral de la vida activa o ya integrados en ella. Comprobaron que el panorama era más complejo de lo previsto por Bi- net. En efecto, por un lado se confirmaba que existían correlaciones apre- ciables entre los resultados obtenidos por los mismos individuos en test de aptitud diferentes. Por otro lado, se pudo observar que estos resultados no dejaban de tener una cierta y verdadera independencia, en el sentido de que algunos individuos podían estar muy bien dotados para una tarea concreta y no para otra.

Ahora es más fácil confeccionar la lista de problemas de los que qui- siéramos ocuparnos en las páginas siguientes. La apretada exposición his- tórica que hemos diseñado nos ha mostrado cómo los desarrollos teóricos venían estimulados por la aplicación práctica, y viceversa. Hoy día sigue ocurriendo lo mismo, hasta el punto de que tendremos que ver, antes de terminar, las consecuencias teóricas del empleo de ordenadores y aparatos especiales para pasar los tests de aptitud.

¿A qué problemas nos referíamos antes? El primero y fundamental, desde el punto de vista teórico, se refiere a la estructura de las aptitudes. Existe una aptitud general dominante y unas aptitudes específicas de me- nor importancia? En tal caso, qué relaciones guardarían entre ellas? ¿O

Page 132: Evaluacion Del Personal

112 EVALUACIÓN DEL PERSONAL

bien se trata de aptitudes específicas más o menos importantes, situándo- se algunas a mitad de camino entre la aptitud general y las aptitudes específicas propiamente dichas? Es preciso que quien utiliza métodos de valoración sepa a qué atenerse frente a la estructura más verosímil, aun cuando no se le haga entrar en el laberinto de las disputas metodológicas, estadísticas y conceptuales.

El segundo punto sobre el que quisiéramos arrojar alguna luz consiste en clasificar los métodos disponibles, explicar las diferencias que guardan entre sí, su razón de ser y su justificación. Ello nos lleva de una manera natural a preguntarnos por la validez de los tests de aptitud y por las eventuales variaciones de esa validez para diferentes tipos de oficios y em- pleos.

Tercer punto, si los métodos que miden las aptitudes son válidos, si resisten la prueba del tiempo (como es el caso) y demuestran su validez predictiva, es preciso que tratemos de comprender el porqué. Y, claro está, asociar esos análisis a los principios teóricos expuestos en la primera parte.

Iniciábamos este capítulo con una introducción histórica porque ello nos permitía identificar los problemas de fondo planteados por la medi- ción de las aptitudes. Era también una manera de mostrar que, en este terreno, la aplicación y los problemas de campo han dirigido la reflexión y orientado la investigación fundamental. En ese sentido, la historia de la medición de las aptitudes está lejos de haber concluido. Una nueva pági- na se ha abierto con la irrupción del «CAT» (computer assisted testing) o tests asistidos por ordenador. Con esa nueva vía y las perspectivas que promete finalizaremos nuestro capítulo.

* * *

¿Cómo se ha estudiado la estructura de las aptitudes? Tomemos como punto de partida la constatación hecha por Binet y luego apoyada por los resultados obtenidos con el Army alpha: en cualquier tarea, el éxito de- pende a la vez de una aptitud «general» (que se denomina inteligencia o funcionamiento cognitivo) y de una o varias aptitudes específicas. La identificación de esas aptitudes y su posterior clasificación, se han llevado a cabo progresivamente gracias a esa técnica de tratamiento de datos que es el análisis factorial. Dicho análisis permite, tras haber hecho las mismas pruebas a un número importante de personas, estudiar las intercorrelacio- nes entre los resultados obtenidos, precisar cuántas aptitudes permite me- dir válidamente el conjunto de tests utilizados y reducir las confusiones debidas al hecho de medir una misma cosa con nombres diferentes. El análisis factorial permite asimismo saber qué pruebas proporcionan un

Page 133: Evaluacion Del Personal

APTITUD COGNITIVA Y APTITUDES ESPECÍFICAS 113

resultado parecido y por ello clarificar la significación de las diferentes medidas de aptitud como medidas de interés y de personalidad, como veremos en el siguiente capítulo.

¿Qué resultados ha dado este esfuerzo analítico? Ante todo, hay que precisar que las aptitudes identificadas son de diversa índole. Pueden ser relativamente amplias, es decir, intervenir en un gran número de tareas, o por el contrario, muy concretas y sólo desempeñar un papel en la realiza- ción de tareas muy específicas. Por supuesto, las aptitudes de amplio alcance no son muy numerosas. Podríamos citar la aptitud verbal, que interviene en el éxito de todas las tareas y actividades que supongan el manejo de palabras y de frases, la aptitud espacial, que desempeña un papel en la ejecución de trabajos que requieran una atinada percepción de los objetos en el espacio y la capacidad de interpretar representaciones planas de objetos tridimensionales, y la aptitud numérica, que se refiere al manejo de números y a la facilidad de efectuar operaciones con ellos. También se han identificado numerosas aptitudes especializadas, como el dominio del vocabulario, la comprensión de un texto escrito, la ejecución de instrucciones presentadas oralmente, la fluidez de asociaciones verba- les, el manejo de símbolos o incluso el de representaciones figurativas.

¿Cuáles son las relaciones entre estas diferentes aptitudes? Las investi- gaciones efectuadas para responder a esta pregunta son bastante numero- sas. Además, existen algunas técnicas de análisis factorial que, aplicadas a idénticos datos, proporcionan resultados ligeramente disparejos entre sí. Aún más, como cada investigación afecta a conjuntos de tests diferentes, sus resultados varían también. Por todo ello, las discusiones entre psicólo- gos especialistas de la estructura de las aptitudes parecen bizantinas a los usuarios de las técnicas de evaluación, quienes han sacado la conclusión de que lo que dominaba al respecto eran la contradicción y la confusión. Sin embargo, hay dos conclusiones sobre las que se puede considerar logrado un acuerdo y que trataremos de resumir claramente.

La representación más verosímil del conjunto de aptitudes correspon- de a una estructura jerárquica. Esto significa varias cosas.

� La aptitud general (llamada aún aptitud mental o funcionamiento cognitivo) desempeña un papel en todas las tareas, ya se trate de tareas profesionales o de tests, y dicho papel siempre es importante. Concreta- mente, esta aptitud general representa aproximadamente el 50 % de la varianza de los resultados de los tests mentales, y constituye un factor determinante del éxito en las tareas que implican una actividad mental. Está constituida esencialmente por la capacidad de separar los aspectos pertinentes de una situación, de una tarea o de datos observados y de identificar las relaciones que existen entre esos aspectos significativos.

Page 134: Evaluacion Del Personal

114 EVALUACIÓN DEL PERSONAL

� El resto de la varianza se explica por aptitudes independientes unas de otras y que son más o menos amplias (es decir, que cubren un gran número de tests o tareas) o puntuales y específicas (es decir, que cubren un restringido número de tests o de tareas).

� El éxito, pues, en una tarea (o en un test concreto) se debe siempre a una aptitud cognitiva general y a una o varias aptitudes de amplio alcance (aptitud numérica, espacial, verbal y numérica), así como a una o varias aptitudes específicas.

En la práctica, esto significa que existen cuatro categorías de tests de aptitud según que traten de medir:

� El funcionamiento cognitivo de una manera tan «pura» como sea posible, es decir, tan independientemente como sea posible de las demás aptitudes.

� Una de las aptitudes fundamentales (a veces llamadas «primaria»). � Un conjunto de aptitudes relativamente fundamentales, de mane-

ra que se consiga de cada individuo sometido a prueba una evaluación de su funcionamiento cognitivo (presente en todos los tests) y un perfil que represente su nivel para una gama de aptitudes concretas.

� Una aptitud específica aislada, como por ejemplo, la fluidez verbal o el dominio de vocabulario.

Hay que subrayar que los tests que miden el funcionamiento cognitivo sólo permiten obtener unas puntuaciones que, por fuerza, son igualmente tributarias de otras varias aptitudes y con harta frecuencia, de las conoci- mientos adquiridos. Desde este punto de vista, y a pesar de las pretensio- nes de ciertos autores de tests, no existe un test de inteligencia (o de funcionamiento cognitivo) que sea totalmente independiente de la cultu- ra, y con mayor razón, del nivel de educación. Los tests llamados «cultu- re-free» reflejan, al igual que los demás, el nivel de conocimientos adqui- ridos. Dicho esto, añadiremos que se han hecho algunos esfuerzos para tratar de aproximarse lo más posible a un cierto test perfecto que sólo midiera el funcionamiento cognitivo. Un psicólogo inglés, Charles Spear- man, consagró buena parte de sus trabajos a indagar un tipo de tareas que midieran el funcionamiento mental y nada más que eso. Según él, las pruebas de razonamiento abstracto son las mejores medidas de lo que él llamó el «factor g» o aptitud general. Describió ese factor g como un proceso de «educción de relaciones y correlaciones», es decir, de ejecu- ción de tareas abstractas que consisten en hacer observaciones, extraer de ellas unos principios o reglas y aplicarlos. Varios de los tests existentes utilizan esta noción y están constituidos por ítems que tienen todos la misma forma y el mismo tipo de contenido. Tal es el caso, por ejemplo, del test de las matrices de Raven, en el que el individuo se enfrenta a unos

Page 135: Evaluacion Del Personal

APTITUD COGNITIVA Y APTITUDES ESPECIFICAS 115

esquemas que tiene que completar tras haber observado y comprendido las relaciones que existen entre los elementos del esquema propuesto. Todos los ítems se fundan en el mismo principio, pero varían en dificul- tad. La misma idea ha presidido la elaboración del test D48, llamado a veces «del dominó», y también la del test B53 de Bonnardel.

Otra forma de rebajar la importancia de las aptitudes específicas en la puntuación de un test de inteligencia general consiste en variar la forma y el soporte de las preguntas, de manera que las eventuales lagunas sobre una aptitud específica se vean compensadas por el talento para con otras. Así pues, estos tests mezclan problemas aritméticos, cuestiones de razona- miento abstracto o concreto, series a completar, etc. Siguiendo este mode- lo se han elaborado, por ejemplo, el Army alpha y, en Francia, el BV9 de Bonnardel, así como uno de los primeros tests de inteligencia escrito di- rectamente en francés, el IL 80 de Lahy.

Otros tests, generalmente llamados «batería factorial», miden un con- junto de aptitudes importantes. Están concebidos para proporcionar una serie de puntuaciones que representen las aptitudes que sus autores consi- deran como las que más frecuentemente entran en juego en el aprendizaje y ejercicio de una profesión. Todos ellos se basan en análisis factoriales que han permitido separar unas aptitudes independientes entre sí y preci- sar la mejor forma de medirlas. Todas estas baterías han sido elaboradas en Estados Unidos y al menos tres de ellas han sido traducidas al fran- cés.

Estas baterías multiaptitudes consisten en un conjunto de tests que miden cada uno una aptitud relativamente independiente de las demás, si bien la serie de aptitudes que cubren no son las mismas. Por ejemplo, la batería PMA de Thurstone («batería de aptitudes mentales primarias») se refiere, como su propio nombre indica, a seis aptitudes mentales conside- radas como fundamentales por el autor, tras numerosos estudios factoria- les: la comprensión verbal, la fluidez verbal, la aptitud espacial, la aptitud numérica, la memoria inmediata y el razonamiento. La batería diferen- cial de aptitudes (DAT) comporta ocho tests, algunos correspondientes a aptitudes fundamentales (razonamiento verbal, aptitud numérica, razo- namiento abstracto, relaciones espaciales, razonamiento mecánico), otros a tareas que requieren varias aptitudes, pero cuyos resultados son suscep- tibles de aportar informaciones importantes en orientación o selección profesional (ortografía, gramática, exactitud y precisión en un trabajo de oficina). Finalmente, la batería GATB (Batería de tests de aptitud general) incluye tres tests que miden aptitudes fundamentales (inteligencia gene- ral, aptitud verbal y aptitud numérica), dos de aptitud espacial (percep- ción de formas, relaciones espaciales), una prueba de cotejo o confronta- ción y tres tests de habilidad motriz (coordinación motriz, destreza

Page 136: Evaluacion Del Personal

116 EVALUACIÓN DEL PERSONAL

manual y de los dedos). Esta batería, que fue elaborada por el US Em- ployment Service, fue muy utilizada en Estados Unidos y sus autores trataron de establecer perfiles tipo que caracterizaran diferentes formas de empleo.

Los responsables de personal tal vez saquen la impresión, al repasar la lista de tests de aptitud que componen estas baterías, de que se refieren a cualidades muy abstractas y muy alejadas de las actividades profesionales. Es cierto. Pero el nexo entre la serie de aptitudes fundamentales y las actividades del trabajo cotidiano puede �y debe� establecerse mediante el análisis del trabajo. Ya vimos en el capítulo primero que el fin del análisis del trabajo consistía precisamente en poner de relieve las aptitu- des y conocimientos necesarios para la correcta ejecución del trabajo. En este sentido, las aptitudes diferenciadas por estas baterías pueden ser útiles como punto de partida para el análisis de las exigencias propias del puesto para el que se constituye un método de evaluación. Finalmente, hay que subrayar que cuando esto se hace preciso, para un puesto que presente una exigencia concreta, puesta de manifiesto por un análisis del trabajo, puede ser útil elaborar un test que se refiera a un aspecto específico, pero decisivo, para esa tarea, por ejemplo, la rapidez y la precisión de la per- cepción visual o la aptitud para ejecutar consignas escritas o incluso la codificación de informaciones de acuerdo con una regla preestableci- da, etc.

En resumen, existen tres tipos de tests de aptitud, lo que explica que la palabra aptitud se utilice con acepciones diferentes. Se habla de aptitud general (o de inteligencia general, o incluso de funcionamiento cognitivo) para designar a la aptitud fundamental que interviene en todas las tareas y que se mide, en mayor o menor cuantía, en todos los tests. Los tests llamados de clasificación general, o de inteligencia general, o incluso de factor g, están construidos para medir la aptitud general de la manera más pura posible. Por otro lado, el mismo término designa también aptitudes importantes y frecuentemente utilizadas, en particular, las aptitudes ver- bal, espacial y numérica, que representan factores de éxito en gran núme- ro de tareas profesionales. Finalmente, ese mismo término se utiliza tam- bién para hablar de aptitudes totalmente específicas, que entran en juego en un reducido número de tareas particulares y para las que se elaboran, en general, unos tests específicos, muy cercanos en definitiva a las pruebas profesionales de las que hablaremos en el capítulo octavo.

Existen numerosos tests de este último tipo, es decir, que miden una aptitud estrecha y muy definida, por ejemplo, un test de clasificación que permite apreciar la aptitud para clasificar informaciones nuevas dentro de categorías predeterminadas, un test de precisión visual, que mide la capa- cidad para detectar diferencias nimias, o incluso un test de ortografía.

Page 137: Evaluacion Del Personal

APTITUD COGNITIVA Y APTITUDES ESPECÍFICAS 117

Caben asimismo en esta categoría los tests de aptitudes motrices, medidas a través de tareas motrices muy normalizadas. Veremos en el capítulo sobre las pruebas profesionales que las investigaciones llevadas a cabo para medir las aptitudes motrices han demostrado claramente que esas aptitudes son independientes entre sí. En otras, palabras, no existe un factor general de actividades psicomotoras comparable al factor general de las actividades mentales.

En resumidas cuentas, hay que subrayar que los tests de aptitud exis- tentes corresponden a un modelo teórico que describe las aptitudes men- tales, las relaciones que existen entre ellas y los problemas planteados por su medición. Si se sigue dicho modelo, es lógico pensar que toda tarea (y todo aprendizaje) ponen en juego

la aptitud general +

una o varias aptitudes principales +

una o varias aptitudes especificas

¿Son válidos estos tests? Dado que miden, dé la manera más pura posible, la aptitud general, las aptitudes principales y las aptitudes especí- ficas, deberían predecir el éxito profesional a condición de que:

1. Posean las cualidades de Habilidad y de diferenciación que hemos definido en el capítulo tres.

2. Estén elegidos de manera pertinente tras un análisis del trabajo, tal como la describíamos en el capítulo primero.

Queda por verificar si el modelo y el método son efectivamente váli- dos, es decir, si los resultados obtenidos mediante esos diversos tests per- miten realmente predecir el éxito profesional.

Existen, de hecho, miles de estudios, publicados o inéditos, que han medido la validez de los tests de aptitud. Estas investigaciones han sido objeto de numerosas síntesis, sobre todo en Estados. Unidos. En un pri- mer momento, estas síntesis eran esencialmente narrativas, ya que sus autores no disponían ni de instrumentos estadísticos ni informáticos que les permitieran hacer una suma de los coeficientes de correlación obteni- dos en los estudios de validez que habían reunido. Más recientemente, en especial tras los trabajos de Hunter y de Schmidt sobre la generalización de la validez, de lo que ya hablamos en el capítulo tres, ha sido posible llevar a cabo unos «meta-análisis», tras haber corregido los coeficientes de validez para tener en cuenta la dimensión y la dispersión de las muestras, y la fidelidad de los tests y criterios. En el momento actual, los resultados

Page 138: Evaluacion Del Personal

118 EVALUACIÓN DEL PERSONAL

de estas síntesis, que abarcan un grueso número de muestras y de indivi- duos, permiten afirmar cierto número de puntos que vamos a exponer a continuación.

Cuando se utiliza un conjunto pertinente de tests de aptitud, cuya elección esté basada en un análisis correcto del trabajo y de sus exigencias, la media de correlaciones obtenidas en un conjunto de estudios que afec- tan a más de 30.000 personas se sitúa a un nivel 0,50. Cuando se conside- ran aisladamente sólo los tests de aptitud general, las correlaciones van, según los casos, de 0,25 a 0,45 (Robertson y Smith, 1989).

Una serie de estudios, realizados todos ellos en Estados Unidos, han demostrado que los tests de aptitud poseen una validez constante dentro de una misma familia de ocupaciones. Estos esfuerzos de síntesis se han llevado a cabo con especial éxito para los trabajos administrativos (Schmidt y Hunter, 1977), para 35 ocupaciones en el ejército (Schmidt y Hunter, 1978), para los técnicos (Northrop, 1985) y para los programado- res (Schmidt y otros, 1980). Aparecen noticias regularmente sobre todo esto en las revistas especializadas.

Podríamos resumir, pues, diciendo que la información procedente de los tests de aptitud es pertinente y que resulta útil someter a prueba de este tipo sobre todo a las personas que se incorporan por primera vez el mundo del trabajo, es decir, cuando no se tiene sobre los candidatos más información que la cualificación que hayan adquirido en el sistema esco- lar. No es preciso repetir estudios de validez para cada una de las especia- lidades que entran en la misma familia de oficios, ya que tanto los tests de aptitud cognitiva como los de aptitudes fundamentales permiten siempre obtener una buena predicción del éxito en el empleo, todo ello sin menos- cabo de que añadiendo tests más específicos se pueda mejorar la calidad del diagnóstico.

Lo que sí ocurre es que existe una variación real entre las validez observada para familias de ocupaciones diferentes. Hunter y otros (1984) dan a este hecho una explicación muy interesante. Utilizaron los 515 estudios de validez llevados a cabo en el transcurso de 35 años por los servicios de empleo americanos, utilizando todos ellos la misma batería de tests, la GATB, una de las baterías antes señaladas. Como antes veía- mos, la GATB incluye 12 tests cuyas puntuaciones pueden reagruparse en tres categorías que corresponderían a tres aptitudes fundamentales: una aptitud cognitiva general, una aptitud espacial general y una aptitud psi- comotriz. Hunter y otros compararon las puntuaciones en estos tres gru- pos de aptitud con el éxito en diferentes categorías de actividad profesio- nal. Para clasificar las diversas actividades profesionales, utilizaron un agrupamiento en grandes categorías que permitiera ordenar los oficios en función de la complejidad de las tareas que llevan consigo, lo que les

Page 139: Evaluacion Del Personal

APTITUD COGNITIVA Y APTITUDES ESPECIFICAS 119

permitió agrupar los datos y obtener de este modo el cuadro que reprodu- cimos a continuación:

Correlación entre puntuaciones en los tres grupos de tests de la batería GATB y el éxito profesional para tres niveles de dificultad* Actividades Organizar Sintetizar y coordinar Analizar y calcular Comparar y copiar Manipular

R AC AE AM

*Según Hunter y otros (1984). AC - aptitud cognitiva; AE - aptitud espacial; AM - aptitud psicomotriz; R - coeficiente de correlación múltiple

Se puede observar que todos los coeficientes de correlación obtenidos son apreciables y que los todos coeficientes de correlación múltiple son elevados. Pero los coeficientes que caracterizan a los diferentes grupos de tests varían y dicha variación parece estar en función del nivel de comple- jidad de las tareas. La validez de los tests de aptitud cognitiva aumenta a medida que lo hace la complejidad de las tareas, mientras que la validez de las pruebas psicomotrices aumenta al tiempo que disminuye la com- plejidad de las tareas.

Puede existir otra fuente de variabilidad entre los coeficientes de corre- lación obtenidos en condiciones homogéneas con los mismos tests en el mismo tipo de ocupación o actividad profesional. Se trata del tipo de criterio utilizado para describir y medir el éxito profesional. En una re- ciente investigación, Nathan y Alexander consideraron esta fuente de va- riación. Realizaron un meta-análisis de los coeficientes de validez obteni- dos con tests que predijeran el éxito en empleos administrativos en relación con cinco tipos de criterios diferentes: calificaciones profesionales por parte de los mandos, muestras de trabajo, cantidad de producción y cualidad de la producción. Los resultados obtenidos afectan a siete tipos de tests: aptitud general, aptitud numérica, aptitud verbal, rapidez percep- tiva, memoria, aptitud espacial y habilidad motriz. En total, se reunieron 1709 correlaciones referentes a esos cinco criterios y esos siete tipos de tests. Cuatro de los cinco criterios (calificaciones, clasificación, cantidad de producción y pruebas profesionales) están correctamente predichos por cada uno de los tests utilizados. El carácter predictivo de las califica- ciones y de los índices de producción es muy homogéneo para los tests de aptitud verbal, de aptitud numérica, de rapidez perceptiva, de memoria y de aptitud espacial. Pero las calificaciones están mejor predichas que los

Page 140: Evaluacion Del Personal

120 EVALUACIÓN DEL PERSONAL

índices de producción por los tests de aptitud general. Los criterios para los cuales los coeficientes de correlación son regularmente más elevados son las muestras de trabajo y las clasificaciones: van de 0,51 a 0,54.

Por el contrario, los índices de calidad de la producción dan unos coeficientes de correlación bajos y que varían enormemente, según los tests empleados. Este punto resulta especialmente interesante por la im- portancia que actualmente se concede a la exigencia de calidad. ¿Cómo explicar los problemas encontrados con este criterio concreto? Los auto- res ofrecen tres explicaciones que llaman especialmente la atención. En primer lugar, anotan la dificultad de hacer operativos de una manera uniforme los criterios de calidad. Según los casos, se trata del número de errores, o del porcentaje de trabajo correctamente efectuado, o incluso de errores por período de tiempo. Sobre todo, recuerdan que los índices de calidad son en general de escasa fiabilidad. En efecto, en la medida en que los errores sean relativamente raros, habrá que sacar datos de un período de tiempo más largo para lograr unos resultados significativos y poder detectar a los individuos que cometen más errores que otros. Finalmente, hay que recordar también que, muchas veces, la calidad del trabajo no es controlable por el personal. Si hemos descrito esta investigación, y sus resultados con detalle, es porque representa un excelente ejemplo de los beneficios que reporta todo análisis de comprobación, y con más razón, de las síntesis realizadas mediante un meta-análisis. No sólo permiten estos trabajos trazar un marco de resultados sobre el que se puedan basar ulteriores aplicaciones, sino que representan además una ocasión de refle- xión crítica sobre todos los parámetros que entran en juego.

Saber qué es lo que se mide es algo esencial. Constatar que esas medi- das constituyen predictores válidos del éxito profesional, es algo también muy importante. Pero esto no exime de tratar de comprender mejor lo que explica esa validez, es decir, a qué se deben las relaciones comproba- das entre tests y predictores de éxito. Podríamos sobre todo preguntarnos si el nivel de aptitud representa una condición exigida para la entrada en la vida profesional, pero cuya importancia pierde fuerza a medida que el individuo adquiere una cierta experiencia en el trabajo. En otras palabras, ¿acaso el papel de las aptitudes como determinante del éxito profesional se debe sobre todo a su importancia en el proceso de aprendizaje, que permite adquirir los conocimientos y el saber práctico esenciales para el correcto ejercicio de las actividades profesionales? ¿O se debe principal- mente al hecho de que esas aptitudes intervienen directamente en esas actividades? Se trata de una cuestión central, tanto en un plano teórico como a nivel práctico. En efecto, si las aptitudes son, sobre todo, impor- tantes como condición necesaria para el aprendizaje y la adquisición de experiencia, habrá que esperar que la validez disminuya a medida que la

Page 141: Evaluacion Del Personal

APTITUD COGNITIVA Y APTITUDES ESPECÍFICAS 121

experiencia adquirida, desde luego más lenta y difícilmente, llegue a igua- lar las diferencias iniciales. Este debate sobre el papel de las aptitudes es capital. Prosigamos nuestra reflexión y supongamos que el papel de las aptitudes resulta clave sobre todo para la adquisición de conocimientos, y que disminuye una vez adquiridos estos. En un período en el que el bagage de adquisiciones técnicas y conocimientos requeridos para el ejer- cicio de una ocupación aumenta sin cesar, será imperativo desarrollar unos métodos de formación adaptados a los niveles de aptitud mediocre, ya que incluso los peor dotados, una vez formados correctamente, serían capaces de ejercer su actividad de manera satisfactoria.

También en este caso el meta-análisis permite aportar algunos ele- mentos para responder a esa cuestión. Un primer estudio de Hunter, (1983), en el que realizaba una síntesis de trabajos civiles y militares, indicaba que la aptitud mental general (el funcionamiento cognitivo) te- nía una correlación efectiva con los conocimientos profesionales adquiri- dos (0,66 para los civiles, 0,55 para los militares) los cuales tienen a su vez una relación con los ensayos profesionales (0,53 para los civiles, 0,56 para los militares), y con las calificaciones profesionales (0,31 para los civiles y 0,30 para los militares). Hunter atribuía la diferencia observada entre los oficios civiles y militares al hecho de que el aprendizaje dentro del ejército concede mucha más importancia a los ejercicios y al aprendizaje sistemá- tico. Esto significaría que los individuos más inteligentes son mejores operarios, sobre todo porque aprenden más deprisa y más a fondo cuando se refiere a su trabajo.

Otra investigación más reciente (Schmidt y otros, 1988) matiza esos primeros resultados. Examina tres hipótesis. Según la primera, las diferen- cias de rendimiento entre los individuos de fuerte potencial cognitivo y los individuos de escaso potencial cognitivo irían en aumento a medida que unos y otros acumulan experiencia profesional. Según la segunda hipótesis, ocurriría justo lo contrario: las diferencias entre los más y los menos dotados irían disminuyendo a medida que creciera la experiencia. Finalmente, según la tercera hipótesis, las diferencias de rendimiento se mantendrían constantes en el tiempo. La primera hipótesis entrañaría un aumento de la validez de los tests mentales en el tiempo; la segunda, una disminución de dicha validez y, la tercera, una validez constante. La in- vestigación de Schmidt se centró en datos referentes a cuatro oficios mili- tares para los que se poseían evaluaciones profesionales (calificaciones y observaciones) obtenidas tras 4, 11, 16, 22 y 60 meses. Todos los sujetos del estudio habían pasado el test de cualificación del Ejército Americano (AFTQ) en el momento de su incorporación al Ejército y fueron someti- dos regularmente a tests de conocimientos profesionales fundados en un análisis detallado del trabajo. Los resultados se inclinan por la tercera

Page 142: Evaluacion Del Personal

122 EVALUACIÓN DEL PERSONAL

hipótesis: la validez de los tests de funcionamiento cognitivo se mantuvo constante durante los cinco años que duró el estudio. Los coeficientes de correlación que expresan la validez son muy elevados cuando los tests se ponen en relación con las observaciones profesionales (0,59 a 0,74) y con los resultados en los tests de conocimiento profesional (0,69 a 0,92) y menos elevados para los criterios representados por las calificaciones pro- fesionales (0,32 a 0,57).

En definitiva, y con el actual estado de nuestros conocimientos, se podrían formular dos conclusiones muy claras.

1. Los tests de funcionamiento cognitivo predicen el éxito profesio- nal porque miden una aptitud necesaria para la adquisición de los conoci- mientos requeridos para realizar correctamente su trabajo. Se pueden dis- tinguir dos tipos de adquisición, según que ésta se desarrolle dentro de un entorno de formación, inicial o continuada, o bien se trate de la adquisi- ción de conocimientos y experiencias sobre el terreno. En el primer caso, los conocimientos que deben asimilarse se presentan de manera didáctica, y sabemos ya desde hace tiempo que el nivel de aptitud mental juega un papel determinante en la facilidad para aprender. Pero en el segundo caso, el papel de la aptitud general es aún más importante. En efecto, para sacar provecho de la experiencia sobre la marcha, hay que efectuar ante todo el trabajo cognitivo necesario para la identificación y formulación de datos pertinentes a partir de las numerosas informaciones continuamente ofrecidas sobre el terreno.

2. Los tests de funcionamiento cognitivo predicen el éxito profesio- nal porque miden una aptitud directamente útil para la ejecución cotidia- na del trabajo. Esto es especialmente cierto cuando se trata de una tarea o de un empleo que exige un esfuerzo de adaptación de los propios conoci- mientos a situaciones cambiantes, o un esfuerzo de innovación para ela- borar soluciones a problemas que hay que analizar antes de llegar a domi- nar.

* * *

La historia de los tests de aptitud no se detiene aquí. Ya hemos indica- do cómo los avances del análisis estadístico y las posibilidades de trata- miento de datos que ofrece la informática han obligado a revisar el con- junto de la teoría de las aptitudes. El desarrollo de la informática abre así mismo nuevos horizontes para la medición de las aptitudes. La evolución tecnológica, que ha puesto a disposición de los usuarios un material cada vez menos voluminoso, cada vez más barato y más fácil de utilizar, debe- ría multiplicar la utilización de la informática como soporte de los tests y

Page 143: Evaluacion Del Personal

APTITUD COGNITIVA Y APTITUDES ESPECÍFICAS 123

sustituir a los clásicos cuestionarios y tests de «papel y lápiz». Como cabría pensar, estos avances precisan un esfuerzo de creación de un soft- ware costoso. Por ello progresan lentamente y sólo afectan, en un primer momento, a organizaciones cuyos efectivos justifiquen un esfuerzo im- portante, como son el ejército y la marina norteamericanos y el ejército alemán.

No obstante, existen actualmente soportes lógicos de tests que se están comercializando y cuyas realizaciones son suficientemente numerosas como para que se hayan publicado algunas investigaciones y balances (Hackel, 1986; Murphy, 1988). Los primeros resultados disponibles indi- can que cuando se traslada un test al ordenador, los resultados obtenidos guardan una fuerte correlación con los arrojados por la versión «papel y lápiz» y su validez se mantiene intacta. Más aún, los sujetos aprecian este tipo de examen y se respeta de forma estricta la normalización de la administración de tests.

Existen unas ventajas materiales innegables, pero que no suponen un cambio fundamental en el método mismo de evaluación. Los avances que están teniendo lugar se sitúan en otro terreno y se refieren a cuatro pun- tos, dos aspectos técnicos y otros dos aspectos más fundamentales. El avance más evidente se debe a la posibilidad de hacer que los tests sean dinámicos: utilizando los recursos gráficos y tipográficos de la pantalla, se puede mover, reforzar, cambiar de color, etc., un ítem del test. Por otro lado, el hecho de tratar las respuestas mediante un soporte lógico permite escapar de la tradicional dicotomía respuesta mala/buena y aplicar las correcciones más precisas, bien porque tengan en cuenta la calidad de la respuesta, bien porque calculen puntuaciones diferentes, según la contri- bución de cada respuesta a dimensiones diferentes.

Un cambio mucho más profundo de nuestros hábitos supone el em- pleo del ordenador para elaborar tests adaptados a cada individuo, tests «a la medida» («adaptive testing»). En efecto, hasta ahora, todos los indivi- duos se sometían a las mismas preguntas y problemas. A lo sumo, en algunos tests se dispone de una versión cuya dificultad es diferente, de modo que las puntuaciones puedan clasificar a grupos con niveles de escolaridad más o menos altos. El ordenador abre nuevas perspectivas. Es posible hacer que utilice procesos estadísticos que tengan en cuenta la dificultad de cada pregunta, su poder discriminatorio, así como la proba- bilidad, para cada individuo, de dar la respuesta correcta, habida cuenta de las respuestas dadas a las preguntas precedentes. Esto implica que el ordenador tenga almacenadas no sólo informaciones sobre la dificultad de las cuestiones, sino también un banco de preguntas de variada dificul- tad y que, por supuesto, no serán empleadas todas para cada individuo. En estas condiciones, el programa permite, después de cada respuesta,

Page 144: Evaluacion Del Personal

124 EVALUACIÓN DEL PERSONAL

calcular una puntuación provisional y elegir la pregunta siguiente, de manera que la respuesta dada por el sujeto a esa nueva pregunta aporte el máximo de información. Si todos los tests de aptitud utilizaran esta posi- bilidad, se reduciría la duración del examen, y las informaciones referen- tes a la dificultad de los ítems, así como sus interrelaciones, se enriquece- rían continuamente por el mero hecho de someter a los examinandos a un test por ordenador.

Pero el mayor avance que se ha de esperar de la utilización de la informática proviene de la posibilidad que ofrece de no limitar la evalua- ción a tener en cuenta el resultado del trabajo y extenderla al proceso seguido por el sujeto para llegar a dicho resultado. En este sentido, y como muy bien subraya Guión (1989), los tests con ordenador no son otra manera de medir las mismas variables, sino una manera de medir algo que hasta ahora no habíamos medido y, en especial, de integrar los resultados de las investigaciones actuales sobre los procesos cognitivos. Tomemos como ejemplo la aptitud espacial. En vez de disponer sólo de los resultados obtenidos por los sujetos en preguntas que impliquen el uso de estas aptitudes, el ordenador nos permitirá seguir paso a paso el proce- so empleado por cada cual para recoger y tratar la información espacial.

De momento, no sabemos si los datos sobre los procesos serán más válidos que los datos sobre los resultados de tales procesos, ni si los proce- sos utilizados por un sujeto en la situación artificial del test permite pre- ver qué proceso empleará en una situación laboral real. Lo que sí está claro es que el trabajo industrial y comercial requiere cada vez más, y a escala cada vez mayor, la recogida y tratamiento de informaciones. En este sentido, los tests que permiten medir y describir con precisión los procesos fundamentales de tratamiento de la información utilizados por cada individuo deberían servir para predecir los resultados profesionales en la mayoría de los empleos y deberían permitir predecir los comporta- mientos y rendimiento mejor que los tests con que contamos actualmen- te. Se ha abierto una nueva página en la historia del desarrollo de los tests de aptitud.

EN RESUMEN

� Todo test de aptitud mide, poco o mucho, la inteligencia general (o funcionamiento cognitivo). Ningún test de aptitud mide sólo la inteligen- cia general. Los tests de factor g o de clasificación general de la inteligen- cia están elaborados de forma que midan y evalúen sobre todo la inteli- gencia general.

� Toda tarea, o actividad profesional, así como su aprendizaje, exige

Page 145: Evaluacion Del Personal

APTITUD COGNITIVA Y APTITUDES ESPECIFICAS 125

un poco, o mucho, de potencial intelectual (o inteligencia, o funciona- miento cognitivo).

� Todo test de aptitud mide, igualmente, una aptitud fundamental y, a veces, una aptitud específica (o varias).

� Toda tarea o actividad profesional requiere, en mayor o menor me- dida, una aptitud fundamental (o varias) y una aptitud específica (o va- rias). El análisis del trabajo debe identificar cuáles son esas aptitudes. La elaboración de los tests, y luego el análisis factorial de las puntuaciones obtenidas en varias series de tests, así como su interpretación, permiten precisar qué es lo que miden.

* N. del T. Desde la década de los 50, la Revista de Psicología General y Aplicada permite seguir en sus páginas las investigaciones españolas en los temas y pruebas menciona- das en este capítulo 6.

Page 146: Evaluacion Del Personal
Page 147: Evaluacion Del Personal

7 Los tests de personalidad

y sus limitaciones

En el capítulo anterior indicábamos que los tests de funcionamiento cognitivo y de aptitudes específicas aportan informaciones de indiscutible validez y, sobre todo, extensible a todas las actividades profesionales. No obstante es evidente que estos tests cognitivos por sí solos no bastan para realizar un pronóstico de éxito profesional, en especial porque no aportan información alguna sobre la personalidad de los candidatos. Esto ocurre sobre todo cuando se trata de selecciones para puestos ejecutivos o para funciones en las que la aptitud para trabajar en equipo y la calidad de las relaciones sociales constituyen una exigencia fundamental. El análisis del trabajo, la descripción de expectativas que formulan los responsables de personal a propósito de las personas que desean seleccionar, ponen de manifiesto la importancia de las cualidades sociales, de la honradez, de la creatividad y de la iniciativa, así como la capacidad de mando. Por eso es por lo que se recurre a las entrevistas, así como alas referencias e informa- ciones que pueden aportar los curriculum vitae o los cuestionarios biográ- ficos. Vimos antes que estos métodos, sin ser del todo inútiles, han decep- cionado con frecuencia a sus usuarios, probablemente porque se utilizaban de una manera intuitiva, no sistemática y sin tomarse el trabajo de verificar su validez. Desde luego, es posible hacerlos más fiables y más válidos. Lo cual no ha sido óbice para que, al buscar otras fuentes de información, los responsables de personal hayan recurrido a los tests de personalidad con la esperanza de que sean tan eficaces en su campo de investigación como los cognitivos, y permitan detectar en los candidatos la presencia o la ausencia de los rasgos de personalidad que se desean o que se pretende evitar.

En otras palabras, todo el mundo está de acuerdo en reconocer una fuerte demanda en cuanto a evaluación y descripción de la personalidad. Y sin embargo el contenido de esa demanda y la significación del propio término personalidad son algo difusos. La palabra se suele emplear en el

127

Page 148: Evaluacion Del Personal

128 EVALUACIÓN DEL PERSONAL

lenguaje corriente en expresiones como «tener personalidad», que equi- valdría a presencia social, energía y fuerza de carácter. Las definiciones que proponen los psicólogos son más amplias, pero no necesariamente más precisas, y se refieren, según los autores, a la aptitud para desempeñar determinados roles, la capacidad para adaptarse a un medio cambiante, y, más frecuentemente, un conjunto de rasgos independientes que caracteri- za el comportamiento pasado y que deberían permitir perfilar el compor- tamiento futuro.

Este carácter vago de las definiciones no impide a los mandos y res- ponsables de personal precisar cuáles son los rasgos de personalidad que exige un determinado puesto de trabajo. La noción de compatibilidad entre «una personalidad» y una función se concreta de hecho de tres maneras diferentes. Las más de las veces, la expectativa respecto a las informaciones que deben proporcionar los exámenes de personalidad es vaga, ya que se trata sólo de predecir las posibilidades de éxito en un determinado puesto de trabajo. Pero puede ocurrir que la demanda sea más ajustada y se refiera a rasgos deseados, como autoridad, tolerancia, perseverancia, simpatía. A la inversa, la dirección puede exigir la elimina- ción de candidatos que ofrezcan una característica no deseada: falta de autocontrol, agresividad, poca honradez, incapacidad para trabajar en equipo �la lista podría ser tan larga como variada�. Las exigencias de los patronos con respecto a la personalidad requerida pueden complicarse más aún por el hecho de que se mezclen a los rasgos de personalidad características de diversa índole desde el punto de vista psicológico, sobre todo los intereses y la motivación.

Existe, pues, una gran confusión en el campo de la medición y de la descripción de la personalidad. Tal confusión aumenta con la irrupción, en un mercado acostumbrado a técnicas simples y fáciles de aplicar, de numerosos métodos supuestamente milagrosos. Sus autores no escatiman un vocabulario seductor para describirlos, sin aportar, lamentablemente, precisión alguna sobre lo que se mide, ni pruebas sobre la fiabilidad y validez de la medición. La reciente moda de los tests por ordenador no ha hecho más que aumentar la confusión. En efecto, si una técnica es poco fiable o poco válida, el hecho de meterla en el ordenador no va a mejorar- la. Es cierto, en cambio, que no se puede desdeñar la posibilidad de utili- zar el ordenador para hacer «tests a medida», ni se deben subestimar los recursos que ofrece para tratar los datos con rapidez, para integrar nuevos datos y, por tanto, para mejorar las normas de referencia. Pero en ningún caso va a resolver el ordenador los problemas que plantea la utilización de tests de personalidad, problemas éticos, por un lado, y problemas teóricos y prácticos, por otro.

Page 149: Evaluacion Del Personal

LOS TESTS DE PERSONALIDAD Y SUS LIMITACIONES 129

PROBLEMAS ÉTICOS

Los problemas éticos han de abordarse en un marco institucional. Una cosa es someter a un test de personalidad a alguien que viene a consultarnos un problema personal, a pedirnos consejo o el tratamiento de un caso patológico y otra muy distinta es hacerle ese test en el marco de la vida profesional y con la idea de remitir los resultados y/o su inter- pretación a una empresa o cualquier otra organización. En el primer caso, las informaciones recogidas se mantendrán en la confidencialidad. En el segundo caso, deben servir de base a decisiones de selección, de promo- ción, etc. Y aún cuando las respuestas de la persona sometida al test no sean objeto de una difusión total, la descripción de su personalidad no será ya un secreto compartido tan sólo por el psicólogo y su cliente. Cual- quier test constituye, en cierto modo, una violación del ámbito personal. Pero sobre todo los tests de personalidad han merecido la consideración de intromisión en la intimidad personal. En efecto, cada persona muestra sólo una «personalidad social» y muy pocos desearían traslucir su «perso- nalidad profunda». El desfase entre ambos aspectos está en función, por lo demás, de las normas socioculturales. Por ejemplo, en una cultura que desapruebe la expresión de las emociones, la agresividad o la intolerancia, esas tendencias serán reprimidas por el individuo, aún cuando estén pre- sentes con fuerza en su personalidad. Cabría preguntarse si los tests de personalidad, en especial aquéllos que, como los proyectivos, disimulan su objeto, no obligan al individuo a revelar unas actitudes, tendencias o sentimientos que desearía guardar para sí. No hay que tomarse a la ligera esta acusación hecha a los psicólogos de no respetar la dignidad de la persona, pero tampoco han de ser objeto de ataques superficiales y que confundan los diferentes aspectos del problema.

El primero de tales aspectos se refiere a la pertinencia de las cuestiones planteadas y, por tanto, la validez de los tests utilizados con miras a decisiones concretas. Es inaceptable plantear preguntas referentes a la per- sonalidad y hacer pasar un test de personalidad si no se es capaz de señalar con precisión qué utilidad tienen esas preguntas y cuál es el valor predictivo y la significación de las descripciones de la personalidad que de ahí se extraigan. Esto significa que no basta con tener la convicción de que las preguntas planteadas son útiles y que corresponden a informacio- nes que permiten prever el comportamiento profesional ulterior. Hay que estar además en condiciones de probar, apoyándose en el estudio de las cualidades métricas que hemos descrito en el capítulo tres, la utilidad de los métodos empleados. Por desgracia, como lo hacía notar Cronbach en 1970, basta con disponer de un cierto material impreso para que cual- quiera se pueda convertir en un traficante de tests. Es muy de lamentar

Page 150: Evaluacion Del Personal

130 EVALUACIÓN DEL PERSONAL

que se confunda tantas veces la muy seria tentativa que representa la puesta a punto y la validación de un test con las promesas infundadas de auténticos quiromantes y adivinos.

Aún queda un segundo aspecto del problema, el más fundamental. ¿Acaso un empresario o el psicólogo que para él trabaja tienen derecho a plantear a las personas preguntas sobre su vida privada que, al menos en apariencia, nada tengan que ver con el trabajo? En realidad, el problema no está en plantear tales preguntas, sino en el hecho de utilizar ese tipo de información para adoptar una decisión que afecte a la vida profesional. No vamos a entrar en el detalle de los procesos interpuestos en Estados Unidos a empresas y organizaciones por parte de empleados que se consi- deraban víctimas de prejuicios injustificados. Pero hay que tener claro que cualquier organización debe poder probar que las informaciones que le han servido para adoptar una decisión (de selección, de promoción, de traslado, etc.) conciernen a aspectos pertinentes, es decir, válidos, de la personalidad y que no ocultan en realidad procedimientos destinados a excluir a determinadas categorías de personal que no se desean por razo- nes que nada tienen que ver con las exigencias laborales.

El último aspecto a tener en cuenta desde el punto de vista ético es también el más delicado. ¿Hasta qué punto tenemos derecho a engañar a las personas examinadas, forzándolas a revelar aspectos de su personali- dad sin que ellas mismas puedan calibrar el alcance y la significación de sus confesiones? Es cierto que cualquiera de nosotros acepta someterse a un examen somático, por razones médicas, aunque no seamos capaces de comprender la significación de las informaciones por él recogidas. Pero conocemos su objetivo: hacer un diagnóstico que corresponda a unos síntomas aparentes o controlar la eficacia de un tratamiento en curso, por ejemplo. Lo mismo debería ocurrir con los exámenes de personalidad. ¿Qué quiere decir esto? Que todo examen debe ir precedido de una expli- cación accesible al individuo y que justifique su validez, y que tales exá- menes han de llevarse a cabo dentro de un clima de mutua confianza, confianza en la objetividad, competencia y honradez del psicólogo y en el uso que se hará de la información recogida. Esto no siempre es así. Des- graciadamente, muchas veces se hace pasar un test de personalidad con una vaga idea de su utilidad, sólo para saber más sobre el candidato, sin un objetivo preciso. Es esa curiosidad vaga lo que resulta un atentado a la dignidad humana, no el hecho de someterle a unos tests pertinentes y válidos y que permitirán evitar un fracaso que sería tan dañino para el candidato como costoso para la organización.

Las observaciones precedentes, así como los análisis hechos de forma más general en la introducción y en el capítulo sobre las cualidades métri- cas, nos remiten finalmente a la capacidad de predicción de los métodos

Page 151: Evaluacion Del Personal

LOS TESTS DE PERSONALIDAD Y SUS LIMITACIONES 131

utilizados, a su realismo y a su aceptabilidad por parte de las personas que se someten a ellos. A la hora de elegir un método de descripción de la personalidad, es muy importante precisar bien qué es lo que se desea medir y saber por qué tal o cual técnica permite alcanzar los objetivos definidos. Como veíamos antes, esta evaluación de los métodos se apoya a la vez en su capacidad de predicción propiamente dicha y en su validez de contenido y construcción o, dicho de otro modo, sobre la teoría que ha servido de base para elaborar la prueba. Este segundo aspecto es especial- mente importante, en lo que concierne a la personalidad, por dos razones muy claras. Ante todo, hemos visto en el capítulo sobre la calificación profesional y los criterios de éxito, hasta qué punto había que extremar la prudencia en el uso de las parrillas de calificación. Especialmente, aque- llos aspectos de la calificación que versan sobre la personalidad deben ser siempre objeto de especial cautela. Por una parte, porque están especial- mente sometidos al «efecto de halo», lo que significa que el calificador no hace, sino una evaluación global de la personalidad. Y por otra parte, porque los calificadores juzgan sobre la base de su propia visión simple de la organización de la personalidad, incluidos incluso por prejuicios de todo orden, fundando muchas veces sus evaluaciones en observaciones fragmentarias del comportamiento. En este sentido, la ausencia de validez predictiva no significa necesariamente que los indicadores estén equivoca- dos y que las evaluaciones de los mandos intermedios sean exactas. Tam- bién puede reflejar una mala utilización de los recursos humanos, unas condiciones de trabajo que impidan la motivación o, incluso, la utiliza- ción por parte de los mandos de las fichas de calificación para conseguir un fin específico, por ejemplo librarse de elementos conflictivos o reclutar un máximo de nuevos agentes.

PROBLEMAS TEÓRICOS Y PRÁCTICOS

El análisis que hasta aquí venimos haciendo, y sobre todo la confusión reinante en torno a lo que se entiende por personalidad, así como la importancia que debe otorgarse a los modelos teóricos que justifican la elaboración de los diferentes métodos existentes, nos han llevado a pre- sentar los diferentes modelos teóricos que justifican el empleo de tal o cual categoría de test de personalidad. Expondremos primeramente la concepción global y psicodinámica de la personalidad, los instrumentos que este enfoque ha posibilitado, sus cualidades y defectos. Luego presen- taremos el dilema «rasgo/situación», que opone la idea de una personali- dad estable y que determina el mismo tipo de conductas, cualesquiera sean las posturas ante la noción de un determinismo situacional de las

Page 152: Evaluacion Del Personal

132 EVALUACIÓN DEL PERSONAL

conductas. Presentaremos y comentaremos los instrumentos que se basan en la noción de rasgo. Los correspondientes a la idea de una especificidad situacional de los comportamientos ocuparán todo el capítulo siguiente, pues no se trata ya de tests de personalidad propiamente dichos, sino de «tests de situación». A continuación, presentaremos una tercera opción que se basa en la importancia de la valoración de uno mismo, el «self- concept», dentro de las conductas y de su motivación. La idea de uno mismo posee una cierta plasticidad y los métodos que ha suscitado este enfoque son a la par instrumentos de descripción y medios para hacer que el individuo evolucione. Estas tres aproximaciones no agotan el campo de la personalidad: aún nos quedará por hablar de los intereses, de su medi- ción y de su papel como determinante del éxito profesional y de la posibi- lidad de describir las escalas de valores individuales que sostienen las mo- tivaciones.

La personalidad global: enfoque «psicodinámico»

La concepción psicodinámica de la personalidad ve en la conducta humana una manifestación de la interacción dinámica de fuerzas inter- nas, interacción que se desarrolla en el campo del inconsciente: cualquier comportamiento sería resultado de un deseo de satisfacer las necesidades profundas, tendencias, impulsos e instintos que caracterizan al individuo. Según esta concepción, habría que buscar en el nivel del inconsciente los determinantes del comportamiento y habría que describirlos en su globa- lidad, ya que es su dinámica interna la que determina las conductas y no la suma de cada una de las necesidades, impulsos e instintos.

Aunque estas ideas están muy difundidas, la teoría psicodinámica de la personalidad no se ha visto libre de críticas teóricas y empíricas (Ban- dura, 1986). Los métodos que ha producido son imposibles de compro- bar, ya que se inscriben en una especie de círculo vicioso. En efecto, la existencia de determinantes profundos e inconscientes se infiere a partir de un comportamiento del que se les supone determinantes. Así, la exis- tencia de la necesidad de triunfar se diagnostica a partir de las respuestas dadas por los individuos que manifiestan un comportamiento autoritario, la curiosidad a partir de conductas exploratorias, etc.

Además, la presencia de necesidades o impulsos profundos que carac- terizan de manera constante a cualquier individuo, difícilmente casa con el hecho de que los comportamientos de un mismo individuo varíen se- gún las situaciones y, sobre todo, según su contexto social. En realidad, la teoría psicodinámica no postula la existencia de un determinismo psíqui- co inconsciente que tuviera siempre los mismos efectos en el comporta-

Page 153: Evaluacion Del Personal

LOS TESTS DE PERSONALIDAD Y SUS LIMITACIONES 133

miento. Al contrario, sostiene que esa dinámica interna puede acarrear efectos diferentes en el comportamiento. En tal caso, la teoría y, con mayor razón, los instrumentos diagnósticos que justifica, no se pueden comprobar fácilmente de manera empírica.

Si aceptamos la idea de que esos determinantes inconscientes del com- portamiento están protegidos por unas defensas fuertes que operan a su vez de manera inconsciente, el acceso a esos agentes inconscientes de la motivación requerirá métodos indirectos que permitan burlar esos meca- nismos de defensa. Los tests construidos para describir la personalidad global y su funcionamiento dinámico inconsciente se conocen con el nombre de «técnicas proyectivas». Están constituidas éstas por estímulos ambiguos o sin significación que los sujetos han de interpretar y comen- tar. Estos métodos se basan en la idea de que el sujeto «proyecta» así su personalidad profunda y la revela a través de su interpretación de los estímulos propuestos. La labor de quien hace el test es de especial impor- tancia, ya que es él quien tiene que describir la dinámica de la personali- dad en su globalidad, a partir de las respuestas obtenidas.

Las pruebas de la calidad y pertinencia de estos métodos consisten, las más de las veces, en explicar un comportamiento que ya se ha manifesta- do mediante un esquema que describe la dinámica inconsciente que lo ha determinado. En cambio, cuando se han buscado testimonios de la efica- cia predictiva de estos métodos, los resultados obtenidos han sido, por lo general, decepcionantes. Como indica Bruchon-Schweitzer (1987) en una reciente síntesis de las investigaciones existentes, sobre las aproximada- mente 5.000 publicaciones relativas a técnicas proyectivas, apenas hay un centenar que se ocupen del problema de su validez y menos de cincuenta, por lo general bastante antiguas, que se refieran a los problemas de selec- ción o de orientación profesional. Más aún, las condiciones de utilización de estos métodos no respetan las reglas que caracterizan el empleo de los restantes tests. La forma de administrar el test puede variar de un experi- mentador a otro, no siempre existe un código de análisis de respuestas y la fiabilidad del método difícilmente se puede distinguir de la fiabilidad aso- ciada al propio experimentador.

En tales condiciones, nada tiene de extraño que las diferencias entre grupos profesionales aparezcan como mínimas y que sólo cuatro estudios de 50 reseñados por Bruchon-Schweitzer ofrezcan unas predicciones me- dianamente válidas, mientras que las demás fracasan por completo. Esta síntesis confirma de plano las anteriores revisiones de la bibliografía exis- tente, sobre todo las de Reilly y Chao (1982) y la de Kinslinger (1966).

Hay que recordar además que las técnicas proyectivas más corrientes se han elaborado para contribuir al diagnóstico clínico o como instru- mento de investigación y no para evaluar las características individuales

Page 154: Evaluacion Del Personal

134 EVALUACIÓN DEL PERSONAL

en el marco de una predicción del éxito profesional. Tal vez se obtendrían mejores resultados si el principio de los métodos proyectivos fuese objeto de una aplicación a la psicología del trabajo y si existiera un marco teórico que tuviera en cuenta los problemas específicos de la predicción del éxito profesional.

Tal es el caso de uno sólo de los métodos existentes, conocido con el nombre de MSCS (Miner Sentence Completion Scale: Escala de Frases a Completar de Miner), método que resulta ser el único que ha permitido obtener resultados probatorios en lo que respecta a la predición del éxito de los ejercutivos dentro de la empresa. Miner analizó las tareas normal- mente efectuadas por los ejecutivos y propuso una lista de seis roles que estos debían desempeñar de manera competente.

1. Ser capaces de lograr que sus acciones estén respaldadas por los niveles superiores de la dirección, lo que supone una capacidad para man- tener buenas relaciones con sus superiores, y por tanto, una actividad positiva frente a quienes representan la autoridad.

2. Ser competitivos, es decir, aceptar los desafíos que les presenten y estar dispuestos a luchar para promocionarse, conseguir un estatus mejor y defender sus ideas.

3. Comportarse de manera enérgica y activa, lo que supone hacerse cargo del grupo del que son responsables, adoptar decisiones y hacer todo lo necesario para que se respete la disciplina.

4. Ejercer una autoridad sobre sus subordinados, dirigir su trabajo y cuidar de que ese trabajo se haga de manera adecuada, utilizando para ello las recompensas y sanciones que tengan a su alcance.

5. Tener visión de las cosas y comportarse de manera tal que provo- que en los demás atención y aportaciones positivas.

6. Estar dispuestos a asumir labores administrativas, como formar parte de comisiones, elaborar dossiers, establecer presupuestos, etc.

Para medir la reacción afectiva de los candidatos a esos seis roles, Miner elaboró una serie de cuarenta frases que se deben completar y un código de depuración de respuestas que permite obtener siete puntuacio- nes, correspondientes a los seis roles citados, teniendo en cuenta que la competitividad (rol n. 2) se desdobla en dos aspectos, competitividad en actividades lúdicas y en situaciones laborales. En un examen de las inves- tigaciones realizadas mediante esta escala, Miner (1978) mostró que las puntuaciones globales se correlacionaban con el éxito profesional de los ejecutivos cuando éste se medía por medio de una variedad de criterios, curva de carreras, promoción, evaluación de los superiores, etc. Especial- mente las dos puntuaciones de competitividad, la actitud frente a la auto- ridad y el ejercicio del poder, se correlacionan bien con estos criterios. No

Page 155: Evaluacion Del Personal

LOS TESTS DE PERSONALIDAD Y SUS LIMITACIONES 135

obstante, según Miner, esta escala sólo sería válida en organizaciones de tipo burocrático, y no permitiría predecir la posición dentro de la organi- zación de algunos individuos que ejercen un liderazgo informal.

En definitiva, habría que resumir diciendo que los tests proyectivos normalmente utilizados, sobre todo para la selección de ejecutivos, y que se pusieron a punto dentro de una perspectiva clínica, sólo tienen una débil validez y una escasa fiabilidad. No obstante, parece posible utilizar con provecho la noción de proyección, en condiciones que permitan res- petar la exigencia de fiabilidad y en el marco de un análisis específico de las exigencias del puesto. Habría que hacer este análisis en el contexto de las empresas y, sobre todo, no dejar de verificar la validez de las puntua- ciones obtenidas.

B) Rasgo o situación: cuestionarios de personalidad

Otra manera de describir la personalidad consiste en emplear cuestio- narios que hayan sido objeto de un análisis factorial y permitan, mediante el empleo de parrillas de corrección, obtener un «perfil» de personalidad, es decir, una serie de puntuaciones que describan los ragos de personali- dad de cada sujeto.

Hemos visto en el capítulo sobre los tests de aptitud que, contraria- mente a lo que durante mucho tiempo se venía creyendo, los test de funcionamiento cognitivo poseen una validez general, verificada cual- quiera que sea la situación y cualquiera que sea la actividad profesional considerada. ¿Cabría imaginar que ocurra lo mismo en lo que respecta a los cuestionarios de personalidad?

Reflexionemos un poco sobre lo que esto significaría. En el caso de los tests de funcionamiento cognitivo, el hecho de que su validez sea «genera- lizable» quiere decir que las cualidades intelectuales que miden son utili- zables, y efectivamente útiles, en todas las actividades profesionales. En el caso de la personalidad, la hipótesis de validez «generalizable» se basa en la noción de rasgo. Supone, efectivamente, que cada individuo se caracte- riza por un perfil psicológico, o por una serie de rasgos de personalidad, que determinan su estilo de comportamiento. Por ejemplo, un individuo agresivo se comportará de manera agresiva en todas las situaciones; una persona autoritaria manifestará su autoritarismo en todas partes. En otras palabras, si el comportamiento responde en fuerte medida a una «perso- nalidad básica», el estilo propio de cada cual será coherente a través de situaciones diversas y estable en el tiempo.

Los cuestionarios de personalidad se basan en este doble supuesto: estabilidad de los rasgos de personalidad y posibilidad de inferirlos a partir

Page 156: Evaluacion Del Personal

136 EVALUACIÓN DEL PERSONAL

de preguntas planteadas a los individuos sobre su comportamiento pasado o incluso sobre su comportamiento habitual. La mayoría de estos cuestio- narios han sido objeto de análisis factoriales referidos a grandes muestras, análisis que han permitido precisar la manera en que se agrupan las res- puestas y deducir de ellas la existencia de rasgos que las plantillas de corrección permiten puntuar. Estos estudios son caros. Además, los cues- tionarios disponibles han sido traducidos del inglés. En el mejor de los casos, aunque desgraciadamente no siempre, la composición factorial se ha verificado sobre una muestra nacional. Entre los más conocidos, pode- mos citar el cuestionario de personalidad de Thurstone, el inventario de Guilford-Zimmerman y el inventario de personalidad de California*.

Pese a los esfuerzos realizados para estructurar los cuestionarios de personalidad y darles una significación empírica, sabemos desde hace tiempo que su validez con respecto a los comportamientos profesionales es uniformemente baja. Los meta-análisis practicados sobre los estudios de validez por Hunter y su equipo, utilizando los mismos métodos que aquellos estudios que permitieron mostrar el carácter generalizable de las cualidades predictivas de los tests de funcionamiento cognitivo, han con- firmado esta escasa validez, así como la imposibilidad de generalizar a partir de los pocos casos en que la validez observada es mayor.

Varias razones podrían aducirse para explicar este estado de cosas. Ante todo, sabemos poco sobre lo que es pertinente para los puestos en cuestión, con las medidas obtenidas. En efecto, si bien el análisis del trabajo permite identificar unas exigencias en términos de aptitud, ese mismo esfuerzo se hace mucho más difícil cuando se trata de definir los rasgos de personalidad necesarios para el ejercicio de una actividad profe- sional determinada, y que se correspondan bien, por su contenido, con los rasgos descritos por los cuestionarios de personalidad. Por otro lado, las preguntas son relativamente transparentes, de modo que lo que se obtiene es más bien un retrato del candidato ideal (tal como se lo imagina la persona interrogada) que un perfil del propio sujeto. Esto resulta especial- mente cierto al existir en la actualidad unos «cursos de formación» para los tests, en los que los candidatos acaban aprendiendo unas pretendidas «trampas» a evitar.

Existen algunos medios de reducir esa deformación de las respuestas. Se puede cuidar la redacción de las preguntas haciendo que sean menos transparentes. También es posible introducir ítems que permitan consti- tuir una auténtica «escala de mentira»** ya que se refieren a faltas venia-

* N. del T. En España el 16 PF ha tenido una amplia penetración así como el EPQ. ** En España, estas escalas están invertidas y se denominan «escalas de sinceridad».

Page 157: Evaluacion Del Personal

LOS TESTS DE PERSONALIDAD Y SUS LIMITACIONES 137

les que la mayoría asumimos sin problema. Se pueden en fin, deslizar en el cuestionario preguntas especialmente conectadas con el deseo de causar una buena impresión. Tales escalas existen, por ejemplo, en el inventario de personalidad de California.

Una manera más directa aún de proceder consiste en reemplazar las preguntas por una elección entre parejas de afirmaciones cuya deseabili- dad social sea equivalente. Pero esto crea unas correlaciones artificiales entre las escalas. En efecto, los examinandos se ven obligados a escoger una de las respuestas y rechazar la otra. Ahora bien, las puntuaciones se obtienen reagrupando las respuestas por categoría. El total de las puntua- ciones es, pues, una cifra constante y el aumento de una puntuación disminuye por fuerza las demás. También se ha tratado de plantear pre- guntas con respuestas a elegir que no admiten distorsiones, pues se refie- ren a hechos precisos. Por ejemplo, se puede pedir a los aspirantes que estimen unos datos cifrados, o que asocien palabras, o que proporcionen informaciones cuya exactitud debería reflejar sus motivaciones.

Hay otras razones que pueden explicar la escasa validez de los cuestio- narios de personalidad. Las preguntas suelen utilizar expresiones como «rara vez», «con frecuencia», «en general», cuyo significado puede variar considerablemente de un sujeto a otro. Pero aún, esas preguntas suelen estar redactadas de manera que los individuos más honestos deberían rehusar contestarlas, a no ser mediante una fórmula vaga: cuando se les pregunta si toman con facilidad la palabra en público, la verdad estaría en responder: «eso depende del tema, del público, de las circunstan- cias...».

Finalmente y sobre todo, no está tan claro que los «rasgos de persona- lidad» representen unos determinantes importantes del comportamiento y es muy probable que la situación en la que uno se encuentra y, sobre todo, la manera de percibir dicha situación, determinen el comporta- miento tanto al menos como la personalidad y la experiencia anterior de los individuos. Recientes investigaciones hacen pensar que ese doble de- terminismo rasgo-situación es algo complejo. Bem y Alien (1974) demos- traron que los individuos son más o menos coherentes a través de las situaciones. Lo que equivaldría a decir que los tests de personalidad serían más válidas para ciertos individuos. Pero Chaplin y Goldberg (1984) no lograron probar que la evaluación de su propia coherencia por parte de los propios sujetos matice eficazmente los resultados de los cuestionarios. En realidad, parece más interesante comprender por qué y en qué condi- ciones los individuos adoptan comportamientos diferentes en situaciones diferentes, en lugar de tratar de medir unos rasgos constantes. Este tipo de reflexión es el que ha llevado a crear unas situaciones estándar en las que es posible observar los comportamientos individuales de manera objetiva:

Page 158: Evaluacion Del Personal

138 EVALUACIÓN DEL PERSONAL

se trata de los tests de situación, que serán objeto de examen en el siguien- te capítulo.

Así pues, la validez «global» de los tests e inventarios de personalidad es escasa. De todos modos, hay que señalar algunos casos específicos en los que inventarios de personalidad hechos a medida para una situación profesional precisa han proporcionado resultados positivos. Un estudio de este tipo pretendía la identificación precoz del potencial de promoción a puestos ejecutivos de alto nivel dentro de la Standard Oil of New Jersey (Laurent, 1968, 1970). Se adoptó el siguiente plan de acción: en un pri- mer momento, se desarrollaron meticulosamente unos criterios de éxito fundados en el nivel alcanzado dentro de la jerarquía, la curva de salarios y la eficacia global. Se sometió a un inventario de personalidad clásico (el Guilford-Zimmerman) a una muestra de 443 ejecutivos en activo y se calcularon las correlaciones entre las puntuaciones obtenidas en el inven- tario de personalidad y los diferentes criterios. Luego, de la mitad de la muestra interrogada, se calcularon las correlaciones entre los criterios, por un lado, y cada ítem del cuestionario, por otro. Los ítems válidos para la primera mitad de la muestra se controlaron para la segunda mitad. Esto permitió elaborar una nueva plantilla de criba de preguntas. La correla- ción total entre un criterio compuesto de éxito profesional y las puntua- ciones en el inventario de personalidad, calculadas utilizando la nueva plantilla de corrección, era de 0,32. Esta correlación fue confirmada por estudios posteriores y cuando el cuestionario de personalidad, utilizado con su correspondiente plantilla de criba específica, se combina con otros tests y medidas igualmente válidos, se puede alcanzar una predicción del éxito profesional del orden de 0,60 a 0,70.

También dieron buenos resultados estudios del mismo tipo que utili- zaban el California Psychological Inventory y un inventario de intereses profesionales, referido a oficiales de policía (Mills y Bohannon, 1980) y a oficiales de marina (Borman y otros, 1980).

En definitiva, podríamos resumir destacando algunos puntos. Ante todo, los cuestionarios de personalidad, en general, son bastante menos válidos de lo que se piensa. Las puntuaciones obtenidas nunca se deberían tomar como una descripción de las características del sujeto que permita predecir su grado de éxito profesional. A lo sumo, se pueden considerar las descripciones que de sí mismos hacen los sujetos a través de las pre- guntas de estos tests como la manera en que ellos se ven, o incluso como la manera en que ellos creen que se han de presentar para tener alguna oportunidad de lograr el puesto al que aspiran. Hay que saber también que estos cuestionarios no tienen «validez global» pero que, tras unos estudios de validación específicos y fundados en un análisis de situaciones profesionales y de la cultura de la empresa, pueden servir para predecir la

Page 159: Evaluacion Del Personal

LOS TESTS DE PERSONALIDAD Y SUS LIMITACIONES 139

compatibilidad entre un individuo y un grupo de puestos o funciones dentro de una determinada organización.

C) Autoevaluación

Algunos investigadores han subrayado la importancia de la propia imagen en los procesos de motivación y decisión. Esto significa, concreta- mente, que nadie está dispuesto ni a aceptar una tarea o responsabilidad, ni a realizar esfuerzos para sacarla adelante, si, antes de nada, no está convencido de que es en efecto capaz de realizarla porque tiene las cuali- dades necesarias para ello. De ahí la idea, aparentemente simple y des- arrollada sobre todo por Bandura (1986), de que el mejor predictor del comportamiento es la manera en que cada cual evalúa sus propias capaci- dades y cualidades personales. En otras palabras, evitaremos siempre aceptar tareas que no nos creamos capaces de realizar de manera satisfac- toria y situaciones que nos creamos incapaces de dominar. Y si, a pesar de todo, se nos confían tales tareas o nos vemos inmersos en tales situacio- nes, estaremos escasamente motivados para superarlas, porque pensamos que no tenemos las cualidades necesarias para ello.

En este sentido, y aun cuando se refiere a la autoevaluación de aptitu- des, la percepción que cada cual tiene de su potencial puede representar un factor determinante de las conductas profesionales. Sin embargo, la síntesis y el meta-análisis de 55 estudios que incluían un total de 267 comprobaciones de autoevaluaciones (Mabe y West, 1982) mostraron que los coeficientes de correlación obtenidos ofrecen una gran dispersión, ya que van de -0,10 a +0,71 y, sobre todo, que esta variabilidad no se explica por diferencias en el tamaño de las muestras y la fiabilidad de los criterios como ocurre con los tests que miden el funcionamiento cogniti- vo. De hecho, la validez es tanto mayor según que:

1. La persona que responde sepa que la ficha de autoevaluación que está rellenando va a ser comprobada;

2. Esa persona tenga ya una cierta experiencia de autoevaluación. 3. Las instrucciones facilitadas con la ficha de autoevaluación pidan

a la persona que responde que se compare con otros. 4. Se garantice el anonimato. Evidentemente, estas observaciones no invitan precisamente a utilizar

cuestionarios de autoevaluación para hacer una selección: hay grandes probabilidades de que las autodescripciones estén distorsionadas en senti- do favorable y diferencien poco a los candidatos entre sí.

Otras dos razones aconsejan la prudencia: por un lado, los procesos psicológicos y sociales que contribuyen a la elaboración de la propia ima-

Page 160: Evaluacion Del Personal

140 EVALUACIÓN DEL PERSONAL

gen son muy complejos y se hallan sometidos al retorno de informaciones sobre uno mismo procedentes de los demás y también a la manera en que cada cual atribuye tal o cual logro a tal o cual de sus cualidades, o a factores externos que no dependen de él. Todas estas fuentes de variabili- dad en la elaboración de la propia imagen hacen que la autoevaluación varíe en pertinencia y siga variando al hilo de acontecimientos y experien- cias. La segunda razón para desconfiar de la autoevaluación como instru- mento de decisión en cuestiones de carrera es, una vez más, el problema planteado por el diferente significado que cada sujeto atribuye a expresio- nes corrientes y frecuentes, como siempre, con frecuencia, a veces, etc. y más todavía a conceptos psicológicos, como dominio, autoridad, agresivi- dad, sociabilidad...

En resumen, podríamos fijar así el estado actual de nuestros conoci- mientos sobre este punto:

1. La propia imagen es ciertamente un determinante importante de la motivación.

2. La propia imagen se construye a través de las experiencias adqui- ridas y sobre todo, gracias al retorno de informaciones sobre la manera en que los demás evalúan nuestros actos y rendimientos.

3. La autoevaluación es un mal instrumento de descripción de la propia imagen, ya que se ve deformada por la «deseabilidad social» y sobre todo porque el significado de las expresiones utilizadas en los cues- tionarios de autoevaluación varía de forma no controlable por los indivi- duos.

Por tanto, podríamos resumir diciendo que la autoevaluación debería considerarse como un instrumento de gestión de los recursos humanos y de las motivaciones individuales, más que como una información útil para la selección: es importante dar a cada cual medios para elaborar una imagen pertinente de sus propias aptitudes y personalidad. Ya en 1955, un psicólogo clínico, Kelly, comprendió muy bien el papel central que tiene la representación que cada persona elabora de sí misma. Kelly des- arrolló un método de estudio de las representaciones que puede aplicarse a la propia imagen de manera fructífera, evitando los obstáculos que su- ponen la deseabilidad social y la heterogeneidad de los significados. Utili- zada ya para la orientación y consejo profesionales, en Inglaterra sobre todo, la «rejilla» de Kelly puede muy bien utilizarse para describir la propia imagen, en comparación con la imagen que el sujeto posee de los demás. Puede entonces servir como punto de partida para introducir al- gún tipo de consejo que permita a los individuos tomar conciencia de la propia imagen implícita, que están utilizando y, en caso necesario, hacer- la evolucionar (Levy-Leboyer y otros, 1987). Evidentemente, por muy

Page 161: Evaluacion Del Personal

LOS TESTS DE PERSONALIDAD Y SUS LIMITACIONES 141

útil que sea ese método, no puede tomarse como base para una selección o una decisión concreta en cuestión de carrera; en cambio, sí que puede entrar a formar parte del conjunto de métodos empleados dentro del marco de un centro de evaluación cuyo principio describiremos en el si- guiente capítulo.

¿ES POSIBLE Y, EN SU CASO, ÚTIL DESCRIBIR LOS INTERESES Y LAS FUENTES DE MOTIVACIÓN?

Cabría preguntarse con toda razón si una de las condiciones del éxito en una tarea profesional determinada es el interés por el trabajo. De ahí la atención dedicada a los cuestionarios de interés, tanto en orientación como en selección profesional. Hay dos tipos de cuestionarios, según se hayan elaborado y contrastado de forma empírica o que respondan y se basen en un análisis descriptivo del campo de intereses. Entre los prime- ros, el más conocido es el cuestionario de Strong, cuyas numerosas planti- llas de corrección pueden proporcionar índices de proximidad con grupos profesionales específicos o con categorías profesionales más amplias. El más conocido dentro de la segunda categoría es el cuestionario de Kuder, resultado de un análisis factorial que ha permitido definir unos grupos coherentes de actividades correspondientes a esferas homogéneas de inte- reses, por lo que proporciona un «perfil» de intereses. También existen perfiles tipo de actividades profesionales que permiten precisar la proxi- midad de los intereses individuales medidos con el cuestionario de Kuder y los que caracterizan a los diferentes grupos profesionales. Otros inventa- rios están constituidos por listas de actividades profesionales o incluso por listas de oficios reagrupados en grandes categorías, tras un análisis facto- rial de las respuestas.

Es posible, pues, diferenciar grupos profesionales examinando los inte- reses profesionales de sus miembros y también indicar si tal o cual indivi- duo tiene unos intereses que le alejan o le aproximan de tal o cual grupo profesional. Por otro lado, existe una fuerte presunción a favor de una estabilidad de los intereses. Tras un período de exploración de las activi- dades, que dura aproximadamente de los 8 a los 18 años, y un período de opción profesional que va aproximadamente de los 15a los 25 años, los intereses parecen estabilizarse. Pero habría que confirmar esa observación que se desprende de investigaciones que han quedado trasnochadas. La actual evolución, que hace aparecer continuamente nuevas ocupaciones y que altera profundamente, por el avance tecnológico, el contenido mismo de las actividades ¿provoca tal vez una menor estabilidad de los intereses?

Page 162: Evaluacion Del Personal

142 EVALUACIÓN DEL PERSONAL

Pueden ser importante para el individuo, cuando se plantean, cuestio- nes sobre su orientación o sobre sus opciones de carrera, utilizar un test que resuma sus intereses y le permita compararlos con los de grupos significativos. Lo cual no significa que dicho diagnóstico ofrezca verdade- ro interés para la empresa. En efecto, las correlaciones encontradas entre intereses profesionales y satisfacción son bastante débiles. Esto puede te- ner varias explicaciones. Cuando una persona se da cuenta de que su actividad profesional no se corresponde con sus intereses, es bastante pro- bable que cambie de actividad. Por ello, cuando se interroga a un grupo de profesionales, sus intereses están suficientemente próximos como para que no se desprenda ninguna correlación entre intereses y satisfacción. Por otra parte, cuando se mide la satisfacción de personas que ejercen alguna actividad que responde a sus intereses, medidos anteriormente, se puede comprobar que la frecuencia de individuos satisfechos es elevada, más elevada que en un grupo similar, pero en el que los intereses anterio- res y las actividades actuales no coincidan. Pero el nexo entre satisfac- ción y adecuación de intereses varía según la importancia que la vida profesional tenga en el conjunto de actividades del individuo (Dupont, 1987).

Tampoco los intereses son buenos predictores del éxito profesional. Las investigaciones existentes, han mostrado que los intereses no permi- ten definir, en el seno de un grupo profesional, a quienes han triunfado plenamente de quienes sólo han obtenido un mediano o escaso éxito. Existe la posibilidad, sugerida por Dupont (1987), de que los intereses puedan desempeñar un papel compensatorio para aquellos individuos cuyas aptitudes sean escasas: en los individuos más dotados, el éxito no dependería de los intereses; mientras que en el caso de aquellos cuyas aptitudes sean mediocres, los intereses permitirían predecir el éxito. En este último caso, la presencia de intereses sería causa de una mayor moti- vación para triunfar en una actividad que se valora más.

Así pues, los tests de interés profesional no son tampoco instrumentos válidos dentro del proceso de selección, y ello aun cuando intereses cerca- nos caractericen a los miembros de un mismo grupo profesional. No obstante, queda por definir mejor la relación entre intereses y personali- dad. En efecto, es muy posible que las personas que comparten los mis- mos intereses profesionales posean otros caracteres personales en común. En tal caso, los intereses serían signos que revelarían la personalidad. De hecho, esa es la idea que ha llevado a utilizar inventarios biográficos como medios de describir la personalidad a través de la conducta pasada, sobre todo las opciones de comportamiento vinculadas a los intereses.

Hemos tratado de mostrar, en la introducción de la presente obra, que la motivación no es una característica de la personalidad individual, sino

Page 163: Evaluacion Del Personal

LOS TESTS DE PERSONALIDAD Y SUS LIMITACIONES 143

que es un proceso que resulta del encuentro entre ciertos valores y ciertos deseos del individuo y lo que la organización y las condiciones laborales le ofrecen. En este sentido, es imposible medir la motivación e identificar individuos que estén motivados, cualesquiera sean las tareas y las circuns- tancias.

En cambio, hay que tener en cuenta que lo que motiva al individuo y organiza su actividad es el hecho de que esa actividad va a procurarle las satisfacciones que él valora. De manera que identificar las fuentes de satisfacción y la jerarquía de valores individuales presenta un enorme interés, tanto para el individuo como para la empresa. Y, sin embargo, existen pocos instrumentos, tests o incluso cuestionarios, destinados a identificar esas fuentes de motivación. Y se admite con harta facilidad que apenas existen diferencias entre los individuos sobre ese punto. Sobre todo, es importante saber que el enriquecimiento proporcionado por los trabajos no satisface a todos y que sólo una parte de las personas activas siente la necesidad de tener mayor responsabilidad y autonomía en su tra- bajo.

La entrevista es muchas veces el único medio de identificar las priori- dades individuales y lo que cada cual desea obtener y realizar mediante su trabajo. ¿Es este un aspecto a tener en cuenta en el momento de la selec- ción? Posiblemente no, ya que esos deseos se desarrollan a compás de la experiencia y no tienen por qué estar forzosamente presentes en el mo- mento de la incorporación profesional. No obstante, algunos investigado- res americanos han hecho algunas tentativas muy prometedoras destina- das a medir, por un lado la importancia que cada cual concede a los diferentes resultados posibles del trabajo, y por otro a verificar la presen- cia de tales resultados en la situación laboral. El hecho de que las condi- ciones de trabajo correspondan o no a los deseos del individuo parece predecir su ulterior satisfacción (Schneider y Schmitt, 1986).

¿Qué podemos sacar en limpio de esta panorámica de tests y cuestio- narios destinados a describir la personalidad, los intereses y las jerarquías de valores? Dicho en dos palabras, que su empleo no está justificado cuando se trata de adoptar decisiones referentes al reclutamiento, la selec- ción o asignación para un puesto, salvo en dos casos: cuando se ha hecho específicamente un estudio de validez para el puesto a cubrir; y cuando los resultados obtenidos se utilizan en el marco de una actividad de aseso- ramiento, orientación o gestión de carrera, por lo que se relativizan con respecto a otras informaciones.

En otras palabras, no existe posibilidad de «generalización» de la vali- dez predictiva de un perfil de personalidad, ni siquiera dentro de un grupo aparentemente homogéneo de funciones. El éxito obtenido por el test de frases a completar de Miner sirve de prueba, ya que la plantilla de escruti-

Page 164: Evaluacion Del Personal

144 EVALUACIÓN DEL PERSONAL

nio que elaboró se funda en un análisis de las funciones de los cuadros dentro de organizaciones de tipo burocrático. Tal vez pudiera desarrollar- se otra plantilla para las organizaciones no burocráticas, y para las peque- ñas y medianas empresas; y no se puede descartar que se puedan utilizar plantilla específicas (y por tanto, unos perfiles de personalidad pertinen- tes) en otros casos, para empresas situadas en algún sector de avance tecnológico rápido o lento, con pocos o muchos niveles jerárquicos den- tro de su organigrama, etc. Lo que queda claro, en cuanto al campo de la personalidad, es que los factores clave del éxito son específicos de cada ocupación, e incluso de cada puesto dentro de una misma ocupación.

De manera que no son las técnicas disponibles las que son de escasa calidad, sino que es su utilización la que es muy delicada. En efecto, se exige, en cada caso, un estudio particular y un análisis del puesto que vaya más allá de la simple enumeración de los rasgos de personalidad requeridos o su elección en una lista preestablecida.

Así pues, problemas prácticos y problemas teóricos nos aconsejan uti- lizar los tests de personalidad con toda precaución y sólo en aquellas condiciones en las que no pueda entrar en juego la distorsión producida por «lo socialmente deseable». Y sobre todo, que nunca los utilicemos en solitario. En contrapartida, pueden servir de apoyo a una entrevista bien llevada, o mejor aún, a una entrevista posterior a unos tests de situación: se podrá así contrastar lo que el sujeto ha dicho de su comportamiento habitual y su manera de describirse a sí mismo con las conductas que ha manifestado en las situaciones estándar en que ha sido observado. Ese es el principio de los seminarios de evaluación de los que vamos a ocuparnos en el siguiente capítulo.

Page 165: Evaluacion Del Personal

8

Pruebas profesionales y test de

situación

La idea de utilizar una prueba profesional para evaluar las posibilida- des de éxito de un candidato a un puesto de trabajo no es nada nueva. Lo nuevo es el afán de elaborar unas pruebas profesionales que posean las cualidades métricas descritas en el capítulo tres. Ello supone tres pasos: normalizar los métodos utilizados, incluyendo por supuesto la califica- ción de las pruebas profesionales, analizar su significado y controlar su validez.

Una prueba profesional es básicamente una muestra de trabajo, o dicho de otra manera, una tarea elegida porque se piensa �preferente- mente basándose en un análisis del trabajo� que dicha tarea o tareas- prueba son representativas de la tarea o tareas que el candidato habrá de efectuar en el ejercicio de su actividad profesional. En algunos casos, las pruebas profesionales se presentan bajo el mismo aspecto que los tests de aptitud y llevan incluso el nombre de test. Tal es el caso, por ejemplo, de los tests para puestos administrativos que figuran en los catálogos de edi- tores de tests y que en realidad son pruebas profesionales elaboradas para oficios burocráticos. En los Estados Unidos, la New Jersey Civil Service Commission ha desarrollado una gran panoplia de pruebas para oficios cualificados tales como electricista, fontanero, carpintero, etc., que las hace pasar en un edificio especialmente equipado al efecto. Algunos de los tests elaborados por el servicio psicológico de la SNCF y por el de la RATP representan asimismo simulacros que guardan la mayor similitud posible con los puestos reales de trabajo. En otros casos, estas «pruebas» merecen el nombre de «tests de situación» porque están constituidos por situaciones-test que simulan una situación real de la profesión en cues- tión. El sujeto enfrentado a esa situación ha de tratarla y su comporta- miento es analizado del modo más preciso y sistemático posible por unos observadores formados y pertrechados de unas parrillas de observación adecuadas.

145

Page 166: Evaluacion Del Personal

146 EVALUACIÓN DEL PERSONAL

Postergadas durante un período bastante largo por el favor de que gozaban los tests, las pruebas profesionales han atraído de nuevo la aten- ción de los psicólogos y de los servicios de personal. En los Estados Uni- dos, esta renovación se vio estimulada por el artículo de Wernimont y Campbell (1968) y por la idea de coherencia en el comportamiento des- arrollada sobre todo por Schmidt y otros (1979). Estos autores subrayaron la utilidad de las muestras de comportamiento laboral, siempre que estas sean realistas y que su elección esté basada en un meticuloso análisis de las exigencias de los puestos a cubrir. La idea central consiste en crear unas pruebas profesionales que se correspondan punto por punto con el trabajo real. Su validez se funda en la idea de que el comportamiento observado durante la prueba profesional, considerada como una réplica en miniatura del trabajo real, se repetirá en las posteriores situaciones laborales. La calificación de las pruebas profesionales no debe limitarse al resultado obtenido, ha de disponerse de manera que tenga también en cuenta los procedimientos utilizados.

Esta fuente de información para la evaluación de los individuos en el trabajo consiste básicamente en unas muestras de trabajo, y desde ese punto de vista, se opone a los tests propiamente dichos que pueden consi- derarse como los «signos» de las cualidades que el individuo es capaz de actualizar en su trabajo. Las pruebas profesionales se basan en la idea de que una buena muestra de comportamiento permitirá predecir un con- junto de comportamiento de igual categoría. El fundamento teórico de los tests consiste, en cambio, en buscar la medición adecuada de un rasgo latente que se estima (basándose en un análisis del trabajo) importante para el puesto en cuestión, y que se supone, según los estudios de validez de contenido, que pueden ser medido por el test.

Wernimont y Campbell, antes citados, defienden la idea de que debe- ríamos apoyar las decisiones en materia de recursos humanos más bien en muestras de comportamiento que en signos cuyo nexo con los criterios de éxito suele ser imperfecto. Ya tuvimos ocasión, en los capítulos 3 y 4, de presentar la noción de validez y la significación de los tests. Por lo que se refiere al objeto de este capítulo, hay que subrayar que varias síntesis realizadas sobre la comprobación de las pruebas profesionales (Ascher y Sciarrino, 1974, Roberston y Kandola, 1982, sobre todo) han demostrado que éstas poseen una aceptable validez, muchas veces tan elevada o más que la obtenida mediante otro tipo de predictores.

Hay otras ventajas que explican la popularidad de las pruebas profe- sionales. Ante todo, poseen una fuerte «validez aparente». Dicho en otras palabras, los candidatos que se someten a ellas tienen la sensación de estar siendo equitativamente juzgados, sobre la base de unos exámenes que ellos consideran pertinentes porque perciben bien la relación entre los

Page 167: Evaluacion Del Personal

tests que realizan y el trabajo al que aspiran. Además, la prueba profesio- nal, por sus cualidades de simulacro del puesto a cubrir, les proporciona informaciones realistas sobre el tipo de tareas que les aguardan. Esta «va- lidez aparente» tiene consecuencias en su comportamiento. En la medida en que aceptan sin reserva el principio del examen a que se someten, se sienten motivados a superarlo al máximo de sus posibilidades. Evidente- mente, eso no ocurre cuando se trata de los clásicos tests cuya relación con el trabajo a realizar aparece muy desdibujada, sobre todo si nadie la justifica mediante informaciones claras y apropiadas antes del examen. Además, el candidato puede evaluar por sí mismo sus resultados. Down y otros (1978) describen una investigación en la que todos los candidatos que habían pasado unas pruebas profesionales eran admitidos a un curso de formación preparatoria para dicho trabajo, si así lo deseaban. Los resultados de la prueba profesional, clasificados en A (los mejores), B, C, D y E (los peores), no se comunicaron a los candidatos. Pues bien, el 90,7 % de los A decidieron iniciar la formación, el 81 % de los B, el 75,6 % de los C, el 54,6 de los D y sólo el 23 % de los E. Si la introducción de pruebas profesionales en el procedimiento de evaluación motiva a los candidatos y les brinda una ocasión para autoevaluarse, cabe pensar que su utilización reducirá las bajas voluntarias, y por tanto, «La rotación de personal». Esto es lo que sucede, como demostraron Cascio y Philips (1979) en una investigación en la que la mera introducción de pruebas profesionales en los métodos de selección redujo el turnover de un 40 a un 3 % en los dos años siguientes.

Las pruebas profesionales y los tests de situación tienen otras ventajas. Sobre todo, los psicólogos americanos han demostrado que no ponen en desventaja a los candidatos que pertenezcan a minorías, o por lo menos no les perjudican tanto como los tests clásicos. Además, y volveremos luego más en detalle sobre el tema, la mayoría de los estudios de validez han demostrado que son buenos indicadores del éxito profesional. Podría- mos añadir que los profanos en su uso no harán una mala elección al optar por una prueba profesional claramente inapropiada, mientras que elegir acertadamente un test cognitivo o de aptitud no resulta nada fácil.

Dicho esto, no todo son ventajas cuando se emplean pruebas de este tipo. En efecto, su utilización resulta costosa y ardua: hay que elaborar unas pruebas específicas para cada ocupación, incluso para cada puesto; muchas veces, sólo se puede examinar a unos pocos candidatos a la vez, a veces incluso hay que hacerlo uno por uno. Y con frecuencia cada prueba exige un material de por sí costoso y que requiere un tiempo de prepara- ción.

Existe una gran variedad de pruebas profesionales y tests de situación. Podríamos clasificarlos en cinco categorías:

PRUEBAS PROFESIONALES Y TEST DE SITUACIÓN 147

Page 168: Evaluacion Del Personal

148 EVALUACIÓN DEL PERSONAL

1. Tareas de naturaleza psicomotriz que implican básicamente la manipulación de objetos en actividades tales como escribir a máquina, utilizar una máquina de coser, ensamblar piezas o trabajarlas.

2. Pruebas de conocimiento que pongan de manifiesto el saber del candidato dentro de un campo estrechamente vinculado al del empleo para el que es examinado.

3. Pruebas de formación en las que se enseña a los candidatos una tarea de la misma naturaleza que las que habrán de realizar en el puesto a cubrir; a continuación se juzgará su capacidad para efectuar la tarea que se les ha enseñado.

4. Tomas de decisión individual en las que el candidato ha de adop- tar decisiones examinando los documentos que se proporcionan, o inclu- so reaccionan ante situaciones que se le describen.

5. Tomas de decisión en grupo en las que varios candidatos han de resolver juntos un problema que se les presenta, o incluso ejecutar en grupo una determinada tarea.

6. Finalmente, seminarios de evaluación, utilizados sobre todo para cubrir puestos ejecutivos o para hacer balances de potencial humano, y que están constituidos por un programa de pruebas diversas en las que los tests de situación desempeñan un papel clave.

Presentaremos las ventajas e inconvenientes de cada uno de estos mé- todos precisando los procesos que hacen entrar en juego, su significado y su validez predictiva.

Resulta un tanto difícil establecer una distinción precisa entre tests psicomotores y pruebas profesionales de tareas motrices. En ambos casos, se trata de que el candidato efectúe un trabajo que ponga en juego unas aptitudes motrices y que puede dar lugar, bien a una medición objetiva de los resultados obtenidos, en cantidad y en calidad, bien a una evaluación del comportamiento hecha por jueces competentes.

Así, los tests de destreza consisten en hacer manipular objetos que hay que ensamblar o desplazar. Es el caso, por ejemplo, del test de destreza de Crawford, en el que el sujeto debe colocar unos tubitos de metal en un agujero y cubrirlos con un collar liso. Es también el caso del test de Bennet, en el que el candidato tiene que colocar unos tornillos y unos pernos. En Francia, han desarrollado tests de coordinación motriz. J. M. Lahy y R. Bonnardel. Muchas veces se acercan mucho a las tareas profe- sionales reales. Por ejemplo, el test del torno consiste en hacer que una punta siga un camino metálico desplazándola mediante dos manivelas.

Aparte de estos tests, se han desarrollado nuevas pruebas profesionales para responder a las necesidades de evaluación de las aptitudes sensomo- trices en puestos muy concretos. Campion (1972) en un trabajo muchas veces citado como dechado de procedimiento a seguir, describe cinco etapas:

Page 169: Evaluacion Del Personal

PRUEBAS PROFESIONALES Y TEST DE SITUACIÓN 149

1. Un grupo de expertos se encarga de confeccionar una lista de las tareas efectuadas en el puesto de trabajo y de su frecuencia.

2. Un segundo grupo de expertos elabora una lista de las tareas que en general han efectuado ya los candidatos al puesto.

3. Los expertos identifican las dimensiones del trabajo en las que se diferencian los buenos operarios de los malos y proporcionan ejemplos de incidentes críticos para ilustrar concretamente tales dimensiones.

4. Se procede entonces a una elección de tareas comunes a las fases 1 y 2 y que se refieran a las dimensiones definidas en 3.

5. Se analizan con detalle las tareas marcadas, se describen los dife- rentes métodos de trabajo y se prepara una ficha de descripción del com- portamiento para los observadores.

El trabajo de elaboración de una prueba profesional psicomotora pue- de parecer largo y fastidioso, pero merece la pena ya que las valideces obtenidas son significativas. En una síntesis de los trabajos publicados, Robertson y otros (1982) indican que la validez media es de 0,44 cuando el criterio es una nota profesional, 0,38 cuando el criterio lo constituye el éxito en un aprendizaje y 0,49 cuando el criterio es una tarea profesional real, en situación. De todos los predictores estudiados en ese artículo, las pruebas profesionales son las que ofrecen mayor validez. Es evidente que por sí mismas no agotan las fuentes de éxito o fracaso profesional, pero sí que desempeñan un papel muy importante.

Hay, sin embargo, dos condiciones que limitan un tanto su utilidad. Ante todo, hay que tener presente que se da una fuerte plasticidad en las aptitudes psicomotrices. En otras palabras, el rendimiento de los sujetos en este tipo de tareas responde a la educación y a la experiencia anterio- res. Lo cual significa que el aprendizaje de una actividad profesional pue- de mejorar sensiblemente el rendimiento de un candidato y que, a la inversa, el ejercicio prolongado de un determinado tipo de tarea puede hace difícil la adaptación a otra labor parecida, pero que suponga unos mecanismos psicomotores aparentemente diferentes.

Por otro lado, las pruebas profesionales sólo son predictivas si corres- ponden ajustadamente a las tareas efectuadas en el puesto o empleo en cuestión. En un estudio ya antiguo, Drewes (1961) había mostrado que un test de destreza no era válido para predecir la productividad de obreros encargados de efectuar trabajos de montaje, mientras que unos simula- cros que reproducían los procesos operativos reales resultaron perfecta- mente predictivos. De ahí la idea de que las pruebas profesionales han de corresponder punto por punto a las tareas para las que se utilizan.

No es ese el punto de vista defendido por Fleishman. Sus estudios sobre las aptitudes psicomotrices comenzaron allá por los años cincuenta

Page 170: Evaluacion Del Personal

150 EVALUACIÓN DEL PERSONAL

con un vasto proyecto referido a la medida de aptitudes responsables del éxito profesional de pilotos de aviación (Fleishman, 1956). Partió de un postulado diferente a la correspondencia «punto por punto» que defendía Drewes: si los tests miden bien las aptitudes necesarias para ejecutar las tareas profesionales, no es preciso que esos tests sean simulacros de traba- jo real, que se parezcan estrechamente a dicho trabajo. Elaboró así una serie de tests destinados a los pilotos y los comprobó en un millar de casos. Los tests, que suponían tareas muy cercanas a las de pilotar (por ejemplo, un test de coordinación compleja, un test de control del timón de dirección) tuvieron valideces del orden de 0,40 a 0,45 y los tests menos similares al puesto de piloto, pero que medían aptitudes pertinentes, da- ban unas valideces entre 0,30 y 0,34. Existen otros ejemplos en la biblio- grafía disponible que muestran que las medidas de aptitud mediante ta- reas-test cercanas a la realidad son más válidas que los tests menos realistas, aún cuando estos posean también una validez nada desdeñable.

Fleishman prosiguió sus investigaciones con el fin de clarificar la natu- raleza de las aptitudes físicas (Fleishman, 1964, 1978, Hogan y otros, 1979, 1980). En una serie de estudios experimentales, un elevado número de tests psicomotores fueron sometidos a un análisis de correlaciones en- tre sí y con criterios varios, y también a análisis factoriales. Los resultados demuestran que no existe un factor general de funcionamiento motor («physical fitness»), sino once aptitudes distintas e independientes entre sí, así como once aptitudes psicomotrices diferentes.

Las aptitudes responsables del funcionamiento motor son: � El equilibrio. � La flexibilidad. � La fuerza estática de la parte alta del cuerpo. � La fuerza estática de la parte baja del cuerpo. � La fuerza dinámica de la parte alta del cuerpo. � La fuerza dinámica de la parte baja del cuerpo. � La fuerza de desplazamiento de la parte alta del cuerpo. � La fuerza de desplazamiento de la parte baja del cuerpo. � La resistencia. � La coordinación de los movimientos de los miembros.

Las aptitudes psicomotrices son: � La precisión del control de los movimientos. � La coordinación de los miembros. � La orientación de las respuestas motrices. � El tiempo de reacción. � La rapidez del movimiento de los brazos.

Page 171: Evaluacion Del Personal

PRUEBAS PROFESIONALES Y TEST DE SITUACIÓN 151

� El control de puntería de un objetivo móvil. � La destreza manual. � La destreza de los dedos. � El control de los movimientos de brazos y manos. � La rapidez de movimientos del puño y dedos. � La puntería hacia un objetivo fijo.

Fleisham elaboró asimismo unas escalas de calificación de los com- portamientos, para lo que se basó en el mismo principio que las escalas de las calificaciones profesionales que describimos en el capítulo segundo.

Los resultados de estas investigaciones se aplicaron a la industria, para evaluar las aptitudes en los oficios manuales. Por ejemplo, Cooper y otros (1983) desarrollaron una batería de tests referentes a cinco aptitudes, defi- nidas por Fleishman y consideradas pertinentes para diversos empleos de la Edison Electric. La validez de esos tests con relación a la evaluación de las cualidades psicomotrices de los sujetos hecha por veteranos alcanzaba un 0,54 (correlación múltiple).

El empleo de cuestionarios de conocimientos profesionales es relativa- mente raro, ya que las cualificaciones garantizadas por los diplomas otor- gados por el sistema educativo ya toman en cuenta dichos conocimientos. De todos modos, Robertson y otros (1984) y Hunter (1982) señalan algu- nos ejemplos de su utilización. Además, Hunter realizó un meta-análisis referido a 296 coeficientes de correlaciones entre cuestionarios de conoci- mientos profesionales y diferentes criterios de éxito: la correlación media obtenida alcanzaba 0,51. Cuando las investigaciones tenidas en cuenta eran las que habían utilizado pruebas profesionales en situación como criterio de éxito (11 estudios), la media de los coeficientes de correlación alcanzaba el 0,78. Evidentemente, en todos los casos se trata de conoci- mientos que son necesarios para el ejercicio de la actividad profesional considerada. Salvo en el caso de los diplomas otorgados por el sistema educativo, que suelen cubrir un campo de conocimientos más amplio del que se utilizará, stricto sensu, en tal o cual puesto.

Cuando el aprendizaje de una actividad representa un elemento críti- co para el éxito profesional y se trata de personal de escasa cualificación, pueden ser muy útiles los tests de formación. Básicamente consisten en evaluar en qué medida son capaces los candidatos de dominar una activi- dad nueva. El aprendizaje se hace en unas condiciones estándar y la des- cripción del rendimiento es objeto, bien de medidas objetivas, bien de una lista de control de errores y dificultades que pueden aparecer durante el aprendizaje. Hay diversos estudios que prueban la validez de este pro- cedimiento. Robertson y otros señalan unos resultados satisfactorios. Reilly y Manese (1979) utilizaron un test de formación para la selección

Page 172: Evaluacion Del Personal

152 EVALUACIÓN DEL PERSONAL

de personal de centralitas telefónicas empleado por ATT. Siegel (1983) preparó y utilizó varios tests de este tipo cuya validez demostró en una muestra de más de 1.000 personas incorporadas al Centro de la Marina americana de San Diego. Las correlaciones obtenidas entre las notas a estos tests y las calificaciones profesionales ulteriores van de 0,45 a 0,61. Estas valideces son superiores a los resultados obtenidos con los clásicos tests de aptitud de «papel y lápiz». Con un ejemplo podremos hacer com- prender mejor el tipo de formación que se pone en juego. Muchos puestos de trabajo en la marina implican una doble tarea: vigilar una pantalla o las señales, por un lado, y un trabajo de montaje, por otro lado. En los tests de formación se enseñaba a los candidatos a ejecutar un trabajo de montaje que implicaba la lectura de esquemas e informaciones y la toma de medidas diversas. Durante la tarea-test los candidatos tenían que efec- tuar el trabajo que acababan de aprender sin perder de vista un tablero de alarmas luminosas. Y fue esa ejecución de la doble tarea lo que se calificó y puso en relación con los comportamientos profesionales ulteriores.

Otro tipo de tests de situación consiste en observar a los candidatos (que aspiran a puestos de responsabilidad) cuando se enfrentan a una situación lo más parecida posible a las situaciones que se les van a presen- tar en la vida profesional real y en las que tendrán que tomar una o algunas decisiones. Un ejemplo de este tipo de test de situación es el que nos brindan Schmitt y Ostroff (1986) quienes elaboraron un simulacro telefónico. Los candidatos aspiraban a una selección de técnicos de la policía encargados de recoger las llamadas telefónicas urgentes de perso- nas que pedían ayuda por diversas razones. Su tarea consistía en obtener información suficiente para poder adoptar iniciativas adecuadas y man- dar a la policía, a los bomberos o asistencia médica. El análisis del trabajo había indicado sobre todo la importancia de la capacidad de comunica- ción, del control emocional y del juicio o discernimiento. Con el fin de valorar la existencia de tales cualidades en los candidatos, se les sometió a un «simulacro telefónico». Tenían que desempeñar el papel de un técnico que recoge llamadas telefónicas. La persona que llamaba era en realidad un técnico aventajado al que se había entregado un guión al que debía atenerse, y que había sido sometido a una sesión de formación de dos horas para que aprendiera a comportarse de una manera igual para con todos los candidatos. Sobre todo, tenía que mostrarse muy afectado, repe- tir los mismos comentarios y no dar ninguna información precisa mien- tras el candidato no se le pidiera expresamente. La conversación se graba- ba por entero y se sometía luego a una doble calificación. Por un lado, los candidatos tenían que rellenar una ficha de entrevista con todas las infor- maciones pertinentes y esa ficha era objeto de una nota que representaba la calidad de la información efectivamente conseguida y anotada. Por

Page 173: Evaluacion Del Personal

PRUEBAS PROFESIONALES Y TEST DE SITUACIÓN 153

otro lado, los candidatos eran puntuados por varios jueces que trabajaban independientemente sobre su capacidad de comunicación, su control emocional y su juicio. La plantilla de calificación se había elaborado confor- me al procedimiento descrito en el capítulo II para elaborar fichas de califica- ción fundadas en comportamientos reales. Las intercorrelaciones entre los jueces eran muy elevadas ya que iban de 0,69 a 0,94. Por otro lado, esas observaciones se correlacionaban de manera muy significativa con la ulterior descripción de los comportamientos profesionales reales.

Otra manera de poner a los candidatos en situaciones simuladas con- siste en pedirles que resuelvan los problemas con que se encuentran al revisar una serie de notas, correspondencia, mensajes telefónicos y otros documentos colocados en la bandeja del correo, de ahí el nombre de este tipo de situación (in tray o in basket, es decir, test de la bandeja o de la cesta). En general, los candidatos disponen de un tiempo limitado para efectuar ese trabajo y se les proporciona un resumen descriptivo de la empresa. Tienen que desenvolverse con la documentación que se les faci- lita, y se supone que la tarea tiene lugar un domingo por la mañana, cuando todos los colaboradores están fuera. Es evidente que la elección de los documentos situados en la cesta del correo es importante y que la calificación del trabajo efectuado ha de hacerse lo más sistemáticamente que sea posible. Sobre todo, es preciso que algunas personas competentes con respecto al puesto y al trabajo solicitados confeccionen una lista de operaciones que han de efectuarse, de informaciones que se deben apartar o no atender, de tareas prioritarias, de las diferentes reacciones posibles y de su respectivo valor. El trabajo realizado y las decisiones adoptadas son objeto de una calificación que pone de relieve la capacidad para desarro- llar unas relaciones humanas satisfactorias, así como la capacidad de ad- ministrar y organizar. Si todos los evaluadores están formados en este tipo de calificación, la experiencia demuestra que los juicios que hacen guar- dan una correlación entre sí.

Este tipo de test es generalmente bien acogido por los candidatos, ya que se parece al trabajo real. No obstante, se ha puesto de relieve el carácter artificial de la tarea: responder por escrito en un despacho solita- rio no ofrece las mismas dificultades que decir las cosas de viva voz, y es más difícil resolver problemas delicados cuando hay otros estímulos soli- citándonos continuamente, como ocurre en la vida real.

A pesar de estas evidentes limitaciones, los tests de decisión en situa- ción predicen el éxito global de una manera significativa: la medida de correlaciones reunida por Robertson y otros sobre 53 estudios alcanza el 0,28. Además, si se establece una correlación entre las calificaciones obte- nidas en un test de situación y una descripción del comportamiento en una tarea precisa, y utilizando bien las aptitudes que se desean medir con

Page 174: Evaluacion Del Personal

154 EVALUACIÓN DEL PERSONAL

ese test, la correlación media (siempre según esa misma fuente) alcanza un 0,75.

Por otro lado, cuando el número de puestos a cubrir es muy restringi- do y, excluye, por tanto, la posibilidad de un estudio de validez clásico, el procedimiento consistente en hacer un análisis del trabajo, que permita definir las exigencias del puesto y elaborar unos tests de situación asocian- do la jerarquía a la evaluación de los candidatos, representa una solución realista y válida. Así describe Robinson la selección de un ejecutivo para una sociedad constructora de casas unifamiliares (1981). La batería de test, elaborada tras un detallado análisis del puesto y de las 19 tareas que incluía, consistió en las siguientes pruebas: lectura de los planos del arqui- tecto (en los que se habían deslizado algunos errores); poner en orden la sucesiva intervención de los diferentes grupos de oficios en la obra; detec- ción de errores en una maqueta del edificio; reorganización del reparto de tareas en una obra sometida a una reorientación de los objetivos y entre- vista sobre relaciones laborales, seguridad y problemas éticos.

Todos los anteriores ejemplos de tests de situación se refieren a cir- cunstancias en las que el candidato se encuentra ante un problema que tiene que resolver él solo; o dicho de otra manera, se trata de evaluar la calidad de las decisiones adoptadas por un individuo que trabaja en solita- rio. No es ese el caso en otra categoría de test de situación llamados test de grupo. El principio es muy sencillo: varios candidatos al mismo puesto, que no se conocen de antemano, tienen que efectuar juntos una tarea concreta o discutir en común un determinado tema. Las más de las veces, se les pide que lleguen, en un tiempo determinado, bien a una decisión común, bien a una realización que sea obra del grupo. Según los casos, se pueden asignar diversos roles a los diferentes miembros del grupo, o no designar líder a alguno de ellos. Este último supuesto, conocido bajo el nombre de «test de grupo sin líder» representa la forma más utilizada y la que desde hace tiempo ha dado lugar a un mayor múmero de investiga- ciones (Bass, 1954; Lévy-Leboyer, 1963).

En un test de grupo sin líder, se reúne a varios individuos y se les encomienda un trabajo o decisión en común. Es importante que sean igualmente competentes, o incompetentes, cosa más fácil de lograr, en cuanto a la tarea o discusión propuestas. En otras palabras, el trabajo a efectuar no es más que un pretexto; la auténtica tarea consiste en el pro- blema social planteado por la necesidad de trabajar en grupo con un objetivo común. El comportamiento de cada uno de los individuos es observado, mientras efectúan esa tarea en grupo, por dos o tres jueces. En general, estos evaluaran el comportamiento en tres aspectos: facilidad para el trabajo en grupo, sociabilidad, ejercicio de la autoridad. Los jueces pueden ser psicólogos cualificados o bien simples profesionales, siempre

Page 175: Evaluacion Del Personal

PRUEBAS PROFESIONALES Y TEST DE SITUACIÓN 155

que hayan recibido una formación adecuada, sobre todo con respecto a la observación objetiva y la diferencia que existe entre dicha observación y los procesos de inferencia que consisten en atribuir supuestas causas al comportamiento observado.

El acuerdo entre los jueces es elevado aún cuando algunos de ellos sean miembros de la jerarquía formados para los tests de grupo, aunque sin verdaderos conocimientos previos en psicología, y sobre todo en gru- pos suficientemente amplios de sujetos (de 6 a 8). Esta Habilidad inter- jueces resulta más elevada, como era de esperar, cuando previamente ha tenido lugar una formación de los mismos (Greenwood y otros, 1967, Thornton y otros 1980). Las valideces de las calificaciones obtenidas du- rante un test de grupo son elevadas; según Bass alcanzan 0,60 para profe- siones de venta y puestos ejecutivos, mientras que el criterio de éxito profesional está constituido por la curva de salarios. Robertson (1982) cita una validez media de 0,35 con el rendimiento en el trabajo y el progreso en la carrera. Los diferentes autores señalan que el contenido de la tarea asignada al grupo no afecta a la validez y que, en general, las informa- ciones proporcionadas por los tests de grupo son más válidas que las extraídas, sobre los mismos aspectos, de cuestionarios o tests de perso- nalidad.

Los tests de situación, tanto los tests «in basket» como los de grupo sin líder representan, según Bray y Grant (1966), la parte más importante de los seminarios de evaluación de los que seguidamente hablaremos: en efecto, guardan una fuerte correlación con la decisión o evaluación final en que desembocan los seminarios de evaluación al cabo de un programa de varios días y son uno de sus componentes más constantes.

Los seminarios de evaluación constituyen la última categoría de prue- ba profesional en la lista que indicábamos al comienzo del presente capí- tulo. En realidad se les podría clasificar dentro del grupo de pruebas pro- fesionales en la medida en que se basan en el mismo principio, a saber, la idea de que la observación directa de una muestra de comportamiento en unas situaciones características del puesto a cubrir representa el mejor predictor del ulterior éxito en dicho puesto. Sin embargo, se apartan de los casos que antes analizábamos en algunos puntos que constituyen, por lo demás, su aspecto más original.

Ante todo, se trata de un método de evaluación que concierne siempre a un grupo homogéneo de candidatos evaluados por un grupo de jueces y observadores. En segundo lugar, el programa de cualquier centro de eva- luación es a la vez definido y flexible. Definido porque hallamos siempre en él los mismos ingredientes: entrevistas, tests de situación individual y tests de grupo, así como tests clásicos, pruebas de aptitud y tests de perso- nalidad. Flexible porque la elección de tests, así como la distribución de

Page 176: Evaluacion Del Personal

156 EVALUACIÓN DEL PERSONAL

tareas entre los entrevistadores y también el contenido de los tests de situación se adaptan al problema planteado, es decir, al objetivo persegui- do. El único imperativo real se refiere a la presencia simultánea, entre los instrumentos de evaluación, de pruebas profesionales (tests de situación y entrevista en situación) y de tests clásicos, con la idea, eso sí, de que los segundos se utilicen, en la medida de lo posible, para analizar y compren- der el comportamiento observado mediante las situaciones-test.

Los seminarios de evaluación representan un método arduo y costoso que solo se utiliza para niveles relativamente elevados de la jerarquía. Según cada caso, se ocupan de reclutar cuadros, o de realizar, en las grandes organizaciones, una investigación de potencial humano que per- mita establecer unos planes de gestión de personal ejecutivo, o incluso, en los Estados Unidos, de efectuar la selección de acceso a la universidad.

Schneider y otros (1986) ofrecen varios ejemplos de programas de seminarios de evaluación. El organizado para reclutar al administrador de un establecimiento escolar dura dos días e incluye una entrevista, un test «in basket», un test de grupo sin líder, una discusión de grupo con roles asignados, un análisis de dossier con presentación oral del resultado. El organizado para la investigación de potencial humano a nivel de mandos intermedios comprende un test de inteligencia, un test proyectivo, un test «in basket», una discusión de grupo, una tarea con roles asignados, un cuestionario de autodescripción, unos tests de personalidad y un ejercicio de presentación oral, con una duración total de tres días. En el primer ejemplo había un observador-evaluador para dos candidatos, en el segun- do ejemplo, la relación es de uno para cuatro. En ambos casos, la fase de observación y la de evaluación se hallan perfectamente separadas, con una duración para la segunda de al menos un día para cada grupo.

Los seminarios de evaluación no son un instrumento nuevo: nacieron durante la Primera Guerra Mundial en Alemania y se utilizaron de nuevo a gran escala durante la Segunda Guerra Mundial por el ministerio britá- nico de la Guerra y por el Office of Strategic Services de los Estados Unidos. Tras la contienda, el estudio longitudinal realizado por Bray y sus colaboradores (1966-1974) en la American Telephone and Telegraph Company, consistente en seguir la evolución de las carreras de un grupo de jóvenes ejecutivos, fue ciertamente el origen del éxito y la multiplica- ción de los seminarios de evaluación en los Estados Unidos. Buena prue- ba de ello son la publicación en 1977 de un obra (Moses y Byham) que recogía todos los conocimientos adquiridos y la de otra obra de 1982 (Thornton y Byham) que hacía balance de las nuevas investigaciones efec- tuadas en ese intervalo, así como la aparición regular, a partir de 1978, de una publicación periódica, el Journal of Assessment Center Technology. En Japón, los seminarios de evaluación han sido adoptados por buena

Page 177: Evaluacion Del Personal

PRUEBAS PROFESIONALES Y TEST DE SITUACIÓN 157

parte de las grandes organizaciones, siendo el ejemplo más conocido el de Matsushita, que habría organizado, hasta la fecha, un millar de semina- rios. También en Europa es importante el éxito logrado por este método: un estudio de síntesis ha visto la luz en francés de la mano de un psicólo- go suizo, F. Tapernoux (1984) y, en Francia, el método se ha adaptado con el nombre de balance del comportamiento por parte de V. Ernoul (1986). Es cierto que los seminarios de evaluación son más frecuentes en los demás países de Europa que en la propia Francia; pero, como muy bien señala Tapernoux en la encuesta por él realizada a este respecto, son muy pocas las empresas francesas que están dispuestas a responder cues- tionarios sobre sus propias prácticas de contratación y selección de perso- nal y las informaciones que tenemos sobre la forma de actuar en Francia son por ello muy fragmentarias.

Podríamos resumir que este método es ampliamente utilizado y que ha dado lugar a numerosas investigaciones experimentales, especialmente en los Estados Unidos. Aún cuando todos estos estudios no hayan gozado del entorno excepcionalmente favorable que permitió a Bray llevar todo su estudio «a ciegas», es decir, sin comunicar al servicio de personal nin- guno de los resultados recogidos durante las sesiones, realizadas a título experimental, en el seminario de evaluación, no deja de ser cierto que disponemos de datos métricos sobre este método y, sobre todo, de valida- ciones muy estimables.

Resulta difícil definir la fiabilidad de un seminario de evaluación en la medida en que no es posible repetir dos veces exactamente el mismo procedimiento. De todos modos hay que admitir que el método plantea pocos problemas desde ese punto de vista, pues los pocos resultados con que se cuenta muestran una fiabilidad muy elevada.

Los primeros datos fueron obtenidos durante la guerra por parte del ejército americano y muestran un fuerte porcentaje de acuerdo entre las evaluaciones asignadas en los dos seminarios de evaluación en los que sucesivamente participaron los mismos candidatos (Morris, 1949). Más recientemente, Moses (1973) comparó las evaluaciones de 85 candidatos y confirmó la existencia de una fuerte fiabilidad. Asimismo es elevado el acuerdo entre los calificadores, como demuestran algunos repasos a la bibliografía existente (Hinrichs y otros 1976, Schmitt, 1977). Este acuerdo entre los jueces se refiere tanto a los psicólogos que participan en la eva- luación como a los miembros de la jerarquía formados para los semina- rios de evaluación: Jones (1981) señala una fuerte fiabilidad entre los calificadores de una serie de seminarios en los que oficiales de marina evaluaban a candidatos a oficiales.

La mejor investigación sobre la validez de los seminarios de evalua- ción es sin duda la de Bray y Grant, ya citada antes. Estos autores exami-

Page 178: Evaluacion Del Personal

158 EVALUACIÓN DEL PERSONAL

naron, durante una serie de seminarios de evaluación celebrados el mis- mo año, a 123 titulados universitarios y 144 ejecutivos de primera línea y guardaron en sus dossiers los resultados de estas evaluaciones. Ocho años más tarde, el 82 % de los diplomados y el 75 % de los restantes candidatos que habían sido promovidos a funciones de mandos intermedios, habían sido correctamente identificados en el momento de someterse a las sesio- nes iniciales de los seminarios de evaluación. La predicción de los no promocionados había sido aún más atinada: el 88 % de los diplomados no ascendidos y el 95 % de los restantes candidatos no ascendidos ya habían sido detectados en los seminarios de evaluación. Además, un estudio de validez realizado veinte años más tarde vino a confirmar el valor de los diagnósticos elaborados en el momento de pasar los seminarios de evalua- ción y la pertinencia de las decisiones adoptadas.

Algunas revistas de investigación han seguido confirmando esos resul- tados. La validez media de las evaluaciones es del orden de 0,40 (Schmitt y otros, 1984, Hunter y Hunter, 1984) y puede alcanzar valores mucho más elevados. Y al repasar las publicaciones que comparan las valideces obtenidas con diferentes criterios vemos, cosa rara y digna de subrayarse, que las valideces son comparables cualesquiera que sean los criterios utili- zados (Thornton y otros, 1985).

Una investigación reciente efectuada en Inglaterra y referida a la pro- moción dentro de la policía aporta una prueba más de esta validez (Feld- ham, 1988). Los seminarios de evaluación incluían tres tests de inteligen- cia y de cultura general, redactar una carta sobre un guión determinado, varias entrevistas, una discusión de grupo sin líder, un ejercicio de deci- siones a adoptar ante unas situaciones descritas por escrito, el estudio de un dossier con la obligación de adoptar una decisión y justificarla, y unas medidas sociométricas facilitadas por los demás candidatos. El conjunto de aspirantes, fueron luego calificados por sus jefes y estas calificaciones fueron objeto de un análisis factorial. Este análisis muestra la existencia de un factor de evaluación global y de un factor de esfuerzo y de motiva- ción. Las notas de evaluación global fueron correctamente predichas por los seminarios de evaluación, mientras que la validez de los tests cogniti- vos por sí solos era mucho más limitada. Los autores explican este resulta- do por el nivel relativamente elevado de las puntuaciones obtenidas en los tests de inteligencia por esta población ya seleccionada. Es posible que a partir de un cierto nivel de inteligencia, lo que determina el éxito profe- sional no tenga que ver con el funcionamiento cognitivo, sino con la motivación y la personalidad. Finalmente, los autores calcularon, basán- dose en las valideces obtenidas y comparando el uso de seminarios con los resultados que habrían dado la mera utilización de entrevistas, que el empleo de este método suponía un ahorro de 550.000 libras por año.

Page 179: Evaluacion Del Personal

PRUEBAS PROFESIONALES Y TEST DE SITUACIÓN 159

Los seminarios de evaluación tienen otras ventajas. Ante todo, poseen una fuerte «validez aparente»; en otras palabras, los candidatos que en ellos participan tienen, en su inmensa mayoría, la sensación de ser juzga- dos sobre unas bases adecuadas, objetivas y pertinentes. Por otro lado, los candidatos aseguran asimismo tener la sensación de haber aprendido algo sobre sí mismos y haber aprovechado la experiencia; lo cual es tanto más cierto cuando es una persona competente quien realiza el feedback de los resultados. Finalmente, los ejecutivos de la empresa que participan en seminarios de evaluación aprenden a hacer evaluaciones objetivas y tie- nen además la posibilidad de observar a los candidatos en situaciones estándar, lo que representa una doble aportación desde el punto de vista de su propia formación.

Lo cual no quita que los seminarios de evaluaciones tengan también sus fallos y hayan suscitado algunas reservas y críticas. Ante todo, hay que recordar su elevado coste, cuando se contabiliza la formación de los jue- ces y observadores, el desarrollo del seminario de evaluación mismo y los costes materiales unidos al hecho de que el conjunto de la operación se lleve a cabo normalmente en locales ajenos a la empresa, donde candida- tos y evaluadores han de residir durante dos o tres días. En realidad, el coste de los seminarios de evaluación no debería calibrarse sin tener en cuenta los beneficios que pueden generar, gracias a una reducción de los errores en la gestión del personal y a una mejor apreciación del potencial humano existente en la empresa. Ya vimos en el capítulo cuatro que se han realizado algunos intentos de aclarar este tipo de comparaciones, con resultados llamativos.

No menos cierto es que los seminarios de evaluación suscitan proble- mas fundamentales y que, al igual que con cualquier otra técnica de eva- luación de adultos, es preciso analizar sus fuentes de validez y ver en qué se basa ésta.

Los datos existentes sobre la validez de los seminarios de evaluación proceden exclusivamente de los ejércitos inglés y americano y de algunas grandes organizaciones americanas o multinacionales como IBM, ATT, Union Carbide, etc. El mejor estudio de validez, el realizado por Bray y Grant en ATT (1966) evita cualquier «contaminación del criterio», man- teniéndose en secreto los resultados de los seminarios de evaluación y no utilizándose para ulteriores decisiones. Pero las más de las veces no ocurre esto con las conclusiones de los seminarios de evaluación, sobre todo cuando se trata de hacer un balance del potencial humano para establecer un plan de promoción, se convierten en «self-fulfilling prophecies», es decir, profecías que influyen sobre la realidad. En este sentido, habría que saber mejor qué efecto producen los seminarios de evaluación en los pro- pios candidatos y en qué medida sirven para reforzar o debilitar su con-

Page 180: Evaluacion Del Personal

160 EVALUACIÓN DEL PERSONAL

fianza en sí mismos de manera tal que influyan luego significativamente en su agresividad y en su motivación posteriores.

También se han criticado los criterios utilizados en los estudios sobre la validez de los seminarios de evaluación. En especial Klimoski y Strick- land (1977) han puesto en entredicho la utilización de la promoción como criterio de validación predictiva. Estos autores defienden la idea de que las promociones recompensan a aquellos ejecutivos que poseen cierta capacidad de adaptación, incluso de supervivencia, dentro de la organiza- ción y que, si los seminarios de evaluación predicen bien las ulteriores promociones, es porque, en definitiva, miden más las capacidad de ma- niobra de los candidatos que su eficacia real. Más aún, según estos auto- res, cuando utilizamos la promoción como criterio de validez de nuestros predictores, corremos el peligro de anquilosar la organización frenando la evolución de las competencias necesarias y no seleccionando más que el mismo tipo de personas. De hecho, en un estudio más reciente (citado por Hunter y Hunter, 1984), los mismos investigadores han validado las eva- luaciones realizadas en un seminario de evaluación basándose en tres criterios, la promoción, las puntuaciones de potencial dadas ulteriormen- te por la jerarquía y la calidad del trabajo: los dos primeros criterios fueron correctamente predichos, pero no así el tercero.

Estos desiguales resultados dan que pensar y recuerdan muy oportuna- mente que la evaluación de los individuos no puede separarse de los problemas fundamentales que son los objetivos de la organización y los medios de que quiera dotarse para conseguirlos. Antes vimos que cual- quier reflexión sobre las calificaciones profesionales y sobre los criterios de validación suele crear desacuerdos entre los miembros de la dirección sobre qué es lo que se espera del personal. Nada tiene, pues, de extraño que la reflexión sobre la validez de los seminarios de evaluación, que sirven sobre todo para detectar los potenciales de personal de mando, lleve a la organización a examinar cuáles son los criterios implícitos por los que se rige su política de promoción.

Por otro lado, varios investigadores se han preguntado qué es lo que realmente se mide en el transcurso de un seminario de evaluación y qué es lo que determina la decisión final de rechazo, incorporación o promo- ción, según los casos. Un estudio en especial (Sackett y Dreher, 1982) pone en tela de juicio la homogeneidad de los resultados ofrecidos por diferentes métodos empleados durante el seminario de evaluación para medir el mismo rasgo psicológico. Si, por ejemplo, se mide la sociabilidad por un lado en el transcurso de un test de grupo y por otro durante una entrevista en situación y en el curso de un juego de roles, cabe esperar que las evaluaciones de la sociabilidad hechas en situaciones diferentes guar- den una correlación entre sí. De hecho, los resultados analizados por

Page 181: Evaluacion Del Personal

PRUEBAS PROFESIONALES Y TEST DE SITUACIÓN 161

Sackett y Dreher indican que las correlaciones entre unos mismos rasgos medidos en diferentes ejercicios se correlacionaban escasamente en dos de las organizaciones estudiadas (0,07 y 0,11) y bien en la tercera (0,51). Y que por el contrario, las intercorrelaciones entre rasgos diferentes califica- dos en el mismo ejercicio eran elevados (0,40 a 0,65), lo cual hace pensar que se califica más una impresión global que unos rasgos específicos. En otra investigación, Russell (1985) efectuó un análisis factorial de las califi- caciones referidas a 16 rasgos distintos evaluados durante el seminario de evaluación. Demostró que existía un fuerte factor general y, además, que dicho factor general poseía un contenido, y por tanto, una significación diferente para cada uno de los jueces (competencia social, aptitud para resolver problemas, o incluso funcionamiento cognitivo).

Este tipo de análisis sobre el contenido real de las pruebas profesiona- les, ya se trate de tareas-miniatura, de situaciones estándar o de semina- rios de evaluación, debería hacerse de manera más sistemática. Hemos tenido oportunidad de repetir en varias ocasiones que la calidad de un método de evaluación no debe calibrarse guiándose por la intuición. Esto reza especialmente por lo que se refiere a los tests clásicos que hemos descrito en los capítulos precedentes, pero también en el caso de las prue- bas profesionales, sobre todo porque se parecen lo suficiente a las tareas reales como para dar a quienes las emplean la sensación de tener en sus manos un instrumento eficaz y pertinente. No sólo conviene asegurarse de que así sea, efectuando estudios de validez predictiva siempre que ello sea posible y consultando los ya existentes, sino que además conviene no olvidar que no hay que hacerse ilusiones en cuanto a la riqueza de las informaciones recogidas. En este sentido, es indispensable el análisis de las valideces de contenido o, dicho de forma más sencilla, del significado de las notas atribuidas. Y lo es más aún en el caso de los seminarios de evaluación y de los tests de situación, donde la participación de observa- dores no psicólogos es la regla. Ya hemos visto que la experiencia que sacan los ejecutivos es muy valiosa y que contribuye a disipar posibles malentendidos sobre la naturaleza del trabajo ofrecido por los psicólogos. Pero eso no exime de una formación adecuada, ni de un control sistemá- tico de los efectos de esa formación, control que ha de realizarse mediante el estudio de las capacidades de cada juez para discriminar los diferentes aspectos que tiene que calificar, y a través del análisis de los resultados obtenidos, en especial los que se refieren al significado real de las puntua- ciones asignadas.

Con el actual estado de nuestros conocimientos, podemos deducir que los tests de situación, si se preparan y llevan a efecto de una manera sistemática, aportan una significativa contribución a la evaluación de la personalidad y al pronóstico del éxito profesional, sobre todo en los pues-

Page 182: Evaluacion Del Personal

162 EVALUACIÓN DEL PERSONAL

tos que implican un ejercicio de la autoridad y la carga de responsabilida- des de gestión. El empleo conjunto de test de situación, pruebas clásicas y entrevistas en los seminarios de evaluación constituye, sin duda alguna, el método actualmente más válido de que disponemos en lo que se refiere a la selección de directivos y a la evaluación del potencial de mando para las organizaciones.

LOS SEMINARIOS DE EVALUACIÓN

� Realizan la evaluación de un grupo de 5 a 8 individuos: � que poseen un nivel de cualifícación equivalente. � que son de edad aproximada. � que no se conocen.

� Suponen la presencia de un psicólogo que organiza el seminario de evaluación y de uno a tres evaluadores, psicólogos o no psicólogos. Los no psicólogos:

� no son los superiores jerárquicos actuales de los candidatos evalua- dos.

� han sido formados para esta tarea. � pueden pertenecer al departamento o servicio que hace la selección.

� Incluyen siempre: � uno o varios tests de situación. � tests clásicos. � varias entrevistas, cada una con un objetivo preciso.

� Van seguidos siempre: � de una reunión de síntesis en la que se adoptan decisiones en co-

mún por parte del grupo de evaluadores. � de una entrevista de realimentación realizada por el psicólogo de

cada candidato. � Pueden tener un objetivo específico (reclutamiento para un determinado puesto, selección para acceder a cursos de formación, por ejemplo), o un objetivo más amplio (buscar potencial de mandos), pero siempre clara- mente definido.

Page 183: Evaluacion Del Personal

RESUMEN PRACTICO Y CONCLUSIONES

DIEZ RESPUESTAS A DIEZ PREGUNTAS QUE SE

PLANTEAN LOS

RESPONSABLES DE

TOMAR DECISIONES

� En resumidas cuentas ¿hay métodos buenos y métodos malos para evaluar a los candidatos y adoptar decisiones respecto a su selección y promoción?

Ningún método es «bueno» independientemente del objeto y de las circunstancias de la evaluación. Concretamente, los métodos útiles y eficaces en psicología clínica y patológica pueden no serlo cuando se trata de adultos normales, a quienes se plantean problemas profesionales. Asimismo, un método que puede servir en el marco de una actividad consultiva puede muy bien no ser válido o ser poco válido cuando se trata de adoptar decisiones de selección: tal es el caso, por ejemplo, de los cuestionarios de interés profesional y de personalidad.

Por otro lado, algunos métodos pueden ser inadecuados para el problema planteado o para la muestra en cuestión. Tal es el caso, por ejemplo, de un método que no diferencia bien a los candidatos porque no sea suficientemente difícil o de un método que proporcione informaciones que ya se poseen.

También hay métodos malos, por ejemplo los que no son fiables, es decir, que dan resultados variables, en función sobre todo de quién los

163

Page 184: Evaluacion Del Personal

164 EVALUACIÓN DEL PERSONAL

utilice; los que no se hallan respaldados por un modelo teórico claro y que se han demostrado incapaces de predecir el comportamiento y servir de base para tomar decisiones correctas.

Finalmente, los métodos de evaluación tienen cada uno sus objetivos precisos; y sólo son «buenos» en la medida en que permiten evaluar los parámetros pertinentes, los que determinan la adecuación al puesto o función en cuestión.

Dicho lo cual, es posible hacer una síntesis de los estudios de validación existentes, por desgracia raros en Francia, aunque numerosos en los países anglosajones, sobre todo. Esto nos permitirá establecer un balance general de los grupos de métodos que han demostrado ser válidos, cualesquiera sean las situaciones, y de los que nunca son válidos o lo son en corta medida, es decir, los que de forma reiterada muestran correlaciones débiles con los criterios de éxito profesional.

Está claro que un método no válido jamás será un buen método, ya que no aporta informaciones fiables. Pero lo contrario no siempre es cierto y es preciso, para elegir el método o métodos correctos, tener en cuenta por lo menos otros dos aspectos. Por un lado, su coste, que habría que comparar (ver capítulo cuatro) con su utilidad, coste que incluye la eventual necesidad de poner a punto unos métodos específicos y formar a los usuarios de los mismos. Por otro lado, su aceptabilidad, es decir, el hecho de que sean fácil o difícilmente aceptables por los candidatos.

El siguiente cuadro presenta estos datos, resumidos a partir de los estudios citados en la presente obra. Habría que añadir que las valideces pueden sumarse en la medida en que las informaciones aportadas por cada uno de los métodos son diferentes. Hemos llamado débiles a las

Validez, coste y aceptabilidad de los métodos de evaluación

Método Validez Coste Aceptabilidad Prueba profesional Tests de aptitudes Seminarios de evaluación Tests de funcionamiento cognitivo Biodata Referencias Entrevistas Tests de personalidad Cuestionarios de interés Autoevaluación Grafología

Fuerte Fuerte Fuerte Fuerte Media Débil Débil Débil Débil Débil

Ninguna

ElevadoEscasoElevadoEscasoMedio EscasoMedio EscasoEscasoEscasoMedio

Muy buena Buena

Muy buena Buena Buena

Muy buena Muy buena

Escasa Media Escasa Buena

Page 185: Evaluacion Del Personal

RESUMEN PRÁCTICO Y CONCLUSIONES 165

valideces que van de 0,10 a 0,20; medias a las que van de 0,20 a 0,40 y fuertes a las que superan 0,40.

Este cuadro, ha de considerarse como un resumen, y las valideces son susceptibles de variar según la naturaleza de las actividades profesionales. Ya vimos en el capítulo seis que eso es lo que ocurre concretamente con los tests de funcionamiento cognitivo o de inteligencia general, que son tanto más válidos cuanto mayor sea el grado de actividad intelectual que implique la tarea en cuestión y con los tests que miden aptitudes específicas. Hemos clasificado los métodos de más o menos válidos. Aquellos métodos de los que no poseemos estudios de validez no figuran, por razones obvias, en el cuadro.

� ¿Se deben emplear los mismos métodos para la selección externa y para la selección interna y la promoción?

Evidentemente no. Por otro lado, no se dispone de la misma información cuando se trata de seleccionar personas externas a la organización o de cubrir puestos mediante la promoción o la selección interna. Las síntesis de estudios de validación sobre decisiones de selección externa (incorporaciones) o de selección interna mediante la promoción, y que emplean criterios de la misma naturaleza, permiten comparar el valor predictivo de las diferentes categorías de métodos. En los cuadros que siguen, establecidos de acuerdo con los datos reunidos por Hunter y Hunter (1984) y por Cook (1988), indicamos las valideces medias de los diferentes métodos disponibles. Los métodos están ordenados por orden de validez decreciente. Este cuadro no se debe utilizar en solitario cuando se trata de elegir un método de evaluación. Por un lado, porque se trata de valideces medias y el análisis del trabajo puede poner de relieve la importancia de alguna exigencia particular. Por otro lado, porque habrá de tomarse en cuenta la posibilidad de emplear tal o cual método, así como su capacidad para discriminar a los candidatos en cuestión. Por ejemplo, los mandos pueden verse escasamente diferenciados por los tests de funcionamiento cognitivo y sus actividades pueden ser demasiado diversas para estar representadas en una prueba profesional. En tales casos, el seminario de evaluación constituirá el mejor método.

Page 186: Evaluacion Del Personal

166 EVALUACIÓN DEL PERSONAL

Validez medias de los diferentes métodos de evaluación para la selección externa

Tests de aptitudes * Prueba profesional y test de situación Seminarios de evaluación Biodata Referencias Entrevistas Notas durante la formación para el puesto Nivel escolar

0,53 0,44 0,43 0,37 0,26 0,14 0,13 0,10

Validez media de los diferentes métodos de evaluación para la selección interna

Prueba profesional y test de situación Tests de aptitudes * Notas profesionales Test de conocimientos profesionales Seminarios de evaluación

0,54 0,53 0,49 0,48 0,43

* Utilización conjunta de tests de funcionamiento cognitivo y de tests de aptitudes específicas.

� ¿Qué pensar de la grafología, tan ampliamente utilizada?

El análisis de la escritura en peritaciones judiciales (y por tanto, la posibilidad de identificar una escritura) es algo que aquí no nos atañe. Ni tampoco el estudio de las características de la escritura en casos patológi- cos, Queda, pues, por ver la validez del análisis grafológico en las tomas de decisión referentes a la selección o promoción de personal. Para asegu- rar dicha validez, tendrían que darse tres condiciones.

1. Una correcta reproductibilidad de los análisis, independientemen- te del grafólogo y del método que utilice. Sin ello, sólo se validará un método o un individuo.

2. Validaciones obtenidas con un texto manuscrito sometido a peri- tación que no aporte, en su contenido, información alguna sobre la perso- na a evaluar. Sin lo cual, el grafólogo hará al mismo tiempo un análisis de contenido de los datos biográficos del CV y de la carta de candidatura, más un estudio de las características estilísticas de dicha carta. Nada se opone a que se estudie la validez de esos diversos indicadores (ver capítu-

Page 187: Evaluacion Del Personal

RESUMEN PRÁCTICO Y CONCLUSIONES 167

lo cinco), pero hay que hacerlo correctamente y estudiar independiente- mente las informaciones que aporta la escritura por sí sola.

3. Un pronóstico preciso, y no una descripción general de la persona en cuestión, descripción que suele ser bastante vaga como para que se pueda verificar en todos los casos.

Estas condiciones casi nunca se cumplen. Y ya hemos dicho (capítu- lo siete) que en los pocos casos en que sí se daban, el análisis grafológico no era válido.

En tal caso, ¿a qué se debe el que se utilice tanto este sistema? Hay que señalar que se trata de una característica muy francesa y que la grafología se utiliza muy poco o nada en otros lugares. Pero lo cierto es que nos la encontramos en casi todas las selecciones que se hacen en Francia, sobre todo cuando se trata de puestos administrativos, de vendedores y de eje- cutivos.

Hay varias razones. Ante todo, el análisis grafológico es menos costoso que la mayoría de los restantes métodos de los que hemos tenido ocasión de tratar. De ahí su empleo tan frecuente en las primeras cribas y cuando las candidaturas son muy numerosas. Aunque habría que comparar la utilidad de esos diversos métodos (ver introducción de la segunda parte). Y recordar que la primera criba es importante: si se deja escapar a los buenos candidatos, no se les podrá repescar en el segundo examen.

En segundo lugar, este método es fácilmente aceptado por los candida- tos, quienes remiten gustosos una carta manuscrita (eso cuando no hacen que otro se la escriba...), mientras que se muestran remisos a someterse a unos tests apremiantes y a responder a unas preguntas que muchas veces consideran indiscretas.

Finalmente, el análisis grafológico llamado «profundo» brinda un per- fil de agradable lectura y seguramente mucho más sugestivo que una serie de puntuaciones obtenidas en uno o varios tests. La persona encargada de decidir en la empresa tiene así la sensación de dominar su propia decisión al ser él quien hace la síntesis de las informaciones que se le ofrecen. Bien está implicar a los encargados de tomar la decisión en el proceso de eva- luación, pero eso no ha de hacerse a partir de unos datos cuya fiabilidad está por probar.

� ¿Qué actitud adoptar ante la morfo-psicología, la astrología, la numerología, etc.?

Una actitud de sentido común. El comportamiento humano es un dato complejo, determinado por parámetros numerosos y diversos. Y esos determinantes pueden ser características de los individuos (sus apti- tudes, su personalidad, sus escalas de valores...), o bien características de

Page 188: Evaluacion Del Personal

168 EVALUACIÓN DEL PERSONAL

la situación laboral (contenido de la tarea, tipo de liderazgo, índole de los planes salariales y de promoción, clima social dentro de la empresa...). Pero en todos esos casos podemos formular unas hipótesis claras sobre las razones que hacen que una característica individual o una característica situacional determinen el comportamiento en el trabajo. Habrá, eso sí, que verificar la hipótesis �como ya hemos visto a lo largo de esta obra� y elaborar unos instrumentos que midan correctamente los parámetros en juego.

Así pues, hay que desconfiar de todos los métodos «milagrosos» que no se apoyen en una hipótesis verificable, que no se justifiquen mediante ninguna experiencia controlable y que sean presentados por sus autores como creencias que hay que aceptar sin examen crítico. Utilizar métodos no fundados para evaluar a las personas y adoptar decisiones que afecten a su vida profesional y a su carrera es algo contrario a la moral y al respeto de los valores humanos.

� El avance técnico y la evolución de los mercados hace cambiar, cada vez con más frecuencia, el contenido y la naturaleza de tareas y funciones. ¿Se puede medir y predecir la capacidad individual para adaptarse al cambio?

«Capacidad de adaptación»: qué buen ejemplo de un pseudo-rasgo de personalidad. Para hacer frente eficazmente a un cambio en el contenido de su trabajo o de sus funciones, es preciso que se den varias condiciones, que se sitúan a niveles distintos.

1. La persona en cuestión ha de ser capaz de adquirir nuevos conoci- mientos y ponerlos en práctica. Esta capacidad de aprendizaje y de movi- lización de los propios conocimientos se basa en el funcionamiento cogni- tivo. Sabemos cómo medir éste, y por tanto, se puede predecir esa faceta esencial de la adaptabilidad.

2. Tiene asimismo que estar convencida de que es capaz de afrontar la nueva situación. Esto depende de la propia imagen, elaborada a com- pás de las experiencias profesionales y de la realimentación sobre su ren- dimiento por parte del medio laboral. Se puede describir el concepto de sí mismo, medir la propia estima. Y se puede, sobre todo, mantener una gestión del personal que contribuya a que cada uno desarrolle una imagen propia realista y estimativa.

3. Los cambios previstos pueden conmocionar (o no) las relaciones entre la vida laboral y la vida fuera del trabajo. La índole de esos influjos, la importancia que cada cual les conceda, desempeñarán evidentemente un papel importante en la «capacidad de adaptación». Difícilmente pue-

Page 189: Evaluacion Del Personal

RESUMEN PRÁCTICO Y CONCLUSIONES 169

den predecirse, ya que se trata de factores que, de por sí, cambian a lo largo de la vida. Pero sí que se pueden analizar y tratar de resolver algunos de los problemas planteados.

4. ¿Puede haber una dimensión de la personalidad que iría ligada al gusto por el cambio o al rechazo del cambio? Probablemente lo que hay es un aspecto cultural que otorga o niega valor al riesgo y a la búsqueda de la novedad, a las satisfacciones que conlleva superar los desafíos. Son posiblemente rasgos de la personalidad que se van desarrollando a lo largo de la vida profesional y que no existirán antes de comenzar a trabajar. Lo que significa que la mejor manera de captarlos y, por tanto, de predecir las conductas futuras, consiste en examinar las conductas pasadas, a tra- vés de inventarios biográficos bien hechos (ver capítulo cinco).

� Según que el reclutamiento sea interno o que se reclute a gente de fuera, la selección de ejecutivos implica decisiones importantes. ¿Hay al- gún método específico para este tipo de problema?

Si y no. No, porque los mismos principios generales se aplican a la selección

de ejecutivos y a la de otras categorías profesionales. Concretamente, el análisis del trabajo es importante por la gran variedad de responsabilidad asignadas a los cuadros.

Sí, por tres razones. Ante todo, se posee más información sobre un candidato cuando éste entra en la vida activa con una prolongada forma- ción: ha tenido que ganar unas oposiciones, aprobar cursos de formación, recibir una cualificación, hacer algún cursillo... Habrá que aprovechar esa información. En segundo lugar, se trata de candidatos previamente selec- cionados por el sistema escolar, especialmente en Francia, donde el acce- so a los cursos de formación más prestigiados es muy elitista. Habrá que cuidar de no utilizar más que pruebas que resulten discriminatorias para un grupo de candidatos ya fuertemente seleccionados.

El tercer punto es el más importante y el más delicado. Se refiere a la capacidad de mando, es decir, a la aptitud para ejercer una autoridad. No es posible resumir en algunas líneas el abundantísimo número de estudios de campo hechos sobre la autoridad. Tales trabajos se han centrado en torno al debate fundamental planteado por las siguientes cuestiones: ¿existe una manera eficaz de ejercer la propia autoridad? ¿Existe un tipo de personalidad que facilite el ejercicio de la autoridad? La respuesta a la primera pregunta es compleja, pero suscita problemas de formación de ejecutivos y de gestión de recursos humanos que desbordan el marco de la presente obra. La respuesta a la segunda pregunta depende de las circuns- tancias; es decir, que la personalidad que facilita el ejercicio de la autori-

Page 190: Evaluacion Del Personal

170 EVALUACIÓN DEL PERSONAL

dad depende de las condiciones en las cuales tal autoridad ha de ejercerse. Según los puestos, la índole de las relaciones jerárquicas, los valores de la organización, las actitudes del personal aspirante al puesto ejecutivo y su calificación, las cualidades de un «buen ejecutivo» serán diferentes. De ahí el interés que tienen (y que hemos desarrollado en el capítulo ocho) los seminarios de evaluación, en los que la colaboración entre los jefes de la empresa y los psicólogos encargados de hacer la evaluación permitirá centrar ésta en las exigencias propias de cada situación.

� El aumento de candidatos provocado por el paro, o los gabinetes que «enseñan» a realizar los tests; ¿no distorsionarán el valor de los resultados?

Efectivamente, se puede estar más o menos familiarizado con el for- mato y la presentación de los tests. Lo mismo ocurre con cualquier exa- men. En los casos de tests de rendimiento máximo, es decir, aquellos en los que se espera que el candidato ofrezca el mejor rendimiento posible en una determinada tarea, poniendo en juego la aptitud que se pretende medir, un eventual aprendizaje beneficiaría más a los más dotados, y por tanto, aumentaría la dispersión de los resultados. Para evitar que un aprendizaje desigual distorsione las puntuaciones obtenidas, sería conve- niente que el test propiamente dicho fuera precedido de una especie de ensayo organizado de manera que todo el mundo haya comprendido per- fectamente las reglas de juego antes de iniciarse el test.

En el caso de los cuestionarios, el hecho de conocer las preguntas de antemano carece de importancia. En cambio, la idea que tienen los candi- datos respecto a la manera en que serán interpretadas las respuestas hace que estos cuestionarios sean poco fiables (ver capítulo siete). En el caso de los tests de situación, no es posible el aprendizaje, máxime cuando se pueden multiplicar y diversificar las situaciones en las que se hacen las observaciones del comportamiento.

� Puede ocurrir que no se esté en forma el día de los tests: ¿no resulta injusto que la vida profesional se ventile en uno de esos «días tontos»?

También puede ocurrir que no se esté en forma el día en que se tiene un examen, o el día en que el patrón hace una inspección, o el día en que se nos viene encima un problema especialmente difícil. Dicho esto, cuan- do se recibe al candidato en los centros de examen, es recomendable asegurarse de que no está enfermo, de que no ha trabajado la noche

Page 191: Evaluacion Del Personal

RESUMEN PRÁCTICO Y CONCLUSIONES 171

anterior y de que no sufre algún problema concreto que aconseje una nueva convocatoria.

� ¿Durante cuánto tiempo son válidos los resultados de los tests?

Depende de los tests y depende de lo que se entienda por válido. Siempre puede ser interesante medir el camino recorrido y la evolución entre dos ocasiones, separadas por varios años, en que se han hecho los tests. Desde luego, es muy arriesgado tomar una decisión basándose en tests que estaban acumulados en los cajones del servicio de personal desde años atrás. Dicho lo cual, los resultados de los tests son más o menos estables según lo que midan. Hemos visto que los intereses profesionales, por ejemplo, apenas se modifican. En cambio las aptitudes específicas pueden haberse desarrollado mediante el aprendizaje hasta tal punto que la evolución de las puntuaciones represente una buena manera de estimar la calidad de la formación. Esta evolución es especialmente sensible por lo que respecta a las aptitudes senso-motrices que mejoran mucho con el aprendizaje. Durante mucho tiempo se ha creído que el funcionamiento cognitivo no podía mejorarse en el adulto y que las puntuaciones obteni- das en esos tests eran muy estables. Recientes investigaciones, y la aplica- ción de métodos de «compensación cognitiva» han demostrado que eso no era cierto. Finalmente, la personalidad puede cambiar a medida que crecen las experiencias de la existencia, así como las aspiraciones, las escalas de valores, las representaciones sociales, etc.

� ¿Hacer buenas evaluaciones permite atraer y retener a los mejores candidatos?

Desde luego que no. Es la imagen de la empresa, la manera en que los candidatos son acogidos e informados lo que atrae a los mejores candida- tos y los retiene: no hay que olvidar que la selección y el reclutamiento son procesos sociales que permiten tanto a la empresa evaluar a los candi- datos como a estos trabar conocimiento con la empresa. En cambio, una empresa no gana nada por el hecho de tener fama de utilizar métodos de evaluación que no puede justificar.

Page 192: Evaluacion Del Personal
Page 193: Evaluacion Del Personal

Bibliografía citada

J.A. ALGERA, M.A.M. GREUTER, Job analysis for personnel selection, inter- vención en la International Conference on advances in selection and assess- ment, Buxton, Inglaterra, 1987.

J.A. ALGERA, P.S. JANSEN, R.A. ROE, P. VIJIN, Validity generalization: some critical remarks on the Schmidt-Hunter procedure, Jal of occupational Psychology, 1984, 57, 197-210.

R.D. ARVEY, J.E. CAMPION, The employment interview: a summary and review of recent research, Personnel Psychology, 1982, 35, 281-322.

R.D. ARVEY, H.E. MILLER, R. GOULD, P. BURCH, Interview validity for selec- ting sales clerks, Personnel Psychology, 1987, 40, 1-12.

J.J. ASHER, J.A. SCIARRINO, Realistic work sample test: a review, Personnel Psychology, 1974, 27, 519-538.

M.J. BALMA, The concept of synthetic validity, Personnel Psychology, 1959, 12, 395-396.

A. BANDURA, Social foundations of thought and action, Prentice Hall, Engle- wood Cliffs, New Jersey, 1986.

B.M. BASS, The leaderless group discussion, Psychological Bulletin, 1954, 51, 465-492.

J.C. BAXTER, B. BROCK, P.C. HILL, R.M. ROZELL, Letters of recommen- dation : a question of value, Jal of applied Psychology, 1981, 66, 296-301.

W.C. BORMAN, R.L. ROSSE, N.M. ABRAHAMS, An empirical construct validity approach to studying predictor-job performance links, Jal of applied psy- chology, 1980, 65, 662-671. D.W. BRAY, The management progress study, American Psychologist, 1969,

19, 419-420. D.W. BRAY, R.S. CAMPBELL, D.L. GRANT, Formative years in business : a

long-term AT & T study of managerial lives, Wiley, New York, 1974. D.W. BRAY, D.L. GRANT, The assessment center in the measurement of

potential for business management, Psychological Monographs, 1966, 80, 625.

B.J. BERNIER, Theorie des tests, Gaetan Morin, Chicoutimi, Canadá, 1984. A. BINET, V. HENRI, La psychologie individuelle, Année Psychologique, 1895,

2, 411-463. A. BINET, Nouvelles recherches sur la mesure du niveau intellectuel, Année

Psychologique, 1911, 17, 182-194. F. BLANZ, E.E. GHISELLI, The mixed standard scale: a new rating system,

Personnel Psychology, 1972, 25, 185-200.

173

Page 194: Evaluacion Del Personal

174 EVALUACIÓN DEL PERSONAL

D.W. BRAY, D.L. GRANT, The assessment center in the measurement of potential for business management, Psychological Monographs, 1966, 80, n° 17.

M.L. BRUCHON-SCHWEITZER, L'évaluation de la personnalité dans la sélection dupersonnel, in C. Lévy-Leboyer, J.C1. Spérandio, Traite..., op. cit., 1987.

M.L. BRUCHON-SCHWEITZER, Pratiques et savoirs en matiére d'évaluation du personnel, intervención en el Congrés de la Société Francaise de Psycho- logie, mayo 1989.

M.A. CAMPION, E.D. PUSELL, B.K. BROWN, Structured interviewing: raising the psychometric properties of the employment interview, Personnel Psy- chology, 1988, 41, 25-42.

S.J. CARROLL, A.N. NASH, Effectiveness of a forced-choice reference check, Personnel Administration, 1972, 35, 42-46.

W.F. CASCIO, N.F. PHILLIPS, Performance testing: a rose among thorns ?, Personnel Psychology, 1979, 32, 751-766.

L.J. CRONBACH, Coefficient alpha and the internal structure of tests, Psycho- metrika, 1951, 16, 297-334.

S. DOWNS, R.M. FARR, L. COLBECK, Self-appraisal: a convergence of selection and guidance, Jal of occupational Psychology, 1978, 51, 271-278.

M.D. DUNNETTE, Validity results for jobs relevant to the petroleum refining industry, American Petroleum Institute, 1972.

H. EBBINGHAUS, Über eine nevé methode zur prüfung geistiger fahigkeiten und ihre andwendung bei schulkindern, Zeitschrift Psychologie, 1897, 13, 401- 459.

V. ERNOULT, J.P. GRUERE, F. PEZEU, Le bilan comportemental dans l'entre- prise, Presses Universitaires de France, 1986, Paris.

R. FELTHAM, Validity of a pólice assessment centre : A 1-19 year follow-up, Jal of occupational Psychology, 1988, 61, 129-145.

J.C. FLANAGAN, La technique de l'incident critique, Revue de Psychologie Appliquée, 1954, 2, 165-185, et 3, 267-295.

E.A. FLEISHMAN, Toward a taxonomy of human performance, American Psychologist, 1975, 30, 1127-1149.

E.A. FLEISHMAN, M.K. QUAINTANCE, Taxonomies of human performance, Academic Press, 1984, New York.

F. GALTON, Inquines into human faculty and its development, Macmillan, 1883, Londres.

E.E. GHISELLI, The validity of occupational aptitude tests, Wiley, 1966, New York.

E.E. GHISELLI, The development of process for indirect or synthetic validity, Personnel Psychology, 1959, 12, 397-402.

E.E. GHISELLI, The validity of aptitude tests in personnel selection, Personnel Psychology, 1973, 26, 461-477.

D.W. GRAY, D.L. GRANT, The assessment center in the measurement of potential for business management, Psychological Monographs, 1966, 80, n°17.

Page 195: Evaluacion Del Personal

BIBLIOGRAFÍA CITADA 175

J.M. GREENWOOD, W.J. MCNAMARA, Inter-rater reliability in situational tests, Jal of applied Psychology, 1967, 51, 503-515.

R.M. GUIÓN, Personnel testing, McGraw HUÍ, 1965, New York. R.M. GUIÓN, Contení validity � the source of my discontent, Applied psy-

chological measurement, 1977, 1, 1-10. R.M. GUIÓN, CJ. CRANNY, A note on concurrent and predictive validity

designs : a critical reanalysis, Jal of applied Psychology, 1982, 67, 239- 244.

R.M. GUIÓN, Comments on personnel selection methods, capítulo 9 en M. Smith y I.T. Robertson, Advances in selection and assesment, Wiley, 1989, Londres.

P. HERRIOT, Towards an attributional theory of the selection interview, Jal of occupational Psychology, 1981, 54, 165-173.

J.R. HINRICHS, S. HAANPERA, Reliability of measurement in situational exer- cises : an assessment of the assessment center method, Personnel Psychology, 1976, 29, 31-40.

H.R. HIRSCH, L.C. NORTHROP, F.L. SCHMIDT, Validity generalization results for law enforcement occupations, US Office of Personnel Management, Washington, 1984.

L.M. HOUGH, Development and evaluation of the « Accomplishment Record » method of selecting and promoting professionals, Jal of applied Psychology, 1984, 69, 135-146.

J.E. HUNTER, R.F. HUNTER, Validity and utility of alternate predictors of job performance, Jal of applied Psychol., 1984, 96, 72-98.

L.R. JAMES, R.G. DEMARGE, S.A. MULAIK, A note on validity generalization procedures, Jal of applied Psychology, 1986, 34, 805-816.

T. JANZ, lnitial comparisons of patterned behavior description interviews versus unstructured interviews, Jal of applied Psychology, 1982, 67, 577-580.

A. JONES, Inter-rater reliability in the assessment of group exercises at a U.K. assessment center, Jal of occupational Psychology, 1981, 54, 79-86.

E.E. JONES, D.E. KANOUSE, H.H. KELLEY, R.E. NISBETT, S. VALINS, B. WEINER, Perceiving the causes of behavior, 1972, General Learning Press, Morristown, N.J.

G. KARNAS, L'analyse du travail, p. 609-625 in C. LÉVY-LEBOYER, J.C. SPE- RANDIO, Tratado, op. cit.

G.A. KELLY, The psychology of personal constructs, Norton, 1955, New York. E.R. KEMERY, K.W. MOSSHOLDER, L. ROTH, The power of the Schmidt and

Hunter additive model of validity generalization, Jal of applied Psychology, 1987, 72, 30-37.

V. de KEYSER, A. PIETTE, Analyse de l'activité des opérateurs au tableau synoptique d'une chaine d'agglomération, Le Travail Humain, 1970, 33, 341-352.

R.J. KIMOSKI, W.J. STRICKLAND, Assessment centers, valid or merely prescient. Personnel Psychology, 1977, 30, 353-361.

H.J. KINSLINGER, Application of projective techniques in personnel psychology since 1940, Psychological Bulletin, 1966, 66, 134-149.

Page 196: Evaluacion Del Personal

176 EVALUACIÓN DEL PERSONAL

G. LATHAM, C. FAY, L. SAARI, The development of behavioral observation scales for appraising the performance of foremen, Personnel Psychology, 1979, 32, 299-311.

G. LATHAM, L.M. SAARI, E.D. PURSELL, M.C. CAMPION, The situational interview, Jal of applied Psychology, 1980, 65, 4, 422-427.

G. LATHAM, K.N. WEXLEY, Behavioral observation scales for performance appraisal purposes, Personnel Psychology, 1977, 30, 255-268.

G. LATHAM, L.M. SAARI, The situational interview, Jal of applied Psychology, 1980, 65, 422-427.

H. LAURENT, Research on the identification of managerial potential, in J.A. Myers, Predicting managerial succes, Foundation for research on human behavior, Ann Arbor, 1968.

H. LAURENT, Cross-cultural cross-validation of empirically validated keys, Jal of applied Psychology, 1970, 54, 417-423.

C.H. LAWSHE, A quantitative approach to content validity, Personnel Psychology, 1975, 28, 563-575.

C. LÉVY-LEBOYER, Comportement social et caracteres individuéis, Monographies Francaises de Psychologie, 1963, Editions du C.N.R.S.

C. LÉVY-LEBOYER, M. GOSSE, V. NATUREL, Une nouvelle vieille méthode, la grille de Kelly, Revue de psychologie appliquée, 1985, 4, 285-271.

C. LÉVY-LEBOYER, J. Cl. SPÉRANDIO, Traite de Psychologie du Travail, PUF, París, 1987.

H.E. LINK, Employment Psychology, Macmillan, Londres, 1920. P.A. MABE, S.G. WEST, Validity of self-evaluation of ability : a review and

meta-analysis, Jal of applied psychology, 1982, 67, 280-296. E. Me CORMICK, Job and task analysis. Capítulo 15 en M.D. Dunnete, Hand-

book of industrial and organizational psychology, Rand Me Nally, 1976.

E. Me CORMICK, R.R. JEANNERET, R.C. MECHAM, A study of job characteristics and job dimensions as based on the Position Analysis Questionnaire, Jal of applied psychology, 1972, 56, 347-368.

C.J. MILLS, W.E. BOHANNON, Personality characteristics of effective state pólice officers, Jal of applied Psychology, 1980, 65, 680-684.

B.S. MORRIS, Officier selection in the British army, 1942-1945, Occupational Psychology, 1949, 23, 219-234.

J.L. MOSES, W.C. BYHAM, Applying the assessment center method, Pergamon Press, New York, 1977.

K.W. MOSSHOLDER, R.D. ARVEY, Synthetic validity, a conceptuel and compa- rative review, Jal of applied Psychology, 1984, 69, 322-333.

P.M. MUCHINSKY, The use of reference reports in personnel selection : a review and evaluation, Jal of occupational Psychology, 1979, 52, 287-297.

S.J. Mussis, M.K. SMITH, Contení validity : a procedural manual, Civil Service Commission, 1973, Minneapolis.

B.R. NATHAN, R.A. ALEXANDER, A comparison of criterio for test validation : a meta-analytic investigation, Personnel Psychology, 1988, 41, 517-535.

J.C. NAYLOR, L.C. SHINE, A table for determining the increase in mean criterion

Page 197: Evaluacion Del Personal

BIBLIOGRAFÍA CITADA 177

score obtained by using a selection device, Jal of industrial psychology, 1965, 3, 33-42.

A.G. NEINER, W.A. OWENS, Relationships between two sets of biodata with 7 years separation, Jal of applied Psychology, 1982, 67, 146-150.

L.C. NORTHROP, Validity generalisation results for apprenticeship occupations, 1985, U.S. Office of Personnel Management, Washington.

H.G. OSBURN, J.C. CALLENDER, J.M. GREENER, S. ASHWORTH, Statistical power of tests of the situational specificity hypothesis in validity generalization studies : a cautionary note, Jal of applied Psychology, 1983, 68, 115-122.

K. PEARLMAN, Job families : a review and discussion of their implications for personnel selection, Psychological Bulletin, 1980, 72, 1-28.

K. PEARLMAN, F.L. SCHMIDT, J.E. HUNTER, Validity generalization results for tests used to predict job proficiency and training success in clerical occu- pations, Jal of applied Psychology, 1980, 65, 374-405. R.D. PANNONE, Predicting test performance : a content valid approach to

screening applicants, Personnel Psychology, 1984, 37, 507-513. S.H. PERES, J.R. GARCÍA, Validity and dimensions of descriptive adjectives

used in reference letters for engineering applicants, Personnel Psychology, 1962, 15, 279-286.

R.R. REILLY, G.T. CHAO, Validity and fairness of some alternative employee selection procedures, Personnel Psychology, 1982, 35, 1-62.

R.R. REILLY, W.R. MANESE, The validity of a mini-course for telephone company personnel, Personnel Psychology, 1979, 32, 83-90.

I.T. ROBERTSON, R.S. KANDOLA, Work sample tests : validity, adverse impact and applicant reaction, Jal of occupational Psychology, 1982, 55, 171-183.

I.T. ROBERTSON, P.J. MAKIN, Management selection in Britain, a survey and critique, Jal of occupational Psychology, 1986, 59, 45-57.

D.D. ROBINSON, Content-oriented personnel selection in a small business, Personnel Psychology, 1981, 34, 77-87.

C.J. RUSSELL, Individual decisión process in an assessment center, Jal of applied Psychology, 1985, 70, 737-746.

P.R. SACKETT, A critical look at some common belief about assessment centers, Public Personnel Management Journal, 1982, 11, 140-147.

P.R. SACKETT, G.F. DREHER, Constructs and assessment center dimensions : some troubling empirical findings, Jal of applied Psychology, 1982, 67, 401-410.

F.L. SCHMIDT, J.R. CAPLAN, S.E. BENNIS, R. DECUIN, L. DUNN, L. ANTONE, The behavioral consistency method of unassembled examining, US Office of Personnel Management, 1979, Washington, D.C.

F.L. SCHMIDT, I. GAST-ROSENBERG, J.E. HUNTER, Validity generalization results for computers programmers, Jal of applied Psychology, 1980, 65, 643-661.

F.L. SCHMIDT, J.E. HUNTER, Development of a general solution to the problem of validity generalization, Jal of applied Psychology, 1977, 62, 529-540.

Page 198: Evaluacion Del Personal

178 EVALUACIÓN DEL PERSONAL

F.L. SCHMIDT, J.E. HUNTER, Moderator research and the law of small number, Personnel Psychology, 1978, 31, 215-232.

F.L. SCHMIDT, J.E. HUNTER, Employment testing: old theories and new research findings, American Psychologist, 1981, 36, 1128-1137.

F.L. SCHMIDT, J.E. HUNTER, A within settings empirical tests of the situation specificity hypothesis in personnel selection, Personnel Psychology, 1984, 37, 317-326.

F.L. SCHMIDT, J.E. HUNTER, A.N. OUTERBRIDGE, S. GOFF, Joint relations of experience and ability with job performance : test of three hypotheses, Jal of applied psychology, 1988, 73, 1, 46-57.

F.L. SCHMIDT, J.E. HUNTER, K. PEARLMAN, Task differences of aptitude test validity in selection : a red herring, Jal of applied psychology, 1981, 66, 166-185.

F.L. SCHMIDT, B.P. OCASIO, J.M. HILLERY, J.E. HUNTER, Further within- setting empirical tests of the situational specificity hypothesis, Personnel Psychology, 1985, 38, 509-524.

N. SCHMITT, Social and situational determinants of interview decisions : impli- cations for the employment interview, Personnel Psychology, 1976, 29, 79- 101.

N. SCHMITT, Inter-rater agreement in dimensionality and combination of assess- ment center judgements, Jal of applied Psychology, 1977, 62, 171-176.

N. SCHMITT, R.Z. GOODING, R.A. NOE, M. KIRSCH, Meta-analysis of validity studies published between 1964 and 1982 and the investigation of study characteristics, Personnel Psychology, 1984, 37, 407-422.

N. SCHMITT, C. ORLOFF, Operationalizing the « behavioral consistency » approach : selection tests development based on a content-oriented strategy, Personnel Psychology, 1986, 39, 91-108.

B. SCHNEIDER, N. SCHMITT, Staffing organizations, Scott, Foresman & Co, Glenview, Illinois, 1986.

A.I. SIEGEL, The miniature job training and evaluation approach : additional findings, Personnel Psychology, 1983, 36, 41-56.

M. SMITH, I.T. ROBERTSON, The theory and practice of systematic staff selection, London Macmillan, 1986.

F. SNEATH, M. TAKUR, B. MEDJUNCK, Testing people at work,, Institute of Personnel management, Londres, 1976.

F. TAPERNOUX, Les centres d'évaluation, Payot, 1984, Lausanne. H.C. TAYLOR, J.T. RUSSEH, The relationship of validity coefficients to the practical

chectiveness of tests in selection: Discussion and tables. Jal of applied psychology, 1939, 23, 565-578.

M.L. TENOPYR, Content-construct confusión, Personnel Psychology, 1977, 30, 47-54.

G.C. THORNTON, W. BYHAM, Assessment center of managerial performance, Academic Press, 1982.

G.C. THORNTON, B.B. GAUGLER, D.B. ROSENTHAL, C. BENTSON, Meta-ana- lysis of assessment center validity, Intervención en el 93 Congreso de la American Psychological Association, Los Angeles, 1985.

Page 199: Evaluacion Del Personal

BIBLIOGRAFÍA CITADA 179

G.C. THORNTON, S. ZORICH, Training to improve observer accuracy, Jal of applied Psychology, 1980, 65, 351-354.

M.H. TRATTNER, Estimating the validity of the aptitude and ability tests for semi professional occupations using the Schmidt-Hunter validity generali- zation procedure, 1985, US Office of Personnel Management.

L. ULRICH, C. TRUMBO, The selection interview since 1949, Psychological Bulletin, 1965, 63, 100-116.

R. WAGNER, The employment interview : a critical summary, Personnel Psy- chology, 1949, 2, 17-46.

P.R. WERNIMONT, J.P. CAMPBELL, Signs, samples and criteria, Jal of applied Psychology, 1968, 52, 372-376.

S. ZEDECK, A. TZINER, S.E. MIDDLESTART, Interviewer validity and reliability : an individual analysis approach, Personnel Psychology, 1983, 36, 355-370.

Page 200: Evaluacion Del Personal

Bibliografía básica en español

M.L. BLUM y J.C. NAYLOR, Psicología Industrial, Trillas, México, 1976. S. CARDONA, Entrevistas de selección de personal, Madrid, Ediciones Díaz de

Santos, 1991. COLEGIO OFICIAL DE PSICÓLOGOS (1984), Actas I Congreso del Colegio Oficial de

Psicólogos, volumen 5, 6 y Libro de Ponencias, C.O.P. Madrid. COLEGIO OFICIAL DE PSICÓLOGOS � Presente y futuro de ¡a Psicología del Trabajo en la Empresa: Actas del I Congreso

Nacional de Psicología del Trabajo, C.O.P. Madrid, 1983. � La intervención psicosocial en las Organizaciones: Actas del II Congreso Nacional

de Psicología del Trabajo, Universidad de Bellaterra, Barcelona, 1985. � Actas del I Congreso Iberoamericano y III Congreso Nacional de Psicología del

Trabajo y de las Organizaciones, Libro de Ponencias y libro de simposios. C.O.P., Madrid, 1985.

E.A. FLEISHMAN y A.R. BASS, Estudios de Psicología Industrial y del Personal, Tri- llas, México, 1976.

A. KORMAN, Psicología de la Industria y de las Organizaciones, Madrid, Marova, 1978.

C. LEVY-LEBOYER, Psicología de las Organizaciones, Barcelona, Planeta, 1975. MEPSA, Tests y técnicas psicológicas, Mepsa, Madrid, 1990. J.M. PEIRO, Psicología de las Organizaciones. Madrid, UNED, 1984. S. QUIJANOS, Un enfoque sistemático para la selección de personal: predictores de

éxito para puestos de ejecutivo, 1985. TEA, Test y Documentos psicológicos: información técnica y criterios de utiliza-

ción, 1990. TEA Ediciones, Madrid.

REVISTAS � Revista de Psicología del Trabajo y de las Organizaciones. � Revista de Psicología General y Aplicada.

Page 201: Evaluacion Del Personal