Como Escolher uma Avaliação Psicométrica Robusta

10 características fundamentais das ferramentas psicométricas de elevada qualidade

O que procurar em avaliações psicométricas valiosas e robustas

When Quando confrontados com as diferentes opções de avaliação psicométrica disponíveis para usar com os seus candidatos e colaboradores, pode ser difícil distinguir entre instrumentos "bons" e "maus". Além disso, pode ser difícil decidir qual deles fornecerá as informações de que precisa e qual deles oferecerá maior valor.
Este artigo descreve os critérios para testes psicométricos sólidos, robustos e valiosos, bem como os critérios adicionais a serem considerados na seleção de avaliações online.
Este artigo:
   Descreve os 10 critérios que deve usar para avaliar ou verificar a qualidade de uma ferramenta psicométrica.
   Inclui os critérios adicionais especialmente relevantes para instrumentos online.
   Inclui listas de verificação gratuitas para descarregar e para garantir que estão cumpridos os principais critérios e para ajudá-lo a escolher a ferramenta (ou ferramentas) mais eficaz(es) para as suas necessidades.
Isto é importante porque você precisa garantir de que qualquer instrumento psicométrico, seja ele realizado online ou offline, ofereça a precisão, valor e equidade necessárias para informar as suas decisões de RH. Organismos profissionais em todo o mundo e organizações como a Comissão Internacional de Testes e a Federação Europeia de Associações de Psicólogos, desenvolveram e definiram padrões consistentes para avaliações psicométricas. Normalmente, estes padrões estabelecem níveis mínimos que uma ferramenta deve alcançar, e ainda como essas ferramentas podem ser usadas e por quem.
(ITC: www.intestcom.org)
(EFPA: www.efpa.eu)

Procura a avaliação psicométrica correcta?
Esteja à vontade para nos contactar e saber mais sobre as Ferramentas Psicométricas da Aon.

1. Objetividade

Objetividade refere-se à medida em que os resultados do teste ou questionário são independentes da pessoa que pontua a avaliação.

Há três maneiras pelas quais a objetividade é demonstrada numa avaliação e estas relacionam-se com as diferentes fases de test:
  • Administração Padronizada
    A avaliação deve ser administrada por meio de instruções padronizadas e numa situação de teste regulamentada.
  • Pontuação padronizada
    O classificador da avaliação não pode ser capaz de influenciar o resultado ou uma pontuação atribuída, ou alterar o algoritmo de pontuação.
  • Interpretação padronizada
    As mesmas conclusões devem ser sempre tiradas de um determinado conjunto de resultados; idealmente, a pontuação deve ser comparada com os resultados de um grupo normativo.
Icon Digital Interview Quick Set Up

Um teste só pode ser interpretado sem ambiguidade se a objectividade nas três fases for assegurada.

2. Confiabilidade

 
A confiabilidade, também denominada precisão, é a medida pela qual uma ferramenta psicométrica apresenta resultados consistentes quando aplicada repetidamente. Por outras palavras, ela mede sempre da mesma forma o mesmo aspeto? Os resultados são fidedignos?

Um instrumento confiável é robusto contra interferências e, ao mesmo tempo, sensível às diferenças subjacentes nos seus valores característicos. Existem diferentes maneiras de definir a confiabilidade:
  • Reteste da Confiabilidade
    Verificar se os resultados da primeira aplicação do teste estão correlacionados com os resultados de uma segunda aplicação.
  • Confiabilidade de forma alternativa
    Calculada quando duas formas paralelas ou alternativas do mesmo teste são preenchidas pelas mesmas pessoas ao mesmo tempo e as suas pontuações são comparadas. Os resultados são então correlacionados para produzir um coeficiente de correlação de confiabilidade de forma alternativa.
  • Consistência Interna
    A consistência interna (coeficiente alfa de Cronbach) também é determinada a partir do uso de versões paralelas do mesmo teste ao mesmo tempo. Isto utiliza valores dos itens individuais do teste como a dificuldade do item e o poder discriminatório.

Um teste totalmente confiável apresenta um coeficiente de correlação de 1,00. Embora não existam instrumentos completamente confiáveis, realisticamente um valor de confiabilidade abaixo de 0,7 não deve ser aceite. Para questionários, o valor ideal está entre 0,75 e 0,85. Para testes de habilidade deve ser entre 0,8 e 0,9.
 
Icon Digital Interview Quick Set Up

Um instrumento confiável é robusto contra a interferência e, ao mesmo tempo, sensível às diferenças subjacentes nos valores característicos.

3. Validade

A validade preocupa-se com a necessidade de o teste medir aquilo para que foi desenhado para medir. Qual o grau de certeza que podemos ter de que as conclusões sobre como alguém se comporta no teste refletem a forma como ele se comportará no posto de trabalho?

Existem diferentes tipos de validade, incluindo:

Validade relacionada com critérios

O critério é a razão para avaliar alguém ou o propósito do teste. Para estimar a validade relacionada com o critério de um teste, a pontuação obtida é comparada com a obtida a partir de um instrumento diferente que mede o mesmo critério. A correlação entre o resultado do teste e esse outro instrumento de medida do critério representa a validade relacionada com o critério.

Validade concorrente

A validade concorrente é determinada quando os valores do teste e do critério forem medidos ao mesmo tempo sendo suposto que ambas as características estão presentes numa pessoa nesse momento. Com este coeficiente de validade, podem ser tiradas conclusões sobre os resultados do teste para critérios isócronos. Estes coeficientes são necessários para analisar os fatores dos problemas reais de desempenho.

Validade Preditiva

A validade preditiva é a extensão em que uma pontuação numa escala ou teste psicométrico prevê pontuações em alguma medida do critério. Por exemplo, a validade preditiva de um teste cognitivo para o desempenho no posto de trabalho é calculada pela correlação entre as pontuações do teste e, por exemplo, as classificações de desempenho do supervisor. Com um nível elevado de validade preditiva, é possível fazer predições baseadas nos resultados do teste.

Validade do Construto

A validade do construto refere-se à medida em que o instrumento mede aquilo que se propõe a medir. Esta medida analisa os resultados dos testes e como estes estão relacionados com os resultados de outros testes que são vistos como indicadores validados do construto, como as classificações externas, medições de comportamento ou resultados experimentais. A validação do construto não termina num coeficiente de validade, fornece um quadro geral de validade. Em teoria, um teste deve possuir uma correlação mais elevada com um teste que mede aproximadamente a mesma coisa do que com um teste que mede outra coisa.

Validade facial

Esta medida considera até que ponto o teste ou o seu conteúdo aparenta abranger o que está a ser medido e é percebido como tal pelos executores do teste e partes interessadas.

Validade Interna e Externa

Além das demais áreas de validade, pode-se identificar validade interna e externa. Um instrumento tem validade interna se os seus resultados puderem ser interpretados. A validade interna diminui à medida que as variáveis não controladas e interferentes aumentam. Além disso, um instrumento é externamente válido se os seus resultados puderem ser generalizados em diferentes situações. Isto significa que a validade externa depende fortemente da natureza genuína da situação de teste e da representatividade da amostra testada.
 

Icon Digital Interview Quick Set Up

Um teste de habilidade validado fornece uma medida para a habilidade geral de uma pessoa e, portanto, ajuda a prever o desempenho em situações em que a habilidade geral é importante.

4. Escalabilidade

Deve ser definida e estabelecida uma escala subjacente na qual as pessoas serão medidas. As pontuações de teste resultantes dos algoritmos de pontuação devem representar adequadamente as relações empíricas das características.

Nos testes de habilidade, isto requer que o candidato mais eficaz do teste receba uma pontuação de teste melhor do que o menos eficaz; isto significa que a relação de desempenho se reflete nas pontuações do teste. A praticabilidade deste critério depende do critério de medição.


 
Icon Digital Interview Quick Set Up

Um bom teste psicométrico fará o candidato mais eficaz alcançar uma pontuação melhor do que o candidato menos eficaz.

5. Custos de Implementação da Avaliação

Refere-se ao tempo e custos necessários para adquirir, licenciar ou aceder aos sistemas de avaliação online ou offline, materiais de teste e quaisquer outros custos de pontuação ou interpretação. Quanto menos tempo e custos necessários para a implementação, mais económico é um teste. Para justificar o uso de uma avaliação psicométrica, você pode procurar desenvolver um business case, pois, o valor das informações obtidas deve ser sempre maior do que os custos reais.

Relação Valor-Custo para Diferentes Ferramentas Psicométricas

Vimos que um instrumento perfeitamente validado forneceria um coeficiente de validade de 1,00. Assim como na confiabilidade, este valor é utópico e não atingível na realidade. No entanto, para avaliar com confiança o desempenho de um candidato, os bons instrumentos de diagnóstico devem ter um valor de pelo menos 0,3. A Figura 1 mostra a relação Valor-Custo de diferentes ferramentas psicométricas.

Os instrumentos psicométricos mais valiosos têm uma boa relação Valor-Custo e tendem a ser instrumentos que são vistos como de "baixo custo" e "elevada validade". os testes de habilidade e questionários de personalidade são frequentemente utilizados pois são simples de implementar com muitos candidatos e tendem a ter elevada validade. Os períodos experimentais e centros de avaliação também são altamente validados, mas normalmente são caros de implementar. Em alternativa, a grafologia é cara e ainda proporciona pouco benefício prático pois os valores de validade são próximos de zero.


 
Icon Digital Interview Quick Set Up

Os instrumentos psicométricos mais valiosos têm uma boa relação Valor-Custo e tendem a ser instrumentos que são vistos como de "baixo custo" e "elevada validade".

6. Normalização e Normas

Os instrumentos psicométricos só são benéficos e significativos se forem normalizados. O processo de aplicação de um instrumento a todos os que se encontram dentro de uma amostra definida em condições comparáveis é chamado de normalização (ajuste). Os dados recolhidos de uma amostra representativa daqueles que concluíram a avaliação nas mesmas condições padrão permite a definição de normas.

As normas são valores estatisticamente comparáveis que permitem comparar a pontuação específica do teste individual de uma pessoa com os resultados dos testes de outras pessoas de um grupo definido (norma). Isto ajuda a classificar e interpretar a pontuação individual.

O grupo definido em relação ao qual as pontuações individuais são comparadas deve partilhar os atributos importantes com os indivíduos testados (por exemplo, idade, nível de escolaridade ou função de trabalho). Os instrumentos psicométricos respeitados deverão ter muitos grupos de normas robustos disponíveis.

Processo de normalização

Os seguintes aspetos são importantes durante a normalização de uma ferramenta psicométrica:
  • Definição da amostra sobre a qual o teste é normalizado e ajustado. A amostra da norma deve ser representativa da população com a qual o teste será aplicado
  • Garantir a objetividade do teste durante a normalização. Em geral, os administradores de teste serão treinados para garantir que o processo de teste seja normalizado e repetível.
  • A idade das normas de teste é crítica para a correta interpretação dos valores normalizados ou percentuais. As normas recolhidas há mais de 10 anos devem ser consideradas desatualizadas.


Técnicas de Normalização

As técnicas de normalização referem-se geralmente à distância entre a pontuação do teste individual e a média da amostra da norma específica e expressam a diferença em unidades de desvio padrão da distribuição.

As normas baseadas em valores padrão, incluindo pontuações de QI, pontuações Z, pontuações T, pontuação centil, pontuação stanine e pontuações percentil, são amplamente aceites e usadas na avaliação psicométrica ocupacional.

Icon Digital Interview Quick Set Up

Os instrumentos psicométricos reputados têm muitos grupos de normas robustos disponíveis.

7. Utilidade do instrumento psicométrico

Ao escolher uma ferramenta psicométrica para seleção ou desenvolvimento, a ferramenta deverá ter utilidade e valor para esse processo.

Um teste é útil se a característica que ele mede possuir relevância prática e se for esperado que as decisões baseadas nele forneçam valor. O objetivo de qualquer instrumento de seleção é ajudar a selecionar os candidatos adequados e rejeitar as pessoas inadequadas. A proporção de candidatos adequados nomeados e a proporção de candidatos inadequados que são rejeitados devem ser idealmente elevadas.

A taxa de sucesso de um instrumento de diagnóstico descreve a relação entre os "candidatos adequados nomeados" (SA) e o total de "candidatos adequados e inadequados nomeados" (SA + UA).


Para avaliar a utilidade de uma ferramenta psicométrica, os seguintes fatores desempenham um papel importante:

  1. O efeito da validade
  2. O efeito da taxa de seleção
  3. O efeito da taxa base
  4. Custos de uma decisão errada


Efeito da Validade

Supondo que a taxa de seleção e a taxa base sejam constantes e estamos a comparar dois instrumentos com validades diferentes, o instrumento com maior validade terá a maior taxa de sucesso (ver Figura 4).
Quanto maior for a validade, mais estreito será o gráfico de dispersão e maior a proporção de candidatos adequados em relação a todos os candidatos nomeados.


Efeito da Taxa Base

Se a taxa de validade e a taxa de seleção forem mantidas constantes e a taxa base mudar, isso terá um impacto adicional na taxa de sucesso.

Se a taxa base aumentar (ou seja, se existirem mais candidatos adequados na população), a relação entre "candidatos adequados nomeados" e "todos os candidatos nomeados" melhora claramente. Isto é mostrado ao compararmos a Figura 4 com a Figura 6.

No entanto, uma elevada taxa base pode levantar a questão quanto à utilidade de um instrumento psicométrico já que a probabilidade de selecionar um candidato adequado é relativamente alta (mesmo com uma seleção aleatória).


Efeito da Taxa de Seleção

Se as taxas de validade e base forem constantes e a taxa de seleção mudar, a taxa de sucesso também muda. Se a taxa de seleção for minimizada, a taxa de sucesso também melhora (ver Figura 6). Ao usar avaliações, uma baixa taxa de seleção é frequentemente escolhida pois normalmente apenas uma pequena proporção dos candidatos será nomeada.

O benefício prático dos instrumentos de diagnóstico é particularmente alto se a validade for elevada e a taxa base for baixa (ou seja, os requisitos da função são elevados e o número de candidatos inadequados é baixo) e se, adicionalmente, a taxa de seleção for baixa

Custo de uma contratação errada

Se o custo de uma contratação errada for extremamente alto, a ferramenta psicométrica adequada usada para selecionar candidatos para este cargo deve ser usada em qualquer caso, pois os custos da utilização destes instrumentos são geralmente muito menores do que os custos de uma contratação errada. Se os custos de uma contratação errada forem baixos, a relação valor-custo de um instrumento de diagnóstico deve ser ponderada.


 

8+9. Aceitabilidade da ferramenta psicométrica e Impossibilidade de distorção das pontuações de teste

Aceitabilidade da Ferramenta Psicométrica

Um teste é considerado aceitável e razoável se não aplicar um stress desnecessário no participante no teste em relação ao seu bem-estar emocional e físico.

Impossibilidade de distorção das pontuações de teste

Quando um instrumento psicométrico é construído de uma forma que o participante do teste não pode controlar e não pode falsificar os valores concretos das pontuações de teste tentando simular um determinado comportamento; ou seja, o teste não pode ser falsificado.
A elevada validade facial pode tornar as pontuações de teste mais sujeitas a serem falsificadas ou influenciadas pois é mais fácil identificar o que a avaliação está a procurar medir. Neste caso, o candidato pode tentar influenciar os seus resultados de teste. Os questionários de personalidade são mais suscetíveis a essas distorções do que os testes de habilidade

Icon Digital Interview Quick Set Up

A forma como trata e respeita os seus candidatos durante o processo de avaliação afetará a sua marca de empregador.

10. Transparência e Equidade

Outro fator essencial que deve ajudar a determinar qual o instrumento de avaliação a utilizar é a forma como o candidato é tratado antes, durante e depois do teste.

Transparência

Um bom instrumento de diagnóstico deve fornecer um grau adequado de transparência. Antes do teste, devem ser fornecidas instruções compreensíveis explicando o teste e o respetivo processo de realização. Os aspetos práticos que explicam a finalidade do teste ou questionário também devem estar disponíveis. Além disso, no caso de realização offline, um administrador de teste treinado deve explicar todo o sistema.
 

Importância do Feedback

As melhores práticas determinam que os candidatos devem receber feedback adequado sobre os resultados de cada instrumento que completarem. O nível mínimo de feedback é um relatório curto de feedback por escrito. O melhor feedback é pessoal e fornecido por uma pessoa treinada em conjunto com um relatório de feedback detalhado.
 

Equidade

É vital que os resultados dos testes não sejam discriminatórios contra qualquer grupo baseado em razões étnicas, socioculturais, de género ou outras. As orientações de acessibilidade estabelecem que todos devem ter as mesmas oportunidades de completar ferramentas psicométricas e isso significa que os candidatos com deficiência devem ter a oportunidade de acordo com as suas habilidades, de realizar uma avaliação – mesmo que isso exija apoio adicional.

Todos os candidatos – independentemente de deficiências, sexo, estado civil, religião, raça, cor da pele e nacionalidade ou antecedentes de etnia/nacionalidade – devem ser tratados de forma igual e justa. Nos EUA, as exigências de tratamento igualitário vão a tal ponto que as empresas têm de cumprir cotas específicas na contratação de candidatos. Cada vez mais, os instrumentos diagnósticos têm de comprovar a alegação de que não discriminam nenhum grupo de pessoas.


 

Critérios adicionais

Avaliações psicométricas online e em dispositivos móveis

As ferramentas psicométricas administradas online – seja via computador, tablet ou smartphone – levantam desafios adicionais. Além dos critérios gerais descritos anteriormente, existem critérios específicos que precisam de ser tidos em conta com a avaliação online.

As orientações sobre o que faz uma boa ferramenta psicométrica online são fornecidas pela Comissão Internacional de Testes (ITC). Os seguintes critérios foram retirados das "Orientações Internacionais sobre testes baseados em computador e entregues pela Internet".

  • Tecnologia
  • Garantia de Qualidade
  • Controlo
  • Segurança

Tecnologia

Enfatiza a necessidade de consideração dos aspetos técnicos dos testes baseados em computador, Internet ou móvel, especialmente em relação ao hardware e software necessários para executar a avaliação.

Estão incluídos os seguintes aspetos:
  • Pensar na tecnologia (hardware: smartphone, tablet, dimensão do ecrã, processador, placa gráfica, monitor, etc. e software) para avaliação online ou baseada em computador, tanto para o fornecedor dos testes como nas instalações dos utilizadores dos testes.
  • Certificar-se de que a avaliação online é segura. Isto significa que o teste deve ser relativamente independente das conexões com a Internet e deve ser estável.
  • Certificar-se de que o teste é fácil de usar. Considerar os problemas relacionados com fatores humanos na apresentação de instruções e itens de teste via computador, tablet ou smartphone.
  • Fazer ajustamentos para os candidatos com deficiência. Considere ajustamentos razoáveis nas características técnicas da avaliação para os candidatos com deficiência (por exemplo, utilizando dispositivos de suporte).
  • Prestar ajuda, informações e exercícios de treino dentro do ambiente online.
  • Certificar-se de que a avaliação online é independente do hardware.
  • Verificar como os itens aparecem no ecrã independentemente do tamanho ou orientação do ecrã. Muitos instrumentos online foram otimizados para um determinado sistema de computador (com condições específicas: resolução e proporções do ecrã) e, quando vistos em outros computadores, aparecem desfocados ou com grão. Isto pode ser evitado por vectorização do material apresentado para que este se adapte de forma ideal às condições do ecrã e possa mitigar quaisquer efeitos devido ao hardware e à conexão de Internet utilizados.
  • Integrar perfeitamente com outros SIRH. Uma ferramenta de avaliação online precisa de estar pronta para que a sua integração perfeita seja possível nos sistemas de gestão, avaliação ou RH existentes (por exemplo: SAP, Peoplesoft, Oracle). Isto garante que todos os dados dos participantes permanecem dentro do sistema corporativo e, portanto, garante a segurança dos dados.

Garantia de Qualidade

Refere-se à garantia da qualidade dos materiais de avaliação e à garantia de elevados padrões de qualidade durante todo o processo de teste.
 
  • Garantir o conhecimento, competência e uso adequado dos testes online pelo fornecedor e utilizador.
  • Considerar as qualidades psicométricas da avaliação a utilizar.
  • Pontuar e analisar os resultados de avaliação online com precisão (por exemplo, com algoritmos de pontuação definidos).
  • Interpretar os resultados adequadamente. Fornecer feedback apropriado.
  • Considerar a igualdade de acesso para todos os grupos.

Controlo

Refere-se ao controlo da entrega dos testes, autenticação do candidato e participante no teste e ativação da prática prévia do teste.
 
  • Detalhar o nível de controlo sobre as condições de teste.
  • Detalhar, se necessário, o controlo adequado sobre o desempenho dos testes (administração aberta ou supervisionada).
  • Dar a devida consideração ao controlo da prática/tempo anterior do tutorial.
  • Considerar o controlo da exposição dos itens de teste.
  • Controlar a autenticidade do participante do teste.
  • Garantir a prevenção de fraude (cópia de respostas, ajuda).

Segurança

A segurança de uma avaliação online é crucial para proteger a integridade dos materiais de teste, a privacidade do participante e dos dados para garantir a confidencialidade.
 
  • Ter em conta a segurança da propriedade intelectual dos editores e autores
  • Garantir a segurança dos materiais de teste.
  • Garantir a segurança dos dados de cada participante no teste, transferidos pela Internet.
  • Manter a confidencialidade e a segurança dos resultados dos participantes do teste, por exemplo, permitindo o acesso apenas a indivíduos autorizados.

 

Conclusão

Em resumo, os instrumentos baseados na Internet devem ser autoexplicativos, à prova de falsificações, independentes de hardware, prontos a funcionar e acessíveis.

Autoexplicativos

Quando as ferramentas online são administradas abertamente sem a presença de supervisor, as instruções precisam de ser claras e autoexplicativas. Devem ser incluídos exemplos interativos com feedback e explicações.

À prova de falsificações

O teste tem de minimizar a oportunidade de que os itens sejam copiados ou partilhados com outros – fazendo com que os itens não sejam garantidos nem capazes de uma medição rigorosa. Na avaliação online, isto é garantido através da geração dinâmica do teste à medida que o teste é executado. Usando esta abordagem é quase impossível que o mesmo teste seja gerado duas vezes.

Acessíveis

Toda a avaliação psicométrica online deve ser acessível para candidatos com deficiência. Isto pode significar que é preciso que existam outros dispositivos de entrada além de um rato (por exemplo, ecrãs táteis, touchpads, teclados, assistência específica para pessoas com deficiência física) ou suporte à assistência de leitura através, por exemplo, de uma lupa.

Icon Digital Interview Quick Set Up

Devem ser incluídos exemplos interativos com feedback e explicações.

Procura a avaliação psicométrica correcta?
Esteja à vontade para nos contactar e saber mais sobre as Ferramentas Psicométricas da Aon.

References

  • Bartram, D. (2000). Internet Recruitment and Selection: Kissing Frogs to Find Princes. International Journal of Selection and Assessment, 8 (4), 261–274.
  • Bortz, J. (2005). Statistik für Human- und Sozialwissenschaftler (6. Aufl.). Heidelberg: Springer.
  • ITC (2005). International Guidelines on Computer-Based and Internet-Delivered Testing.
  • Kersting, M. (2006). DIN SCREEN – Leitfaden zur Kontrolle und Optimierung der Qualität von Verfahren und deren Einsatz bei beruflichen Eignungsbeurteilungen.
    Lengerich: Pabst Science Publisher.
  • Naglieri, J. A.; Drasgow, F.; Schmit, M.; Handler, L.; Prifitera, A.; Margolis, A.; Velasquez, R. (2004). Psychological Testing on the Internet: New Problems, Old Issues.
    American Psychologist, 59 (3), 150–162.
  • Zimbardo, P. G. (1995). Psychologie (6. Aufl.). Berlin, Heidelberg: Springer.