Google et le traitement automatique des candidatures

Un journaliste de Courrier Cadres , Robin Carcan, m’a demandé de réagir sur le fameux article du New York Times présentant la nouvelles méthodes de traitement automatique des candidatures de Google.

L’entreprise qui recevrait chaque mois 100 000 candidatures a administré cet été à chacun de ses employés ayant au moins cinq mois d’ancienneté un questionnaire plutôt conséquent (300 questions) portant notamment sur des aspects « biographiques ». L’idée est de lier les données ainsi recueillies à des indicateurs de performances de manière à identifier d’éventuelles corrélations… et à construire sur cette base un algorithme de sélection automatique des candidats.

Comme l’échange avec le journaliste de Courrier Cadres s’est fait par mail, je reproduis ci-après ma (brève) contribution. Je n’ai malheureusement pas eu accès au questionnaire de Google, ni à l’algorithme (qui n’est sans doute pas promis au même succès que le PageRank !). N’hésitez pas à me contacter si vous avez des informations complémentaires.

Mise à jour : l’article est disponible sur le site de Courrier Cadres sous forme d’interview, voir aussi la brève rédigée par Robin Carcan sur le même site.

Avec Internet, candidater est devenu rapide et peu coûteux et les entreprises bénéficiant d’une image forte se trouvent submergées par le nombre de candidatures qu’elles reçoivent, de manière spontanée ou via annonce. Non seulement les volumes augmentent fortement, mais également la part de candidatures non pertinentes, c’est-à-dire en provenance de personnes ne correspondant pas au profil requis (ce que j’appelle le « bruit« ).

L’analyse de cette masse d’information hétérogène devient problématique, d’où la mise en place de dispositifs de présélection des candidatures. Parmi ces dispositifs, ceux fondés sur le recueil de données « biographiques » (biodata) tendent à se répandre dans les grandes entreprises. Mais, habituellement, c’est une méthode standardisée qui est utilisée pour évaluer les informations biographiques pertinentes au regard de l’emploi.

Google procède de manière différente : l’entreprise a mené une enquête auprès de ses employés, de manière à recueillir un large éventail de données biographiques qui ont été ensuite mises en relation avec une batterie d’indicateurs de performance desdits employés manière à déterminer statistiquement les variables biographiques pertinentes. En demandant aux candidats de renseigner ces mêmes variables et en appliquant aux données les coefficients obtenus à partir des estimations réalisées à partir des données internes, Google pense ainsi pouvoir prédire le niveau de performance potentiel des candidats.

Ce genre de solution peut a priori apparaître comme séduisante et correspond sans doute à la culture de Google. C’est une « boîte d’ingénieurs » qui a bâti son succès sur ses algorithmes de traitement automatique de l’information.

Des modèles estimés à partir des données recueillies auprès des collaborateurs de Google, on ne sait que très peu de choses. Mais, sur le principe, et sans même entrer dans le débat sur le traitement automatique des candidatures, la méthode me semble peu valide. Elle est en effet entâchée de nombreux biais.

  • En premier lieu, la population enquêtée en interne et celle des candidats sont de nature très différente. Cela paraît évident mais les employés de Google ont déjà fait l’objet d’une sélection puisqu’il ont été embauchés. Rien ne dit que leur niveau de performance n’est pas affecté par une variable inobservée, i.e. non prise en compte dans le questionnaire mais qui a été déterminante lors de leur embauche, par exemple leur motivation telle qu’elle est apparue lors de l’entretien. Un candidat présentant des caractéristiques biographiques similaires à un employé « performant » chez Google, mais ne présentant pas cette caractéristique inobservée, risque de se révéler décevant… C’est ce que l’on appelle en statistique un biais de sélection induit par l’hétérogénéité individuelle non observée. En clair, les populations n’étant pas strictement comparables, il n’est pas rigoureux de tirer des conclusions sur les candidats à partir des modèles estimés sur la base de données internes.
  • En second lieu, ce type de méthode est adapté aux emplois fortement standardisés. Si ce n’est pas le cas (et cela n’est l’est vraisemblablement pas chez Google…) il faut alors estimer un modèle par type d’emploi, avec tous les problèmes de représentativité que cela peut induire et les difficultés méthodologiques qui s’en suivent si l’entreprise n’a pas préalablement fait l’effort d’établir une cartographie précise de ses métiers.

Au-delà des questions de validité technique, les méthodes de ce type me posent deux problèmes.

  • D’une part, elles laissent à penser qu’il peut y avoir un recrutement parfaitement neutre et objectif, presque « scientifique ». C’est évidemment faux.
  • D’autre part, elles sont fondées sur le présupposé selon lequel il est bon de reproduire les profils dont on dispose déjà en interne. Or on considère plutôt habituellement que la diversité est source de créativité…

Il y a tout de même au moins un résultat intéressant dans l’étude que Google a mené auprès de ses employés : elle monterait que l’importance donnée jusque là par l’entreprise à l’excellence académique n’est pas systématiquement facteur de « performance ». Une utilisation intelligente de ces résultats pourrait être simplement de donner pour consigne aux recruteurs de ne pas sur-pondérer ce critère dans leurs décisions d’embauche. Mais cela laisserait bien sûr entier le problème du filtrage des candidatures, qui me semble être la motivation première de la mise en place de ce dispositif.

Publicités

4 commentaires »

  1. Google et le recrutement via son moteur

    Pour rsumer en quelques mots (je vous laisse lire l’analyse complte qui a t ralise par le Blog e-recrutement), Google a interview un ventail rprsentatif de leurs employs afin de collecter des informations biographiques leur sujet. Ces…

  2. […] le note très justement Yannick Fondeur, cette méthode aura au moins servi à prouver que les qualifications académiques ne sont pas […]

  3. Bonjour, Je suis Damien Crequer, associé du cabinet de recrutement Taste. Je pense que le traitement automatisé des candidatures n’est pas la solution pour trouver les meilleurs profils. Au contraire, ce processus relève du fantasme même si c’est tentant d’économiser le temps de la lecture et de la sélection des CV. Chez Taste, nous sommes persuadés que la recherche de compétences est une dimension stratégique qui ne peut pas être informatisée.

    Vous pouvez lire un article sur ce sujet ici : http://recrutement.typepad.com/blog/

  4. Depuis 2007 les pratiques de cabinet de recrutement ont peu évoluées. La technologie ne remplace pas encore, et heureusement, l’humain!

RSS feed for comments on this post · TrackBack URI

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :