Les logiciels d'analyse statistique

Typologie des logiciels d'analyse statistiques

Il existe trois types de logiciel pour faire des statsistiques. 

  1. les tableurs
  2.  les interfaces graphiques
  3.  les logiciels de programmation

S'il fallait en choisir un... je choisirai les trois ! Dans ma pratique, je jongle sans vergogne entre les trois solutions, voire je fais un retour au calcul à la main lorsque c'est nécessaire et que je sais le faire.

Pourtant un choix rationnel devrait me conduire à choisir le langage de programmation, notamment R. il est en effet   gratuit, plus souple, plus rapide et accepte des jeux de données bien plus importants que ces concurrents. Mais il faut pour cela apprendre un langage de programmation, voire plusieurs, les fonctions développées par les utilisateurs permettant de réaliser les mêmes opérations de différentes manières avec des logiques souvent très différentes. Si on n'est pas expert en programmation (ce qui n'est pas une obligation pour tous les utilisateurs de statstiques), on a parfois plus vite fait de manipuler les données dans un tableur.

Le tableur a ce précieux avantage de donner des objets concrets à manipuler : des lignes, des colonnes, des cellules dans lesquels je vois des valeurs que je peux pointer pour les inclure dans un calcul. Tout cela existe aussi dans R, mais il faut agir sur les objets par des lignes de commande et donc  les penser plutôt que de les manipuler concrètement. Les données seraient donc plus faciles à manipuler ? Oui, si le tableau n'est pas trop grand et si les calculs à faire ne sont pas trop complexes. C'est sur ces deux critères me semble-t-il que la distinction entre les deux doit se faire. Il faut par ailleurs avoir une bonne maitrise de la procédure de calcul pour pourvoir l'utiliser. Pour s'en convaincre, essayez de faire une analyse de variance avec un tableur, voire pour les plus téméraires, une analyse factorielle.

Les interfaces graphiques sont-elles une voie permettant de tirer partie du meilleur des deux mondes ? Oui, à condition de rester dans des analyses standards. Si vous avez besoin d'explorer de façon atypique vos données, que ce soit avec le tableur ou R, il vous faudra construire des fonctions sur mesure. La comparaison sur des contrastes dans l'analyse de variance ou l'exploration graphique d'une ACP sont loin d'être triviales avec l'un ou l'autre de ces outils. Avec le langage R, elles se transforment en dialogue avec les données une fois qu'on commence à le comprendre .

Conclusion, si vous devez répondre à un besoin ponctuel et limité d'analyse, le tableur est idéal. Si vous devez réaliser des analyses complexes de façon standard, une interface graphique est le bon choix. S'il vous faut de l'analyse sur mesure, R s'impose !