Les logiciels d'analyse statistique

Programmer avec R

Avec tout ça, est-il encore utile d'apprendre le langage d'analyse R ? Si vous avez déjà tout ce qu'il vous faut, à quoi bon ? Mais avez-vous vraiment tout ce qu'il vous faut ? Pour les étudiants qui ne se destinent pas à la recherche, la réponse est probablement oui. Pour les autres, collègues et thesards, je sens que par soucis d'économie cognitive la tentation est grande de répondre de même. Laissez-moi vous présenter brièvement trois arguments pour défendre l'idée que l'effort vaut d'être fait.

R est à l'analyse de données ce que la haute couture est à l'habillage. Il offre du sur-mesure. pour s'en convaincre, il suffit de regarder le graphique ci-dessous dont la reproduction ne nécessite que l'utilisation de neuf commandes (Wang,2017), même si celles-ci sont, pour certaines, un peu complexes. Comme c'est un langage de programmation, il est possible d'écrire vos propres fonctions ou programmes. Vous pouvez ainsi capitaliser votre expérience sur le logiciel, et donc progressivement vous faciliter la vie.

Un exemple de graphique avec R

Un exemple de graphique avec R. Source: The economist

L'autre credo des supporters de R est la transparence et la reproductibilité de la Science. Le code utilisé pour une analyse est en effet ouvert et facilement partageable. C'est du simple texte. Il est d'ailleurs enregistrable dans un fichier de script. L'analyse est donc reproductible puisqu'un simple copier-coller dans le logiciel permettra de l'exécuter à nouveau. Avec des logiciels d'édition comme rmarkdown, il est possible d'utiliser directment ce code afin de générer le rapport. Ce faisant, en rédigeant le compte-rendu d'analyse ou l'article, non seulement on communique les résultats, mais on communique aussi le programme d'analyse lui-même.

enfin R repose sur une importante et grandissante communauté qui a un sens aigu du partage. Si vous voulez faire quelque chose, soyez sûr que quelqu'un y a travaillé avant vous. Il en va ainsi de toutes les idées géniales. Cherchez un peu sur les blogs ou les forums et vous trouverez quelqu'un qui met à disposition le bout de code dont vous avez besoin. Pour vous en convaincre, visitez la section "Script" de l'excellent site ABCD'R ou consultez R-bloggers, notamment l’intéressant article de Josef qui nous explique trois bonnes raisons de ne pas programmer en R. Ce n'est qu'un exemple parmi d'autres. Vous verrez également sur ce site, qu'en plus du partage du code, la communauté est très prolifique en matière de ressources pédagogiques libres. Ce petit site en est un autre exemple.

Convaincu ? Encore hésitant ? Cela n'a pas d'importance. De toutes façons, le chemin vers la maîtrise de ces logiciels et des méthodes statistiques est long et nul n'a l'obligation d'aller jusqu'au bout s'il n'en a pas le besoin. L'important est donc d'avoir une connaissance de l'éventail de possibilités et d'en tirer le meilleur profit pour vous même.