Mathématiques Finances Economie : Logiciels statistiques
Cours 6
R et les autres logiciels statistiques
1. Les logiciels statistiques en général
Il existe de nombreux logiciels dits «de statistiques» plus ou moins spécialisés. Pour s'en convaincre, on pourra consulter la liste du wiki anglais, une liste française de logiciels gratuits et son équivalent allemand et enfin, si vous n'avez pas peur de vous noyer, la très longue liste de J. C. Pezzullo. C'est suffisamment compliqué pour que le wiki français et le wiki anglais proposent des pages pour comparer ces logiciels.
Si l'on simplifie beaucoup, il y a les logiciels qui se surajoutent à Excel, les grands logiciels généraux payants comme Spss, Statistica et Sas, les grands logiciels généraux gratuits comme R et enfin les logiciels spécialisés comme gretl dont nous avons parlé au cours 5.
Il n'y a pas de meilleur logiciel de statistiques en soi, pas plus qu'il n'y a de meilleure voiture dans l'absolu. Il y a tout au plus des logiciels beaucoup plus complets que d'autres, beaucoup plus robustes en routine (il suffit de penser aux volumes traités par les très grandes compagnies ou entreprises internationales), plus faciles à utiliser, multilingues, avec une aide détaillée etc. Avant de comparer ces logiciels, il convient donc de définir les critères de comparaison.
2. Surtout pas Excel tout seul
Si le logiciel Excel dispose de fonctions statistiques (voir par exemple la question 1 de mon cours 1 pour EDA et sa réponse), ce n'est en aucun cas un logiciel statistique car il lui manque de nombreuses fonctions et graphiques élémentaires (comme la comparaison de moyennes, les box-plots...) et surtout, Excel peut se tromper dans certains calculs. Voir par exemple les 3 liens de ma page générale de statistiques sur la question.
Excel permet cependant de faire des calculs probabilistes et statistiques, des graphiques, de re-programmer les tests statistiques usuels. On trouvera un petit pot-pourri de calculs sous Excel dans le fichier demogh.zip.
Par contre, comme Excel est souvent utilisé pour saisir des données, faire des calculs simples comme des comptages, et comme Excel se programme facilement, il existe quelques logiciels (souvent payants) dits add-on ou add-in qui se rajoutent à Excel sous forme d'un menu complémentaire. Par exemple en français, il y a Statbox et Xlstat.
Le grand intérêt de ces logiciels est que leur apprentissage se fait rapidement et que les résultats sont produits directement dans Excel, en français et avec les «bons» termes. Voir par exemple des exemple de feuilles de résultats de Statbox dans l'archive statbox_xls.zip. De plus, comme ils sont payants, ils fournissent des manuels, une aide téléphonique...
Par contre, l'inconvénient est qu'il n'implémentent que les grands calculs, qu'ils sont parfois un peu lents et limités quand on aborde les grandes tailles (des milliers de lignes ou de colonnes...).
3. Les autres grands logiciels
On trouvera sur la page demo.php une présentation des manipulations pour réaliser les mêmes calculs et graphiques statistiques sous Excel, Statbox, Xlstat et Spss, Statistica, Sas. En complément, de nombreuses questions sur les fonctionnalités respectives de ces logiciels sont présentées sous forme de questions et réponses de mon cours 5 pour EDA.
Pour faire court, Statistica 10 et Sas 9.2 sont sans doute les plus complets, les plus efficaces, bien que R soit devenu le logiciel montant car Spss, Statistica et Sas proposent aujourd'hui des interfaces pour exécuter R à l'intérieur de leur propre logiciel. Excel le propose aussi, via RExcel et Outils.Stat.
Dès 2009, le New York Times avait même indiqué que le logiciel R était en train de devenir la lingua franca de tous les analystes (sous-entendu financiers) de données...
Retour à la page principale de (gH)