Skip to content
Snippets Groups Projects
Commit cca57d33 authored by VAN-KOTE ELSA's avatar VAN-KOTE ELSA
Browse files

Merge branch 'stats' into 'master'

ajout des explications tsv-utils, libreoffice et gnuplot dans le README

See merge request !8
parents ce37ea53 04aec5e6
Branches
1 merge request!8ajout des explications tsv-utils, libreoffice et gnuplot dans le README
# quelques tips
# Quelques tips
Passer d'un ods à un csv : 'enregistrer sous' dans libreoffice et sélectionner CSV. Mettre comme paramètres :
......@@ -7,4 +7,76 @@ Passer d'un ods à un csv : 'enregistrer sous' dans libreoffice et sélectionner
affichage avec colonnes alignées : `head fichier.tsv | column -ts ' '`
## Statistiques avec tsv-utils
Pour télécharger tsv-utils : suivre les étapes données dans le README.md du [dépot Github](https://github.com/eBay/tsv-utils/tree/master), la partie "Prebuilt binaries".
`tsv-filter --str-eq 2:Généraliste stats.tsv` : cette commande permet de filtrer le fichier _stats.tsv_ en ne récupérant que les lignes comportant la chaîne de caractères "Généraliste" dans la deuxième colonne.
L'option --str-eq permet de chercher des chaines de caractères.
Si on veut obtenir le nombre de lignes en totalité, on ajoute `wc -l` après un pipe.
## Statistiques avec Libreoffice
`=IF(B2="Généraliste",1, "non")` : si la cellule B2 contient "Généraliste" alors on obtient 1, sinon la string "non".
## Quelques questions posées sur le fichier
- Nombre d'ONG qui interviennent en matière religieuse (où entrée 'religion' > 0)
_(on récupère la colonne 8 de notre fichier tsv
on fait un grep pour ne prendre que les lignes commençant par un chiffre entre 1 et 9, au moins une fois
puis on compte le nombre de lignes totales)_
`cut -f8 statistics.tsv | grep -E '^[1-9]+' | wc -l`
- Nombre d'ONG impliquées en représentation
`cut -f6 statistics.tsv | grep -E '^[1-9]+' | wc -l`
- Nombre d'ONG impliquées en TI (tierce intervention)
`cut -f7 statistics.tsv | grep -E '^[1-9]+' | wc -l`
- Nombre d'ONG impliquées en requête
`cut -f5 statistics.tsv | grep -E '^[1-9]+' | wc -l`
- Nombre d'ONG impliquées en GC (grande cours)
`cut -f10 statistics.tsv | grep -E '^[1-9]+' | wc -l`
- Nombre d'ONG qui ont un taux d'intervention en matière religieuse supérieur à 20%
```
cut -f8 statistics.tsv > rel
cut -f9 statistics.tsv > tot
paste -d'/' rel tot | tail -n+2 | bc -l 2>/dev/null | grep -E '(1.0+|\.[2-9][0-9]+)' | wc -l
#solution 2
paste -d'/' rel tot | tail -n+2 | sed 's/$/*100/' | bc -l 2>/dev/null | grep -oE '^(100...|19.[5-9].|[2-9][0-9]...)' | wc -l
rm rel tot
```
## Création d'un graphique avec gnuplot
Pour télécharger gnuplot : `sudo apt install gnuplot`
En utilisant le petit fichier de test rapide du dépôt appelé test.data, on peut faire une première sortie image avec les commandes suivantes :
```
#on lance gnuplot
gnuplot
#on instancie les variables souhaitées pour son graph :
#pour créer un bar graph
>set style data histogram
#on donne une largeur aux colonnes
>set boxwidth 0.5 relative
#on rempli les colonnes de couleur
>set style fill solid
#on donne une échelle à l'axe Y
>set yrange [1:300]
#une fois que tout est prêt, on peut lancer la commande de création du graph
>plot './test.data' u 2:xtic(1) with boxes title 'Nombre de categories', "" using 0:($2+10):2 with labels font "WingDings,12" notitle
```
#Catégorie Nombre
Requête 13
Représentation 14
Tierce-intervention 228
Religion 44
Grande-chambre 127
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment