Skip to content
Snippets Groups Projects
Commit 5477646c authored by VAN-KOTE ELSA's avatar VAN-KOTE ELSA
Browse files

reorga dépot

parents
Branches
1 merge request!9reorga dépot
# Quelques tips
Passer d'un ods à un csv : 'enregistrer sous' dans libreoffice et sélectionner CSV. Mettre comme paramètres :
- field delimiter ,
- string delimiter "
affichage avec colonnes alignées : `head fichier.tsv | column -ts ' '`
## Statistiques avec tsv-utils
Pour télécharger tsv-utils : suivre les étapes données dans le README.md du [dépot Github](https://github.com/eBay/tsv-utils/tree/master), la partie "Prebuilt binaries".
`tsv-filter --str-eq 2:Généraliste stats.tsv` : cette commande permet de filtrer le fichier _stats.tsv_ en ne récupérant que les lignes comportant la chaîne de caractères "Généraliste" dans la deuxième colonne.
L'option --str-eq permet de chercher des chaines de caractères.
Si on veut obtenir le nombre de lignes en totalité, on ajoute `wc -l` après un pipe.
## Statistiques avec Libreoffice
`=IF(B2="Généraliste",1, "non")` : si la cellule B2 contient "Généraliste" alors on obtient 1, sinon la string "non".
## Quelques questions posées sur le fichier
- Nombre d'ONG qui interviennent en matière religieuse (où entrée 'religion' > 0)
_(on récupère la colonne 8 de notre fichier tsv
on fait un grep pour ne prendre que les lignes commençant par un chiffre entre 1 et 9, au moins une fois
puis on compte le nombre de lignes totales)_
`cut -f8 statistics.tsv | grep -E '^[1-9]+' | wc -l`
- Nombre d'ONG impliquées en représentation
`cut -f6 statistics.tsv | grep -E '^[1-9]+' | wc -l`
- Nombre d'ONG impliquées en TI (tierce intervention)
`cut -f7 statistics.tsv | grep -E '^[1-9]+' | wc -l`
- Nombre d'ONG impliquées en requête
`cut -f5 statistics.tsv | grep -E '^[1-9]+' | wc -l`
- Nombre d'ONG impliquées en GC (grande cours)
`cut -f10 statistics.tsv | grep -E '^[1-9]+' | wc -l`
- Nombre d'ONG qui ont un taux d'intervention en matière religieuse supérieur à 20%
```
cut -f8 statistics.tsv > rel
cut -f9 statistics.tsv > tot
paste -d'/' rel tot | tail -n+2 | bc -l 2>/dev/null | grep -E '(1.0+|\.[2-9][0-9]+)' | wc -l
#solution 2
paste -d'/' rel tot | tail -n+2 | sed 's/$/*100/' | bc -l 2>/dev/null | grep -oE '^(100...|19.[5-9].|[2-9][0-9]...)' | wc -l
rm rel tot
```
## Création d'un graphique avec gnuplot
Pour télécharger gnuplot : `sudo apt install gnuplot`
En utilisant le petit fichier de test rapide du dépôt appelé test.data, on peut faire une première sortie image avec les commandes suivantes :
```
#on lance gnuplot
gnuplot
#on instancie les variables souhaitées pour son graph :
#pour créer un bar graph
>set style data histogram
#on donne une largeur aux colonnes
>set boxwidth 0.5 relative
#on rempli les colonnes de couleur
>set style fill solid
#on donne une échelle à l'axe Y
>set yrange [1:300]
#une fois que tout est prêt, on peut lancer la commande de création du graph
>plot './test.data' u 2:xtic(1) with boxes title 'Nombre de categories', "" using 0:($2+10):2 with labels font "WingDings,12" notitle
```
#! /bin/sh
# script pour calculer des pourcentages
NOMBRE=$1
TOTAL=$2
echo $(($1*100/$2))'%'
#! /bin/sh
TSV=$1
COLUMN=$2
cut -f$COLUMN $TSV | grep -E '^[1-9]+' | wc -l
#Questions à poser :
E+F+G = I
J+K = I
Nombre d'ONG qui interviennent en matière religieuse (où entrée "religion" > 0)
Nombre d'ONG impliquées en représentation
Nombre d'ONG impliquées en TI (tierce intervention)
Nomnbre d'ONG impliquées en requête
Nombre d'ONG impliquées en GC (grande cours)
Nombre d'ONG qui ont un taux d'intervention en matière religieuse supérieur à 20%
Nombre d'ONG qui interviennent exclusivement en TI
Nombre d'ONG qui interviennent exclusivement en rp
Pourcentage d'ONG qui interviennent qu'une seule fois
Nombre de TI total ( avec marge de 31 "jointes")
Nombre d'ONG qui interviennent en GC + TI
Nombre d'ONG qui interviennent en GC + rp
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment