Expressions spécifiques de corpus
Analyse de la série de textes candide contre la série de textes bete
avec suppression des mots comme le la les the of pour
une expression correspond à deux mots consécutifs
1. Textes originaux de la série 1
cand_ch1.txt.no cand_ch2.txt.no
2. Textes originaux de la série 2
bete_ch1.txt.no bete_ch2.txt.no
3. Dénombrement des lignes et des mots
3.1 série 1
1 : 211 ligne(s) dans cand_ch1.txt.no 2 : 165 ligne(s) dans cand_ch2.txt.no analyse de cand_ch1.txt.no 677 mots en tout dont 633 mots distincts. chaque mot est donc répété 1.07 fois en moyenne. analyse de cand_ch2.txt.no 689 mots en tout dont 647 mots distincts. chaque mot est donc répété 1.06 fois en moyenne.3.2 série 2
1 : 1289 ligne(s) dans bete_ch1.txt.no 2 : 1277 ligne(s) dans bete_ch2.txt.no analyse de bete_ch1.txt.no 9840 mots en tout dont 7817 mots distincts. chaque mot est donc répété 1.26 fois en moyenne. analyse de bete_ch2.txt.no 10094 mots en tout dont 8098 mots distincts. chaque mot est donc répété 1.25 fois en moyenne.4. Expressions spécifiques de la série 1
soit 12 mots spécifiques
5. Expressions spécifiques de la série 2
soit 943 mots spécifiques
Retour à la page principale de (gH)