Expressions spécifiques de corpus
Analyse de la série de textes candide contre la série de textes bete
sans suppression des mots comme le la les the of pour
une expression correspond à trois mots consécutifs
1. Textes originaux de la série 1
2. Textes originaux de la série 2
3. Dénombrement des lignes et des mots
3.1 série 1
1 : 211 ligne(s) dans cand_ch1.txt 2 : 165 ligne(s) dans cand_ch2.txt analyse de cand_ch1.txt 804 mots en tout dont 745 mots distincts. chaque mot est donc répété 1.08 fois en moyenne. analyse de cand_ch2.txt 792 mots en tout dont 751 mots distincts. chaque mot est donc répété 1.05 fois en moyenne.3.2 série 2
1 : 1289 ligne(s) dans bete_ch1.txt 2 : 1277 ligne(s) dans bete_ch2.txt analyse de bete_ch1.txt 11362 mots en tout dont 9227 mots distincts. chaque mot est donc répété 1.23 fois en moyenne. analyse de bete_ch2.txt 11651 mots en tout dont 9479 mots distincts. chaque mot est donc répété 1.23 fois en moyenne.4. Expressions spécifiques de la série 1
soit 10 mots spécifiques
5. Expressions spécifiques de la série 2
soit 1241 mots spécifiques
Retour à la page principale de (gH)