Expressions spécifiques de corpus
Analyse de la série de textes lea3art contre la série de textes shsp3
sans suppression des mots comme le la les the of pour
une expression correspond à trois mots consécutifs
1. Textes originaux de la série 1
LEA1_pone.0083056.txt LEA2_610721.txt LEA3_4559-73.txt
2. Textes originaux de la série 2
SHSP1_1-s2.0-S0378111914000420-main.txt SHSP2_art10.1007_Fs11033-013-2973-9.txt SHSP3_dst050.txt
3. Dénombrement des lignes et des mots
3.1 série 1
1 : 1064 ligne(s) dans LEA1_pone.0083056.txt 2 : 1614 ligne(s) dans LEA2_610721.txt 3 : 1839 ligne(s) dans LEA3_4559-73.txt analyse de LEA1_pone.0083056.txt 8191 mots en tout dont 6325 mots distincts. chaque mot est donc répété 1.30 fois en moyenne. analyse de LEA2_610721.txt 11146 mots en tout dont 8690 mots distincts. chaque mot est donc répété 1.28 fois en moyenne. analyse de LEA3_4559-73.txt 10895 mots en tout dont 8479 mots distincts. chaque mot est donc répété 1.28 fois en moyenne.3.2 série 2
1 : 537 ligne(s) dans SHSP1_1-s2.0-S0378111914000420-main.txt 2 : 1518 ligne(s) dans SHSP2_art10.1007_Fs11033-013-2973-9.txt 3 : 1651 ligne(s) dans SHSP3_dst050.txt analyse de SHSP1_1-s2.0-S0378111914000420-main.txt 5279 mots en tout dont 4157 mots distincts. chaque mot est donc répété 1.27 fois en moyenne. analyse de SHSP2_art10.1007_Fs11033-013-2973-9.txt 6060 mots en tout dont 4701 mots distincts. chaque mot est donc répété 1.29 fois en moyenne. analyse de SHSP3_dst050.txt 8456 mots en tout dont 6833 mots distincts. chaque mot est donc répété 1.24 fois en moyenne.4. Expressions spécifiques de la série 1
soit 167 mots spécifiques
5. Expressions spécifiques de la série 2
soit 78 mots spécifiques
Retour à la page principale de (gH)