Valid XHTML     Valid CSS2    

Expressions spécifiques de corpus

Analyse de la série de textes candide contre la série de textes bete

sans suppression des mots comme le la les the of pour

une expression correspond à trois mots consécutifs

1. Textes originaux de la série 1

cand_ch1.txt       cand_ch2.txt       

2. Textes originaux de la série 2

bete_ch1.txt       bete_ch2.txt       

3. Dénombrement des lignes et des mots

3.1 série 1

  1  :    211  ligne(s) dans cand_ch1.txt
  2  :    165  ligne(s) dans cand_ch2.txt

  analyse de  cand_ch1.txt
  804 mots en tout dont  745  mots distincts.
 chaque mot est donc répété      1.08 fois en moyenne.

  analyse de  cand_ch2.txt
  792 mots en tout dont  751  mots distincts.
 chaque mot est donc répété      1.05 fois en moyenne.

3.2 série 2

  1  :   1289  ligne(s) dans bete_ch1.txt
  2  :   1277  ligne(s) dans bete_ch2.txt

  analyse de  bete_ch1.txt
  11362 mots en tout dont  9227  mots distincts.
 chaque mot est donc répété      1.23 fois en moyenne.

  analyse de  bete_ch2.txt
  11651 mots en tout dont  9479  mots distincts.
 chaque mot est donc répété      1.23 fois en moyenne.

4. Expressions spécifiques de la série 1

soit 10 mots spécifiques

5. Expressions spécifiques de la série 2

soit 1241 mots spécifiques

 

 

retour gH    Retour à la page principale de   (gH)