Valid XHTML     Valid CSS2    

Expressions spécifiques de corpus

Analyse de la série de textes candide contre la série de textes bete

avec suppression des mots comme le la les the of pour

une expression correspond à deux mots séparés par #

1. Textes originaux de la série 1

cand_ch1.txt.no       cand_ch2.txt.no       

2. Textes originaux de la série 2

bete_ch1.txt.no       bete_ch2.txt.no       

3. Dénombrement des lignes et des mots

3.1 série 1

  1  :    211  ligne(s) dans cand_ch1.txt.no
  2  :    165  ligne(s) dans cand_ch2.txt.no

  analyse de  cand_ch1.txt.no
  677 mots en tout dont  669  mots distincts.
 chaque mot est donc répété      1.01 fois en moyenne.

  analyse de  cand_ch2.txt.no
  689 mots en tout dont  683  mots distincts.
 chaque mot est donc répété      1.01 fois en moyenne.

3.2 série 2

  1  :   1289  ligne(s) dans bete_ch1.txt.no
  2  :   1277  ligne(s) dans bete_ch2.txt.no

  analyse de  bete_ch1.txt.no
  9840 mots en tout dont  9461  mots distincts.
 chaque mot est donc répété      1.04 fois en moyenne.

  analyse de  bete_ch2.txt.no
  10094 mots en tout dont  9763  mots distincts.
 chaque mot est donc répété      1.03 fois en moyenne.

4. Expressions spécifiques de la série 1

soit 3 mots spécifiques

5. Expressions spécifiques de la série 2

soit 5 mots spécifiques

 

 

retour gH    Retour à la page principale de   (gH)