Valid XHTML     Valid CSS2    

Expressions spécifiques de corpus

Analyse de la série de textes lea3art contre la série de textes shsp3

avec suppression des mots comme le la les the of pour

une expression correspond à trois mots consécutifs

1. Textes originaux de la série 1

LEA1_pone.0083056.txt.no       LEA2_610721.txt.no       LEA3_4559-73.txt.no       

2. Textes originaux de la série 2

SHSP1_1-s2.0-S0378111914000420-main.txt.no       SHSP2_art10.1007_Fs11033-013-2973-9.txt.no       SHSP3_dst050.txt.no       

3. Dénombrement des lignes et des mots

3.1 série 1

  1  :   1064  ligne(s) dans LEA1_pone.0083056.txt.no
  2  :   1614  ligne(s) dans LEA2_610721.txt.no
  3  :   1839  ligne(s) dans LEA3_4559-73.txt.no

  analyse de  LEA1_pone.0083056.txt.no
  7535 mots en tout dont  6090  mots distincts.
 chaque mot est donc répété      1.24 fois en moyenne.

  analyse de  LEA2_610721.txt.no
  10496 mots en tout dont  8426  mots distincts.
 chaque mot est donc répété      1.25 fois en moyenne.

  analyse de  LEA3_4559-73.txt.no
  10020 mots en tout dont  8222  mots distincts.
 chaque mot est donc répété      1.22 fois en moyenne.

3.2 série 2

  1  :    537  ligne(s) dans SHSP1_1-s2.0-S0378111914000420-main.txt.no
  2  :   1518  ligne(s) dans SHSP2_art10.1007_Fs11033-013-2973-9.txt.no
  3  :   1651  ligne(s) dans SHSP3_dst050.txt.no

  analyse de  SHSP1_1-s2.0-S0378111914000420-main.txt.no
  4856 mots en tout dont  4002  mots distincts.
 chaque mot est donc répété      1.21 fois en moyenne.

  analyse de  SHSP2_art10.1007_Fs11033-013-2973-9.txt.no
  5686 mots en tout dont  4525  mots distincts.
 chaque mot est donc répété      1.26 fois en moyenne.

  analyse de  SHSP3_dst050.txt.no
  7753 mots en tout dont  6601  mots distincts.
 chaque mot est donc répété      1.17 fois en moyenne.

4. Expressions spécifiques de la série 1

soit 118 mots spécifiques

5. Expressions spécifiques de la série 2

soit 45 mots spécifiques

 

 

retour gH    Retour à la page principale de   (gH)