Valid XHTML     Valid CSS2    

Expressions spécifiques de corpus

Analyse de la série de textes lea3art contre la série de textes shsp3

avec suppression des mots comme le la les the of pour

une expression correspond à un seul mot

1. Textes originaux de la série 1

LEA1_pone.0083056.txt.no       LEA2_610721.txt.no       LEA3_4559-73.txt.no       

2. Textes originaux de la série 2

SHSP1_1-s2.0-S0378111914000420-main.txt.no       SHSP2_art10.1007_Fs11033-013-2973-9.txt.no       SHSP3_dst050.txt.no       

3. Dénombrement des lignes et des mots

3.1 série 1

  1  :   1064  ligne(s) dans LEA1_pone.0083056.txt.no
  2  :   1614  ligne(s) dans LEA2_610721.txt.no
  3  :   1839  ligne(s) dans LEA3_4559-73.txt.no

  analyse de  LEA1_pone.0083056.txt.no
  7535 mots en tout dont  2251  mots distincts.
 chaque mot est donc répété      3.35 fois en moyenne.

  analyse de  LEA2_610721.txt.no
  10496 mots en tout dont  2814  mots distincts.
 chaque mot est donc répété      3.73 fois en moyenne.

  analyse de  LEA3_4559-73.txt.no
  10020 mots en tout dont  2644  mots distincts.
 chaque mot est donc répété      3.79 fois en moyenne.

3.2 série 2

  1  :    537  ligne(s) dans SHSP1_1-s2.0-S0378111914000420-main.txt.no
  2  :   1518  ligne(s) dans SHSP2_art10.1007_Fs11033-013-2973-9.txt.no
  3  :   1651  ligne(s) dans SHSP3_dst050.txt.no

  analyse de  SHSP1_1-s2.0-S0378111914000420-main.txt.no
  4856 mots en tout dont  1567  mots distincts.
 chaque mot est donc répété      3.10 fois en moyenne.

  analyse de  SHSP2_art10.1007_Fs11033-013-2973-9.txt.no
  5686 mots en tout dont  1558  mots distincts.
 chaque mot est donc répété      3.65 fois en moyenne.

  analyse de  SHSP3_dst050.txt.no
  7753 mots en tout dont  2144  mots distincts.
 chaque mot est donc répété      3.62 fois en moyenne.

4. Expressions spécifiques de la série 1

soit 300 mots spécifiques

5. Expressions spécifiques de la série 2

soit 134 mots spécifiques

 

 

retour gH    Retour à la page principale de   (gH)