
NLP pour
- N atural
- L anguage
- P rocessing
soit
- T raitement du
- L angage
- N aturel
Il existe plusieurs familles d’apprentissages utilisées pour les librairies de NLP qui ont évolué avec le temps.
J'utilise la librairie NLP appelés Spacy, qui est assez récente mais plus rapide. Voici ce dont est capable Spacy:
Etape 0: initialisation
import spacy nlp = spacy.load("en_core_web_sm")
Etape 1: Récupérer le fichier et le rendre compréhensible:
Pour le language de programmation.
def get_text_from_file(files): with open(files, 'r') as myfile: text = myfile.read() return text
Pour la librairie de NLP
doc = nlp(text)
def get_text(doc): verbes = [] for token in doc: if token.pos_ == "VERB" verbes.append(token.lemma_) return verbes
Il ne reste plus qu'a éxécuter les fonctions a la chaine.
def main(files): texte = get_text_from_file("Téléchargement/alice.txt") doc = nlp(texte) verbes = get_text(doc) print(verbes)