Bienvenue sur PhraseoBase



Accéder aux corpus PhraseoRom DE EN FR
Accéder à PhraseoLing Ressources téléchargeables

PhraseoBase est une base de données qui regroupe deux applications. Une première application donne accès, grâce au lexicoscope, au corpus de romans contemporains constitué dans le cadre du projet ANR-DFG PhraseoRom (https://phraseorom.univ-grenoble-alpes.fr/accueil). La seconde application donne accès à un ensemble d’analyses linguistiques et stylistiques menées sur les données extraites de ce corpus.



Que trouverez-vous dans PhraseoBase ?



Un accès au corpus constitué dans le cadre du projet ANR-DFG PhraseoRom. Il s’agit d’un corpus de romans contemporains français, anglais et allemands classés en six sous-genres : des romans policiers, sentimentaux, historiques, de science-fiction, de fantasy et des romans de littérature générale. Ces corpus ont été enrichis linguistiquement : il sont lemmatisés, étiquetés morpho-syntaxiquement et syntaxiquement. L’interface du lexicoscope en permet une interrogation directe.

Un accès via une interface ergonomique aux Arbres Lexico-syntaxiques Récurrents (ALR) spécifiques aux sous-genres romanesques contemporains et aux analyses linguistiques qui leurs sont associées : données statistiques, lexicales, syntaxiques et codages sémantiques. Une seconde interface permet d’accéder aux motifs stylistiques spécifiques aux romans contemporains et à leur analyse discursive.

Un ensemble de ressources à télécharger : tableurs contenant les ALR et leur données linguistiques et stylistiques associées, guides détaillant les analyses sémantique et stylistiques proposées, liste des étiquettes morpho-syntaxiques associées aux tokens des corpus, etc.

Pour les chercheurs

Dans le domaine de la linguistique comme de la stylistique, les chercheurs trouveront ici un accès à des corpus de grande taille composés de textes rigoureusement sélectionnés et enrichis linguistiquement, ainsi qu’à des données linguistiques et stylistiques riches, documentées et immédiatement exploitables.

Pour les enseignants

Les données analysées proposées permettent d’élaborer des parcours didactiques pour l’accès aux textes romanesques. Le classement sémantique des ALR permet par exemple un accès onomasiologique aux données textuelles. De plus, dans le volet stylistique les exemples ont été sélectionnés un à un pour illustrer précisément les fonctions stylistiques des motifs textuels.

Pour les étudiants

Les étudiants trouveront dans la PhraseoBase à la fois des corpus, une interface d’interrogation et un ensemble de données issues de ces corpus avec plusieurs niveaux d’analyse qui leur fourniront une base idéale pour se lancer dans l’analyse du corpus.


Accéder aux corpus PhraseoRom DE EN FR
Accéder à PhraseoLing Ressources téléchargeables

Référence à citer

Sascha Diwersy, Laetitia Gonon, Vannina Goossens, Olivier Kraif, Iva Novakova, Julie Sorba & Ilaria Vidotto (2021). La phraséologie du roman contemporain dans les corpus et les applications de la PhraseoBase. Corpus [En ligne], 22 | 2021, URL : http://journals.openedition.org/corpus/6101 ; DOI : https://doi.org/10.4000/corpus.6101