Projets

Quelques-uns de mes projets: Beaucoup concernent le Traitement Automatique des Langues (TAL), l'informatique et la linguistique, d'autres traitent de grec ancien, d'électronique, de photographie ou encore de cinéma. Certains sont récents, d'autres le sont moins. Cliquez sur le bouton “En savoir plus” pour afficher la page dédiée au projet.

Outil d'annotation de la coréférence (SACR)

Pour annoter des mentions et des relations de coréférence avec un simple glisser-déposé (drag-and-drop). Annotation de propriéteś pur chaque mention: partie du discours (noun, pronom, etc.), genre, nombre, fonction, etc.

en savoir plus github l'utiliser !

Base de données et corpus de coréférence pour l'anglais et le français (corefdb)

Pour étudier les phénomènes de coréférence avec une base de données relationnelle contenant des tables pour coréférence (mentions, chaînes, relaations) et pour les structures textuelles (tokens, phrases, paragraphes, textes). Avec des annotations linguistiques (parties du discours, entités nommées, etc.).

Version enrichie d'annotation linguistiques du corpus Democrat pour le français.

en savoir plus github

Système neuronal de résolution automatique de la coréférence pour le français (cofr)

Pour détecter automatiquement les mentions (y compris des singletons) et les relations de coréférence dans un texte. Le système est une adaptation pour le français d'un système originellement conçu pour l'anglais.

en savoir plus github

Outil d'analyse de la coréférence (CRViewer)

Pour calculer des statistiques de chaînes de coréférence, avec diagrammes circulaires et diagrammes à barres.

en savoir plus gitlab

Fiches de linguistique et de grammaire grecque (grec ancien)

Pour apprendre le grec ancien avec 150 fiches de linguistique et de grammaire (419 pages): morphologie (déclinaison, conjugaison), phonétique, syntaxe, usage des temps et modes...

en savoir plus

Les chaînes de coréférence dans les articles scientifiques (mémoire de master)

Une étude en linguistique de corpus des chaînes de coréférence dans les articles de recherche de format IMRaD: discussion des notions d'expression référentielle et de coréférence, constitution du corpus (webscrapping), conception d'un guide d'annotation, annotation des textes, analyse des annotations.

C'est l'un de mes deux mémoires de master (en “Sciences du Langage”).

en savoir plus

Représentation visuelle des chaînes de coréférence

Différentes façons de visualiser les relations de coréférence entre les expressions linguistiques d'un texte.

en savoir plus

Visualisation sous forme d'arbres de la sortie d'analyseurs syntaxiques (dependency2tree)

Pour représenter les sorties CoNLL d'analyseurs syntaxiques tels que StanfordNLP (pour l'anglais) ou Talismane (pour le français) sous forme d'arbres compilés avec Latex ou Graphviz.

en savoir plus github

Application interactive de géométrie dans l'espace

Pour dessiner des figures géométriques dans l'espace: solides, droites, vecteurs, plans, fonctions...

en savoir plus github

Regular Expression For Classe Instances (refci)

Pour chercher des patterns dans une liste d'objets, comme des tokens. Par exemple:

[pos="determiner"][pos="noun" lemma="cat"]

pour trouver un déterminant suivi d'un nom avec le lemme cat. Ce module fonctionne pour des objets de toutes disciplines, par seulement en linguistique!

en savoir plus github

Système de résolution automatique de la coréférence à base de règles linguistiques (mémoire de master)

Pour détecter automatiquement la coréférence avec un système qui utilise des règles linguistiques définies manuellement. J'ai aussi développé un dictionnaire d'entités nommmées et de nom propres contenant des informations utile pour la résolution de la coréférence, et un dictionnaire d'hyperonymes.

C'est l'un de mes deux mémoires de master (en “Linguistique, Informatique, Traduction”).

en savoir plus

Création de cartes topographiques des données USGS/NASA

Pour faire des cartes topographiques en couleurs à partir des données brutes de la NASA et d l'USGS.

en savoir plus github

Police de caractère pour le grec ancien

Une police pour le grec ancien qui ressemble à celle du célèbre éditeur “Les Belles Lettres”, créée avec FontForge.

en savoir plus

Création de frises chronologiques (timeline) (mktimeline)

Pour créer des frises chronologiques à partir d'une liste de dates et d'événements.

en savoir plus github

Intégration d'annotation déportées (standoff to inline annotations) (standoff2inline)

Pour intégrer des annotations “déportées” (= standoff, c'est-à-dire indexées par la position d'un caractère ou d'un token) dans un texte (= inline, comme avec XML). Par exemple, dans la phrase: Le chat a bu du lait., les 3e et 4e mots représentent un verbe (dire “3e et 4e”, c'est ça l'annotation déportée), de sorte que l'annotation intégrée serait:

Le chat <verb>a but</verb> du lait.

en savoir plus github

Bibtex and Biblatex Entry Generator

Pour avoir une entrée bibtex bien formatté à partir de champs à remplir. Permet d'éditer facilement les entrées de Google Scholar.

en savoir plus github l'utiliser !

Screencast avec Linux

Pour enregistrer l'écran et sa voix avev Linux. Utile pour faire des tutoriels ou des cours en ligne sous Linux.

en savoir plus github

Labo photo

Mon labo photo, où j'ai développé et tiré mes photographies argentiques.

en savoir plus

Mon projecteur cinéma: une salle de cinéma chez moi

Mon projecteur 35mm.

en savoir plus

Quelques images de synthèse

Quelques images de synthèse faites avec Blender il y a quelques temps.

en savoir plus

Programme d'apprentissage des couleurs des résistances électroniques

Pour apprendre à lire facilement les valeurs nominales et les tolérances des résistances électroniques à partir de leurs bagues de couleur.

en savoir plus github

Alimentation de laboratoire électronique

Comment j'ai réalisé une alimentation de laboratoire (2x 1.2V à 20V, 333mA).

en savoir plus

Création de listes de vocabulaire

Pour créer de façon semi-automatique des listes de vocabulaire à partir de textes bruts dans le cadre de l'apprentissage d'une langue étrangère.

en savoir plus github

Script de creation de cartes mémoire (flashcards) papier

Pour préparer des cartes mémoire (flashcards) prêtes à imprimer avec LaTeX.

en savoir plus github

Scripts de conversion pour formats d'annotation de la coréférence (corefconversion)

Pour convertir entre différents formats utilisé pour l'annotation de la coréférence, comme .jsonlines, .conll, texte...

en savoir plus github

Représentation visuelles de modèle d'élévation de l'USGS et de la NASA (hgt2pnm)

Pour voir en image les modèle d'élévation bruts de l'USGS et de la NASA.

en savoir plus github

Nombre hexadécimaux et patterns binaires (hexagame)

Pour apprendre les nombres hexadécimaux et leur patterns binaires correspondants. Un projet d'école en assembleur.

en savoir plus github

Afficher un cadre de couleur de l'écran (drawframe)

Pour afficher un cadre de couleur qui reste sur toutes les autres fenêtre, sous Linux. Utile pour enregistrer des screencasts.

en savoir plus github

Convertion de .jsonlines en TEI-URS (jsonlines2tei)

Pour importer des documents .jsonlines dans le logiciel d'annotation et d'analyse de données textuelles TXM.

en savoir plus github

Alarme “pomodoro” en ligne de commande

Pour chronométrer des sessions de 25 minutes (ou autres) avec un simple script Python qui inverse les couleurs de l'écran à la fin de la session de travail.

en savoir plus github