webleads-tracker

DATA SCIENTIST – EXPERT NLP H/F - Fortia

DATA SCIENTIST – EXPERT NLP H/F

CDI

Fortia Financial Solutions est une RegTech labélisée OSEO, créée en 2012 et basée à Paris.

Les RegTech proposent aux acteurs financiers des solutions technologiques destinées à gérer leurs activités « Compliance » ou conformité, c’est-à-dire le respect des dispositions législatives et réglementaires ainsi que des normes internes et statutaires.

Fortia Financial Solutions développe la plate-forme logicielle INNOVA, solution innovante reposant sur le Machine-Learning et l’Intelligence Artificielle, dédiée aux métiers de la Finance. Elle permet l’automatisation des processus et des contrôles de conformité.

DATA AVANGARDE, solution de Master Data Management alimentée par l’IA, visant à automatiser et à sécuriser l’ensemble de la chaîne de production des données et de gestion des référentiels, vient compléter cette offre de détection de règles et de calculs de ratios.

Rejoindre Fortia Financial Solutions, c’est rejoindre une équipe dynamique et passionnée.

DESCRIPTION DU POSTE

Sous la supervision du Chief Research Scientist, vous rejoindrez une équipe R&D dédiée à l’analyse sémantique de texte dans le contexte spécifique de la finance. Vous travaillerez sur l’analyse des sentiments, la reconnaissance d’entités nommées et l’extraction d’informations en général.

Vous serez amené à travailler sur des problèmes d’analyse syntaxique de dépendance, de marquage de POS et d’analyse syntactique en utilisant des méthodes de Deep Learning (CNN, LSTM, bi-lstm, Word embeddings comme word2vec ou GLOVE) ou de méthodes plus classiques d’apprentissage automatique (svm, KNN etc.).

Vous apporterez votre expertise concernant différentes problématiques:

  • Définition d’un protocole pour le nettoyage et la validation des étiquettes
  • Définition de l’architecture de la solution : coordination des tâches afin de réduire la consommation temps/ressource
  • Définition d’une procédure afin de gagner en performance
  • Modélisation, implémentation et testing des algorithmes
  • Participation à la rédaction de brevets et de spécifications techniques

Notre objectif est de mettre en place, des techniques d’avant-garde dans le TAL pour l’application spécifique d’analyse de textes financiers. Pour ce faire, nous sommes en relation étroite avec des universités bien connues à Paris et au Royaume-Uni. Nous participons fréquemment aux conférences appropriées dans le domaine et participons aux défis universitaires.

PROFIL RECHERCHE

  • Expérience significative dans le domaine du Deep Learning et du TAL (Doctorat/PhD dans le domaine du TAL Traitement Automatique du Langage / NLP Natural Language Processing ou plus de 5 ans d’expérience sur des projets dans ce domaine)
  • Au moins 2 ans d’expérience (travaux d’études compris) sur le framework PYTHON en lien avec des problématiques de NLP (analyse des sentiments, reconnaissance d’entités nommées et extraction d’informations en général)
  • Veille active concernant les dernières avancées en matière de Machine Learning
  • Participation à des conférences techniques dans ce domaine
  • Vous êtes autonome, collaboratif(ve), motivé(e)

Vous maîtrisez les sujets suivants :

  • TAL: fixations de mots, reconnaissance d’entité nommée (NER)
  • Apprentissage automatique : LSTM, CNN, KNN
  • Gestion de projet par grappes
  • Programmation Python (SKLEARN, KERAS)
  • Liste de publication dans le domaine NLP (idéalement en « Information Extraction »)

AVANTAGE

  • Vous serez amené à participer à 2 « top tier conferences » par an tels que ACL, EMNLP, ICML ou NIPS

NOUS VOUS PROPOSONS

  • Une dimension internationale de votre travail
  • Une plate-forme répondant à des exigences techniques très avancées
  • Un travail orienté vers l’interactivité avec les collaborateurs de toutes les équipes: Développement, Projet/Business Analyst, Commerciale et Produit
  • Un environnement intellectuellement stimulant

Apply now

By continuing your navigation, you accept the use of cookies for statistical purposes and personalization. Learn more