L’EQUIPE DATA SCIENCE :
L'équipe Data Science est composée de plus de 40 économistes, data scientists, ingénieurs data et ingénieurs machine learning. Notre rôle est de produire et d’améliorer les informations sur le marché du logement (modèles d'estimation, cartes de prix et indices de prix entre autres) qui sont mises à disposition sur les sites du groupe Aviv en France, en Allemagne et en Belgique.
Pour y parvenir, nous fonctionnons comme un laboratoire de recherche. Cela se traduit par des liens forts avec l'écosystème académique : quatre membres de l'équipe sont actuellement doctorants en mathématiques et en économie et nous avons des partenariats actifs avec des chercheurs et des universitaires qui siègent au sein de notre Comité Scientifique. Cela se traduit également par le fait que nous ne nous contentons pas d'appliquer uniquement des solutions existantes en ce qui concerne notre domaine d'expertise : pour aller au-delà des performances des algorithmes sur étagère, nous construisons nos propres solutions propriétaires.
SUJET DE STAGE: La ville comme un réseau de neurones : application au prix de l’immobilier
Les cartes de prix, qui traduisent l’hétérogénéité spatiale des prix de l’immobilier, sont une des marques de fabrique de Meilleurs Agents et maintenant d’Aviv. Loin d’être trivial, de par la nature rare et hétérogène des données immobilière, ce problème mobilise des techniques de statistiques spatiales avancées et fait l’objet d’une recherche active dans l’entreprise depuis plus de 10 ans. Ce stage s’inscrit dans la continuité de ces années de recherche.
Plus précisément, il s’agit d’explorer une piste ouverte dans la thèse de doctorat de Sarah Soleiman “De la complexité spatiale aux prix de l’immobilier : approches statistiques”, réalisée en partenariat avec entre l’université Panthéon-Sorbonne et Meilleurs Agents. Partant de la modélisation proposée d’une ville comme un réseau où chaque neurone est une parcelle, il s’agira de passer de la maille parcelle à la maille logement et adapter l’architecture du réseau et les procédures de mise à jour. Selon l’avancée du stage d’autres pistes pourront être explorées, par exemple l’inférence de structure et la détection de frontières implicites.
Concrètement, le stage fera l’objet d’une première phase de compréhension théorique du modèle et de la littérature scientifique dans lequel il s’inscrit, ainsi que de prise en main des données. La seconde phase consistera à proposer une adaptation de la modélisation au changement de maille. Enfin, il s’agira de tester cette nouvelle modélisation dans le cas de la ville de Paris.
Le ou la stagiaire travaillera sous la supervision de Sarah Soleiman et sera épaulé(e) par l’ensemble des équipes du pôle Data Science pour les questions tant scientifiques que techniques.