elaboration d'un modele pour l'optimisation des traitements en big data
Ecole Superieure Polytechnique D’Antananarivo - nan - None ()
Auteur : rajaonarivelo maminiaina andry tahiana
Annee de soutenance : 2019
Diplome : DOCTORAT
Langue : FR
Resume
lanalyse des big data est au coeur de la recherche scientifique et des entreprises modernes. pour analyser ces données à très grande échelle, mapreduce est devenue un modèle attrayant. ce modèle nest pas conçu pour effectuer des opérations de jointures avec plusieurs entrées. de nombreuses études sur les algorithmes de jointures, tels que semi-join, bloomjoin dans mapreduce ont été explorées, mais cependant grand nombres de données non-joints sont toujours générées et transmises sur le réseau. de cette recherche nous obtiendrons un modèle pour résoudre ce problème en créant lintersection des filtres basé sur le filtre de bloom afin déliminer les éléments disjoints entre deux ensembles de données dentrée. deux modèles sont donc proposées pour modéliser le filtre. pour appliquer ce dernier dans une opération de jointure, un travail mapreduce sera ajusté de manière cohérente, en essayant de ne pas augmenter les coûts associés. nous considérons alors les jointures à 2 voies et allons analyser leurs coûts. par conséquent, grâce à lintersection des filtres, lopération de jointures minimise le coût de le/s disque. enfin, de létude réalisée on a pu prouver son efficacité après avoir comparé les solutions existantes sur les coûts des jointures des deux approches.