Elle est utilisée dans le monde professionnel pour résoudre des problématiques très diverses, allant de la gestion de relation client à la maintenance préventive, en passant par la détection de fraudes ou encore l'optimisation de sites web.
http://fr.wikipedia.org/wiki/Exploration_de_donn%C3%A9es
Le Data Mining est en fait un terme générique englobant toute une famille d'outils facilitant l'analyse des données contenues au sein d'une base décisionnelle de type Data Warehouse ou DataMart.
http://www.piloter.org/business-intelligence/datamining.htm
Ultra-Fluide propose ici une liste d'outils open source pour le datamining.
http://www.ultra-fluide.com/ressources/datamining/outils.htm
Le langage R, un projet de GNU similaire à S, est un langage de programmation et un environnement mathématique utilisés pour le traitement de données et l'analyse statistique. Depuis plusieurs années, deux nouvelles versions apparaissent, au printemps et à l'automne. R dispose de nombreuses fonctions graphiques.
R est fondé sur le langage S qui a été développé par John Chambers des laboratoires Bell et est décrit dans (en) Evolution of the S Language. R est considéré par ses créateurs comme étant une exécution de S, avec la sémantique dérivée du langage Scheme. R est librement disponible sous la GPL et est disponible pour Microsoft Windows, Macintosh, et de nombreux systèmes de type Unix.
R-projet Scilab est un logiciel libre de calcul numérique fournissant un environnement de calcul pour des applications scientifiques. Développé depuis 1990 par des chercheurs de l’INRIA et de l’ENPC, il est développé par le Consortium Scilab depuis mai 2003, Consortium développé et maintenu par l'INRIA jusqu'en juillet 2008 puis depuis par la Fondation de coopération scientifique Digiteo.
Il est disponible pour Windows, Mac OS X, Linux et BSD.
La syntaxe et les possibilités offertes par Scilab sont similaires à celles de Matlab, mais les deux logiciels ne sont pas compatibles bien qu'existe un traducteur de Matlab vers Scilab.
ScilabIl est disponible pour Windows, Mac OS X, Linux et BSD.
La syntaxe et les possibilités offertes par Scilab sont similaires à celles de Matlab, mais les deux logiciels ne sont pas compatibles bien qu'existe un traducteur de Matlab vers Scilab.
Mixmod, logiciel libre développé par le CNRS, l'INRIA, l'université de FrancheComté, l'université de Compičgne et l'université de Lille, est destiné ŕ un public d'industriels et de chercheurs souhaitant disposer d'un outil convivial et performant pour la classification automatique des données (statistiques).
Mixmod est aujourd'hui reconnu comme un outil de choix dans le domaine de la classification automatique des données, il est téléchargé environ 250 fois par mois. Son succčs repose, en grande partie sur les nombreuses et riches fonctionnalités qu'il propose permettant de traiter des données dans des situations complexes.
Aujourd'hui Mixmod est composé d'un noyau écrit en C++ (30 000 lignes) et s'utilise dans les environnements de Scilab et Matlab (interfaces graphiques).
Mixmod (format pdf)Mixmod est aujourd'hui reconnu comme un outil de choix dans le domaine de la classification automatique des données, il est téléchargé environ 250 fois par mois. Son succčs repose, en grande partie sur les nombreuses et riches fonctionnalités qu'il propose permettant de traiter des données dans des situations complexes.
Aujourd'hui Mixmod est composé d'un noyau écrit en C++ (30 000 lignes) et s'utilise dans les environnements de Scilab et Matlab (interfaces graphiques).
Autoclass-c - Logiciel spécialisé dans le clustering (analyse discriminante et maximum de vraisemblance). Développé par un laboratoire de la NASA et disponible dans le domaine publique. Outil performant écrit en C qui n'a plus évolué depuis le milieu 2002.
Autoclass-c (en anglais)

Aucun commentaire:
Enregistrer un commentaire