Catégories
> 5 Information et communication > 5.40 Technologie de l'information (logiciels) > Traitement des données > Analyse de données
Analyse de donnéesVoir aussi
|
Affiner la recherche Interroger des sources externes
Data mining et statistique décisionnelle / Stéphane Tufféry / Paris : Technip (2007)
Titre : Data mining et statistique décisionnelle : l'intelligence des données Type de document : texte imprimé Auteurs : Stéphane Tufféry, Auteur Mention d'édition : Nouvelle édition revue et augmentée Editeur : Paris : Technip Année de publication : 2007 Importance : 1 vol. (XIX-533 p.) Présentation : ill. en noir et blanc, fig., couv. en coul. Format : 25 cm ISBN/ISSN/EAN : 978-2-7108-0888-6 Prix : 55,00 EUR Langues : Français (fre) Index. décimale : 519.5 Statistiques et probabilités Résumé : Quatrième de couverture : Le data mining et la statistique sont de plus en plus répandus dans les entreprises et les organisations soucieuses d'extraire l'information pertinente cachée dans leurs bases de données, en vue d'expliquer et de prévoir.
Cette nouvelle édition, revue et augmentée de 160 pages, fait le point sur le data mining, ses méthodes, ses outils et ses applications, qui vont du scoring jusqu'au web mining et au text mining. Nombre de ces outils appartiennent à l'analyse des données et la statistique classique (classification automatique, analyse discriminante, régression logistique, modèles linéaires généralisés,...) mais certains sont plus spécifiques au data mining, comme les antres de décision, les réseaux de neurones, les SVM, le boosting, etc.
Tous sont disponibles dans des logiciels de plus en plus puissants et conviviaux : un chapitre aide d'ailleurs le lecteur a se diriger dans cette offre logicielle fournie et dresse un comparatif très approfondi des deux leaders, SAS et SPSS. L'utilisation des logiciels et l'interprétation des résultats sont illustrées par de nombreux exemples conduits avec SAS. SPSS et R. Les aspects méthodologiques vont de la conduite des projets jusqu'aux facteurs de réussite et aux pièges à éviter, en passant par l'évaluation et la comparaison des modèles, l'intégration dans le marketing de bases de données, le Calcul du retour sur investissement, les interfaces informatiques, sans oublier les contraintes juridiques dés que l'on traite des données à caractère personnel.Note de contenu : 1/Panorama du data mining
2/Le déroulement d'une étude de data mining
3/ L'exploration et la préparation des données
4/L'utilisation des données commerciales
5/ Aperçu sur les techniques de data mining
6/L'analyse factorielle
7/Les réseaux de neurones
8/Les techniques de classification automatique
9/La recherche d'associations
10/Les techniques de classement et de prédiction
11/Une application du data mining : le scoring
12/Les facteurs de succès d'un projet de data mining
13/ Les logiciels de statistique et data mining
14/Le text mining
15/Le web mining
Annexes
Bibliographie.Data mining et statistique décisionnelle : l'intelligence des données [texte imprimé] / Stéphane Tufféry, Auteur . - Nouvelle édition revue et augmentée . - Paris : Technip, 2007 . - 1 vol. (XIX-533 p.) : ill. en noir et blanc, fig., couv. en coul. ; 25 cm.
ISBN : 978-2-7108-0888-6 : 55,00 EUR
Langues : Français (fre)
Index. décimale : 519.5 Statistiques et probabilités Résumé : Quatrième de couverture : Le data mining et la statistique sont de plus en plus répandus dans les entreprises et les organisations soucieuses d'extraire l'information pertinente cachée dans leurs bases de données, en vue d'expliquer et de prévoir.
Cette nouvelle édition, revue et augmentée de 160 pages, fait le point sur le data mining, ses méthodes, ses outils et ses applications, qui vont du scoring jusqu'au web mining et au text mining. Nombre de ces outils appartiennent à l'analyse des données et la statistique classique (classification automatique, analyse discriminante, régression logistique, modèles linéaires généralisés,...) mais certains sont plus spécifiques au data mining, comme les antres de décision, les réseaux de neurones, les SVM, le boosting, etc.
Tous sont disponibles dans des logiciels de plus en plus puissants et conviviaux : un chapitre aide d'ailleurs le lecteur a se diriger dans cette offre logicielle fournie et dresse un comparatif très approfondi des deux leaders, SAS et SPSS. L'utilisation des logiciels et l'interprétation des résultats sont illustrées par de nombreux exemples conduits avec SAS. SPSS et R. Les aspects méthodologiques vont de la conduite des projets jusqu'aux facteurs de réussite et aux pièges à éviter, en passant par l'évaluation et la comparaison des modèles, l'intégration dans le marketing de bases de données, le Calcul du retour sur investissement, les interfaces informatiques, sans oublier les contraintes juridiques dés que l'on traite des données à caractère personnel.Note de contenu : 1/Panorama du data mining
2/Le déroulement d'une étude de data mining
3/ L'exploration et la préparation des données
4/L'utilisation des données commerciales
5/ Aperçu sur les techniques de data mining
6/L'analyse factorielle
7/Les réseaux de neurones
8/Les techniques de classification automatique
9/La recherche d'associations
10/Les techniques de classement et de prédiction
11/Une application du data mining : le scoring
12/Les facteurs de succès d'un projet de data mining
13/ Les logiciels de statistique et data mining
14/Le text mining
15/Le web mining
Annexes
Bibliographie.Exemplaires
Code-barres Cote Support Localisation Section Disponibilité aucun exemplaire Data mining et statistiques décisionnelle / Stéphane Tufféry / Paris : Technip (2017)
Titre : Data mining et statistiques décisionnelle : La science des données Type de document : texte imprimé Auteurs : Stéphane Tufféry, Auteur ; Gilbert Saporta, Préfacier, etc. Mention d'édition : 5eme édition Editeur : Paris : Technip Année de publication : 2017 Importance : 1 vol. (XX-913 p.) Présentation : ill., graph., tableaux, couv. ill. en coul. Format : 24 cm ISBN/ISSN/EAN : 978-2-7108-1180-0 Langues : Français (fre) Index. décimale : 519.5 Statistiques et probabilités Résumé : Présentation de l'éditeur : "Le data mining et la data science sont de plus en plus répandus dans les entreprises et les organisations soucieuses d’extraire l’information pertinente de leurs bases de données, qu’elles peuvent utiliser pour expliquer et prévoir les phénomènes qui les concernent (risques, production, consommation, fidélisation…).
Cette cinquième édition, actualisée et augmentée de 90 pages, fait le point sur le data mining, ses méthodes, ses outils et ses applications, qui vont du scoring jusqu’au text mining, objet d’un chapitre complètement remanié. Nombre de ses outils appartiennent à l’analyse des données et à la statistique « classiques » (analyse factorielle, classification automatique, analyse discriminante, régression logistique, modèles linéaires généralisés, régression pénalisée, régression clusterwise…) mais certains sont plus spécifiques au data mining, comme les réseaux de neurones, les algorithmes génétiques, les SVM, les arbres de décision, les forêts aléatoires, le boosting et la détection des règles d’associations. Les avancées les plus récentes du machine learning et les applications les plus actuelles des Big Data sont présentées, qui vont des algorithmes de reconnaissance d’image aux méthodes de plongement de mots en text mining. Les chapitres sur les réseaux de neurones et les SVM sont illustrés par la reconnaissance de l’écriture manuscrite.
Ces outils sont disponibles dans des logiciels de plus en plus puissants et complets, à commencer par le logiciel libre R, que nous comparons en détail aux logiciels SAS et IBM SPSS dans un chapitre spécifique. Ces logiciels sont utilisés pour illustrer par des exemples précis les explications théoriques données.
Les aspects méthodologiques vont de la conduite des projets jusqu’aux facteurs de réussite et aux pièges à éviter, en passant par l’évaluation et la comparaison des modèles, leur intégration dans les processus opérationnels. Un chapitre est consacré à une étude de cas complète de credit scoring, de l’exploration des données jusqu’à l’élaboration de la grille de score."Note de contenu : 1. Panorama du data mining et de la data science. 2. Le déroulement d’une étude de data mining. 3. L’exploration et la préparation des données. 4. L’utilisation des données commerciales et géodémographiques. 5. Les logiciels de statistique, de data mining et machine learning. 6. Panorama des méthodes de statistique et de data mining. 7. L’analyse factorielle. 8. Les réseaux de neurones artificiels. 9. Les méthodes de classification automatique. 10. La détection des règles d’associations. 11. Les méthodes de classement et de régression. 12. L’analyse discriminante linéraire et ses généralisations. 13. Le modèle linéaire et ses généralisations. 14. Le modèle logistique et ses généralisations. 15. Les arbres de décisions. 16. Les autres modèles prédictifs. 17. Les méthodes d’agrégation de modèles. 18. Une application du data mining : le scoring. 19. Les facteurs de succès d’un projet de data mining. 20. Le text mining. 21. Le web mining. Annexes. Bibliographie. Index. Data mining et statistiques décisionnelle : La science des données [texte imprimé] / Stéphane Tufféry, Auteur ; Gilbert Saporta, Préfacier, etc. . - 5eme édition . - Paris : Technip, 2017 . - 1 vol. (XX-913 p.) : ill., graph., tableaux, couv. ill. en coul. ; 24 cm.
ISBN : 978-2-7108-1180-0
Langues : Français (fre)
Index. décimale : 519.5 Statistiques et probabilités Résumé : Présentation de l'éditeur : "Le data mining et la data science sont de plus en plus répandus dans les entreprises et les organisations soucieuses d’extraire l’information pertinente de leurs bases de données, qu’elles peuvent utiliser pour expliquer et prévoir les phénomènes qui les concernent (risques, production, consommation, fidélisation…).
Cette cinquième édition, actualisée et augmentée de 90 pages, fait le point sur le data mining, ses méthodes, ses outils et ses applications, qui vont du scoring jusqu’au text mining, objet d’un chapitre complètement remanié. Nombre de ses outils appartiennent à l’analyse des données et à la statistique « classiques » (analyse factorielle, classification automatique, analyse discriminante, régression logistique, modèles linéaires généralisés, régression pénalisée, régression clusterwise…) mais certains sont plus spécifiques au data mining, comme les réseaux de neurones, les algorithmes génétiques, les SVM, les arbres de décision, les forêts aléatoires, le boosting et la détection des règles d’associations. Les avancées les plus récentes du machine learning et les applications les plus actuelles des Big Data sont présentées, qui vont des algorithmes de reconnaissance d’image aux méthodes de plongement de mots en text mining. Les chapitres sur les réseaux de neurones et les SVM sont illustrés par la reconnaissance de l’écriture manuscrite.
Ces outils sont disponibles dans des logiciels de plus en plus puissants et complets, à commencer par le logiciel libre R, que nous comparons en détail aux logiciels SAS et IBM SPSS dans un chapitre spécifique. Ces logiciels sont utilisés pour illustrer par des exemples précis les explications théoriques données.
Les aspects méthodologiques vont de la conduite des projets jusqu’aux facteurs de réussite et aux pièges à éviter, en passant par l’évaluation et la comparaison des modèles, leur intégration dans les processus opérationnels. Un chapitre est consacré à une étude de cas complète de credit scoring, de l’exploration des données jusqu’à l’élaboration de la grille de score."Note de contenu : 1. Panorama du data mining et de la data science. 2. Le déroulement d’une étude de data mining. 3. L’exploration et la préparation des données. 4. L’utilisation des données commerciales et géodémographiques. 5. Les logiciels de statistique, de data mining et machine learning. 6. Panorama des méthodes de statistique et de data mining. 7. L’analyse factorielle. 8. Les réseaux de neurones artificiels. 9. Les méthodes de classification automatique. 10. La détection des règles d’associations. 11. Les méthodes de classement et de régression. 12. L’analyse discriminante linéraire et ses généralisations. 13. Le modèle linéaire et ses généralisations. 14. Le modèle logistique et ses généralisations. 15. Les arbres de décisions. 16. Les autres modèles prédictifs. 17. Les méthodes d’agrégation de modèles. 18. Une application du data mining : le scoring. 19. Les facteurs de succès d’un projet de data mining. 20. Le text mining. 21. Le web mining. Annexes. Bibliographie. Index. Réservation
Réserver ce documentExemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité GEN000000000004 519.5 TUF Ouvrage Centre de documentation UniLasalle/ Campus Rouen Salle de lecture Disponible Practical statistics for data scientists / Peter C. Bruce / 2017
Titre : Practical statistics for data scientists : 50 essential concepts / Type de document : texte imprimé Auteurs : Peter C. Bruce ; Andrew Bruce Mention d'édition : First edition. Année de publication : 2017 Importance : xvi, 298 pages Présentation : illustrations Format : 24 cm ISBN/ISSN/EAN : 978-1-4919-5296-2 Langues : Anglais (eng) Index. décimale : 519.5 Statistiques et probabilités Résumé : "Statistical methods are a key part of of data science, yet very few data scientists have any formal statistics training. Courses and books on basic statistics rarely cover the topic from a data science perspective. This practical guide explains how to apply various statistical methods to data science, tells you how to avoid their misuse, and gives you advice on what's important and what's not.
Many data science resources incorporate statistical methods but lack a deeper statistical perspective. If you’re familiar with the R programming language, and have some exposure to statistics, this quick reference bridges the gap in an accessible, readable format.
With this book, you’ll learn:
Why exploratory data analysis is a key preliminary step in data science
How random sampling can reduce bias and yield a higher quality dataset, even with big data
How the principles of experimental design yield definitive answers to questions
How to use regression to estimate outcomes and detect anomalies
Key classification techniques for predicting which categories a record belongs to
Statistical machine learning methods that “learn” from data
Unsupervised learning methods for extracting meaning from unlabeled data"Practical statistics for data scientists : 50 essential concepts / [texte imprimé] / Peter C. Bruce ; Andrew Bruce . - First edition. . - 2017 . - xvi, 298 pages : illustrations ; 24 cm.
ISBN : 978-1-4919-5296-2
Langues : Anglais (eng)
Index. décimale : 519.5 Statistiques et probabilités Résumé : "Statistical methods are a key part of of data science, yet very few data scientists have any formal statistics training. Courses and books on basic statistics rarely cover the topic from a data science perspective. This practical guide explains how to apply various statistical methods to data science, tells you how to avoid their misuse, and gives you advice on what's important and what's not.
Many data science resources incorporate statistical methods but lack a deeper statistical perspective. If you’re familiar with the R programming language, and have some exposure to statistics, this quick reference bridges the gap in an accessible, readable format.
With this book, you’ll learn:
Why exploratory data analysis is a key preliminary step in data science
How random sampling can reduce bias and yield a higher quality dataset, even with big data
How the principles of experimental design yield definitive answers to questions
How to use regression to estimate outcomes and detect anomalies
Key classification techniques for predicting which categories a record belongs to
Statistical machine learning methods that “learn” from data
Unsupervised learning methods for extracting meaning from unlabeled data"Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité GEN000000001068 519.5 BRU Ouvrage Centre de documentation UniLasalle/ Campus Rouen Salle de lecture Exclu du prêt