Il s'agit de l'application Linux « Statistics for Data Scientists », dont la dernière version est téléchargeable sous le nom statistics-for-data-scientistssourcecode.tar.gz. Elle peut être exécutée en ligne sur l'hébergeur gratuit OnWorks pour postes de travail.
Téléchargez et exécutez en ligne gratuitement cette application nommée Statistiques pour les scientifiques des données avec OnWorks.
Suivez ces instructions pour exécuter cette application :
- 1. Téléchargé cette application sur votre PC.
- 2. Entrez dans notre gestionnaire de fichiers https://www.onworks.net/myfiles.php?username=XXXXX avec le nom d'utilisateur que vous voulez.
- 3. Téléchargez cette application dans ce gestionnaire de fichiers.
- 4. Démarrez l'émulateur en ligne OnWorks Linux ou Windows en ligne ou l'émulateur en ligne MACOS à partir de ce site Web.
- 5. Depuis le système d'exploitation OnWorks Linux que vous venez de démarrer, accédez à notre gestionnaire de fichiers https://www.onworks.net/myfiles.php?username=XXXXX avec le nom d'utilisateur que vous souhaitez.
- 6. Téléchargez l'application, installez-la et exécutez-la.
CAPTURES D'ÉCRAN:
Statistiques pour les data scientists
DESCRIPTION:
Le référentiel « statistiques pour les data scientists » est une ressource pédagogique conçue pour relier la théorie statistique rigoureuse aux flux de travail pratiques en science des données. Le code et les supports pédagogiques sont destinés à aider les data scientists et les analystes à appréhender les principes statistiques (par exemple, l'inférence, les régressions, les tests d'hypothèses, les probabilités, les intervalles de confiance) dans des contextes pertinents pour des tâches d'analyse de données réelles. Le référentiel comprend des notebooks Jupyter, des scripts R, des exemples concrets et, éventuellement, des séries de problèmes illustrant l'application des méthodes statistiques à des jeux de données réels. Il vise à démystifier le lien entre les statistiques classiques et la modélisation empirique en abordant la vérification des hypothèses, la visualisation, l'interprétation des résultats et les pièges d'une mauvaise utilisation. Le contenu privilégie la clarté et l'accessibilité, montrant non seulement comment réaliser des tests statistiques ou construire des modèles, mais aussi leur signification et quand une méthode est préférable à une autre.
Comment ça marche
- Bloc-notes et scripts Jupyter illustrant les concepts statistiques de base (inférence, régression, probabilité)
- Exemples concrets d'application de méthodes statistiques à des ensembles de données réels
- Accent mis sur l'interprétation et le diagnostic des hypothèses
- Intégration de la théorie aux flux de travail pratiques de la science des données
- Style d'enseignement accessible qui relie les idées des manuels à la modélisation appliquée
- Code + format narratif pour soutenir l'apprentissage et l'utilisation de référence
Langage de programmation
R
Catégories
Cette application est également disponible sur https://sourceforge.net/projects/statistics-for-data-sc.mirror/. Elle est hébergée sur OnWorks afin de pouvoir être exécutée en ligne plus facilement depuis l'un de nos systèmes d'exploitation gratuits.