Accueil » Articles marqués « data science »

Archives de mot-clé : data science

Suivez-nous

LinkedIn
RSS

Évènements à venir

Restons en contact

Big data, machine learning et évaluation : 8. Conclusion

La data science au service des administrations

8. Conclusion

Envie de lire plus de cas pratiques ? Consultez mon article sur l’analyse des sentiments (via Google Cloud).

8.1. Un retard d’adaptation

Les tentatives d’intégration de nouveaux modèles statistiques et de leurs applications informatiques dans le pilotage de projets, de programmes ou de politiques publiques ouvrent des voies prometteuses pour l’évaluation. La croissance exponentielle des données ainsi que la diffusion gratuite d’outils de développement accélèrent la recherche et les innovations dans le domaine. Si les organisations à but lucratif sont incitées à s’adapter, les acteurs associatifs et étatiques accusent un temps de retard et les évaluateurs peinent à innover dans leurs méthodes d’analyse.

Big data, machine learning et évaluation : 7. La détection de prestations erronées

La data science au service des administrations

7. La détection d’anomalies

Une administration chargée de fournir des prestations financières à des individus doit également s’assurer de l’exactitude des prestations accordées, ainsi que de la qualité des données sur lesquelles reposent leur calculs. En effet, l’égalité et la légalité de traitement des bénéficiaires ne sauraient être garanties sur la base de données erronées. Cependant, Il est impossible pour les auditeurs d’examiner les centaines de milliers de prestations et ceux-ci doivent généralement se contenter d’un petit échantillon aléatoire.

Big data, machine learning et évaluation : 6. La gestion des tickets d’incident

La data science au service des administrations

6. La gestion des tickets d’incident

En délivrant des services informatisés (e-démarches, poursuites, etc.), l’administration assume également la gestion des problèmes des usagers. Comme pour beaucoup de supports techniques, les problèmes se ressemblent et les équipes passent un temps important à répéter les mêmes instructions. Une façon de résoudre ce problème est de créer une foire aux questions (FAQ) à disposition des usagers. Néanmoins, ces derniers préfèrent le plus souvent ouvrir un ticket, imposant un temps d’attente ainsi qu’une charge de travail pour l’équipe de support. Une solution plus ambitieuse est d’automatiser l’analyse de tickets pour trouver des contenus similaires et rediriger immédiatement l’utilisateur vers une réponse appropriée. Une telle application contribue grandement à l’expérience des usagers, tout en déchargeant l’administration qui reçoit une centaine de milliers de tickets par année.

Big data, machine learning et évaluation : 5. La prédiction des pannes (ou maintenance prédictive)

La data science au service des administrations

5. La prédiction des pannes (ou maintenance prédictive)

La santé des serveurs informatiques est essentielle à la qualité des prestations publiques, tant pour les habitants (e.g. les services e-démarches) que pour les collaborateurs de l’État (e.g. les logiciels de travail). Dans ce contexte, l’équipe responsable des serveurs est confrontée à deux problèmes : d’une part, les pannes critiques doivent absolument être évitées pour assurer la continuité des services ; d’autre part, multiplier les opérations de maintenance est coûteux et fastidieux pour l’administration, alors que la plupart des machines examinées ne présentent aucun signe de dégradation. Un indicateur fiable de prédiction de pannes apparaît alors comme une solution enviable. Ce problème repose sur deux hypothèses :

Big data, machine learning et évaluation : 4. Prédire les contraventions impayées de la ville Détroit

La data science au service des administrations

4. Prédire les contraventions impayées de la ville Détroit

En 2017, la ville de Detroit a lancé une compétition publique pour l’aider à résoudre son problème de contraventions impayées (Kaggle 2019). Il s’agit plus précisément des blight tickets, des contraventions infligées aux résidents qui manquent de préserver le bon état de leur propriété (détérioration, graffitis, insalubrité, etc.). Malheureusement, la plupart de ces contraventions demeurent impayées à la fin du délai légal, entraînant des procédures administratives lourdes et coûteuses pour les autorités. La ville a donc cherché à accroître le respect du paiement des contraventions (dit aussi compliance). Pour en comprendre les déterminants, une étape visait à identifier les meilleurs prédicteurs de la compliance. La ville a ainsi publié ses données en vue d’obtenir un modèle prédictif performant.

Big data, machine learning et évaluation : 3. Quelques définitions

La data science au service des administrations

3. Quelques définitions

3.1. Le machine learning

Le machine learning (ou apprentissage automatique) est le « processus par lequel un algorithme évalue et améliore ses performances sans l’intervention d’un programmeur, en répétant son exécution sur des jeux de données jusqu’à obtenir, de manière régulière, des résultats pertinents » (République française 2018). Malgré quelques développements précoces depuis les années 1950, la recherche dans le domaine ne s’est intensifiée qu’à partir du 21e siècle, grâce à l’explosion des puissances de calcul et du big data (Foote 2020). Le machine learning distingue deux types majeurs d’apprentissage (Shalev-Shwartz et Ben-David 2014, 22-23) :

Big data, machine learning et évaluation : 2. Survol de la discussion scientifique

La data science au service des administrations

2. Survol de la discussion scientifique

La thématique du big data en évaluation soulève plusieurs enjeux déjà explorés depuis une dizaine d’années. Dresser un état de la littérature permet de recenser les sentiers battus, ainsi que ceux qui restent à défricher. Néanmoins, la relative nouveauté du machine learning explique la pauvreté actuelle des publications liées à l’évaluation de projets, de programmes ou de politiques publiques. De plus, le machine learning est une pratique inhérente à la science des données (ou data science), une discipline nouvelle située à la frontière entre les statistiques et l’informatique (Christensson 2017). Malgré un lien déjà fortement établi entre les statistiques et l’évaluation, les professionnels du domaine peinent à intégrer ces nouveaux outils sans accuser un temps de retard (Bamberger 2017a).

Big data, machine learning et évaluation : 1. Introduction

La data science au service des administrations

0. Abstract

La révolution numérique a transformé durablement la façon dont sont menés les projets, les programmes et les politiques publiques. Les nouvelles technologies de l’information et de la communication créent de nouvelles sources de données, dont la plupart relèvent du big data. Ces dernières représentent des enjeux méthodologiques nouveaux pour les professionnels de l’évaluation, qui peinent pourtant encore à les intégrer dans leurs analyses.

❝ Cette série d’articles vise à jeter un pont entre l’évaluation et la science des données en présentant quatre cas d’application au service des administrations

Cette série d’articles vise à jeter un pont entre l’évaluation et la science des données en présentant quatre cas d’application, notamment du machine learning, au service des administrations. Pour chacun d’eux, il partage les algorithmes de résolution en langage Python, en utilisant des données similaires publiques ou fictives. Grâce aux outils libres et gratuits permettant de reproduire ces codes, il invite les évaluateurs à se familiariser de façon pratique à la science des données et aux perspectives qu’elle peut leur offrir dans leurs pratiques professionnelles.

La théorie vous ennuie ? Passez directement à la partie sur les cas pratiques !