Cinq ressources intéressantes pour apprendre l’apprentissage fédéré en 2023

[ad_1]

L’apprentissage fédéré est une méthode d’apprentissage automatique collaborative qui utilise des données originales sans les altérer. Contrairement aux systèmes d’apprentissage automatique traditionnels, qui nécessitent que les données de formation soient centralisées dans une seule machine ou un centre de données, l’apprentissage fédéré forme des algorithmes sur plusieurs périphériques ou serveurs décentralisés.

Cette technique d’apprentissage permet aux téléphones mobiles de construire un modèle de prédiction partagé tout en conservant les données d’entraînement sur l’appareil et en évitant le stockage des données sur le cloud.

Voici quelques ressources intéressantes qui vous aideront à vous familiariser avec l’apprentissage fédéré.

Substrat

Substra est un cadre logiciel d’apprentissage fédéré créé par un effort de recherche multipartenaire centré sur l’entreprise française Owkin, fondée en 2016. Substra se concentre sur l’industrie médicale avec des objectifs de propriété et de confidentialité des données. Aujourd’hui, il est utilisé pour la découverte de médicaments dans le secteur pharmaceutique dans le cadre de l’initiative MELLODY.

Substra prend en charge plusieurs interfaces pour différents types d’utilisateurs. Il dispose d’une bibliothèque Python pour les scientifiques des données, d’interfaces de ligne de commande pour les administrateurs et d’interfaces utilisateur graphiques pour les chefs de projet et autres utilisateurs avancés. Le déploiement de Substra nécessite une configuration Kubernetes sophistiquée pour chaque nœud.

PySyft + PyGrid

PySyft est un package Python 3 open source qui utilise FL, la confidentialité différentielle et des calculs cryptés pour permettre un apprentissage fédéré à des fins de recherche. Il a été créé par la communauté OpenMined et fonctionne principalement avec des frameworks d’apprentissage en profondeur tels que PyTorch et TensorFlow.

PySyft peut effectuer deux types de calculs :

  • Calculs dynamiques sur des données non observables
  • Les calculs statiques sont des graphiques de calculs que nous pouvons faire plus tard dans un environnement informatique différent.

PySyft est un langage de programmation qui définit des objets, des méthodes d’apprentissage automatique et des abstractions. Vous ne pouvez pas travailler sur des tâches simples de science des données qui nécessitent une communication réseau avec PySyft. Cela nécessiterait l’utilisation d’un autre package appelé PyGrid. De plus, PyGrid prend en charge l’apprentissage fédéré sur le Web, les appareils mobiles, les périphériques périphériques et de nombreux types de terminaux. PyGrid est l’API utilisée pour gérer et faire évoluer PySyft. Nous pouvons utiliser PyGrid Admin pour le gérer.

OpenFL

Intel Open Federated Learning est un projet Python 3 open source développé par Intel pour appliquer FL aux données sensibles. OpenFL contient des scripts de déploiement bash et utilise des certificats pour sécuriser la communication, mais l’utilisateur doit gérer la plupart de cela lui-même.

La bibliothèque comprend deux parties : le collaborateur, qui forme des modèles globaux à l’aide d’un ensemble de données local, et l’agrégateur, qui reçoit les mises à jour du modèle et les agrège pour produire le modèle global. OpenFL inclut une API Python ainsi qu’une interface de ligne de commande. Étant donné que la communication entre les nœuds se fait via mTLS, des certificats sont nécessaires. Chaque nœud de la fédération doit être certifié. Pour réduire les coûts de communication, OpenFL permet la compression des données avec et sans perte. Les développeurs peuvent ajuster la journalisation, les mécanismes de fractionnement des données et la logique d’agrégation dans OpenFL.

Le plan d’apprentissage fédéré (FL) est le fondement de la philosophie de conception OpenFL. Il s’agit d’un fichier YAML qui définit les collaborateurs, agrégateurs, connexions, modèles, données et toute configuration de base nécessaires. Pour isoler les contextes de fédération, OpenFL fonctionne dans des conteneurs Docker.

Apprentissage fédéré IBM

IBM Federated Learning fournit une base pour FL sur laquelle nous pouvons créer des fonctionnalités avancées. Il ne s’appuie sur aucun cadre d’apprentissage automatique et prend en charge de nombreuses topologies d’apprentissage, telles qu’un agrégateur et des protocoles standard.

Il est destiné à fournir une base solide pour l’apprentissage fédéré, permettant de nombreux modèles d’apprentissage, topologies et modèles d’apprentissage dans des scénarios d’entreprise et de cloud hybride. IBM Federated Learning est compatible avec une variété de modèles d’apprentissage automatique, notamment :

  • Keras, PyTorch et TensorFlow sont utilisés pour créer des modèles.
  • Régression logistique, SVM linéaire, régression de crête et autres classificateurs/régressions linéaires (avec régularisateurs)
  • Arbre de décision ID3
  • DQN, DDPG, PPO et différents algorithmes d’apprentissage par renforcement profond
  • Théorème de Bayes

NVIDIA CLAIR

NVIDIA CLARA est un cadre d’application conçu pour des cas d’utilisation dans le domaine de la santé. Il contient des frameworks accélérés par GPU, des SDK et des applications de référence pour aider les développeurs, les data scientists et les chercheurs à créer des systèmes d’apprentissage fédérés en temps réel, sécurisés et évolutifs. Par exemple, CLARA est actuellement utilisé par la startup française Therapixel, qui utilise la technologie NVIDIA pour augmenter la précision d’un diagnostic de cancer du sein.

  • NVIDIA CLARA est compatible avec les cas d’utilisation suivants :
  • Clara AGX est un clarificateur de dispositif médical.
  • Clara Discovery pour le développement de médicaments
  • Clara Gardien de l’hôpital
  • Clara Imaging est spécialisée dans l’imagerie médicale.
  • Clara Parabricks pour la recherche génomique



[ad_2]

Laisser un commentaire