Pour implémenter un modèle de Machine Learning, le choix de la source de données est primordial. Ce choix est plus important quand on traite des données financières. Bien évidement, il existe plusieurs sources données mais dans notre article nous allons voir un “newcomer” qui est Quandl.com.
Nous allons voir comment le configurer pour obtenir des données en utilisant Python
A noter que Quandl propose des données payantes et une grande quantité de données gratuites.
Quandl, Késako ?
Quandl est un nouveau fournisseur de données financières fondé en 2013 et devenu rapidement très respecté. Ils comptent aujourd’hui plus de 250 000 utilisateurs allant des particuliers aux grandes institutions financières. En fait, Quandl fournit deux catégories principales de données :
- Données financières de base: données sur les titres et données marché pour toutes les classes d’actifs.
- Données alternatives: données de sources autres que les données des marchés réglementés.
Il couvre la plupart des données financières de base dont les sources les plus populaires sont payantes avec un système d’abonnement. Par contre, c’est dans les données alternatives que Quandl est désormais considéré comme l’un des principaux fournisseurs et enregistre la plus forte croissance.
Mais alors, qu’est ce que les données alternatives ?!
Données alternatives
Les données alternatives représente toute forme de données pouvant être utilisées par les analystes financiers pour évaluer un titre ou un marché. En principe, ces données proviennent de sources de données autre que les sources habituelles.
Une sources de données habituelle peut inclure des bilans financiers, des rapports réglementaires, des communiqués de presse et présentations d’entreprise, etc. Cependant avec l’essor fulgurant des «Big Data» et de «Data Science» ces dernières années, on constate une explosion de sources de données alternatives.
Parmi les données alternatives fournit, on a :
- Transactions par carte de paiement
- Imagerie satellite / GPS
- Trafic aérien, maritime et ferroviaire
- Réseaux sociaux
- Tendances sur internet
- Nouvelles immatriculations de voitures
Dans un environnement d’investissement très concurrentiel, l’analyse de ces données peut donner un avantage concurrentiel non négligeable.
Ouvrir un compte sur Quandl
Pour commencer à utiliser Quandl, il faut d’abord créer un compte en suivant les étapes suivantes:
- Renseigner votre nom et prénom
- Entrez l’adresse email et choisir Personal dans “How will you use this data”
- Choisir un mot de passe
- Cliquer sur ‘Create account’
Vous allez recevoir dans les secondes qui suivent un email de confirmation. Vous devez cliquer sur le lien de validation.
Maintenant vous pouvez vous connectez à votre nouveau compte Quandl. D’abord, vous verrez votre vue Tableau de bord.
Le tableau de bord vous permet de voir toutes les données disponibles sous différentes catégories.
API de Quandl
Maintenant qu’on ait un compte sur Quandl, nous allons voir comment l’utiliser. Premièrement, nous allons voir comment générer la clé API
Clé API Quandl
Avant d’utiliser l’API de Quandl, on doit commencer par vérifier la clé cliente de l’API.
Accédez à la page “Account Settings” de votre compte Quandl:
Maintenant, la chaîne de caractère affichée à l’écran représente la clé API.
On va, maintenant, se pencher sur la configuration sur Python.
API Python
Dans cette partie de l’article, nous allons voir comment configurer l’API sur Python. Pour Cela, suivez les étapes suivantes :
1- Installation de Python
Assurez-vous d’avoir installer Python sur votre machine. Si ce n’est pas le cas, installez-le en suivant le tutoriel sur Youtube.
2- Installation de la librairie Quandl
Après avoir installé python, nous devrons installer la librairie Quandl avant d’essayer d’obtenir des données.
Python est fourni avec un outil appelé pip qui simplifie l’installation. Donc, il suffit d’exécuter la ligne suivante pour installer Quandl
pip install quandl
3- Premier script
Ce premier script va surtout nous permettre de tester que tout est bien configuré.
- Créer un dossier de travail
- Ouvrer le terminal de commande et taper “python” pour accéder à l’environnement Python
- Importer l’API Quandl et s’assurer que notre clé d’API est définie.
import quandl quandl.ApiConfig.api_key = ‘sufaEEBSq6gtFfX2SyXX’
- Maintenant, on va récupérer des données sur les contrats d’Or
data = quandl.get(‘CME/GCJ2020`) print(data)
- On enregistre les données récupérées sur un fichier Csv
data.to_csv(‘c:\quandl\GCJ2020.csv’)