En s'engageant dans l'optimisation des processus commerciaux à l'aide de réseaux neuronaux (systèmes anti-fraude, robots de trading), nous pouvons conclure que l'intégration de systèmes avec apprentissage automatique peut améliorer considérablement les avantages concurrentiels du marché.
L'une des caractéristiques des réseaux neuronaux est qu'ils sont capables d'apprendre à améliorer leur efficacité.
Il existe une masse énorme de réseaux neuronaux et différents types d'apprentissage, mais les principales approches d'apprentissage sont les suivantes :
- Les réseaux neuronaux, étudiants avec un professeur ;
- Les réseaux neuronaux, étudiants sans professeur.
Les réseaux neuronaux à l'étude avec un professeur
L'apprentissage supervisé implique la disponibilité d'un ensemble complet de données balisées pour former un modèle à toutes les étapes de sa construction.
La présence d'un ensemble de données entièrement marqué signifie que chaque exemple de l'ensemble d'apprentissage correspond à la réponse que l'algorithme doit recevoir. Ainsi, un ensemble de données marqué avec des photos de fleurs va entraîner un réseau de neurones composé de roses, de marguerites et de jonquilles. Lorsque le réseau reçoit une nouvelle photo, il la compare aux exemples de l'ensemble de données d'apprentissage pour prédire la réponse.
Fondamentalement, l'apprentissage est utilisé pour résoudre deux types de problèmes : la classification et la régression.
Dans les problèmes de classification, l'algorithme prédit des valeurs discrètes correspondant aux numéros des classes auxquelles les objets appartiennent. Dans un exemple d'apprentissage de données avec des photographies d'animaux, chaque image aura une étiquette correspondante, par exemple un chat, un koala ou une tortue. La qualité de l'algorithme est estimée en fonction de la précision avec laquelle il peut classer correctement de nouvelles photos avec des koalas et des tortues.
Mais les tâches de régression sont associées à des données continues. Un exemple, la régression linéaire, calcule la valeur attendue de la variable y, en tenant compte des valeurs spécifiques de x. (À propos, les méthodes de régression linéaire sont largement utilisées en statistiques).
Les tâches d'apprentissage automatique plus utilitaires impliquent un grand nombre de variables. Par exemple, un réseau neuronal qui prédit le prix d'un appartement dans une ville en fonction de sa taille, de son emplacement et de l'accessibilité des transports publics. L'algorithme fait le travail d'un expert qui calcule le prix d'un appartement sur la base des données obtenues.
On peut conclure que les réseaux neuronaux qui étudient avec un enseignant sont plus efficaces lorsqu'il existe un grand échantillon de données fiables.
Réseaux neuronaux, étudiants sans l'aide d'un professeur
Il est parfois difficile d'obtenir un grand nombre de données propres et fiables. Par conséquent, l'algorithme doit trouver des réponses inconnues jusqu'alors. Dans cette situation, nous avons affaire à des réseaux de neurones formés sans professeur.
Dans une formation sans enseignant, le modèle dispose d'un ensemble de données, et il n'y a pas d'indication claire de ce qu'il faut en faire. Le réseau neuronal tente de trouver de manière autonome des corrélations dans les données, en extrayant des signes utiles et en les analysant. (Lors de l'écriture d'un robot de trading pour le pool d'investissement du projet Range.Trade, le réseau neuronal a trouvé beaucoup de spécialistes non identifiés entre les phases du marché et les indications des indicateurs personnalisés).
Regroupement des données sur la base de caractéristiques communes
En fonction de la tâche, le modèle organise les données de différentes manières.
- Regroupement. L'algorithme trouve des caractéristiques communes dans un échantillon de données et les divise.
- Détection d'anomalies. Les banques peuvent détecter des transactions frauduleuses en identifiant des actions inhabituelles dans le comportement d'achat des clients. Par exemple, il est suspect qu'une carte de crédit soit utilisée dans une ville et après 5 minutes dans une autre, située à 3000 km de la première. Les systèmes anti-fraude que nous avons écrits pour nos clients sont un exemple de ce type de système.
- Associations. Certaines caractéristiques de l'objet sont en corrélation avec d'autres signes. En considérant certaines caractéristiques clés d'un objet, le modèle peut en prédire d'autres avec lesquelles il existe une relation.
- Auto-encodeurs. Les auto-codeurs prennent des données d'entrée, les codent, puis essaient de recréer les données d'origine à partir du code résultant. Il n'y a pas beaucoup de situations réelles où l'on peut utiliser un auto-codeur simple. Mais il est utile d'ajouter des couches et des fonctionnalités qui se développent : en utilisant des versions d'images bruitées et originales pour la formation, les auto-codeurs peuvent supprimer le bruit des données vidéo, des images ou des scans médicaux pour améliorer la qualité des données.
Dans une formation sans enseignant, il est difficile de calculer la précision de l'algorithme car il n'y a pas de "bonne réponse" ou de marqueur dans les données. Mais les données marquées sont souvent peu fiables ou trop chères à obtenir. Dans ce cas, en donnant au modèle la liberté de rechercher des dépendances, vous pouvez obtenir de bons résultats. Nous avons utilisé l'approche par les données pour former l'algorithme du plus court chemin en utilisant la méthode d'optimisation formique. Pour s'amuser.
Pour savoir si cette tâche se prête à une optimisation par des réseaux neuronaux, vous pouvez consultez-nous.