Forex Daily Ohlc Data Mining


Mineração de dados de uma estratégia Forex Majors Devido às características únicas de diferentes pares de moedas, muitas estratégias quantitativas de Forex são projetadas com um par de moedas específicas em mente. Embora isso possa produzir muitas estratégias de negociação lucrativas, também há vantagens em desenvolver estratégias que podem ser negociadas em vários pares de moedas. Isso introduz um elemento de diversificação que pode fornecer um nível adicional de proteção contra desvantagem. Daniel Fernandez publicou recentemente um sistema que ele projetou para negociar em cada um dos quatro maiores de Forex. Seu objetivo era encontrar um sistema que teria produzido um histórico de 20 anos de negociação rentável em EURUSD, GBPUSD, USDJPY e USDCHF. Daniel usa uma abordagem de mineração de dados para desenvolver uma estratégia para negociar as quatro principais divisas. Para construir seu sistema, Daniel usou seu software de mineração de dados para definir sinais de entrada e saída que teriam produzido uma estratégia de negociação lucrativa em cada um dos quatro pares de moedas nos últimos 20 anos. O que ele aparece é uma combinação de três regras baseadas em preços que formam a base de sua estratégia Forex Majors. Daniel8217s Forex Majors Strategy Daniel8217s A estratégia Forex Majors é muito simples na medida em que sempre tem uma posição, longa ou curta, em cada um dos quatro pares de moedas que negocia. Baseia todas as suas negociações em gráficos diários. A estratégia vai longa quando as três condições seguintes são atendidas: a estratégia é curta quando as três condições seguintes são atendidas: como você pode ver, a estratégia é basicamente uma estratégia otimizada seguindo a estratégia. Isso faz sentido, porque Daniel afirma no início de seu artigo que a tendência de longo prazo seguindo as estratégias são geralmente as melhores estratégias para negociar múltiplos mercados. Uma regra adicional que a estratégia de Daniel8217s usa é uma parada-perda baseada em ATR. A perda de parada fixa é definida em 180 da ATR de 20 dias. Se a perda de parada for disparada, a estratégia permanece fora do mercado até que um sinal seja gerado na direção oposta. O teste indica que a reintrodução em um sinal na mesma direção afetou negativamente o desempenho. Backtesting Performance Os resultados de backtesting que Daniel incluiu em sua publicação mostram que a estratégia foi bastante lucrativa. Produziu um índice de ganhos de 45, um fator de lucro de 1,38, e um índice de recompensa para risco de 1,68. A maior preocupação de Daniel8217 sobre a estratégia foi que o período de retirada máxima representava um tempo muito longo. De acordo com os números de Daniel8217s, o retorno anual médio foi de 9,67. Isso consistiu em 16 anos rentáveis, 4 anos perdidos e um ano que basicamente se rompeu. O melhor ano foi um retorno de 37,76, eo pior ano foi uma perda de 20,2. Daniel observa que este sistema não representaria uma boa estratégia autônoma por causa de seus retornos em relação a remessas máximas. No entanto, ele sugere que poderia ser uma peça interessante de uma estratégia maior e multi-sistema. Cloud Data-mining dentro de Asirikuy: buscando sistemas de negociação em um ambiente comunitário. Se você quiser procurar sistemas de negociação usando a mineração de dados, você irá Em breve enfrenta problemas relacionados com a intensidade computacional da tarefa em questão. Mesmo espaços de lógica simples (como duas regras baseadas em ação de preço) podem conter milhões de combinações de sistemas potenciais e testar todas elas é fundamental para a descoberta de estratégias que valem a pena negociar. No entanto, a descoberta de sistemas em dados reais é apenas o início do problema, uma vez que encontrar se essas combinações surgiram devido ao viés de mineração de dados (DMB) ou verdadeiras ineficiências históricas exige ainda mais poder computacional. Hoje vou falar sobre como decidimos abordar o problema da intensidade computacional no Asirikuy e como desenvolvemos uma implementação de mineração de dados em nuvem que nos permite buscar novos sistemas como uma comunidade comercial, juntando esforços para encontrar sistemas que se beneficiem Nós como um todo, ajudando-nos a entender melhor a forma como a mineração de dados funciona e nos permite explorar opções que, de outra forma, seriam muito caras para qualquer pessoa explorar. Começarei com uma breve descrição do problema em questão, seguindo nossa solução e os benefícios potenciais que nos levarão a aguardar. Por que a mineração de dados é tão cara Imagine que você queria encontrar um sistema que funcione em 25 anos de dados diários (cumpre algumas preferências estatísticas) e você deseja restringir seu espaço de pesquisa a sistemas que utilizam 2 regras baseadas em ação de preço (comparações simples entre dados OHLC ) Que contêm valores de OHLC com turnos entre 1 e 50, com um tamanho de passo de 2. Você sabe que deseja restringir o risco por comércio, de modo que o sistema que você deseja gerar deve ter uma tabela de trabalho que pode variar entre 0,5 e 2 vezes o diário ATR com 0,5 passos. Este conjunto simples de opções oferece-lhe quase 150 milhões de sistemas possíveis, que você precisaria testar novamente para obter algumas estatísticas e saber se o sistema é ou não vale a pena considerar para negociação ao vivo. Usando algo como nossa implementação inicial do kantu (que leva aproximadamente 3 milissegundos para cada teste), você precisaria aproximadamente 5 dias para completar o teste. Usando o PKantu, nossa implementação mais recente, que usa OpenCL e GPUs para back-testing, levaria aproximadamente 50 minutos (0.0056 milissegundos por teste). Você pensaria então que o PKantu resolve o problema, porque nos permite obter resultados rapidamente, mesmo para grandes espaços de lógica, mas a questão aqui também é que, para saber se um sistema vale a pena ser comercializado, também precisamos avaliar DMB . A avaliação do DMB envolve a geração de muitas séries de dados aleatórios usando o bootstrapping com substituição e a mineração nesses dados, o que significa que você precisa executar o experimento acima N vezes, onde N é o número de séries de dados aleatórias que deseja executar testes em. Uma vez que você deseja que seus resultados convertem 8211 alcançar uma distribuição estável de sistemas gerados em dados aleatórios 8211, isso geralmente implica gerar sistemas em séries de dados 50-100, o que aumenta consideravelmente os custos computacionais. Usando o exemplo acima, o exame de DMB em PKantu (50 séries de dados aleatórios) leva aproximadamente 2 dias de trituração computacional. Se você estiver procurando por gerar sistemas em prazos mais baixos ou em espaços lógicos maiores, então você está procurando períodos de semanas ou meses cruéis para realizar corretamente uma análise, sem garantia de que resultados levem a algo a negociar. Por outro lado, se você tem uma comunidade comercial, realizar esforços de mineração de dados individuais é altamente subóptimo, já que provavelmente estamos interessados ​​em coisas semelhantes. Se for esse o caso, então, faz muito sentido se juntar ao poder computacional e se concentrar na solução de um conjunto de problemas relevantes para a comunidade como um todo, contribuindo para a descoberta e avaliação de novos sistemas de negociação ao vivo. Nesse espírito, desenvolvemos uma interface de mineração de dados em nuvem que permite que os membros da Asirikuy realizem esforços de mineração de dados que beneficiem toda a comunidade. O servidor possui uma implementação de banco de dados que contém todas as experiências relevantes e a pessoa que deseja contribuir só precisa executar um script que obtenha automaticamente o experimento que precisa ser executado e executado no computador do person8217s. Cada pessoa contribui com uma geração de geração de sistema em dados reais ou aleatórios de cada vez e esses resultados são enviados ao servidor, automaticamente anexados e analisados ​​automaticamente para gerar resultados que podem ser facilmente vistos e analisados ​​por toda a comunidade. Uma vez que a análise do DMB depende da convergência da distribuição de sistemas gerados em dados aleatórios, cada contribuição adicional ajuda a refinar os resultados e nos fornece novas informações. Desta forma, as pessoas não precisam ter tempo para analisar os resultados dos seus próprios resultados, mas eles simplesmente podem contribuir com o poder computacional bruto eo ambiente de nuvem que criamos na Asirikuy faz o resto. No final, podemos executar coisas que são inviáveis ​​para concorrer a uma única pessoa, podemos obter resultados para muitas experiências diferentes em apenas alguns dias (mesmo que apenas 10 pessoas estejam contribuindo) e também podemos unir esforços para obter resultados Para um único experimento com alto custo computacional (por exemplo, um espaço lógico com 1800 milhões de sistemas). O melhor é que os esforços são centralizados e, portanto, não devemos realizar as mesmas experiências 20 vezes (o que acontece quando todos fazem as coisas por conta própria), mas as experiências são realizadas de forma centralizada e todos podem se beneficiar da resultados. Além disso, os resultados são ordenadamente organizados dentro de uma implementação de banco de dados, por isso é muito fácil obter estatísticas para experiências. Este esforço de mineração de dados da nuvem será a pedra angular do Repositório do Sistema de Negociação da Asirikuy, que contém sistemas de negociação derivados da mineração de dados (verificados para representar verdadeiras ineficiências históricas) e permite que os membros escolham um portfólio que se encaixe em seus próprios objetivos comerciais. Nosso repositório de sistema será o tópico de uma publicação futura: o). Se você quiser saber mais sobre a mineração de dados e como você também pode contribuir para um esforço de mineração de dados baseado em nuvem, considere se juntar ao Asirikuy. Um site cheio de vídeos educacionais, sistemas de negociação, desenvolvimento e uma abordagem sólida, honesta e transparente para negociação automatizada em geral. Espero que tenha gostado deste artigo. O)

Comments

Popular Posts