• STAN

Conheça STAN

Olá! nós somos STAN.


Trabalhamos com dados e com futebol, exatamente nessa ordem. Nossa proposta é trazer um novo jeito de entender futebol através do que existe de mais avançado no campo de estatística e ciência de dados. Não estamos falando simplesmente de analisar quantidade de passes certos, chutes, desarmes, gols, etc. Estamos falando em aplicar modelos de aprendizado de máquina que usam tudo isso (e muito mais) para criar métricas que consideram tudo o que o jogador fez em campo para calcular precisamente quanto ele ajudou seu time.


A coleta de dados no futebol tem avançado bastante nos últimos anos, ao ponto de hoje termos volumes incríveis de informação em toda partida. Apesar disso, hoje em dia quase todas as análises feitas ficam muito longe de sequer raspar a superfície da informação que esses números podem nos dar. A grande maioria do que vemos de "estatística" em futebol por aí costuma ser muito superficial e por mais que envolvam números, acabam usando eles simplesmente como critérios subjetivos, isso quando não é só um meio de comprovar uma opinião simplista (por exemplo, o jogador A fez 10 gols enquanto o jogador B fez 7, logo o jogador A é melhor que o B). Por favor, não confunda esse tipo de análise com o que fazemos por aqui.


O futebol é um esporte muito complexo. Dentro de campo, cada detalhe pode fazer a diferença. São infinitas combinações de táticas, características de jogadores, estilos de jogo e estratégias que duelam entre si em uma partida. A palavra chave para se começar a interpretar o futebol corretamente é o contexto. É ai que o uso de técnicas de aprendizado de máquina (ou machine learning em inglês) entra. Esse tipo de técnica é amplamente usada e estabelecida nas mais diversas indústrias. Através de diversos algorítmos, os modelos de machine learning conseguem observar um grande volume de dados, aprender como eles funcionam ao identificar padrões de comportamento e traçar relações entre as estatísticas e resultados reais gerados por elas. Dessa forma, os modelos conseguem se adaptar aos mais diversos contextos e analisar a fundo o que acontece até nos casos mais particulares, tudo isso sem sofrer com nenhum tipo de opinião subjetiva.


O que fazemos aqui é justamente trazer para o futebol o que existe de melhor no campo da ciência de dados. Temos vários modelos de machine learning que nos permite calcular coisas que para muita gente seria impossível de se medir. Entre nossas principais métricas temos:


VAM - Vitórias Acima da Média: Quanto a probabilidade de vitória do time é maior se usar um jogador ao invés de um jogador médio da posição. Para quem conhece esportes americanos, essa métrica é uma versão de futebol do WAR. Um jeito simples de interpretar o VAM é como sendo o quanto as chances do time vencer são maiores por ter um determinado jogador em campo ao invés de se fosse um outro qualquer em seu lugar.


VAE - Vitórias Além do Esperado: Quanto o jogador superou as expectativas. Baseado na performance de seus companheiros, sobretudo os mais próximos taticamente, medimos quanto seria esperado de um jogador, em termos de probabilidade de vitória gerada e comparamos com quanto de fato ele gerou.


PV - Probabilidade de Vitória: Baseado em tudo que um jogador fez dentro de campo, qual a probabilidade do time ter vencido o jogo. Em outras palavras, se o desempenho do time dependesse só dele, ou seja, se todos jogassem no mesmo nível que ele, qual seria a chance do time ter vencido o jogo.


MPC - Melhora de Performance do Companheiro: Quanto a performance de um colega de time muda por causa da atuação de um jogador. Ou seja, quanto um jogador consegue melhorar a performance dos seus companheiros.


PGM - Probabilidade de Gols Marcados: Baseado em tudo que um jogador fez dentro de campo, qual a probabilidade do time ter feito gols. Similar ao PV, mas focado no desempenho ofensivo, medindo a probabilidade do time ter feito gols, ao invés de ter vencido.


PGS - Probabilidade de Gols Sofridos: Baseado em tudo que um jogador fez dentro de campo, qual a probabilidade do time não ter sofrido gols. Similar ao PV, mas focado no desempenho defensivo, medindo a probabilidade do time ter mantido o clean sheet.


PPB - Probabilidade de Posse de Bola: Baseado em tudo que um jogador fez dentro de campo, qual a probabilidade do time ter dominado a posse de bola. Similar ao PV, mas focado no domínio do jogo.


Enfim, isso é um pouco do que fazemos. É uma proposta nova e diferente. Nós viemos de fora do meio de futebol, com experiência acadêmica e profissional em algumas das maiores empresas do mundo. As técnicas que empregamos são similares à diversas abordagem de sucesso nos mais distintos setores, desde finanças até medicina. Pode ser que ás vezes o jeito tradicional de se interpretar o futebol se sinta de certa forma ameaçado pela mudança que estamos propondo, afinal, com o pouco de "estatística" que já existe, é comum o discurso de que os números são frios, não enxergam o todo, números não consideram o contexto, etc. No fundo esse discurso é verdadeiro, mas o problema não está nos números, e sim na forma que eles vinham sendo utilizados. Os nossos números vão fundo e trazem significado real, considerando contexto e relações que talvez nem o melhor analista humano conseguiria perceber sozinho. Não nos colocamos como verdade absoluta, afinal somos os primeiros a admitir que ainda é só o começo e vamos evoluir ainda mais com o tempo. Mas pode ter certeza que o que trazemos são informações objetivas, precisas, completas, profundas e verdadeiras, até porque o que não falta é ciência avançada sendo usada em nossos métodos, além de frequente monitoramento, para sempre ter certeza que nossos números refletem corretamente o que acontece em campo. Nós nos atemos aos fatos e sabemos usa-los, não dependendo de preferências, opiniões pessoais ou subjetividade de.


Por tudo isso, te convidamos a acompanhar nosso trabalho. Conheça o que é estatística de verdade e veja um novo jeito de entender o futebol.










5 visualizações0 comentário