Como destruir uma base militar utilizando Machine Learning.
Aplicação de algoritmos de classificação Naive Bayes e Análise Discriminante Quadrática na Guerra Moderna.
Devido aos conflitos recentes, conceitos como o da Guerra Eletrônica ganham destaque em discussões a respeito das estratégias militares na tomada ou na defesa territorial. O ato de um soldado ucraniano ligar o seu telefone celular pode atrair uma chuva de estilhaços de fogo, ocasionado por radares de artilharia e controles remotos de veículos aéreos não tripulados.
A Guerra Eletrônica (GE) é o conjunto de ações envolvendo o uso do espectro eletromagnético ou de energia dirigida para aumentar as capacidades de uma força armada, aprimorar a consciência situacional no Teatro de Operações e obter efeitos ofensivos e defensivos. Essa tecnologia é usualmente utilizada por artilharias, caças, mísseis de cruzeiro, drones e entre outros meios para garantir ou impedir o emprego hostil de uma determinada força militar.
E como que a GE pode está ligada com o Aprendizado de Máquinas (ML)?
A Defense Brief Editorial divulgou em abril de 2020 que a empresa de tecnologia alemã, Hensoldt, concluiu o desenvolvimento de um novo sistema modular de combate eletrônico aerotransportado baseado em Inteligência Artificial (IA).
Kalætron Attack, nome dado ao sistema, neutraliza os radares de controle de fogo do inimigo em diferentes distâncias, permitindo que ataques possam ser deferidos diretamente a um alvo de interesse.
O sistema utiliza hardware digitalizado e inteligência artificial para detectar ameaças baseadas em radar às forças aéreas em tempo recorde e neutralizá-las com contramedidas eletrônicas direcionadas.
Hensoldt explica que o design digital permite que o Kalætron Attack detecte e identifique posições de defesa aérea muito rapidamente em uma ampla faixa de frequência. A unidade usa técnicas de IA para reconhecer novos padrões de ameaças de um conjunto de pulsos coletados. Isso é especialmente importante para identificar os mais recentes sistemas de radar de defesa aérea que cobrem uma faixa de frequência extremamente ampla ou saltam entre frequências específicas em frações de segundo.
Aproveitando o contexto mencionado, o objetivo deste artigo é apresentar os conceitos e a aplicação das técnicas de Machine Learning baseadas nos modelos de Naive Bayes (NB) e de Análise Discriminante Quadrática (QDA) de forma a descrever o comportamento do sistema do Kalætron Attack.
Os modelos de classificação baseados em NB e QDA foram escolhidos por serem modelos de fácil construção, de rápida solução e sem a necessidades de inserir hiperparâmetros, porém o leitor pode reproduzir o estudo com qualquer outro classificador.
Naive Bayes (NB)
O algoritmo Naive Bayes é utilizado no aprendizado de máquinas supervisionado, baseado no Teorema de Bayes (proposto por Thomas Bayes) que tem como objetivo encontrar a probabilidade a Posteriori, probabilidade condicionada que é atribuída a partir da análise dos eventos passados.
O classificador bayesiano simplifica o aprendizado assumindo que os atributos são independentes. Embora a independência seja geralmente uma suposição, na prática, o Naive Bayes compete bem contra classificadores mais sofisticados e é atualmente utilizado em classificação de texto, diagnóstico médico e sistemas de gerenciamento de desempenho.
Seu algoritmo é baseada na equação proposta por Bayes:
Portanto, para determinar a hipótese máxima da probabilidade posteriori (MAP) de um determinado evento, basta aplicar a seguinte equação:
Logo, para um classificador de duas classe, se P(W1|x)>P(W2|x) for verdadeiro, então a observação será classificada como w1, caso contrário, será classificada como w2.
Análise Discriminante Quadrática (QDA)
O classificador DA foi introduzido por R. Fisher e foi usado em muitos problemas de classificação por ser básico e simples de implementar. Existem dois tipos de classificador DA, o classificador baseado em análise discriminante linear (LDA) e o baseado em análise discriminante quadrática (QDA). Para o nosso estudo, será focado na QDA.
A QDA nada mais é que um modelo matemático que utiliza funções discriminantes para determinar os limites de decisão e regiões para cada classe de forma não-linear.
Essas funções descriminates seguem o mesmo princípio do teorema de Bayes e comumente assume que P(x|w) é proveniente de uma distribuição normal, logo:
onde, μi representa a média e ∑i a matriz de covariância da i-ésima classe, |∑i| e ∑(−1)i a determinante e a inversa da matriz de covariância, respectivamente, e m o número de atributos ou o número de variáveis de uma amostra (x).
Dessa forma, para chegar à borda de decisão e a região de duas classes, podemos resumir as equações da seguinte forma.
onde,
desta forma,
O processo descrito acima pode ser resumido, conforme a figura abaixo:
Não se preocupe com as fórmulas matemáticas, a biblioteca Scikit-Learn torna tudo isso mais fácil. 😉
Metodologia
Após o entendimento dos conceitos fundamentais que dão suporte a este artigo, será utilizada a metodologia de construção de modelos de Machine Learning utilizando softwares de linguagem de programação em Python da seguinte forma:
O primeiro processo será o de seleção de dados com base nas características descritas no Defense Brief Editorial sobre o Kalætron Attack. Após, será feita uma análise exploratória dos dados para entender o comportamento das variáveis preditivas, e em seguida serão construídos dois modelos de Machine Learning frente aos dados de treino, um baseado no algoritmo do Naive Bayes e outro da Análise Discriminante Quadrática. Por fim, o modelo que apresentar melhor resultado será validado pelo o conjunto de teste.
Seleção de dados
O dataset selecionado possui 2000 registros de emissões eletromagnéticas, dividido em 3 variáveis, sendo elas, duas variáveis preditivas e uma variável alvo:
Variável Alvo: Definido por “A” e “E”.
Onde a classe “A” representa radares de Defesa Aérea, uma ameaça iminente e que precisam ser neutralizada, e a classe “E” que representa radares de Vigilância Aérea, e assim, não oferece uma ameaça direta.
Variáveis preditivas:
- FREQ: Frequência de ondas em MHz.
- PRF: Frequência de repetição de pulsos em PPS.
O modelo proposto visa classificar, a partir das variáveis FREQ e PRF, se a emissão eletromagnética é uma possível ameaça que precisa ser neutralizada. Abaixo segue a visualização do banco de dados.
A intenção deste artigo não é demonstrar as técnicas de pré-processamento dos dados. Essa etapa foi realizada previamente, sendo assim, o dataset em questão, está balanceado e ausente de valores nulos.
Análise Exploratória dos Dados
A visualização gráfica abaixo contribui para que seja analisado o comportamento das classes em relação as variáveis preditivas.
Observado o histograma da variável PRF é possível perceber que os dados apresentam previsibilidade pela distância entre suas médias, e com o Scatter plot pode-se verificar regiões de classificação.
Construção do Modelo
Nesta etapa os dados serão divididos em treino e teste, respeitando uma proporção de 70/30, respectivamente. Em seguida, os dados de treino serão modelados pelos dois algoritmo em 10 Folds (Cross-Validation), e o modelo que obtiver a maior acurácia média, ou seja, aquele que apresentar a melhor performance geral em relação a quantidade de amostras classificadas corretamente, será selecionado para validação.
Outra facilidade dos modelos de classificação baseados em NB e QDA é que eles não precisam de padronização e nem normalização dos dados. Os resultados dos modelos seguem abaixo.
QuadraticDiscriminantAnalysis: Accuracy: 0.883 STD: 0.025
GaussianNB: Accuracy: 0.804 STD: 0.031
Verifica-se que, utilizando a acurácia como métrica, o classificador QDA obteve uma melhor performance em relação ao NB.
Entendendo os conceitos de ambos os classificadores é possível compreender o por que da performance da QDA ser melhor para esse conjunto de dados. Apesar dos dois classificadores serem paramétricos, somente a QDA leva em consideração a covariância, o que permite que as bordas de de decisão ganhem inclinação de forma a se aderir melhor aos dados.
Esse conceito pode ser observado nas figuras abaixo:
Validação
Após selecionar a Análise Discriminante Quadrática como o melhor modelo, agora será validado a sua performance frente aos dados de teste.
O modelo apresentou um acurácia de 90% ao classificar corretamente as emissões eletromagnéticas, e uma precisão capaz de identificar 92% das emissões provenientes de sistemas de Defesa Aérea, não identificando 8% das ameaças iminentes que deveriam ser neutralizadas.
Uma forma de melhor a precisão seria diminuir o critério de classificação (default 50%), ajudando a identificar as emissões duvidosas, ou seja, aquelas que estão próximas de 50% de probabilidade de serem uma ameaça.
Alterando o critério de classificação para “A”, quando uma EM estiver acima de 40% de probabilidade de ser proveniente de um sistema de Defesa Aérea, obtém-se 96% de precisão e um baixo trade-off com os falsos positivos, que aumentaram em 1%, totalizando 13%.
Conclusão
É possível verificar que a ciência de dados está cada vez mais presente na guerra moderna. Saber que o sistema tem 96% de precisão em identificar ameaças e 13% de falsos positivos pode ser uma informação primordial para os comandantes definirem a quantidade de aeronaves e de armamento a serem empregados, de forma a tornar possível a garantia do sucesso da missão.
Neste artigo foi possível entender o funcionamento prático de dois classificadores baysianos paramétricos que possuem boa performance, apesar da sua simplicidade.
Desta forma, fica a curiosidade: quais são as capacidades de precisão do sistema de inteligência artificial do Kalætron Attack? Será que o sistema apresenta valores altos de falsos positivos em prol de uma precisão maior?
Referências
Defense Brief Editorial. Germany’s Hensoldt unveils new AI-based electronic warfare jammer. 2020.
RISH, Irina et al. An empirical study of the naive Bayes classifier. In: IJCAI 2001 workshop on empirical methods in artificial intelligence. 2001. p. 41–46.
THARWAT, Alaa. Linear vs. quadratic discriminant analysis classifier: a tutorial. International Journal of Applied Pattern Recognition, v. 3, n. 2, p. 145–180, 2016.
Segue o link do Linkedin para demais interações ou dúvidas sobre o assunto, e o Github para quem desejar visualizar os códigos utilizados.
Linkedin: https://www.linkedin.com/in/bruno-brasil-8a34101b6/
Github: https://github.com/brunobf09