SlideShare uma empresa Scribd logo
1 de 23
Baixar para ler offline
Trabalho apresentado para obtenção do título de especialista em
Data Science e Analytics – 2022
1
Dados da Rede CAN Bus para Avaliação do Comportamento do Operador de Colheita
Florestal utilizando Ferramentas de Data Science
Dennis Bernardi ¹*; Fernando Vasconcelos2
1
Suzano S/A. Consultor Excelência Operacional - Transformação Digital, Geotecnlogias e Analytcs. Rod. General
Euryale de Jesys Zerbine, Km 84; 12310-123 Jacareí, SP, Brasil
2
Orientador, USP/Esalq. Doutorando FEA/USP. Universidade de São Paulo Avenida Professor Luciano Gualberto,
908, Butantã. São Paulo/SP. CEP: 05508-010 Fortaleza, Ceará, Brasil
Trabalho apresentado para obtenção do título de especialista em
Data Science e Analytics – 2022
2
Dados da Rede CAN Bus para Avaliação da Comportamento do Operador de Colheita
Florestal utilizando Ferramentas de Data Science
Resumo
O presente Trabalho de Conclusão de Curso [TCC], objetivou avaliar a utilização de
dados da rede CAN Bus de Harvesters Florestais, através de técnicas de data mining e
machine learning, obtendo insigths operacionais relacionados ao consumo de diesel. A CAN
Bus, nos entregou 59 variáveis, optamos por avaliar a correlação de Pearson de 15 variáveis
com o consumo de diesel, sendo que 5 apresentaram correlação positiva (Engine Percent
Load At Current Speed, Actual Engine - Percent Torque, Accelerator Pedal Position 1, Engine
Speed e Engine Torque Mode), como variáveis independentes elaboramos equações
múltiplas, para representar o comportamento da variável dependente, consumo de diesel
(L/hora), porém com baixa correção. Então buscamos a utilização de técnicas de Machine
Learning, K-NN (K-Nearest Neighbors), usando as mesmas 5 variáveis, classificar os
operadores como Operador Ótimo e Operador Oportunidade, obtendo-se uma acurácia
superior a 90%. Demonstramos assim que os dados da rede CAN Bus dos Harvesters, tem
grande potencial para auxiliar na tomada de decisão operacional, bem como apoiar na
classificação dos operadores, focando os treinamentos nos operadores que realmente
necessitam. Também podemos notar que uma melhor gestão do diesel, podem contribuir com
a redução de custos operacionais, além de contribuir para questões relacionadas aos temas
ESG, tornando os custos de implantação da tecnologia de leitura da CAN Bus, viáveis
operacionalmente. Oportunidades ficam para no futuro próximo também lermos dados da
CAN Bus do Joystick das máquinas, assim podemos traçar ainda melhor o perfil
comportamental dos operadores, contribuindo ainda mais para a Excelência Operacinal
florestal.
Palavras-chave: Colheita Florestal; Machine Leaning; CAN Bus; K-NN.
CAN Bus Network Data for Forest Harvesting Operator Behavior using Data Science
Tools
Abstract
This TCC evaluate the use of data from the CAN Bus network of Forestry Harvesters,
through data mining and machine learning techniques, to obtain operational insights related to
diesel consumption. CAN Bus gave us 59 variables, we chose to evaluate the Pearson
correlation of 15 variables with diesel consumption, 5 of which showed a positive correlation
(Engine Percent Load At Current Speed, Actual Engine - Percent Torque, Accelerator Pedal
Position 1, Engine Speed and Engine Torque Mode), as independent variables we seek to
elaborate multiple equations, which represent if the behavior of the dependent variable, diesel
consumption (L/hour), the result showed a low correction. So we started using the Machine
Learning technique, K-NN (K-Nearest Neighbors), to classify the operators as Excelente
Operator and Opportunity Operator from this variables, where we obtained an accuracy greater
than 90%. We thus demonstrate that the use of data from the Harvesters CAN Bus network
has great potential to assist in operational decision making, as well as to support the
classification of operators who have the greatest need for training of others, thus focusing
training on operators who really need it. We can also notice that better diesel management
can contribute to the reduction costs, addition to contributing to ESG, making the costs of
implementing the CAN Bus reading technology operationally viable. Opportunities remain for
the near future to also read CAN Bus data from the machines' Joystick, so we can better trace
the behavioral profile of operators, contributing even more to Forest Operational Excellence.
Keywords: Forest Harvesting; Machine Leaning; CAN Bus; K-NN.
Trabalho apresentado para obtenção do título de especialista em
Data Science e Analytics – 2022
3
Introdução
O setor de árvores plantadas atua há anos com produção sustentável, provendo
inúmeros produtos de origem renovável essenciais para o dia a dia das pessoas como móveis,
livros, pisos laminados, painéis de madeira, papéis higiênicos e embalagens. Além de prover
o hoje, essa indústria também está de olho no futuro, investindo em pesquisa e inovação para
oferecer cada vez mais bioprodutos ou biomateriais da economia circular, biodegradáveis e
recicláveis (IBÁ, 2021).
Com posição de destaque no desenvolvimento de uma economia de baixo carbono, o
setor de base florestal é destacado por sua alta produtividade, tecnologia incorporada,
melhores práticas de manejo florestal, responsabilidade social e modernas instalações
produtivas. Com uma área total de árvores cultivadas somando 9 milhões de hectares, atua,
comumente, em áreas anteriormente degradadas pela ação humana. Com um olhar
cuidadoso para o meio ambiente, o setor conta com 5,9 milhões de hectares destinados para
Áreas de Preservação Permanente [APP], Reserva Legal [RL] e Reservas Particulares do
Patrimônio Natural [RPPN] (IBÁ, 2021).
Dentro desses 9 milhões de hectares, vivemos em um momento de grande
modernização no sistema de Colheita Florestal, destacando-se dentro os diferentes sistemas
cut-to-length, o qual consiste em um sistema de colheita mecanizada no qual as árvores são
desgalhadas e processadas em toras atendendo à demanda fabril. Tal sistema é composto
do conjunto de máquinas Harvester e Forwarder.
Com cada vez mais essas máquinas de alta capacidade de produção permitem que
as operações de corte e baldeio de florestas de eucalipto sejam realizadas de forma
sistemática e em alta escala. Entretanto, um ponto de suma importância para termos uma
atividade com o menor custo possível e alta disponibilidade é a implantação de sistemas
gestão de combustíveis e de manutenção, eliminando-se assim a dependência de
apontamentos manuais, que para serem integrados aos sistemas de gestão demandam de
ações humanas.
A redução do consumo de combustível impacta diretamente na redução do custo da
madeira produzida, bem como contribui para a mitigação de gases de efeito estufa, pontos
relacionados as questões de Environmental, Social, and corporate Governance [ESG], cada
dia mais presentes na nossa sociedade. Uma economia no consumo de combustível nos
harvesters de colheita florestal pode ser conseguida através de capacitação de operadores,
a qual está dentro da rotina da equipe de corte e através de conjuntos de equipamentos com
melhores performance operacional, litros/m³ produzido.
Trabalho apresentado para obtenção do título de especialista em
Data Science e Analytics – 2022
4
Foi somente a partir da década de 1990, com a abertura das importações, falta de mão
de obra no campo e também a necessidade de se executar o trabalho de forma mais
ergonômica e com maior eficiência, que as empresas iniciaram a mecanização das operações
de colheita de forma mais intensiva.
Atualmente, os principais métodos de colheita mecanizada são: “árvore completa” (
full-tree [FT]) e o de “corte no comprimento” (cut-to-length [CTL]). O método FT, como o nome
diz as áreas são cortadas inteiras, utilizando-se Feller Buncher e depois essas são arrastadas
para a borda do talhão e então processadas para transporte. No método CTL, o harvester
abate a árvore e processa em diferentes medidas dentro do talhão, as quais são
posteriormente baldeada para a borda utilizando-se de Forwarders. É típico para o método
CTL o processamento de diferentes dimensões de toras, que são chamadas sortimentos,
derivados de uma mesma árvore (Miolanem, 2021).
Na Suzano, temos os dois sistemas operacionais, FT e CTL, porém o CTL é o
predominante no processo, sendo que temos múltiplos sortimento de madeira, variando-se o
comprimento da madeira conforme configuração das fábrica que recebem essa madeira, no
processo CTL, processamos a madeira sem casca até um diâmetro de 4cm, deixando no
interior do talhão os resíduos, cascas, galhos e folhas, os quais são incorporados como
adubação verde ao próximo ciclo de produção florestal, otimizando-se assim os custos para
formação do próximo ciclo de produção florestal.
A CAN Bus ou Barramento Controller Area Network, foi desenvolvido pela empresa
alemã Robert BOSCH e disponibilizado em meados dos anos 80, tendo sua aplicação inicial
focada em ônibus e caminhões. Atualmente, é amplamente utilizado na indústria, em veículos
automotivos, navios e tratores, entre outros (Alexag, 2021). O CAN é um protocolo de
comunicação serial síncrono, sendo que o sincronismo entre os módulos conectados à rede
é feito em relação ao início de cada mensagem lançada ao barramento (evento que ocorre
em intervalos de tempo conhecidos e regulares) (Alexag, 2021).
Os fundamentos do CAN são especificados por duas normas: a ISO11898 e a
ISO11519-2. A primeira, ISO11898, determina as características de uma rede trabalhando
com alta velocidade de transmissão de dados, de 125Kbps a 1Mbps. A segunda, ISO11519-
2, determina as características de uma rede trabalhando com baixa velocidade, de 10Kbps a
125Kbps (Alexag, 2021).
Toda comunicação das redes CAN é baseada em mensagens, que são transportadas
em quadros de bits, que por sua vez são formadas por campos, que são conjuntos de bits
com determinada função no quadro (MAPA, 2001). O esquema apresentado na Figura 1,
ilustra uma mensagem CAN e dos tipos de quadro de dados do CAN, formado por campos de
bits.
Trabalho apresentado para obtenção do título de especialista em
Data Science e Analytics – 2022
5
Figura 1. Quadro e Mensagens CAN
Fonte: MAPA (2001)
Uma mensagem da CAN é formada pelo Campo de Dados, ao qual está associado
um campo que caracteriza a mensagem. No caso do CAN, este campo que caracteriza a
mensagem é denominado Identificador, e define a prioridade de cada mensagem. O valor
do identificador para as mensagens de cada nó é exclusivo, e quanto mais baixo o valor de
um Identificador maior é a prioridade das mensagens desse nó. Utilizando um identificador
os vários nós fazem o escalonamento do acesso ao meio. Quando os nós recebem a
mensagem transmitida por um determinado nó, realizam o teste de aceitação e verificam se
a mensagem tem interesse para esse nó ou não, através do identificador, (MAPA, 2001).
Não é objetivo desse Trabalho de Conclusão de Curso [TCC], detalhar o protocolo
CAN, porém vale ressaltar que os padrões baseados neste protocolo apresentam
características expressivas para aplicação diversas, sendo elas em máquinas florestais,
agrícolas ou até maquinário pesado destinado à mineração ou mesmo obras de engenharia,
tendo seu emprego avançado rapidamente. No setor agrícola a utilização deste protocolo tem
sido fomentada por associações de normas internacionais de expressão, como NMEA, ISO,
SAE e DIN, além de empresas de equipamentos agrícolas e outros grupos.
Os dados utilizados neste TCC, foram oriundos de uma Proof of Concept [POC],
realizado na Suzano no segundo semestre de 2021, em conjunto com a empresa IoTag
(https://iotag.com.br), a qual é detentora da tecnologia para leitora de rede CAN Bus dos
Harvester da Suzano!
O objetivo do presente TCC, é apresentar uma alternativa para melhorarmos a gestão
de diesel no processo de colheita florestal, utilizando técnicas de data mining e machine
learning, sendo que para isso foi feita a leitura dos dados presente na rede CAN Bus de 3
Harvestes, para obtenção do consumo instantâneo e outras variáveis que possam estar
relacionadas à sua variação.
Como objetivos específicos temos:
• Ler a rede CAN das máquinas florestais, Harvester;
Trabalho apresentado para obtenção do título de especialista em
Data Science e Analytics – 2022
6
• Avaliar a quantidade de informações, periodicidade de informações que são,
possível de serem coletadas da rede CAN Bus dos Harvesters;
• Analisar e comparar as variações de faixa de consumo ocorridas nos 3 turnos
operacionais;
• Propor um cenário para otimização do consumo de diesel, baseado nos dados
coletados;
• Avaliar se podemos através de técnicas de data mining e machine learning,
diferenciar os operadores em duas classes, relacionadas ao consumo de
combustível.
Material e Métodos
Esse trabalho foi desenvolvido, utilizando-se dados da leitura da CAN Harvesters,
tratores especializados em corte de madeira, que fazem parte do parque de máquinas da
Suzano S/A, na unidade SP, a escolha dessas máquinas se deve ao processo de POC (Proof
Of Concept) que foi conduzida na Suzano, junto com a empresa IoTag (https://iotag.com.br),
tem a tecnologia dos leitores de rede CAN Bus.
Para análise dos dados, foi feito uso da estatística descritiva, onde buscamos a
comparação da variação do consumo entre máquinas e turnos, nos diferentes dias que temos
dados coletados, buscamos uma alternativa para definir o melhor padrão de consumo, bem
como uma proposta de como buscar esse padrão nos demais turnos e máquinas.
A partir da análise exploratória dos dados, buscamos através da correlação de
Pearson, a qual é uma medita que varia entre -1 e 1, onde por meio do sinal resultante,
podemos identificar o tipo de relação linear entre as variáveis analisadas, onde quanto mais
próximo dos extremos (-1 e 1) mais forte é a correlação entre as variáveis (Fávero e Belfiore
,2022).
Segundo Fávero e Belfiore (2022), correlação positivas, indicam uma relação
diretamente proporcional entre as variáveis, gerando uma correlação linear positiva, já
correlações negativas, indicam uma relação inversamente proporcional entre as variáveis,
gerando uma correlação linear negativa, valores nulos, demostram que não existem
correlações entre as variáveis.
Como identificamos algumas variáveis com melhor correlação com o consumo de
diesel, buscamos avaliar se seria possível termos equações lineares, capaz de explicar a
variação de consumo. No caso, optamos pela tentativa de uso de equações múltipla, onde
mais de uma variável (X1, X2, Xn) é utilizada para tentar explicar a variação de consumo de
diesel (Y).
Trabalho apresentado para obtenção do título de especialista em
Data Science e Analytics – 2022
7
Fávero e Belfiore (2022), comentam que o conceito ceteris paribus (mantidas as
demais condições constantes), deve ser utilizado na análise da regressão múltipla, uma vez
que a interpretação do parâmetro de cada variável será feita isoladamente. Assim um modelo
com duas variáveis explicativas, X1 e X2, os respectivos coeficientes serão analisados de
forma a considerar todos os outros fatores constantes.
Como temos dados com alta multicolinearidade, entre as possíveis variáveis
explicativas para o consumo de Diesel, a alternativa para identificar melhor os padrões de
comportamento, foi trabalharmos com análise de agrupamentos, a qual segundo Fávero e
Belfiore (2022), são muito úteis e que podem ser aplicadas quando há a intenção de se
verificar a existência de comportamentos semelhantes entre as observações, em relação a
determinadas variáveis e o objetivo de se criar grupos ou clusters, em que prevaleça a
homogeneidade interna.
No nosso caso, essa homogeneidade tem o objetivo de identificarmos os melhores
operadores, visando não citar nomes, iremos trabalhar com os dados agrupados por turno
operacional, ondem criaremos duas classes, que chamaremos neste trabalho de Operador
Ótimo (1) e Operador Oportunidade (0), respectivamente associados à operadores com média
de consumo menor ou igual a média do Harvester no período e operadores com média de
consumo maior que a média do Harvester no período.
Buscando identificar padrões, utilizamos um método relativamente simples, porém
com excelentes resultados, K — Nearest Neighbors [K-NN], o qual permite com baixo poder
de processamento, análise e inferência em grandes volumes de dados. É um dos muitos
algoritmos, de aprendizagem supervisionada, usado no campo de data mining e machine
learning, ele é um classificador onde o aprendizado é baseado “no quão similar” é um dado
(um vetor) do outro. O treinamento é formado por vetores de n dimensões.
Segundo Rocha Neto e Menezes Jr (2019), o K-NN é uma classificador sub-ótimo que
cria fronteiras de decisões complexas a partir de um conjunto de padrões de treinamento com
classes conhecidas a priori. Mais precisamente, para um dado vetor característico no conjunto
teste, os vetores de K mais próximos no conjunto de treino são selecionados de acordo com
alguma medida de distância e o vetor de características de teste é atribuído ao rótulo mais
representado na classe dos K vizinhos.
Classificar um exemplo desconhecido com o algoritmo K-NN pode ser resumido nos
seguintes passos (Rocha Neto e Menezes Jr, 2019), (Figura 2):
• Calcular a distância entre o exemplo desconhecido e os outros exemplos do
conjunto de treinamento;
• Identificar os K vizinhos mais próximos;
Trabalho apresentado para obtenção do título de especialista em
Data Science e Analytics – 2022
8
• Utilizar o rótulo da classe de vizinhos mais próximos para determinar o rótulo
de classe do exemplo desconhecido em uma espécie de votação.
Figura 2. Classificação do K-NN
Fonte: Rocha Neto e Menezes Jr (2019)
Resultados e Discussão
Durante a POC, conseguimos ler a rede CAN Bus de 3 Harvesters Komatsu PC200F
com cabeçote processador, conforme Tabela 1 e no Anexo 1 onde estão listadas as variáveis
lidas.
Tabela 1. Lista de Harvester, dias com dados coletados e horas trabalhadas
Nome Equipamento Dias de Leitura da Rede CAN Bus Horas Totais Trabalhadas
HV – Estrovenga
55 (7/out a 30/nov/2021)
942h 25min 00seg
HV – Relâmpago 1.007h 44min 11seg
HV - Magnata 1.061h 34min 06seg
Total 3.011h 43min 17seg
Fonte: Resultados da pesquisa
Buscando uma análise inicial dos dados, fizemos uso da estatística descritiva a qual
fornece resumos simples sobre as amostras, segregadas por Harvester, sobre as
observações que foram feitas, durante a coleta de dados. Tabela 2.
Vale aqui explicar como funcionam os turnos na Suzano S/A, são todos de 8 horas
sendo que o primeiro turno, inicia-se as 00:00 horas, o segundo turno inicia-se as 08:00 horas
e o terceiro turno inicia-se as 16:00 horas.
Analisando a Tabela 2, podemos notar que uma variação considerável entre os
Harvester, sendo o HV – Estrovenga com o pior consumo médio, também temos variações,
menores, mas não menos importantes entre os turnos em um mesmo Harvester, lembrando
que como estamos olhando para todos os dados coletados, temos uma variação de
operadores, sendo que um mesmo operador pode ter trabalhado em mais de um turno, aqui
não vamos entrar no detalhe a nível de operador.
Trabalho apresentado para obtenção do título de especialista em
Data Science e Analytics – 2022
9
Analisando-se a média dos três turnos, o melhor Harvester, foi o HV – Relâmpago,
com consumo médio de 21,50 litros/hora trabalhada, seguido pelo HV – Magnata com 21,68
litro/hora trabalhada, já o HV – Estrovenga, teve o pior consumo médio de 23,22 litro/hora,
sendo estes harvesters, respectivamente, 0,79% e 7,40% acima do HG - Relâmpago.
Olhando o alto consumo do HV – Estrovenga, as possíveis explicações para a grande
variação de consumo, seria comportamento dos operadores que trabalham neste Harvester,
porém pela leitura da rede CAN Bus, o HV – Estrovenga é o equipamento com mais horas
trabalhadas, 19.619 horas contra 3.143 e 8.429 horas respectivamente dos HV – Magnata a
e do HV – Relâmpago (Tabela 3). Baseado nesta variação do horímetro, não podemos inferir
somente com dados da rede CAN Bus, que somente os operadores são responsáveis pela
variação de consumo, precisaríamos avaliar também as condições de manutenção das
máquinas
Tabela 2. Análise descritiva dos dados coletados, consumo de combustível, mínimo, médio e
máximo no período analisado
Harvester Turno
Variação Consumo (L/H)
Mínimo Médio Máximo
HV - Estrovenga
Primeiro 5,14 23,14 45,00
Segundo 5,07 23,11 45,00
Terceiro 5,10 23,41 47,37
Média 5,07 23,22 47,37
HV - Relâmpago
Primeiro 5,14 21,21 45,00
Segundo 5,14 21,55 45,00
Terceiro 5,14 21,78 45,00
Média 5,14 21,50 45,00
HV - Magnata
Primeiro 5,14 21,41 45,00
Segundo 5,10 21,79 45,00
Terceiro 5,08 21,84 45,00
Média 5,08 21,68 45,00
Fonte: Resultados da pesquisa
Tabela 3. Variação do Horímetro dos Harvesters durante a POC
Harvester Horímetro Final POC
HV Estrovenga 19.619
HV Relâmpago 8.429
HV Magnata 3.143
Fonte: Resultados da pesquisa
No Anexo 2, apresentamos a variação de consumo diária por máquina, assim
podemos ter um melhor detalhamento da variação média, o que nos permite demonstrar que
Trabalho apresentado para obtenção do título de especialista em
Data Science e Analytics – 2022
10
trabalhar com uma média diária é muito mais eficiente do que trabalhar com uma média de
um período, Anexo 2 comparado com a Tabela 2.
Já na Tabela 4, demostramos a melhor e pior média de cada um dos Harvesters
segregados por Turno, bem como o percentual de oportunidade que temos na variação
dessas duas métricas. Sendo que o HV – Estrovenga no primeiro turno apresentou a maior
variação de média diária, 18,86 litros/hora no melhor dia contra 24,95 litros/hora no pior dia,
uma variação de 32,3% já o HV – Magnata, teve a menor variação percentual, a qual ocorreu
no segundo turno, mesmo assim sendo um valor bastante considerável, 13,8%, 20,05
litros/hora no melhor dia contra 22,80 litros/hora no pior dia.
Parte dessas variações podem ser explicadas devido as diferenças de produtividade
(m³), relevo do terreno, nas áreas trabalhadas no período da POC, porém podemos notar que
o HV – Magnata, que é o mais novo de todos apresentou-se a menor variação dentro os 3
HV, evidenciando aqui que temos alguma oportunidade na manutenção e regulagem das
máquinas com o avanço na sua utilização (horímetro).
Tabela 4. Resumo do consumo por turno e Harvesters
Métrica
HV - Estrovenga HV - Relâmpago HV - Magnata
Primeiro Segundo Terceiro Primeiro Segundo Terceiro Primeiro Segundo Terceiro
Melhor
Média
18,86 20,37 20,33 18,78 18,60 18,94 19,54 20,05 20,02
Pior
Média
24,95 24,15 24,69 22,66 23,98 23,53 22,81 22,80 23,23
%
Variação
Melhor vs
Pior Média
32,3% 18,6% 21,5% 20,6% 28,9% 24,2% 16,8% 13,8% 16,0%
Fonte: Resultados da pesquisa
Analisando-se a variação da melhor média, entre os turnos, notamos que o HV-
Estrovenga tem uma variação média do melhor turno com os outros dois de 7,9%, já o HV-
Relâmpago tem uma variação de 1,4% entre o melhor turno e os demais e finalmente o HV-
Magnata tem uma variação média de 2,5% entre o melhor turno e os demais. Mais uma
evidência que temos oportunidades na manutenção e regulagens do HV-Estrovenga,
melhorando assim sua variação de consumo.
Considerando uma hipótese, de melhorarmos o desempenho entre os turnos em cada
HV de permitirmos uma variação da média de até +10%, utilizando-se a melhor média de cada
HV, temos as seguintes hipóteses:
• HV-Estrovenga, 18,86 litros/hora, no primeiro turno, temos um limite
operacional de 20,75 litros/hora;
Trabalho apresentado para obtenção do título de especialista em
Data Science e Analytics – 2022
11
• HV-Relâmpago, 18,60 litros/hora, no primeiro turno, temos um limite
operacional de 20,46 litros/hora.
• HV-Magnata, 19,54 litros/hora, no primeiro turno, temos um limite
operacional de 21,49 litros/hora.
Também podemos considerar que deveríamos buscar uma meta de consumo para
todas as máquinas, sendo essa meta definhada pelo melhor consumo registrado, que é do
HV-Relâmpado, 18,60 litros/hora + 10% = 20,46 litros/hora. Com base neste limite
operacional, simulamos a oportunidade de redução de diesel, se todo consumo acima dessa
média independente do Harvester e/ou turno, for evitado.
Nas tabelas 5 e 6, demostramos respetivamente o total de horas trabalhadas acima
da meta de consumo, 20,46 litros/hora, evidenciando qual seria o ganho potencial de litros de
diesel se trabalhássemos para atingir essa meta. Considerando que temos aproximadamente
3.012 horas efetivamente trabalhadas registradas (Tabela 1), contamos pela análise da tabela
5, que em mais de 60% do tempo trabalhamos com acima da meta.
Tabela 5. Horas trabalhadas acima da meta definida (20,46 litros/hora) de consumo
Turnos HV Estrovenga HV Relâmpago HV Magnata Total Geral
Primeiro 246h 56min 08seg 163h 12min 18seg 183h 43min 09seg 593h 51min 35seg
Segundo 236h 51min 58seg 161h 58min 01seg 201h 06min 54seg 599h 56min 53seg
Terceiro 253h 23min 24seg 190h 39min 24seg 220h 05min 50seg 664h 08min 38seg
Total
Geral
737h 11min 30seg 515h 49min 43seg 604h 55min 53seg 1.857h 57min 06seg
Fonte: Resultados da pesquisa
Analisando-se os dados da Tabela 5, temos para o período analisado, quase 1.860
horas trabalhadas acima da meta definida para o consumo de diesel (+10%), o que gerou um
consumo extra de diesel de 5.583 litros (Tabela 6) para os 3 Harvesters durante os 55 que
tivemos monitoramento das atividades.
Tabela 6. Oportunidade de redução de consumo de Diesel, baseado na meta definida
Turnos HV Estrovenga HV Relâmpago HV Magnata Total Geral
Primeiro 864 437 476 1.777
Segundo 825 454 521 1.801
Terceiro 923 520 562 2.005
Total Geral 2.612 1.411 1.559 5.583
Fonte: Resultados da pesquisa
Trabalho apresentado para obtenção do título de especialista em
Data Science e Analytics – 2022
12
O grande desafio é como tornar esse monitoramento sistemático e efetivo para que
possamos realmente termos ganhos operacionais com a redução do consumo de diesel,
sendo que se atingirmos esse objetivo teríamos um ganho de 8,23% no total de litros
consumidos.
Assim sendo, baseando-se nos dados coletados da Rede CAN Bus, quais seriam as
variáveis monitoradas, apresentam melhor correlação ao consumo de combustível.
Começamos pela análise do Engine Speed, mais conhecido como RPM. A Tabela 7,
apresenta 5 classes de RPM que estratificamos os dados e sua média de consumo por turno
para cada um dos HV. Assim podemos demostram que conforme aumenta o giro do motor
diesel, maior é o consumo médio, sendo que acima de 1.800 RPM temos uma variação média
superior a 20% quando comparado à operação na faixa de 1.650 até 1.800 RPM.
Tabela 7. Variação do consumo (litro/hora) por faixa de RPM
Faixa
RPM Turnos HV Estrovenga HV Relâmpago HV Magnata Total Geral
menor
a 1.200
RPM
Primeiro 12,2 13,7 11,9 12,4
Segundo 11,6 13,0 12,6 12,3
Terceiro 14,3 15,1 13,5 14,1
1.200
a 1.650
RPM
Primeiro 12,9 12,0 13,8 12,7
Segundo 12,7 12,1 13,3 12,6
Terceiro 13,3 11,9 13,4 12,8
1.650
a 1.800
RPM
Primeiro 21,2 17,1 17,8 19,4
Segundo 19,2 17,5 18,5 18,5
Terceiro 18,7 17,9 18,5 18,4
1.800
a 1.900
RPM
Primeiro 23,5 21,6 21,8 22,3
Segundo 23,6 22,0 22,1 22,6
Terceiro 23,8 22,1 22,1 22,7
acima
1.900
RPM
Primeiro 24,0 21,3 20,9 21,6
Segundo 24,4 21,9 22,3 22,5
Terceiro 24,5 22,1 22,0 22,6
Fonte: Resultados da pesquisa
A Tabela 8, demostramos o tempo operacional, em cada uma das faixas de RPM
definidas previsamente (Tabela 7), podemos notar que a maior parte do tempo, os 3
Harvesters operam na faixa de 1.800 a 1.900 RPM. Uma avaliação futura da faixa de RPM
ótima operacional, pode apresentar oportunidades aqui não avaliadas, relacionando a faixa
de RPM capaz de atender a demanda hidráulica do cabeçote de processamento.
Na Tabela 9, verificamos o consumo em litro, para cada uma das faixas de RPM
criadas, onde podemos notar que trabalhando acimas de 1.900 RPM temos o consumo de
Trabalho apresentado para obtenção do título de especialista em
Data Science e Analytics – 2022
13
7.797,0 Litros, correspondente à 11,5% do total consumido durante a POC, bastante
significativo.
Tabela 8. Tempo operação por faixa de RPM
Faixa
RPM Turnos HV Estrovenga HV Relâmpago HV Magnata Total Geral
menor
a 1.200
RPM
Primeiro
4h 17min 05seg 1h 58min 03seg 4h 13min 29seg 10h 28min 37seg
Segundo
4h 49min 26seg 2h 41min 11seg 4h 28min 53seg 11h 59min 30seg
Terceiro
4h 19min 45seg 2h 01min 51seg 4h 32min 55seg 10h 54min 31seg
1.200
a 1.650
RPM
Primeiro
17h 45min 35seg 21h 00min 41seg 10h 32min 33seg 49h 18min 49seg
Segundo
19h 43min 35seg 19h 00min 46seg 13h 27min 31seg 52h 11min 52seg
Terceiro
16h 42min 31seg 17h 50min 08seg 13h 33min 31seg 48h 06min 10seg
1.650
a 1.800
RPM
Primeiro
12h 19min 30seg 07h 05min 36seg 06h 50min 16 seg 26h 15min 22seg
Segundo
09h 50min 22seg 07h 17min 09seg 07h 37min 48seg 24h 45min 19seg
Terceiro
09h 12min 25seg 05h 30min 32seg 06h 14min 36seg 20h 57min 33seg
1.800
a 1.900
RPM
Primeiro
264h 48min 19seg 283h 27min 58seg 278h 54mn 46seg 827h 11min 03seg
Segundo
251h 10min 50seg 236h 33min 54seg 268h 54min 35seg 756h 39min 19seg
Terceiro
268h 11min 22seg 267h 13min 18seg 292h 20min 18seg 827h 44min 58seg
acima
1.900
RPM
Primeiro
21h 53min 59seg 55h 45min 34seg 69h 47min 03seg 147h 26min 36seg
Segundo
19h 41min 52seg 45h 02min 05seg 41h 44min 55seg 106h 28min 52seg
Terceiro
17h 38min 24seg 35h 15min 25seg 38h 20min 57seg 91h 14min 46seg
TOTAL 943h 25min 00seg 1.007h 44min 11seg 1.061h 34min 06seg 3.011h 43min 17seg
Fonte: Resultados da pesquisa
Tabela 9. Consumo (Litros Totais) para nas faixas de RPM por HV
Faixa RPM HV Estrovenga HV Relâmpago HV Magnata Total Geral
< 1.200 118,5 73,0 120,5 312,0
1.200 – 1.650 599,5 709,0 448,5 1.757,0
1.650 – 1.800 616,5 377,5 373,5 1.367,5
1.800 – 1.900 18.641,5 19.014,0 18.935,0 56.590,5
> 1.900 1.452,0 3.017,5 3.327,5 7.797,0
Total Geral 21.428,0 23.191,0 23.205,0 67.824,0
Fonte: Resultados da pesquisa
Separamos então, 15 variáveis para avaliarmos a correlação de Pearson entre elas,
como uma forma de identificar potenciais oportunidades de atuação operacional. Nas Tabelas
10, 11 e 12, temos a matriz de correlação de Pearson, para cada um dos HV analisados, para
esse grupo de variáveis. Podemos notar que com o consumo de combustível (L/hora) somente
4 variáveis apresentaram correlação superior a 0,20 nos três HV estudados.
Sendo que 2 variáveis têm correlação superior a ,50 nos três HV estudados, sendo
elas, Engine Percent Load At Current Speed – 0,59, 0,56 e 0,52, Actual Engine - Percent
Trabalho apresentado para obtenção do título de especialista em
Data Science e Analytics – 2022
14
Torque – 0,60, 0,59 e 0,55 nos respectivos HV – Estrovenga, HV – Relampago e HV -
Magnata.
A variável Accelerator Pedal Position 1 apresentou correlação de 0,50, 0,50 e 045
nos respectivos HV – Estrovenga, HV – Relampago e HV - Magnata. Enquanto que variável
Engine Speed apresentou correlação de 0,46, 0,44 e 0,40 nos respectivos HV – Estrovenga,
HV – Relampago e HV – Magnata.
Finalmente a última variável com correlação superior a 0,20 foi a Engine Torque
Mode, tem uma correção de 0,22, 0,29 e 0,28 nos respectivos HV – Estrovenga, HV –
Relampago e HV – Magnata, as demais variáveis tem correlações abaixo de 0,20 com o
consumo de combustível (L/hora).
Tabela 10. Correlação de Pearson para as variáveis selecionadas – HV Estrovenga
Fonte: Resultados originais da pesquisa
Tabela 11. Correlação de Pearson para as variáveis selecionadas – HV Relâmpago
Fonte: Resultados originais da pesquisa
Engine Total Idel
Hours
Nomal Friction -
Percent Torque
Engine Total
Hours of
Operation
Engine Total
Revolutions
Enige Coolant
Temperature
Engine Oil
Temperature 1
Engine Oil
Pressure
Accelerator Pedal
Position 1
Engine Percent
Load At Current
Speed
Engine Torque
Mode
Actual Engine
Percent Torque
Engine Speed
Engine ECU
Temperature
Total ECCU Run
Time
L/Hora
Engine Total Idel
Hours
1,00
Nomal Friction -
Percent Torque
0,00 1,00
Engine Total
Hours of
Operation
0,98 0,01 1,00
Engine Total
Revolutions
0,98 0,01 1,00 1,00
Enige Coolant
Temperature
-0,17 0,04 -0,19 -0,20 1,00
Engine Oil
Temperature 1
-0,17 0,04 -0,20 -0,20 1,00 1,00
Engine Oil
Pressure
-0,01 0,16 -0,01 -0,01 0,01 0,01 1,00
Accelerator Pedal
Position 1
-0,04 0,10 -0,04 -0,04 0,16 0,16 0,02 1,00
Engine Percent
Load At Current
Speed
0,12 0,09 0,12 0,12 0,16 0,16 0,02 0,71 1,00
Engine Torque
Mode
-0,03 0,02 -0,03 -0,03 0,04 0,04 0,02 0,44 0,21 1,00
Actual Engine
Percent Torque
0,12 0,09 0,12 0,12 0,17 0,16 0,02 0,74 0,97 0,21 1,00
Engine Speed -0,08 0,11 -0,07 -0,07 0,16 0,16 0,01 0,98 0,65 0,37 0,68 1,00
Engine ECU
Temperature
0,21 0,23 0,19 0,19 0,51 0,50 0,03 0,11 0,26 -0,03 0,26 0,08 1,00
Total ECCU Run
Time
0,98 0,01 1,00 1,00 -0,20 -0,20 -0,01 -0,04 0,12 -0,03 0,12 -0,07 0,19 1,00
L/Hora 0,09 0,05 0,09 0,09 0,08 0,08 0,02 0,50 0,59 0,22 0,61 0,46 0,16 0,09 1,00
Engine Total Idel
Hours
Nomal Friction -
Percent Torque
Engine Total
Hours of
Operation
Engine Total
Revolutions
Enige Coolant
Temperature
Engine Oil
Temperature 1
Engine Oil
Pressure
Accelerator Pedal
Position 1
Engine Percent
Load At Current
Speed
Engine Torque
Mode
Actual Engine
Percent Torque
Engine Speed
Engine ECU
Temperature
Total ECCU Run
Time
L/Hora
Engine Total Idel
Hours
1,00
Nomal Friction -
Percent Torque
-0,02 1,00
Engine Total
Hours of
Operation
0,99 -0,01 1,00
Engine Total
Revolutions
0,99 -0,01 1,00 1,00
Enige Coolant
Temperature
0,08 0,06 0,09 0,09 1,00
Engine Oil
Temperature 1
0,09 0,06 0,09 0,09 1,00 1,00
Engine Oil
Pressure
0,04 17.7% 0,05 0,05 0,01 0,01 1,00
Accelerator Pedal
Position 1
0,01 0,08 0,01 0,01 0,20 0,20 0,01 1,00
Engine Percent
Load At Current
Speed
0,21 0,06 0,21 0,21 0,27 0,27 0,04 0,66 1,00
Engine Torque
Mode
0,05 0,02 0,04 0,04 0,09 0,09 0,00 0,46 0,30 1,00
Actual Engine
Percent Torque
0,22 0,06 0,23 0,23 0,28 0,28 0,04 0,69 0,94 0,31 1,00
Engine Speed -0,06 0,09 -0,06 -0,06 0,18 0,18 0,00 0,97 0,58 0,39 0,61 1,00
Engine ECU
Temperature
0,04 0,16 0,05 0,05 0,69 0,69 0,04 0,07 0,24 -0,02 0,25 0,04 1,00
Total ECCU Run
Time
0,99 -0,01 1,00 1,00 0,09 0,09 0,05 0,01 0,21 0,04 0,23 -0,06 0,05 1,00
L/Hora 0,14 0,03 0,14 0,14 0,13 0,14 0,02 0,50 0,57 0,29 0,59 0,44 0,13 0,14 1,00
Trabalho apresentado para obtenção do título de especialista em
Data Science e Analytics – 2022
15
Tabela 12. Correlação de Pearson para as variáveis selecionadas – HV Magnata
Fonte: Resultados originais da pesquisa
Baseando-se nestas correlações, avaliamos construir uma equação multivariada, por
mínimos quadrados para o consumo (L/hora), apresentadas na Tabela 13, com as 5 viáveis
com as melhores correlações, citadas acima.
Tabela 13. Equações multivariadas elaboradas
Harvester Equações Geradas
HV Estrovenga
L/hora = 15.602 + 0.15108*APP + 0.015704*EPLCS + 0.23714*ETM +
0.18262*AEPT + -0.010406*RPM
HV Relampago
L/hora = 14.183 + 0.16907*APP + 0.019056*EPLCS + 0.27512*ETM +
0.15403*AEPT + -0.0097075*RPM
HV Magnata
L/hora = 16.11 + 0.14927*APP + 0.0085225*EPLCS + 0.3293*ETM +
0.18078*AEPT + -0.010432*RPM
Fonte: Resultados originais da pesquisa
Abaixo a análise dos resultados, Figuras 3, 4 e 5, demonstrando que para o processo
de estimativa de consumo de combustível, não temos, ao menos com os dados coletados
nesta POC, como simular com precisão tal variação baseando na formulação de equações
multivariadas.
Podemos notar que todos os resultados, que todas as equações apresentaram R²
abaixo de 40%, indicando que podem existir outros fatores que determinam o consumo de
combustíveis (L/hora), não podendo ser explicado satisfatoriamente com as 5 variáveis com
melhor correlação de Pearson, coletadas pela rede CAN Bus, com o consumo (L/hora).
Também é possível identificar pelos resultados, que existe forte multicolinearidade
entre as variáveis independentes, como temos um grande volume de dados, a sugestão é que
Engine Total Idel
Hours
Nomal Friction -
Percent Torque
Engine Total
Hours of
Operation
Engine Total
Revolutions
Enige Coolant
Temperature
Engine Oil
Temperature 1
Engine Oil
Pressure
Accelerator Pedal
Position 1
Engine Percent
Load At Current
Speed
Engine Torque
Mode
Actual Engine
Percent Torque
Engine Speed
Engine ECU
Temperature
Total ECCU Run
Time
L/Hora
Engine Total Idel
Hours
1,00
Nomal Friction -
Percent Torque
0,05 1,00
Engine Total
Hours of
Operation
0,97 0,06 1,00
Engine Total
Revolutions
0,97 0,06 1,00 1,00
Enige Coolant
Temperature
0,02 0,12 0,06 0,06 1,00
Engine Oil
Temperature 1
0,02 0,12 0,06 0,06 0,99 1,00
Engine Oil
Pressure
0,00 0,10 -0,01 -0,01 0,03 0,03 1,00
Accelerator Pedal
Position 1
-0,04 0,04 -0,04 -0,04 0,34 0,24 0,03 1,00
Engine Percent
Load At Current
Speed
-0,11 -0,01 -0,11 -0,10 0,31 0,32 0,04 0,59 1,00
Engine Torque
Mode
0,00 0,05 0,00 0,00 0,12 0,12 0,01 0,47 0,30 1,00
Actual Engine
Percent Torque
-0,12 0,12 -0,11 -0,11 0,34 0,34 0,04 0,73 0,93 0,30 1,00
Engine Speed -0,02 0,07 -0,02 -0,02 0,34 0,35 0,03 0,97 0,61 0,29 0,66 1,00
Engine ECU
Temperature
-0,06 0,06 -0,02 -0,01 0,52 0,53 0,00 0,05 0,13 0,00 0,14 0,03 1,00
Total ECCU Run
Time
0,98 0,05 1,00 1,00 0,06 0,06 -0,01 -0,04 -0,10 0,00 -0,11 -0,02 -0,01 1,00
L/Hora -0,08 0,01 -0,08 -0,08 0,11 0,11 0,02 0,45 0,52 0,28 0,55 0,40 0,09 -0,08 1,00
Trabalho apresentado para obtenção do título de especialista em
Data Science e Analytics – 2022
16
existe realmente um relacionamento entre as variáveis analisadas, visto que todas são
provenientes da rede CAN Bus das máquinas.
Figura 3. Resultado da OLS – HV Estrovenga
Fonte: Resultados originais da pesquisa
Figura 4. Resultado da OLS – HV Relâmpago
Fonte: Resultados originais da pesquisa
Trabalho apresentado para obtenção do título de especialista em
Data Science e Analytics – 2022
17
Figura 5. Resultado da OLS – HV Magnata
Fonte: Resultados originais da pesquisa
Baseando-se nos resultados apresentados nas Figura 3, 4 e 5, devido a
multicolinearidade dos dados, onde as variáveis explicativas tem alta correlação entre si, o
que pode ser observado analisando-se as Tabelas 10, 11 e 12, buscamos alternativas para
trabalhar a informação, sendo que para tal, vamos trabalhar somente com os dados do HV –
Magnata, por esse ser o HV mais novo, menor horímetro, onde se espera, eliminar com isso,
pontos que não são abordados nesse TCC como por exemplo, diferenças na manutenção
preventiva das máquinas ou mesmo desgastes de componentes do motor devido ao avanço
do uso dos equipamentos.
A primeira abordagem feita, foi classificar os dados do HV – Magnata, baseando-se na
média do consumo por dia e turno em duas classes, Operador Ótimo e Operador
Oportunidade, dados apresentados no Anexo 2. Assim consideramos Operador Ótimo (1)
os que tiverem a média de consumo menor ou igual a média geral do Harverster no período
analisado e Operador Oportunidade (0) os que tiverem a média superior a média geral no
período.
Com essa separação, utilizando-se as 5 variáveis com melhor correlação de Pearson,
(Tabela 12), buscamos avaliar a utilização o algoritmo K-NN para avaliar quanto ele seria
assertivo nessa separação, a sua avaliação inicial deve-se principalmente pela simplicidade
de sua utilização e baixa demanda computacional.
Na Figura 6 e Tabela 14, são apresentados os resultados obtidos com o K-NN, para o
HV- Magnata variando-se somente o número de vizinhos, pelos resultados, notamos que o K-
NN, apresentou melhores resultados com poucos vizinhos, demostrando os dados tem baixa
similaridade entre os dados da rede CAN Bus, quando passamos de 10 vizinho, já temos uma
perda considerável no Score obtido. Assim sendo, avaliamos a acurácia, via matriz de
confusão para identificar qual a melhor escolha para o Nr. de vizinhos (Figura 7).
Trabalho apresentado para obtenção do título de especialista em
Data Science e Analytics – 2022
18
Figura 6. Resultados da classificação K-NN
Fonte: Resultados originais da pesquisa
Tabela 14. Resultados da classificação K-NN
Nr. Vizinho
n_neighbors
Cross Validation Score Obtido
3 93,37%
4 93,59%
5 93,45%
6 93,40%
7 93,17%
8 93,10%
9 93,07%
10 92,99%
15 92,62%
20 92,03%
25 91,58%
50 89,29%
100 81,71'%
150 76,12%
250 68,66%
500 63,50%
1.000 59,49%
5.000 55,84%
Fonte: Resultados originais da pesquisa
Trabalho apresentado para obtenção do título de especialista em
Data Science e Analytics – 2022
19
Figura 7. Matrizes de confusão para 3 até 10 vizinhos dos resultados do K-NN
Fonte: Resultados originais da da pesquisa
Conclusões
A leitura dos dados da rede CAN Bus de Harvesters Floretais, é uma grande fonte de
informações para identificarmos oportunidades operacionais, permitindo identificar padrões
comportamentais de consumo de diesel entre operadores e consequentemente a
classificação desses operadores em Operadores Ótimos e Operadores Oportunidade,
gerando insights para focarmos os treinamentos operacionais nos operadores com maior
consumo de diesel.
A quantidade de informações presentes na rede CAN Bus dos Harvesters avaliados,
foi muito boa, também foi excelente a repetibilidade com que conseguimos coletar tais
informações, utilizando a solução apresentada pela empresa IoTag.
Podemos também notar que entre máquinas e também entre os turnos operacionais
nos mesmos Harvesters, tivemos uma grande variação no consumo de diesel, o que demostra
que temos oportunidades operacionais para serem trabalhadas.
No presente TCC acabamos utilizando somente de 5 variáveis, das presentes na CAN,
futuramente temos oportunidades de estudas as demais variáveis e seu comportamento,
Classes
Operador
Oportunidade
Operador
Ótimo
Recall Classes
Operador
Oportunidade
Operador
Ótimo
Recall
Operador
Oportunidade
4607 290 94,1%
Operador
Oportunidade
4728 169 96,5%
Operador
Ótimo
251 3670 93,6%
Operador
Ótimo
292 3629 92,6%
Precision 94,8% 92,7% Precision 94,2% 95,6%
f-score 94,5% 93,1% f-score 95,4% 94,0%
Acurácia 93,9% Acurácia 94,8%
Classes
Operador
Oportunidade
Operador
Ótimo
Recall Classes
Operador
Oportunidade
Operador
Ótimo
Recall
Operador
Oportunidade
4617 280 94,3%
Operador
Oportunidade
4675 222 95,5%
Operador
Ótimo
208 3713 94,7%
Operador
Ótimo
270 3651 93,1%
Precision 95,7% 93,0% Precision 94,5% 94,3%
f-score 95,0% 93,8% f-score 95,0% 93,7%
Acurácia 94,5% Acurácia 94,4%
Classes
Operador
Oportunidade
Operador
Ótimo
Recall Classes
Operador
Oportunidade
Operador
Ótimo
Recall
Operador
Oportunidade
4577 320 93,5%
Operador
Oportunidade
4583 314 93,6%
Operador
Ótimo
202 3719 94,8%
Operador
Ótimo
223 3698 94,3%
Precision 95,8% 92,1% Precision 95,4% 92,2%
f-score 94,6% 93,4% f-score 94,5% 93,2%
Acurácia 94,1% Acurácia 93,9%
Classes
Operador
Oportunidade
Operador
Ótimo
Recall Classes
Operador
Oportunidade
Operador
Ótimo
Recall
Operador
Oportunidade
4541 356 92,7%
Operador
Oportunidade
4598 299 93,9%
Operador
Ótimo
191 3730 95,1%
Operador
Ótimo
250 3671 93,6%
Precision 96,0% 91,3% Precision 94,8% 92,5%
f-score 94,3% 93,2% f-score 94,4% 93,0%
Acurácia 93,8% Acurácia 93,8%
Matriz Nr Vizinho = 3 Matriz Nr Vizinho = 4
Matriz Nr Vizinho = 5 Matriz Nr Vizinho = 6
Matriz Nr Vizinho = 7 Matriz Nr Vizinho = 8
Matriz Nr Vizinho = 9 Matriz Nr Vizinho = 10
Trabalho apresentado para obtenção do título de especialista em
Data Science e Analytics – 2022
20
talvez relacionado a hora exata de fazer a manutenção preventiva dos Harvesters, partindo-
se assim para a tão desejada manutenção preditiva.
A utilização de equações multivariadas, para tentar explicar o consumo de diesel, não
apresentou um bom R2
, uma das hipóteses, é a alta multicolinearidade das variáveis
explicativas que propusemos usar neste trabalho, avaliar outras informações pode ser uma
oportunidade para futuros trabalhos.
Já a utilização do classificador K-NN para diferenciar um Operador Ótimo de um
Operador Oportunidade, utilizando-se para tal dados coletados da rede CAN Bus, tem um
alto poder de previsão, com baixo consumo computacional para treinar o algoritmo K-NN o
treinamento é executado em segundos, utilizando um computador I5-8265U CPU 1.6GHz e
16Gb de RAM.
A partir do treinamento efetuado com o K-NN, que apresentou uma alta acuraria, acima
de 90%, mesmo com poucos dados processados, temos uma oportunidade de a partir de 1
medição curta de operação, exemplo 2 horas de trabalho operacional, classificar quais
operadores tem ou não mais habilidade operacional, com foco no menor consumo de diesel,
elencando assim os operadores que deveriam ter prioridade no treinamento operacional,
auxiliando as equipe de Treinamento a focarem realmente nos operadores com maior
necessidade.
Futuramente, com o avanço da leitura da CAN Bus dos joysticks dos Harvesters, incluir
tais dados neste processo de classificação de operadores, podem gerar novos insights
interessantes para o processo de treinamento e capacitação destes operadores.
Agradecimento
Agradecimento especial minha família, esposa Célia e filho Rafael, pela compreensão
e pelo tempo que precisei deixar de estar com vocês durante todo o MBA e ainda mais na
confecção do TCC, aonde foram alguns finais de semanas.
Agradecimento a Suzano por ceder os dados e a IoTag pelo fornecimento dos
equipamentos leitores de rede CAN Bus, sem os quais não seria possível a elaboração desse
TCC.
Referências
Alexag. CAN Bus – Barramento Controller Area Network. Disponível em:
http://www.alexag.com.br/CAN_Bus_Parte_2.html, - Acesso em: 04 out. 2021
Fávero, L.P.; Belfiore, P. Manual de Análise de Dados. Reimpressão. Rio de Janeiro, LTC.
2022,
Trabalho apresentado para obtenção do título de especialista em
Data Science e Analytics – 2022
21
Indústria Brasileira de Árvores [IBÁ]. 2020 Relatório Anual. Disponível em:
https://iba.org/datafiles/publicacoes/relatorios/relatorio-iba-2020.pdf Acesso em: 15 nov.
2021.
Ministério da Agricultura, Pecuária e Abastecimento [MAPA]. Circular Técnica 123. CAN
(Controller Area Network): Um Padrão Internacional de Comunicação de Transdutores
Inteligentes para Máquinas Agrícolas. São Carlo, SP – Out/2001.
Miolanem, T. O uso efetivo do método de colheita cut-to-lenght. Revista Opiniões. Março-
Maio 2017: 46-47. Disponível em: https://florestal.revistaopinioes.com.br/revista/detalhes/16-
o-uso-efetivo-do-metodo-de-colheita-cut-lenght/ Acesso em: 11 abr. 2021.
Rocha Neto, W. B. da; Menezes Jr, J. M. P. Perfil de condução de motoristas: análise por
meio de algoritmos de reconhecimento de padrões. Anais do Congresso Brasileiro de
Automática, 2019.
Soeiro, V. M. N. Manutenção de máquinas florestais na colheita mecanizada: a busca para
obter a melhor disponibilidade mecânica, TCC. UFPR, 2012.
Anexos
Anexo 1. Lista de variáveis que foram possíveis de ler da rede CAN Bus
Lista de variáveis lidas Qtde
Trabalho apresentado para obtenção do título de especialista em
Data Science e Analytics – 2022
22
Data/Hora, Nome Máquina (HV), Lamp. Proteção, Lamp. Alarme, Lamp. Parada,
timestamp, Source, Protect Lamp, Amber Warning Lamp, Red Stop Lamp,
Malfunction Indicator Lamp, Failure Mode Identifier, Occurrence Count, SPN
Conversion Method, Suspect Parameter Number, Accelerator Pedal Kickdown
Switch, Road Speed Limit Status, Accelerator Pedal Position 1, Engine Percent Load
At Current Speed, Remote Accelerator Pedal Position, Engine Torque Mode, Drivers
Demand Engine - Percent Torque, Actual Engine - Percent Torque, Source Address
of Controlling Device for Engine Control, Engine Speed, Auxiliary Temperature 1,
Auxiliary Pressure #1, Engine ECU Temperature, Total ECU Run Time, Estimated
Percent Fan Speed, Fan Drive State, Engine Total Idle Fuel Used, Engine Total Idle
Hours, Nominal Friction - Percent Torque, Engines Desired Operating Speed
Asymmetry Adjustment, Engines Desired Operating Speed, Total Power Takeoff
Hours, Engine Trip Fuel, Engine Total Fuel Used, Engine Coolant Temperature,
Engine Fuel Temperature 1, Engine Oil Temperature 1, Engine Oil Pressure, Engine
Coolant Pressure, Engine Coolant Level, Engine Total Hours of Operation, Engine
Total Revolutions, Engine Alternate Rating Select, Engine Alternate Droop
Accelerator 1 Select, Engine Idle Shutdown Timer Function, Engine Wait to Start
Lamp, Engine Protection System Configuration, Freeze Frame Length, Seconds,
Minutes, Hours, Month, Day, Year, Compass Bearing, Navigation-Based Vehicle
Speed, Latitude, Longitude, Altitude
59
Fonte: Resultados da pesquisa
Trabalho apresentado para obtenção do título de especialista em
Data Science e Analytics – 2022
23
Anexo 2. Análise descritiva, consumo de combustível diário, por turno e Harvesters
Data
HV - Estrovenga HV - Relâmpago HV - Magnata
Primeiro Segundo Terceiro Primeiro Segundo Terceiro Primeiro Segundo Terceiro
07/out 20,82 21,08 23,32 21,00 21,39 21,73 22,01 22,11 22,28
08/out 18,86 20,37 22,73 21,12 21,40 21,67 21,86 21,73 22,28
09/out 22,03 23,02 23,41 21,16 21,70 21,19 21,25 21,64 22,24
10/out 23,00 23,95 23,81 20,79 18,94 19,25 20,04 21,79 21,91
11/out 23,40 23,34 23,62 19,41 20,73 20,74 19,54 21,82 22,31
12/out 23,28 22,92 24,12 20,42 20,68 21,93 21,53 22,35 22,17
13/out 24,24 22,93 24,11 21,37 20,68 21,70 21,70 22,43 21,51
14/out 24,00 23,51 23,38 20,84 21,61 21,60 21,19 21,92 21,50
15/out 23,16 24,15 22,32 20,58 20,79 21,04 22,12 21,96 21,57
16/out 22,42 22,99 22,48 21,17 21,78 21,03 21,69 21,65 21,21
17/out 22,88 23,47 23,37 20,96 21,48 20,86 22,43 21,06 22,20
18/out 22,03 22,47 23,00 20,88 21,21 18,94 22,71 22,63 22,75
19/out 22,43 22,95 24,00 20,64 21,28 19,33 22,60 21,85 22,10
20/out 21,60 21,86 22,77 19,81 20,67 21,11 21,78 22,21 21,74
21/out 21,90 21,80 23,41 19,62 19,92 21,27 21,64 22,33 21,52
22/out 23,14 22,91 23,46 20,26 20,35 21,48 20,60 22,47 22,09
23/out 23,27 22,84 22,80 21,33 20,87 20,87 21,54 22,45 22,40
24/out 22,79 23,44 22,50 20,72 21,08 21,42 20,66 22,30 22,90
25/out 22,92 22,63 21,67 20,00 21,64 21,34 21,03 22,23 22,35
26/out 22,74 23,06 22,09 20,29 20,79 21,29 20,39 21,24 22,33
27/out 22,69 23,42 23,54 19,47 20,83 21,40 21,30 22,08 22,88
28/out 24,48 22,76 21,58 20,96 20,21 21,54 22,37 22,09 22,75
29/out 22,47 22,53 22,19 20,03 20,50 20,76 22,26 21,31 23,23
30/out 21,15 23,17 23,16 18,78 18,60 21,91 22,23 22,35 22,02
31/out 21,96 22,77 23,34 20,70 21,08 20,83 22,22 22,80 21,61
01/nov 22,66 22,28 23,19 20,64 21,22 23,26 22,47 22,29 22,03
02/nov 21,94 21,88 23,23 21,92 22,58 22,46 22,81 22,70 22,36
03/nov 23,10 21,98 23,42 22,48 22,41 21,94 21,72 21,59 22,60
04/nov 23,46 21,86 22,77 22,06 21,75 22,09 21,93 21,48 22,06
05/nov 22,07 21,97 23,24 22,31 21,38 22,06 20,62 21,36 21,43
06/nov 23,65 22,89 23,57 22,03 20,68 22,45 21,56 21,59 21,88
07/nov 23,63 23,26 24,09 21,82 22,39 22,71 20,97 21,53 21,25
08/nov 24,01 22,75 21,52 22,22 22,46 22,53 21,05 21,75 21,72
09/nov 23,24 23,34 22,75 21,80 22,86 22,27 21,15 21,40 22,22
10/nov 23,56 23,95 22,14 21,66 22,51 22,27 21,22 21,47 21,78
11/nov 21,56 22,41 24,13 21,66 22,21 21,41 21,44 22,37 22,10
12/nov 23,13 23,34 22,21 20,78 21,67 21,48 22,40 21,56 21,40
13/nov 19,89 23,73 23,87 20,36 21,80 21,72 21,76 20,91 21,29
14/nov 23,06 23,41 24,69 20,62 21,13 23,25 21,67 21,32 20,02
15/nov 24,48 24,15 24,40 20,98 22,03 22,51 20,64 21,24 21,62
16/nov 24,21 23,79 24,45 21,43 21,84 22,40 21,56 21,86 21,58
17/nov 23,84 24,13 23,92 21,56 20,64 20,15 19,88 21,64 21,56
18/nov 23,70 23,67 24,25 21,59 22,72 21,26 20,49 20,05 21,46
19/nov 24,95 23,75 24,60 21,23 21,16 21,61 21,28 21,10 21,00
20/nov 24,85 24,07 24,21 21,17 21,50 22,53 21,21 21,54 21,35
21/nov 23,32 23,43 24,05 21,97 21,84 22,82 21,74 21,86 21,23
22/nov 23,22 23,63 23,01 21,66 22,37 21,91 21,23 21,27 21,70
23/nov 22,82 22,60 23,72 22,31 22,39 22,82 21,06 22,13 21,63
24/nov 23,45 23,67 24,15 22,27 22,29 22,51 20,59 21,21 20,78
25/nov 23,43 23,65 24,67 21,80 22,16 22,71 20,20 21,49 21,47
26/nov 24,10 23,83 23,89 22,56 23,06 22,91 19,67 20,74 21,34
27/nov 24,44 23,48 23,64 22,66 23,98 22,10 20,70 21,53 21,96
28/nov 24,12 23,98 23,51 21,50 21,99 22,44 20,84 21,82 21,84
29/nov 24,45 24,05 23,34 22,43 22,67 22,87 20,08 21,75 20,26
30/nov 23,87 23,53 20,33 22,46 22,89 23,53 20,57 21,80 20,21
Média 23,14 23,11 23,41 21,21 21,55 21,78 21,41 21,79 21,84
Fonte: Resultados da pesquisa

Mais conteúdo relacionado

Mais procurados

Plantas daninhas e seu controle
Plantas daninhas e seu controlePlantas daninhas e seu controle
Plantas daninhas e seu controleGeagra UFG
 
"Programa ABC - Agricultura de Baixo Carbono"
"Programa ABC - Agricultura de Baixo Carbono""Programa ABC - Agricultura de Baixo Carbono"
"Programa ABC - Agricultura de Baixo Carbono"UNDP Policy Centre
 
Políticas Agrícolas
Políticas AgrícolasPolíticas Agrícolas
Políticas AgrícolasGeagra UFG
 
Aula recursos f+¡sicos
Aula recursos f+¡sicosAula recursos f+¡sicos
Aula recursos f+¡sicos07082001
 
IRRIGAÇÃO: MÉTODOS, SISTEMAS E APLICAÇÕES
IRRIGAÇÃO: MÉTODOS, SISTEMAS E APLICAÇÕESIRRIGAÇÃO: MÉTODOS, SISTEMAS E APLICAÇÕES
IRRIGAÇÃO: MÉTODOS, SISTEMAS E APLICAÇÕESLEANDRO DE MATOS
 
Apostila propagacao de arvores frutiferas
Apostila propagacao de arvores frutiferasApostila propagacao de arvores frutiferas
Apostila propagacao de arvores frutiferasLenildo Araujo
 
Colheita e Comercialização do Girassol
Colheita e Comercialização do GirassolColheita e Comercialização do Girassol
Colheita e Comercialização do GirassolGeagra UFG
 
Cadastro Ambiental Rural - CAR
Cadastro Ambiental Rural - CARCadastro Ambiental Rural - CAR
Cadastro Ambiental Rural - CARCBH Rio das Velhas
 
Métodos de extensão rural
Métodos de extensão ruralMétodos de extensão rural
Métodos de extensão ruralfabio schwab
 
projeto de suinocultura (trabalho do curso de técnico agrícola)
projeto de suinocultura (trabalho do curso de técnico agrícola)projeto de suinocultura (trabalho do curso de técnico agrícola)
projeto de suinocultura (trabalho do curso de técnico agrícola)Luis Deleprane
 
Monitoramento bioclimático para sigatoka amarela
Monitoramento bioclimático para sigatoka amarelaMonitoramento bioclimático para sigatoka amarela
Monitoramento bioclimático para sigatoka amarelaErnane Nogueira Nunes
 
Delineamentos estatísticos
Delineamentos estatísticosDelineamentos estatísticos
Delineamentos estatísticosUERGS
 
Silvicultura de Precisão
Silvicultura de PrecisãoSilvicultura de Precisão
Silvicultura de Precisãomarcos Marcos
 
Planejamento e implantação de povoamentos florestais
Planejamento e implantação de povoamentos florestaisPlanejamento e implantação de povoamentos florestais
Planejamento e implantação de povoamentos florestaisTaís Leandro
 

Mais procurados (20)

Plantas daninhas e seu controle
Plantas daninhas e seu controlePlantas daninhas e seu controle
Plantas daninhas e seu controle
 
Integração Lavoura Pecuaria Floresta ILPF
Integração Lavoura Pecuaria Floresta ILPFIntegração Lavoura Pecuaria Floresta ILPF
Integração Lavoura Pecuaria Floresta ILPF
 
"Programa ABC - Agricultura de Baixo Carbono"
"Programa ABC - Agricultura de Baixo Carbono""Programa ABC - Agricultura de Baixo Carbono"
"Programa ABC - Agricultura de Baixo Carbono"
 
Técnicas de Poda
Técnicas de PodaTécnicas de Poda
Técnicas de Poda
 
Políticas Agrícolas
Políticas AgrícolasPolíticas Agrícolas
Políticas Agrícolas
 
Aula recursos f+¡sicos
Aula recursos f+¡sicosAula recursos f+¡sicos
Aula recursos f+¡sicos
 
Sistemas agroflorestais
Sistemas agroflorestaisSistemas agroflorestais
Sistemas agroflorestais
 
IRRIGAÇÃO: MÉTODOS, SISTEMAS E APLICAÇÕES
IRRIGAÇÃO: MÉTODOS, SISTEMAS E APLICAÇÕESIRRIGAÇÃO: MÉTODOS, SISTEMAS E APLICAÇÕES
IRRIGAÇÃO: MÉTODOS, SISTEMAS E APLICAÇÕES
 
Apostila propagacao de arvores frutiferas
Apostila propagacao de arvores frutiferasApostila propagacao de arvores frutiferas
Apostila propagacao de arvores frutiferas
 
Teoria da Trofobiose
Teoria da Trofobiose Teoria da Trofobiose
Teoria da Trofobiose
 
Colheita e Comercialização do Girassol
Colheita e Comercialização do GirassolColheita e Comercialização do Girassol
Colheita e Comercialização do Girassol
 
Silvicultura
SilviculturaSilvicultura
Silvicultura
 
Palestra abc
Palestra abcPalestra abc
Palestra abc
 
Cadastro Ambiental Rural - CAR
Cadastro Ambiental Rural - CARCadastro Ambiental Rural - CAR
Cadastro Ambiental Rural - CAR
 
Métodos de extensão rural
Métodos de extensão ruralMétodos de extensão rural
Métodos de extensão rural
 
projeto de suinocultura (trabalho do curso de técnico agrícola)
projeto de suinocultura (trabalho do curso de técnico agrícola)projeto de suinocultura (trabalho do curso de técnico agrícola)
projeto de suinocultura (trabalho do curso de técnico agrícola)
 
Monitoramento bioclimático para sigatoka amarela
Monitoramento bioclimático para sigatoka amarelaMonitoramento bioclimático para sigatoka amarela
Monitoramento bioclimático para sigatoka amarela
 
Delineamentos estatísticos
Delineamentos estatísticosDelineamentos estatísticos
Delineamentos estatísticos
 
Silvicultura de Precisão
Silvicultura de PrecisãoSilvicultura de Precisão
Silvicultura de Precisão
 
Planejamento e implantação de povoamentos florestais
Planejamento e implantação de povoamentos florestaisPlanejamento e implantação de povoamentos florestais
Planejamento e implantação de povoamentos florestais
 

Semelhante a Dados da Rede CAN Bus para Avaliação do Comportamento do Operador de Colheita Florestal utilizando Ferramentas de Data Science

Programa computacional para seleção de engrenagens
Programa computacional para seleção de engrenagensPrograma computacional para seleção de engrenagens
Programa computacional para seleção de engrenagensWelington Vale
 
PLANEJAMENTO A NÍVEL DE PROJETO DAS OPERAÇÕES LOGÍSTICAS.pdf
PLANEJAMENTO A NÍVEL DE PROJETO DAS OPERAÇÕES LOGÍSTICAS.pdfPLANEJAMENTO A NÍVEL DE PROJETO DAS OPERAÇÕES LOGÍSTICAS.pdf
PLANEJAMENTO A NÍVEL DE PROJETO DAS OPERAÇÕES LOGÍSTICAS.pdfNewtonCosta14
 
Ecologia e telecomunicações
Ecologia e telecomunicaçõesEcologia e telecomunicações
Ecologia e telecomunicaçõesJustino Lourenço
 
Aplicação da telemática na agricultura moderna cana-de-açucar
Aplicação da telemática na agricultura moderna   cana-de-açucarAplicação da telemática na agricultura moderna   cana-de-açucar
Aplicação da telemática na agricultura moderna cana-de-açucarAndrei Sampedro
 
OPTIMIZAÇÃO DA RECOLHA SELECTIVA DE RESÍDUOS SÓLIDOS URBANOS
OPTIMIZAÇÃO DA RECOLHA SELECTIVA DE RESÍDUOS SÓLIDOS URBANOSOPTIMIZAÇÃO DA RECOLHA SELECTIVA DE RESÍDUOS SÓLIDOS URBANOS
OPTIMIZAÇÃO DA RECOLHA SELECTIVA DE RESÍDUOS SÓLIDOS URBANOSIgor Boieiro
 
Ct136 AuditóRio 2 Francisco Salvador
Ct136   AuditóRio 2   Francisco SalvadorCt136   AuditóRio 2   Francisco Salvador
Ct136 AuditóRio 2 Francisco SalvadorFrancisco Salvador
 
RioInfo 2010 - Fórum de Negócios - Salão da Inovação - Marcos Marconi
RioInfo 2010 - Fórum de Negócios - Salão da Inovação - Marcos MarconiRioInfo 2010 - Fórum de Negócios - Salão da Inovação - Marcos Marconi
RioInfo 2010 - Fórum de Negócios - Salão da Inovação - Marcos MarconiRio Info
 
Motorola Solutions para Indústria Minera_PT_102314_v3
Motorola Solutions para Indústria Minera_PT_102314_v3Motorola Solutions para Indústria Minera_PT_102314_v3
Motorola Solutions para Indústria Minera_PT_102314_v3Motorola Solutions LatAm
 
Utilização de motorroçadora
Utilização de motorroçadoraUtilização de motorroçadora
Utilização de motorroçadoraCarlos Alves
 
A IMPORTÂNCIA DO CONHECIMENTO DE CIÊNCIA DE DADOS PARA GESTORES DE USINAS
A IMPORTÂNCIA DO CONHECIMENTO DE CIÊNCIA DE DADOS PARA GESTORES DE USINASA IMPORTÂNCIA DO CONHECIMENTO DE CIÊNCIA DE DADOS PARA GESTORES DE USINAS
A IMPORTÂNCIA DO CONHECIMENTO DE CIÊNCIA DE DADOS PARA GESTORES DE USINASMarcio Venturelli
 
CONCEITOS E APLICAÇÕES DE REDES MEC
CONCEITOS E APLICAÇÕES DE REDES MECCONCEITOS E APLICAÇÕES DE REDES MEC
CONCEITOS E APLICAÇÕES DE REDES MECJúlio César Magro
 
18.ago topázio 12.15_373_aeselpa
18.ago topázio 12.15_373_aeselpa18.ago topázio 12.15_373_aeselpa
18.ago topázio 12.15_373_aeselpaitgfiles
 
Planejamento de Capacidade em infra-estruturas suportadas por serviço terceir...
Planejamento de Capacidade em infra-estruturas suportadas por serviço terceir...Planejamento de Capacidade em infra-estruturas suportadas por serviço terceir...
Planejamento de Capacidade em infra-estruturas suportadas por serviço terceir...Joao Galdino Mello de Souza
 
O contributo das tecnologias de informação e comunicação para a sustentabilid...
O contributo das tecnologias de informação e comunicação para a sustentabilid...O contributo das tecnologias de informação e comunicação para a sustentabilid...
O contributo das tecnologias de informação e comunicação para a sustentabilid...ISA - Intelligent Sensing Anywhere
 
Sistemas de Medição Inteligente
Sistemas de Medição InteligenteSistemas de Medição Inteligente
Sistemas de Medição Inteligenteslides-mci
 

Semelhante a Dados da Rede CAN Bus para Avaliação do Comportamento do Operador de Colheita Florestal utilizando Ferramentas de Data Science (20)

Programa computacional para seleção de engrenagens
Programa computacional para seleção de engrenagensPrograma computacional para seleção de engrenagens
Programa computacional para seleção de engrenagens
 
PLANEJAMENTO A NÍVEL DE PROJETO DAS OPERAÇÕES LOGÍSTICAS.pdf
PLANEJAMENTO A NÍVEL DE PROJETO DAS OPERAÇÕES LOGÍSTICAS.pdfPLANEJAMENTO A NÍVEL DE PROJETO DAS OPERAÇÕES LOGÍSTICAS.pdf
PLANEJAMENTO A NÍVEL DE PROJETO DAS OPERAÇÕES LOGÍSTICAS.pdf
 
Ecologia e telecomunicações
Ecologia e telecomunicaçõesEcologia e telecomunicações
Ecologia e telecomunicações
 
Apresentacao bolsistas
Apresentacao bolsistasApresentacao bolsistas
Apresentacao bolsistas
 
Aplicação da telemática na agricultura moderna cana-de-açucar
Aplicação da telemática na agricultura moderna   cana-de-açucarAplicação da telemática na agricultura moderna   cana-de-açucar
Aplicação da telemática na agricultura moderna cana-de-açucar
 
OPTIMIZAÇÃO DA RECOLHA SELECTIVA DE RESÍDUOS SÓLIDOS URBANOS
OPTIMIZAÇÃO DA RECOLHA SELECTIVA DE RESÍDUOS SÓLIDOS URBANOSOPTIMIZAÇÃO DA RECOLHA SELECTIVA DE RESÍDUOS SÓLIDOS URBANOS
OPTIMIZAÇÃO DA RECOLHA SELECTIVA DE RESÍDUOS SÓLIDOS URBANOS
 
Ct136 AuditóRio 2 Francisco Salvador
Ct136   AuditóRio 2   Francisco SalvadorCt136   AuditóRio 2   Francisco Salvador
Ct136 AuditóRio 2 Francisco Salvador
 
RioInfo 2010 - Fórum de Negócios - Salão da Inovação - Marcos Marconi
RioInfo 2010 - Fórum de Negócios - Salão da Inovação - Marcos MarconiRioInfo 2010 - Fórum de Negócios - Salão da Inovação - Marcos Marconi
RioInfo 2010 - Fórum de Negócios - Salão da Inovação - Marcos Marconi
 
Motorola Solutions para Indústria Minera_PT_102314_v3
Motorola Solutions para Indústria Minera_PT_102314_v3Motorola Solutions para Indústria Minera_PT_102314_v3
Motorola Solutions para Indústria Minera_PT_102314_v3
 
Redes industriais
Redes industriaisRedes industriais
Redes industriais
 
Utilização de motorroçadora
Utilização de motorroçadoraUtilização de motorroçadora
Utilização de motorroçadora
 
A IMPORTÂNCIA DO CONHECIMENTO DE CIÊNCIA DE DADOS PARA GESTORES DE USINAS
A IMPORTÂNCIA DO CONHECIMENTO DE CIÊNCIA DE DADOS PARA GESTORES DE USINASA IMPORTÂNCIA DO CONHECIMENTO DE CIÊNCIA DE DADOS PARA GESTORES DE USINAS
A IMPORTÂNCIA DO CONHECIMENTO DE CIÊNCIA DE DADOS PARA GESTORES DE USINAS
 
Redes4
Redes4Redes4
Redes4
 
CONCEITOS E APLICAÇÕES DE REDES MEC
CONCEITOS E APLICAÇÕES DE REDES MECCONCEITOS E APLICAÇÕES DE REDES MEC
CONCEITOS E APLICAÇÕES DE REDES MEC
 
18.ago topázio 12.15_373_aeselpa
18.ago topázio 12.15_373_aeselpa18.ago topázio 12.15_373_aeselpa
18.ago topázio 12.15_373_aeselpa
 
Demandas cemig
Demandas cemigDemandas cemig
Demandas cemig
 
Planejamento de Capacidade em infra-estruturas suportadas por serviço terceir...
Planejamento de Capacidade em infra-estruturas suportadas por serviço terceir...Planejamento de Capacidade em infra-estruturas suportadas por serviço terceir...
Planejamento de Capacidade em infra-estruturas suportadas por serviço terceir...
 
O contributo das tecnologias de informação e comunicação para a sustentabilid...
O contributo das tecnologias de informação e comunicação para a sustentabilid...O contributo das tecnologias de informação e comunicação para a sustentabilid...
O contributo das tecnologias de informação e comunicação para a sustentabilid...
 
Umbirussu Simulacao CCT
Umbirussu   Simulacao CCTUmbirussu   Simulacao CCT
Umbirussu Simulacao CCT
 
Sistemas de Medição Inteligente
Sistemas de Medição InteligenteSistemas de Medição Inteligente
Sistemas de Medição Inteligente
 

Mais de Dennis Bernardi

Transformação Digital na Floresta
Transformação Digital na FlorestaTransformação Digital na Floresta
Transformação Digital na FlorestaDennis Bernardi
 
VANT no Planejamento de uso e ocupação do solo
VANT no Planejamento de uso e ocupação do soloVANT no Planejamento de uso e ocupação do solo
VANT no Planejamento de uso e ocupação do soloDennis Bernardi
 
Geotecnologias Aplicadas ao Agronegócio
Geotecnologias Aplicadas ao AgronegócioGeotecnologias Aplicadas ao Agronegócio
Geotecnologias Aplicadas ao AgronegócioDennis Bernardi
 
Lidar processamentos iniciais
Lidar   processamentos iniciaisLidar   processamentos iniciais
Lidar processamentos iniciaisDennis Bernardi
 
Geotecnologias aplicadas à Gestão Florestal
Geotecnologias aplicadas à Gestão FlorestalGeotecnologias aplicadas à Gestão Florestal
Geotecnologias aplicadas à Gestão FlorestalDennis Bernardi
 
O GIS como base para a Silvicultura de Precisão na FIBRIA
O GIS como base para a Silvicultura de Precisão na FIBRIAO GIS como base para a Silvicultura de Precisão na FIBRIA
O GIS como base para a Silvicultura de Precisão na FIBRIADennis Bernardi
 

Mais de Dennis Bernardi (8)

Distância de Baldeio
Distância de BaldeioDistância de Baldeio
Distância de Baldeio
 
Gis forest 2021
Gis forest  2021 Gis forest  2021
Gis forest 2021
 
Transformação Digital na Floresta
Transformação Digital na FlorestaTransformação Digital na Floresta
Transformação Digital na Floresta
 
VANT no Planejamento de uso e ocupação do solo
VANT no Planejamento de uso e ocupação do soloVANT no Planejamento de uso e ocupação do solo
VANT no Planejamento de uso e ocupação do solo
 
Geotecnologias Aplicadas ao Agronegócio
Geotecnologias Aplicadas ao AgronegócioGeotecnologias Aplicadas ao Agronegócio
Geotecnologias Aplicadas ao Agronegócio
 
Lidar processamentos iniciais
Lidar   processamentos iniciaisLidar   processamentos iniciais
Lidar processamentos iniciais
 
Geotecnologias aplicadas à Gestão Florestal
Geotecnologias aplicadas à Gestão FlorestalGeotecnologias aplicadas à Gestão Florestal
Geotecnologias aplicadas à Gestão Florestal
 
O GIS como base para a Silvicultura de Precisão na FIBRIA
O GIS como base para a Silvicultura de Precisão na FIBRIAO GIS como base para a Silvicultura de Precisão na FIBRIA
O GIS como base para a Silvicultura de Precisão na FIBRIA
 

Dados da Rede CAN Bus para Avaliação do Comportamento do Operador de Colheita Florestal utilizando Ferramentas de Data Science

  • 1. Trabalho apresentado para obtenção do título de especialista em Data Science e Analytics – 2022 1 Dados da Rede CAN Bus para Avaliação do Comportamento do Operador de Colheita Florestal utilizando Ferramentas de Data Science Dennis Bernardi ¹*; Fernando Vasconcelos2 1 Suzano S/A. Consultor Excelência Operacional - Transformação Digital, Geotecnlogias e Analytcs. Rod. General Euryale de Jesys Zerbine, Km 84; 12310-123 Jacareí, SP, Brasil 2 Orientador, USP/Esalq. Doutorando FEA/USP. Universidade de São Paulo Avenida Professor Luciano Gualberto, 908, Butantã. São Paulo/SP. CEP: 05508-010 Fortaleza, Ceará, Brasil
  • 2. Trabalho apresentado para obtenção do título de especialista em Data Science e Analytics – 2022 2 Dados da Rede CAN Bus para Avaliação da Comportamento do Operador de Colheita Florestal utilizando Ferramentas de Data Science Resumo O presente Trabalho de Conclusão de Curso [TCC], objetivou avaliar a utilização de dados da rede CAN Bus de Harvesters Florestais, através de técnicas de data mining e machine learning, obtendo insigths operacionais relacionados ao consumo de diesel. A CAN Bus, nos entregou 59 variáveis, optamos por avaliar a correlação de Pearson de 15 variáveis com o consumo de diesel, sendo que 5 apresentaram correlação positiva (Engine Percent Load At Current Speed, Actual Engine - Percent Torque, Accelerator Pedal Position 1, Engine Speed e Engine Torque Mode), como variáveis independentes elaboramos equações múltiplas, para representar o comportamento da variável dependente, consumo de diesel (L/hora), porém com baixa correção. Então buscamos a utilização de técnicas de Machine Learning, K-NN (K-Nearest Neighbors), usando as mesmas 5 variáveis, classificar os operadores como Operador Ótimo e Operador Oportunidade, obtendo-se uma acurácia superior a 90%. Demonstramos assim que os dados da rede CAN Bus dos Harvesters, tem grande potencial para auxiliar na tomada de decisão operacional, bem como apoiar na classificação dos operadores, focando os treinamentos nos operadores que realmente necessitam. Também podemos notar que uma melhor gestão do diesel, podem contribuir com a redução de custos operacionais, além de contribuir para questões relacionadas aos temas ESG, tornando os custos de implantação da tecnologia de leitura da CAN Bus, viáveis operacionalmente. Oportunidades ficam para no futuro próximo também lermos dados da CAN Bus do Joystick das máquinas, assim podemos traçar ainda melhor o perfil comportamental dos operadores, contribuindo ainda mais para a Excelência Operacinal florestal. Palavras-chave: Colheita Florestal; Machine Leaning; CAN Bus; K-NN. CAN Bus Network Data for Forest Harvesting Operator Behavior using Data Science Tools Abstract This TCC evaluate the use of data from the CAN Bus network of Forestry Harvesters, through data mining and machine learning techniques, to obtain operational insights related to diesel consumption. CAN Bus gave us 59 variables, we chose to evaluate the Pearson correlation of 15 variables with diesel consumption, 5 of which showed a positive correlation (Engine Percent Load At Current Speed, Actual Engine - Percent Torque, Accelerator Pedal Position 1, Engine Speed and Engine Torque Mode), as independent variables we seek to elaborate multiple equations, which represent if the behavior of the dependent variable, diesel consumption (L/hour), the result showed a low correction. So we started using the Machine Learning technique, K-NN (K-Nearest Neighbors), to classify the operators as Excelente Operator and Opportunity Operator from this variables, where we obtained an accuracy greater than 90%. We thus demonstrate that the use of data from the Harvesters CAN Bus network has great potential to assist in operational decision making, as well as to support the classification of operators who have the greatest need for training of others, thus focusing training on operators who really need it. We can also notice that better diesel management can contribute to the reduction costs, addition to contributing to ESG, making the costs of implementing the CAN Bus reading technology operationally viable. Opportunities remain for the near future to also read CAN Bus data from the machines' Joystick, so we can better trace the behavioral profile of operators, contributing even more to Forest Operational Excellence. Keywords: Forest Harvesting; Machine Leaning; CAN Bus; K-NN.
  • 3. Trabalho apresentado para obtenção do título de especialista em Data Science e Analytics – 2022 3 Introdução O setor de árvores plantadas atua há anos com produção sustentável, provendo inúmeros produtos de origem renovável essenciais para o dia a dia das pessoas como móveis, livros, pisos laminados, painéis de madeira, papéis higiênicos e embalagens. Além de prover o hoje, essa indústria também está de olho no futuro, investindo em pesquisa e inovação para oferecer cada vez mais bioprodutos ou biomateriais da economia circular, biodegradáveis e recicláveis (IBÁ, 2021). Com posição de destaque no desenvolvimento de uma economia de baixo carbono, o setor de base florestal é destacado por sua alta produtividade, tecnologia incorporada, melhores práticas de manejo florestal, responsabilidade social e modernas instalações produtivas. Com uma área total de árvores cultivadas somando 9 milhões de hectares, atua, comumente, em áreas anteriormente degradadas pela ação humana. Com um olhar cuidadoso para o meio ambiente, o setor conta com 5,9 milhões de hectares destinados para Áreas de Preservação Permanente [APP], Reserva Legal [RL] e Reservas Particulares do Patrimônio Natural [RPPN] (IBÁ, 2021). Dentro desses 9 milhões de hectares, vivemos em um momento de grande modernização no sistema de Colheita Florestal, destacando-se dentro os diferentes sistemas cut-to-length, o qual consiste em um sistema de colheita mecanizada no qual as árvores são desgalhadas e processadas em toras atendendo à demanda fabril. Tal sistema é composto do conjunto de máquinas Harvester e Forwarder. Com cada vez mais essas máquinas de alta capacidade de produção permitem que as operações de corte e baldeio de florestas de eucalipto sejam realizadas de forma sistemática e em alta escala. Entretanto, um ponto de suma importância para termos uma atividade com o menor custo possível e alta disponibilidade é a implantação de sistemas gestão de combustíveis e de manutenção, eliminando-se assim a dependência de apontamentos manuais, que para serem integrados aos sistemas de gestão demandam de ações humanas. A redução do consumo de combustível impacta diretamente na redução do custo da madeira produzida, bem como contribui para a mitigação de gases de efeito estufa, pontos relacionados as questões de Environmental, Social, and corporate Governance [ESG], cada dia mais presentes na nossa sociedade. Uma economia no consumo de combustível nos harvesters de colheita florestal pode ser conseguida através de capacitação de operadores, a qual está dentro da rotina da equipe de corte e através de conjuntos de equipamentos com melhores performance operacional, litros/m³ produzido.
  • 4. Trabalho apresentado para obtenção do título de especialista em Data Science e Analytics – 2022 4 Foi somente a partir da década de 1990, com a abertura das importações, falta de mão de obra no campo e também a necessidade de se executar o trabalho de forma mais ergonômica e com maior eficiência, que as empresas iniciaram a mecanização das operações de colheita de forma mais intensiva. Atualmente, os principais métodos de colheita mecanizada são: “árvore completa” ( full-tree [FT]) e o de “corte no comprimento” (cut-to-length [CTL]). O método FT, como o nome diz as áreas são cortadas inteiras, utilizando-se Feller Buncher e depois essas são arrastadas para a borda do talhão e então processadas para transporte. No método CTL, o harvester abate a árvore e processa em diferentes medidas dentro do talhão, as quais são posteriormente baldeada para a borda utilizando-se de Forwarders. É típico para o método CTL o processamento de diferentes dimensões de toras, que são chamadas sortimentos, derivados de uma mesma árvore (Miolanem, 2021). Na Suzano, temos os dois sistemas operacionais, FT e CTL, porém o CTL é o predominante no processo, sendo que temos múltiplos sortimento de madeira, variando-se o comprimento da madeira conforme configuração das fábrica que recebem essa madeira, no processo CTL, processamos a madeira sem casca até um diâmetro de 4cm, deixando no interior do talhão os resíduos, cascas, galhos e folhas, os quais são incorporados como adubação verde ao próximo ciclo de produção florestal, otimizando-se assim os custos para formação do próximo ciclo de produção florestal. A CAN Bus ou Barramento Controller Area Network, foi desenvolvido pela empresa alemã Robert BOSCH e disponibilizado em meados dos anos 80, tendo sua aplicação inicial focada em ônibus e caminhões. Atualmente, é amplamente utilizado na indústria, em veículos automotivos, navios e tratores, entre outros (Alexag, 2021). O CAN é um protocolo de comunicação serial síncrono, sendo que o sincronismo entre os módulos conectados à rede é feito em relação ao início de cada mensagem lançada ao barramento (evento que ocorre em intervalos de tempo conhecidos e regulares) (Alexag, 2021). Os fundamentos do CAN são especificados por duas normas: a ISO11898 e a ISO11519-2. A primeira, ISO11898, determina as características de uma rede trabalhando com alta velocidade de transmissão de dados, de 125Kbps a 1Mbps. A segunda, ISO11519- 2, determina as características de uma rede trabalhando com baixa velocidade, de 10Kbps a 125Kbps (Alexag, 2021). Toda comunicação das redes CAN é baseada em mensagens, que são transportadas em quadros de bits, que por sua vez são formadas por campos, que são conjuntos de bits com determinada função no quadro (MAPA, 2001). O esquema apresentado na Figura 1, ilustra uma mensagem CAN e dos tipos de quadro de dados do CAN, formado por campos de bits.
  • 5. Trabalho apresentado para obtenção do título de especialista em Data Science e Analytics – 2022 5 Figura 1. Quadro e Mensagens CAN Fonte: MAPA (2001) Uma mensagem da CAN é formada pelo Campo de Dados, ao qual está associado um campo que caracteriza a mensagem. No caso do CAN, este campo que caracteriza a mensagem é denominado Identificador, e define a prioridade de cada mensagem. O valor do identificador para as mensagens de cada nó é exclusivo, e quanto mais baixo o valor de um Identificador maior é a prioridade das mensagens desse nó. Utilizando um identificador os vários nós fazem o escalonamento do acesso ao meio. Quando os nós recebem a mensagem transmitida por um determinado nó, realizam o teste de aceitação e verificam se a mensagem tem interesse para esse nó ou não, através do identificador, (MAPA, 2001). Não é objetivo desse Trabalho de Conclusão de Curso [TCC], detalhar o protocolo CAN, porém vale ressaltar que os padrões baseados neste protocolo apresentam características expressivas para aplicação diversas, sendo elas em máquinas florestais, agrícolas ou até maquinário pesado destinado à mineração ou mesmo obras de engenharia, tendo seu emprego avançado rapidamente. No setor agrícola a utilização deste protocolo tem sido fomentada por associações de normas internacionais de expressão, como NMEA, ISO, SAE e DIN, além de empresas de equipamentos agrícolas e outros grupos. Os dados utilizados neste TCC, foram oriundos de uma Proof of Concept [POC], realizado na Suzano no segundo semestre de 2021, em conjunto com a empresa IoTag (https://iotag.com.br), a qual é detentora da tecnologia para leitora de rede CAN Bus dos Harvester da Suzano! O objetivo do presente TCC, é apresentar uma alternativa para melhorarmos a gestão de diesel no processo de colheita florestal, utilizando técnicas de data mining e machine learning, sendo que para isso foi feita a leitura dos dados presente na rede CAN Bus de 3 Harvestes, para obtenção do consumo instantâneo e outras variáveis que possam estar relacionadas à sua variação. Como objetivos específicos temos: • Ler a rede CAN das máquinas florestais, Harvester;
  • 6. Trabalho apresentado para obtenção do título de especialista em Data Science e Analytics – 2022 6 • Avaliar a quantidade de informações, periodicidade de informações que são, possível de serem coletadas da rede CAN Bus dos Harvesters; • Analisar e comparar as variações de faixa de consumo ocorridas nos 3 turnos operacionais; • Propor um cenário para otimização do consumo de diesel, baseado nos dados coletados; • Avaliar se podemos através de técnicas de data mining e machine learning, diferenciar os operadores em duas classes, relacionadas ao consumo de combustível. Material e Métodos Esse trabalho foi desenvolvido, utilizando-se dados da leitura da CAN Harvesters, tratores especializados em corte de madeira, que fazem parte do parque de máquinas da Suzano S/A, na unidade SP, a escolha dessas máquinas se deve ao processo de POC (Proof Of Concept) que foi conduzida na Suzano, junto com a empresa IoTag (https://iotag.com.br), tem a tecnologia dos leitores de rede CAN Bus. Para análise dos dados, foi feito uso da estatística descritiva, onde buscamos a comparação da variação do consumo entre máquinas e turnos, nos diferentes dias que temos dados coletados, buscamos uma alternativa para definir o melhor padrão de consumo, bem como uma proposta de como buscar esse padrão nos demais turnos e máquinas. A partir da análise exploratória dos dados, buscamos através da correlação de Pearson, a qual é uma medita que varia entre -1 e 1, onde por meio do sinal resultante, podemos identificar o tipo de relação linear entre as variáveis analisadas, onde quanto mais próximo dos extremos (-1 e 1) mais forte é a correlação entre as variáveis (Fávero e Belfiore ,2022). Segundo Fávero e Belfiore (2022), correlação positivas, indicam uma relação diretamente proporcional entre as variáveis, gerando uma correlação linear positiva, já correlações negativas, indicam uma relação inversamente proporcional entre as variáveis, gerando uma correlação linear negativa, valores nulos, demostram que não existem correlações entre as variáveis. Como identificamos algumas variáveis com melhor correlação com o consumo de diesel, buscamos avaliar se seria possível termos equações lineares, capaz de explicar a variação de consumo. No caso, optamos pela tentativa de uso de equações múltipla, onde mais de uma variável (X1, X2, Xn) é utilizada para tentar explicar a variação de consumo de diesel (Y).
  • 7. Trabalho apresentado para obtenção do título de especialista em Data Science e Analytics – 2022 7 Fávero e Belfiore (2022), comentam que o conceito ceteris paribus (mantidas as demais condições constantes), deve ser utilizado na análise da regressão múltipla, uma vez que a interpretação do parâmetro de cada variável será feita isoladamente. Assim um modelo com duas variáveis explicativas, X1 e X2, os respectivos coeficientes serão analisados de forma a considerar todos os outros fatores constantes. Como temos dados com alta multicolinearidade, entre as possíveis variáveis explicativas para o consumo de Diesel, a alternativa para identificar melhor os padrões de comportamento, foi trabalharmos com análise de agrupamentos, a qual segundo Fávero e Belfiore (2022), são muito úteis e que podem ser aplicadas quando há a intenção de se verificar a existência de comportamentos semelhantes entre as observações, em relação a determinadas variáveis e o objetivo de se criar grupos ou clusters, em que prevaleça a homogeneidade interna. No nosso caso, essa homogeneidade tem o objetivo de identificarmos os melhores operadores, visando não citar nomes, iremos trabalhar com os dados agrupados por turno operacional, ondem criaremos duas classes, que chamaremos neste trabalho de Operador Ótimo (1) e Operador Oportunidade (0), respectivamente associados à operadores com média de consumo menor ou igual a média do Harvester no período e operadores com média de consumo maior que a média do Harvester no período. Buscando identificar padrões, utilizamos um método relativamente simples, porém com excelentes resultados, K — Nearest Neighbors [K-NN], o qual permite com baixo poder de processamento, análise e inferência em grandes volumes de dados. É um dos muitos algoritmos, de aprendizagem supervisionada, usado no campo de data mining e machine learning, ele é um classificador onde o aprendizado é baseado “no quão similar” é um dado (um vetor) do outro. O treinamento é formado por vetores de n dimensões. Segundo Rocha Neto e Menezes Jr (2019), o K-NN é uma classificador sub-ótimo que cria fronteiras de decisões complexas a partir de um conjunto de padrões de treinamento com classes conhecidas a priori. Mais precisamente, para um dado vetor característico no conjunto teste, os vetores de K mais próximos no conjunto de treino são selecionados de acordo com alguma medida de distância e o vetor de características de teste é atribuído ao rótulo mais representado na classe dos K vizinhos. Classificar um exemplo desconhecido com o algoritmo K-NN pode ser resumido nos seguintes passos (Rocha Neto e Menezes Jr, 2019), (Figura 2): • Calcular a distância entre o exemplo desconhecido e os outros exemplos do conjunto de treinamento; • Identificar os K vizinhos mais próximos;
  • 8. Trabalho apresentado para obtenção do título de especialista em Data Science e Analytics – 2022 8 • Utilizar o rótulo da classe de vizinhos mais próximos para determinar o rótulo de classe do exemplo desconhecido em uma espécie de votação. Figura 2. Classificação do K-NN Fonte: Rocha Neto e Menezes Jr (2019) Resultados e Discussão Durante a POC, conseguimos ler a rede CAN Bus de 3 Harvesters Komatsu PC200F com cabeçote processador, conforme Tabela 1 e no Anexo 1 onde estão listadas as variáveis lidas. Tabela 1. Lista de Harvester, dias com dados coletados e horas trabalhadas Nome Equipamento Dias de Leitura da Rede CAN Bus Horas Totais Trabalhadas HV – Estrovenga 55 (7/out a 30/nov/2021) 942h 25min 00seg HV – Relâmpago 1.007h 44min 11seg HV - Magnata 1.061h 34min 06seg Total 3.011h 43min 17seg Fonte: Resultados da pesquisa Buscando uma análise inicial dos dados, fizemos uso da estatística descritiva a qual fornece resumos simples sobre as amostras, segregadas por Harvester, sobre as observações que foram feitas, durante a coleta de dados. Tabela 2. Vale aqui explicar como funcionam os turnos na Suzano S/A, são todos de 8 horas sendo que o primeiro turno, inicia-se as 00:00 horas, o segundo turno inicia-se as 08:00 horas e o terceiro turno inicia-se as 16:00 horas. Analisando a Tabela 2, podemos notar que uma variação considerável entre os Harvester, sendo o HV – Estrovenga com o pior consumo médio, também temos variações, menores, mas não menos importantes entre os turnos em um mesmo Harvester, lembrando que como estamos olhando para todos os dados coletados, temos uma variação de operadores, sendo que um mesmo operador pode ter trabalhado em mais de um turno, aqui não vamos entrar no detalhe a nível de operador.
  • 9. Trabalho apresentado para obtenção do título de especialista em Data Science e Analytics – 2022 9 Analisando-se a média dos três turnos, o melhor Harvester, foi o HV – Relâmpago, com consumo médio de 21,50 litros/hora trabalhada, seguido pelo HV – Magnata com 21,68 litro/hora trabalhada, já o HV – Estrovenga, teve o pior consumo médio de 23,22 litro/hora, sendo estes harvesters, respectivamente, 0,79% e 7,40% acima do HG - Relâmpago. Olhando o alto consumo do HV – Estrovenga, as possíveis explicações para a grande variação de consumo, seria comportamento dos operadores que trabalham neste Harvester, porém pela leitura da rede CAN Bus, o HV – Estrovenga é o equipamento com mais horas trabalhadas, 19.619 horas contra 3.143 e 8.429 horas respectivamente dos HV – Magnata a e do HV – Relâmpago (Tabela 3). Baseado nesta variação do horímetro, não podemos inferir somente com dados da rede CAN Bus, que somente os operadores são responsáveis pela variação de consumo, precisaríamos avaliar também as condições de manutenção das máquinas Tabela 2. Análise descritiva dos dados coletados, consumo de combustível, mínimo, médio e máximo no período analisado Harvester Turno Variação Consumo (L/H) Mínimo Médio Máximo HV - Estrovenga Primeiro 5,14 23,14 45,00 Segundo 5,07 23,11 45,00 Terceiro 5,10 23,41 47,37 Média 5,07 23,22 47,37 HV - Relâmpago Primeiro 5,14 21,21 45,00 Segundo 5,14 21,55 45,00 Terceiro 5,14 21,78 45,00 Média 5,14 21,50 45,00 HV - Magnata Primeiro 5,14 21,41 45,00 Segundo 5,10 21,79 45,00 Terceiro 5,08 21,84 45,00 Média 5,08 21,68 45,00 Fonte: Resultados da pesquisa Tabela 3. Variação do Horímetro dos Harvesters durante a POC Harvester Horímetro Final POC HV Estrovenga 19.619 HV Relâmpago 8.429 HV Magnata 3.143 Fonte: Resultados da pesquisa No Anexo 2, apresentamos a variação de consumo diária por máquina, assim podemos ter um melhor detalhamento da variação média, o que nos permite demonstrar que
  • 10. Trabalho apresentado para obtenção do título de especialista em Data Science e Analytics – 2022 10 trabalhar com uma média diária é muito mais eficiente do que trabalhar com uma média de um período, Anexo 2 comparado com a Tabela 2. Já na Tabela 4, demostramos a melhor e pior média de cada um dos Harvesters segregados por Turno, bem como o percentual de oportunidade que temos na variação dessas duas métricas. Sendo que o HV – Estrovenga no primeiro turno apresentou a maior variação de média diária, 18,86 litros/hora no melhor dia contra 24,95 litros/hora no pior dia, uma variação de 32,3% já o HV – Magnata, teve a menor variação percentual, a qual ocorreu no segundo turno, mesmo assim sendo um valor bastante considerável, 13,8%, 20,05 litros/hora no melhor dia contra 22,80 litros/hora no pior dia. Parte dessas variações podem ser explicadas devido as diferenças de produtividade (m³), relevo do terreno, nas áreas trabalhadas no período da POC, porém podemos notar que o HV – Magnata, que é o mais novo de todos apresentou-se a menor variação dentro os 3 HV, evidenciando aqui que temos alguma oportunidade na manutenção e regulagem das máquinas com o avanço na sua utilização (horímetro). Tabela 4. Resumo do consumo por turno e Harvesters Métrica HV - Estrovenga HV - Relâmpago HV - Magnata Primeiro Segundo Terceiro Primeiro Segundo Terceiro Primeiro Segundo Terceiro Melhor Média 18,86 20,37 20,33 18,78 18,60 18,94 19,54 20,05 20,02 Pior Média 24,95 24,15 24,69 22,66 23,98 23,53 22,81 22,80 23,23 % Variação Melhor vs Pior Média 32,3% 18,6% 21,5% 20,6% 28,9% 24,2% 16,8% 13,8% 16,0% Fonte: Resultados da pesquisa Analisando-se a variação da melhor média, entre os turnos, notamos que o HV- Estrovenga tem uma variação média do melhor turno com os outros dois de 7,9%, já o HV- Relâmpago tem uma variação de 1,4% entre o melhor turno e os demais e finalmente o HV- Magnata tem uma variação média de 2,5% entre o melhor turno e os demais. Mais uma evidência que temos oportunidades na manutenção e regulagens do HV-Estrovenga, melhorando assim sua variação de consumo. Considerando uma hipótese, de melhorarmos o desempenho entre os turnos em cada HV de permitirmos uma variação da média de até +10%, utilizando-se a melhor média de cada HV, temos as seguintes hipóteses: • HV-Estrovenga, 18,86 litros/hora, no primeiro turno, temos um limite operacional de 20,75 litros/hora;
  • 11. Trabalho apresentado para obtenção do título de especialista em Data Science e Analytics – 2022 11 • HV-Relâmpago, 18,60 litros/hora, no primeiro turno, temos um limite operacional de 20,46 litros/hora. • HV-Magnata, 19,54 litros/hora, no primeiro turno, temos um limite operacional de 21,49 litros/hora. Também podemos considerar que deveríamos buscar uma meta de consumo para todas as máquinas, sendo essa meta definhada pelo melhor consumo registrado, que é do HV-Relâmpado, 18,60 litros/hora + 10% = 20,46 litros/hora. Com base neste limite operacional, simulamos a oportunidade de redução de diesel, se todo consumo acima dessa média independente do Harvester e/ou turno, for evitado. Nas tabelas 5 e 6, demostramos respetivamente o total de horas trabalhadas acima da meta de consumo, 20,46 litros/hora, evidenciando qual seria o ganho potencial de litros de diesel se trabalhássemos para atingir essa meta. Considerando que temos aproximadamente 3.012 horas efetivamente trabalhadas registradas (Tabela 1), contamos pela análise da tabela 5, que em mais de 60% do tempo trabalhamos com acima da meta. Tabela 5. Horas trabalhadas acima da meta definida (20,46 litros/hora) de consumo Turnos HV Estrovenga HV Relâmpago HV Magnata Total Geral Primeiro 246h 56min 08seg 163h 12min 18seg 183h 43min 09seg 593h 51min 35seg Segundo 236h 51min 58seg 161h 58min 01seg 201h 06min 54seg 599h 56min 53seg Terceiro 253h 23min 24seg 190h 39min 24seg 220h 05min 50seg 664h 08min 38seg Total Geral 737h 11min 30seg 515h 49min 43seg 604h 55min 53seg 1.857h 57min 06seg Fonte: Resultados da pesquisa Analisando-se os dados da Tabela 5, temos para o período analisado, quase 1.860 horas trabalhadas acima da meta definida para o consumo de diesel (+10%), o que gerou um consumo extra de diesel de 5.583 litros (Tabela 6) para os 3 Harvesters durante os 55 que tivemos monitoramento das atividades. Tabela 6. Oportunidade de redução de consumo de Diesel, baseado na meta definida Turnos HV Estrovenga HV Relâmpago HV Magnata Total Geral Primeiro 864 437 476 1.777 Segundo 825 454 521 1.801 Terceiro 923 520 562 2.005 Total Geral 2.612 1.411 1.559 5.583 Fonte: Resultados da pesquisa
  • 12. Trabalho apresentado para obtenção do título de especialista em Data Science e Analytics – 2022 12 O grande desafio é como tornar esse monitoramento sistemático e efetivo para que possamos realmente termos ganhos operacionais com a redução do consumo de diesel, sendo que se atingirmos esse objetivo teríamos um ganho de 8,23% no total de litros consumidos. Assim sendo, baseando-se nos dados coletados da Rede CAN Bus, quais seriam as variáveis monitoradas, apresentam melhor correlação ao consumo de combustível. Começamos pela análise do Engine Speed, mais conhecido como RPM. A Tabela 7, apresenta 5 classes de RPM que estratificamos os dados e sua média de consumo por turno para cada um dos HV. Assim podemos demostram que conforme aumenta o giro do motor diesel, maior é o consumo médio, sendo que acima de 1.800 RPM temos uma variação média superior a 20% quando comparado à operação na faixa de 1.650 até 1.800 RPM. Tabela 7. Variação do consumo (litro/hora) por faixa de RPM Faixa RPM Turnos HV Estrovenga HV Relâmpago HV Magnata Total Geral menor a 1.200 RPM Primeiro 12,2 13,7 11,9 12,4 Segundo 11,6 13,0 12,6 12,3 Terceiro 14,3 15,1 13,5 14,1 1.200 a 1.650 RPM Primeiro 12,9 12,0 13,8 12,7 Segundo 12,7 12,1 13,3 12,6 Terceiro 13,3 11,9 13,4 12,8 1.650 a 1.800 RPM Primeiro 21,2 17,1 17,8 19,4 Segundo 19,2 17,5 18,5 18,5 Terceiro 18,7 17,9 18,5 18,4 1.800 a 1.900 RPM Primeiro 23,5 21,6 21,8 22,3 Segundo 23,6 22,0 22,1 22,6 Terceiro 23,8 22,1 22,1 22,7 acima 1.900 RPM Primeiro 24,0 21,3 20,9 21,6 Segundo 24,4 21,9 22,3 22,5 Terceiro 24,5 22,1 22,0 22,6 Fonte: Resultados da pesquisa A Tabela 8, demostramos o tempo operacional, em cada uma das faixas de RPM definidas previsamente (Tabela 7), podemos notar que a maior parte do tempo, os 3 Harvesters operam na faixa de 1.800 a 1.900 RPM. Uma avaliação futura da faixa de RPM ótima operacional, pode apresentar oportunidades aqui não avaliadas, relacionando a faixa de RPM capaz de atender a demanda hidráulica do cabeçote de processamento. Na Tabela 9, verificamos o consumo em litro, para cada uma das faixas de RPM criadas, onde podemos notar que trabalhando acimas de 1.900 RPM temos o consumo de
  • 13. Trabalho apresentado para obtenção do título de especialista em Data Science e Analytics – 2022 13 7.797,0 Litros, correspondente à 11,5% do total consumido durante a POC, bastante significativo. Tabela 8. Tempo operação por faixa de RPM Faixa RPM Turnos HV Estrovenga HV Relâmpago HV Magnata Total Geral menor a 1.200 RPM Primeiro 4h 17min 05seg 1h 58min 03seg 4h 13min 29seg 10h 28min 37seg Segundo 4h 49min 26seg 2h 41min 11seg 4h 28min 53seg 11h 59min 30seg Terceiro 4h 19min 45seg 2h 01min 51seg 4h 32min 55seg 10h 54min 31seg 1.200 a 1.650 RPM Primeiro 17h 45min 35seg 21h 00min 41seg 10h 32min 33seg 49h 18min 49seg Segundo 19h 43min 35seg 19h 00min 46seg 13h 27min 31seg 52h 11min 52seg Terceiro 16h 42min 31seg 17h 50min 08seg 13h 33min 31seg 48h 06min 10seg 1.650 a 1.800 RPM Primeiro 12h 19min 30seg 07h 05min 36seg 06h 50min 16 seg 26h 15min 22seg Segundo 09h 50min 22seg 07h 17min 09seg 07h 37min 48seg 24h 45min 19seg Terceiro 09h 12min 25seg 05h 30min 32seg 06h 14min 36seg 20h 57min 33seg 1.800 a 1.900 RPM Primeiro 264h 48min 19seg 283h 27min 58seg 278h 54mn 46seg 827h 11min 03seg Segundo 251h 10min 50seg 236h 33min 54seg 268h 54min 35seg 756h 39min 19seg Terceiro 268h 11min 22seg 267h 13min 18seg 292h 20min 18seg 827h 44min 58seg acima 1.900 RPM Primeiro 21h 53min 59seg 55h 45min 34seg 69h 47min 03seg 147h 26min 36seg Segundo 19h 41min 52seg 45h 02min 05seg 41h 44min 55seg 106h 28min 52seg Terceiro 17h 38min 24seg 35h 15min 25seg 38h 20min 57seg 91h 14min 46seg TOTAL 943h 25min 00seg 1.007h 44min 11seg 1.061h 34min 06seg 3.011h 43min 17seg Fonte: Resultados da pesquisa Tabela 9. Consumo (Litros Totais) para nas faixas de RPM por HV Faixa RPM HV Estrovenga HV Relâmpago HV Magnata Total Geral < 1.200 118,5 73,0 120,5 312,0 1.200 – 1.650 599,5 709,0 448,5 1.757,0 1.650 – 1.800 616,5 377,5 373,5 1.367,5 1.800 – 1.900 18.641,5 19.014,0 18.935,0 56.590,5 > 1.900 1.452,0 3.017,5 3.327,5 7.797,0 Total Geral 21.428,0 23.191,0 23.205,0 67.824,0 Fonte: Resultados da pesquisa Separamos então, 15 variáveis para avaliarmos a correlação de Pearson entre elas, como uma forma de identificar potenciais oportunidades de atuação operacional. Nas Tabelas 10, 11 e 12, temos a matriz de correlação de Pearson, para cada um dos HV analisados, para esse grupo de variáveis. Podemos notar que com o consumo de combustível (L/hora) somente 4 variáveis apresentaram correlação superior a 0,20 nos três HV estudados. Sendo que 2 variáveis têm correlação superior a ,50 nos três HV estudados, sendo elas, Engine Percent Load At Current Speed – 0,59, 0,56 e 0,52, Actual Engine - Percent
  • 14. Trabalho apresentado para obtenção do título de especialista em Data Science e Analytics – 2022 14 Torque – 0,60, 0,59 e 0,55 nos respectivos HV – Estrovenga, HV – Relampago e HV - Magnata. A variável Accelerator Pedal Position 1 apresentou correlação de 0,50, 0,50 e 045 nos respectivos HV – Estrovenga, HV – Relampago e HV - Magnata. Enquanto que variável Engine Speed apresentou correlação de 0,46, 0,44 e 0,40 nos respectivos HV – Estrovenga, HV – Relampago e HV – Magnata. Finalmente a última variável com correlação superior a 0,20 foi a Engine Torque Mode, tem uma correção de 0,22, 0,29 e 0,28 nos respectivos HV – Estrovenga, HV – Relampago e HV – Magnata, as demais variáveis tem correlações abaixo de 0,20 com o consumo de combustível (L/hora). Tabela 10. Correlação de Pearson para as variáveis selecionadas – HV Estrovenga Fonte: Resultados originais da pesquisa Tabela 11. Correlação de Pearson para as variáveis selecionadas – HV Relâmpago Fonte: Resultados originais da pesquisa Engine Total Idel Hours Nomal Friction - Percent Torque Engine Total Hours of Operation Engine Total Revolutions Enige Coolant Temperature Engine Oil Temperature 1 Engine Oil Pressure Accelerator Pedal Position 1 Engine Percent Load At Current Speed Engine Torque Mode Actual Engine Percent Torque Engine Speed Engine ECU Temperature Total ECCU Run Time L/Hora Engine Total Idel Hours 1,00 Nomal Friction - Percent Torque 0,00 1,00 Engine Total Hours of Operation 0,98 0,01 1,00 Engine Total Revolutions 0,98 0,01 1,00 1,00 Enige Coolant Temperature -0,17 0,04 -0,19 -0,20 1,00 Engine Oil Temperature 1 -0,17 0,04 -0,20 -0,20 1,00 1,00 Engine Oil Pressure -0,01 0,16 -0,01 -0,01 0,01 0,01 1,00 Accelerator Pedal Position 1 -0,04 0,10 -0,04 -0,04 0,16 0,16 0,02 1,00 Engine Percent Load At Current Speed 0,12 0,09 0,12 0,12 0,16 0,16 0,02 0,71 1,00 Engine Torque Mode -0,03 0,02 -0,03 -0,03 0,04 0,04 0,02 0,44 0,21 1,00 Actual Engine Percent Torque 0,12 0,09 0,12 0,12 0,17 0,16 0,02 0,74 0,97 0,21 1,00 Engine Speed -0,08 0,11 -0,07 -0,07 0,16 0,16 0,01 0,98 0,65 0,37 0,68 1,00 Engine ECU Temperature 0,21 0,23 0,19 0,19 0,51 0,50 0,03 0,11 0,26 -0,03 0,26 0,08 1,00 Total ECCU Run Time 0,98 0,01 1,00 1,00 -0,20 -0,20 -0,01 -0,04 0,12 -0,03 0,12 -0,07 0,19 1,00 L/Hora 0,09 0,05 0,09 0,09 0,08 0,08 0,02 0,50 0,59 0,22 0,61 0,46 0,16 0,09 1,00 Engine Total Idel Hours Nomal Friction - Percent Torque Engine Total Hours of Operation Engine Total Revolutions Enige Coolant Temperature Engine Oil Temperature 1 Engine Oil Pressure Accelerator Pedal Position 1 Engine Percent Load At Current Speed Engine Torque Mode Actual Engine Percent Torque Engine Speed Engine ECU Temperature Total ECCU Run Time L/Hora Engine Total Idel Hours 1,00 Nomal Friction - Percent Torque -0,02 1,00 Engine Total Hours of Operation 0,99 -0,01 1,00 Engine Total Revolutions 0,99 -0,01 1,00 1,00 Enige Coolant Temperature 0,08 0,06 0,09 0,09 1,00 Engine Oil Temperature 1 0,09 0,06 0,09 0,09 1,00 1,00 Engine Oil Pressure 0,04 17.7% 0,05 0,05 0,01 0,01 1,00 Accelerator Pedal Position 1 0,01 0,08 0,01 0,01 0,20 0,20 0,01 1,00 Engine Percent Load At Current Speed 0,21 0,06 0,21 0,21 0,27 0,27 0,04 0,66 1,00 Engine Torque Mode 0,05 0,02 0,04 0,04 0,09 0,09 0,00 0,46 0,30 1,00 Actual Engine Percent Torque 0,22 0,06 0,23 0,23 0,28 0,28 0,04 0,69 0,94 0,31 1,00 Engine Speed -0,06 0,09 -0,06 -0,06 0,18 0,18 0,00 0,97 0,58 0,39 0,61 1,00 Engine ECU Temperature 0,04 0,16 0,05 0,05 0,69 0,69 0,04 0,07 0,24 -0,02 0,25 0,04 1,00 Total ECCU Run Time 0,99 -0,01 1,00 1,00 0,09 0,09 0,05 0,01 0,21 0,04 0,23 -0,06 0,05 1,00 L/Hora 0,14 0,03 0,14 0,14 0,13 0,14 0,02 0,50 0,57 0,29 0,59 0,44 0,13 0,14 1,00
  • 15. Trabalho apresentado para obtenção do título de especialista em Data Science e Analytics – 2022 15 Tabela 12. Correlação de Pearson para as variáveis selecionadas – HV Magnata Fonte: Resultados originais da pesquisa Baseando-se nestas correlações, avaliamos construir uma equação multivariada, por mínimos quadrados para o consumo (L/hora), apresentadas na Tabela 13, com as 5 viáveis com as melhores correlações, citadas acima. Tabela 13. Equações multivariadas elaboradas Harvester Equações Geradas HV Estrovenga L/hora = 15.602 + 0.15108*APP + 0.015704*EPLCS + 0.23714*ETM + 0.18262*AEPT + -0.010406*RPM HV Relampago L/hora = 14.183 + 0.16907*APP + 0.019056*EPLCS + 0.27512*ETM + 0.15403*AEPT + -0.0097075*RPM HV Magnata L/hora = 16.11 + 0.14927*APP + 0.0085225*EPLCS + 0.3293*ETM + 0.18078*AEPT + -0.010432*RPM Fonte: Resultados originais da pesquisa Abaixo a análise dos resultados, Figuras 3, 4 e 5, demonstrando que para o processo de estimativa de consumo de combustível, não temos, ao menos com os dados coletados nesta POC, como simular com precisão tal variação baseando na formulação de equações multivariadas. Podemos notar que todos os resultados, que todas as equações apresentaram R² abaixo de 40%, indicando que podem existir outros fatores que determinam o consumo de combustíveis (L/hora), não podendo ser explicado satisfatoriamente com as 5 variáveis com melhor correlação de Pearson, coletadas pela rede CAN Bus, com o consumo (L/hora). Também é possível identificar pelos resultados, que existe forte multicolinearidade entre as variáveis independentes, como temos um grande volume de dados, a sugestão é que Engine Total Idel Hours Nomal Friction - Percent Torque Engine Total Hours of Operation Engine Total Revolutions Enige Coolant Temperature Engine Oil Temperature 1 Engine Oil Pressure Accelerator Pedal Position 1 Engine Percent Load At Current Speed Engine Torque Mode Actual Engine Percent Torque Engine Speed Engine ECU Temperature Total ECCU Run Time L/Hora Engine Total Idel Hours 1,00 Nomal Friction - Percent Torque 0,05 1,00 Engine Total Hours of Operation 0,97 0,06 1,00 Engine Total Revolutions 0,97 0,06 1,00 1,00 Enige Coolant Temperature 0,02 0,12 0,06 0,06 1,00 Engine Oil Temperature 1 0,02 0,12 0,06 0,06 0,99 1,00 Engine Oil Pressure 0,00 0,10 -0,01 -0,01 0,03 0,03 1,00 Accelerator Pedal Position 1 -0,04 0,04 -0,04 -0,04 0,34 0,24 0,03 1,00 Engine Percent Load At Current Speed -0,11 -0,01 -0,11 -0,10 0,31 0,32 0,04 0,59 1,00 Engine Torque Mode 0,00 0,05 0,00 0,00 0,12 0,12 0,01 0,47 0,30 1,00 Actual Engine Percent Torque -0,12 0,12 -0,11 -0,11 0,34 0,34 0,04 0,73 0,93 0,30 1,00 Engine Speed -0,02 0,07 -0,02 -0,02 0,34 0,35 0,03 0,97 0,61 0,29 0,66 1,00 Engine ECU Temperature -0,06 0,06 -0,02 -0,01 0,52 0,53 0,00 0,05 0,13 0,00 0,14 0,03 1,00 Total ECCU Run Time 0,98 0,05 1,00 1,00 0,06 0,06 -0,01 -0,04 -0,10 0,00 -0,11 -0,02 -0,01 1,00 L/Hora -0,08 0,01 -0,08 -0,08 0,11 0,11 0,02 0,45 0,52 0,28 0,55 0,40 0,09 -0,08 1,00
  • 16. Trabalho apresentado para obtenção do título de especialista em Data Science e Analytics – 2022 16 existe realmente um relacionamento entre as variáveis analisadas, visto que todas são provenientes da rede CAN Bus das máquinas. Figura 3. Resultado da OLS – HV Estrovenga Fonte: Resultados originais da pesquisa Figura 4. Resultado da OLS – HV Relâmpago Fonte: Resultados originais da pesquisa
  • 17. Trabalho apresentado para obtenção do título de especialista em Data Science e Analytics – 2022 17 Figura 5. Resultado da OLS – HV Magnata Fonte: Resultados originais da pesquisa Baseando-se nos resultados apresentados nas Figura 3, 4 e 5, devido a multicolinearidade dos dados, onde as variáveis explicativas tem alta correlação entre si, o que pode ser observado analisando-se as Tabelas 10, 11 e 12, buscamos alternativas para trabalhar a informação, sendo que para tal, vamos trabalhar somente com os dados do HV – Magnata, por esse ser o HV mais novo, menor horímetro, onde se espera, eliminar com isso, pontos que não são abordados nesse TCC como por exemplo, diferenças na manutenção preventiva das máquinas ou mesmo desgastes de componentes do motor devido ao avanço do uso dos equipamentos. A primeira abordagem feita, foi classificar os dados do HV – Magnata, baseando-se na média do consumo por dia e turno em duas classes, Operador Ótimo e Operador Oportunidade, dados apresentados no Anexo 2. Assim consideramos Operador Ótimo (1) os que tiverem a média de consumo menor ou igual a média geral do Harverster no período analisado e Operador Oportunidade (0) os que tiverem a média superior a média geral no período. Com essa separação, utilizando-se as 5 variáveis com melhor correlação de Pearson, (Tabela 12), buscamos avaliar a utilização o algoritmo K-NN para avaliar quanto ele seria assertivo nessa separação, a sua avaliação inicial deve-se principalmente pela simplicidade de sua utilização e baixa demanda computacional. Na Figura 6 e Tabela 14, são apresentados os resultados obtidos com o K-NN, para o HV- Magnata variando-se somente o número de vizinhos, pelos resultados, notamos que o K- NN, apresentou melhores resultados com poucos vizinhos, demostrando os dados tem baixa similaridade entre os dados da rede CAN Bus, quando passamos de 10 vizinho, já temos uma perda considerável no Score obtido. Assim sendo, avaliamos a acurácia, via matriz de confusão para identificar qual a melhor escolha para o Nr. de vizinhos (Figura 7).
  • 18. Trabalho apresentado para obtenção do título de especialista em Data Science e Analytics – 2022 18 Figura 6. Resultados da classificação K-NN Fonte: Resultados originais da pesquisa Tabela 14. Resultados da classificação K-NN Nr. Vizinho n_neighbors Cross Validation Score Obtido 3 93,37% 4 93,59% 5 93,45% 6 93,40% 7 93,17% 8 93,10% 9 93,07% 10 92,99% 15 92,62% 20 92,03% 25 91,58% 50 89,29% 100 81,71'% 150 76,12% 250 68,66% 500 63,50% 1.000 59,49% 5.000 55,84% Fonte: Resultados originais da pesquisa
  • 19. Trabalho apresentado para obtenção do título de especialista em Data Science e Analytics – 2022 19 Figura 7. Matrizes de confusão para 3 até 10 vizinhos dos resultados do K-NN Fonte: Resultados originais da da pesquisa Conclusões A leitura dos dados da rede CAN Bus de Harvesters Floretais, é uma grande fonte de informações para identificarmos oportunidades operacionais, permitindo identificar padrões comportamentais de consumo de diesel entre operadores e consequentemente a classificação desses operadores em Operadores Ótimos e Operadores Oportunidade, gerando insights para focarmos os treinamentos operacionais nos operadores com maior consumo de diesel. A quantidade de informações presentes na rede CAN Bus dos Harvesters avaliados, foi muito boa, também foi excelente a repetibilidade com que conseguimos coletar tais informações, utilizando a solução apresentada pela empresa IoTag. Podemos também notar que entre máquinas e também entre os turnos operacionais nos mesmos Harvesters, tivemos uma grande variação no consumo de diesel, o que demostra que temos oportunidades operacionais para serem trabalhadas. No presente TCC acabamos utilizando somente de 5 variáveis, das presentes na CAN, futuramente temos oportunidades de estudas as demais variáveis e seu comportamento, Classes Operador Oportunidade Operador Ótimo Recall Classes Operador Oportunidade Operador Ótimo Recall Operador Oportunidade 4607 290 94,1% Operador Oportunidade 4728 169 96,5% Operador Ótimo 251 3670 93,6% Operador Ótimo 292 3629 92,6% Precision 94,8% 92,7% Precision 94,2% 95,6% f-score 94,5% 93,1% f-score 95,4% 94,0% Acurácia 93,9% Acurácia 94,8% Classes Operador Oportunidade Operador Ótimo Recall Classes Operador Oportunidade Operador Ótimo Recall Operador Oportunidade 4617 280 94,3% Operador Oportunidade 4675 222 95,5% Operador Ótimo 208 3713 94,7% Operador Ótimo 270 3651 93,1% Precision 95,7% 93,0% Precision 94,5% 94,3% f-score 95,0% 93,8% f-score 95,0% 93,7% Acurácia 94,5% Acurácia 94,4% Classes Operador Oportunidade Operador Ótimo Recall Classes Operador Oportunidade Operador Ótimo Recall Operador Oportunidade 4577 320 93,5% Operador Oportunidade 4583 314 93,6% Operador Ótimo 202 3719 94,8% Operador Ótimo 223 3698 94,3% Precision 95,8% 92,1% Precision 95,4% 92,2% f-score 94,6% 93,4% f-score 94,5% 93,2% Acurácia 94,1% Acurácia 93,9% Classes Operador Oportunidade Operador Ótimo Recall Classes Operador Oportunidade Operador Ótimo Recall Operador Oportunidade 4541 356 92,7% Operador Oportunidade 4598 299 93,9% Operador Ótimo 191 3730 95,1% Operador Ótimo 250 3671 93,6% Precision 96,0% 91,3% Precision 94,8% 92,5% f-score 94,3% 93,2% f-score 94,4% 93,0% Acurácia 93,8% Acurácia 93,8% Matriz Nr Vizinho = 3 Matriz Nr Vizinho = 4 Matriz Nr Vizinho = 5 Matriz Nr Vizinho = 6 Matriz Nr Vizinho = 7 Matriz Nr Vizinho = 8 Matriz Nr Vizinho = 9 Matriz Nr Vizinho = 10
  • 20. Trabalho apresentado para obtenção do título de especialista em Data Science e Analytics – 2022 20 talvez relacionado a hora exata de fazer a manutenção preventiva dos Harvesters, partindo- se assim para a tão desejada manutenção preditiva. A utilização de equações multivariadas, para tentar explicar o consumo de diesel, não apresentou um bom R2 , uma das hipóteses, é a alta multicolinearidade das variáveis explicativas que propusemos usar neste trabalho, avaliar outras informações pode ser uma oportunidade para futuros trabalhos. Já a utilização do classificador K-NN para diferenciar um Operador Ótimo de um Operador Oportunidade, utilizando-se para tal dados coletados da rede CAN Bus, tem um alto poder de previsão, com baixo consumo computacional para treinar o algoritmo K-NN o treinamento é executado em segundos, utilizando um computador I5-8265U CPU 1.6GHz e 16Gb de RAM. A partir do treinamento efetuado com o K-NN, que apresentou uma alta acuraria, acima de 90%, mesmo com poucos dados processados, temos uma oportunidade de a partir de 1 medição curta de operação, exemplo 2 horas de trabalho operacional, classificar quais operadores tem ou não mais habilidade operacional, com foco no menor consumo de diesel, elencando assim os operadores que deveriam ter prioridade no treinamento operacional, auxiliando as equipe de Treinamento a focarem realmente nos operadores com maior necessidade. Futuramente, com o avanço da leitura da CAN Bus dos joysticks dos Harvesters, incluir tais dados neste processo de classificação de operadores, podem gerar novos insights interessantes para o processo de treinamento e capacitação destes operadores. Agradecimento Agradecimento especial minha família, esposa Célia e filho Rafael, pela compreensão e pelo tempo que precisei deixar de estar com vocês durante todo o MBA e ainda mais na confecção do TCC, aonde foram alguns finais de semanas. Agradecimento a Suzano por ceder os dados e a IoTag pelo fornecimento dos equipamentos leitores de rede CAN Bus, sem os quais não seria possível a elaboração desse TCC. Referências Alexag. CAN Bus – Barramento Controller Area Network. Disponível em: http://www.alexag.com.br/CAN_Bus_Parte_2.html, - Acesso em: 04 out. 2021 Fávero, L.P.; Belfiore, P. Manual de Análise de Dados. Reimpressão. Rio de Janeiro, LTC. 2022,
  • 21. Trabalho apresentado para obtenção do título de especialista em Data Science e Analytics – 2022 21 Indústria Brasileira de Árvores [IBÁ]. 2020 Relatório Anual. Disponível em: https://iba.org/datafiles/publicacoes/relatorios/relatorio-iba-2020.pdf Acesso em: 15 nov. 2021. Ministério da Agricultura, Pecuária e Abastecimento [MAPA]. Circular Técnica 123. CAN (Controller Area Network): Um Padrão Internacional de Comunicação de Transdutores Inteligentes para Máquinas Agrícolas. São Carlo, SP – Out/2001. Miolanem, T. O uso efetivo do método de colheita cut-to-lenght. Revista Opiniões. Março- Maio 2017: 46-47. Disponível em: https://florestal.revistaopinioes.com.br/revista/detalhes/16- o-uso-efetivo-do-metodo-de-colheita-cut-lenght/ Acesso em: 11 abr. 2021. Rocha Neto, W. B. da; Menezes Jr, J. M. P. Perfil de condução de motoristas: análise por meio de algoritmos de reconhecimento de padrões. Anais do Congresso Brasileiro de Automática, 2019. Soeiro, V. M. N. Manutenção de máquinas florestais na colheita mecanizada: a busca para obter a melhor disponibilidade mecânica, TCC. UFPR, 2012. Anexos Anexo 1. Lista de variáveis que foram possíveis de ler da rede CAN Bus Lista de variáveis lidas Qtde
  • 22. Trabalho apresentado para obtenção do título de especialista em Data Science e Analytics – 2022 22 Data/Hora, Nome Máquina (HV), Lamp. Proteção, Lamp. Alarme, Lamp. Parada, timestamp, Source, Protect Lamp, Amber Warning Lamp, Red Stop Lamp, Malfunction Indicator Lamp, Failure Mode Identifier, Occurrence Count, SPN Conversion Method, Suspect Parameter Number, Accelerator Pedal Kickdown Switch, Road Speed Limit Status, Accelerator Pedal Position 1, Engine Percent Load At Current Speed, Remote Accelerator Pedal Position, Engine Torque Mode, Drivers Demand Engine - Percent Torque, Actual Engine - Percent Torque, Source Address of Controlling Device for Engine Control, Engine Speed, Auxiliary Temperature 1, Auxiliary Pressure #1, Engine ECU Temperature, Total ECU Run Time, Estimated Percent Fan Speed, Fan Drive State, Engine Total Idle Fuel Used, Engine Total Idle Hours, Nominal Friction - Percent Torque, Engines Desired Operating Speed Asymmetry Adjustment, Engines Desired Operating Speed, Total Power Takeoff Hours, Engine Trip Fuel, Engine Total Fuel Used, Engine Coolant Temperature, Engine Fuel Temperature 1, Engine Oil Temperature 1, Engine Oil Pressure, Engine Coolant Pressure, Engine Coolant Level, Engine Total Hours of Operation, Engine Total Revolutions, Engine Alternate Rating Select, Engine Alternate Droop Accelerator 1 Select, Engine Idle Shutdown Timer Function, Engine Wait to Start Lamp, Engine Protection System Configuration, Freeze Frame Length, Seconds, Minutes, Hours, Month, Day, Year, Compass Bearing, Navigation-Based Vehicle Speed, Latitude, Longitude, Altitude 59 Fonte: Resultados da pesquisa
  • 23. Trabalho apresentado para obtenção do título de especialista em Data Science e Analytics – 2022 23 Anexo 2. Análise descritiva, consumo de combustível diário, por turno e Harvesters Data HV - Estrovenga HV - Relâmpago HV - Magnata Primeiro Segundo Terceiro Primeiro Segundo Terceiro Primeiro Segundo Terceiro 07/out 20,82 21,08 23,32 21,00 21,39 21,73 22,01 22,11 22,28 08/out 18,86 20,37 22,73 21,12 21,40 21,67 21,86 21,73 22,28 09/out 22,03 23,02 23,41 21,16 21,70 21,19 21,25 21,64 22,24 10/out 23,00 23,95 23,81 20,79 18,94 19,25 20,04 21,79 21,91 11/out 23,40 23,34 23,62 19,41 20,73 20,74 19,54 21,82 22,31 12/out 23,28 22,92 24,12 20,42 20,68 21,93 21,53 22,35 22,17 13/out 24,24 22,93 24,11 21,37 20,68 21,70 21,70 22,43 21,51 14/out 24,00 23,51 23,38 20,84 21,61 21,60 21,19 21,92 21,50 15/out 23,16 24,15 22,32 20,58 20,79 21,04 22,12 21,96 21,57 16/out 22,42 22,99 22,48 21,17 21,78 21,03 21,69 21,65 21,21 17/out 22,88 23,47 23,37 20,96 21,48 20,86 22,43 21,06 22,20 18/out 22,03 22,47 23,00 20,88 21,21 18,94 22,71 22,63 22,75 19/out 22,43 22,95 24,00 20,64 21,28 19,33 22,60 21,85 22,10 20/out 21,60 21,86 22,77 19,81 20,67 21,11 21,78 22,21 21,74 21/out 21,90 21,80 23,41 19,62 19,92 21,27 21,64 22,33 21,52 22/out 23,14 22,91 23,46 20,26 20,35 21,48 20,60 22,47 22,09 23/out 23,27 22,84 22,80 21,33 20,87 20,87 21,54 22,45 22,40 24/out 22,79 23,44 22,50 20,72 21,08 21,42 20,66 22,30 22,90 25/out 22,92 22,63 21,67 20,00 21,64 21,34 21,03 22,23 22,35 26/out 22,74 23,06 22,09 20,29 20,79 21,29 20,39 21,24 22,33 27/out 22,69 23,42 23,54 19,47 20,83 21,40 21,30 22,08 22,88 28/out 24,48 22,76 21,58 20,96 20,21 21,54 22,37 22,09 22,75 29/out 22,47 22,53 22,19 20,03 20,50 20,76 22,26 21,31 23,23 30/out 21,15 23,17 23,16 18,78 18,60 21,91 22,23 22,35 22,02 31/out 21,96 22,77 23,34 20,70 21,08 20,83 22,22 22,80 21,61 01/nov 22,66 22,28 23,19 20,64 21,22 23,26 22,47 22,29 22,03 02/nov 21,94 21,88 23,23 21,92 22,58 22,46 22,81 22,70 22,36 03/nov 23,10 21,98 23,42 22,48 22,41 21,94 21,72 21,59 22,60 04/nov 23,46 21,86 22,77 22,06 21,75 22,09 21,93 21,48 22,06 05/nov 22,07 21,97 23,24 22,31 21,38 22,06 20,62 21,36 21,43 06/nov 23,65 22,89 23,57 22,03 20,68 22,45 21,56 21,59 21,88 07/nov 23,63 23,26 24,09 21,82 22,39 22,71 20,97 21,53 21,25 08/nov 24,01 22,75 21,52 22,22 22,46 22,53 21,05 21,75 21,72 09/nov 23,24 23,34 22,75 21,80 22,86 22,27 21,15 21,40 22,22 10/nov 23,56 23,95 22,14 21,66 22,51 22,27 21,22 21,47 21,78 11/nov 21,56 22,41 24,13 21,66 22,21 21,41 21,44 22,37 22,10 12/nov 23,13 23,34 22,21 20,78 21,67 21,48 22,40 21,56 21,40 13/nov 19,89 23,73 23,87 20,36 21,80 21,72 21,76 20,91 21,29 14/nov 23,06 23,41 24,69 20,62 21,13 23,25 21,67 21,32 20,02 15/nov 24,48 24,15 24,40 20,98 22,03 22,51 20,64 21,24 21,62 16/nov 24,21 23,79 24,45 21,43 21,84 22,40 21,56 21,86 21,58 17/nov 23,84 24,13 23,92 21,56 20,64 20,15 19,88 21,64 21,56 18/nov 23,70 23,67 24,25 21,59 22,72 21,26 20,49 20,05 21,46 19/nov 24,95 23,75 24,60 21,23 21,16 21,61 21,28 21,10 21,00 20/nov 24,85 24,07 24,21 21,17 21,50 22,53 21,21 21,54 21,35 21/nov 23,32 23,43 24,05 21,97 21,84 22,82 21,74 21,86 21,23 22/nov 23,22 23,63 23,01 21,66 22,37 21,91 21,23 21,27 21,70 23/nov 22,82 22,60 23,72 22,31 22,39 22,82 21,06 22,13 21,63 24/nov 23,45 23,67 24,15 22,27 22,29 22,51 20,59 21,21 20,78 25/nov 23,43 23,65 24,67 21,80 22,16 22,71 20,20 21,49 21,47 26/nov 24,10 23,83 23,89 22,56 23,06 22,91 19,67 20,74 21,34 27/nov 24,44 23,48 23,64 22,66 23,98 22,10 20,70 21,53 21,96 28/nov 24,12 23,98 23,51 21,50 21,99 22,44 20,84 21,82 21,84 29/nov 24,45 24,05 23,34 22,43 22,67 22,87 20,08 21,75 20,26 30/nov 23,87 23,53 20,33 22,46 22,89 23,53 20,57 21,80 20,21 Média 23,14 23,11 23,41 21,21 21,55 21,78 21,41 21,79 21,84 Fonte: Resultados da pesquisa