Descoberta de conhecimento em base de dados de absenteísmo trabalhista com uso de inteligência computacional

Autores/as

  • Ricardo Pinto Ferreira Universidade Nove de Julho
  • Andréa Martiniano Universidade Nove de Julho
  • Domingos Napolitano Universidade Nove de Julho
  • Renato José Sassi Universidade Nove de Julho

DOI:

https://doi.org/10.20397/2177-6652/2020.v20i4.1309

Palabras clave:

Absenteísmo, Presenteísmo, Data mining, DBSCAN, Rede Neural Artificial.

Resumen

O objetivo deste artigo é aplicar inteligência computacional com técnicas de data mining para identificar através da tarefa de clusterização e classificação o perfil de empregados absenteístas e presenteístas, utilizando o algoritmo Density Based Spatial Clustering of Applications With Noise (DBSCAN) e Redes Neurais Artificiais (RNAs) na descoberta de conhecimento em base de dados. O Avanço da ciência computacional permite o processamento de grande quantidade de dados, o que motiva o estudo em questão, o termo data mining surgiu devido às semelhanças entre a procura de informação importante numa base de dados e o ato de minerar a montanha para encontrar um veio de ouro. Data mining é o elemento responsável pela extração eficiente do conhecimento implícito e útil contido em um banco de dados. O Absenteísmo é o não comparecimento ao trabalho, conforme o programado. No Presenteísmo há a presença do empregado no trabalho, ainda que doente, contudo, suas atividades são improdutivas. O algoritmo DBSCAN foi aplicado em data mining para clusterizar e a RNA foi aplicada para classificar níveis de perfis absenteístas e presenteístas. Os resultados apresentados mostraram que a aplicação das técnicas no data mining foi satisfatória, o que confirma a utilização das técnicas como uma opção a ser utilizada neste tipo de problema. A metodologia adotada na estruturação deste artigo foi definida como bibliográfica, exploratória e experimental.

Biografía del autor/a

Ricardo Pinto Ferreira, Universidade Nove de Julho

Doutor em Informática e Gestão do Conhecimento pela Universidade Nove de Julho, bolsista pela Universidade Corporativa dos Correios, Mestre em Engenharia de Produção na área de Gestão e Otimização da Produção pela Universidade Nove de Julho (2011), pós-graduado em Tecnologia da Informação e Internet na área de Ciência da Computação, nível de Especialização (2008), MBA em Administração na área de Logística Empresarial e Supply Chain, nível de Especialização (2007), Bacharel em Administração de Empresas (2005). Suas principais áreas de pesquisa são: Inteligência Computacional, Mineração de Dados, Lógica Fuzzy, Redes Neurais Artificiais, Mapa Auto-Organizável de Kohonen, algoritmo Density Based Spatial Clustering of Applications With Noise (DBSCAN), Algoritmo de otimização por colônia de formigas, Algoritmo de colônia artificial de abelhas, Absenteísmo, Presenteísmo, Logística Empresarial, Roteirização de Veículos, Roteirização Dinâmica de Veículos, Roteirização por Hierarquia. Experiência em Docência do ensino superior nos cursos de Engenharia Elétrica, Engenharia Mecânica, Engenharia de Produção, Engenharia Civil e Engenharia de Produção Mecânica na Universidade Nove de Julho, ministrou as disciplinas: Planejamento e Organização da Qualidade, Técnicas Avançadas de Gestão de Produção, Organização do Trabalho, Expressão Gráfica, Matemática, Introdução ao Computer Aided Design (CAD) e Desenho aplicado à engenharia. Membro do EURO Working Group on Vehicle Routing and Logistics Optimization (VeRoLog) filiado à Association of the European Operational Research Societies. Membro da Brazilian Fuzzy Community. Avaliador de trabalhos da mostra paulista de ciências e engenharia (MOP) e feira brasileira de ciências e engenharia (FEBRACE).

Andréa Martiniano, Universidade Nove de Julho

Doutoranda em Informática e Gestão do Conhecimento pela Universidade Nove de Julho, bolsista Prosup pela Capes, Mestre em Engenharia de Produção pela Universidade Nove de Julho (2012), pós-graduada em Tecnologia da Informação e Internet na área de Ciência da Computação, nível de Especialização pela Universidade Nove de Julho (2009), Bacharel em Administração de Empresas pela Faculdade Sumaré (2008). Áreas de pesquisa: Engenharia de Produção, Gestão do Absenteísmo e Presenteísmo, Inteligência Artificial, Redes Neurais Artificiais, Mapas Auto-Organizáveis de Kohonen e Data Mining.

Domingos Napolitano, Universidade Nove de Julho

Doutor em Informática e Gestão do Conhecimento (PPGIGC- Uninove), Bolsista PROSUP da CAPES e Mestre em Administração pelo Programa de Mestrado Profissional em Gestão de Projetos (MPA-GP Uninove) e especialização em Administração Industrial e Energia pela Poli USP. Graduado em Engenharia Mecânica pelo Instituto Maua de Tecnologia (1991). Atuou por 15 anos como Gestor nas áreas de Engenharia e Operações na Companhia de Gas de São Paulo Comgas. Certificado em Gestão de Projetos pelo PMI (PMP - Project Mangement Professional). Tem experiência na área de Engenharia Mecânica, com experiência em projetos de Redes de Gás Canalizado, envolvendo as fases de Engenharia Basica e Executiva, Construção e Operação. Têm mais de 25 anos de atuação na indústria de equipamentos e energia, grande parte deles dedicados à gestão de projetos nas áreas de engenharia e construção, tecnologia da informação e também a programas focando o desenvolvimento de competências organizacionais na gestão de riscos de acidentes. Atualmente suas pesquisas envolvem o empregos de técnicas de Inteligencia Computacional, na gestão de riscos em projetos , bem como no apoio na tomada de riscos em projetos e na gestão de riscos de segurança pessoal.

Renato José Sassi, Universidade Nove de Julho

Bacharel em Ciências Econômicas pela Faculdade de Economia Finanças e Administração de São Paulo (1987), Especialista (Pós-Graduação Lato Sensu) em Administração de Empresas (Área de Concentração Análise de Sistemas) pela Fundação Escola de Comércio Álvares Penteado (1988), Especialista (Pós-Graduação Lato Sensu) em Didática do Ensino Superior pelo Centro Universitário Sant anna (1996), Mestre em Administração de Empresas (Gestão de Negócios - Área de Concentração em Marketing) pelo Centro Universitário SantAnna (1999) e Doutor em Engenharia Elétrica pela Escola Politécnica da Universidade de São Paulo (EPUSP - 2006). Atualmente é pesquisador e docente permanente do Programa de Mestrado e Doutorado em Informática e Gestão do Conhecimento na Universidade Nove de Julho, docente colaborador do Programa de Mestrado e Doutorado em Engenharia de Produção e docente nos cursos de graduação em Ciência da Computação e Sistemas de Informação na mesma universidade, ministrando a disciplina Inteligência Artificial. Membro do Núcleo de Estudos Avançados em Informática e Gestão do Conhecimento na Universidade Nove de Julho. Líder do grupo de pesquisa Núcleo de Estudos em Inteligência Computacional na Identificação e Previsão do Presenteísmo e Absenteísmo (ICIPA) cadastrado no DGP-CNPq. Pesquisador Associado do Grupo de Inteligência Computacional, Modelagem e Neurocomputação (ICONE) do Laboratório de Sistemas Integráveis (LSI) da Escola Politécnica da Universidade de São Paulo (USP). Possui experiência na área da Ciência da Computação e Administração de Empresas, atuando principalmente nos seguintes temas: Inteligência Analítica, Inteligência Computacional, Descoberta de Conhecimento em Bases de Dados, Mineração de Dados e Métodos de Apoio à Tomada de Decisão. Orientador de alunos bolsistas PIBIC, PIBITI, PROSUP Capes, Ciência sem Fronteiras e Universidade Corporativa dos Correios.

Citas

Ankerst, M., Breunig, M. M., Kriegel, Hans-Peter & Sander, J. (1999). Optics: Ordering Points to Identify the Clustering Structure. In Proc. ACM SIGMOD’99 Int. Conf. on Management of Data (SIGMOD’99), p. 49-60, Philadelphia.

Araújo, J. P. (2012). Afastamento do trabalho: absenteísmo e presenteísmo em uma Instituição Federal de Ensino Superior. Dissertação de Mestrado, programa de pós-graduação em Ciências da Saúde, Universidade de Brasília, Brasília.

Azevedo, C. S. & Santos, M. F. (2005). Data Mining - Descoberta de Conhecimento em Bases de Dados. Lisboa, Portugal: FCA – ed. Informática – Coleção: Sistema de Informação, 214 p.

Barros, A. S. & Campos, F. C. (2006). Uma discussão sobre a aplicação de processo de KDD e técnicas de mineração de dados na indústria automobilística. XIII SIMPEP - Bauru, SP, Brasil, 6 a 8 de nov.

Berry, M. J. A. & Linoff, G. (1997). Data Mining Techniques: For Marketing, Sales, and Customer Support. New York: Wiley Computer Publishing.

Bergstrom, G., Bodin, L., Hagberg, J., Lindh, T., Aronsson, G. & Josephson, M. (2009). Does sickness presenteeism have an impact on future general health?Int Arch Occup Environ Health.

Bernstrom, V. H. (2013). The relationship between three stages of job change and long-term sickness absence. Social Science & Medicine, v. 98, December 2013, http://dx.doi.org/10.1016/j.socscimed.2013.10.001. Pages 239–246.

Bigus, J. P. (1996). Data Mining with Neural Network: Solving Business Problems from Applications Development to Decision Support. Mcgraw-Hill.

Braga, A.P.; Carvalho, A.C.P.L.F.; Ludermir, T.B. (2011). Redes Neurais Artificiais: Teoria e Aplicações. LTC, Rio de Janeiro.

Bratsberg, B., Fevang, E. & Roed, K. (2013). Job loss and disability insurance. Labour Economics, 24 (2013) 137–150. http://dx.doi.org/10.1016/j.labeco.2013.08.004.

Buckerman, P. & Laukkanen, E. (2009). Presenteeism in Finland: Determinants by Gender and the sector of conomy. Ege Akademik Bakış / Ege Academic Review 9 (3): p.1007- 1016.

Buttillos, A. S., Vargas III, K. G. & Gomero-Cuadra, R. (2015). Work productivity among adults with varied Body Mass Index: Results from a Canadian population-based survey. Journal of Epidemiology and Global Health (2015) 5, http://dx.doi.org/10.1016/j.jegh.2014.08.001, p.191– 199.

Campos, M. M. & Saito, K. (2004). Sistemas inteligentes em controle de automação de processos. Rio de Janeiro: Ciência Moderna.

Canfield, G. W. & Soash, D. G. (1955). Presenteeism - A constructive view. Industrial Medicine and Surgery, vol. 24, p. 417-418.

Carvalho, L. A. V. (2005). Data Mining: a Mineração de dados no Marketing, Medicina, Economia, Engenharia e Administração. Editora Ciência Moderna Ltda. Rio de Janeiro.

Costa, J. A. F. & Andrade Netto, M. L. (2007). Segmentação de Mapas Auto-Organizáveis com Espaço de Saída 3-D. Revista Controle & Automação/Vol.18 n.2/abr, mai. e Jun.

Cunha, J. B., Blank, V. L. G. & Boing, A. F. (2009). Tendência Temporal de Afastamento do Trabalho em Servidores Públicos (1995-2005). Revista Brasileira de Epidemiologia. São Paulo, vol.12 n. 2.

Dai, B. &. Lin, I. (2012). Map/Reduce-based DBSCAN Algorithm with Optimized Data Partition. IEEE Fifth International Conference on Cloud Computing, p. 59-66.

Diniz, C. A. & Louzada Neto, F. (2000). Data Mining: uma introdução. São Paulo: ABE.

Ester, M.; Kriegel, H.-P.; Sander, J. & Xu, X. (1996). A Density Based Spatial Clustering of Applications With Noise. In Simoudis, E., Han, J. & Fayyad, U., editors, Second International Conference on Knowledge Discovery and Data Mining. Portland, Oregon. American Association for Artificial Intelligence, p. 226-231.

Fayyad, U.M.; Grinstein, G. & Wierse, A. (2001). Information Visualization in Data Mining and Knowledge Discovery. Morgan Kaufmann.

Fayyad, U.M, Piatetsky-Shapiro, G. & Smyth, P. (1996a). From data mining to knowledge discovery: an overview. In: Advances in Knowledge Discovery and Data Mining, AAAI Press / The MIT Press, MIT, Menlo Park, California, Cambridge, Massachusetts, and London, England, p.1-34.

Fayyad, U.M, Piatetsky-Shapiro, G. & Smyth, P. (1996b). From Data Mining to Knowledge Discovery in Databases. In: AI Magazine. American Association for Artificial Intelligence. Providence, Rhode Island, p.37-54.

Fayyad, U.M, Piatetsky-Shapiro, G. & Smyth, P. (1996c). The KDD Process for Extracting Useful Knowledge from Volumes of Data. In: Communications of the ACM. v.39 (11): p.27-34.

Ferreira, R. P., Martiniano, A., Ferreira, A., Ferreira, A.; Sassi, R. J. (2016). Study on daily demand forecasting orders using artificial neural network. IEEE Latin America Transactions, v.14, n. 3, p.1519-1525.

Fonseca, V. R. (2009). Atividade Física, Absenteísmo e Demanda por Atendimento à Saúde de Funcionários de Indústria Automobilística de São Caetano do Sul. Tese de Doutorado em Ciências – Universidade de São Paulo. 154 p., São Paulo.

Freitas, A. A. (2003). A Survey of Evolutionary Algorithms for Data Mining and knowledge Discovery. Curitiba. GNU. R Project for Statistical Computing. Disponível em: <http://cran.r-project.org/>. Acesso em: 07 mar. 2017.

Goetzel, R. Z, Long, S. R, Ozminkowski, R. J, Hawkins, K., Wang, S. H & Lynch, W. H. (2004). Absence, disability, and presenteeism cost estimates of certain physical and mental health conditions affecting US employers. Journal of Occupational And Environmental Medicine. v.46(4): p. 398- 412.

Goldschmidt, R. & Passos, E. (2005). Data mining: um guia prático, Elsevier.

Goldschmidt, R., Passos, E. & Bezerra. E. (2015). Data mining: Conceitos, técnicas, algoritmos, orientações e aplicações, Rio de Janeiro, 2 ed. Elsevier.

Guelpeli, M. V. C. (2009). Cassiopeia: Um Modelo Baseado em Sumarização e Aprendizado Autônomo Usado em Agrupamentos para Descoberta de Conhecimento em Bases textuais. 100 p. Tese de Doutorado em Computação – Universidade Federal Fluminens. Niterói, RJ.

Halbesleben, J. R. B., Whitman, M. V. & Crawford, W. S. (2014). A dialectical theory of the decision to go to work: Bringing together absenteeism and presenteeism. Human Resource Management Review 24 (2014) 177–192.

Han, J.; Kamber, M. & Pei, J. (2011). Data mining: concepts and techniques. 3 ed. Waltham, MA: Morgan Kaufmann.

Haykin, S. (2001). Redes Neurais – Princípios e Práticas. Bookman. 2 ed. Porto Alegre.

Hebb, D. O. (1949). The Organization of Behavior: Neuropsychological Theory, N. Y.: Willey.

Hemp, P. (2004). Presenteeism: at work – but out of it. Havard Business Review. 82(10): 49-58.

Inoue, K. C., Matsuda, L. M. , Silva, D. M. P. P., Uchimura, T. T. & Mathias, T. A. F. (2008). Absenteísmo-doença da equipe de enfermagem em unidade de terapia intensiva. Rev. bras. enfermagem. v.61 nº.2. Mar./Abr., Brasília.

Jodas, D. A. & Haddad, M. C. L. (2009). Síndrome de Burnout em Trabalhadores de Enfermagem de um Pronto Socorro de Hospital Universitário. Acta Paulista de Enfermagem. v. 22, n. 2. São Paulo.

Johns, G. (2003). How methodological diversity has improved our understanding of absenteeism from work. Human Resource Management Review, 13 (2): p. 157-184.

Johns, G. (2010). Presenteeism in the workplace: A review and research agenda. Journal of Organizational Behavior. vol. 31, p. 519 – 542.

Kohonen, T. (2001). Self-Organizing Maps. Springer. 3ª ed. New York.

Kovács, Z. L. Redes Neurais Artificiais - Fundamentos e Aplicações. (2006). Editora Livraria da Física. 4ª edição. São Paulo.

Laranjeira, C. A. (2009). O Contexto Organizacional e a Experiência de Estress: uma Perspectiva Integrativa. Revista salud pública [online], vol.11, n.1, p. 123-133.

Levin-Epstein, J. (2005). Presenteeism and Paid Sick Days. Center for LAW and Social Policy – CLASP, ago.

Ludwig Junior, O. & Montgomery, E. (2007). Redes Neurais: Fundamentos e Aplicações com Programas em C. Rio de Janeiro: Ciência Moderna.

Lumare Júnior, G. (2007). Valor econômico do cliente: uma teoria das encomendas. São Paulo: Financial Times – Prentice Hall.

Martiniano, A. (2012). Aplicação de técnica da mineração de dados na identificação do perfil de empregados absenteístas e presenteístas em uma empresa de courier da cidade de São Paulo. 130 p. Dissertação de Mestrado em Engenharia de Produção – Universidade Nove de Julho, São Paulo.

Martinez, L. F., Ferreira, A. I., Souza, L. M. & Cunha, J. V. (2007). A Esperança é a última a morrer? Capital Psicológico Positivo e Presentismo. Comportamento Organizacional e Gestão, vol. 13, n. 1, p. 37-54.

Martins, P. L., Silva, E. M. S. & Rocha, R. C. (2009). Fatores Prejudiciais ao bom desempenho dos Funcionários nas Diversas Organizações: com Ênfase para o Alcoolismo. VI SEGeT – Simpósio de Excelência em Gestão e Tecnologia.

MBP. Multiple Back-Propagation. Disponível em: <http://mbp.sourceforge.net/>. Acesso em: 07 mar. 2017.

McCuloch, W. S.; Pitts, W. H. (1943). A logical calculus of the ideas immanent in nervous activity, Bulletin of mathematical biophysics, v. 5, p. 115-133.

Mckevitt Tauffer, R. & Coltre, S. M. (2007). A contribuição dos fatores intrínsecos e extrínsecos da organização para o absenteísmo nos setores de produção de uma indústria de carrocerias de ônibus. In: Encontro Nacional de Engenharia de Produção – ENEGEP. Anais. n. 27, Foz do Iguaçu.

Mendel, J. M.; Mclaren, R. W. (1970). Reinforcement-learning control and pattern recognition systems. Adaptive, Learning and Pattern Recognition Systems. Academic Press, New York e London, Cap. 8, p. 287–318.

Miranda, A. R., Gomes, C. F. & Gomes, M. A. N. (2006). Uma avaliação da Qualidade de Vida no Trabalho dos gerentes da construção civil. Xlll SIMPEP, nov. 2006. Bauru – SP, Brasil.

Mitchell, T. M. (1997). Machine Learning. McGraw-Hill.

Nascimento Júnior, C. L & Yoneyama, T. (2004). Inteligência artificial em controle e automação. São Paulo: Blucher – FAPESP.

Olson, D. L; Delen, D. (2008). Advanced Data Mining Techniques. Berlin: Springer.

Pacheco, M. A. C., Vellasco, M. M. B. R. (org). (2007). Sistemas inteligentes de apoio à decisão: análise econômica de projetos de desenvolvimento de campos de petróleo sob incerteza. Rio de Janeiro: Ed. PUC-Rio: Ed. Interciência.

Paschoalino, J. B. Q. (2008). O Professor Adoecido Entre o Absenteísmo e o Presenteísmo. VII Seminário Redestrado – Nuevas Regulaciones en América Latina.

Penatti, I, Zago, J. S. & Quelhas, O. (2006). Absenteísmo: as consequências na gestão de pessoas. III SEGeT – Simpósio de Excelência em Gestão e Tecnologia. Resende.

Ponniah, P. (2001). Data Warehousing Fundamentals: A Comprehensive Guide for IT Professionals. John Wiley and Sons.

Rezende, S. O. (2005). Sistemas Inteligentes: Fundamentos e Aplicações. Barueri: Manole.

Riazifar, N. & Saghapour, E. (2015). Retinal Vessel Segmentation Using System Fuzzy and DBSCAN Algorithm. IEEE 2nd International Conference on Pattern Recognition and Image Analysis (IPRIA 2015), p. 1-4.

Rosenblatt, M. (1958). The Perceptron: A probabilistic model for information storage and organization in the Brain. Psychological review, v.65, n.6, p. 386-408.

Russell, S & Norvig, P. (2013). Inteligência Artificial. Rio de Janeiro. 3 ed. Elsevier.

Sassi, R. J. (2006). Uma Arquitetura Híbrida para Descoberta de Conhecimento em Bases de Dados: Teoria dos Rough Sets e Redes Neurais Artificiais Mapas Auto-Organizáveis. 169 p. Tese de Doutorado, Escola Politécnica da Universidade de São Paulo, Departamento de Engenharia Elétrica, São Paulo.

Silva, I. N., Spatti, D. H. & Flauzino, R. A. (2010). Redes Neurais Atificiais para Engenharia e Ciências Aplicadas. SP: Artliber.

Silva, L. A.; Peres, S. M.; Boscarioli, C. (2016). Introdução à Mineração de dados: com aplicações em R. Elsevier. 1.ed. Rio de Janeiro.

Silva Neto, M. A. (2008). Mineração Visual de Dados: extração do conhecimento a partir das técnicas de Visualização da Informação e mineração de dados. 172 p. Dissertação de Mestrado em Ciências na área de concentração Programação Matemática – Universidade Federal do Paraná, PR.

Simões, M. G.; Shaw, I. S. (2007). Controle e Modelagem fuzzy. São Paulo: Blucher: FAPESP.

Turban, E., Sharda, R., Aronson, J. E. & King, D. (2009). Business Intelligence: Um enfoque gerencial para a inteligência do negócio. Porto Alegre: Bookman.

Thorwarth, M. Arisha, A. & Harper, P. (2009). Simulation Model to Investigate Flexible Workload Management for Healthcare and Servicescape Environment. IEEE Proceedings of the 2009 Winter Simulation Conference M. D. Rossetti, R. R. Hill, B. Johansson, A. Dunkin and R. G. Ingalls, eds. p. 1946-1956.

UCI. Repository of Machine Learning and Intelligent Systems. Disponível em: http://archive.ics.uci.edu/ml/datasets. Irvine, CA: University of California, Department of Information and Computer Science. Acesso em: 04 fev. 2018.

Umann, J. (2011). Estresse, Coping e Presenteísmo em Enfermeiros Hospitalares. 132 p. Dissertação de Mestrado em Enfermagem, Universidade Federal de Santa Maria, Rio Grande do Sul. RS.

Uris, A. (1955). How to build presenteeism. Petroleum Refiner, v. 34, p. 348-359.

Viscovery. Viscovery® SOMine. Disponível em: <https://www.viscovery.net/>. Acesso em: 04 fev. 2018.

WEKA. Waikato Environment for Knowledge Analysis. Disponível em: <http://www.cs.waikato.ac.nz/ml/weka>. Acesso em: 07 mar. 2017.

WHO. World Health Organization. Disponível em: < http://www.who.int/classifications/icd/en/>. Acesso em: 15 mar. 2017.

Witten, I. H; Frank, E. (2005). Data Mining - Practical Machine Learning Tools and Techniques. San Francisco, CA: Elsevier.

Ye, N. (2003). The Handbook of Data Mining. Mahwah, New Jersey: Lawrence Erlbaum Associates.

Publicado

2020-11-24

Cómo citar

Ferreira, R. P., Martiniano, A., Napolitano, D., & Sassi, R. J. (2020). Descoberta de conhecimento em base de dados de absenteísmo trabalhista com uso de inteligência computacional. Revista Gestão & Tecnologia, 20(4), 108–135. https://doi.org/10.20397/2177-6652/2020.v20i4.1309