SlideShare uma empresa Scribd logo
1 de 30
Baixar para ler offline
Daniele Rodrigues dos Santos
VERIFICAÇÃO DA POSSIBILIDADE DE OBTENÇÃO DE ÍNDICES DE
PERFORMANCE DE PEQUENAS E MÉDIAS EMPRESAS ATRAVÉS DA ANÁLISE DE
DADOS ABERTOS
Monografia apresentada à Faculdade FIA de
Administração de Negócios mantida pela Fundação
Instituto de Administração como requisito para
obtenção do certificado de conclusão de curso de Pós-
Graduação Lato Sensu
Área de habilitação: MBA Analytics em Big Data
Orientador: Prof. Dr. Adolpho Walter Pimazoni Canton
Profa. Dra. Alessandra Ávila Montini
São Paulo
2017
Daniele Rodrigues dos Santos
VERIFICAÇÃO DA POSSIBILIDADE DE OBTENÇÃO DE ÍNDICES DE
PERFORMANCE DE PEQUENAS E MÉDIAS EMPRESAS ATRAVÉS DA ANÁLISE DE
DADOS ABERTOS
Trabalho de conclusão de curso apresentado à Faculdade FIA de Administração e Negócios
como requisito para a obtenção do título Master of Business Administration em Analytics em
Big Data.
Aprovado em: ____ de _______ de _____.
BANCA EXAMINADORA
__________________________________________
Prof. Dr. Adolpho Walter Pimazoni Canton – Faculdade FIA de Administração e Negócios
__________________________________________
Profa. Dra. Alessandra Ávila Montini – Faculdade FIA de Administração e Negócios
LISTA DE FIGURAS
Figura 1: Modelo conceitual central – Extraído de Raifur[2], p.69 ...................................................... 10
Figura 2: Variáveis Influentes – modelo multinomial. Extraído de Raifur[2],p.161.............................. 15
Figura 3: Pesquisa nota fiscal paulista................................................................................................... 17
Figura 4: Informações básicas............................................................................................................... 18
Figura 5: Site oficial da empresa ........................................................................................................... 19
Figura 6: Perfil público de empresa no LinkedIn®................................................................................. 19
Figura 7: Listagem de funcionários com perfil no LinkedIn® ................................................................ 19
Figura 8: Canal de Vídeos do YouTube®................................................................................................ 20
Figura 9: Site Jusbrasil........................................................................................................................... 20
Figura 10: Site EmpresasCNPJ............................................................................................................... 21
Figura 11: Comprovante de inscrição e situação cadastral................................................................... 21
Figura 12: Capital social......................................................................................................................... 22
Figura 13: Site do cadastro nacional de empresas Idôneas.................................................................. 22
Figura 14: Site IBGE ............................................................................................................................... 23
Figura 15: Arquitetura de extração e análise de dados ........................................................................ 26
LISTA DE TABELAS
Tabela 1: Variáveis de capital humano ................................................................................................. 11
Tabela 2: Variáveis de tamanho da empresa e demografia pessoal..................................................... 11
Tabela 3: Variáveis de características gerenciais .................................................................................. 12
Tabela 4: Variáveis de condições de ambiente..................................................................................... 12
Tabela 5: Variáveis de características organizacionais.......................................................................... 12
Tabela 6: Variáveis de motivação e percepção..................................................................................... 13
Tabela 7: Variáveis de tamanho e demografia pessoal......................................................................... 13
Tabela 8: Variáveis de desempenho ..................................................................................................... 13
Tabela 9: Variáveis influentes e grupos conceituais ............................................................................. 16
SUMÁRIO
1.Resumo....................................................................................................................................7
2.Briefing....................................................................................................................................8
3.Sumário....................................................................................................................................9
4.Introdução..............................................................................................................................10
5.Descrição dos indicadores para aferição de desempenho e critérios de sobrevivência.........11
6.Teste de hipótese e técnicas estatísticas utilizadas................................................................14
7.Aferição das variáveis influentes através da verificação de dados abertos ...........................17
8.Sugestão de arquitetura para extração e análise de dados .....................................................26
8.Conclusões finais...................................................................................................................28
9.Referências ............................................................................................................................29
7
1.RESUMO
Segundo dados do Sebrae[1] (Serviço Brasileiro de Apoio às Micro e Pequenas Empresas),
em 2014, as pequenas e micro empresas representavam 27% do PIB e contribuíam com 52%
dos empregos de carteira assinada.
Apesar da importância econômica de empresas deste porte, existem poucas pesquisas sobre
definição de indicadores e índices de performance dado que muitos desses indicadores são
obtidos através da análise de dados financeiros abertos. Pequenos e micro empreendimentos
geralmente possuem esses dados fechados e quando são disponibilizados, muitas vezes,
carecem de consistência.
O objetivo deste trabalho é estudar verificar a possibilidade de obtenção de indicadores,
baseados em um modelo teórico, através de dados de bases abertas. Assim, poderia se
classificar empresas quanto a possibilidade de sucesso ou falência.
Os dados serão obtidos sem necessidade de interação com o empreendedor. A base científica,
é a tese de doutorado apresentada pelo Dr. Léo Raifur em Fatores Determinantes do
Desempenho de Pequenas e Médias Empresas da Região Centro- Sul do Estado do Paraná[2].
8
2.BRIEFING
Data from Sebrae[1] (Serviço Brasileiro de Apoio às Pequenas e Micro Empresas) in 2014,
small and medium business were responsible for 27% of PIB and 52% of workforce were
hired by these companies.
Although economic significance of those companies, there are few academic references about
how to define performance indicators for such kind of business as the usual methods rely on
financial information and generally, small and medium business does not make these data
available on open sources neither are consistent.
The goal of this work is verify the possibility of find business indicators based on theorical
model, through data obtained on open sources. Thus, would be possible classify enterprises in
which regards the success or failure conditions.
Data are acquired without any interaction with entrepreneurs. Scientific argumentation is
based on research developed by Léo Raifur, PhD in Fatores Determinantes do Desempenho
de Pequenas e Médias Empresas da Região Centro-Sul do Estado do Paraná[2].
9
3.SUMÁRIO
Na fase de Introdução deste trabalho, apresentamos os índices de desempenho definidos pela
fonte científica, Raifur[2].
Na fase de desenvolvimento, escolhemos aleatoriamente uma empresa para efetuar pesquisa e
verificamos que tipo de informação é possível ser obtida sem haver interação como os
empreendedores.
Finalmente, consolidamos os resultados da fase de desenvolvimento e definimos o que pode
ser aplicável de acordo com a teoria desenvolvida por Raifur[2].
10
4.INTRODUÇÃO
Os dados da pesquisa de Raifur[2] foram coletados através de envio de e-mail para empresas
listadas na Associação Comercial ou mailing-list de pesquisadores. Alguns questionários
foram impressos e entregues diretamente aos respondentes.
O modelo conceitual da pesquisa de Raifur[2], está representado no diagrama abaixo:
Figura 1: Modelo conceitual central – Extraído de Raifur[2], p.69
A seguir, vamos descrever os indicadores de cada grupo de entrada: Tamanho, motivação e
perfil de risco, condições do ambiente, capital social, capital humano, características
gerenciais, características organizacionais e demografia pessoal.
11
5.DESCRIÇÃO DOS INDICADORES PARA AFERIÇÃO DE DESEMPENHO E
CRITÉRIOS DE SOBREVIVÊNCIA
Capital Humano
A descrição das variáveis de capital humano é dada a seguir:
Descrição Tipo Escala
Escolaridade Ordinal 5
Experiência ocupacional Ordinal 6
Experiência ocupacional no ramo de negócio Ordinal 6
Experiência em funções de liderança Ordinal 6
Média anual de treinamento pessoal Ordinal 6
Histórico familiar Dummy 2
Experiência anterior em outra empresa Dummy 2
Tabela 1: Variáveis de capital humano
Tamanho da Empresa e Demografia Pessoal
A descrição das variáveis de tamanho da empresa e demografia pessoal é dada a seguir:
Descrição Tipo Escala
Disponibilidade de capital para constituição da empresa Ordinal 5
Uso de empréstimo na constituição da empresa Ordinal 5
Quantidade de fornecedores Ordinal 5
Giro dos fornecedores Ordinal 5
Relacionamento da empresa com bancos Likert 5
Uso de serviços especializados Likert 4
Receptividade nas demandas de crédito Likert 6
Volume de crédito atendido nas demandas Likert 6
Dificuldade de obtenção de crédito Likert 6
Impacto do crédito na expansão do negócio Likert 6
Tabela 2: Variáveis de tamanho da empresa e demografia pessoal
12
Características Gerenciais
A descrição das variáveis de características gerenciais é dada a seguir:
Descrição Tipo Escala
Nível de pesquisa de mercado realizado antes da abertura Likert 6
Pesquisa e contatos prévios com os principais fornecedores Likert 6
Análise de ambiente: concorrentes, preços, etc. Likert 6
Pesquisa sobre localização do negócio Likert 6
Estudo sobre a viabilidade econômico-financeira Likert 6
Conhecimento e controle do fluxo de caixa Likert 6
Frequência de uso de antecipação de recebíveis Likert 6
Problemas com inadimplentes Likert 6
Pagamento de juros elevados Likert 6
Tabela 3: Variáveis de características gerenciais
Condições de Ambiente
A descrição das variáveis de condições de ambiente é dada a seguir:
Descrição Tipo Escala
Grau de sazonalidade no segmento da empresa Likert 5
Grau de competição no ambiente da empresa Likert 5
Suporte governamental em relação a linhas de acesso ao crédito Likert 6
Nível de avaliação dos serv. públicos relacionados com PMEs Likert 6
Nível de avaliação de suporte de instituições Likert 6
Ambiente competitivo: grau de lealdade e formalidade Likert 6
Tabela 4: Variáveis de condições de ambiente
Características Organizacionais
A descrição das variáveis de características organizacionais é dada a seguir:
Descrição Tipo Escala
Escopo de abrangência: especialidade versus generalidade Dummy 2
Afiliação ou independência do negócio Dummy 2
Nível de qualificação do staff Likert 4
Nível de treinamento disponibilizado ao staff Likert 4
Número de sócios da empresa Razão
Relacionamento entre os sócios Likert 5
Grau de inovação exigido no setor de atuação Likert 5
Se a empresa possui site(sítio) Dummy 2
Se os produtos/serviços podem ser consultados no sítio Dummy 2
Se a empresa comercializa prod./serviços pela internet Dummy 2
Tabela 5: Variáveis de características organizacionais
13
Motivação e percepção de risco
A descrição das variáveis de motivação e percepção de risco é dada a seguir:
Descrição Tipo Escala
Decisão de empreender: oportunidade versus necessidade Nominal 2
Motivação para a decisão de empreender Nominal 3
Percepção do grau de risco envolvido nas PMEs Likert 5
Tabela 6: Variáveis de motivação e percepção
Tamanho e demografia pessoal
A descrição das variáveis de tamanho e demografia pessoal é dada a seguir:
Descrição Tipo Escala
Capital gasto para constituir o negócio Ordinal 8
Faturamento anual bruto do último ano Ordinal 9
Número atual de empregados Razão -
Gênero do empreendedor Nominal 2
Idade do empreendedor Razão -
Estado civil do empreendedor Nominal 4
Tabela 7: Variáveis de tamanho e demografia pessoal
Desempenho
A descrição das variáveis de desempenho é dada a seguir:
Descrição Tipo Escala Ajuste*
Margem de Lucro Likert 7 5
Crescimento de Receita Likert 5 5
Crescimento de Quadro de Empregados Likert 5 5
Percepção Comparativa de Desempenho Likert 5 5
Satisfação Pessoal com a Empresa Likert 5 5
Impacto da Empresa sobre Qualidade de Vida Familiar Likert 5 5
Nível de Confirmação da Decisão Likert 4 5
Grau de Efetivação das Expectativas Likert 4 5
(*) As variáveis Margem de Lucro e Nível de Confirmação da Decisão foram
reponderadas para escala de cinco pontos
Tabela 8: Variáveis de desempenho
14
6.TESTE DE HIPÓTESE E TÉCNICAS ESTATÍSTICAS UTILIZADAS
A tese de Raifur (2013,p.80) testou a seguinte hipótese central:
“se existe pelo menos um fator(indicador) capaz de explicar o desempenho (variável
dependente) de pequenas e médias empresas”
Para este fim, foram utilizados os testes estatísticos listados a seguir: análise fatorial,
regressão linear múltipla, regressão logística binária e regressão logística multinomial.
Vamos formalizar cada uma das técnicas no tópico seguinte.
6.1 ANÁLISE FATORIAL
“O propósito essencial da análise factorial é descrever, se possível, a estrutura de covariâncias
entre as variáveis em termos de um nº menor de variáveis (não observáveis) chamadas
factores. Por outras palavras, a análise factorial estuda os inter-relacionamentos entre as
variáveis, num esforço para encontrar um conjunto de factores (em menor nº que o conjunto
de variáveis originais) que exprima o que as variáveis originais partilham em comum.”
Lucas[3], p.1
6.2 REGRESÃO LINEAR MÚLTIPLA
“A análise de regressão estuda o relacionamento entre uma variável chamada variável
dependente e outras variáveis chamadas variáveis independentes.
Este relacionamento é representado por um modelo matemático, isto é, por uma equação que
associa a variável dependente com as variáveis independentes.
Este modelo é designado por modelo de regressão linear simples se define uma relação linear
entre a variável dependente e uma variável independente.
Se em vez de uma, forem incorporadas várias variáveis independentes, o modelo passa a
denominar-se modelo de regressão linear múltipla.”
Henriques[4],p.1
6.3 REGRESSÃO LOGÍSTICA
“A regressão logística é uma técnica estatística que tem como objectivo produzir, a partir de
um conjunto de observações, um modelo que permita a predição de valores tomados por uma
variável categórica, frequentemente binária, a partir de uma série de variáveis explicativas
contínuas e/ou binárias[1][2]”
15
“Em comparação com as técnicas conhecidas em regressão, em especial a regressão linear, a
regressão logística distingue-se essencialmente pelo facto de a variável resposta ser
categórica.”
Wikipédia[5]
6.4 – DEFINIÇÃO DO MODELO GERAL
Foram realizados testes de hipóteses para definição do modelo geral.
Primeiramente, foi verificada a possibilidade de definição de uma fórmula de desempenho.
Para isto, foi utilizada a técnica de Regressão Linear Multivariada.
Em seguida, foi verificada a possibilidade de se discriminar empresas sobreviventes das não
sobreviventes, para isto, foi utilizado o modelo Logístico Geral.
Finalmente, chegamos ao modelo que será utilizado como base para o nosso estudo. Através
de Regressão Logística Multinomial, foi determinado o modelo para classificar as empresas
não sobreviventes, sobrevivência marginal e alto desempenho. A figura abaixo apresenta o
modelo e as variáveis influentes.
Figura 2: Variáveis Influentes – modelo multinomial. Extraído de Raifur[2],p.161
16
A seguir, visualizamos as variáveis influentes organizadas por Grupo Conceitual:
Variável Descrição
Grupo
Conceitual
EXP_OC Experiência Ocupacional
Capital HumanoEXP_R Experiência Ocupacional no Ramo do Negócio
EMP_C Uso de Empréstimos na Constituição da Empresa
Capital Social
PESQ_MERC Nível de Pesquisa de Mercado Realizado Antes da Abertura
PESQ_FORN Pesquisa e Contatos Prévios com os Principais Fornecedores
PESQ_AMB Análise de Ambiente: Concorrentes, Preços, etc.
PESQ_LOC Pesquisa sobre Localização do Negócio
AN_VEF Análise de Viabilidade Econômico- Financeira
FIN_CP Financiamento de Curto Prazo
CRED_LA Suporte Governamental em Relação a Linhas de Acesso ao Crédito Condições do
AmbienteSERV_PUB Nível de Avaliação dos Serviços Públicos Relacionados com PMEs
TREIN_E Nível de Treinamento Disponibilizado ao Staff
Características
Organizacionais
EMP_A Número Atual de Empregados Tamanho
Tabela 9: Variáveis influentes e grupos conceituais
Este trabalho irá avaliar a possibilidade de aferição destas variáveis através de dados abertos
na internet.
17
7.AFERIÇÃO DAS VARIÁVEIS INFLUENTES ATRAVÉS DA VERIFICAÇÃO DE
DADOS ABERTOS
Partimos da hipótese de que não temos informação alguma sobre as empresas a serem
pesquisadas. Assim, a primeira tarefa foi encontrar uma fonte de dados aonde poderíamos
obter a listagem de empresas.
A informação foi encontrada no site da Secretaria da Fazenda do Estado de São Paulo[6].
Pesquisamos quais estabelecimentos na cidade de São Paulo participam do Programa Nota
Fiscal Paulista. Abaixo, ilustramos a primeira página do resultado da busca:
Figura 3: Pesquisa nota fiscal paulista
Em seguida, vamos analisar quais informações sobre os proprietários pode ser obtida por
dados abertos.
18
7.1 OBTENÇÃO DE INFORMAÇÃO POR FONTES ABERTAS
Baseado na lista de estabelecimentos obtida no site da Secretaria da Fazenda do Estado de São
Paulo, escolhemos aleatoriamente uma empresa para verificação de qual tipo de informação
está disponível em fontes abertas. A empresa selecionada foi: '' PROTENDE '' SISTEMAS E
METODOS DE CONSTRUCOES LTDA.
7.1.1 DADOS DA '' PROTENDE '' SISTEMAS E METODOS DE CONSTRUCOES LTDA
Utilizando a ferramenta de busca Google®[8], encontramos algumas referências sobre a
empresa “Protende”.
a. Página inicial do Google®[8] com informativo básico do funcionamento do
estabelecimento
Figura 4: Informações básicas
19
b. Site oficial da empresa[15]. O mesmo continha informações sobre o tipo de serviços
prestados e formas de contato.
Figura 5: Site oficial da empresa
c. Linkedin®[7]. Nesta plataforma encontramos o perfil público da empresa e o perfil de
alguns funcionários.
Figura 6: Perfil público de empresa no LinkedIn®
Figura 7: Listagem de funcionários com perfil no LinkedIn®
20
d. Canal no YouTube®[9]. A empresa possui um canal de vídeos no YouTube®[9] para
divulgação de projetos
Figura 8: Canal de Vídeos do YouTube®
e. No site Jusbrasil[10], é possível verificar todas as citações sobre a empresa em diário
oficial ou ações judiciais que não estão em estado sigiloso
Figura 9: Site Jusbrasil
21
6 – No site EmpresasCNPJ[11] é possível obter informações sobre: CNPJ, Nome Fantasia,
Razão Social, Data de Abertura, Endereço, Telefone, e-mail, natureza jurídica, status da
empresa e atividade econômica principal
Figura 10: Site EmpresasCNPJ
Com a informação sobre o CNPJ, é possível realizar uma busca no site da Receita Federal e
obter um conjunto de dados relevantes:
7.1- Site Consulta CNPJ da Receita Federal[12]. Comprovante de Inscrição e Situação
Cadastral
Figura 11: Comprovante de inscrição e situação cadastral
22
7.2 - Capital Social
Figura 12: Capital social
8. Cadastro Nacional de Empresas Idôneas
No site do Cadastro Nacional de Empresas Idôneas[13], não foi encontrado processos contra a
empresa pesquisada
Figura 13: Site do cadastro nacional de empresas Idôneas
23
9. Site do IBGE
No site do IBGE[14] encontramos dados demográficos, macroeconomia e microeconomia.
Existem diversos indicadores, sendo possível refinar as informações por município, estado e
nacionalmente.
Figura 14: Site IBGE
7.2 ADERÊNCIA DAS INFORMAÇÕES OBTIDAS EM FONTES ABERTAS COM AS
VARIÁVEIS INFLUENTES
Vamos discutir a possibilidade da utilização dos dados em fontes abertas para definição das
variáveis influentes. O conjunto de variáveis foi apresentado na tabela 2.4.1.
7.2.1 – Variável Experiência Ocupacional
Esta informação é passível de ser obtida mas depende da dedicação dos sócios e
administradores da empresa em manter seu currículo atualizado e aberto ao público. A melhor
plataforma para consulta deste tipo de informação é o LinkedIn®.
No caso da empresa “Protende”, a maioria dos sócios e administradores não adicionou muita
informação ao seu perfil público do LinkedIn®. Está disponível apenas a ocupação atual e
informações sobre formação educacional.
7.2.2 – Variável Experiência Ocupacional no Ramo de Atuação
A variável pode ser obtida utilizando as mesmas fontes de dados da variável “Experiência
Ocupacional”. Como observado anteriormente, a qualidade da informação depende de
dedicação pessoal em manter o currículo atualizado e aberto ao público.
7.2.3 – Uso de Empréstimos na Constituição da Empresa
Esta informação só está disponível se o empréstimo foi adquirido em instituição pública,
excluindo –se bancos públicos. Não é uma informação de fácil acesso. O uso de técnicas de
text-mining seria adequado na tentativa de extração desta informação em diário oficial ou
conteúdo de página de sites oficiais.
24
7.2.4 – Nível de Pesquisa de Mercado Realizado Antes da Abertura
Não é possível obter esta informação por fontes abertas. Os sócios e administrados precisam
ser questionados de maneira direta.
7.2.5 – Pesquisa e Contato Prévio com os Principais Fornecedores
Não é possível obter esta informação por fontes abertas. Os sócios e administrados precisam
ser questionados de maneira direta.
7.2.6 – Análise de Ambiente: Preços, Concorrentes, etc.
Esta informação está disponível em fontes abertas mas não é possível determinar se este tipo
de pesquisa foi realizada pelos sócios e administradores da empresa durante o planejamento
de abertura do negócio.
7.2.7 – Pesquisa sobre Localização do Negócio
É possível verificar pelo conjunto de informações disponível em fontes abertas mas não é
podemos determinar se este tipo de pesquisa foi realizada pelos sócios e administradores da
empresa durante o planejamento de abertura do negócio.
7.2.8 – Análise de Viabilidade Econômico-Financeira
É possível verificar pelo conjunto de informações disponível em fontes abertas mas não
podemos determinar se este tipo de pesquisa foi realizada pelos sócios e administradores da
empresa durante o planejamento de abertura do negócio.
7.2.9 – Financiamento de Curto Prazo
Esta informação só está disponível se o financiamento foi adquirido em instituição pública,
excluindo –se bancos públicos. Não é uma informação de fácil acesso. O uso de técnicas de
text-mining seria adequado na tentativa de extração desta informação em diário oficial ou
conteúdo de página de sites oficiais.
7.2.10 – Suporte Governamental em Relação as Linhas de Crédito
Não é possível obter esta informação por fontes abertas. Os sócios e administrados precisam
ser questionados de maneira direta.
7.2.11 – Nível de Avaliação de Serviços Público Relacionados com PMEs
Não é possível obter esta informação por fontes abertas. Os sócios e administrados precisam
ser questionados de maneira direta.
7.2.12 – Nível de Treinamento Disponibilizado ao Staff
25
Não é possível obter esta informação por fontes abertas. Os sócios e administrados precisam
ser questionados de maneira direta.
7.2.13 – Número Atual de Empregados
É possível obter esta informação mas depende da dedicação dos sócios e administradores da
empresa em manter o perfil público da empresa atualizado. A melhor plataforma para
consulta deste tipo de informação é o LinkedIn®.
26
8. SUGESTÃO DE ARQUITETURA PARA EXTRAÇÃO E ANÁLISE DE DADOS
A seguir, sugerimos arquitetura para extração e análise de dados obtidos pela internet e
também dados históricos internos.
Figura 15: Arquitetura de extração e análise de dados
A arquitetura sugerida leva em consideração o fato de que os dados obtidos são
desestruturados.
O Sqoop foi desenvolvido para transferência eficiente de grande quantidade de dados entre o
Apache Hadoop e sistema de banco de dados.
O Kafka é uma plataforma de streaming distribuída. Foi concebido para armazenamento e
distribuição de streamings em tempo real. Cada gravação consiste de uma estrutura de chave,
valor e datação (timestamp). Pode ser usado para monitorar dados do Twitter®.
O Flume foi desenvolvido para agregar, coletar e movimentar grandes volumes de Logs.
27
O Spark é uma engine para processamento rápido de grande quantidade de dados.
O Hive é um software de armazenamento de dados que facilita a leitura, escrita e
administração de grandes volumes de dados em sistemas distribuídos. Utiliza a linguagem
SQL.
O Teradata é uma empresa que criou uma distribuição Hadoop voltada para o meio
empresarial.
O Tableau é um software de visualização de dados.
Quanto aos módulos de limpeza, tratamento e análise de dados, podemos utilizar a linguagem
Python para desenvolver aplicações para este fim. O Python possui bibliotecas de inteligência
artificial e estatística.
28
8.CONCLUSÕES FINAIS
As bases de dados abertas fornecem uma infinidade de informações relevantes sobre a
constituição das empresas, dados de macroeconomia e microeconomia.
Entretanto, não é possível aferir as variáveis influentes formuladas por Raifur[2] através
exclusivamente destas fontes. Muitas destas variáveis dizem respeito ao planejamento
efetuado pelo empreendedor antes da abertura ou início do negócio, currículo dos
administradores e dados financeiros privados.
Pela pesquisa efetuada neste trabalho, não parece ser uma prioridade dos administradores,
tornar este tipo de informação pública.
Saliento que encontramos alguns dados interessantes não diretamente citados na tese de
Raifur[2]: canal de vídeos do YouTube®, currículo de funcionários da empresa e rede de
relacionamentos no LinkedIn®; atas, diário oficial e ações judiciais no portal do Jusbrasil,
possibilidade de verificação de pendências com o governo no site do cadastro nacional de
empresas idôneas.
Portanto, o trabalho de Raifur[2] poderia ser revisto levando em consideração essas novas
fontes de informação. Através do uso da econometria, estatística, mineração de dados e
analytics, é possível se chegar a um novo conjunto de variáveis influentes.
A obtenção e análise desses dados possibilita a criação de uma ferramenta de mapeamento e
monitoramento da saúde de pequenos e médios negócios, ajudando a direcionar políticas de
governo e investimentos privados.
29
9.REFERÊNCIAS
[1] Brasil. Sebrae – Serviço Brasileiro de Apoio às Micro e Pequenas Empresas. Sebrae Mato
Grosso, 2014. Disponível em:
< http://www.sebrae.com.br/sites/PortalSebrae/ufs/mt/noticias/micro-e-pequenas-empresas-
geram-27-do-pib-do-brasil,ad0fc70646467410VgnVCM2000003c74010aRCRD>
[2] RAIFUR, Léo. Fatores Determinantes do Desempenho de Pequenas e Médias
Empresas da Região Centro-Sul do Estado do Paraná.2013. 211 f. Tese (Programa de Pós-
Graduação em Administração) - Faculdade de Economia, Administração e Contabilidade,
Universidade de São Paulo, São Paulo, 2013
[3]LUCAS,Cristina. Análise de Componentes Principais e Análise Factorial. 2016.
Disponível em:
<http://www.estgv.ipv.pt/PaginasPessoais/lucas/material/Acetatos%20ACP%20e%20AFC%2
03%C2%AAparte%20aluno.pdf>
[4]HENRIQUES, Carla. Análise de Regressão Linear Simples e Múltipla. 2010/2011.
Disponível em:
<http://www.estgv.ipv.pt/PaginasPessoais/psarabando/Ambiente%202010-
2011/Slides/Regressaoalunos.pdf>
[5]Brasil, Wikipédia – Regressão Logística. 2016. Disponível em:
<https://pt.wikipedia.org/wiki/Regress%C3%A3o_log%C3%ADstica>
[6]Brasil, Secretaria da Fazenda – Nota Fiscal Paulista. 2016. Disponível em:
<http://www.nfp.fazenda.sp.gov.br/lista_aprovacao.shtm>
[7]Brasil, LinkedIn® - Protende Sistemas e Métodos de Construção. 2016. Disponível em:
< https://br.linkedin.com/company/protende-sistemas-e-m-todos-de-constru-es-ltda>
[8]Brasil, Google® - Pesquisa “Protende Sistemas e Métodos de Construção”. 2016.
Disponível em:
< https://www.google.com.br/search?q=consulta+empresa+numero+funcionarios&ie=utf-
8&oe=utf-8&client=firefox-b-
ab&gfe_rd=cr&ei=Jvw2WNDlBZGlwQTtoJzYCw#q=protende+%27%27+sistemas+e+meto
dos+de+construcoes+ltda>
[9]Brasil, YouTube® - Canal de Vídeos da Protende Sistemas e Métodos de Construção.
2016. Disponível em:
< https://www.youtube.com/channel/UCOPEp3fAG8dr8-VpMLBsvrw>
30
[10]Brasil, JusBrasil – Pesquisa “Protende Sistemas e Métodos de Construção”. 2016.
Disponível em:
<http://www.jusbrasil.com.br/busca?q=%27%27+PROTENDE+%27%27+SISTEMAS+E+M
ETODOS+DE+CONSTRUCOES+LTDA>
[11] Brasil, EmpresasCNPJ – Pesquisa “Protende Sistemas e Métodos de Construção”. 2016.
Disponível em:
<http://www.empresascnpj.com/s/empresa/protende-sistemas-e-metodos-de-construcoes-
ltda/48298061000103>
[12] Brasil, Consulta CNPJ – Receita Federal. 2016. Disponível em:
<http://www.receita.fazenda.gov.br/pessoajuridica/cnpj/cnpjreva/cnpjreva_solicitacao2.asp>
[13] Brasil, Cadastro Nacional de Empresas Idôneas. 2016. Disponível em:
<http://www.portaltransparencia.gov.br/ceis>
[14] Brasil, IBGE. 2016. Disponível em:
<http://www.ibge.gov.br/home/>
[15] Brasil, Site Oficial da Empresa.2016. Disponível em:
<http://www.protende.com.br/newsite/home.htm>

Mais conteúdo relacionado

Mais procurados

RDBNoSQLの基礎と組み合わせDB構成をちょっとよくする話
RDBNoSQLの基礎と組み合わせDB構成をちょっとよくする話RDBNoSQLの基礎と組み合わせDB構成をちょっとよくする話
RDBNoSQLの基礎と組み合わせDB構成をちょっとよくする話Shohei Kobayashi
 
Orecord mode dso
Orecord mode dsoOrecord mode dso
Orecord mode dsoPhani Kumar
 
OpenLineage による Airflow のデータ来歴の収集と可視化(Airflow Meetup Tokyo #3 発表資料)
OpenLineage による Airflow のデータ来歴の収集と可視化(Airflow Meetup Tokyo #3 発表資料)OpenLineage による Airflow のデータ来歴の収集と可視化(Airflow Meetup Tokyo #3 発表資料)
OpenLineage による Airflow のデータ来歴の収集と可視化(Airflow Meetup Tokyo #3 発表資料)NTT DATA Technology & Innovation
 
BETTER TOGETHER 〜VMware NSXとJuniperデバイスを繋いでみよう!〜
BETTER TOGETHER 〜VMware NSXとJuniperデバイスを繋いでみよう!〜BETTER TOGETHER 〜VMware NSXとJuniperデバイスを繋いでみよう!〜
BETTER TOGETHER 〜VMware NSXとJuniperデバイスを繋いでみよう!〜Juniper Networks (日本)
 
モニタリングプラットフォーム開発の裏側
モニタリングプラットフォーム開発の裏側モニタリングプラットフォーム開発の裏側
モニタリングプラットフォーム開発の裏側Rakuten Group, Inc.
 
俺の俺による俺のための App Service Environment
俺の俺による俺のための App Service Environment俺の俺による俺のための App Service Environment
俺の俺による俺のための App Service EnvironmentSunao Tomita
 
Standard Edition 2でも使えるOracle Database 12c Release 2オススメ新機能
Standard Edition 2でも使えるOracle Database 12c Release 2オススメ新機能Standard Edition 2でも使えるOracle Database 12c Release 2オススメ新機能
Standard Edition 2でも使えるOracle Database 12c Release 2オススメ新機能Ryota Watabe
 
SSMSでSQL Serverの実行計画を見てSQLチューニング
SSMSでSQL Serverの実行計画を見てSQLチューニングSSMSでSQL Serverの実行計画を見てSQLチューニング
SSMSでSQL Serverの実行計画を見てSQLチューニング釣りキチ翔平
 
ここがつらいよAws batch
ここがつらいよAws batchここがつらいよAws batch
ここがつらいよAws batchYu Yamada
 
リアクティブ・アーキテクチャ ~大規模サービスにおける必要性と課題〜 #devsumi
リアクティブ・アーキテクチャ ~大規模サービスにおける必要性と課題〜 #devsumiリアクティブ・アーキテクチャ ~大規模サービスにおける必要性と課題〜 #devsumi
リアクティブ・アーキテクチャ ~大規模サービスにおける必要性と課題〜 #devsumiYuta Okamoto
 
ScyllaDBユーザー勉強会 #1
ScyllaDBユーザー勉強会 #1ScyllaDBユーザー勉強会 #1
ScyllaDBユーザー勉強会 #1Changhwan Lee
 
Neo4j Innovation Lab – Bringing the Best of Data Science and Design Thinking ...
Neo4j Innovation Lab – Bringing the Best of Data Science and Design Thinking ...Neo4j Innovation Lab – Bringing the Best of Data Science and Design Thinking ...
Neo4j Innovation Lab – Bringing the Best of Data Science and Design Thinking ...Neo4j
 
今こそ知りたいSpring Batch(Spring Fest 2020講演資料)
今こそ知りたいSpring Batch(Spring Fest 2020講演資料)今こそ知りたいSpring Batch(Spring Fest 2020講演資料)
今こそ知りたいSpring Batch(Spring Fest 2020講演資料)NTT DATA Technology & Innovation
 
How to manage a big scale HTML/CSS project
How to manage a big scale HTML/CSS projectHow to manage a big scale HTML/CSS project
How to manage a big scale HTML/CSS projectRenoir Boulanger
 
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現Ryoma Nagata
 
YugabyteDBを使ってみよう(NewSQL/分散SQLデータベースよろず勉強会 #1 発表資料)
YugabyteDBを使ってみよう(NewSQL/分散SQLデータベースよろず勉強会 #1 発表資料)YugabyteDBを使ってみよう(NewSQL/分散SQLデータベースよろず勉強会 #1 発表資料)
YugabyteDBを使ってみよう(NewSQL/分散SQLデータベースよろず勉強会 #1 発表資料)NTT DATA Technology & Innovation
 
SAP HANAのソースエンドポイントとしての利用
SAP HANAのソースエンドポイントとしての利用SAP HANAのソースエンドポイントとしての利用
SAP HANAのソースエンドポイントとしての利用QlikPresalesJapan
 
NOSQLEU - Graph Databases and Neo4j
NOSQLEU - Graph Databases and Neo4jNOSQLEU - Graph Databases and Neo4j
NOSQLEU - Graph Databases and Neo4jTobias Lindaaker
 
ネットワーク ゲームにおけるTCPとUDPの使い分け
ネットワーク ゲームにおけるTCPとUDPの使い分けネットワーク ゲームにおけるTCPとUDPの使い分け
ネットワーク ゲームにおけるTCPとUDPの使い分けモノビット エンジン
 
AlloyDBを触ってみた!(第33回PostgreSQLアンカンファレンス@オンライン 発表資料)
AlloyDBを触ってみた!(第33回PostgreSQLアンカンファレンス@オンライン 発表資料)AlloyDBを触ってみた!(第33回PostgreSQLアンカンファレンス@オンライン 発表資料)
AlloyDBを触ってみた!(第33回PostgreSQLアンカンファレンス@オンライン 発表資料)NTT DATA Technology & Innovation
 

Mais procurados (20)

RDBNoSQLの基礎と組み合わせDB構成をちょっとよくする話
RDBNoSQLの基礎と組み合わせDB構成をちょっとよくする話RDBNoSQLの基礎と組み合わせDB構成をちょっとよくする話
RDBNoSQLの基礎と組み合わせDB構成をちょっとよくする話
 
Orecord mode dso
Orecord mode dsoOrecord mode dso
Orecord mode dso
 
OpenLineage による Airflow のデータ来歴の収集と可視化(Airflow Meetup Tokyo #3 発表資料)
OpenLineage による Airflow のデータ来歴の収集と可視化(Airflow Meetup Tokyo #3 発表資料)OpenLineage による Airflow のデータ来歴の収集と可視化(Airflow Meetup Tokyo #3 発表資料)
OpenLineage による Airflow のデータ来歴の収集と可視化(Airflow Meetup Tokyo #3 発表資料)
 
BETTER TOGETHER 〜VMware NSXとJuniperデバイスを繋いでみよう!〜
BETTER TOGETHER 〜VMware NSXとJuniperデバイスを繋いでみよう!〜BETTER TOGETHER 〜VMware NSXとJuniperデバイスを繋いでみよう!〜
BETTER TOGETHER 〜VMware NSXとJuniperデバイスを繋いでみよう!〜
 
モニタリングプラットフォーム開発の裏側
モニタリングプラットフォーム開発の裏側モニタリングプラットフォーム開発の裏側
モニタリングプラットフォーム開発の裏側
 
俺の俺による俺のための App Service Environment
俺の俺による俺のための App Service Environment俺の俺による俺のための App Service Environment
俺の俺による俺のための App Service Environment
 
Standard Edition 2でも使えるOracle Database 12c Release 2オススメ新機能
Standard Edition 2でも使えるOracle Database 12c Release 2オススメ新機能Standard Edition 2でも使えるOracle Database 12c Release 2オススメ新機能
Standard Edition 2でも使えるOracle Database 12c Release 2オススメ新機能
 
SSMSでSQL Serverの実行計画を見てSQLチューニング
SSMSでSQL Serverの実行計画を見てSQLチューニングSSMSでSQL Serverの実行計画を見てSQLチューニング
SSMSでSQL Serverの実行計画を見てSQLチューニング
 
ここがつらいよAws batch
ここがつらいよAws batchここがつらいよAws batch
ここがつらいよAws batch
 
リアクティブ・アーキテクチャ ~大規模サービスにおける必要性と課題〜 #devsumi
リアクティブ・アーキテクチャ ~大規模サービスにおける必要性と課題〜 #devsumiリアクティブ・アーキテクチャ ~大規模サービスにおける必要性と課題〜 #devsumi
リアクティブ・アーキテクチャ ~大規模サービスにおける必要性と課題〜 #devsumi
 
ScyllaDBユーザー勉強会 #1
ScyllaDBユーザー勉強会 #1ScyllaDBユーザー勉強会 #1
ScyllaDBユーザー勉強会 #1
 
Neo4j Innovation Lab – Bringing the Best of Data Science and Design Thinking ...
Neo4j Innovation Lab – Bringing the Best of Data Science and Design Thinking ...Neo4j Innovation Lab – Bringing the Best of Data Science and Design Thinking ...
Neo4j Innovation Lab – Bringing the Best of Data Science and Design Thinking ...
 
今こそ知りたいSpring Batch(Spring Fest 2020講演資料)
今こそ知りたいSpring Batch(Spring Fest 2020講演資料)今こそ知りたいSpring Batch(Spring Fest 2020講演資料)
今こそ知りたいSpring Batch(Spring Fest 2020講演資料)
 
How to manage a big scale HTML/CSS project
How to manage a big scale HTML/CSS projectHow to manage a big scale HTML/CSS project
How to manage a big scale HTML/CSS project
 
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
 
YugabyteDBを使ってみよう(NewSQL/分散SQLデータベースよろず勉強会 #1 発表資料)
YugabyteDBを使ってみよう(NewSQL/分散SQLデータベースよろず勉強会 #1 発表資料)YugabyteDBを使ってみよう(NewSQL/分散SQLデータベースよろず勉強会 #1 発表資料)
YugabyteDBを使ってみよう(NewSQL/分散SQLデータベースよろず勉強会 #1 発表資料)
 
SAP HANAのソースエンドポイントとしての利用
SAP HANAのソースエンドポイントとしての利用SAP HANAのソースエンドポイントとしての利用
SAP HANAのソースエンドポイントとしての利用
 
NOSQLEU - Graph Databases and Neo4j
NOSQLEU - Graph Databases and Neo4jNOSQLEU - Graph Databases and Neo4j
NOSQLEU - Graph Databases and Neo4j
 
ネットワーク ゲームにおけるTCPとUDPの使い分け
ネットワーク ゲームにおけるTCPとUDPの使い分けネットワーク ゲームにおけるTCPとUDPの使い分け
ネットワーク ゲームにおけるTCPとUDPの使い分け
 
AlloyDBを触ってみた!(第33回PostgreSQLアンカンファレンス@オンライン 発表資料)
AlloyDBを触ってみた!(第33回PostgreSQLアンカンファレンス@オンライン 発表資料)AlloyDBを触ってみた!(第33回PostgreSQLアンカンファレンス@オンライン 発表資料)
AlloyDBを触ってみた!(第33回PostgreSQLアンカンファレンス@オンライン 発表資料)
 

Semelhante a Indicadores de desempenho de PMEs a partir de dados abertos

Elaboração projeto investimento
Elaboração projeto investimentoElaboração projeto investimento
Elaboração projeto investimentoAlexandra Alcantara
 
Pesquisa mostra perfil do Empreendedor Individual
Pesquisa mostra perfil do Empreendedor IndividualPesquisa mostra perfil do Empreendedor Individual
Pesquisa mostra perfil do Empreendedor IndividualCristiane Thiel
 
Geração de valor nas compras organizacionais e as influências na relação busi...
Geração de valor nas compras organizacionais e as influências na relação busi...Geração de valor nas compras organizacionais e as influências na relação busi...
Geração de valor nas compras organizacionais e as influências na relação busi...Renan Crippa Freitas
 
Influência do PMBOK no sucesso dos Projetos de Sistemas de Informação
Influência do PMBOK no sucesso dos Projetos de Sistemas de InformaçãoInfluência do PMBOK no sucesso dos Projetos de Sistemas de Informação
Influência do PMBOK no sucesso dos Projetos de Sistemas de InformaçãoLuisEspe
 
Monografia PUC MINAS 2009 - Processo de Avaliação e Análise de Riscos para El...
Monografia PUC MINAS 2009 - Processo de Avaliação e Análise de Riscos para El...Monografia PUC MINAS 2009 - Processo de Avaliação e Análise de Riscos para El...
Monografia PUC MINAS 2009 - Processo de Avaliação e Análise de Riscos para El...Marcelo Veloso
 
Pesquisa de Marketing Cenários da Comunicação Corporativa
Pesquisa de Marketing Cenários da Comunicação CorporativaPesquisa de Marketing Cenários da Comunicação Corporativa
Pesquisa de Marketing Cenários da Comunicação CorporativaESPM
 
Modelo de Plano de Negócios do Sistem Indústria
Modelo de Plano de Negócios do Sistem IndústriaModelo de Plano de Negócios do Sistem Indústria
Modelo de Plano de Negócios do Sistem IndústriaLourdes Martins
 
O Uso dos Sistemas de Informação no Apoio ao Planeamento e Controlo Corporativo
O Uso dos Sistemas de Informação no Apoio ao Planeamento e Controlo CorporativoO Uso dos Sistemas de Informação no Apoio ao Planeamento e Controlo Corporativo
O Uso dos Sistemas de Informação no Apoio ao Planeamento e Controlo CorporativoAlberto Zenkner
 
ANÁLISE DE ESTRATÉGIAS NO AMBIENTE DE MARKETING DIGITAL E e-COMMERCE: a estr...
 ANÁLISE DE ESTRATÉGIAS NO AMBIENTE DE MARKETING DIGITAL E e-COMMERCE: a estr... ANÁLISE DE ESTRATÉGIAS NO AMBIENTE DE MARKETING DIGITAL E e-COMMERCE: a estr...
ANÁLISE DE ESTRATÉGIAS NO AMBIENTE DE MARKETING DIGITAL E e-COMMERCE: a estr...Erich Lacerda
 
Empreendedorismo teleaula 4_tema_5
Empreendedorismo teleaula 4_tema_5Empreendedorismo teleaula 4_tema_5
Empreendedorismo teleaula 4_tema_5Elizabeth Custodio
 
Plano de curso mba em business intelligence at big data (mba)-20212-turma-v...
Plano de curso   mba em business intelligence at big data (mba)-20212-turma-v...Plano de curso   mba em business intelligence at big data (mba)-20212-turma-v...
Plano de curso mba em business intelligence at big data (mba)-20212-turma-v...Ricardo Roberto MSc, MBA
 
PI II - CONCEPCAO DE SERVICOS DE TI
PI II - CONCEPCAO DE SERVICOS DE TIPI II - CONCEPCAO DE SERVICOS DE TI
PI II - CONCEPCAO DE SERVICOS DE TINilo Basílio
 
Análise do impacto do ambiente externo na gestão de vantagens competitiva
Análise do impacto do ambiente externo na gestão de vantagens competitivaAnálise do impacto do ambiente externo na gestão de vantagens competitiva
Análise do impacto do ambiente externo na gestão de vantagens competitivaUniversidade Pedagogica
 
UTILIZAÇÃO DA METODOLOGIA LEAN STARTUP PARA CRIAÇÃO DE UMA STARTUP: Anál...
UTILIZAÇÃO DA METODOLOGIA LEAN STARTUP PARA CRIAÇÃO DE UMA STARTUP: Anál...UTILIZAÇÃO DA METODOLOGIA LEAN STARTUP PARA CRIAÇÃO DE UMA STARTUP: Anál...
UTILIZAÇÃO DA METODOLOGIA LEAN STARTUP PARA CRIAÇÃO DE UMA STARTUP: Anál...Marcelo Linhares
 
[FINAL] MONOGRAFIA - DANIEL BRANDT - OS CRITÉRIOS DE SUCESSO EM PROJETOS DE S...
[FINAL] MONOGRAFIA - DANIEL BRANDT - OS CRITÉRIOS DE SUCESSO EM PROJETOS DE S...[FINAL] MONOGRAFIA - DANIEL BRANDT - OS CRITÉRIOS DE SUCESSO EM PROJETOS DE S...
[FINAL] MONOGRAFIA - DANIEL BRANDT - OS CRITÉRIOS DE SUCESSO EM PROJETOS DE S...Daniel Brandt
 
Plano De Negócios - SOLUTION – GESTÃO E ENGENHARIA LTDA
Plano De Negócios - SOLUTION – GESTÃO E ENGENHARIA LTDAPlano De Negócios - SOLUTION – GESTÃO E ENGENHARIA LTDA
Plano De Negócios - SOLUTION – GESTÃO E ENGENHARIA LTDAVictor Mendes
 

Semelhante a Indicadores de desempenho de PMEs a partir de dados abertos (20)

Elaboração projeto investimento
Elaboração projeto investimentoElaboração projeto investimento
Elaboração projeto investimento
 
Pesquisa mostra perfil do Empreendedor Individual
Pesquisa mostra perfil do Empreendedor IndividualPesquisa mostra perfil do Empreendedor Individual
Pesquisa mostra perfil do Empreendedor Individual
 
Geração de valor nas compras organizacionais e as influências na relação busi...
Geração de valor nas compras organizacionais e as influências na relação busi...Geração de valor nas compras organizacionais e as influências na relação busi...
Geração de valor nas compras organizacionais e as influências na relação busi...
 
Influência do PMBOK no sucesso dos Projetos de Sistemas de Informação
Influência do PMBOK no sucesso dos Projetos de Sistemas de InformaçãoInfluência do PMBOK no sucesso dos Projetos de Sistemas de Informação
Influência do PMBOK no sucesso dos Projetos de Sistemas de Informação
 
Monografia PUC MINAS 2009 - Processo de Avaliação e Análise de Riscos para El...
Monografia PUC MINAS 2009 - Processo de Avaliação e Análise de Riscos para El...Monografia PUC MINAS 2009 - Processo de Avaliação e Análise de Riscos para El...
Monografia PUC MINAS 2009 - Processo de Avaliação e Análise de Riscos para El...
 
Pesquisa de Marketing Cenários da Comunicação Corporativa
Pesquisa de Marketing Cenários da Comunicação CorporativaPesquisa de Marketing Cenários da Comunicação Corporativa
Pesquisa de Marketing Cenários da Comunicação Corporativa
 
Modelo de Plano de Negócios do Sistem Indústria
Modelo de Plano de Negócios do Sistem IndústriaModelo de Plano de Negócios do Sistem Indústria
Modelo de Plano de Negócios do Sistem Indústria
 
O Uso dos Sistemas de Informação no Apoio ao Planeamento e Controlo Corporativo
O Uso dos Sistemas de Informação no Apoio ao Planeamento e Controlo CorporativoO Uso dos Sistemas de Informação no Apoio ao Planeamento e Controlo Corporativo
O Uso dos Sistemas de Informação no Apoio ao Planeamento e Controlo Corporativo
 
Pim v
Pim vPim v
Pim v
 
ANÁLISE DE ESTRATÉGIAS NO AMBIENTE DE MARKETING DIGITAL E e-COMMERCE: a estr...
 ANÁLISE DE ESTRATÉGIAS NO AMBIENTE DE MARKETING DIGITAL E e-COMMERCE: a estr... ANÁLISE DE ESTRATÉGIAS NO AMBIENTE DE MARKETING DIGITAL E e-COMMERCE: a estr...
ANÁLISE DE ESTRATÉGIAS NO AMBIENTE DE MARKETING DIGITAL E e-COMMERCE: a estr...
 
Empreendedorismo teleaula 4_tema_5
Empreendedorismo teleaula 4_tema_5Empreendedorismo teleaula 4_tema_5
Empreendedorismo teleaula 4_tema_5
 
Plano de curso mba em business intelligence at big data (mba)-20212-turma-v...
Plano de curso   mba em business intelligence at big data (mba)-20212-turma-v...Plano de curso   mba em business intelligence at big data (mba)-20212-turma-v...
Plano de curso mba em business intelligence at big data (mba)-20212-turma-v...
 
Plano definitivo
Plano definitivoPlano definitivo
Plano definitivo
 
PI II - CONCEPCAO DE SERVICOS DE TI
PI II - CONCEPCAO DE SERVICOS DE TIPI II - CONCEPCAO DE SERVICOS DE TI
PI II - CONCEPCAO DE SERVICOS DE TI
 
Análise do impacto do ambiente externo na gestão de vantagens competitiva
Análise do impacto do ambiente externo na gestão de vantagens competitivaAnálise do impacto do ambiente externo na gestão de vantagens competitiva
Análise do impacto do ambiente externo na gestão de vantagens competitiva
 
Pim v 2011
Pim v 2011Pim v 2011
Pim v 2011
 
UTILIZAÇÃO DA METODOLOGIA LEAN STARTUP PARA CRIAÇÃO DE UMA STARTUP: Anál...
UTILIZAÇÃO DA METODOLOGIA LEAN STARTUP PARA CRIAÇÃO DE UMA STARTUP: Anál...UTILIZAÇÃO DA METODOLOGIA LEAN STARTUP PARA CRIAÇÃO DE UMA STARTUP: Anál...
UTILIZAÇÃO DA METODOLOGIA LEAN STARTUP PARA CRIAÇÃO DE UMA STARTUP: Anál...
 
[FINAL] MONOGRAFIA - DANIEL BRANDT - OS CRITÉRIOS DE SUCESSO EM PROJETOS DE S...
[FINAL] MONOGRAFIA - DANIEL BRANDT - OS CRITÉRIOS DE SUCESSO EM PROJETOS DE S...[FINAL] MONOGRAFIA - DANIEL BRANDT - OS CRITÉRIOS DE SUCESSO EM PROJETOS DE S...
[FINAL] MONOGRAFIA - DANIEL BRANDT - OS CRITÉRIOS DE SUCESSO EM PROJETOS DE S...
 
Plano De Negócios - SOLUTION – GESTÃO E ENGENHARIA LTDA
Plano De Negócios - SOLUTION – GESTÃO E ENGENHARIA LTDAPlano De Negócios - SOLUTION – GESTÃO E ENGENHARIA LTDA
Plano De Negócios - SOLUTION – GESTÃO E ENGENHARIA LTDA
 
466 1478-1-pb
466 1478-1-pb466 1478-1-pb
466 1478-1-pb
 

Indicadores de desempenho de PMEs a partir de dados abertos

  • 1. Daniele Rodrigues dos Santos VERIFICAÇÃO DA POSSIBILIDADE DE OBTENÇÃO DE ÍNDICES DE PERFORMANCE DE PEQUENAS E MÉDIAS EMPRESAS ATRAVÉS DA ANÁLISE DE DADOS ABERTOS Monografia apresentada à Faculdade FIA de Administração de Negócios mantida pela Fundação Instituto de Administração como requisito para obtenção do certificado de conclusão de curso de Pós- Graduação Lato Sensu Área de habilitação: MBA Analytics em Big Data Orientador: Prof. Dr. Adolpho Walter Pimazoni Canton Profa. Dra. Alessandra Ávila Montini São Paulo 2017
  • 2.
  • 3. Daniele Rodrigues dos Santos VERIFICAÇÃO DA POSSIBILIDADE DE OBTENÇÃO DE ÍNDICES DE PERFORMANCE DE PEQUENAS E MÉDIAS EMPRESAS ATRAVÉS DA ANÁLISE DE DADOS ABERTOS Trabalho de conclusão de curso apresentado à Faculdade FIA de Administração e Negócios como requisito para a obtenção do título Master of Business Administration em Analytics em Big Data. Aprovado em: ____ de _______ de _____. BANCA EXAMINADORA __________________________________________ Prof. Dr. Adolpho Walter Pimazoni Canton – Faculdade FIA de Administração e Negócios __________________________________________ Profa. Dra. Alessandra Ávila Montini – Faculdade FIA de Administração e Negócios
  • 4. LISTA DE FIGURAS Figura 1: Modelo conceitual central – Extraído de Raifur[2], p.69 ...................................................... 10 Figura 2: Variáveis Influentes – modelo multinomial. Extraído de Raifur[2],p.161.............................. 15 Figura 3: Pesquisa nota fiscal paulista................................................................................................... 17 Figura 4: Informações básicas............................................................................................................... 18 Figura 5: Site oficial da empresa ........................................................................................................... 19 Figura 6: Perfil público de empresa no LinkedIn®................................................................................. 19 Figura 7: Listagem de funcionários com perfil no LinkedIn® ................................................................ 19 Figura 8: Canal de Vídeos do YouTube®................................................................................................ 20 Figura 9: Site Jusbrasil........................................................................................................................... 20 Figura 10: Site EmpresasCNPJ............................................................................................................... 21 Figura 11: Comprovante de inscrição e situação cadastral................................................................... 21 Figura 12: Capital social......................................................................................................................... 22 Figura 13: Site do cadastro nacional de empresas Idôneas.................................................................. 22 Figura 14: Site IBGE ............................................................................................................................... 23 Figura 15: Arquitetura de extração e análise de dados ........................................................................ 26
  • 5. LISTA DE TABELAS Tabela 1: Variáveis de capital humano ................................................................................................. 11 Tabela 2: Variáveis de tamanho da empresa e demografia pessoal..................................................... 11 Tabela 3: Variáveis de características gerenciais .................................................................................. 12 Tabela 4: Variáveis de condições de ambiente..................................................................................... 12 Tabela 5: Variáveis de características organizacionais.......................................................................... 12 Tabela 6: Variáveis de motivação e percepção..................................................................................... 13 Tabela 7: Variáveis de tamanho e demografia pessoal......................................................................... 13 Tabela 8: Variáveis de desempenho ..................................................................................................... 13 Tabela 9: Variáveis influentes e grupos conceituais ............................................................................. 16
  • 6. SUMÁRIO 1.Resumo....................................................................................................................................7 2.Briefing....................................................................................................................................8 3.Sumário....................................................................................................................................9 4.Introdução..............................................................................................................................10 5.Descrição dos indicadores para aferição de desempenho e critérios de sobrevivência.........11 6.Teste de hipótese e técnicas estatísticas utilizadas................................................................14 7.Aferição das variáveis influentes através da verificação de dados abertos ...........................17 8.Sugestão de arquitetura para extração e análise de dados .....................................................26 8.Conclusões finais...................................................................................................................28 9.Referências ............................................................................................................................29
  • 7. 7 1.RESUMO Segundo dados do Sebrae[1] (Serviço Brasileiro de Apoio às Micro e Pequenas Empresas), em 2014, as pequenas e micro empresas representavam 27% do PIB e contribuíam com 52% dos empregos de carteira assinada. Apesar da importância econômica de empresas deste porte, existem poucas pesquisas sobre definição de indicadores e índices de performance dado que muitos desses indicadores são obtidos através da análise de dados financeiros abertos. Pequenos e micro empreendimentos geralmente possuem esses dados fechados e quando são disponibilizados, muitas vezes, carecem de consistência. O objetivo deste trabalho é estudar verificar a possibilidade de obtenção de indicadores, baseados em um modelo teórico, através de dados de bases abertas. Assim, poderia se classificar empresas quanto a possibilidade de sucesso ou falência. Os dados serão obtidos sem necessidade de interação com o empreendedor. A base científica, é a tese de doutorado apresentada pelo Dr. Léo Raifur em Fatores Determinantes do Desempenho de Pequenas e Médias Empresas da Região Centro- Sul do Estado do Paraná[2].
  • 8. 8 2.BRIEFING Data from Sebrae[1] (Serviço Brasileiro de Apoio às Pequenas e Micro Empresas) in 2014, small and medium business were responsible for 27% of PIB and 52% of workforce were hired by these companies. Although economic significance of those companies, there are few academic references about how to define performance indicators for such kind of business as the usual methods rely on financial information and generally, small and medium business does not make these data available on open sources neither are consistent. The goal of this work is verify the possibility of find business indicators based on theorical model, through data obtained on open sources. Thus, would be possible classify enterprises in which regards the success or failure conditions. Data are acquired without any interaction with entrepreneurs. Scientific argumentation is based on research developed by Léo Raifur, PhD in Fatores Determinantes do Desempenho de Pequenas e Médias Empresas da Região Centro-Sul do Estado do Paraná[2].
  • 9. 9 3.SUMÁRIO Na fase de Introdução deste trabalho, apresentamos os índices de desempenho definidos pela fonte científica, Raifur[2]. Na fase de desenvolvimento, escolhemos aleatoriamente uma empresa para efetuar pesquisa e verificamos que tipo de informação é possível ser obtida sem haver interação como os empreendedores. Finalmente, consolidamos os resultados da fase de desenvolvimento e definimos o que pode ser aplicável de acordo com a teoria desenvolvida por Raifur[2].
  • 10. 10 4.INTRODUÇÃO Os dados da pesquisa de Raifur[2] foram coletados através de envio de e-mail para empresas listadas na Associação Comercial ou mailing-list de pesquisadores. Alguns questionários foram impressos e entregues diretamente aos respondentes. O modelo conceitual da pesquisa de Raifur[2], está representado no diagrama abaixo: Figura 1: Modelo conceitual central – Extraído de Raifur[2], p.69 A seguir, vamos descrever os indicadores de cada grupo de entrada: Tamanho, motivação e perfil de risco, condições do ambiente, capital social, capital humano, características gerenciais, características organizacionais e demografia pessoal.
  • 11. 11 5.DESCRIÇÃO DOS INDICADORES PARA AFERIÇÃO DE DESEMPENHO E CRITÉRIOS DE SOBREVIVÊNCIA Capital Humano A descrição das variáveis de capital humano é dada a seguir: Descrição Tipo Escala Escolaridade Ordinal 5 Experiência ocupacional Ordinal 6 Experiência ocupacional no ramo de negócio Ordinal 6 Experiência em funções de liderança Ordinal 6 Média anual de treinamento pessoal Ordinal 6 Histórico familiar Dummy 2 Experiência anterior em outra empresa Dummy 2 Tabela 1: Variáveis de capital humano Tamanho da Empresa e Demografia Pessoal A descrição das variáveis de tamanho da empresa e demografia pessoal é dada a seguir: Descrição Tipo Escala Disponibilidade de capital para constituição da empresa Ordinal 5 Uso de empréstimo na constituição da empresa Ordinal 5 Quantidade de fornecedores Ordinal 5 Giro dos fornecedores Ordinal 5 Relacionamento da empresa com bancos Likert 5 Uso de serviços especializados Likert 4 Receptividade nas demandas de crédito Likert 6 Volume de crédito atendido nas demandas Likert 6 Dificuldade de obtenção de crédito Likert 6 Impacto do crédito na expansão do negócio Likert 6 Tabela 2: Variáveis de tamanho da empresa e demografia pessoal
  • 12. 12 Características Gerenciais A descrição das variáveis de características gerenciais é dada a seguir: Descrição Tipo Escala Nível de pesquisa de mercado realizado antes da abertura Likert 6 Pesquisa e contatos prévios com os principais fornecedores Likert 6 Análise de ambiente: concorrentes, preços, etc. Likert 6 Pesquisa sobre localização do negócio Likert 6 Estudo sobre a viabilidade econômico-financeira Likert 6 Conhecimento e controle do fluxo de caixa Likert 6 Frequência de uso de antecipação de recebíveis Likert 6 Problemas com inadimplentes Likert 6 Pagamento de juros elevados Likert 6 Tabela 3: Variáveis de características gerenciais Condições de Ambiente A descrição das variáveis de condições de ambiente é dada a seguir: Descrição Tipo Escala Grau de sazonalidade no segmento da empresa Likert 5 Grau de competição no ambiente da empresa Likert 5 Suporte governamental em relação a linhas de acesso ao crédito Likert 6 Nível de avaliação dos serv. públicos relacionados com PMEs Likert 6 Nível de avaliação de suporte de instituições Likert 6 Ambiente competitivo: grau de lealdade e formalidade Likert 6 Tabela 4: Variáveis de condições de ambiente Características Organizacionais A descrição das variáveis de características organizacionais é dada a seguir: Descrição Tipo Escala Escopo de abrangência: especialidade versus generalidade Dummy 2 Afiliação ou independência do negócio Dummy 2 Nível de qualificação do staff Likert 4 Nível de treinamento disponibilizado ao staff Likert 4 Número de sócios da empresa Razão Relacionamento entre os sócios Likert 5 Grau de inovação exigido no setor de atuação Likert 5 Se a empresa possui site(sítio) Dummy 2 Se os produtos/serviços podem ser consultados no sítio Dummy 2 Se a empresa comercializa prod./serviços pela internet Dummy 2 Tabela 5: Variáveis de características organizacionais
  • 13. 13 Motivação e percepção de risco A descrição das variáveis de motivação e percepção de risco é dada a seguir: Descrição Tipo Escala Decisão de empreender: oportunidade versus necessidade Nominal 2 Motivação para a decisão de empreender Nominal 3 Percepção do grau de risco envolvido nas PMEs Likert 5 Tabela 6: Variáveis de motivação e percepção Tamanho e demografia pessoal A descrição das variáveis de tamanho e demografia pessoal é dada a seguir: Descrição Tipo Escala Capital gasto para constituir o negócio Ordinal 8 Faturamento anual bruto do último ano Ordinal 9 Número atual de empregados Razão - Gênero do empreendedor Nominal 2 Idade do empreendedor Razão - Estado civil do empreendedor Nominal 4 Tabela 7: Variáveis de tamanho e demografia pessoal Desempenho A descrição das variáveis de desempenho é dada a seguir: Descrição Tipo Escala Ajuste* Margem de Lucro Likert 7 5 Crescimento de Receita Likert 5 5 Crescimento de Quadro de Empregados Likert 5 5 Percepção Comparativa de Desempenho Likert 5 5 Satisfação Pessoal com a Empresa Likert 5 5 Impacto da Empresa sobre Qualidade de Vida Familiar Likert 5 5 Nível de Confirmação da Decisão Likert 4 5 Grau de Efetivação das Expectativas Likert 4 5 (*) As variáveis Margem de Lucro e Nível de Confirmação da Decisão foram reponderadas para escala de cinco pontos Tabela 8: Variáveis de desempenho
  • 14. 14 6.TESTE DE HIPÓTESE E TÉCNICAS ESTATÍSTICAS UTILIZADAS A tese de Raifur (2013,p.80) testou a seguinte hipótese central: “se existe pelo menos um fator(indicador) capaz de explicar o desempenho (variável dependente) de pequenas e médias empresas” Para este fim, foram utilizados os testes estatísticos listados a seguir: análise fatorial, regressão linear múltipla, regressão logística binária e regressão logística multinomial. Vamos formalizar cada uma das técnicas no tópico seguinte. 6.1 ANÁLISE FATORIAL “O propósito essencial da análise factorial é descrever, se possível, a estrutura de covariâncias entre as variáveis em termos de um nº menor de variáveis (não observáveis) chamadas factores. Por outras palavras, a análise factorial estuda os inter-relacionamentos entre as variáveis, num esforço para encontrar um conjunto de factores (em menor nº que o conjunto de variáveis originais) que exprima o que as variáveis originais partilham em comum.” Lucas[3], p.1 6.2 REGRESÃO LINEAR MÚLTIPLA “A análise de regressão estuda o relacionamento entre uma variável chamada variável dependente e outras variáveis chamadas variáveis independentes. Este relacionamento é representado por um modelo matemático, isto é, por uma equação que associa a variável dependente com as variáveis independentes. Este modelo é designado por modelo de regressão linear simples se define uma relação linear entre a variável dependente e uma variável independente. Se em vez de uma, forem incorporadas várias variáveis independentes, o modelo passa a denominar-se modelo de regressão linear múltipla.” Henriques[4],p.1 6.3 REGRESSÃO LOGÍSTICA “A regressão logística é uma técnica estatística que tem como objectivo produzir, a partir de um conjunto de observações, um modelo que permita a predição de valores tomados por uma variável categórica, frequentemente binária, a partir de uma série de variáveis explicativas contínuas e/ou binárias[1][2]”
  • 15. 15 “Em comparação com as técnicas conhecidas em regressão, em especial a regressão linear, a regressão logística distingue-se essencialmente pelo facto de a variável resposta ser categórica.” Wikipédia[5] 6.4 – DEFINIÇÃO DO MODELO GERAL Foram realizados testes de hipóteses para definição do modelo geral. Primeiramente, foi verificada a possibilidade de definição de uma fórmula de desempenho. Para isto, foi utilizada a técnica de Regressão Linear Multivariada. Em seguida, foi verificada a possibilidade de se discriminar empresas sobreviventes das não sobreviventes, para isto, foi utilizado o modelo Logístico Geral. Finalmente, chegamos ao modelo que será utilizado como base para o nosso estudo. Através de Regressão Logística Multinomial, foi determinado o modelo para classificar as empresas não sobreviventes, sobrevivência marginal e alto desempenho. A figura abaixo apresenta o modelo e as variáveis influentes. Figura 2: Variáveis Influentes – modelo multinomial. Extraído de Raifur[2],p.161
  • 16. 16 A seguir, visualizamos as variáveis influentes organizadas por Grupo Conceitual: Variável Descrição Grupo Conceitual EXP_OC Experiência Ocupacional Capital HumanoEXP_R Experiência Ocupacional no Ramo do Negócio EMP_C Uso de Empréstimos na Constituição da Empresa Capital Social PESQ_MERC Nível de Pesquisa de Mercado Realizado Antes da Abertura PESQ_FORN Pesquisa e Contatos Prévios com os Principais Fornecedores PESQ_AMB Análise de Ambiente: Concorrentes, Preços, etc. PESQ_LOC Pesquisa sobre Localização do Negócio AN_VEF Análise de Viabilidade Econômico- Financeira FIN_CP Financiamento de Curto Prazo CRED_LA Suporte Governamental em Relação a Linhas de Acesso ao Crédito Condições do AmbienteSERV_PUB Nível de Avaliação dos Serviços Públicos Relacionados com PMEs TREIN_E Nível de Treinamento Disponibilizado ao Staff Características Organizacionais EMP_A Número Atual de Empregados Tamanho Tabela 9: Variáveis influentes e grupos conceituais Este trabalho irá avaliar a possibilidade de aferição destas variáveis através de dados abertos na internet.
  • 17. 17 7.AFERIÇÃO DAS VARIÁVEIS INFLUENTES ATRAVÉS DA VERIFICAÇÃO DE DADOS ABERTOS Partimos da hipótese de que não temos informação alguma sobre as empresas a serem pesquisadas. Assim, a primeira tarefa foi encontrar uma fonte de dados aonde poderíamos obter a listagem de empresas. A informação foi encontrada no site da Secretaria da Fazenda do Estado de São Paulo[6]. Pesquisamos quais estabelecimentos na cidade de São Paulo participam do Programa Nota Fiscal Paulista. Abaixo, ilustramos a primeira página do resultado da busca: Figura 3: Pesquisa nota fiscal paulista Em seguida, vamos analisar quais informações sobre os proprietários pode ser obtida por dados abertos.
  • 18. 18 7.1 OBTENÇÃO DE INFORMAÇÃO POR FONTES ABERTAS Baseado na lista de estabelecimentos obtida no site da Secretaria da Fazenda do Estado de São Paulo, escolhemos aleatoriamente uma empresa para verificação de qual tipo de informação está disponível em fontes abertas. A empresa selecionada foi: '' PROTENDE '' SISTEMAS E METODOS DE CONSTRUCOES LTDA. 7.1.1 DADOS DA '' PROTENDE '' SISTEMAS E METODOS DE CONSTRUCOES LTDA Utilizando a ferramenta de busca Google®[8], encontramos algumas referências sobre a empresa “Protende”. a. Página inicial do Google®[8] com informativo básico do funcionamento do estabelecimento Figura 4: Informações básicas
  • 19. 19 b. Site oficial da empresa[15]. O mesmo continha informações sobre o tipo de serviços prestados e formas de contato. Figura 5: Site oficial da empresa c. Linkedin®[7]. Nesta plataforma encontramos o perfil público da empresa e o perfil de alguns funcionários. Figura 6: Perfil público de empresa no LinkedIn® Figura 7: Listagem de funcionários com perfil no LinkedIn®
  • 20. 20 d. Canal no YouTube®[9]. A empresa possui um canal de vídeos no YouTube®[9] para divulgação de projetos Figura 8: Canal de Vídeos do YouTube® e. No site Jusbrasil[10], é possível verificar todas as citações sobre a empresa em diário oficial ou ações judiciais que não estão em estado sigiloso Figura 9: Site Jusbrasil
  • 21. 21 6 – No site EmpresasCNPJ[11] é possível obter informações sobre: CNPJ, Nome Fantasia, Razão Social, Data de Abertura, Endereço, Telefone, e-mail, natureza jurídica, status da empresa e atividade econômica principal Figura 10: Site EmpresasCNPJ Com a informação sobre o CNPJ, é possível realizar uma busca no site da Receita Federal e obter um conjunto de dados relevantes: 7.1- Site Consulta CNPJ da Receita Federal[12]. Comprovante de Inscrição e Situação Cadastral Figura 11: Comprovante de inscrição e situação cadastral
  • 22. 22 7.2 - Capital Social Figura 12: Capital social 8. Cadastro Nacional de Empresas Idôneas No site do Cadastro Nacional de Empresas Idôneas[13], não foi encontrado processos contra a empresa pesquisada Figura 13: Site do cadastro nacional de empresas Idôneas
  • 23. 23 9. Site do IBGE No site do IBGE[14] encontramos dados demográficos, macroeconomia e microeconomia. Existem diversos indicadores, sendo possível refinar as informações por município, estado e nacionalmente. Figura 14: Site IBGE 7.2 ADERÊNCIA DAS INFORMAÇÕES OBTIDAS EM FONTES ABERTAS COM AS VARIÁVEIS INFLUENTES Vamos discutir a possibilidade da utilização dos dados em fontes abertas para definição das variáveis influentes. O conjunto de variáveis foi apresentado na tabela 2.4.1. 7.2.1 – Variável Experiência Ocupacional Esta informação é passível de ser obtida mas depende da dedicação dos sócios e administradores da empresa em manter seu currículo atualizado e aberto ao público. A melhor plataforma para consulta deste tipo de informação é o LinkedIn®. No caso da empresa “Protende”, a maioria dos sócios e administradores não adicionou muita informação ao seu perfil público do LinkedIn®. Está disponível apenas a ocupação atual e informações sobre formação educacional. 7.2.2 – Variável Experiência Ocupacional no Ramo de Atuação A variável pode ser obtida utilizando as mesmas fontes de dados da variável “Experiência Ocupacional”. Como observado anteriormente, a qualidade da informação depende de dedicação pessoal em manter o currículo atualizado e aberto ao público. 7.2.3 – Uso de Empréstimos na Constituição da Empresa Esta informação só está disponível se o empréstimo foi adquirido em instituição pública, excluindo –se bancos públicos. Não é uma informação de fácil acesso. O uso de técnicas de text-mining seria adequado na tentativa de extração desta informação em diário oficial ou conteúdo de página de sites oficiais.
  • 24. 24 7.2.4 – Nível de Pesquisa de Mercado Realizado Antes da Abertura Não é possível obter esta informação por fontes abertas. Os sócios e administrados precisam ser questionados de maneira direta. 7.2.5 – Pesquisa e Contato Prévio com os Principais Fornecedores Não é possível obter esta informação por fontes abertas. Os sócios e administrados precisam ser questionados de maneira direta. 7.2.6 – Análise de Ambiente: Preços, Concorrentes, etc. Esta informação está disponível em fontes abertas mas não é possível determinar se este tipo de pesquisa foi realizada pelos sócios e administradores da empresa durante o planejamento de abertura do negócio. 7.2.7 – Pesquisa sobre Localização do Negócio É possível verificar pelo conjunto de informações disponível em fontes abertas mas não é podemos determinar se este tipo de pesquisa foi realizada pelos sócios e administradores da empresa durante o planejamento de abertura do negócio. 7.2.8 – Análise de Viabilidade Econômico-Financeira É possível verificar pelo conjunto de informações disponível em fontes abertas mas não podemos determinar se este tipo de pesquisa foi realizada pelos sócios e administradores da empresa durante o planejamento de abertura do negócio. 7.2.9 – Financiamento de Curto Prazo Esta informação só está disponível se o financiamento foi adquirido em instituição pública, excluindo –se bancos públicos. Não é uma informação de fácil acesso. O uso de técnicas de text-mining seria adequado na tentativa de extração desta informação em diário oficial ou conteúdo de página de sites oficiais. 7.2.10 – Suporte Governamental em Relação as Linhas de Crédito Não é possível obter esta informação por fontes abertas. Os sócios e administrados precisam ser questionados de maneira direta. 7.2.11 – Nível de Avaliação de Serviços Público Relacionados com PMEs Não é possível obter esta informação por fontes abertas. Os sócios e administrados precisam ser questionados de maneira direta. 7.2.12 – Nível de Treinamento Disponibilizado ao Staff
  • 25. 25 Não é possível obter esta informação por fontes abertas. Os sócios e administrados precisam ser questionados de maneira direta. 7.2.13 – Número Atual de Empregados É possível obter esta informação mas depende da dedicação dos sócios e administradores da empresa em manter o perfil público da empresa atualizado. A melhor plataforma para consulta deste tipo de informação é o LinkedIn®.
  • 26. 26 8. SUGESTÃO DE ARQUITETURA PARA EXTRAÇÃO E ANÁLISE DE DADOS A seguir, sugerimos arquitetura para extração e análise de dados obtidos pela internet e também dados históricos internos. Figura 15: Arquitetura de extração e análise de dados A arquitetura sugerida leva em consideração o fato de que os dados obtidos são desestruturados. O Sqoop foi desenvolvido para transferência eficiente de grande quantidade de dados entre o Apache Hadoop e sistema de banco de dados. O Kafka é uma plataforma de streaming distribuída. Foi concebido para armazenamento e distribuição de streamings em tempo real. Cada gravação consiste de uma estrutura de chave, valor e datação (timestamp). Pode ser usado para monitorar dados do Twitter®. O Flume foi desenvolvido para agregar, coletar e movimentar grandes volumes de Logs.
  • 27. 27 O Spark é uma engine para processamento rápido de grande quantidade de dados. O Hive é um software de armazenamento de dados que facilita a leitura, escrita e administração de grandes volumes de dados em sistemas distribuídos. Utiliza a linguagem SQL. O Teradata é uma empresa que criou uma distribuição Hadoop voltada para o meio empresarial. O Tableau é um software de visualização de dados. Quanto aos módulos de limpeza, tratamento e análise de dados, podemos utilizar a linguagem Python para desenvolver aplicações para este fim. O Python possui bibliotecas de inteligência artificial e estatística.
  • 28. 28 8.CONCLUSÕES FINAIS As bases de dados abertas fornecem uma infinidade de informações relevantes sobre a constituição das empresas, dados de macroeconomia e microeconomia. Entretanto, não é possível aferir as variáveis influentes formuladas por Raifur[2] através exclusivamente destas fontes. Muitas destas variáveis dizem respeito ao planejamento efetuado pelo empreendedor antes da abertura ou início do negócio, currículo dos administradores e dados financeiros privados. Pela pesquisa efetuada neste trabalho, não parece ser uma prioridade dos administradores, tornar este tipo de informação pública. Saliento que encontramos alguns dados interessantes não diretamente citados na tese de Raifur[2]: canal de vídeos do YouTube®, currículo de funcionários da empresa e rede de relacionamentos no LinkedIn®; atas, diário oficial e ações judiciais no portal do Jusbrasil, possibilidade de verificação de pendências com o governo no site do cadastro nacional de empresas idôneas. Portanto, o trabalho de Raifur[2] poderia ser revisto levando em consideração essas novas fontes de informação. Através do uso da econometria, estatística, mineração de dados e analytics, é possível se chegar a um novo conjunto de variáveis influentes. A obtenção e análise desses dados possibilita a criação de uma ferramenta de mapeamento e monitoramento da saúde de pequenos e médios negócios, ajudando a direcionar políticas de governo e investimentos privados.
  • 29. 29 9.REFERÊNCIAS [1] Brasil. Sebrae – Serviço Brasileiro de Apoio às Micro e Pequenas Empresas. Sebrae Mato Grosso, 2014. Disponível em: < http://www.sebrae.com.br/sites/PortalSebrae/ufs/mt/noticias/micro-e-pequenas-empresas- geram-27-do-pib-do-brasil,ad0fc70646467410VgnVCM2000003c74010aRCRD> [2] RAIFUR, Léo. Fatores Determinantes do Desempenho de Pequenas e Médias Empresas da Região Centro-Sul do Estado do Paraná.2013. 211 f. Tese (Programa de Pós- Graduação em Administração) - Faculdade de Economia, Administração e Contabilidade, Universidade de São Paulo, São Paulo, 2013 [3]LUCAS,Cristina. Análise de Componentes Principais e Análise Factorial. 2016. Disponível em: <http://www.estgv.ipv.pt/PaginasPessoais/lucas/material/Acetatos%20ACP%20e%20AFC%2 03%C2%AAparte%20aluno.pdf> [4]HENRIQUES, Carla. Análise de Regressão Linear Simples e Múltipla. 2010/2011. Disponível em: <http://www.estgv.ipv.pt/PaginasPessoais/psarabando/Ambiente%202010- 2011/Slides/Regressaoalunos.pdf> [5]Brasil, Wikipédia – Regressão Logística. 2016. Disponível em: <https://pt.wikipedia.org/wiki/Regress%C3%A3o_log%C3%ADstica> [6]Brasil, Secretaria da Fazenda – Nota Fiscal Paulista. 2016. Disponível em: <http://www.nfp.fazenda.sp.gov.br/lista_aprovacao.shtm> [7]Brasil, LinkedIn® - Protende Sistemas e Métodos de Construção. 2016. Disponível em: < https://br.linkedin.com/company/protende-sistemas-e-m-todos-de-constru-es-ltda> [8]Brasil, Google® - Pesquisa “Protende Sistemas e Métodos de Construção”. 2016. Disponível em: < https://www.google.com.br/search?q=consulta+empresa+numero+funcionarios&ie=utf- 8&oe=utf-8&client=firefox-b- ab&gfe_rd=cr&ei=Jvw2WNDlBZGlwQTtoJzYCw#q=protende+%27%27+sistemas+e+meto dos+de+construcoes+ltda> [9]Brasil, YouTube® - Canal de Vídeos da Protende Sistemas e Métodos de Construção. 2016. Disponível em: < https://www.youtube.com/channel/UCOPEp3fAG8dr8-VpMLBsvrw>
  • 30. 30 [10]Brasil, JusBrasil – Pesquisa “Protende Sistemas e Métodos de Construção”. 2016. Disponível em: <http://www.jusbrasil.com.br/busca?q=%27%27+PROTENDE+%27%27+SISTEMAS+E+M ETODOS+DE+CONSTRUCOES+LTDA> [11] Brasil, EmpresasCNPJ – Pesquisa “Protende Sistemas e Métodos de Construção”. 2016. Disponível em: <http://www.empresascnpj.com/s/empresa/protende-sistemas-e-metodos-de-construcoes- ltda/48298061000103> [12] Brasil, Consulta CNPJ – Receita Federal. 2016. Disponível em: <http://www.receita.fazenda.gov.br/pessoajuridica/cnpj/cnpjreva/cnpjreva_solicitacao2.asp> [13] Brasil, Cadastro Nacional de Empresas Idôneas. 2016. Disponível em: <http://www.portaltransparencia.gov.br/ceis> [14] Brasil, IBGE. 2016. Disponível em: <http://www.ibge.gov.br/home/> [15] Brasil, Site Oficial da Empresa.2016. Disponível em: <http://www.protende.com.br/newsite/home.htm>