SlideShare uma empresa Scribd logo
1 de 29
Baixar para ler offline
A lista de Mais Vendidos do Publishnews
e o Mercado Editorial Brasileiro entre 2011 e 2022
Whaner Endo
Sumário
01
02
03
04
05
06
07
OBJETIVO DO TRABALHO
CONCEITO DE BEST-SELLER
LISTA DE MAIS VENDIDOS DO PUBLISHNEWS
METODOLOGIA
RESULTADOS
POSSÍVEIS CONTINUAÇÕES DO TRABALHO
REFERÊNCIAS
OBJETIVO DO TRABALHO
O início da análise da lista de “Mais Vendidos” do
Publishnews.
Faz parte de um projeto de pesquisa mais amplo,
que visa determinar a representatividade das listas
de Best-sellers em relação ao mercado editorial.
O BEST-SELLER
CUSTOMERS
• O best-seller como tipo de narrativa
ficcional X comportamento de vendas
(REIMÃO, 2021)
• As listas como gatilho para o
comportamento do consumidor
(CARARE, 2012)
• Antecedente da homogeneização ou a
pasteurização das publicações
THOMPSON, 2012)
Revista The Bookman,
Começou a publicar
mensalmente, os seis
livros mais vendidos no
mercado americano
01
1895
02 03 04
The New York Times
lança sua lista semanal.
Ainda hoje é
considerada uma das
mais importantes do
mercado mundial.
1942
O Globo foi responsável
pela criação da primeira
lista brasileira, chamada
“Os best-sellers da
quinzena.
1956
Em setembro o
Publishnews publica
sua primeira lista de
mais vendidos.
2010
A LISTA DO PN
Foi a primeira a publicar, entre os metadados
disponibilizados, a quantidade de exemplares
vendidos de determinado título.
Possui uma série histórica desde 2010 e se
mantém ativa até os dias atuais. São dados
na granularidade semanal, agregados por
mês para este trabalho.
Período de 2011-2022.
METODOLOGIA
• [CRISP-DM], acrônimo de CRoss-
Industry Standard Process for Data
Mining.
• Sistematizar uma linha de pesquisa
com métodos quantitativos no GP
de Produção Editorial.
• Apresentar termos e conceito de
forma didática no trabalho.
Web scraping
FASES DO CRISP-DM
Foi criado um script na
linguagem python,
utilizando um spider
desenvolvido com base
na biblioteca Scrapy
Data wrangling
Manipulação do dataset
inicial, composto de 37.200
datapoints, com 3.100
observações e 12 features
Análise
Análise dos dados
através de scripts em
linguagem python e
utilização de diversas
bibliotecas.
Mission
ANÁLISE
• Verificou-se a necessidade de criar novas features ou
manipular as features existentes.
• Avaliou-se a presença de missing values.
• Descartados os dados dos anos de 2010 e 2023 e, com
isso, o dataset passou a ter formato 2.880 linhas x 19
colunas ou 54.720 datapoints.
• Baseada em EDA – Exploratory Data Analysis, trazendo
estatísticas descritivas dos dados.
• Dividida em dados gerais, por título, autoria e editora.
• Criação de visualizações e tabelas para melhor
compreensão.
DADOS GERAIS
36.804.272 608 99
QTD. VENDIDA TÍTULOS EDITORAS
351
AUTORIAS
Gráfico 1: Volume de venda de exemplares, por ano
TÍTULOS
626 exemplares,
com ‘Os quatro
segredos sagrados
para o amor e a
prosperidade’
Abril de 2020
Nada a perder 3
vedeu 439.338
exemplares
Dezembro de 2014
7% dos títulos ou os
primeiros 44
correspondem a
50% das vendas
(18,5M).
80% (29,5M) = 26%
dos títulos
QTD. MÍNIMA + VENDIDO PARETO
Gráfico 1: Volume de venda de exemplares, por ano
Gráfico 1: Volume de venda de exemplares, por ano
Temática
religiosa
Livros
e
colorir
CATEGORIA
AUTORIA
Os 15 que mais venderam representam 45% do total de
exemplares vendidos e para se atingir 80% do total
vendido ou 29,5 milhões são necessários exatos 20%
dos títulos ou os 71 primeiros da lista
PARETO
EDITORAS
REFERÊNCIAS
CARARE, Octavian. THE IMPACT OF BESTSELLER RANK ON DEMAND: EVIDENCE FROM THE APP MARKET*. International Economic
Review, [S. l.], v. 53, n. 3, p. 717–742, 2012. DOI: 10.1111/j.1468-2354.2012.00698.x. Disponível em: http://doi.wiley.com/10.1111/j.1468-
2354.2012.00698.x.
CHAPMAN, Pete; CLINTON, Julian; KERBER, Randy; KHABAZA, Thomas; REINARTZ, Thomas; SHEARER, Colin; WIRTH, Rüdiger. CRISP-DM
1.0 - Step-by-step data mining guide. [s.l: s.n.].
MARTINEZ-PLUMED, Fernando; CONTRERAS-OCHANDO, Lidia; FERRI, Cesar; HERNANDEZ-ORALLO, Jose; KULL, Meelis; LACHICHE,
Nicolas; RAMIREZ-QUINTANA, Maria Jose; FLACH, Peter. CRISP-DM Twenty Years Later: From Data Mining Processes to Data Science
Trajectories. IEEE Transactions on Knowledge and Data Engineering, [S. l.], v. 33, n. 8, p. 3048–3061, 2021. DOI: 10.1109/TKDE.2019.2962680.
Disponível em: https://ieeexplore.ieee.org/document/8943998/.
PAZ, Eliane Hatherly. Best-sellers da ditadura: os livros mais vendidos sob o AI-5. Em: XXXXI CONGRESSO BRASILEIRO DE CIÊNCIAS DA
COMUNICAÇÃO - INTERCOM 2018, Joinville,. Anais [...]. Joinville, p. 15.
Publishnews. [s.d.]. Disponível em: https://www.publishnews.com.br/paginas/institucional. Acesso em: 14 jul. 2023.
REIMÃO, Sandra. Mercado editorial brasileiro. [s.l.] : Universidade de São Paulo. Escola de Comunicações e Artes, 2021. DOI:
10.11606/9788572052122. Disponível em: https://www.livrosabertos.sibi.usp.br/portaldelivrosUSP/catalog/book/264.
SCRAPY DEVELOPERS. Scrapy 2.10 documentation. 2023. Disponível em: https://docs.scrapy.org/en/latest/index.html. Acesso em: 14 ago.
2023.
SILVA DE LIMA, Luzimar; MARLY ALVES, Shirlei. Best-sellers e ensino de literatura: mercado editorial, leitores e escola. Revista Graphos, [S. l.],
v. 22, n. 2, p. 269–282, 2020. DOI: 10.22478/ufpb.1516-1536.2020v22n2.52284. Disponível em:
https://periodicos.ufpb.br/index.php/graphos/article/view/52284.
SORENSEN, ALAN T. BESTSELLER LISTS AND PRODUCT VARIETY*. The Journal of Industrial Economics, [S. l.], v. 55, n. 4, p. 715–738,
2007. DOI: 10.1111/j.1467-6451.2007.00327.x. Disponível em: http://doi.wiley.com/10.1111/j.1467-6451.2007.00327.x.
THOMPSON, John B. Merchants of culture: The publishing business in the Twenty-First Century. 2a. ed. London: Plume Books, 2012.
YUCESOY, Burcu; WANG, Xindi; HUANG, Junming; BARABÁSI, Albert-László. Success in books: a big data approach to bestsellers. EPJ Data
Science, [S. l.], v. 7, n. 1, p. 7, 2018. DOI: 10.1140/epjds/s13688-018-0135-y. Disponível em:
https://epjdatascience.springeropen.com/articles/10.1140/epjds/s13688-018-0135-y.
Whaner Endo
whaner@gmail.com
whaner@usp.br
www.linkedin.com/in/whaner
Obrigado!

Mais conteúdo relacionado

Semelhante a Apresentação - Intercom 2023.pdf

Data Science - A arte de estudar e analisar dados
Data Science - A arte de estudar e analisar dadosData Science - A arte de estudar e analisar dados
Data Science - A arte de estudar e analisar dadosDayane Cristine Leite
 
Jornalismo em bases de dados e o hackeamento dos jornais
Jornalismo em bases de dados e o hackeamento dos jornaisJornalismo em bases de dados e o hackeamento dos jornais
Jornalismo em bases de dados e o hackeamento dos jornaisYuri Almeida
 
Curso Business Analytics.pdf
Curso Business Analytics.pdfCurso Business Analytics.pdf
Curso Business Analytics.pdfLuiz Alves
 
A importância das APIs públicas e Big Data no universo da comunicação (Jornal...
A importância das APIs públicas e Big Data no universo da comunicação (Jornal...A importância das APIs públicas e Big Data no universo da comunicação (Jornal...
A importância das APIs públicas e Big Data no universo da comunicação (Jornal...Rafael Sbarai
 
Interrogando plataformas e algoritmos digitais
Interrogando plataformas e algoritmos digitaisInterrogando plataformas e algoritmos digitais
Interrogando plataformas e algoritmos digitaisTarcízio Silva
 
Apresentacao oficina modulo1_atualizado
Apresentacao oficina modulo1_atualizadoApresentacao oficina modulo1_atualizado
Apresentacao oficina modulo1_atualizadoPetcom
 
Apresentacao oficina modulo1_atualizado
Apresentacao oficina modulo1_atualizadoApresentacao oficina modulo1_atualizado
Apresentacao oficina modulo1_atualizadoPetcom
 
Big Data Analytics e Social Mining - Inteligência Em Uma Montanha de Dados?
Big Data Analytics e Social Mining - Inteligência Em Uma Montanha de Dados?Big Data Analytics e Social Mining - Inteligência Em Uma Montanha de Dados?
Big Data Analytics e Social Mining - Inteligência Em Uma Montanha de Dados?Mauricio Cesar Santos da Purificação
 
BIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTS
BIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTSBIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTS
BIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTSVivaldo Jose Breternitz
 

Semelhante a Apresentação - Intercom 2023.pdf (20)

Data Science - A arte de estudar e analisar dados
Data Science - A arte de estudar e analisar dadosData Science - A arte de estudar e analisar dados
Data Science - A arte de estudar e analisar dados
 
O livro didatico no Brasil
O livro didatico no BrasilO livro didatico no Brasil
O livro didatico no Brasil
 
Jornalismo em bases de dados e o hackeamento dos jornais
Jornalismo em bases de dados e o hackeamento dos jornaisJornalismo em bases de dados e o hackeamento dos jornais
Jornalismo em bases de dados e o hackeamento dos jornais
 
Monitoramento e pesquisa em midias sociais parte 1
Monitoramento e pesquisa em midias sociais parte 1Monitoramento e pesquisa em midias sociais parte 1
Monitoramento e pesquisa em midias sociais parte 1
 
Curso Business Analytics.pdf
Curso Business Analytics.pdfCurso Business Analytics.pdf
Curso Business Analytics.pdf
 
Citações e métricas complementares: um estudo da sua correlação em artigos ci...
Citações e métricas complementares: um estudo da sua correlação em artigos ci...Citações e métricas complementares: um estudo da sua correlação em artigos ci...
Citações e métricas complementares: um estudo da sua correlação em artigos ci...
 
A importância das APIs públicas e Big Data no universo da comunicação (Jornal...
A importância das APIs públicas e Big Data no universo da comunicação (Jornal...A importância das APIs públicas e Big Data no universo da comunicação (Jornal...
A importância das APIs públicas e Big Data no universo da comunicação (Jornal...
 
Fontes de pesquisa
Fontes de pesquisaFontes de pesquisa
Fontes de pesquisa
 
Digicorp coutinho 123
Digicorp coutinho 123Digicorp coutinho 123
Digicorp coutinho 123
 
Interrogando plataformas e algoritmos digitais
Interrogando plataformas e algoritmos digitaisInterrogando plataformas e algoritmos digitais
Interrogando plataformas e algoritmos digitais
 
Apresentacao oficina modulo1_atualizado
Apresentacao oficina modulo1_atualizadoApresentacao oficina modulo1_atualizado
Apresentacao oficina modulo1_atualizado
 
Apresentacao oficina modulo1_atualizado
Apresentacao oficina modulo1_atualizadoApresentacao oficina modulo1_atualizado
Apresentacao oficina modulo1_atualizado
 
Big Data Analytics e Social Mining - Inteligência Em Uma Montanha de Dados?
Big Data Analytics e Social Mining - Inteligência Em Uma Montanha de Dados?Big Data Analytics e Social Mining - Inteligência Em Uma Montanha de Dados?
Big Data Analytics e Social Mining - Inteligência Em Uma Montanha de Dados?
 
ESTUDO CIENTOMÉTRICO EM PERIÓDICOS DA CIÊNCIA DA INFORMAÇÃO SOBRE MARKETING D...
ESTUDO CIENTOMÉTRICO EM PERIÓDICOS DA CIÊNCIA DA INFORMAÇÃO SOBRE MARKETING D...ESTUDO CIENTOMÉTRICO EM PERIÓDICOS DA CIÊNCIA DA INFORMAÇÃO SOBRE MARKETING D...
ESTUDO CIENTOMÉTRICO EM PERIÓDICOS DA CIÊNCIA DA INFORMAÇÃO SOBRE MARKETING D...
 
ESTUDO CIENTOMÉTRICO EM PERIÓDICOS DA CIÊNCIA DA INFORMAÇÃO SOBRE MARKETING D...
ESTUDO CIENTOMÉTRICO EM PERIÓDICOS DA CIÊNCIA DA INFORMAÇÃO SOBRE MARKETING D...ESTUDO CIENTOMÉTRICO EM PERIÓDICOS DA CIÊNCIA DA INFORMAÇÃO SOBRE MARKETING D...
ESTUDO CIENTOMÉTRICO EM PERIÓDICOS DA CIÊNCIA DA INFORMAÇÃO SOBRE MARKETING D...
 
Expertise Social Media Research - out 2013
Expertise   Social Media Research - out 2013Expertise   Social Media Research - out 2013
Expertise Social Media Research - out 2013
 
O destino do jornal
O destino do jornalO destino do jornal
O destino do jornal
 
Aula6 Cauda Longa E Economia Da Colaboracao Catia Lassalvia 28 4 08
Aula6 Cauda Longa E Economia Da Colaboracao  Catia Lassalvia 28 4 08Aula6 Cauda Longa E Economia Da Colaboracao  Catia Lassalvia 28 4 08
Aula6 Cauda Longa E Economia Da Colaboracao Catia Lassalvia 28 4 08
 
BIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTS
BIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTSBIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTS
BIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTS
 
Jornalismo e big data
Jornalismo e big dataJornalismo e big data
Jornalismo e big data
 

Apresentação - Intercom 2023.pdf

  • 1. A lista de Mais Vendidos do Publishnews e o Mercado Editorial Brasileiro entre 2011 e 2022 Whaner Endo
  • 2. Sumário 01 02 03 04 05 06 07 OBJETIVO DO TRABALHO CONCEITO DE BEST-SELLER LISTA DE MAIS VENDIDOS DO PUBLISHNEWS METODOLOGIA RESULTADOS POSSÍVEIS CONTINUAÇÕES DO TRABALHO REFERÊNCIAS
  • 3. OBJETIVO DO TRABALHO O início da análise da lista de “Mais Vendidos” do Publishnews. Faz parte de um projeto de pesquisa mais amplo, que visa determinar a representatividade das listas de Best-sellers em relação ao mercado editorial.
  • 4. O BEST-SELLER CUSTOMERS • O best-seller como tipo de narrativa ficcional X comportamento de vendas (REIMÃO, 2021) • As listas como gatilho para o comportamento do consumidor (CARARE, 2012) • Antecedente da homogeneização ou a pasteurização das publicações THOMPSON, 2012)
  • 5. Revista The Bookman, Começou a publicar mensalmente, os seis livros mais vendidos no mercado americano 01 1895 02 03 04 The New York Times lança sua lista semanal. Ainda hoje é considerada uma das mais importantes do mercado mundial. 1942 O Globo foi responsável pela criação da primeira lista brasileira, chamada “Os best-sellers da quinzena. 1956 Em setembro o Publishnews publica sua primeira lista de mais vendidos. 2010
  • 6. A LISTA DO PN Foi a primeira a publicar, entre os metadados disponibilizados, a quantidade de exemplares vendidos de determinado título. Possui uma série histórica desde 2010 e se mantém ativa até os dias atuais. São dados na granularidade semanal, agregados por mês para este trabalho. Período de 2011-2022.
  • 7. METODOLOGIA • [CRISP-DM], acrônimo de CRoss- Industry Standard Process for Data Mining. • Sistematizar uma linha de pesquisa com métodos quantitativos no GP de Produção Editorial. • Apresentar termos e conceito de forma didática no trabalho.
  • 8. Web scraping FASES DO CRISP-DM Foi criado um script na linguagem python, utilizando um spider desenvolvido com base na biblioteca Scrapy Data wrangling Manipulação do dataset inicial, composto de 37.200 datapoints, com 3.100 observações e 12 features Análise Análise dos dados através de scripts em linguagem python e utilização de diversas bibliotecas.
  • 9. Mission ANÁLISE • Verificou-se a necessidade de criar novas features ou manipular as features existentes. • Avaliou-se a presença de missing values. • Descartados os dados dos anos de 2010 e 2023 e, com isso, o dataset passou a ter formato 2.880 linhas x 19 colunas ou 54.720 datapoints. • Baseada em EDA – Exploratory Data Analysis, trazendo estatísticas descritivas dos dados. • Dividida em dados gerais, por título, autoria e editora. • Criação de visualizações e tabelas para melhor compreensão.
  • 10. DADOS GERAIS 36.804.272 608 99 QTD. VENDIDA TÍTULOS EDITORAS 351 AUTORIAS
  • 11. Gráfico 1: Volume de venda de exemplares, por ano
  • 12. TÍTULOS 626 exemplares, com ‘Os quatro segredos sagrados para o amor e a prosperidade’ Abril de 2020 Nada a perder 3 vedeu 439.338 exemplares Dezembro de 2014 7% dos títulos ou os primeiros 44 correspondem a 50% das vendas (18,5M). 80% (29,5M) = 26% dos títulos QTD. MÍNIMA + VENDIDO PARETO
  • 13. Gráfico 1: Volume de venda de exemplares, por ano
  • 14. Gráfico 1: Volume de venda de exemplares, por ano Temática religiosa Livros e colorir
  • 15.
  • 16.
  • 17.
  • 19.
  • 20.
  • 21.
  • 22. AUTORIA Os 15 que mais venderam representam 45% do total de exemplares vendidos e para se atingir 80% do total vendido ou 29,5 milhões são necessários exatos 20% dos títulos ou os 71 primeiros da lista PARETO
  • 23.
  • 25.
  • 26.
  • 28. CARARE, Octavian. THE IMPACT OF BESTSELLER RANK ON DEMAND: EVIDENCE FROM THE APP MARKET*. International Economic Review, [S. l.], v. 53, n. 3, p. 717–742, 2012. DOI: 10.1111/j.1468-2354.2012.00698.x. Disponível em: http://doi.wiley.com/10.1111/j.1468- 2354.2012.00698.x. CHAPMAN, Pete; CLINTON, Julian; KERBER, Randy; KHABAZA, Thomas; REINARTZ, Thomas; SHEARER, Colin; WIRTH, Rüdiger. CRISP-DM 1.0 - Step-by-step data mining guide. [s.l: s.n.]. MARTINEZ-PLUMED, Fernando; CONTRERAS-OCHANDO, Lidia; FERRI, Cesar; HERNANDEZ-ORALLO, Jose; KULL, Meelis; LACHICHE, Nicolas; RAMIREZ-QUINTANA, Maria Jose; FLACH, Peter. CRISP-DM Twenty Years Later: From Data Mining Processes to Data Science Trajectories. IEEE Transactions on Knowledge and Data Engineering, [S. l.], v. 33, n. 8, p. 3048–3061, 2021. DOI: 10.1109/TKDE.2019.2962680. Disponível em: https://ieeexplore.ieee.org/document/8943998/. PAZ, Eliane Hatherly. Best-sellers da ditadura: os livros mais vendidos sob o AI-5. Em: XXXXI CONGRESSO BRASILEIRO DE CIÊNCIAS DA COMUNICAÇÃO - INTERCOM 2018, Joinville,. Anais [...]. Joinville, p. 15. Publishnews. [s.d.]. Disponível em: https://www.publishnews.com.br/paginas/institucional. Acesso em: 14 jul. 2023. REIMÃO, Sandra. Mercado editorial brasileiro. [s.l.] : Universidade de São Paulo. Escola de Comunicações e Artes, 2021. DOI: 10.11606/9788572052122. Disponível em: https://www.livrosabertos.sibi.usp.br/portaldelivrosUSP/catalog/book/264. SCRAPY DEVELOPERS. Scrapy 2.10 documentation. 2023. Disponível em: https://docs.scrapy.org/en/latest/index.html. Acesso em: 14 ago. 2023. SILVA DE LIMA, Luzimar; MARLY ALVES, Shirlei. Best-sellers e ensino de literatura: mercado editorial, leitores e escola. Revista Graphos, [S. l.], v. 22, n. 2, p. 269–282, 2020. DOI: 10.22478/ufpb.1516-1536.2020v22n2.52284. Disponível em: https://periodicos.ufpb.br/index.php/graphos/article/view/52284. SORENSEN, ALAN T. BESTSELLER LISTS AND PRODUCT VARIETY*. The Journal of Industrial Economics, [S. l.], v. 55, n. 4, p. 715–738, 2007. DOI: 10.1111/j.1467-6451.2007.00327.x. Disponível em: http://doi.wiley.com/10.1111/j.1467-6451.2007.00327.x. THOMPSON, John B. Merchants of culture: The publishing business in the Twenty-First Century. 2a. ed. London: Plume Books, 2012. YUCESOY, Burcu; WANG, Xindi; HUANG, Junming; BARABÁSI, Albert-László. Success in books: a big data approach to bestsellers. EPJ Data Science, [S. l.], v. 7, n. 1, p. 7, 2018. DOI: 10.1140/epjds/s13688-018-0135-y. Disponível em: https://epjdatascience.springeropen.com/articles/10.1140/epjds/s13688-018-0135-y.