Resumo de artigo apresentado no Grupo de Pesquisa em Produção Editorial do Congresso Nacional de Estudos Interdisciplinares da Comunicação - INTERCOM 2023
3. OBJETIVO DO TRABALHO
O início da análise da lista de “Mais Vendidos” do
Publishnews.
Faz parte de um projeto de pesquisa mais amplo,
que visa determinar a representatividade das listas
de Best-sellers em relação ao mercado editorial.
4. O BEST-SELLER
CUSTOMERS
• O best-seller como tipo de narrativa
ficcional X comportamento de vendas
(REIMÃO, 2021)
• As listas como gatilho para o
comportamento do consumidor
(CARARE, 2012)
• Antecedente da homogeneização ou a
pasteurização das publicações
THOMPSON, 2012)
5. Revista The Bookman,
Começou a publicar
mensalmente, os seis
livros mais vendidos no
mercado americano
01
1895
02 03 04
The New York Times
lança sua lista semanal.
Ainda hoje é
considerada uma das
mais importantes do
mercado mundial.
1942
O Globo foi responsável
pela criação da primeira
lista brasileira, chamada
“Os best-sellers da
quinzena.
1956
Em setembro o
Publishnews publica
sua primeira lista de
mais vendidos.
2010
6. A LISTA DO PN
Foi a primeira a publicar, entre os metadados
disponibilizados, a quantidade de exemplares
vendidos de determinado título.
Possui uma série histórica desde 2010 e se
mantém ativa até os dias atuais. São dados
na granularidade semanal, agregados por
mês para este trabalho.
Período de 2011-2022.
7. METODOLOGIA
• [CRISP-DM], acrônimo de CRoss-
Industry Standard Process for Data
Mining.
• Sistematizar uma linha de pesquisa
com métodos quantitativos no GP
de Produção Editorial.
• Apresentar termos e conceito de
forma didática no trabalho.
8. Web scraping
FASES DO CRISP-DM
Foi criado um script na
linguagem python,
utilizando um spider
desenvolvido com base
na biblioteca Scrapy
Data wrangling
Manipulação do dataset
inicial, composto de 37.200
datapoints, com 3.100
observações e 12 features
Análise
Análise dos dados
através de scripts em
linguagem python e
utilização de diversas
bibliotecas.
9. Mission
ANÁLISE
• Verificou-se a necessidade de criar novas features ou
manipular as features existentes.
• Avaliou-se a presença de missing values.
• Descartados os dados dos anos de 2010 e 2023 e, com
isso, o dataset passou a ter formato 2.880 linhas x 19
colunas ou 54.720 datapoints.
• Baseada em EDA – Exploratory Data Analysis, trazendo
estatísticas descritivas dos dados.
• Dividida em dados gerais, por título, autoria e editora.
• Criação de visualizações e tabelas para melhor
compreensão.
12. TÍTULOS
626 exemplares,
com ‘Os quatro
segredos sagrados
para o amor e a
prosperidade’
Abril de 2020
Nada a perder 3
vedeu 439.338
exemplares
Dezembro de 2014
7% dos títulos ou os
primeiros 44
correspondem a
50% das vendas
(18,5M).
80% (29,5M) = 26%
dos títulos
QTD. MÍNIMA + VENDIDO PARETO
22. AUTORIA
Os 15 que mais venderam representam 45% do total de
exemplares vendidos e para se atingir 80% do total
vendido ou 29,5 milhões são necessários exatos 20%
dos títulos ou os 71 primeiros da lista
PARETO
28. CARARE, Octavian. THE IMPACT OF BESTSELLER RANK ON DEMAND: EVIDENCE FROM THE APP MARKET*. International Economic
Review, [S. l.], v. 53, n. 3, p. 717–742, 2012. DOI: 10.1111/j.1468-2354.2012.00698.x. Disponível em: http://doi.wiley.com/10.1111/j.1468-
2354.2012.00698.x.
CHAPMAN, Pete; CLINTON, Julian; KERBER, Randy; KHABAZA, Thomas; REINARTZ, Thomas; SHEARER, Colin; WIRTH, Rüdiger. CRISP-DM
1.0 - Step-by-step data mining guide. [s.l: s.n.].
MARTINEZ-PLUMED, Fernando; CONTRERAS-OCHANDO, Lidia; FERRI, Cesar; HERNANDEZ-ORALLO, Jose; KULL, Meelis; LACHICHE,
Nicolas; RAMIREZ-QUINTANA, Maria Jose; FLACH, Peter. CRISP-DM Twenty Years Later: From Data Mining Processes to Data Science
Trajectories. IEEE Transactions on Knowledge and Data Engineering, [S. l.], v. 33, n. 8, p. 3048–3061, 2021. DOI: 10.1109/TKDE.2019.2962680.
Disponível em: https://ieeexplore.ieee.org/document/8943998/.
PAZ, Eliane Hatherly. Best-sellers da ditadura: os livros mais vendidos sob o AI-5. Em: XXXXI CONGRESSO BRASILEIRO DE CIÊNCIAS DA
COMUNICAÇÃO - INTERCOM 2018, Joinville,. Anais [...]. Joinville, p. 15.
Publishnews. [s.d.]. Disponível em: https://www.publishnews.com.br/paginas/institucional. Acesso em: 14 jul. 2023.
REIMÃO, Sandra. Mercado editorial brasileiro. [s.l.] : Universidade de São Paulo. Escola de Comunicações e Artes, 2021. DOI:
10.11606/9788572052122. Disponível em: https://www.livrosabertos.sibi.usp.br/portaldelivrosUSP/catalog/book/264.
SCRAPY DEVELOPERS. Scrapy 2.10 documentation. 2023. Disponível em: https://docs.scrapy.org/en/latest/index.html. Acesso em: 14 ago.
2023.
SILVA DE LIMA, Luzimar; MARLY ALVES, Shirlei. Best-sellers e ensino de literatura: mercado editorial, leitores e escola. Revista Graphos, [S. l.],
v. 22, n. 2, p. 269–282, 2020. DOI: 10.22478/ufpb.1516-1536.2020v22n2.52284. Disponível em:
https://periodicos.ufpb.br/index.php/graphos/article/view/52284.
SORENSEN, ALAN T. BESTSELLER LISTS AND PRODUCT VARIETY*. The Journal of Industrial Economics, [S. l.], v. 55, n. 4, p. 715–738,
2007. DOI: 10.1111/j.1467-6451.2007.00327.x. Disponível em: http://doi.wiley.com/10.1111/j.1467-6451.2007.00327.x.
THOMPSON, John B. Merchants of culture: The publishing business in the Twenty-First Century. 2a. ed. London: Plume Books, 2012.
YUCESOY, Burcu; WANG, Xindi; HUANG, Junming; BARABÁSI, Albert-László. Success in books: a big data approach to bestsellers. EPJ Data
Science, [S. l.], v. 7, n. 1, p. 7, 2018. DOI: 10.1140/epjds/s13688-018-0135-y. Disponível em:
https://epjdatascience.springeropen.com/articles/10.1140/epjds/s13688-018-0135-y.