O documento descreve três estudos linguísticos realizados com base em dois corpora diacrônicos de cartas particulares em português e espanhol dos séculos XVI ao XIX:
1) Analisa a evolução do uso do advérbio/conjunção "pois" como marcador discursivo no português, desde o século XVI até o século XX.
2) Estuda o uso não possessivo da palavra relativa "cujo" no português a partir do século XVII.
3) Investiga ocorrências de "leísmo", "laísmo
Considere a seguinte situação fictícia: Durante uma reunião de equipe em uma...
A idade dos 'desvios': uso não canônico de cujo
1. A idade dos ‘desvios’: diacronia, variação social
e linguística de corpus
Catarina Carvalheiro, Ana Luísa Costa, Rita Marquilhas,
Clara Pinto, Fernanda Pratas, Gael Vaamonde
23/06/2014, CODILI
2. P.S., Post Scriptum
Arquivo digital de escrita quotidiana em
Portugal e Espanha na época moderna
Dois corpora diacrónicos
o Séculos XVI a XIX (início)
Dois corpora iberorromânicos
o Português e Espanhol dos espaços europeu
e extra-europeu
Dois corpora quási-falados, contextualizados
o Cartas particulares de gente diversa, muita dela gente
vulgar, usadas como instrumento de prova
o Arquivadas dentro de processos criminais e
contextualizadas pelos próprios tribunais
A idade dos 'desvios': diacronia, variação social e linguística de corpus
2
3. Transcrição, edição, geração de corpora
linguisticamente anotados
Transcrição cuidada
o Procedimentos da crítica genética
Reconstituição da situação de comunicação
Digitalização do manuscrito
Edição digital ‘documentária’
Exportação do texto não formular (narratio e ps da
carta)
Processamento por ferramentas de anotação
automática
o eDictor, FreeLing, parser de Dan Bikel
A idade dos 'desvios': diacronia, variação social e linguística de corpus
3
4. Corpus representativo
Enunciados próximos dos naturais, da interação
face-a-face, com tematização do quotidiano
Enunciados socialmente diversos
o Presença das variáveis sexo, idade, estatuto social,
proveniência geográfica, migração, capital vs província
Base empírica mais segura para estudos
tradicionais
Base empírica para estudos inovadores em
Sociolinguística Histórica
A idade dos 'desvios': diacronia, variação social e linguística de corpus
4
5. A idade dos ‘desvios’
Desmontagem do conceito de desvio linguístico junto do
público leigo
o Sistemática antiguidade de estruturas pretensamente
desviantes
Três casos
a. Ocorrências de pois em português como marcador
discursivo
b. Ocorrências não canónicas em português a partir do século
XVII da palavra relativa cujo
c. Ocorrências de leísmo, laísmo e loísmo no espanhol,
distribuição e algumas evidências
A idade dos 'desvios': diacronia, variação social e linguística de corpus
5
6. O percurso de pois – I
Advérbio de tempo
(1) Mando o meu salteyro grande a Jo(han) Ean(e)s,
sucelareyro, q(ue) o aia elle en sua uida & POYS sua mort(e) que fique
ao m(o)est(e)i(r)o
(Doc. 55, Orense (1281); Maia, 1986: 133)
Conjunção subordinativa causal
(2) Outrossi pediu que POIS o dito scudeiro nõ pagaua o dito
trebuto ao dito Monsteiro que lhj abrisse mão das ssas herdades
(DN091 (1339) ; Martins, Ana Maria, 2001: 571)
6
conj. coord.
adv. conect.
marc. disc.
A idade dos 'desvios': diacronia, variação social e linguística de corpus
adv./conj.
temporal
conj. subord.
causal
7. Conjunção coordenativa explicativa / conector paratático
de estruturas de suplementação
(3) Andei mais devagar do que o normal, pois não havia razão para
correr riscos.
(CRPC, O Jogo, apud Mendes, 2013)
Conector / advérbio conectivo conclusivo
(4) A Ana apanhou chuva; ficou, pois, doente.
Advérbio de afirmação
(5) – Ele está esgotado.
– Pois… Não para de trabalhar!
7
O percurso de pois – II
A idade dos 'desvios': diacronia, variação social e linguística de corpus
8. O percurso de pois – III
Marcadores discursivos (MD) já atestados
a. MD fático
(6) X: percebes, e a parte de cima é para arrumação.
A: (…) Pois/ m. fático/.
X: tudo coberto de estantes e isso para arrumar as coisas e abrir
encomendas e essas coisas todas.
A: Pois, pois /m. fático/.
(ca. 1980, CRPC, apud Lima, 2002)
b. MD de reação a ato ilocutório
(7) – Estou com sono!
– Pois deita-te.
(Lopes, 1991, p. 185)
8
A idade dos 'desvios': diacronia, variação social e linguística de corpus
9. Um novo marcador discursivo a partir do corpus PS
– MD estruturador de informação
(introduz informação nova)
(8) eu pesote pelo amor deos q(ue) te Lenbres q(ue) eu sou teu marido pois torna a
pedir a Senhora q(ue) pedia por mim que me valha
(CARDS0033 – 1791)
9
A idade dos 'desvios': diacronia, variação social e linguística de corpus
O percurso de pois – IV
10. (9) [Munto estimarei que te tenhas tido felecidades Como eu p(ar)a mim dezejo i
Juntamente em Comp(anhi)a da nosa Mai dos mais irmaus.] arenga
Pois eu sahi da cidade do porto a dezoito de no(vem)bro de mil 818 i chiguei aqui a
esta prisão de desta cida do Rio de jan(ei)ro Com trinta digo Com sesenta dias de
viaige.
(CARDS7052 – 1818)
(10) E quando o Remeta vivera seguro e se lhe satisfara e se lhe savera agradecer em
todo o tempo. Pois nos ficamos a espera da Resposta do noso amigo pa(ra) sabermos
se sem ou não.
(CARDS0029 – 1830)
(11) poues cá reçebim a aeçomenda que de lisboa poues esquzavas de andar a
ecomodar esa xente poues a gente ca gozaramos pouco pela pascoa que a gente não
tinha alegria para iço q estava pera açentar paraça o meu [N]
(FLY2153 – 1917)
10
MD pois na escrita do quotidiano
A idade dos 'desvios': diacronia, variação social e linguística de corpus
11. 11
Séculos
XVII XVIII XIX XX
Totais
Tabela 1: Ocorrências de pois estruturador por século
Dados
Estruturas analisadas 105 101 101 112 419
Totais de pois estruturador 0 10 18 68 96
% de pois estruturador 0 9,9% 17,8% 60,7% 22,9%
A idade dos 'desvios': diacronia, variação social e linguística de corpus
Pois nos corpora PS-CARDS e FLY
(o percurso de um MD)
12. palavra relativa
“variante casual genitiva dos pronomes pessoais” pertencente à
classe dos pronomes possessivos (Paiva Raposo 2013: 906)
(12) A Ana queixou-se à polícia. O seu colar/colar dela desapareceu.
A Ana, cujo colar desapareceu, queixou-se à polícia. (Veloso 2013: 2097)
relação semântica de “posse material ou jurídica, mas também de
parentesco ou relação entre a parte e o todo”
(Paiva Raposo 2013: 906)
retoma o antecedente nominal que corresponde ao possuidor
atribui interpretação definida ao “sintagma nominal que forma o
constituinte relativo”
(13) o seu livro / um livro seu
(14) *comprei um livro as cujas páginas vinham rasgadas
(Veloso 2013: 2097)
12
A idade dos 'desvios': diacronia, variação social e linguística de corpus
Cujo: uso possessivo contemporâneo – I
13. O que dizem as gramáticas:
“A fórma cujo apparece uma ou outra vez, todavia usada
apenas por pessoas de limitada leitura e pretenciosas [e] por
pessoas letradas, de certo por descuido”
“A sua construcção, porém, afasta-se da que é ensinada pelos
grammaticos”
(15) Tens razão, mas lembra-te que uma familia respeitavel como nós
estamos sendo nesta cidade do Porto, devemos evitar escandalos cujos possam
affectar a nossa sociedade.
(Camilo Castelo Branco, A Corja, p. 13, apud Moreira 1907: 40-41)
“Perdeu completamente o valor possessivo, passando sempre
de adjectivo a substantivo, e ficando a equivaler ao pronome
que, como na frase os homens cujos eu vi, em vez de os
homens que eu vi” (Moreira 1907: 40)
13
A idade dos 'desvios': diacronia, variação social e linguística de corpus
Cujo não possessivo – I
14. Cujo não possessivo no PS – I
Atestações a partir do séc. XVII
Estruturas em que cujo aparece:
(det) + cujo + (Nome)
(16) emfim ahi vai hum arratel de xá bom cujo he de preso 1600 e na reali(da)de creio q(ue)
gostarás dele (CARDS2160 – 177-)
(17) logo hove desconfiança q(ue) era fortada e os dois maxos forão vindos na Ci(da)de de
Tavira os cujos vendeo ao S(enho)r Antonio
(CARDS0133 – 1819)
(18) Amigo Tenho a pedirlhe hum favor Cujo favor pode façer que vem a ser o áRemjarme O
Livro de S(ão) Cyprinno (CARDS6170 – 1829)
(19) Logo que V(ossa) m(er)ce hesta Resseba imediatamente terra a Bondade de remeter a
quantia de 30 – moedas em mettal ao noso Camarada Gualdino franc(isc)o Lavra heste Denheiro o ha de
V(ossa) m(er)ce mandar por hum Portador capas o Cujo ha de entregar este Denheiro a Grade da Ditta
prizão em m(ui)to segredo o Cujo noso Camarada Gualdino Francisco Lavra ha de mostrar hum sinal
igual a heste que aqui remeto a V(ossa) m(er)ce (CARDS5117 – 1824)
14
A idade dos 'desvios': diacronia, variação social e linguística de corpus
15. Exibe traços de palavra relativa verificados por:
a. Próclise obrigatória
(20) V(oça) S(enhori)a emtregara o prezo Manoel de Jazus dos Paços a coantia de des mohedas em
metal cujo prezo lhe ha de emtregar hum reçibo por esta mesma letra
(CARDS0199 – 1822)
b. Posição dentro da oração relativa: quando cujo ocorre no DP
com função sintática de objeto, este é fronteado, tal como numa relativa de
objeto típica
(21) porém apenas só pode reçeber huma carta de hum coronel inglez q(ue) ali está encarregado de
huma comissão particular, cuja carta mandou p(ar)a Lord Russel q(ue) aqui está
(CARDS8136 – 1831)
Possibilidade de coocorrer com Nome:
A forma (det)+cujo+N é mais frequente nos casos em que não existe
adjacência entre o antecedente e a oração relativa:
(22) fasme o favor de ajuntares a demasia q(u)e te pedi q(u)e são 240 o q(u)e te ficarei obrigado pois
estou nesta ora sem hum vintem em casa cujo favor eu to agradeçerei
(CARDS6069 – 1828)
15
A idade dos 'desvios': diacronia, variação social e linguística de corpus
Propriedades de Cujo não possessivo – I
16. O antecedente e o Nome que precede cujo podem não ser
lexicalmente idênticos, embora remetam sempre para o mesmo
campo semântico
(23) O mez passado escrevi a V(ossa) S(enhori)a huma Carta, rogando-lhe o
favor de me emprestar 12$000 r(ei)s p(ar)a serem emtregues ao meu Procurador, em
Cuja ouCazião lhe remeti 15$840, dizendo-lhe q(eu) V(ossa) S(enhori)a daria o resto
(CARDS0292 – 1827)
16
A idade dos 'desvios': diacronia, variação social e linguística de corpus
Propriedades de Cujo não possessivo – II
17. O uso não possessivo de cujo é paralelo ao uso diacrónico
de o qual descrito por Cardoso (2008, 2011), uma expressão
relativa sem valor possessivo.
(24) entrego e outorgo. ao Mosteiro de san Saluador de Moreyra. Hũu casal
que e en Rial de Pereyra. o qual casal a dita dona Mayor uëegas [...]
mandou ao dito Mosteiro.
(Martins 2001; Doc. Portugueses do Noroeste e da Região de Lisboa; 1282, apud CARDOSO 2011)
17
A idade dos 'desvios': diacronia, variação social e linguística de corpus
Cujo e o Qual – paralelismo
18. • Y vuestro corazón por mis manos os le sacaré y le echaré a un perro
para que lo coma. (PS4124, 1570) Leísmo: uso de le, les como OD -> lo
• La tía se halla con una grave enfermedad de tabardillo […]. Hoy la han
dado el viático y mañana se dice una misa y rogativas por su salud.
(PS8037, 1712) Laísmo: uso de la, las como OI -> le
• Y harán lo que quisieren, pues yo sólo vine a salir de con ellos […].
Dios los abra los ojos, que bien lo han menester. (PS6155, 1706)
Loísmo: uso de lo, los como OI -> les
A idade dos 'desvios': diacronia, variação social e linguística de corpus
18
Leísmo, laísmo, loísmo
Usos ‘não-etimológicos’
ou inovadores
Usos ‘etimológicos’ ou canónicos
OD: la, las (fem.); lo, los (masc.)
OI: le, les
Leísmo
19. Graus de difusão no PS:
inovação no OD e OI
19
leísmo % laísmo/loísmo % inov. total % TOTAL
s. XVI 47 (242) 19 3 (142) 2 50 (384) 13 384
s. XVII 150 (637) 24 17 (523) 3 167 (1160) 14 1160
s. XVIII 260 (953) 27 137 (823) 17 397 (1776) 22 1776
s. XIX 47 (349) 14 8 (245) 3 55 (594) 9 594
TOTAL 504 (2181) 23 165 (1733) 10 669 (3914) 17 3914
Tabela 1. Percentagens gerais de inovação no OD e OI
A idade dos 'desvios': diacronia, variação social e linguística de corpus
20. A idade dos 'desvios': diacronia, variação social e linguística de corpus
20
Distinções referenciais no PS: leísmo
Antecedente animado maior expressão
Se masc. sg.
Antecedente inanimado menor expressão
Se masc. pl. e fem.
21. A idade dos 'desvios': diacronia, variação social e linguística de corpus
21
Distinções referenciais no PS: laísmo e
loísmo
Antecedente animado maior expressão
(laísmo) Se sg.
(loísmo) Se pl.
Antecedente inanimado menor expressão
(laísmo) Se pl.
(loísmo) Ø
22. Distinções referenciais na literatura
• O grau de difusão dos usos inovadores está
condicionado pelas características referenciais da
entidade pronominalizada:
22
leísmo > laísmo > loísmo
an > in an > in pl > sg
sg > pl sg > pl an > in (plural)
ms > fm in > an (singular)
(Fernández-Ordóñez 1999)
A idade dos 'desvios': diacronia, variação social e linguística de corpus
23. 23
• Procedência de autores no PS - leísmo
A idade dos 'desvios': diacronia, variação social e linguística de corpus
24. • Procedência de autores no PS - laísmo
24
A idade dos 'desvios': diacronia, variação social e linguística de corpus
25. • Procedência de autores no PS - loísmo
25
A idade dos 'desvios': diacronia, variação social e linguística de corpus
26. Usos inovadores e procedência geográfica
• Duas áreas básicas na atualidade:
Adaptado de
Fernández-Ordóñez (1994)
– Área confundidora (centro e ocidente de Castela, do sul
da Cantabria a La Mancha)
– Área distinguidora (resto da península)
26
A idade dos 'desvios': diacronia, variação social e linguística de corpus
27. A idade dos 'desvios': diacronia, variação social e linguística de corpus
27
pois – cujo – le- la- loísmo:
a língua na perspetiva dos falantes
Esta [carta] faço só por dar a v(ossa) m(er)ce gosto de ver as
minhas Letras p(ar)a v(ossa) m(er)ce se rir hü bucadinho e mais
toda a caza.
(CARDS3048 – 1752)
Desafio
conciliar análises gramaticais com análises
discursivas
28. Referências
CORPORA
• CIPM - Corpus Informatizado do Português Medieval, Universidade Nova de Lisboa.
• CRPM - Corpus de Referência do Português Contemporâneo, Centro de Linguística da Universidade de
Lisboa.
• Camarinhas, Nuno. 2010. Juízes e administração da justiça no antigo regime: Portugal e o império colonial,
séculos XVII e XVIII. [Lisboa]: Fundação Calouste Gulbenkian & Fundação para a Ciência e a Tecnologia.
• Cardoso, A. 2011. Variation and change in the syntax of relative clauses: new evidence from Portuguese.
Tese de Doutoramento. FLUL.
• Castro, Ivo. 2001. “Metodologia do aparato genético”. In Memória dos afectos: homenagem a Giuseppe
Tavani, organizado por Manuel Simões, Ivo Castro, e João David Pinto Correia, 69–81. Lisboa: Colibri.
• Fernández-Ordóñez, Inés (1993): "Leísmo, laísmo y loísmo: estado de la cuestión", en O. Fernández
Soriano (ed.), Los pronombres átonos, Madrid, Taurus, pp. 63-96.
• Fernández-Ordóñez, Inés (1999): "Leísmo, laísmo y loísmo", en I. Bosque y V. Demonte (dirs.), Gramática
descriptiva de la lengua española, Madrid, Espasa Calpe, pp. 1317-1397.
• Fiéis, Alexandra & Maria Lobo. 2009. “Para uma diacronia das orações causais e explicativas do português”.
In Alexandra Fiéis & Antónia Coutinho (orgs.) Textos seleccionados. XXIV Encontro Nacional da Associação
Portuguesa de Linguística, Lisboa: Colibri/APL, pp. 265-280.
• Flores Cervantes, Marcela (2006): "Leísmo, laísmo y loísmo", en C. Company Company (dir.), Sintaxis
histórica de la lengua española. Primera parte: La frase verbal, México, Fondo de Cultura Económica, vol. I,
pp. 669-749.
• Grésillon, Almuth. 1994. Élements de critique génétique. Paris: PUF.
• Hespanha, António Manuel. 2003. Cultura Jurídica Europeia: Síntese de um Milénio. 2o ed. Mem Martins:
Publicações Europa-América.
• Klein-Andreu, Flora (1981): "Distintos sistemas de empleo de le, la, lo. Perspectiva sincrónica, diacrónica y
sociolingüística", ThBICC, 36, pp. 284-304.
28
A idade dos 'desvios': diacronia, variação social e linguística de corpus
29. Referências
• Lima, José Pinto de. 2002. “Grammaticalization, subjetification and the origin of phatic markers”. In New
Reflections on grammaticalization, ed. Ilse Wisher & Gabriele Diewald, 363-78. Amsterdam: John Benjamins.
• Lopes, Ó. 1991. “Da partícula pois ao conceito de apodeixis”. In Actas do VII Encontro da Associação
Portuguesa de Linguística, Lisboa: APL, pp. 179-192.
• MAIA, Clarinda de Azevedo (1986) História do Galego-Português, Coimbra, INIC, pp. 19-295.)
• Moreira, Julio. 1907. Estudos de Lingua Portuguesa (Primeira serie. Subsidios para a Syntaxe Historica e
Popular). Lisboa: Livraria Clássica Editora, 2.ª ed. 1922.
• MARTINS, Ana Maria 2001. Documentos Portugueses do Noroeste e da Região de Lisboa: Da Produção
Primitiva ao Século XVI. Lisboa: Imprensa Nacional – Casa da Moeda. 571 pp.
• Moreno, Juan-Carlos e José-Luis Mendívil-Giró. 2014. On Biology, History and Culture in Human Language:
A Critical Overview. Sheffield & Bristol: Equinox.
• Nevalainen, Terttu. 2011. “Historical Sociolinguistics”. In The SAGE Handbook of Sociolinguistics,
organizado por Ruth Wodak, Barbara Johnstone, e Paul Kerswill, 279–95. Los Angeles: SAGE.
• Nevalainen, Terttu e Helena Raumolin-Brunberg. 2003. Historical Sociolinguistics: Language Change in
Tudor and Stuart England. London & New York: Longman.
• Penny, Ralph J. 2000. Variation and Change in Spanish. Cambridge & New York: Cambridge University
Press.
• Pierazzo, Elena. 2011. “A rationale of digital documentary editions”. Literary and linguistic computing 26 (4):
463–77.
• Raposo, Eduardo Buzaglo Paiva. 2013. “Pronomes”. In Gramática do Português, ed. Eduardo Buzaglo Paiva
Raposo et al., 1:883-918. Lisboa: Fundação Calouste Gulbenkian.
• Trudgill, Peter. 1986. Dialects in Contact. Oxford & New York: B. Blackwell.
29
A idade dos 'desvios': diacronia, variação social e linguística de corpus
30. Básta de sentim(en)to vamos ao q(ue) sérve.
Tudo aceito, tudo agradeço, pois de tudo percizo.
(CARDS0212 – 1824)
Clara & Catarina,
cujas são muito obrigadas
URL: http://ps.clul.ul.pt/
E-mail: cardsclul@gmail.com
A idade dos 'desvios': diacronia, variação social e linguística de corpus
30
Notas do Editor
Trazemo-vos uma breve apresentação de um trabalho em curso que envolve precisamente o tema que deu origem a este colóquio. Nós estamos a montar dois corpora diacrónicos iberorromânicos, os corpora P.S., Post Scriptum. São diacrónicos porque cobrem toda a Idade Moderna. São iberromânicos porque recolhem amostragem para duas línguas românicas originárias da Península Ibérica, o português e o espanhol. Pretendemos formar um recurso que demonstre como elas seriam faladas, naqueles séculos, em vários pontos dos dois impérios, tanto na Europa como no espaço extra-europeu. O incentivo para montarmos estes dois corpora partiu da verificação de uma possibilidade excecional ao nível das fontes portuguesas e espanholas. A documentação oficial dos tribunais dos dois reinos conservou cartas particulares de gente diversa, muita dela gente vulgar. Ficaram arquivadas dentro de processos criminais e foram contextualizadas pelos próprios tribunais, civis ou religiosos, que as usaram, na época, como instrumento de prova para perseguir os respetivos autores, destinatários ou indivíduos com eles relacionados. O facto de sermos uma equipa grande, formada por quinze pessoas que só a isto se dedicam, permite-nos enfrentarmos a tarefa de verificar milhares de processos, desde os mais importantes, que são os da Inquisição, aos da justiça episcopal, da Coroa, periférica da Coroa, da Intendência da polícia e das ordens militares.
Comentário: a justiça do Antigo Regime (nome por que se reconhecem os estados europeus imediatamente anteriores às revoluções liberais, Portugal-1820, Espanha-1808/1814) era plural. Este pluralismo do ordenamento jurídico tinha raízes medievais e só desapareceu com a racionalização iluminista que acompanhou a instituição dos estados liberais no século XIX. Havia muitas justiças paralelas. A Igreja tinha duas, a da Inquisição, que perseguia heresias ou crimes contra o 1º mandamento (séculos XV a XIX em Espanha e XVI a XIX em Portugal), e a episcopal, que perseguia os outros pecados (pecado era equivalente a crime). A justiça da Coroa perseguia crimes contra a estabilidade do Estado e podia ser ministrada no centro dos reinos ou na periferia (essa era a periférica da Coroa, a cargo dos juízes de fora); a Intendência da polícia velava pela segurança nas cidades; a das ordens militares era o tribunal onde tinham direito a ser julgados, como privilégio, os indivíduos que tinham a distinção de serem cavaleiros. Havia ainda a justiça local. Autor de referência: António Manuel Hespanha (Hespanha 2003). Citação de Nuno Camarinhas sobre este tema:
Cada corpo [i.e. instituição] é provido de uma jurisdição que permite uma espécie de auto-governo: a possibilidade de ter magistrados próprios, a capacidade de julgar os seus próprios conflitos internos, o poder de fazer leis. (Camarinhas 2010, 19).
O caso da Inquisição, que conhecemos bem, ilustra isso. A maioria dos processos é por judaísmo, a heresia mais ameaçadora para a época, mas também há processos movidos a pessoas que não cumpriam bem os deveres de familiar do Santo Ofício, ou então a pessoas que tentavam fazer-se passar por familiares do Santo Ofício.
Sempre que contêm cartas como prova instrumental, transcrevemo-las com os mesmos cuidados que a crítica genética dedica ao manuscrito de autor literário.
Comentário: a crítica genética é uma variante de crítica textual que acompanha o processo de génese do texto escrito, tipicamente literário, e reúne um dossier com todos os documentos que permitiram a elaboração do texto definitivo. Autores de referência: Almuth Grésillon e Ivo Castro, (Grésillon 1994 e Castro 2001).
Reconstituímos a situação de comunicação, classificamos sociologicamente autor e destinatário com o máximo possível de dados, obtemos a digitalização da imagem e publicamos online uma edição do conjunto.
Comentário: O raciocínio é este. Estamos a montar um recurso para o estudo da mudança linguística nas duas línguas. O principal factor de mudança nas línguas é a variação. Sem conhecermos o grau de variação -- em todos os níveis de descrição -- das duas línguas, não temos base empírica para a nossa linguística diacrónica. Encontrámos um conjunto de fontes onde até conseguimos aperceber-nos de alguma variação (daí que só consideremos para o corpus linguístico as cartas ORIGINAIS; as cópias só servem para o conjunto das fontes históricas). Com estas fontes não se corre o risco de bater no obstáculo assim descrito pela Terttu Nevalainen: However, looking for authentic material produced by individuals, the historical sociolinguist is faced with the fact that it is only available from the literate section of the population. This represents the tip of the iceberg at a time when the vast majority of the population was illiterate. As the social structures of an earlier era are not familiar to the researcher, they have to be reconstructed on the basis of social, demographic and economic history. Placing historical linguistic findings in their social contexts thus requires more back-ground information than those present-day studies in which the researchers are familiar with the communities they. (Nevalainen 2011, 281). Muitos dos nossos autores são semi-alfabetizados e não propriamente letrados; muitas das suas histórias de vida são do nosso conhecimento porque o próprio tribunal as investigou e reconstituiu.
É o tipo de edição eletrónica a que se vem chamando, em Humanidades Digitais, uma 'edição digital documentária', composta pela fonte, pelos resultados do seu tratamento editorial e pelas ferramentas informáticas que permitiram que ele se processasse (Pierazzo 2011).
Comentário: A ‘documentary digital edition’ é um conceito de edição digital que a Elena Pierazzo. Define-a assim: ...the very definition of ‘diplomatic edition’ needs to be substantially revised if the edition is published on the web. Even more importantly, the discussion argues for the existence of a new editorial object which is generated by the changed conditions: a new publication form called the ‘digital documentary edition’ which is composed of the source, the outputs and the tools able to produce and display them (Pierazzo 2011, 463). Nós fazemos isto ao dar o XML, as DTD, a folha de estilo, o endereço das aplicações e respetivos manuais, o JPG. A nossa edição não é diplomática porque não respeita totalmente o original: é quási-paleográfica. Só se distingue da paleográfica, que também desenvolve abreviaturas, por normalizar i/j, u/v e por não respeitar hipossegmentações e hiper-segmentações.
O texto de tal edição, libertado de todas as suas partes formulares, reduzido, portanto, aos trechos espontâneos, permite-nos depois a alimentação dos corpora linguísticos.
Comentário: A nossa intenção, ao retirarmos as partes formulares, é óbvia: há um grau de tradição de género (epistolográfico) dentro das partes formulares que torna mais arcaicos e artificiais os respetivos enunciados. Sem eles, temos a segurança de dispor de um registo mais espontâneo.
Estes são morfologicamente etiquetados com as aplicações informáticas mais consensuais no âmbito da atual investigação em Linguística Histórica do português e do espanhol, a saber, o programa eDictor do Tycho Brahe para o português e o programa FreeLing para o espanhol. Pelas mesmas razões, a anotação sintática dos dois corpora, que já está a ser experimentada no corpus português, seguirá o sistema de anotação dos Penn Parsed Corpora of Historical English.
Comentário: se perguntarem pela anotação sintática do espanhol, expliquem que FreeLing tem uma anotação sintática superficial (shallow parsed) que se pode converter na da UPenn. O Josep Fontana também está a tentar isso para um corpus de espanhol medieval e estamos sincronizados com ele.
O recurso, por conseguinte, tenta aproximar-se daquilo com que sonham desde sempre os historiadores das línguas, ou seja, ter alguma ideia do que seriam os enunciados naturais da interação falada face-a-face, empreendida tanto por mulheres como por homens, jovens ou idosos, da elite, das classes intermédias e do povo, da corte ou da província, autóctones ou estrangeiros, do centro ou da periferia do império, e isto ao longo de vários séculos.
Comentário: Variáveis externas que têm pertinência comprovada na difusão da mudança linguística: contacto interdialectal e contacto entre línguas (os falantes não nativos de uma variedade entram muitas vezes em processos de analogia dentro dos paradigmas morfológicos ou de simplificação dentro dos sistemas fonológicos; se há regiões de grande imigração, como são as grandes cidades, o respetivo dialeto muda em função desse acontecimento) (Penny 2000), sexo (mulheres são mais receptivas às inovações) (Trudgill 1986), estatuto social (aparentemente menos importante do que o sexo em termos de factor de disseminação de mudança) (Nevalainen e Raumolin-Brunberg 2003).
Com o Post Scriptum há condições para que os investigadores prossigam, com dados mais seguros, os seus trabalhos tradicionais na história do português e do espanhol. Mas quando o corpus estiver totalmente constituído, em 2017, passa a haver também maneira de controlar o papel das variáveis extralinguísticas no processo de variação e consequente mudança destas duas línguas ao longo da Idade Moderna, à maneira do que a Sociolinguística Histórica vem propondo que se faça em nome de um domínio mais realista do que é a mudança das línguas (Nevalainen 2011). Passa a haver igualmente maneira de controlar quão artificiais serão as estruturas dos enunciados literários, ou cultos, daqueles séculos, comparadas com as deste corpus mais espontâneo (Moreno e Mendívil-Giró 2014).
Comentário: No livro novo destes dois autores faz-se uma grande apologia da diferença entre Línguas Naturais e Línguas Cultivadas, valendo estas últimas só como línguas artificiais, não podendo portanto ser boa base para a investigação empírica em linguística. Só as línguas naturais permitem acesso a propriedades da faculdade da linguagem, não as línguas cultivadas. Os generativistas não concordam, achando que qualquer enunciado vale como amostra de língua-E, seja um diálogo espontâneo ou um texto literário.
Ainda não temos o corpus pronto, mas já pudemos aperceber-nos, com o que vamos editando, que ele será bastante útil na desmontagem do conceito de desvio linguístico junto do público leigo. Vamos descobrindo a sistemática antiguidade de estruturas que são apontadas como inovações desviantes de falantes pouco escolarizados de hoje, pretensamente explicáveis por um processo de aquisição imperfeita da língua contemporânea. Vimos falar-vos da antiguidade de três delas, propondo um raciocínio que não aceite como compatíveis os atributos do desviante e de antigo. A amostra com que trabalhámos contém, no seu conjunto, cerca de meio milhão de palavras, assim distribuídas pelos sucessivos séculos.
Embora haja atestações de MD com outras funções desde o séc. XIV, pois como MD estruturador de informação aparece no corpus PS a partir do séc. XVIII, como no exemplo.
Se menor adjacência, então cujo/qual+N. Se adjacência, então não N - Cardoso diz que o núcleo interno começa a desaparecer depois de XVI, mas temos cujo+N no PS no XIX.
Nota: ‘ocasião’ não se refere ao período DO entrudo, mas sim ao momento posterior ao entrudo em que ele passar em Almada
Det+Cujo+ nome semelhante ao comportamento de det+qual+N (séc. XIII-XV). A partir daqui, há tendência de det+qual sem N. Contudo, temos atestações de det+cujo+N até ao séc. XVIII
A tabla mostra as porcentaxes de innovación no terreo do OD (leísmo) e no terreo do OI (laísmo e loísmo). Por exemplo, no s. XVI hai un 19% de formas “le(s)” sobre o total de clíticos en función de OD (de 242 clíticos, incluindo casos de leísmo aparente, le em OD, 47 são leísmo) e un 2% de formas “la(s)/lo(s)” sobre o total de clíticos en función de OI. A última columna recolle a porcentaxe total de innovación. Por exemplo, no s. XVI hai un 13% de innovación (i.e casos de leísmo, laísmo e loísmo) sobre o total de clíticos rexistrados. No apéndice I recóllense as frecuencias absolutas.
A tabla mostra fundamentalmente dúas cousas:
Que as porcentaxes máis altas rexístranse no terreo do OD, o que parece confirmar a idea aceptada na bibliografía de que o desvío máis frecuente é o leísmo.
Que as porcentaxes totais de innovación non alcanzan en ningún século o 25%, o que revela que os usos canónicos son dominantes no corpus
Que o laísmo o loísmo son cambios minoritarios e incipientes comparados co leísmo, aínda que a súa presencia non é nada desdeñable no corpus
Aínda que non se amosa na tabla, o laísmo é moito máis frecuente que o loísmo no noso corpus (dos 165 casos de laísmo/loísmo, 151 son de laísmo e 14 de loísmo). Por tanto, o corpus parece confirmar as diferencias de frecuencia observadas na bibliografía, a saber: leísmo > laísmo > loísmo. Esta orden de frecuencia está claramente relacionada co grado de valoración de cada fenómeno. O leísmo é o desvío máis difundido e o máis prestixiado, o laísmo ocupa o segundo lugar en difusión. O loísmo é a innovación menos difundida e a que sufre dunha maior estigmatización. Neste caso, por tanto, os datos diacrónicos axústanse á situación actual.
Matizacións:
Ese 17% de laísmo/loísmo no s. XVIII explícase pola presencia dun autor (BMP1: Blas Martín Pingarrón, natural de Getafe - Madrid), autor de varias cartas do s. XVIII e nas que se rexistran ata 78 casos de laísmo, máis da metade do total de casos de laísmo rexistrados para ese século (128 casos).
A segunda cuestión plantexada neste traballo ten que ver coas características referencias da entidade pronominalizada. En diversos traballos sobre o tema obsérvanse discrepancias en función de factores de carácter referencial:
O leísmo é máis frecuente con entidades animadas, singulares e masculinas
O laísmo é máis frecuente con entidades animadas (atribuible a que a maior parte dos antecedentes de dativos son animados) e singulares
O loísmo é máis frecuente en plural. No plural é máis frecuente con entidades animadas; no singular é máis frecuente con entidades inanimadas.
Só se marcan as provincias nas que se constata máis dun autor leísta.
O mapa reflicte cómo o leísmo, sendo ouso innovador máis difundido, exténdese por diferentes puntos da península. Débense ter en conta, no obstante dúas matizacións:
Os datos están parcialmente condicionados pola estratexia de búsqueda das cartas. É dicir, polos arquivos históricos que xa foron visitados: visitáronse diferentes arquivos municipais en Galicia e Cataluña. Tambén se traballou no AHN de Madrid, que recolle documentación de toda a península, e na Chancillería de Valladolid, que recolle información de toda a zona ao norte do río Tejo.
O mapa recolle calquera tipo de leísmo (i.e forma le, les en función de OD). Sen embargo, é sabido que moitos casos de le(s) en función de OD ilustran o que se denomina leísmo aparente, é dicir, leísmo condicionado pola natureza da construcción: Por exemplo: o “le” de cortesía (a usted le vio mi padre noche), o le(s) das construccións impersonais (A mis sobrinos se les conoce cuando se les trata), o le(s) con verbos de afección (desagradar, disgustar, encantar, …). Sería necesario segregar os exemplos en función destes aspectos.
Só se marcan as provincias nas que se constata máis dun autor laísta.
O mapa mostra a vinculación entre laísmo e parte da actual zona confundidora, uma das zonas classificadas como referencial (Ordónez 1993)
Só se marcan as provincias nas que se constata máis dun autor loísta.
O mapa mostra a vinculación entre loísmo e parte da actual zona confundidora, aínda que é preciso obter máis datos para comprobar relamente a zona vinculada a este uso innovador.
A terceira e última cuestión plantexada neste traballo ten que ver coa perspectiva dialectal do fenómeno. Estudos sincrónicos como o de Fernández Ordóñez conclúen que na actualidade podemos diferenciar dúas áreas fundamentais na península:
Área confundidora (i.e área na que se confunden os clíticos de dativo e acusativo) – Madrid e zonas fronteiriças de Madrid: é nesta zona onde se rexistran os usos innovadores (leísmo, laísmo, loísmo). Dentro da área confundidora pódense trazar ulteriores diferencias nas que non imos entrar (cf. Fernández Ordóñez 1994)
Área distinguidora (i.e área na que se distinguen as funcións de dativo e acusativo): é nesta área onde se rexistran os usos canónicos, incluíndo o leísmo para animados masculinos singulares
A continuación mostraranse os datos que arroxa PS sobre o cruce entre usos innovadores e procedencia xeográfica. Para a obtención dos datos tivéronse en conta os seguintes aspectos:
Para traballar con certa sistematicidade e facilitar o tratamento estatístico, tomouse como referencia a provincia
Cada autor foi asociado á provincia da que é natural ou, no seu defecto, á provincia na que residiu de maneira constante. Esta información adiota aparecer nos procesos xudiciais coa expresión “natural de” ou “veciño de”
Para maior fiabilidade, só se computaron aqueles usos innovadores que aparecen en alomenos dous autores dunha mesma provincia.
Apesar de continuarem vivos nas duas línguas, todos se distanciam do que se pode considerar serem as suas normas cultas;
Mecanismos de coesão textual produzidos pela mão de autores como instrumento de coerência textual.
Esta tabla mostra as porcentaxes de leísmo en función de xénero, número e animación. Por exemplo, no s.XVI hai un 72% de leísmo sobre o total de casos de clítico en función de OD masculino, singular, animado. E no s. XVII hai un 3% de leísmo sobre o total de casos de clítico en función de OD femenino singular inanimado. Se marcan en vermello as porcentaxes sobre un total < 5. No apéndice II pódense consultar as frecuencias absolutas desta tabla.
A tabla mostra fundamentalmente o seguinte:
Que as porcentaxes máis altas rebasan o 70% cando a entidade é animada, masculina e singular. Polo tanto, animacidade, masculinidade e singularidade son factores determinantes na aparición do leísmo, o que coincide amplamente coas ideas recollidas na bibliografía.
Que o leísmo con referente femenino parece ir disminuindo co tempo, a medida que avanza o leísmo masculino, o que suxire que no terreo do OD o “le(s)” foise especializando cada vez máis para o masculino e o la(s) para o femenino.
Chama a atención a baixada de porcentaxe de leísmo (tanto animado como non animado) no s. XIX. Podería responder ao feito de que é a finais do XVIII e inicios do XIX cando a Acameia comeza a condenar os usos innovadores (e esta baixada de porcentaxes tambén se constata no laísmo –8 casos no XIX– e no loísmo –ningún caso rexistrado no XIX–). De ser esta a razón, non deixa de sorprender que norma académica teña influxo nun rexistro informal como é o das cartas de PS. De novo, serán necesarios máis datos para poder confirmar esta hipótese.
NOTA BENE: a ocorrência de leísmo é quase nula no plural quando se trata de pronominalizar nomes com traços inanimados. Isto comprova que a tendência do leísmo está para nomes animados (não contínuos), contáveis, portanto. Nomes não contáveis não são pruralizáveis. De notar que o dativo é o caso de pessoa (e não de coisa).
Esta tabla mostra as porcentaxes de laísmo e loísmo en función de número e animación. Por exemplo, no s.XVI hai un 9% de laísmo sobre o total de casos de clítico en función de OI femenino singular, animado. E no s. XVII hai un 8% de loísmo sobre o total de casos de clítico en función de OI masculino plural animado. No apéndice III pódense consultar as frecuencias absolutas desta tabla.
A tabla mostra fundamentalmente o seguinte:
Que laísmo e loísmo están fortemente asociados ás entidades animadas. Isto é claramente atribuible ao feito de que a maior parte dos antecedentes en dativo (i.e OI) son personais (ou animados)
Que o laísmo en singular é máis frecuente que en plural. E no loísmo sucede ao contrario: no plural está moito máis documentado que no singular. Estes datos confirman as tendencias de frecuencia observadas na bibliografía. A maior frecuencia de loísmo en plural axústase á hipótese do paralelismo entre pronomes e demostrativos: este-a-o, estas-os / le-la-lo, las-los. Esta hipótese defende a eliminación das distincións de caso a favor das de xénero. É dicir, o plural masculino adopta a forma “los” (igual que “estos”) e o singular masculino adopta a forma “le” (igual que “este”), con independencia da función sintáctica.
Os exemplos tipo (a) son máis frecuentes que os exemplos tipo (b)
Os exemplos tipo (a) son máis frecuentes que os exemplos tipo (b)
Os exemplos tipo (a) son máis frecuentes que os exemplos tipo (b)