O ESTATUTO DA LINGUÍSTICA DE CORPUS: METODOLOGIA OU ÁREA DA LINGUÍSTICA?
RESUMO
150 Este trabalho problematiza a pesquisa linguística a partir de corpora digitais, à luz de questionamentos sobre o papel do que se convencionou chamar Linguística de Corpus (doravante LC). Assim, o artigo inicia com discussão sobre o estatuto da LC: se a LC pode ser considerada um ramo da Linguística ou se é uma mera metodologia que lança mão do computador na investigação de fenômenos linguísticos. Sem favorecer uma ou outra posição, em um segundo estágio o trabalho apresenta exemplos práticos de abordagem indutiva e dedutiva em recentes pesquisas realizadas no âmbito dos estudos de inglês como língua estrangeira em corpora de aprendiz brasileiro. O artigo sugere que o status de ´ramo da linguística´ ou ‘metodologia de tratamento de dados’ pode ser estabelecido ao se decidir o ponto de entrada em dados oriundos de textos eletrônicos. Qualquer que ele seja, os resultados obtidos fazem importantes contribuições para o modo que são vistos os fenômenos linguísticos.
PALAVRAS-CHAVE: Linguística de corpus; abordagem dirigida pelo corpus; abordagem baseada em corpus.
INTRODUÇÃO
O presente artigo é sobre Linguística de Corpus (doravante LC) e por conseguinte, lida com significado. O artigo não é sobre outras linguísticas, como por exemplo a Linguística Cognitiva. Em outras palavras, ele aborda significado, mas não lida com entendimento ou cognição, apesar de, conforme alega Teubert (2004, p. 38) significado e entendimento/ cognição poderem ser entendidos, por vezes, como complementares. Por ser sobre LC, o artigo aborda significados co-construídos: o significado de um item lexical ou expressão é o que é, porque nos foi passado por uma ou várias pessoas e essas devem tê-lo ouvido ou lido de outras. Além disso, porque o trabalho é sobre LC, ele enfoca significados extraídos de compilações de textos em formato digital, ou corpus. Em suma, sendo sobre Linguística de Corpus, o presente trabalho entende que seu ´objeto de estudo´ não é um fenômeno mental, mas um fenômeno social, algo observável e acessível através de evidências que advêm de corpus digitalizado.
Definir o que é um corpus (plural, corpora) para a LC parece um ponto de partida interessante para a presente discussão. As definições de corpus, via de regra, ressaltam que um corpus é uma coletânea de textos em linguagem natural, escritos ou falados, geralmente armazenados de forma organizada e informada, além de serem digitalizados a fim de que possam ser lidos por computador. Ainda que a definição de autores diversos ressalte uma ou outra característica, um corpus para a LC espelhará esses fatores principais.
Entretanto, se a definição de ‘corpus’ não motiva grandes discussões teóricas, o rótulo Linguística de Corpus causa muita comoção1. Uma pergunta feita invariavelmente pelos recém-iniciados nos estudos de corpora digitalizados é se a LC seria uma área da Linguística, com objeto de investigação e conceitos próprios, ou uma metodologia de investigação que parte de grandes quantidades de dados textuais armazenados em forma digital.
Pode-se afirmar, sem medo de errar, que essa preocupação em estabelecer qual a identidade da LC caracteriza o início de um grande número de livros sobre o assunto. Isto acontece de tal forma, e com tanta frequência, já há duas décadas, que se poderia caracterizar a seção introdutória de alguns livros sobre LC como um ´movimento retórico´ que consiste em fornecer a opinião do autor sobre o impasse linguística ou metodologia.
SHEPHERD, Tania MG. O estatuto da Linguística de corpus: metodologia ou área da Linguística?. Matraga-Revista do Programa de Pós-Graduação em Letras da UERJ, v. 16, n. 24, 2009.
https://www.e-publicacoes.uerj.br/index.php/matraga/article/view/27801
Comentários
Postar um comentário