DIFICULDADES NA COMPILAÇÃO DE UM CORPUS DE LÍNGUA ESPANHOLA

Autores

  • Laura Campos de Borba Universidade Federal do Rio Grande do Sul (UFRGS)

Palavras-chave:

Compilação de corpus. Navegadores off-line. Língua espanhola.

Resumo

Algumas das ferramentas utilizadas pelos pesquisadores da Linguística de Corpus, visando a criação de corpora através da coleta de textos da internet, são os navegadores off-line. O objetivo do presente trabalho é apresentar os problemas encontrados durante a coleta de textos da internet para a compilação de um corpus de língua espanhola. A metodologia utilizada é o manejo do navegador off-line HTTrackpara reunir e armazenar textos jornalísticos em espanhol. Nossos primeiros resultados demonstram que a utilização desse programa não fornece garantias de que todo e qualquer texto disponível na internet possa ser obtido.

Palavras-chave: Compilação de corpus. Navegadores off-line. Língua espanhola.  

Biografia do Autor

  • Laura Campos de Borba, Universidade Federal do Rio Grande do Sul (UFRGS)
    Graduanda em Letras pela Universidade Federal do Rio Grande do Sul (UFRGS) e bolsista de Iniciação Científica PIBIC/CNPq.

Downloads

Edição

Seção

Primeiras Letras