Arquivo de eventos

Introdução à compilação de corpora

para estudos linguísticos

 

25 de outubro de 2017

13:30-17:00

sala 3017 (FALE)

 

Organizadores/Apresentadores: Jessica Queiroz, Jessica Ceritello, Elisa Mattos, Rubens Viegas (UFMG)

 

Este workshop, que integra a programação da Semana de Letras 2017, visa introduzir a metodologia da Linguística de Corpus, e, mais especificamente:

  • fazer um breve histórico sobre a Linguística de Corpus;
  • mostrar o impacto da Linguística de Corpus para as pesquisas em Linguística;
  • apresentar os critérios para a compilação de corpora escritos e orais (e.g. autenticidade, balanceamento, representatividade);
  • apresentar corpora já existentes (C-ORAL BRASIL, CorIFA, COCA, entre outros);
  • apresentar os resultados de alguns estudos baseados em corpora;
  • apresentar as ferramentas utilizadas nas pesquisas com corpora (AntConc, PRAAT, entre outras);
  • conversar individualmente com os participantes sobre suas pesquisas e opções de corpora (disponíveis ou a serem compilados).

 

Público alvo: alunos de Iniciação Científica, alunos do Bacherelado em Linguística, alunos do Poslin.

 

Programação

CURSO

Utilização da plataforma TEITOK para edição, anotação, visualização e publicação de corpora.


TEITOK é uma ferramenta online que permite a visualização, criação e edição de corpora que apresentem seja anotações textuais, seja anotações linguísticas, fornecendo uma interface gráfica amigável que permite tais operações.

TEITOK pode ser utilizado para consulta de corpora, permitindo diferentes configurações das informações nele contidas, mas possibilita também a edição e correção de seus dados pelos seus administradores. Sua modularidade permite utilizá-lo para criar e publicar documentos no formato TEI, assim como sua tokenização, etiquetagem morfossintática com a ferramenta NeoTag, e organização em formato de corpus, que pode ser posteriormente disponibilizado em plataformas como CQPWeb.

O curso é destinado preferencialmente a pesquisadores e suas equipes que estejam compilando ou já compilaram seus corpora e queiram utilizar uma ferramenta versátil para sua exploração, formatação, edição, anotação e disponibilização; é direcionado a professores e alunos da UFMG assim como de outras instituições que tenham interesse na ferramenta, e abordará as funcionalidades básicas do TEITOK, com exemplos e exercícios que possibilitem testar os corpora dos alunos na plataforma.

 

O curso será em modalidade remota, de 24/05 a 20/06 com aulas síncronas às terças, (horário : 13h - 15h BRT) e aulas assíncronas às segundas.

 

Cronograma:
Aula 1S: 24/05 Introdução
Aula 1A: 30/05 Estrutura de corpus
Aula 2S: 31/05 Teitok
Aula 2A: 06/6 Teitok prática
Aula 3S: 07/6 Compilação, publicação e edição de corpus (recapitulando todo o conteúdo do curso com demonstração de um pequeno projeto)
Aula 3A: 20/06 Entrega do projeto final

 

Avaliação:
Frequência obrigatória nas aulas síncronas (75%)
Realização dos exercícios
Entrega do projeto final

 

Ministrante: Andressa Gomide (CELGA-ILTEC-Universidade de Coimbra)

Andressa Rodrigues Gomide é membro integrado do CELGA-ILTEC da Universidade de Coimbra e atua no desenvolvimento de recursos linguísticos e computacionais para o português como língua pluricêntrica. Em 2020, concluiu seu doutorado em linguística pela Lancaster University, onde desenvolveu duas ferramentas para buscas em corpus e se especializou em linguística computacional. Atualmente colabora nos seguintes projetos: DiPoMo, que é voltado para a criação do dicionário de português de Moçambique; Terminologias Científicas e Técnicas Comuns (TCTC), que tem como objetivo global a criação e disponibilização pública de terminologias científicas e técnicas para os países da Comunidade de Países de Língua Portuguesa; Corpus do Português como Língua Pluricêntrica (CPLP), um corpus escrito do português e suas variedades.

 

VAGAS: 30

Inscrições até: 20/05

Para fazer sua inscrição, clique aqui e preencha o formulário

 

 

 

----------------------------------------------------------------------------------------------------------- 

 

 

 

Linguística de corpus:

abordagens, metodologias, ferramentas

18 e 19 outubro 2017

Faculdade de Letras - UFMG

 

No âmbito da 26ª Semana do Conhecimento da UFMG, este workshop visa promover a discussão de questões de ordem teórico-metodológica relacionadas com a linguística de corpus, a partir dos diversos objetos de estudo e das diferentes abordagens de vários pesquisadores membros do NELC. Integram o workshop algumas sessões dedicadas a oficinas de teor prático, dirigidas principalmente a alunos de graduação e voltadas para a familiarização com  algumas ferramentas de análise e tratamento de dados linguísticos.

 

Local: Auditório 2001 (palestras), Sala 3063  (oficinas)

 

Programação

18 de outubro

9:30 – 10:30

PEDRO PERINI SANTOS, LÍDIA FERREIRA-SANTOS, JÉSSICA LEAL (Grupo CIL - Corpus Infantil Longitudinal, UFVJM): Linguística de corpus infantil: desafios da pesquisa e alguns resultados referentes às diáteses verbais

10:30 – 11:30

PATRIK VEZALI (UFVJM): Constituição, tratamento e análise de corpora audiovisuais

11:30 – 12:30

Pausa para almoço

12:30 – 14:30

FREDERICO CAVALCANTE, MARCELO VIEIRA (UFMG): Praat: introdução ao uso básico [oficina para alunos de graduação]

14:30 – 15:00

Coffee break

15:00 – 16:00

LÚCIA DE ALMEIDA FERRARI (UFMG): Criando um corpus de fala: teorias e questões práticas

16:00 – 17:00

LUCIANA ÁVILA (UFSB): Por que a linguística para a linguística computacional? O caso da anotação semântica da modalidade

17:00 – 18:00

MARIA ZANOLI (USP): O estudo da Unidade Informacional Tópico centrado na fala espontânea do crioulo de Cabo Verde – Barlavento

 

 19 de outubro

9:00 – 10:00

MÁRCIA OLIVEIRA (USP), CARLOS FIGUEIREDO (Universidade de Macau): Metodologia de recolha de dados do Libolo/Angola: interface linguístico-cultural

10:00 – 10:30

Coffee break

10:30 – 11:30

BRUNO ROCHA (UFPA): Metodologias em pesquisas sobre fala de pacientes com Esquizofrenia e o projeto C-ORAL-ESQ

11:30 – 12:30

HENRIQUE CHAVES, GIULIA BOSSAGLIA, HELIANA MELLO, TOMMASO RASO (UFMG): Computação e linguística: a plataforma DB-CoM para o estudo da fala espontânea

12:30 – 13:30

Pausa para almoço

13:30 – 15:30

FREDERICO CAVALCANTE, MARCELO VIEIRA (UFMG): Praat: introdução ao uso básico [oficina para alunos de graduação]

15:30 – 16:00

Coffee break

16:00 – 18:00

SAULO MENDES SANTOS (UFMG): O ambiente R para tratamento de dados linguísticos [oficina para alunos de graduação]

 

Baixe a programação

Faculdade de Letras da Universidade Federal de Minas Gerais
Av. Antônio Carlos, 6627 Pampulha - Belo Horizonte/MG - CEP: 31270-901
(31) 3409-5101 dir@letras.ufmg.br

© Copyright 2024 - Setor de Tecnologia da Informação - Faculdade de Letras - UFMG