Phonetics Applied to Speech Processing: The Portuguese Nasals
Fonética Aplicada ao Processamento da Fala: As Nasais do Português
(Concluído)
De 01/02/2001 a 31/01/2003 (com prolongamento até Set. 2003), decorreu o projecto Phonetics Applied to Speech Processing: The Portuguese Nasals (Fonética Aplicada ao Processamento da Fala: As Nasais do Português), coordenado pela Prof. Lurdes de Castro Moutinho, do CLC, em colaboração com a Unidade de Investigação IEEETA. Este projecto foi avaliado em Excellent e financiado pela Fundação para a Ciência e a Tecnologia (FCT) com o código: POSI/PLP/36427/99.
1. Motivações
– A nossa investigação sobre síntese articulatória das vogais nasais revelou que estes sons são de natureza dinâmica embora não existam análises acústicas detalhadas;
– O nosso trabalho sobre a interacção fonte-tracto para os sons nasais trouxe alguns contributos, para um melhor conhecimento da natureza dinâmica das vogais altas;
– Falta de informação acerca das variantes regionais;
– Desenvolvimento de um trabalho multidisciplinar entre foneticistas e investigadores do processamento da fala;
– Existência de outros Projectos, já em curso, que se relacionam com este:
- DLC/CLC -Atlas Prosódico Multimédia das Línguas Românicas
- DET/IEETA – grupo de investigação sobre Processamento de Sinal e
Síntese Articulatória.
2. Objectivos do Projeto
Objectivos a curto prazo
– Aprofundamento do conhecimento acerca das nasais do Português Europeu baseado na análise acústica;
– Gravação de um corpus, incluindo variantes regionais e contextuais;
– Análise das características dinâmicas e propriedades da fonte glotal, para as nasais do Português;
– Utilização dos resultados para melhorar a síntese articulatória;
– Divulgação de resultados.
Objectivos a longo prazo
– Desenvolvimento de um sistema completo de síntese para o Português Europeu baseado em modelos biológicos;
– Aplicação da linguagem a interacções homem/máquina (ex. Robótica);
– Cooperação entre grupos de investigação multidisciplinares da Universidade de Aveiro (Engenheiros de Electrónica e Linguistas);
– Criação de um curso de pós-graduação, combinando estudos em Tecnologia da Fala e Fonética.
Outros Objectivos
– Actas de conferências nacionais e internacionais
– Revistas científicas
– Documentos Multimédia
– Site na Web
– CD-ROM (+ ftp) para o corpus
– Possibilidade de um curso de Fonética na Web
– Contribuição para a implementação de um curso de Português Língua Estrangeira (PLE) na Web.
– Seminários e/ou conferências
3. Corpus
– Dados provenientes de várias regiões, visto que o Português não é uma língua homogénea (as investigações existentes são, na sua maioria, baseadas em informantes da região de Lisboa);
– Gravação de um número adequado de informantes;
– Dados acerca de fenómenos de ditongação e dos sons nasais, sobretudo das vogais nasais;
– Dados que permitam a análise de propriedades dinâmicas e das propriedades relacionadas com a fonte glotal.
4. Composição do corpus
O corpus a gravar foi organizado, tendo em conta todos os contextos fonéticos em que as vogais nasais do Português podem ocorrer:
Com base numa tabela geral, foram elaboradas tabelas parciais, por contextos:
Tabela 1: consoante oclusiva surda – vogal nasal – consoante oclusiva surda
Tabela 2: consoante oclusiva sonora – vogal nasal – consoante oclusiva sonora
Tabela 3: consoante oclusiva surda – vogal nasal – consoante oclusiva sonora
Tabela 4: consoante oclusiva sonora – vogal nasal – consoante oclusiva surda
Tabela 5: consoante fricativa – vogal nasal – consoante fricativa
Tabela 6: consoante nasal
Tabela 7: (1) outra consoante – vogal nasal – consoante fricativa ou (2) consoante fricativa – vogal nasal – outra consoante
Tabela 8: vogal nasal seguida ou precedida de consoante líquida
Tabela 9: consoante oclusiva – vogal oral – consoante oclusiva
Tabela 10: vogal nasal no início e no fim de palavra [corpus lido]
Tabela 11: sequências (incluindo vogal nasal) não existentes dentro de palavra
Tabela 12: vogal oral – vogal nasal
A selecção final do corpus a gravar foi feita tendo em conta o equilíbrio entre contextos, isto é, tentando evitar uma disparidade entre o número de palavras a serem analisadas em cada tabela. Constituiu-se, deste modo, uma amostragem que, sendo representativa do primeiro levantamento exaustivo, fosse comportável, em termos de tempo de gravação por informante. A principal preocupação, nesta segunda triagem, foi a de manter, dentro de cada tabela, exemplos de todas as vogais e de todos os contextos possíveis.
Com base num corpus, assim constituído, constituímos um subcorpus para gravação.
As gravações foram efectuadas nas regiões escolhidas, a saber:
– Minho, Trás-os-Montes, Douro Litoral, Beira Litoral, Beira Interior, Alentejo e Algarve, tendo sido utilizada recolha directa para um portátil usando o sistema CSL 4400 da Kay Elemetrics Corp. A aquisição do sinal de voz, proveniente de um microfone Shure SM48, e o sinal EGG, proveniente do Kay model 6103, foi efectuada em simultâneo e a 22050 Hz. Todo o equipamento foi financiado pela FCT e adquirido expressamente para este projeto.
Alguns exemplos de palavras usadas no corpus do projeto: Oitenta, Cabendo, Setembro.
No mapa, assinalam-se os pontos onde foi feita a recolha.
|
|
Para as gravações, foram utilizados estímulos visuais que levavam o informante a produzir a palavra desejada e só na impossibilidade da sua utilização, recorremos à visualização da palavra escrita.
A selecção dos locutores, de ambos os sexos, junto de informantes pouco escolarizados obedece a critérios de representatividade e espontaneidade;
– O corpus inclui dados acerca do sinal de fala e da fonte glotal;
– Aproveitamento de outros corpora, nomeadamente dos já recolhidos pela equipa de investigação do Atlas Multimédia Prosódico do Espaço Românico (AMPER).
O programa utilizado para a gravação do corpus e para a segmentação é o SFSWin (http://www.phon.ucl.ac.uk/resource/sfs/), que permite a gravação simultânea dos dois canais de entrada que se pretendem utilizar: o microfone e o electroglotógrafo. O SFSWin permite visualizar todas as formas de onda, em simultâneo, ou individualmente, (oscilograma e sinal acústico que representa os movimentos das cordas vocais na produção do som).
5. Análise
– Estudo da natureza dinâmica dos sons nasais, particularmente das vogais nasais e orais empregando técnicas recentes de análise;
– Análise dos parâmetros relacionados com a fonte glotal que foram negligenciados nas análises anteriores;
– Caracterização das variantes regionais;
– Estudo da influência dos factores suprassegmentais.
Para as gravações, utilizámos o Electroglotógrafo (EGG) para obter:
– Informações acerca da excitação glotal ocorrida no momento de produção das nasais do Português;
– Frequência fundamental das diferentes vogais;
– Quociente de abertura, de velocidade,…
Após a gravação procedeu-se à organização de ficheiros, para anotação, contemplando-se a vogal nasal, bem como o contexto fonético em que ela ocorre. Esta anotação foi realizada utilizando o programa SFS. O sistema utilizado para a representação Fonética é o SAMPA para o Português.
6. Apresentação de um caso exemplar
8. Equipa de Investigação
4 doutorados
– Lurdes de Castro Moutinho (Departamento de Línguas e Culturas/Universidade de Aveiro) – coordenadora
– Rosa Lídia Coimbra (Departamento de Línguas e Culturas/Universidade de Aveiro)
– António Joaquim Silva Teixeira (Departamento de Electrónica/Universidade de Aveiro)
– Francisco António Cardoso Vaz (Departamento de Electrónica/Universidade de Aveiro)
3 não doutorados
1 Aluna de Mestrado do Departamento de Electrónica (Universidade de Aveiro) – Liliana Ferreira
1 Técnica de Investigação – Raquel de Castro Lisboa (aluna da FEUP)
1 bolseira de investigação – Liliana Ferreira (do DET, UA)
Publicações (ordem alfabética)
FERREIRA, L.; COIMBRA, R. L.; MOUTINHO, L. C.; TEIXEIRA, A. – “Contributos para a caracterização das vogais nasais do Português”, in: DUARTE, Inês; LEIRIA, Isabel (org.), Actas do XX Encontro da Associação Portuguesa de Linguística, Lisboa: APL/Colibri, 2005, pp. 563-571.
MOUTINHO, L. C.; R. L. COIMBRA, R. C. LISBOA, A. TEIXEIRA & F. VAZ – “Contributo para o estudo da variação contextual e regional das vogais nasais do Português Europeu”, Encontro Comemorativo dos 25 anos do Centro de Linguística da Universidade do Porto, Vol. II (ISBN: 972-9350-71-x), Porto: CLUP, 2002, pp. 5-17.
MOUTINHO, L. C.; R. L. COIMBRA, S. S. RUIVO & U. P. BENDIHA – “Projet d’Atlas Prosodique Multimédia des Variétés Romanes. Contribution Portugaise”, Travaux de l’Institut de Phonétique de Strasbourg (TIPS), nº31, 2001(2002), pp. 61-70.
MOUTINHO, L. C.; TEIXEIRA, A. – “Relatório Anual – Primeiro Ano” Relatório FAPL 2/2002, Projecto Phonetics Applied to Speech Processing: The Portuguese Nasals, PCTI P/PLP/36427/99). CLC/IEETA, Universidade de Aveiro: 2002.
MOUTINHO, L. C.; TEIXEIRA, A.; COIMBRA, R. L. – “Relatório Anual – Segundo Ano”, Relatório FAPL 4/2003, Projecto Phonetics Applied to Speech Processing: The Portuguese Nasals, PCTI P/PLP/36427/99). CLC/IEETA, Universidade de Aveiro: 2003.
OLIVEIRA, C.; A. TEIXEIRA & L. C. MOUTINHO – “On European Portuguese Automatic Syllabification”, Interspeech, 9th European Conference on Speech Communication and Technology, Lisboa, 2005, pp. 2933-2936.
TEIXEIRA, A., F. VAZ, L. MOUTINHO & R. L. COIMBRA – “Acerca das Vogais Nasais do Português Europeu”, Revista da Universidade de Aveiro – Letras, Nº 18, 2001, pp. 241-274.
TEIXEIRA, A., R. L. COIMBRA, L. MOUTINHO, R. L. COIMBRA & F. VAZ – “Novos corpora para o estudo das vogais nasais do Português Europeu”, Actas do XVII Encontro Nacional da Associação Portuguesa de Linguística, Lisboa: Colibri, 2002, pp. 557-560.
TEIXEIRA, A.; FERREIRA, L.; LISBOA, R.; COIMBRA, R. L.; MOUTINHO, L. C. – Novo Corpus Acústico para Estudo das Vogais Nasais do Português Europeu Contemplando Variedades Regionais e Contextuais (Relatório Técnico nº FAPL 1/2003, Projecto Phonetics Applied to Speech Processing: The Portuguese Nasals, PCTI P/PLP/36427/99). CLC/IEETA, Universidade de Aveiro: Set. 2003.
TEIXEIRA, A.; FERREIRA, L.; MOUTINHO, L.; COIMBRA, R. L. & LISBOA, R. – “An Acoustic Corpus Contemplating Regional Variation for Studies of European Portuguese Nasals”. In: LINO, Maria Teresa et al. (eds.), Proceedings of the Fourth International Conference on Language Resources and Evaluation (LREC2004), Volume VI, Paris: European Language Resources Association (ISBN: 2-9517408-1-6), 2004, pp. 2155- 2158.
TEIXEIRA, A.; L. C. MOUTINHO & R. L. COIMBRA – “”, in: MAMEDE, Nuno J; Jorge Baptista; Isabel Trancoso & Maria das Graças Volpe Nunes (coord.), Computational Processing of the Portuguese Language (Proceedings of the 6th International Workshop PROPOR 2003), vol. 1.2721 da série Lecture Notes in Colección Estudios de Lengua y Literatura. Valladolid, 2003. (libro, 367 págs.). ISBN: 84-9718-189-1.Computer Science, Berlin-Heidelberg-New York: Springer-Verlag (ISBN 3-540-40436-8), 2003, pp. 66-69. Artigo referenciado no ISI Web of Knowledge (IDS Number: BX50C)
TEIXEIRA, A.; L. C. MOUTINHO & R. L. COIMBRA – “Production, Acoustic and Perceptual Studies on European Portuguese Vowels Height”, Proceedings of the 15th International Congress of Phonetic Sciences, Barcelona 3-9 August 2003, CD-Rom (ISBN: 1-876346-48-5), pp. 3033-3036.
TEIXEIRA, A.; VAZ, F.; MOUTINHO, L. C.; COIMBRA, R. L.; LISBOA, R. C. – “Para a melhoria da síntese articulatória das vogais nasais do Português Europeu: Estudo da duração e de características relacionadas com a fonte glotal”, Revista de Estudos da Linguagem (Revista da Faculdade de Letras da Universidade Federal de Minas Gerais), Vol. 12, N.º 2, Jul./Dez. 2004, pp. 65-92.
Trabalho académico realizado no âmbito do Projeto
Liliana Silva Ferreira – Contributos para a Caracterização das Vogais Nasais do Português (2005)
Tese de Mestrado em Engenharia Electrónica e Telecomunicações, realizada sob a orientação científica do Doutor António Joaquim da Silva Teixeira, Professor do Departamento de Engenharia Electrónica e Telecomunicações da Universidade de Aveiro.
.