SlideShare uma empresa Scribd logo
  • Carregar
  • Início
  • Conheça mais
  • Entrar
  • Cadastre-se
SlideShare uma empresa Scribd logo
  • Início
  • Conheça mais
  • Carregar
  • Entrar
  • Cadastre-se

Atualizámos a nossa política de privacidade. Clique aqui para ver os detalhes. Toque aqui para ver os detalhes.

×
×
×
×
×
×
Yamagishi Laboratory, National Institute of Informatics, Japan

Yamagishi Laboratory, National Institute of Informatics, Japan

21 Seguidores
17 SlideShares 0 Painéis de recortes 21 Seguidores 2 Seguindos
  • Parar de bloquear usuário Bloquear usuário
17 SlideShares 0 Painéis de recortes 21 Seguidores 2 Seguindos

Personal Information
Organização/Local de trabalho
Chiyoda, Tokyo Japan
Setor
Technology / Software / Internet
Site
nii-yamagishilab.github.io
Sobre
National Institute of Informatics (NII) is an academic research institution for informatics leading frontier research on data science, big data, and artificial intelligence, supported by the Ministry of Education, Culture, Sports, Science and Technology, Japan. Yamagishi Lab at NII is a sound media group consisting of 1 faculty, 4 postdocs and 3 PhDs.
Detalhes do contato
Marcadores
speech synthesis deep learning speech information processing wavenet tacotron mean opinion score attention speaker verification ai 音声研究会 チュートリアル 音声合成 machine learning tts acoustic environment device recording speech enhancement speech dataset speech quality assessment synthetic speech evaluation voicemos challenge multilingual hifi-gan correlation alignment self-supervised learning speaker anonymization multiple enrollment spoofing aware mos prediction speech naturalness assessment logical access countermeasure presentation attack detection anti-spoofing resnet tdnn listening test evaluation midi music synthesis vector quantization voice conversion text-to-speech waveform generation neural waveform models テキスト音声合成 ディープラーニング
Ver mais
Apresentações (17)
Ver tudo
エンドツーエンド音声合成に向けたNIIにおけるソフトウェア群 ~ TacotronとWaveNetのチュートリアル (Part 1)~
Há 3 anos • 1933 Visualizações
エンドツーエンド音声合成に向けたNIIにおけるソフトウェア群 ~ TacotronとWaveNetのチュートリアル (Part 2)~
Há 3 anos • 2443 Visualizações
Tutorial on end-to-end text-to-speech synthesis: Part 1 – Neural waveform modeling
Há 3 anos • 5065 Visualizações
Tutorial on end-to-end text-to-speech synthesis: Part 2 – Tactron and related end-to-end systems
Há 3 anos • 4414 Visualizações
Neural source-filter waveform model
Há 3 anos • 1075 Visualizações
Neural Waveform Modeling
Há 3 anos • 1132 Visualizações
Advancements in Neural Vocoders
Há 1 ano • 741 Visualizações
Preliminary study on using vector quantization latent spaces for TTS/VC systems with consistent performance
Há 1 ano • 201 Visualizações
Text-to-Speech Synthesis Techniques for MIDI-to-Audio Synthesis
Há 1 ano • 169 Visualizações
How do Voices from Past Speech Synthesis Challenges Compare Today?
Há 1 ano • 127 Visualizações
Attention Back-end for Automatic Speaker Verification with Multiple Enrollment Utterances
Há 9 meses • 63 Visualizações
Estimating the confidence of speech spoofing countermeasure
Há 9 meses • 67 Visualizações
Generalization Ability of MOS Prediction Networks
Há 9 meses • 62 Visualizações
Odyssey 2022: Language-Independent Speaker Anonymization Approach using Self-Supervised Pre-Trained Models
Há 7 meses • 19 Visualizações
Spoofing-aware Attention Back-end with Multiple Enrollment and Novel Trials Sampling Strategy for SASVC 2022
Há 4 meses • 11 Visualizações
Analyzing Language-Independent Speaker Anonymization Framework under Unseen Conditions
Há 4 meses • 13 Visualizações
The VoiceMOS Challenge 2022
Há 4 meses • 41 Visualizações
  • Atividades
  • Sobre

Apresentações (17)
Ver tudo
エンドツーエンド音声合成に向けたNIIにおけるソフトウェア群 ~ TacotronとWaveNetのチュートリアル (Part 1)~
Há 3 anos • 1933 Visualizações
エンドツーエンド音声合成に向けたNIIにおけるソフトウェア群 ~ TacotronとWaveNetのチュートリアル (Part 2)~
Há 3 anos • 2443 Visualizações
Tutorial on end-to-end text-to-speech synthesis: Part 1 – Neural waveform modeling
Há 3 anos • 5065 Visualizações
Tutorial on end-to-end text-to-speech synthesis: Part 2 – Tactron and related end-to-end systems
Há 3 anos • 4414 Visualizações
Neural source-filter waveform model
Há 3 anos • 1075 Visualizações
Neural Waveform Modeling
Há 3 anos • 1132 Visualizações
Advancements in Neural Vocoders
Há 1 ano • 741 Visualizações
Preliminary study on using vector quantization latent spaces for TTS/VC systems with consistent performance
Há 1 ano • 201 Visualizações
Text-to-Speech Synthesis Techniques for MIDI-to-Audio Synthesis
Há 1 ano • 169 Visualizações
How do Voices from Past Speech Synthesis Challenges Compare Today?
Há 1 ano • 127 Visualizações
Attention Back-end for Automatic Speaker Verification with Multiple Enrollment Utterances
Há 9 meses • 63 Visualizações
Estimating the confidence of speech spoofing countermeasure
Há 9 meses • 67 Visualizações
Generalization Ability of MOS Prediction Networks
Há 9 meses • 62 Visualizações
Odyssey 2022: Language-Independent Speaker Anonymization Approach using Self-Supervised Pre-Trained Models
Há 7 meses • 19 Visualizações
Spoofing-aware Attention Back-end with Multiple Enrollment and Novel Trials Sampling Strategy for SASVC 2022
Há 4 meses • 11 Visualizações
Analyzing Language-Independent Speaker Anonymization Framework under Unseen Conditions
Há 4 meses • 13 Visualizações
The VoiceMOS Challenge 2022
Há 4 meses • 41 Visualizações
Personal Information
Organização/Local de trabalho
Chiyoda, Tokyo Japan
Setor
Technology / Software / Internet
Site
nii-yamagishilab.github.io
Sobre
National Institute of Informatics (NII) is an academic research institution for informatics leading frontier research on data science, big data, and artificial intelligence, supported by the Ministry of Education, Culture, Sports, Science and Technology, Japan. Yamagishi Lab at NII is a sound media group consisting of 1 faculty, 4 postdocs and 3 PhDs.
Detalhes do contato
Marcadores
speech synthesis deep learning speech information processing wavenet tacotron mean opinion score attention speaker verification ai 音声研究会 チュートリアル 音声合成 machine learning tts acoustic environment device recording speech enhancement speech dataset speech quality assessment synthetic speech evaluation voicemos challenge multilingual hifi-gan correlation alignment self-supervised learning speaker anonymization multiple enrollment spoofing aware mos prediction speech naturalness assessment logical access countermeasure presentation attack detection anti-spoofing resnet tdnn listening test evaluation midi music synthesis vector quantization voice conversion text-to-speech waveform generation neural waveform models テキスト音声合成 ディープラーニング
Ver mais

Modal header

  • Sobre nós
  • Suporte
  • Termos
  • Privacidade
  • Direitos Autorais
  • Preferências de cookies
  • Não vender ou partilhar as minhas informações pessoais
Português
English
Español
Idioma atual: Português
Français
Deutsch

© 2023 SlideShare from Scribd

Atualizámos a nossa política de privacidade.

Atualizámos a nossa política de privacidade de modo a estarmos em conformidade com os regulamentos de privacidade em constante mutação a nível mundial e para lhe fornecer uma visão sobre as formas limitadas de utilização dos seus dados.

Pode ler os detalhes abaixo. Ao aceitar, está a concordar com a política de privacidade atualizada.

Obrigado!

Ver política de privacidade atualizada
Encontrámos um problema, por favor tente novamente.