Navigasjon

  • Hopp til innhold
NTNU Hjemmeside NTNU Hjemmeside

ntnu.no

  • Studier
    • Studere på NTNU
    • Finn studieprogram
    • Søke opptak
    • Videreutdanning og deltid
    • Forkurs og oppfriskning
  • Studentliv
    • Student i Gjøvik
    • Student i Trondheim
    • Student i Ålesund
  • Forskning og innovasjon
    • Forskning
    • Innovasjon
    • Satsingsområder
    • Toppforskning
    • Ekspertlister
    • Ph.d.
  • Om NTNU
    • Fakulteter og institutter
    • Sentre
    • Bibliotek
    • Kart
    • Ledige stillinger
    • Arrangement
    • Nyheter
    • Kontakt oss
    • Om NTNU
  1. Ansatte

Språkvelger

English

Xinwei Cao

Last ned pressefoto
Last ned pressefoto
Foto:

Xinwei Cao

Stipendiat
Institutt for elektroniske systemer

xinwei.cao@ntnu.no
+49 152 26795174 Elektro C, Gløshaugen
Publikasjoner Formidling

Publikasjoner

  • Kronologisk
  • Etter kategori
  • Alle publikasjoner i Nasjonalt vitenarkiv (NVA)

2025

  • Fan, Zijian; Cao, Xinwei; Salvi, Giampiero; Svendsen, Torbjørn. (2025) Improving Phone Recognition through Informed Initialization and Path-Aligned CTC Loss.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Cao, Xinwei; Fan, Zijian; Svendsen, Torbjørn; Salvi, Giampiero. (2025) Child speech assessment through large language model speech synthesis: Preliminary results.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

2024

  • Cao, Xinwei. (2024) Kos-Interspeech2024.
    Annet
  • Cao, Xinwei; Fan, Zijian; Svendsen, Torbjørn Karl; Salvi, Giampiero. (2024) A Framework for Phoneme-Level Pronunciation Assessment Using CTC. Interspeech
    Vitenskapelig artikkel
  • Fan, Zijian; Cao, Xinwei; Salvi, Giampiero; Svendsen, Torbjørn Karl. (2024) Towards Better Recognition of Spontaneous Children's Speech: Speaker-Clustering Fine-Tuning of Whisper. Machine Learning for Signal Processing
    Vitenskapelig artikkel
  • Olstad, Anne Marte Haug; Smolander, Anna; Strömbergsson, Sofia; Ylinen, Sari; Lehtonen, Minna; Kurimo, Mikko. (2024) Collecting Linguistic Resources for Assessing Children’s Pronunciation of Nordic Languages. Proceedings of LREC
    Vitenskapelig artikkel

2023

  • Cao, Xinwei. (2023) Interspeech 2023.
    Annet
  • Fan, Zijian; Cao, Xinwei; Salvi, Giampiero; Svendsen, Torbjørn Karl. (2023) Using Modified Adult Speech as Data Augmentation for Child Speech Recognition. Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing
    Vitenskapelig artikkel
  • Cao, Xinwei; Fan, Zijian; Svendsen, Torbjørn Karl; Salvi, Giampiero. (2023) An Analysis of Goodness of Pronunciation for Child Speech. Interspeech
    Vitenskapelig artikkel

Tidsskriftspublikasjoner

  • Cao, Xinwei; Fan, Zijian; Svendsen, Torbjørn Karl; Salvi, Giampiero. (2024) A Framework for Phoneme-Level Pronunciation Assessment Using CTC. Interspeech
    Vitenskapelig artikkel
  • Fan, Zijian; Cao, Xinwei; Salvi, Giampiero; Svendsen, Torbjørn Karl. (2024) Towards Better Recognition of Spontaneous Children's Speech: Speaker-Clustering Fine-Tuning of Whisper. Machine Learning for Signal Processing
    Vitenskapelig artikkel
  • Olstad, Anne Marte Haug; Smolander, Anna; Strömbergsson, Sofia; Ylinen, Sari; Lehtonen, Minna; Kurimo, Mikko. (2024) Collecting Linguistic Resources for Assessing Children’s Pronunciation of Nordic Languages. Proceedings of LREC
    Vitenskapelig artikkel
  • Fan, Zijian; Cao, Xinwei; Salvi, Giampiero; Svendsen, Torbjørn Karl. (2023) Using Modified Adult Speech as Data Augmentation for Child Speech Recognition. Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing
    Vitenskapelig artikkel
  • Cao, Xinwei; Fan, Zijian; Svendsen, Torbjørn Karl; Salvi, Giampiero. (2023) An Analysis of Goodness of Pronunciation for Child Speech. Interspeech
    Vitenskapelig artikkel

Del av bok/rapport

  • Fan, Zijian; Cao, Xinwei; Salvi, Giampiero; Svendsen, Torbjørn. (2025) Improving Phone Recognition through Informed Initialization and Path-Aligned CTC Loss.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Cao, Xinwei; Fan, Zijian; Svendsen, Torbjørn; Salvi, Giampiero. (2025) Child speech assessment through large language model speech synthesis: Preliminary results.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Cao, Xinwei. (2024) Kos-Interspeech2024.
    Annet
  • Cao, Xinwei. (2023) Interspeech 2023.
    Annet

Formidling

2025

  • Vitenskapelig foredrag
    Fan, Zijian; Cao, Xinwei; Salvi, Giampiero; Svendsen, Torbjørn. (2025) Improving Phone Recognition through Informed Initialization and Path-Aligned CTC Loss. 2025 IEEE 35th International Workshop on Machine Learning for Signal Processing (MLSP) 2025-08-30 - 2025-09-02
  • Vitenskapelig foredrag
    Cao, Xinwei; Fan, Zijian; Svendsen, Torbjørn; Salvi, Giampiero. (2025) Child speech assessment through large language model speech synthesis: Preliminary results. 2025 IEEE 35th International Workshop on Machine Learning for Signal Processing (MLSP) 2025-08-30 - 2025-09-02

2024

  • Vitenskapelig foredrag
    Olstad, Anne Marte Haug; Smolander, Anna; Strömbergsson, Sofia; Ylinen, Sari; Lehtonen, Minna; Kurimo, Mikko. (2024) Collecting Linguistic Resources for Assessing Children’s Pronunciation of Nordic Languages. LREC-COLING , Turin, Italy 2024-05-20 - 2024-05-24
  • Vitenskapelig foredrag
    Fan, Zijian; Cao, Xinwei; Salvi, Giampiero; Svendsen, Torbjørn Karl. (2024) Towards Better Recognition of Spontaneous Children's Speech: Speaker-Clustering Fine-Tuning of Whisper. chine Learning for Signal Processing , London, UK 2024-09-22 - 2024-09-25
  • Vitenskapelig foredrag
    Cao, Xinwei; Fan, Zijian; Svendsen, Torbjørn Karl; Salvi, Giampiero. (2024) Framework for Phoneme-Level Pronunciation Assessment Using CTC. Interspeech , Kos, Greece 2024-09-01 - 2024-09-05

2023

  • Vitenskapelig foredrag
    Fan, Zijian; Cao, Xinwei; Salvi, Giampiero; Svendsen, Torbjørn Karl. (2023) Using Modified Adult Speech as Data Augmentation for Child Speech Recognition. ICASSP , Rhodes, Greece 2023-06-04 - 2023-06-10
  • Vitenskapelig foredrag
    Cao, Xinwei; Fan, Zijian; Svendsen, Torbjørn Karl; Salvi, Giampiero. (2023) An Analysis of Goodness of Pronunciation for Child Speech. Interspeech , Dublin, Irland 2023-08-20 - 2023-08-24

NTNU – Norges teknisk-naturvitenskapelige universitet

  • For ansatte
  • |
  • For studenter
  • |
  • Innsida
  • |
  • Blackboard

Studere

  • Om studier
  • Studieprogram
  • Emner
  • Videreutdanning
  • Karriere

Aktuelt

  • Nyheter
  • Arrangement
  • Jobbe ved NTNU

Om NTNU

  • Om NTNU
  • Bibliotek
  • Strategi
  • Forskning
  • Satsingsområder
  • Innovasjon
  • Organisasjonskart
  • Utdanningskvalitet

Kontakt

  • Kontakt oss
  • Finn ansatte
  • Spør en ekspert
  • Pressekontakter
  • Kart

NTNU i tre byer

  • NTNU i Gjøvik
  • NTNU i Trondheim
  • NTNU i Ålesund

Om nettstedet

  • Bruk av informasjonskapsler
  • Tilgjengelighetserklæring
  • Personvern
  • Ansvarlig redaktør
Facebook Instagram Linkedin Snapchat Tiktok Youtube
Logg inn
NTNU logo