Họ và tên: Phùng Trung Nghĩa
Chức vụ: Hiệu trưởng
Di động:
Email: ptnghia@ictu.edu.vn
Học vị: Tiến sĩ
Chức danh: Phó giáo sư
Địa chỉ:
Website: http://ptnghia.tnu.edu.vn
Cán bộ, giảng viên cung cấp thông tin lý lịch sơ lược, quá trình đào tạo, quá trình công tác, thành tích khen thưởng của bản thân.
BÁO CÁO TỔNG QUAN KẾT QUẢ ĐÀO TẠO
VÀ NGHIÊN CỨU KHOA HỌC
PGS. TS. Phùng Trung Nghĩa,
Trường ĐH Công nghệ thông tin và Truyền thông, Đại học Thái Nguyên
1. Định hướng chuyên môn cá nhân
Mặc dù theo học Đại học và Cao học ngành Điện tử viễn thông, tôi có niềm yêu thích đặc biệt với Công nghệ thông tin. Chính vì vậy, ngay từ khi học Đại học và Cao học, tôi đã say mê nghiên cứu, tìm tòi để tự xây dựng các phần mềm ứng dụng. Cả đồ án tốt nghiệp đại học và luận văn thạc sỹ tôi đều chọn hướng nghiên cứu giao giữa Công nghệ thông tin và Điện tử viễn thông. Đồ án tốt nghiệp Đại học Đại học Bách Khoa Hà Nội ngành Điện tử viễn thông của tôi là về hệ mật mã khóa công khai RSA ứng dụng trong truyền thông bảo mật do PGS.TS. Lê Bá Dũng, Viện Công nghệ thông tin, Viện Hàn lâm KH&CN Việt Nam hướng dẫn. Đây là một đề tài sử dụng các kiến thức nền tảng Công nghệ thông tin nhưng ứng dụng trong lĩnh vực truyền thông / viễn thông. Luận văn tốt nghiệp cao học Trường Đại học Công nghệ, Đại học Quốc Gia Hà Nội của tôi là về phương pháp nhận dạng tiếng nói dùng biến đổi Wavelet và mô hình Markov ẩn (HMM) do PGS.TS. Trịnh Anh Vũ, Đại học Quốc Gia Hà Nội hướng dẫn. Nhận dạng tiếng nói có nhiều cách tiếp cận từ mô hình xử lý bậc thấp liên quan đến các thao tác xử lý tín hiệu tiếng nói cho đến các mô hình tính toán bậc cao như học máy, huấn luyện và nhận dạng. Cách tiếp cận của tôi kết hợp sử dụng phép biến đổi Wavelet để trích đặc trưng và mô hình HMM để huấn luyện / nhận dạng tiếng nói cũng là cách tiếp cận kết hợp cả các mô hình xử lý tín hiệu bậc thấp (liên quan nhiều đến kiến thức về Điện tử viễn thông) và các mô hình tính toán bậc cao (liên quan nhiều đến kiến thức về Công nghệ thông tin).
Sau khi tốt nghiệp thạc sĩ, trong giai đoạn đầu tiên định hình định hướng nghiên cứu, tôi được gặp và làm việc cùng PGS.TS. Lương Chi Mai, Phó Viện trưởng Viện Công nghệ thông tin, Viện Hàn Lâm, KH&CN Việt Nam, chuyên gia đầu ngành Xử lý tiếng nói và ngôn ngữ tại Việt Nam. PGS.TS. Lương Chi Mai đã định hướng cho cá nhân tôi nghiên cứu về xử lý thông tin, tín hiệu, trong đó tập trung vào thông tin, tín hiệu âm thanh, tiếng nói. PGS.TS. Lương Chi Mai cũng là người giới thiệu tôi cho GS.TS. Masato Akagi, Viện KHCN tiên tiến Nhật Bản (JAIST), một chuyên gia hàng đầu về xử lý tín hiệu tiếng nói trên thế giới – Chủ tịch hiệp hội nghiên cứu về âm thanh học Nhật Bản (Acoustical Society of Japan - ASJ), hướng dẫn NCS cho tôi sau này.
Đến khi nhận được học bổng nhà nước theo học NCS tại và nhận bằng tiến sĩ tại JAIST năm 2013 chuyên ngành Khoa học thông tin (Information Science), một lần nữa tôi có cơ hội tiếp tục nghiên cứu chuyên sâu hơn về xử lý âm thanh, tiếng nói với sự hướng dẫn trực tiếp của GS. Masato Akagi và cố vấn của PGS.TS. Lương Chi Mai. Trong đó xuất phát từ những hạn chế của các mô hình xử lý tín hiệu trên miền thời gian và miền tần số riêng rẽ, các nghiên cứu của tôi dựa trên các phép xử lý kết hợp thông tin trên cả miền thời gian và miền tần số với kỹ thuật phân rã tiếng nói theo thời gian (Temporal Decomposition – TD) được đề xuất bởi Altal năm 1983. Kỹ thuật phân rã tiếng nói theo thời gian cho phép các đặc trưng tính toán trên miền tần số như Linear Predictive Coding (LPC), Line Spectral Frequencies (LSF), Mel-frequency Cepstral Coefficients (MFCC) có thể được phân rã trên miền thời gian nhằm định vị những vị trí quan trọng trên miền thời gian, xấp xỉ các đặc trưng ở các vị trí khác bằng cách nội suy từ các đặc trưng tại các vị trí quan trọng đã xác định. Sử dụng kỹ thuật này thay cho kỹ thuật trích đặc trưng theo khung nối tiếp giúp định vị thông tin tốt hơn trên miền thời gian, qua đó cải thiện được chất lượng nhiều hệ thống xử lý tín hiệu tiếng nói. Mặc dù lý thuyết về kỹ thuật phân rã tiếng nói theo thời gian được đề xuất từ năm 1983 nhưng các ứng dụng của kỹ thuật phân rã tiếng nói theo thời gian trong các hệ thống xử lý tín hiệu còn rất rộng mở. Trong phạm vi luận án tiến sĩ của mình với đề tài “Nâng cao chất lượng tổng hợp tiếng nói trong điều kiện hạn chế dữ liệu”, tôi áp dụng kỹ thuât phân rã tiếng nói theo thời gian cho các ứng dụng tổng hợp tiếng nói và đã đề xuất được hệ thống các phương pháp giúp cải thiện chất lượng tiếng nói tổng hợp trong điều kiện hạn chế dữ liệu.
Sau khi tốt nghiệp TS trở về công tác tại Trường ĐH Công nghệ thông tin và Truyền thông, tôi tiếp tục phát triển hướng nghiên cứu của mình và cộng tác với nhóm nghiên cứu của PGS.TS. Lương Chi Mai, TS. Vũ Tất Thắng tại Viện Hàn Lâm, KH&CN Việt Nam, mở rộng sang các vấn đề kết hợp giữa các mô hình xử lý tín hiệu và các mô hình học máy tiên tiến để cải thiện chất lượng các hệ thống xử lý tín hiệu, đặc biệt áp dụng trong các hệ thống xử lý âm thanh, tiếng nói. Đây cũng là hướng nghiên cứu tôi sẽ tiếp tục duy trì trong thời gian tới. Trong đó ngoài việc tập trung chuyên sâu hơn về các mô hình học máy cho xử lý tín hiệu, tôi cũng sẽ đề xuất các phương pháp, mô hình xử lý cho các loại tín hiệu khác ngoài tín hiệu âm thanh, tiếng nói (như các loại tín hiệu y sinh). Có thể nói hướng nghiên cứu trong quá trình làm NCS và sau khi tốt nghiệp TS của tôi vẫn phát triển và đi theo định hướng nghiên cứu ban đầu của tôi nằm giữa Công nghệ thông tin (các mô hình tính toán bậc cao) và Điện tử viễn thông (các mô hình xử lý tín hiệu bậc thấp).
Định hướng nghiên cứu nằm giữa Công nghệ thông tin và Điện tử viễn thông của tôi cũng phù hợp với xu thế hiện đại. Trong đó Công nghệ thông tin và viễn thông (truyền thông) hiện nay về cơ bản đã được tích hợp trong lĩnh vực chung là Công nghệ thông tin và Truyền thông (Information and Communication Technology – ICT). Xu thế này đã được phổ biến trong nhiều lĩnh vực của đời sống xã hội, bao gồm cả giáo dục, đào tạo và nghiên cứu khoa học. Xu thế tích hợp ICT này cũng được áp dụng triệt để trong quan điểm đào tạo, nghiên cứu tại ngôi trường tôi công tác từ khi mới học xong Đại học cho đến nay, Trường Đại học Công nghệ thông tin và Truyền thông (CNTT&TT), Đại học Thái Nguyên, tiền thân là Khoa Công nghệ thông tin, Đại học Thái Nguyên. Được làm việc và sinh hoạt chuyên môn trong một môi trường như vậy, dù là giảng dạy hay nghiên cứu các nội dung thuộc về các ngành nghề khác nhau như Điện tử viễn thông, Kỹ thuât máy tính, Kỹ thuật y sinh, bản thân tôi vẫn luôn xác định Công nghệ thông tin đã, đang và sẽ là nền tảng chuyên môn của cá nhân tôi. Do vậy, tôi đã chọn ngành đăng ký hồ sơ PGS là Công nghệ thông tin để phù hợp nhất với định hướng chuyên môn của bản thân.
2. Hoạt động đào tạo
Trước khi đi học NCS tập trung ở Nhật Bản từ năm 2009, tôi đã giảng dạy các học phần Mạng máy tính, Kỹ thuật truyền số liệu, Thông tin số, Xử lý tín hiệu số cho sinh viên hệ Đại học các ngành Công nghệ thông tin, Kỹ thuật máy tính, Điện tử viễn thông với tổng số giờ chuẩn (GC) hàng năm đều vượt định mức 280 GC.
Trong giai đoạn này tôi đã hướng dẫn đồ án tốt nghiệp Đại học cho sinh viên cả ngành Công nghệ thông tin và Điện tử viễn thông.
Kể từ khi tốt nghiệp TS trở về trường công tác, tôi đã giảng dạy các học phần Mạng và truyền số liệu, Xử lý tín hiệu số, Xử lý âm thanh – tiếng nói cho sinh viên hệ Đại học các ngành Kỹ thuật máy tính, Công nghệ kỹ thuật Điện tử truyền thông (Điện tử viễn thông), Kỹ thuật y sinh với tổng số GC đều vượt định mức 189 GC.
Trong giai đoạn này tôi cũng đã hướng dẫn đồ án tốt nghiệp Đại học Điện tử viễn thông, Kỹ thuật y sinh và luận văn Cao học cho sinh viên ngành Công nghệ thông tin (chuyên ngành Khoa học máy tính).
Từ năm 2016, tôi cũng đã hướng dẫn NCS đầu tiên chuyên ngành Khoa học máy tính tại Viện Hàn lâm KH&CN Việt Nam với vai trò hướng dẫn 2.
Trong suốt quá trình tham gia vào hoạt động đào tạo, trực tiếp giảng dạy, đứng lớp và hướng dẫn sinh viên làm đồ án, học viên làm luận văn, ngoài việc cố gắng truyền đạt kiến thức một cách chính xác và khoa học nhất, tôi luôn cố gắng tìm cách truyền cho người học niềm cảm hứng, say mê học tập, khơi gợi nguồn sáng tạo của sinh viên, học viên.
3. Hoạt động nghiên cứu khoa học
3.1. Đề tài nghiên cứu khoa học tiêu biểu
Tôi luôn tích cực trong công tác nghiên cứu khoa học và đã thực hiện nhiều đề tài nghiên cứu khoa học liên tục từ khi tốt nghiệp thạc sỹ năm 2007 cho đến nay.
Giai đoạn từ 2007 đến 2009 là giai đoạn đầu tiên định hình hướng nghiên cứu sau khi tốt nghiệp thạc sỹ, tôi đã chọn cho mình hướng nghiên cứu chính về xử lý thông tin, tín hiệu, trong đó tập trung vào thông tin, tín hiệu âm thanh, tiếng nói, hình ảnh.
Trong giai đoạn này tôi đã tham gia 02 đề tài NCKH cấp Bộ, chủ nhiệm 01 đề tài NCKH cấp Bộ. Cả 03 đề tài NCKH cấp Bộ đều thuộc về lĩnh vực xử lý tín hiệu tiếng nói, hình ảnh. Trong đó, đề tài NCKH cấp Bộ tôi chủ nhiệm “Nâng cao hiệu quả nhận dạng tiếng việt liên tục trong môi trường có nhiễu”, mã số B2008-TN07-01, được nghiệm thu ngay trước khi tôi đi làm NCS tại Nhật Bản năm 2009. Đề tài đã đề xuất và kiểm nghiệm một phương pháp trích đặc trưng (âm tiết, thanh điệu) hiệu quả với tiếng Việt trong môi trường thực (có nhiễu) và đề xuất và kiểm nghiệm một mô hình kết hợp các đặc trưng thanh điệu và đặc trưng âm tiết trong tiếng nói liên tục phù hợp với tiếng Việt.
Trong giai đoạn làm NCS từ 2009 đến 2013, tôi cũng đã tham gia các đề tài của GS hướng dẫn Masato Akagi với vai trò nghiên cứu viên.
Trong giai đoạn sau khi làm xong NCS và trở về trường công tác từ 2013 đến nay, tôi đã chủ nhiệm 01 đề tài NCKH cấp Tỉnh Thái Nguyên về lĩnh vực kỹ thuật y sinh và đang chủ nhiệm 01 đề tài NCKH cấp Bộ về lĩnh vực xử lý ngôn ngữ tự nhiên sẽ nghiệm thu trong năm 2017 (đề tài đang hoàn thành đúng tiến độ). Đề tài NCKH cấp Tỉnh Thái Nguyên tôi chủ nhiệm “Thiết kế, chế tạo hệ thống tự động cảnh báo, giám sát và chăm sóc sức khỏe từ xa cho người cao tuổi (NCT) về nhịp tim, nhiệt độ, huyết áp”, mã số KC-25-2015 có tính ứng dụng cao và phù hợp với đặt hàng của Tỉnh Thái Nguyên. Trong đó, mục tiêu của đề tài là thiết kế, chế tạo một hệ thống tự động giám sát GPS, thân nhiệt, nhịp tim, huyết áp hỗ trợ chăm sóc sức khỏe từ xa phù hợp với cả bệnh nhân NCT và bác sỹ người Việt để có thể triển khai thực tế tại Việt Nam. Đây là một đề tài có tính liên ngành giữa Kỹ thuật y sinh – Điện tử - Truyền thông – Công nghệ thông tin. Sản phẩm của đề tài bao gồm cả sản phẩm phần cứng và hệ thống phần mềm đã được sản xuất thử nghiệm và được Hội đồng nghiệm thu đánh giá hoạt động tin cậy, ổn định, có khả năng thương mại hóa.
3.2. Sách đã xuất bản tiêu biểu
Tôi đã chủ biên 02 cuốn sách chuyên khảo về lĩnh vực xử lý tiếng nói. Sách chuyên khảo “Kỹ thuật phân rã tiếng nói theo thời gian và ứng dụng” xuất bản tại Nhà xuất bản Đại học Thái Nguyên năm 2017 đã được sử dụng cho mục đích giảng dạy, nghiên cứu cho giảng viên, học viên cao học, nghiên cứu sinh chuyên ngành Khoa học máy tính, Kỹ thuật viễn thông trong trường. Cho đến nay đã có 05 học viên cao học chuyên ngành Khoa học máy tính tại Trường Đại học CNTT&TT được tôi hướng dẫn có luận văn phát triển từ các nội dung được trình bày trong cuốn sách chuyên khảo này. Sách chuyên khảo “Studies on Improving the Naturalness of Synthesized Speech under Limited Data Conditions” xuất bản tại Nhà xuất bản quốc tế Lambert Academic Publishing năm 2017 được biên tập, chỉnh sửa từ nội dung luận án tiến sỹ cùng tên tôi, bảo vệ tại Viện Khoa học công nghệ tiên tiến Nhật Bản (JAIST) năm 2013. Sách đang được bán tại Amazon (https://www.amazon.com/dp/3330048719). Sách hiện nay được sử dụng cho mục đích giảng dạy, nghiên cứu cho giảng viên, học viên cao học, nghiên cứu sinh chuyên ngành Khoa học máy tính, Kỹ thuật viễn thông trong trường.
Ngoài ra tôi cũng đã tham gia biên soạn 01 cuốn sách giáo trình “Thông tin số” do TS. Hoàng Quang Trung là chủ biên xuất bản tại Nhà xuất bản Đại học Thái Nguyên năm 2016. Sách giáo trình Thông tin số hiện là tài liệu chính cho học phần Thông tin số trong chương trình đào tạo đại học ngành Công nghệ, kỹ thuật Điện tử Truyền thông và là tài liệu tham khảo cho học phần Kỹ thuật truyền tin trong chương trình đào tạo đại học ngành Truyền thông và Mạng máy tính đào tạo tại Trường Đại học CNTT&TT.
3.3. Công trình khoa học tiêu biểu
Tôi đã công bố tổng số khoảng bài báo khoa học, trong đó có 19 bài báo khoa học trong nước, 26 bài báo khoa học quốc tế. Trong số 45 công trình khoa học, tôi tự đánh giá 05 công trình khoa học sau là tiêu biểu nhất:
(1) Trung-Nghia Phung, Thanh-Son Phan, Thang Tat Vu, Mai Chi Luong, Masato Akagi, Improving Naturalness of HMM-Based TTS Trained with Limited Data by Temporal Decomposition, IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS 11 (2013), 2417-2426 (Tạp chí SCIE, Online ISSN: 1745-1361, Print ISSN: 0916-8532).
Bài báo số (1) là công trình khoa học quan trọng trong luận án tiến sĩ của tôi thực hiện tại Viện JAIST, Nhật Bản. Bài báo trình bày về phương pháp nâng cao chất lượng của tiếng nói tổng hợp theo mô hình thống kê HMM trong điều kiện giới hạn dữ liệu bằng kỹ thuật phân rã tiếng nói theo thời gian. Tổng hợp tiếng nói sử dụng mô hình HMM là phương pháp hiện đại, phổ biến nhất nhưng có một hạn chế lớn là tiếng nói bị hiệu ứng “trung bình hóa” dẫn tới quá trơn, mất các đặc trưng chi tiết dẫn tới chất lượng tiếng nói tổng hợp không cao, không tự nhiên. Khi lượng dữ liệu để huấn luyện là không lớn, ảnh hưởng của hiệu ứng “trung bình hóa” càng trở nên trầm trọng. Giải pháp đề xuất trong bài báo này giúp giải quyết khó khăn này. Bài báo được xuất bản trên tạp chí IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, một tạp chí ISI của Viện Kỹ thuật Điện tử, Thông tin và Truyền thông (Institute of Electronics, Information and Communication Engineers - IEICE), tổ chức khoa học hàng đầu của Nhật Bản.
(2) Nguyen Gia-Nhu, Trung-Nghia Phung (Corresponding author – tác giả liên hệ) "Reducing over-smoothness in HMM-based speech synthesis using exemplar-based voice conversion", EURASIP Journal on Audio, Speech, and Music Processing, Springer, Vol 2017.1 (2017), 14 (Tạp chí SCIE, ISSN: 1687-4722, Impact Factor: 1.579).
Bài báo số (2) là công trình khoa học mà tôi mới công bố năm 2017. Bài báo trình bày về phương pháp nâng cao chất lượng của tiếng nói tổng hợp theo mô hình thống kê HMM bằng kỹ thuật biến đổi tiếng nói theo mẫu. Nâng cao chất lượng của tiếng nói tổng hợp bởi mô hình HMM là vấn đề vẫn được nhiều nhà nghiên cứu quan tâm trong nhiều năm qua. Phát triển từ các kết quả trong luận án TS của tôi, đặc biệt là kết quả từ bài báo số (1), trong bài báo này tôi và cộng sự đã đề xuất thêm một giải pháp bổ sung sử dụng kỹ thuật biến đổi tiếng nói theo mẫu. Các kết quả phân tích, đánh giá cho thấy phương pháp đề xuất cho hiệu quả tốt. Bài báo được xuất bản trên tạp chí EURASIP Journal on Audio, Speech, and Music Processing do Springer xuất bản, một tạp chí ISI có chỉ số Impact Factor rất cao trong lĩnh vực chuyên ngành Xử lý âm thanh, tiếng nói (IF = 1.579).
(3) Trung-Nghia Phung, Huy-Khoi Do, Van-Tao Nguyen, and Quang-Vinh Thai, Eigennoise speech recovery in adverse environments with joint compensation of additive and convolutive noise, Advances in Acoustics and Vibration, Vol 2015 (2015) (Tạp chí Scopus, ISSN: 1687-6261).
Bài báo số (3) đề xuất phương pháp khôi phục chất lượng của tiếng nói trong điều kiện nhiễu nặng bao gồm cả nhiễu cộng và nhiễu nhân. Xử lý nhiễu trong tiếng nói là bài toán đã được nghiên cứu hàng chục năm qua. Tuy nhiên hiệu quả của các phương pháp triệt nhiễu đã được công bố là không cao trong điều kiện nhiễu nặng, đặc biệt là khi có cả nhiễu cộng và nhiễu nhân. Bài báo này đề xuất phương pháp khôi phục tiếng nói dựa trên kỹ thuật biến đổi tiếng nói với tiếng nói nguồn là tiếng nói bị nhiễu nặng còn tiếng nói đích là tiếng nói sạch. Giải pháp này đi theo hướng nghiên cứu kết hợp các kết quả nghiên cứu mới nhất về xử lý tín hiệu và học máy để có thể giải quyết các vấn đề tồn tại kinh điển trong xử lý tín hiệu bằng các thuật toán học máy nâng cao. Các kết quả phân tích, đánh giá cho thấy phương pháp đề xuất cho hiệu quả tốt. Bài báo được xuất bản trên tạp chí Advances in Acoustics and Vibration, tạp chí thuộc danh mục Scopus.
(4) Phùng Trung Nghĩa, Một kỹ thuật biến đổi giọng người nói hiệu quả sử dụng kỹ thuật phân rã tiếng nói theo thời gian, Chuyên san các công trình nghiên cứu, phát triển và ứng dụng CNTT-TT, T. 2, S. 36 (2016), 5-13 (Tạp chí quốc gia, ISSN phiên bản tiếng Việt: 1859-3526, ISSN phiên bản tiếng Anh: 1859-3534).
Bài báo số (4) đề xuất phương pháp biến đổi giọng người nói hiệu quả sử dụng kỹ thuật phân rã tiếng nói theo thời gian. Biến đổi giọng người nói là bài toán mới được quan tâm gần đây trong các hệ thống xử lý tiếng nói hiện đại. Biến đổi giọng người nói có thể giúp xây dựng các hệ thống tổng hợp tiếng nói đa giọng, có thể tổng hợp ra giọng của nhân vật nổi tiếng, người đã mất,... phục vụ cho lĩnh vực điện ảnh. Bài báo này đề xuất phương pháp biến đổi giọng người nói dựa trên kỹ thuật phân rã tiếng nói theo thời gian. Các kết quả phân tích, đánh giá cho thấy phương pháp đề xuất cho hiệu quả tốt. Bài báo được xuất bản trên tạp chí Chuyên san các công trình nghiên cứu, phát triển và ứng dụng CNTT-TT, tạp chí Quốc gia uy tín trong lĩnh vực Công nghệ thông tin, thuộc danh mục tạp chí được HĐGSNN tính tối đa 1 điểm.
(5) Phung Trung Nghia, Luong Chi Mai, Masato Akagi, Improving The Naturalness Of Concatenative Vietnamese Speech Synthesis Under Limited Data Conditions, Journal of Computer Science and Cybernetics (Tạp chí Tin học và Điều khiển học), Vol 31, No 1 (2015), 1-16 (Tạp chí quốc gia, ISSN: 1813-9663).
Bài báo số (5) đề xuất phương pháp tổng hợp tiếng nói dựa trên ghép nối trong điều kiện lượng dữ liệu để ghép nối là hạn chế. Trong khi hầu hết các nghiên cứu hiện nay về xử lý tiếng nói đi theo hướng tổng hợp thống kê dùng mô hình HMM, tổng hợp bằng ghép nối vẫn tiếp tục được cải tiến để có thể áp dụng trong các ứng dụng đặc thù. Đặc biệt khi lượng dữ liệu không đủ lớn để huấn luyện các mô hình thống kê hay khi chỉ cần tổng hợp tiếng nói đầu ra ở phạm vi giới hạn. Tuy nhiên, tổng hợp tiếng nói theo phương pháp ghép nối sẽ gặp phải vấn đề không trơn ở các điểm ghép nối khi ghép dữ liệu khác ngữ cảnh. Để xử lý những chỗ không trơn này, bài báo đề xuất giải pháp sử dụng mô hình nội suy tiếng nói trên miền thời gian. Các kết quả phân tích, đánh giá cho thấy phương pháp đề xuất cho hiệu quả tốt. Bài báo được xuất bản trên tạp chí Tạp chí Tin học và Điều khiển học, tạp chí Quốc gia uy tín trong lĩnh vực Công nghệ thông tin, thuộc danh mục tạp chí được HĐGSNN tính tối đa 1 điểm.
3.4. Hoat động phát triển cộng đồng khoa học
Ngoài nhiệm vụ nghiên cứu khoa học và đào tạo của cá nhân, tôi còn tích cực tham gia các hiệp hội, các tổ chức nghiên cứu khoa học nhằm phát triển các hoạt động đào tạo và nghiên cứu khoa học trong lĩnh vực khoa học chuyên ngành.
Ngay từ khi tốt nghiệp Đại học và bắt đầu là giảng viên Khoa Công nghệ thông tin, Đại học Thái Nguyên, năm 2003 tôi đã tham gia Ban giám khảo cuộc thi Tin học trẻ không chuyên tỉnh Thái Nguyên, Giám khảo cuộc thi Tay nghề ASEAN nghề Công nghệ thông tin tỉnh Thái Nguyên năm 2004, Huấn luyện viên đội tuyển thi Tay nghề ASEAN nghề Công nghệ thông tin tỉnh Thái Nguyên tham dự kỳ thi quốc gia năm 2004.
Khi bắt đầu làm NCS tại Viện JAIST, Nhật Bản năm 2009, tôi đã trở thành thành viên của các hiệp hội Viện kỹ thuật Điện và Điện tử (Institute of Electrical and Electronics Engineers - IEEE), Viện Kỹ thuật Điện tử, Thông tin và Truyền thông (Institute of Electronics, Information and Communication Engineers - IEICE), Hiệp hội xử lý thông tin và tín hiệu khu vực Châu Á – Thái Bình Dương (Asia Pacific Signal and Information Processing Association - APSIPA).
Sau khi nhận bằng TS trở về Việt Nam, tôi là thành viên của Hội Vô tuyến điện Tử Việt Nam (Radio and Electronics Association of Vietnam REV) từ năm 2016. Tôi cũng đã tích cực tham gia các diễn đàn, hội thảo khoa học chuyên ngành với vai trò thành viên ban chương trình, ban tổ chức, phản biện:
- Trưởng ban xuất bản, Thành viên Ban tổ chức, Ban chương trình, Đồng biên tập viên chính (co-editor) Hội thảo quốc tế về Các công nghệ tiên tiến trong lĩnh vực Công nghệ thông tin và Truyền thông (ICTA 2016) do Springer bảo trợ chuyên môn.
http://www.springer.com/la/book/9783319490724
- Thành viên Ban chương trình Hội thảo quốc tế về Các công nghệ tính toán và truyền thông RIVF năm 2016 do IEEE bảo trợ chuyên môn.
http://rivf2016.tlu.edu.vn/tabid/394/catid/934/conference-committees.aspx
- Thành viên Ban chương trình, đồng trưởng phiên (section chair) Hội thảo quốc tế về Thiết kế hệ thống thông tin và các ứng dụng thông minh INDIA 2017 do Springer bảo trợ chuyên môn.
http://india2017.duytan.edu.vn/media/1047/india-2017-technical-program.pdf
- Thành viên Ban chương trình hội thảo quốc tế về Kỹ thuật y sinh năm 2016 (BME-HUST 2016) do IEEE bảo trợ chuyên môn.
- Thành viên Ban chương trình Hội thảo Quốc gia "Một số vấn đề chọn lọc của Công nghệ thông tin và truyền thông" năm 2016 do Viện Công nghệ thông tin và Trường Đại học Sư phạm Hà Nội đồng tổ chức.
- Thành viên Ban chương trình, đồng trưởng phiên (section chair) phiên “Xử lý tín hiệu” tại Hội nghị Quốc gia về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT) năm 2016 tại Viện Nghiên Cứu Điện Tử, Tin Học và Tự Động Hoá.
- Tham gia phản biện cho tạp chí Tin học và điều khiển học:
http://vjs.ac.vn/index.php/jcc/announcement/view/71
- Tham gia phản biện nhiều tạp chí khoa học chuyên ngành, hội thảo quốc gia và quốc tế khác. Trong đó có những hội thảo quốc tế hàng đầu trong lĩnh vực Xử lý tín hiệu tiếng nói như IEEE Oriental Cocosda, Apsipa, Interspeech,..., và những hội thảo quốc tế được tổ chức ở Việt Nam như IEEE ICCE, IEEE ATC, Springer INDIA, IEEE RIVF,...
Cán bộ, giảng viên đưa thông tin giới thiệu về học phần (tên học phần, số tín chỉ ...) và học liệu điện tử chính thống cho từng học phần. Các tài liệu điện tử bao gồm file text (word, pdf...), file audio, file video.
Cán bộ, giảng viên đưa thông tin về các đề tài, dự án các cấp đã nghiệm thu hoặc đang được thực hiện
TT |
Tên CT, ĐT |
CN |
TG |
Mã số và cấp quản lý |
Thời gian thực hiện |
Ngày nghiệm thu |
Kết quả |
1 |
Một số phương pháp tấn công và bảo mật mạng |
CN |
CS-2005-01, Cấp cơ sở |
2005 |
Khá |
||
2 |
Ứng dụng công nghệ Agent trong trả lời tự động bằng tin nhắn SMS |
TG |
B2006-TN07-01, Cấp Bộ |
2006-2007 |
Khá |
||
3 |
Nghiên cứu và xây dựng thử nghiệm hệ thống nhận dạng ảnh mặt người phục vụ công tác điều tra và nhận dạng đối tượng |
TG |
B2007-TN07-02, Cấp Bộ |
2007-2008 |
Khá |
||
4 |
Nghiên cứu phương pháp nhận dạng người nói và xây dựng thử nghiệm hệ thốngnhận dạng người nói hạn chế |
TG |
B2007-TN07-03, Cấp Bộ |
2007-2008 |
Tốt |
||
5 |
Nâng cao hiệu quả nhận dạng tiếng nói tiếng Việt liên tục trong môi trường có nhiễu |
CN |
B2008-TN07-01, Cấp Bộ |
2008-2009 |
Khá |
||
6 |
Nghiên cứu phát triển và đánh giá hiệu năng một số giao thức định tuyến cho mạng MANET |
TG |
B2011-TN05-01, Cấp Bộ |
2011-2013 |
Khá |
||
7 |
Thiết kế, chế tạo hệ thống tự động cảnh báo, giám sát và chăm sóc sức khỏe từ xa cho người cao tuổi về nhịp tim, nhiệt độ, huyết áp |
CN |
KC-25-2015, Cấp Tỉnh Thái Nguyên |
2015-2016 |
Khá |
Cán bộ, giảng viên đưa thông tin về các bài báo khoa học đã được công bố trên các tạp chí, kỷ yếu hội nghị có mã số ISSN; các sách, giáo trình đã xuất bản tại các nhà xuất bản có mã số ISBN.
No |
Publications |
Authors |
Publishers |
Year |
1 |
Quad mesh optimization in controlling 3d objects applied for Vietnamese sign language performance |
Le Son Thai, Ma Van Thu, Tran Nguyen Duy Trung, Phung Trung Nghia |
Thai Nguyen University of Science and Technology, 178(02), tr. 91 – 96. |
2018 |
2 |
Downlink power control for uniform user capacity in single cell massive MIMO system |
Pham Thi Quynh Trang, Trinh Anh Vu, Phung Trung Nghia |
Thai Nguyen University of Science and Technology, 173(13): 117 – 121. |
2018 |
3 |
Reducing over-smoothness in HMM-based speech synthesis using exemplar-based voice conversion |
Gia-Nhu Nguyen, Trung-Nghia Phung |
EURASIP Journal on Audio, Speech, and Music Processing, Springer, 14, 1-7. |
2017 |
4 |
Multiple emotional voice conversion in Vietnamese HMM-based speech synthesis using non-negative matrix factorization |
Phung Trung Nghia |
International Journal of Advanced and Applied Sciences, 4, 8, 1-5, 2017. |
2017 |
5 |
A rule-based method for text shortening in Vietnamese sign language translation |
Thi Bich Diep Nguyen, Trung-Nghia Phung, Tat-Thang Vu |
The 4th International Conference on Information system design and Intelligent applications, Springer AISC, Vol.672, Proc. of INDIA-2017, pp. 655-662. |
2017 |
6 |
Studies on Speech Synthesis under Limited Data Conditions |
Trung-Nghia Phung |
Research Book, Lambert Academic Publishing. |
2017 |
7 |
Temporal decomposition and application in speech processing |
Phung Trung Nghia, Le Hung Linh |
Research Book, Thai Nguyen University Publishing. |
2017 |
8 |
An Efficient Approach for Voice Transformation using Temporal Decomposition |
Phung Trung Nghia |
Research, Development and Application on Information & Communication Technology Vol 2, No 36 (2016), 36, 2, 5-13. |
2016 |
9 |
A Measure of Smoothness in Synthesized Speech |
Phung Trung Nghia, Nguyen Van Tao, Pham Thi Mai Huong, Nguyen Thi Bich Diep, Phung Thi Thu Hien |
REV Journal on Electronics and Communications (2016), 6, 1-2, 1-5. |
2016 |
10 |
Special Characters of Vietnamese Sign Language Recognition System Based on Virtual Reality Glove |
Nguyen Thi Bich Diep, Phung Trung Nghia, Vu Tat Thang &Phi Tung Lam |
International Conference on Advances in Information and Communication Technology. Springer International Publishing, 2016, pp. 572-581 |
2016 |
11 |
The IOIT English ASR system for IWSLT 2016 |
Van Huy Nguyen, Trung-Nghia Phung, Tat Thang Vu, Chi Mai Luong |
The International Workshop on Spoken Language Translation (IWSLT), USA, 2016. |
2016 |
12 |
Digital Information |
Hoang Quang Trung, Phung Trung Nghia, Le Hung Linh |
Textbook, Thai Nguyen University Publishing. |
2016 |
13 |
Eigennoise Speech Recovery in Adverse Environments with Joint Compensation of Additive and Convolutive Noise |
Trung-Nghia Phung, Huy-Khoi Do, Van-Tao Nguyen, and Quang-Vinh Thai |
Advances in Acoustics and Vibration 2015 (2015) |
2015 |
14 |
On Designing A System To Supervise Patients’ Vital Signs Through Wireless Sensor Network |
Nguyen The Dung, Phung Trung Nghia, Nguyen Thai Ha, Nguyen Viet Dung |
The 5th International Conference on Biomedical Engineering in Vietnam,Springer International Publishing, (2015) 5 113-116. |
2015 |
15 |
IRPL: An energy aware IPv6 routing protocol for wireless sensor networks |
Vu Chien Thang, Nguyen Van Tao, Le Nhat Thang Phung Trung Nghia, Vu Manh Thuy |
National Conference on Control and Automation VCCA, 2015 |
2015 |
16 |
Remote monitoring system for Parkinson disease patient |
Nguyen The Dung, Phung Trung Nghia, Do Huy Khoi, Nguyen Van Thao, Hoang Thi Hong Anh |
Thai Nguyen University of Science and Technology, 137, 5, 59 - 64 |
2015 |
17 |
Improving the naturalness of concatenativeVietnamesespeech synthesis under limited data conditions |
Phung Trung Nghia, Luong Chi Mai, Masato Akagi |
Journal ofComputer science and Cybernetics, (2015) 1-16 |
2015 |
18 |
Network coding supported cooperative MAC protocol |
Hoang Quang Trung, Phung Trung Nghia, Bui Thi Thanh Xuan, Nguyen Van Tao |
Vietnam Automation Today, Special Issue on Control and Automation 8 (2014), 10, 55-62. |
2014 |
19 |
An EPA-EH decoding method for multi-path fading channel using LDPC codes. |
Nguyen Anh Tuan, Phung Trung Nghia, Nguyen Van Tao |
Vietnam Automation Today, Special Issue on Control and Automation 8 (2014), 11, 8-11. |
2014 |
19 |
LMS Adaptive Filtering in Separation of Heart Sounds and Lung Sounds |
Phung Trung Nghia, Nguyen Thanh Trung, Nguyen The Dung, Doan Thi Hien |
The 7th National Conference on Fundamental and Applied Information Technology Research (FAIR'7), 524 - 529 |
2014 |
20 |
Improve the performance of Chord P2P network in the process of joining and leaving nodes |
Pham Thanh Nam, Nguyen Van Tao, PhungTrungNghia, Dao Manh Tuan |
The 7th National Conference on Fundamental and Applied Information Technology Research (FAIR'7), 84 – 89. |
2014 |
21 |
Improving Naturalness of HMM-Based TTS Trained with Limited Data by Temporal Decomposition |
Trung-Nghia PHUNG, Thanh-Son PHAN,Thang Tat VU, Mai Chi LUONG, Masato AKAGI |
IEICE Transactions on Information and Systems, 11 (2013) 2417-2426 |
2013 |
22 |
A Hybrid TTS between Unit Selection and HMM-based TTS in limited dataconditions |
Trung-Nghia Phung, Mai Chi Luong, Masato Akagi |
The 8th ISCA Speech Synthesis Workshop (SSW8), August, Spain, 279-284. |
2013 |
23 |
Improving the flexibility of unit selection TTS with Temporal Decomposition |
Trung-Nghia Phung, Mai Chi Luong, Masato Akagi |
ASJ Spring Meeting 2013, 299-302. |
2013 |
24 |
Improving the naturalness of speech synthesized by HMMSS by producing an appropriate smoothness |
Trung-Nghia Phung, Mai Chi Luong, Masato Akagi |
ASJ Autumn Meeting 2013, 129 – 134. |
2013 |
25 |
Comparing two method: spectral envelope feature (mfcc) and pitch in contend – based music retrieval |
Phung Thi Thu Hien, Doan Xuan Ngoc, Phung Trung Nghia |
Thai Nguyen University of Science and Technology, 112, 12-2, 33-39 |
2013 |
26 |
A Study on Restoration of Bone-Conducted Speech in Noisy Environment with LP-based Model and Gaussian Mixture Model |
Phung Nghia Trung, Masashi Unoki, Masato Akagi |
J. Signal Processing, 16 (2012) 409-417 |
2012 |
27 |
An Investigation on Speech Perception Under Effect of Coarticulation |
Trung-Nghia Phung, Mai Chi Luong, Masato Akagi |
J. Computer & Electrical Engineering, 4 (2012) 532-536 |
2012 |
28 |
On the Stability of Spectral Targets under Effect of Coarticulation |
Trung-Nghia Phung, Mai Chi Luong, Masato Akagi |
J. Computer & Electrical Engineering 4 (2012) 537-541 |
2012 |
29 |
Transformation of F0 contours for lexical tones inconcatenative speech synthesis of tonal languages |
Trung-Nghia Phung, Mai Chi Luong, Masato Akagi |
International Conference on Speech Database and Assessments (OrientalCOCOSDA), Macau, 129 – 134. |
2012 |
30 |
A concatenative speechsynthesis for monosyllabic languages with limited data |
Trung-Nghia Phung, Mai Chi Luong, Masato Akagi |
Asia-Pacic Signal & Information Processing Association Annual Summit and Conference (APSIPA ASC 2012), USA, 1- 10. |
2012 |
31 |
A low cost concatenative TTS for monosyllabic languages |
Trung-Nghia Phung, Mai Chi Luong, Masato Akagi |
Auditory Research Meeting 2012, 343-348. |
2012 |
32 |
Comparative evaluation and improvement of bone-conducted-speech restoration method based on linear prediction |
Masashi Unoki, Phung Nghia Trung, Masato Akagi |
ASJ Spring Meeting, 1-Q-31, 819-822 |
2011 |
33 |
An investigation on perceptual line spectral frequency (PLP-LSF) target stability against the vowel neutralization phenomenon |
Trung-Nghia Phung, Mai Chi Luong, Masato Akagi |
3rd International Conference on Signal Acquisition and Processing, Singapore, 512-514. |
2011 |
34 |
An investigation on speech perception over coarticulation |
Trung-Nghia Phung, Mai Chi Luong, Masato Akagi |
3rd International Conference on Signal Acquisition and Processing, Singapore, 507-511. |
2011 |
35 |
A Novel Spectral Conversion Based Approach for Noisy Speech Enhancement |
Huy-Khoi Do, Trung-Nghia Phung, Huu-Cong Nguyen, Van-Tao Nguyen, Quang-Vinh Thai |
J. Information and Electronics Engineering 3 (2011) 281-285. |
2011 |
36 |
Missing data processing in data mining |
Phung Thi Thu Hien, Phung Trung Nghia, Doan Xuan Ngoc |
Thai Nguyen University of Science and Technology, 86, 10, 55-60. |
2011 |
37 |
Improving Bone-Conducted Speech Restoration in noisy environment based on LP scheme |
Trung Nghia Phung, Masashi Unoki and Masato Akagi |
The APSIPA ASC 2010, Singapore |
2010 |
38 |
Comparative Evaluation of Bone-conducted speech Restoration based on Linear Prediction Scheme |
Trung Nghia Phung, Masashi Unoki and Masato Akagi |
Technical Committee on Engineering Acoustics, Hokkaido, Japan, 53-58. |
2010 |
39 |
Some evaluations of speech recognition performance using subband coding |
Phung Trung Nghia |
Thai Nguyen University of Science and Technology, 4, 52, 47-51. |
2009 |
40 |
Using fundamental frequency and algorithm dynamic time warping (dtw) to search contend music |
Phung Thi Thu Hien, Thai Quang Vinh, Phung Trung Nghia, Le Tuan Anh |
Thai Nguyen University of Science and Technology, 61, 12-2, 10-16. |
2009 |
41 |
The perceptual wavelet feature for noise robust Vietnamese speech recognition |
Trung, Nguyen Quoc, and Phung Trung Nghia |
Second International Conference on Communications and Electronics, ICCE 2008, 258 – 261. |
2008 |
42 |
A new wavelet-based wide-band speech coder |
Nghia, Phung Trung, and Pham Viet Binh |
International Conference onAdvanced Technologies for Communications, ATC 2008, 349-352. |
2008 |
43 |
A novel fast noise robust Vietnamese speech recognition applied for robot control |
Nghia, Phung Trung, and Thai Quang Vinh |
International Conference onControl, Automation, Robotics and Vision, ICARCV 2008, 821-826. |
2008 |
44 |
A image enhancement method using Wavelet transform based on local noise level and edge analysis |
Pham Viet Binh, Phung Trung Nghia, Do Huy Khoi |
National Conference 10th @, 263 – 269 |
2008 |
45 |
A speech denoising and enhancement method using Wavelet transform |
Vu Ngoc Phan, Phung Trung Nghia, Do Huy Khoi |
National Conference 10th @, 270 – 276 |
2008 |
46 |
Musical signal processing by the time – frequency method using Wavelet transform |
Phung Trung Nghia, Le Khanh Duong |
National Conference ICT-RDA 2008, 3-7 |
2008 |
47 |
Spectral subtraction and MMSE combining method in the wavelet domain |
Vu Ngoc Phan, Do Huy Khoi, Phung Trung Nghia |
Thai Nguyen University of Science and Technology, 2, 1(45), 90-94. |
2008 |
48 |
A robust wavelet-based text-independent speaker identification |
Phung Trung Nghia, Pham Viet Binh, Nguyen Huu Thai, Nguyen Thanh Ha & Prayoth Kumsawat |
The IEEE International Conference on Computational Intelligence and Multimedia Applications (ICCIMA 2007), India, 219-223. |
2007 |
49 |
A low bit rate wide-band speech coder in the perceptual wavelet packet domain |
Phung Trung Nghia, Vu Ngoc Phan |
ISEE 2007 (2007), 2, 139 – 144 |
2007 |
50 |
Intelligent SMS agent for automatic answering system and experimental solutions |
Phung Trung Nghia, Pham Viet Binh |
Thai Nguyen University of Science and Technology, 2, 4(44), 20-24. |
2007 |
51 |
Face recognition using Gabor wavelet and Neural network |
Bui Ngoc Tuan, Phung Trung Nghia, Do Huy Khoi |
Thai Nguyen University of Science and Technology, 2, 4(44), 33-37. |
2007 |
Cán bộ, giảng viên đưa thông tin về đào tạo sinh viên, học viên:
- Hướng dẫn sinh viên tốt nghiệp
- Hướng dẫn học viên cao học
- Hướng dẫn nghiên cứu sinh
Đang đồng hướng dẫn 02 NCS chuyên ngành Khoa học máy tính;
Đã hướng dẫn 06 HVCH bảo vệ thành công luận văn ThS;
Đã hoàn thành 01 đề tài NCKH cấp Bộ Giáo dục & Đào tạo, 01 đề tài NCKH cấp Tỉnh Thái Nguyên với vai trò chủ nhiệm đề tài;
Đã hoàn thành 02 đề tài NCKH cấp Bộ Giáo dục & Đào tạo với vai trò thành viên chính;
Đang chủ nhiệm 01 đề tài NCKH cấp Bộ Giáo dục & Đào tạo sẽ nghiệm thu trong năm 2017;
Đã công bố 19 bài báo KH trong nước, 26 bài báo KH ở ngoài nước;
Đã xuất bản 01sách giáo trình và 02 sách chuyên khảo.
Cán bộ, giảng viên đưa các tài liệu điện tử tham khảo phục vụ cho công tác giảng dạy và nghiên cứu khoa học hoặc các tài liệu khoa học thú vị khác (của chính tác giả hoặc của tác giả khác).