Ai là người đứng sau giọng nói của Stephen Hawking?
Admin / July 28, 2022
Năm 1985, Stephen Hawking được phẫu thuật mở khí quản cứu sống ông đã lấy đi giọng nói tự nhiên của mình.
Bệnh xơ cứng teo cơ một bên (ALS), còn được gọi là bệnh Lou Gehrig hoặc bệnh thần kinh vận động (MND), đã khiến giọng nói của ông bị nói ngọng và ảnh hưởng đến khả năng di chuyển của anh ta.
Điều đó đã thay đổi khi Walter và Ginger Woltosz, những người sáng lập Words Plus, tặng một hệ thống liên lạc có tên là Equalizer. Cặp đôi đã kết hôn ban đầu đã bắt đầu phát triển nó cho người mẹ quá cố của Ginger, Lucille Evans, người mắc bệnh ALS. Chương trình máy tính cuộn qua các cụm từ thông dụng trên màn hình và Hawking có thể chọn nội dung mình muốn giao tiếp chỉ bằng một nút bấm.
Khi anh ấy gửi một tin nhắn, nó đã được xử lý bởi một bộ tổng hợp giọng nói có tên là Speech Plus CallText 5010. Giọng nam của nó có giọng Mỹ. Giọng của Dennis H. Klatt.
Nhà nghiên cứu Dennis Klatt của Viện Công nghệ Massachusetts (MIT) đã làm việc về tổng hợp giọng nói từ những năm 1960.
Ông đã phát triển một thuật toán gọi là KlattTalk hoặc MITalk. Điều này có ba giọng - 'Perfect Paul', 'Beautiful Betty' và 'Kit the Kid' - được tạo ra bằng cách sử dụng hàng giờ ghi âm từ chính anh, vợ anh và con gái anh. ( Bạn có thể nghe giọng nói trên BBC Sounds .) Chúng được phát hành lần đầu tiên vào năm 1984, như một phần của bộ tổng hợp giọng nói DECtalk.
'Perfect Paul' cũng sẽ sớm được sử dụng bởi bộ tổng hợp Speech Plus CallText 5010.
Joseph Perkell, một đồng nghiệp của Dennis Klatt, nói với Witness History: “Lần đầu tiên tôi thực sự hiểu rằng Stephen Hawking sẽ sử dụng bộ tổng hợp giọng nói của Dennis Klatt là khi tôi nghe anh ấy nói. Tôi nghĩ, ồ, tôi đang xem Stephen Hawking và phát ra giọng của Dennis. Đó là một loại đáng ngạc nhiên.
“Vào thời điểm đó, chất lượng của nó là tốt nhất bạn có thể nhận được. So với các kế hoạch khác đang được phát triển ở những nơi khác, [của Klatt] rõ ràng là tốt nhất. ”
Một giọng nói sống mãi
Trong khi làm việc trên công nghệ có thể mang lại tiếng nói cho Stephen Hawking, Dennis Klatt đã đánh mất chính mình. Căn bệnh ung thư tuyến giáp ảnh hưởng đến dây thanh quản của ông, và ông nói giọng khàn và khàn trong thập kỷ cuối đời, trước khi mất khả năng nói hoàn toàn. Ông mất năm 1988.
Giọng nói của anh ấy vẫn tồn tại.
Giáo sư Hawking đã sử dụng Speech Plus CallText 5010 cho đến khi ông qua đời vào năm 2018, mặc dù thực tế là ông đã được đề nghị "nâng cấp". Trên thực tế, khi anh ấy cần một bộ tổng hợp mới - hai thập kỷ sau khi Speech Plus ngừng hoạt động - nhóm của anh ấy đã phải nỗ lực rất nhiều để khôi phục lại 'Perfect Paul'.
Hawking nói vào năm 2006: “Tôi giữ nó bởi vì tôi không nghe thấy giọng nói nào mà tôi thích hơn và vì tôi đã xác định được với nó.
Mặc dù nhiều người mô tả giọng nói tổng hợp của Stephen Hawking giống như âm thanh của robot, nhưng điều đó không ngăn cản ông truyền đạt những ý tưởng phức tạp nhất, cho dù ông đang giảng bài tại Đại học Cambridge, thực hiện các cuộc phỏng vấn trên truyền hình hay phát biểu tại NASA. Nó cũng không ngăn cản anh ta khỏi cuộc trò chuyện.
Thêm vào đó, giọng nói của Hawking trở thành một trong những giọng nói nổi tiếng và dễ nhận biết nhất trên thế giới. Không có gì ngạc nhiên khi các nhà làm phim làm việc trong bộ phim tiểu sử năm 2014 của ông, The Theory of Everything, muốn làm đúng như vậy.
Biên kịch Anthony McCarten nói với Variety: “Chúng tôi đã dành rất nhiều thời gian và tiền bạc để cố gắng tái tạo giọng nói, nhưng chúng tôi không bao giờ đạt được điều đó”.
May mắn thay, Hawking rất hài lòng với buổi chiếu trước đó nên ông đã cho phép các nhà làm phim sử dụng 'Perfect Paul', hiện đã được đăng ký nhãn hiệu.
Eddie Redmayne, người đóng vai Hawking trong phim, cho biết: “Với giọng nói cụ thể của anh ấy, đó là giấc mơ của một diễn viên. Bạn đang tiến gần hơn một bước tới sự thật. ”
Công nghệ chuyển văn bản thành giọng nói
Chuyển văn bản thành giọng nói đã trải qua một chặng đường dài kể từ khi Dennis Klatt phát triển 'Perfect Paul'.Klatt đã thiết kế thủ công thuật toán tổng hợp giọng nói của mình. Dựa trên các thông số về giọng nói của chính mình, ông đã hình thành các quy tắc để định hình âm thanh do máy tính tạo ra thành âm thanh giống giọng nói. Kỹ thuật này đã mang tính đột phá vào thời điểm đó.
Giờ đây, chúng ta có các thuật toán máy tính có thể học các mô hình giọng nói phức tạp với hàng triệu tham số. Họ cũng có thể xử lý khối lượng lớn hơn nhiều và nhiều loại dữ liệu giọng nói của con người. Kết quả là chúng ta có giọng nói tổng hợp nghe tự nhiên hơn nhiều.
Điều này đã được thực hiện nhờ những tiến bộ về phần cứng, cũng như khả năng tải dữ liệu và xử lý lên đám mây. Nhóm làm việc trên bộ tổng hợp giọng nói trước đó của Hawking đã bị giới hạn bởi sức mạnh tính toán của các thiết bị chuyển văn bản thành giọng nói "ngoại tuyến", đặc biệt là những thiết bị có thể phù hợp với xe lăn.
Giọng nói tổng hợp có thể không bao giờ đạt được hoàn toàn ngang bằng với giọng nói của con người, nhưng ngày càng khó phân biệt giữa chúng. Trong những năm 1980, chuyển văn bản thành giọng nói đã đủ tiên tiến để giúp một trong những bộ óc khoa học vĩ đại nhất thế giới truyền đạt ý tưởng của mình. Giờ đây, nó cung cấp một cách hiệu quả về chi phí cho tất cả mọi người để nói lên tiếng nói của họ.
Tại vMixvoice, chúng tôi sử dụng giọng nói AI nâng cao và xử lý ngôn ngữ tự nhiên (NLP) để chuyển đổi nội dung viết thành âm thanh. Đăng ký miễn phí và bắt đầu tạo âm thanh ngay hôm nay.