Tiện ích tạo giọng nói Google Duplex đã được giám đốc điều hành Sundar Pichai của công ty Google công bố lần đầu tại hội nghị các nhà phát triển Google I/O vào tháng 5.2018 và đến tháng 3 năm 2019 bắt đầu được phổ biến rộng rãi tại Mỹ. Ông cho biết giọng nói được trí khôn nhân tạo (AI) tạo ra với mục đích giúp cho các trao đổi công việc như giữ chỗ qua điện thoại được thuận lợi hơn và giảm số nhân viên.
Google Duplex, cuộc cách mạng tạo giọng nói người
Cuộc trình diễn của Pichai cho thấy “giọng nói AI” (AI Call) không chỉ hiểu người ở đầu dây bên kia mà còn biết trả lời đúng những câu hỏi hay chất vấn từ họ. Giọng nói của Google Duplex chuẩn đến nỗi ngữ điệu rất giống người.
Nó có được khả năng này nhờ vào ASR (công nghệ nhận biết giọng nói) của Google và “hệ thần kinh” RNN xây dựng bằng công nghệ TensorFlow Extended. Dĩ nhiên, RNN phải “học” trước những mẫu đàm thoại và tất cả tình huống thường gặp trong lĩnh vực nó phụ trách mới có thể thực hiện tốt nhiệm vụ. ASR sẽ xử lý câu nói từ đầu dây bên kia, phân tích và điều chỉnh lại trước khi trả lời chính xác bằng giọng nói tự nhiên.
Để trợ giúp người dùng Google Duplex, Google đã phát hành một video hướng dẫn cách bảo trợ lý Google Assistant đặt bàn khách sạn và chứng minh cho người dùng thấy “trợ lý AI” hiệu quả thế nào khi nó tự gọi điện đến nhà hàng theo lệnh chủ và trò chuyện với người quản lý nhà hàng. Sau khi gọi điện xong, Google Assistant còn gửi lưu ý đến chủ nhân để báo việc đặt bàn dã hoàn tất. Phía nhà hàng cũng có thể dùng Google Duplex để trả lời khách giữ chỗ thay vì tuyển thêm nhân viên.
Độ chuẩn của “giọng nói AI” được chứng minh bằng cuộc hẹn với salon tóc của một diễn viên. Giọng nói lên xuống và ngắt quãng thật đến nỗi một chuyên viên về công nghệ cũng phải “tâm phục khẩu phục”. Tháng 10.2018, Google cho biết từ mùa thu 2018, Google Duplex đã đến tay một số khách hàng chọn lọc ở một số thành phố Mỹ, đầu tiên là Atlanta, New York, Phoenix và nội ô thành phố San Francisco trước khi mở rộng sang 43 bang vào tháng 3.2019.
Dĩ nhiên, do mới mẻ nên Google Duplex có một số hạn chế. Hạn chế lớn nhất là do mới ở giai đoạn thử nghiệm beta nên bạn chưa thể nghe lại ghi âm cuộc trò chuyện theo yêu cầu hoặc không thể nhận nội dung viết ra của nó. Không biết Google có cho phép người dùng Duplex được hưởng hai chế độ này trong tương lai hay không? Ngoài ra, nếu bạn quyết định huỷ lệnh giữ chỗ, bạn chỉ có thể dùng Duplex để giữ chỗ lại tại cùng nhà hàng sau một ngày nữa. N
ếu bạn dùng Duplex giữ chỗ tại nhiều nhà hàng rồi huỷ nó, Google sẽ tạm khoá “trợ lý giọng nói” của bạn trong một thời gian không xác định. Công ty cho biết phải hạn chế để ngăn chặn những kẻ dùng Duplex quấy rối các nhà hàng.
Những cảnh báo
Cuộc biểu diễn Google Duplex tại Google I/O đã được những người dự khán đón chào nồng nhiệt khi họ không thể phân biệt được thật giả trong giọng nói tạo ra với sự giúp sức của phần mềm giả giọng tiên tiến nhất. Nhưng đồng thời, những chuyên viên công nghệ cũng nhận ra sự nguy hiểm của phát minh này đã lên tiếng cảnh báo Google là sẽ có một số người dùng hệ thống của nó để phạm pháp.
Gần như ngay lập tức, Google trấn an là sẽ có những bước đi tiếp theo để bảo đảm ai cũng có thể biết đó là giọng giả khi họ nhận cuộc gọi từ “trợ lý AI”. Thậm chí, sẽ có một tín hiệu đi kèm để người nhận không bị lầm. Trong thực tế, Google Duplex đã có một số cập nhật về an ninh. Ví dụ, trang bị thêm cho “hệ thống tạo giọng nói AI” khả năng tự giới thiệu nó là sản phẩm của Google khi bắt đầu cuộc gọi, đồng thời báo cho người ở đầu bên kia biết là cuộc đàm thoại sẽ được ghi lại. Nếu người nhận không muốn ghi lại,
Google Assistant sẽ chuyển cuộc gọi sang đường dây không ghi. “Bất cứ ai được phần mềm này gọi đến sẽ được báo trước họ đang trò chuyện với máy chứ không phải người thật” – phát ngôn viên Google khẳng định với trang web tin tức công nghệ Verge. Trong tuyên bố trấn an người dùng, Google cho biết sẽ quan tâm đến tất cả những cảnh báo và lo lắng về Google Duplex và bảo đảm là sẽ không có ai bị lừa bởi “giọng nói AI”. “Việc minh bạch về sản phẩm và loại trừ các yếu tố gây hại cho người dùng luôn là ưu tiên số 1 của chúng tôi. Hệ thống giả giọng sẽ có bộ phận cảnh báo cài sẵn để báo trước với người nhận đây là giọng giả. Sẽ không có ai bị nó đánh lừa” – thông báo của Google viết.
Cho đến thời điểm này, Google Duplex được xem là thành công nhất của công nghệ giả giọng người với giọng nói thật như người. “Mục đích của chúng tôi là làm cho cuộc trò chuyện giữa người và máy tự nhiên hơn, rất lợi cho những người già cần trò chuyện để khuây khoả trên máy tính. Duplex không được tạo ra để trợ giúp những kẻ lừa đảo. Chúng tôi đón chào tất cả các phản hồi sau cuộc trình diễn để có những điều chỉnh ở phiên bản cuối cùng” – thông báo của Google nhấn mạnh. Đối với giảng sư Zeynep Tufekci thuộc Đại học Bắc Carolina chuyên theo dõi và góp ý về ảnh hưởng của công nghệ mới đối với xã hội và ngược lại, cuộc trình diễn của Google gây ấn tượng với bà rất mạnh và “ngoài sự tưởng tượng”.
Trên mạng xã hội Twitter, bà viết: “Việc Duplex của Google bắt chước quá hoàn hảo giọng nói người không chỉ là một tiến bộ công nghệ vượt bực mà còn báo trước những nguy cơ khó lường nếu công nghệ bị lạm dụng. Tôi kinh hoảng trước thành tựu của Google nhưng cũng thấy khủng khiếp với những hậu quả nó có thể gây ra trong tương lai”.
Trong post sau đó, bà cảnh báo: “Nói nghiêm túc, chúng ta không thể đùa với một sự bắt chước quá hoàn hảo! Tôi rất ngạc nhiên khi thấy Google quyết định đưa phát minh ra công chúng mà không chờ hoàn chỉnh sản phẩm cuối cùng bảo đảm 100% an toàn cho người dùng. Tôi tin là những chuyên viên lừa đảo đang tìm cách khai thác Google Duplex để gây án”.
Ích lợi của hệ thống tạo giọng nói giống thật
Một trong những mục tiêu được theo đuổi từ lâu trong lĩnh vực “tương tác máy-người” là cho phép máy tính có thể nói chuyện giống như người, tức là có giọng nói tự nhiên. Trong những năm gần đây, chúng ta đã chứng kiến cuộc cách mạng về khả năng hiểu và phát ra giọng nói tự nhiên của máy tính, mà nổi bật là ứng dụng tìm WaveNet của Google.
Tuy nhiên, cho dù đã đạt được nhiều tiến bộ đến tình trạng nghệ thuật thì máy tính vẫn không thể hiểu được giọng nói tự nhiên ở nhiều trường hợp. Đặc biệt, hệ thống trả lời điện thoại tự động vẫn còn rất khó khăn trong việc nhận biết cả những từ hay mệnh lệnh đơn giản nên phản hồi thường thiếu chính xác. Hệ thống không có khả năng tự chỉnh giọng nói người để có thể hiểu được mà người gọi điện hay ra lệnh thường phải nói lại một vài lần chậm và rõ hơn để giúp máy hiểu. Google Duplex là câu trả lời cho vấn đề.
Công nghệ mới này có thể tự chỉnh và hiểu câu nói của đầu dây bên kia để tiến hành cuộc trò chuyện giống như trong thế giới thực trên điện thoại mà chỉ có một bên là người. Bạn hãy tưởng tượng mình gọi điện giữ chỗ tại một khách sạn thông qua Google Assistant dùng Google Duplex và máy tính của khách sạn tự trả lời những câu hỏi của khách dựa vào những gì nó được lập trình mà không cần hỏi đi hỏi lại, với độ chính xác gần như tuyệt đối.
Hẹn gặp bác sĩ, giữ chỗ nhà hàng hay đăng ký vé máy bay cũng rất thuận lợi. Phía nhận cuộc gọi dùng Duplex thay cho nhân viên bằng xương bằng thịt, rất tiện. Khách có cảm giác mình đang nói chuyện với một người khác chứ không phải với máy. Dĩ nhiên, Duplex chỉ có thể thực hiện những cuộc đàm thoại tự nhiên trong lĩnh vực mà nó được “huấn luyện” chứ không thể làm được điều này trong mọi lĩnh vực.
Cuộc trình diễn gọi điện đăng ký giữ chỗ với “tiếp tân Duplex” tại salon làm đẹp nói ở trên là một ví dụ. Điều thú vị là Duplex cho ra nhiều giọng nói khác nhau đối với từng khách hàng. Rõ ràng, công nghệ Google Duplex được xây dựng để giao tiếp máy-người được dễ dàng hơn và chính xác hơn. Có nhiều thách thức trong trò chuyện máy-người mà điểm mấu chốt nhất vẫn là sự khó hiểu của nhiều giọng nói tự nhiên và khó bắt chước giọng nói tự nhiên về cả ngữ điệu lẫn âm vực.
Khi con người nói chuyện với nhau, chúng ta có thể dùng những câu văn phức tạp hơn là nói với máy tính vì sợ máy không hiểu. Máy cũng không hiểu chính xác câu hỏi do bỏ qua những âm nó không biết là gì, đặc biệt khi người bên kia nói nhanh, không rõ, nuốt chữ. Những tạp âm trong điện thoại cũng gây trở ngại cho máy. Khả năng tự điều chỉnh và hiểu một câu nói, một mệnh lệnh của máy rất kém. Nay, Google Duplex giải quyết được trở ngại này nhờ khả năng tự chỉnh câu hỏi tốt nên hiểu tốt hơn, tương tác tốt và cho ra được những câu nói giống người nói.
Các doanh nghiệp có thể dùng Duplex thay cho nhân viên giữ chỗ. Nó cho phép khách hàng giữ chỗ hay đăng ký qua Google Assistant mà không cần đến một nhân viên được đào tạo bài bản trong lĩnh vực này. Duplex cũng tự động nhắc khách hàng nhớ ngày hẹn để xem khách có huỷ hay dời lại ngày hẹn hay không. Google Duplex giúp khách hàng tiết kiệm thời gian.