Trong cuộc thí nghiệm thành công ngoài mong đợi, những thiết bị cấy vào não có thể nhận diện từ ngữ, dùng AI để tạo âm thanh gần giống giọng nói của bệnh nhân.
Cách đây 4 năm, hội chứng ALS (xơ cứng teo cơ một bên) khiến Casey Harrell mất khả năng nói chuyện bình thường. Buổi chia sẻ về khí hậu trên Zoom là lần cuối ông tự nói chuyện mà không cần trợ giúp.
Tháng 7/2023, nhóm bác sĩ từ Đại học California, Davis (Mỹ) cấy ghép các điện cực vào não Harrell để nhận biết những gì ông muốn nói. Điều này đồng nghĩa Harrell trở thành “vật thí nghiệm” tiếp theo trong sứ mệnh kết nối não người với máy tính.
Bác sĩ nhấn mạnh cuộc phẫu thuật không thể thay đổi số mệnh của Harrell, song kết quả thu được ngoài mong đợi. Theo bài nghiên cứu đăng trên Tạp chí Y học New Zealand ngày 14/8, thiết bị có khả năng nhận diện từ với tỷ lệ chính xác cao, phát âm thanh tương tự giọng nói thật của ông nhờ trí tuệ nhân tạo (AI).
Hội chứng ALS khiến Casey Harrell mất khả năng nói chuyện bình thường.
“Điều này thật thú vị”, TS Edward Chang, bác sĩ phẫu thuật thần kinh tại Đại học California, San Francisco, người từng phát triển nhiều thiết bị cấy ghép giúp người liệt nói chuyện, cho biết.
Trả lời New York Times, Chang nhấn mạnh hệ thống “được xem như khoa học viễn tưởng” cách đây vài năm, giờ lại “đang được cải thiện, tối ưu hóa rất nhanh chóng”.
Nhóm bác sĩ cấy vào lớp ngoài não của Harrell 4 mảng điện cực nhỏ ngang ốc vít, gấp đôi các nghiên cứu trước. Mỗi mảng chứa 64 điểm thu xung điện từ tế bào thần kinh, phát ra khi Harrell cố gắng cử động miệng, môi, hàm và lưỡi để nói.
3 tuần sau ca phẫu thuật, các nhà khoa học đến phòng khách sạn của Harrell ở California để “cắm điện”. Họ kết nối thiết bị cấy ghép với dãy máy tính bằng dây cắp gắn vào 2 trụ kim loại nhô khỏi hộp sọ.
Một mảng điện cực kết nối hệ thống não-máy tính giúp Harrell “nói chuyện”. (Ảnh: New York Times).
Sau khi đào tạo máy tính nhận diện các từ cơ bản, thiết bị cấy ghép có thể ghi nhận những gì Harrell muốn nói dựa trên 50 từ vựng cho trước, với độ chính xác 99,6%.
Hệ thống hoạt động nhanh đến nỗi các nhà khoa học phải rút ngắn giai đoạn phân tích đầu tiên. Khi cố gắng nói to rõ câu “What good is that?” (tạm dịch: Điều này có ích gì?), Harrell run rẩy, mỉm cười và bật khóc.
Với người bình thường, từ “what” và “good” của ông Harrell rất khó nghe, song với các điện cực tùy chỉnh theo từng tế bào thần kinh trong não, chúng được nhận diện rõ ràng. Lời nói của ông được hiển thị chính xác bằng văn bản trên màn hình gắn phía trước.
Thiết bị cấy ghép giúp cải thiện triệu chứng gây ra bởi ALS, không dựa vào cơ mặt vốn đã yếu ớt của Harrell mà sử dụng phần vỏ não vận động.
“Điểm mấu chốt là đưa nhiều mảng thu điện não chính xác vào các phần ‘nói nhiều nhất’ trong não mà chúng ta có thể tìm thấy”, Sergey Stavisky, nhà khoa học thần kinh tại Đại học California, Davis, thành viên nhóm nghiên cứu, cho biết.
Đến ngày thứ 2, hệ thống có thể xử lý 125.000 từ vựng có sẵn với độ chính xác 90%, đồng thời tạo ra giọng nói giống hệt Harrell nhờ dữ liệu đào tạo từ các cuộc phỏng vấn và file ghi âm. Trong một số trường hợp, thiết bị có thể ghép từ để tạo câu ngay cả khi giọng nói nhận diện không rõ ràng.
“Con gái ngoan của cha. Cha đã chờ ngày này lâu lắm rồi” là những gì Harrell nói với con gái Aya vừa về nhà lúc đó.
Thiết bị được kết nối với máy tính, màn hình dùng để hiển thị từ ngữ Harrell muốn nói. (Ảnh: New York Times).
Các nhà khoa học tiếp tục đào tạo thiết bị để cải thiện khả năng nhận diện giọng nói. Nghiên cứu cho biết trong 8 tháng, Harrell đã thốt gần 6.000 từ riêng biệt, tỷ lệ nhận diện chính xác được duy trì 97,5%. Con số này cao hơn nhiều ứng dụng trên smartphone và cả những thiết bị cấy ghép trước đây (khoảng 75%).
Trong khi các hệ thống như Neuralink giúp con người di chuyển trỏ chuột trên màn hình, thiết bị cấy ghép não của Harrell cho phép ông giao tiếp tự nhiên với mọi người.
“Mọi thứ biến từ trình diễn khoa học thành hệ thống mà Casey có thể sử dụng mỗi ngày để trò chuyện với gia đình và bạn bè”, TS David Brandman, người phẫu thuật ông Harrell, cho biết.
Sự tiến bộ về khả năng nhận diện giọng nói một phần đến từ mô hình AI dùng trong các công cụ như ChatGPT. Trong mọi thời điểm, thiết bị cấy ghép của Harrell có thể bắt tín hiệu trong một nhóm tế bào thần kinh, chuyển nhịp xung thành đơn vị nguyên âm hoặc phụ âm. Sau đó, máy tính tập hợp các chuỗi dữ liệu để tạo ra từ, hoặc ghép chuỗi từ thành câu phù hợp những gì ông muốn nói.
Trong lúc phỏng vấn, Harrell thường chỉnh lại từ ngữ trên màn hình trước khi nhấn nút phát âm thanh. Giọng nói mang phong cách trang trọng, nhóm nghiên cứu cũng chỉnh sửa phần mềm để nhận diện những cụm từ không phổ biến mà ông hay dùng.
Hệ thống cũng “đánh thức” một phần tính cách của Harrell, khi ông cùng vợ Saxon trở lại thói quen đùa giỡn như xưa, dù cách truyền tải thay đổi đôi chút. Phần mềm còn tinh chỉnh giọng nói, giúp chúng ngày càng giống cách trò chuyện trước đây của ông.
Harrell và người vợ Levana Saxon. (Ảnh: New York Times).
“Có nhiều từ nghe giống hệt những gì tôi từng nói. Ví dụ như ‘What up?’ (Chuyện gì vậy?)”. Khi nghe máy tính phát ra cụm từ với giọng nói cũ, Harrell mỉm cười.
Khả năng giao tiếp bằng máy tính giúp Harrell trò chuyện nhiều hơn với con gái 5 tuổi Aya. Các nhân viên y tế từng tỏ vẻ khinh thường ông giờ cũng nói chuyện nhẹ nhàng hơn. Nó còn giúp Harrell tha thứ những người bạn từng rời bỏ mình.
Dù vậy, chưa thể khẳng định hệ thống cấy ghép tương tự có hữu ích cho những người gặp triệu chứng nặng hơn hay không. Với căn bệnh của Harrell, khả năng nói giảm sút nhưng không hoàn toàn mất đi.
Gánh nặng tài chính cũng là vấn đề lớn với người mắc ALS. Điều này khiến họ gặp khó trong việc tiếp cận thiết bị cấy ghép tiên tiến, theo chia sẻ của Melanie Fried-Oken, giáo sư thần kinh học tại Đại học Khoa học và Sức khỏe Oregon.
Bản in 3D não của Harrell, giúp các nhà khoa học tinh chỉnh thiết bị cấy ghép. (Ảnh: New York Times).
Bản thân Harrell thừa nhận “rất may mắn nhưng tức giận” khi sống trong thế giới có khả năng kết nối máy tính với não bộ, nhưng không thể giải quyết tình trạng khó khăn tài chính với những người cần trợ giúp.
Trong các cuộc phỏng vấn, Harrell cho biết ông làm việc hiệu quả, tự lập hơn sau ca phẫu thuật. Bên cạnh email công việc, ông còn cho hệ thống đọc lời bài hát để một ngày có thể hát cho mọi người, điều các nhà khoa học đang nỗ lực biến thành hiện thực.