Hợp nhất người - máy
Phần trao đổi gần đây của Demis Hassabis tại diễn đàn All-in-Summit 2025 (do All-in-Podcast tổ chức) cung cấp cho công chúng một bức tranh khá toàn diện về cách AI len lỏi vào đời sống chúng ta, mà cụ thể là Google DeepMind (nơi ông làm CEO). Demis bất đầu bằng Gemini Live, một công cụ AI mà người dùng có thể trò chuyện liên tục cũng như chia sẻ camera điện thoại để nó có thể cùng thảo luận bối cảnh hay môi trường mình đang dự phần. Hãy tưởng tượng bạn đang đi khám phá hang Sơn Đoòng ở Quảng Bình mà mỗi bước đi bạn như thể video call cho Gemini để hỏi xem hòn đá hay thạch nhũ này hình thành ra sao hay cái cây dọc đường là cây gì có ăn được hay không. Gemini có thể hiểu thế giới vật lý xung quanh một cách đáng kinh ngạc, nhờ vậy có thể tích hợp vào kính đeo mắt để trở thành trợ lý hàng ngày của con người.
Demis cũng nhắc đến Gemeni robotics, công cụ hỗ trợ robot hiểu ngôn ngữ tự nhiên. Ví dụ như chúng ta có thể ra lệnh cho hai cánh tay máy đang cầm hai khối vuông màu đỏ và vàng (màu cờ Việt Nam) như đặt hộp đỏ lên hộp vàng hay ngược lại bằng chính giọng nói của mình. Một phát kiến khác của DeepMind cũng khá thú vị là Genie 3, một nền tảng AI có thể tạo ra các mô hình thế giới (world models - như trong trò chơi điện tử 3D) thông qua vài dòng promp và thể hiện bằng không gian 3D trên màn hình máy tính hay điện thoại mà con người có thể dạo chơi và thêm thắt vào các sự kiện diễn ra trong đó (cũng nhờ promp theo thời gian thực). Ngoài ra ông cũng đề cập đến Nano Banana, công cụ AI giúp xử lý hình ảnh: tưởng tượng bạn đăng tải hình ảnh toàn thân của bạn và bộ đồ bạn muốn mặc, sau đó nhờ công cụ này kết hợp hai hình ảnh với nhau xem bạn trông như thế nào trong bộ trang phục mới (hoặc chơi đùa với hình ảnh đó như hỏi Nano Banana xem mình trông như thế nào nếu nhảy nhót trong trang phục này). Cuối cùng Demis nhắc đến tâm huyết rất lớn của ông Isomorphic Labs, một nhánh của DeepMind tập trung vào việc khám phá các loại thuốc chữa bệnh bằng AI. Tựu chung lại, DeepMind có khả năng len lõi vào mọi ngóc ngách trong khai phá khoa học của con người.
Các phát kiến trên áp dụng "kỹ thuật đảo ngược vật lý trực giác" (reverse engineering intuitive physics) trong đó đào sâu vào hành vi (behavior) và cách thức con người ra quyết định (decision-making)/ trực giác để các mô hình tính toán có thể tiên đoán và hiểu cách thức con người suy luận về thế giới vật lý quanh mình (physical scenarios). Demis nhấn mạnh AGI (Trí tuệ Nhân tạo Tổng quát) giờ đây phải hiểu rõ thế giới vật lý hay tự nhiên bên ngoài trông như thế nào nữa chứ không chỉ tập trung khai phá thế giới trừu tượng của ngôn ngữ hay toán học.
Demis thừa nhận, AI ngày nay vẫn chưa đạt được sự sáng tạo thực sự (true creativity), cụ thể nó chưa thể đưa ra những suy đoán mới hay giả thuyết mới. Nó có thể chứng minh một thông tin gì đó bạn đưa ra nhưng chưa thể đưa ra ý tưởng mới. Sự sáng tạo như con người là một địa hạt mà Demis đang có các thảo luận chuyên sâu với các nhà tâm lý, khoa học thần kinh (neuroscience), nhân học (human scientists) để đưa vào áp dụng một số lý thuyết mô phỏng. Cụ thể như thử nghiệm một mô hình AI hiện đại trong đó nạp cho nó kiến thức của nhân loại trước năm 1901 sau đó thử thách cỗ máy này đưa ra được lý thuyết tương đối giống như Albert Einstein.
Bức tranh AI - con người trên khiến mình liên tưởng ngay đến viễn cảnh hợp nhất "người-máy" mà Sam Altman, nhà sáng lập của OpenAI (công ty đối thủ của Demis) từng đề cập đến trong một bài viết ngắn cách đây 8 năm, thời điểm Sam chưa trở thành một biểu tượng toàn cầu (Sam hình như không tham gia hội nghị All-in trên). Bài viết này của Sam có một số viễn kiến quan trọng mà mình nghĩ ai cũng nên đọc để có góc nhìn đa chiều về AI, bên cạnh các ứng dụng hấp dẫn mà Demis giới thiệu. Cụ thể chàng trai (Sam khi đó còn trẻ) cảnh báo nhân loại về mối nguy tiềm tàng của AI cùng các vấn đề thế hệ của anh cũng là thế hệ của mình (8x) phải đối mặt: đó là hội chứng dễ dàng giận dữ, buồn bã và thường không hạnh phúc, để rồi tìm kiếm giải tỏa bằng qua những dopamine (chất kích thích) ngắn hạn, đó có thể là thuốc lá, thuốc l-ắc hay các lượt like trên mạng xã hội (dopamine thuật toán). Tông giọng trong bài viết rất khác những gì anh thể hiện trên các phương tiện truyền thông đại chúng những năm gần đây, như khi bị chất vấn trước Quốc hội Hoa Kỳ vào năm 2023, Sam một mực khẳng định: "AI được đặt trong vòng kiểm soát và được xây dựng một cách an toàn" và rằng "AI là một công cụ chứ không phải một con quái vật". Đó là dấu hiệu cho thấy Sam buộc phải hòa nhịp để đón các nguồn lực lớn toàn cầu đổ về xu hướng này và đảm bảo công chúng cảm thấy an tâm và an toàn đón nhận tương lai.
Bài do mình lược dịch dưới đây:
Hợp nhất (the Merge)
Một chủ đề phổ biến mà Silicon Valley (Thung lũng Silicon) những năm gần đây đề cập chính là sự hợp nhất giữa máy móc và con người cũng như thời điểm nào thì con người sẽ bị thay thế hay vượt qua bởi một cỗ máy AI siêu mạnh hoặc một giống loài có bộ gen cải thiện vượt trội. Đại đa số tiên đoán điều này sẽ diễn ra từ năm 2025 đến 2075. Mọi người gọi nó là "singularity" (điểm hợp nhất), hiện tại từ này có vẻ gợi lên cảm giác không thoải mái và hơi thiếu thực tế nên nhiều người còn ngại dùng. Theo tôi, lý do thực sự có lẽ bắt nguồn từ việc "singularity" ám chỉ một khoảng khắc "huy hoàng" nào đó trong tương lai mà hợp nhất đột ngột xuất hiện thay vì một quá trình diễn ra từ từ vốn rất khó để quan sát.
Tôi cho rằng hợp nhất đã diễn ra rồi và chúng ta đã sống trong tiến trình này một vài năm nay. Điện thoại đã bắt đầu kiểm soát và nói cho ta biết mình nên làm gì, thông tin ngồn ngộn trên mạng xã hội gần như quyết định cảm giác trong ngày của chúng ta, các cỗ máy tìm kiếm quyết định chúng ta nghĩ gì. Công chúng gần như sẽ không thể hiểu được cách thức tinh vi các thuật toán can thiệp vào đời sống chúng ta. Chúng tối ưu hóa những gì mà những người tạo dựng (creators) sai khiến sau hậu trường, theo cái cách khiến đa phần mọi người không thể nắm bắt chính xác điều gì thực sự diễn ra - đây chính xác là nhưng gì mà cỗ máy AI phức tạp ngày nay đang tiến hành mà tương lai chắc chắn chuyển hóa thành thứ đồ chơi cho trẻ con (ám chỉ mức độ phổ biến sau này). Chúng cực kỳ hiệu quả, ít nhất đối với tôi, thật khó có thể cưỡng lại những gì mà thuật toán muốn tôi làm. Trừ khi, tôi thực sự nỗ lực muốn phản biện hay chiến đấu với các thuật toán, rõ ràng tôi đã trở nên cực kỳ nghiện Internet. Một trong những cơn đại dịch "ngọt ngào" của thế hệ chúng tôi chính là sự tập trung chú ý (attention) cũa mình đã bị can thiệp thô bạo (hacking), tôi thấy rõ chuyển hóa này trong mình - tôi đã mất đi khoản tập trung sâu sắc mình từng có (attention span). Con cái những người bạn của tôi đa phần hoang mang không biết chúng sẽ bỏ lỡ thứ gì trên mạng (những xu hướng ngắn hạn tràn lan vô bổ). Thế hệ này trở nên dễ dàng giận dữ, buồn bã và không hạnh phúc, nhưng thay vì chuyển hóa những năng lượng tiêu cực đó vào những nỗ lực thay đổi hiện thực, thế hệ trẻ con này chỉ tìm kiếm những dopamine chất kích thích liều cao từ những lượt like hay các tung hô trên mạng.
Chúng ta đang ở trong giai đoạn cùng tiến hóa (co-evolution), AI đã ảnh hưởng, can thiệp và xâm nhập vào trong đời sống hàng ngày và chúng ta cũng đang làm những gì có thể cải thiện hạ tầng phục vụ AI. Chúng ta xây dựng thêm năng lực tính toán (computing power) qua các trung tâm dữ liệu để AI có nền tảng chạy và tìm cách tạo ra những con chip (vi xử lý) tốt hơn. Điều này gần như không thể ngừng lại. Chúng ta đã khắc sâu bài học lịch sử, các tiến bộ khoa học chắc chắn sẽ xảy ra miễn là không đi ngược các quy luật vật lý (laws of physics).
Điều quan trọng hơn cả, nếu chúng ta không làm gì ngu ngốc tự hủy diệt chính mình thì chắc chắn siêu nhân AI (superhuman AI) sẽ hình thành, can thiệp cải thiện gen sẽ diễn ra, các giao tiếp kết nối não người với máy sẽ xuất hiện (brain-machine interfaces). Nếu bám vào niềm tin rằng những thứ thông minh hơn con người không bao giờ có thể được tạo ra thì đó là một sự thất bại của trí tượng con người hay nói cách khác chúng ta đang có một thái độ thờ ơ ngạo mạn. Con người luôn có niềm kiêu hãnh lớn về trí thông minh của mình, một thứ gì đó độc nhất vô nhị trên quả đất, cao hơn tất cả các giống loài khác. Có lẽ hệ thống AI khi đủ thông minh cũng sẽ cảm thấy như vậy và bắt đầu so sánh những khác biệt giữa bản thân mình và con người "tinh tinh" để bắt đầu tính toán các nước đi tiếp theo.
Hợp nhất có thể diễn ra dưới nhiều hình thức, kiểu như chúng ta có thể cắm các điện cực (electrodes) vào bộ não hay trở thành những người bạn rất thân của các chatbot. Đối với tôi, hợp nhất chính là viễn cảnh tốt đẹp nhất cho nhân loại, thử tưởng tượng xem hai giống loài khác nhau (người và máy) đều muốn cùng một thứ thì trước sau gì mâu thuẫn cũng diễn ra, hai phe đấu nhau và phe thắng sẽ thống trị hành tinh. Chúng ta chỉ nên có một phe nơi tất cả các thành viên trong đó đều chăm sóc cho nhau.
Hợp nhất đã xảy ra từ từ rồi và tiến trình này trông sẽ ngày càng lạ lùng trong mắt chúng ta. Rất có thể, chúng ta sẽ là giống loài đầu tiên có thể thiết kế luôn những hậu duệ (descendants) của mình trông như thế nào. Tôi đoán chúng ta sẽ trở thành làm nền khởi động sinh học (biological bootloader) của trí tuệ số (digital intelligence) và biết đâu có thể chìm dần trong một nhánh nào đó của cây tiến hóa (mờ nhạt trong tiến trình tiến đến trí tuệ tối thượng mà hợp nhất người-máy thống trị chăng). Rõ ràng, nhân loại phải ngồi xuống suy tư nghiêm túc xem quá trình hợp nhất thành công trông như thế nào.
Có vẻ như hợp nhất sẽ diễn ra sớm hơn đại đa số mọi người nghĩ. Phần cứng đang được cải thiện với tốc độ thần tốc - điều ngạc nhiên nhất mà tôi khám phá ra khi làm việc trong dự án OpenAI chính là mối quan hệ tương hỗ giữa sức mạnh tính toán và các phát kiến AI cùng số lượng gia tăng chóng những con người thông minh nhất mong muốn làm việc trong địa hạt AI. Tất cả đều cộng hưởng để tiến trình này diễn ra nhanh đến kinh ngạc. Thế giới tốt nhất là nên xem xét điều này một cách nghiêm túc đồng thời thúc đẩy quá trình điều phối diễn tiến này ở mọi ngóc ngách khác nhau trên thế giới (worldwide coordination).
PS:
Nói thêm về All-in-Podcast, đây là một trong những podcast quyền lực nhất thung lũng Silicon được sáng lập bởi bốn nhà đầu tư mạo hiểm vốn là bạn chơi poker với nhau (venture capotalist): Chamath Palihapitiya, Jason Calacanis, David Sacks và David Friedberg. Đây là nền tảng chuyên thảo luận về các xu hướng thị trường, các vấn đề chính trị cũng như các góc nhìn chuyên sâu trong ngành (công nghệ). David Sacks, GP quỹ Craft Venture, là thành viên của nhóm PayPal Mafia sừng sỏ, người đồng hành cùng Peter Thiel, Max Levchin và Luke Nosek trong quá trình xây dựng nền tảng thương mại điện tử sơ khởi Confinity mà sau này chuyển hóa thành PayPal. Sacks cũng là người đứng đằng sau Geni.com, nền tảng phả hệ các gia tộc đã hỗ trợ mình rất nhiều trong việc nghiên cứu và hệ thống hóa lại các dòng chảy lịch sử tư tưởng và nguồn lực của nhân loại.
Comments ()