Chúng tôi đã hỏi ChatGPT và Google những câu hỏi giống nhau về bệnh ung thư. Đây là những gì chúng trả lời


Thực hiện bởi tiến sĩ Ashley M Hopkins – trưởng phòng nghiên cứu dịch tễ ung thư lâm sàng, Đại học Flinders, Úc

Gần đây bạn có thể đã nghe nhiều về ChatGPT, một loại chatbot sử dụng trí tuệ nhân tạo (AI) để viết luận, biến những người mới sử dụng máy tính thành lập trình viên và giúp mọi người giao tiếp.

ChatGPT cũng có thể đóng vai trò giúp mọi người hiểu thêm thông tin về y tế.

Mặc dù ChatGPT sẽ không sớm thay thế việc nói chuyện với bác sĩ của bạn, nhưng nghiên cứu mới của chúng tôi cho thấy tiềm năng của ChatGPT trong việc trả lời các câu hỏi thường gặp về bệnh ung thư.

Đây là những gì chúng tôi tìm thấy khi đặt câu hỏi tương tự cho ChatGPT và Google. Bạn có thể ngạc nhiên bởi kết quả của chúng.

ChatGPT có liên quan gì đến sức khỏe?

ChatGPT đã được đào tạo về lượng dữ liệu văn bản khổng lồ để tạo phản hồi đàm thoại cho các truy vấn dựa trên văn bản.

ChatGPT đại diện cho một kỷ nguyên mới của công nghệ AI, sẽ được kết hợp với các công cụ tìm kiếm, bao gồm Google và Bing, để thay đổi cách chúng ta điều hướng thông tin trực tuyến. Điều này bao gồm cách chúng tôi tìm kiếm thông tin sức khỏe.

Chẳng hạn, bạn có thể hỏi ChatGPT những câu hỏi như “Bệnh ung thư nào phổ biến nhất?” hoặc “Bạn có thể viết cho tôi một bản tóm tắt bằng tiếng Anh đơn giản về các triệu chứng ung thư phổ biến mà bạn không nên bỏ qua”. Nó tạo ra những câu trả lời trôi chảy và mạch lạc. Nhưng những câu trả lời của chúng có đúng hay không?

Chúng tôi đã so sánh ChatGPT với Google

Nghiên cứu mới được công bố của chúng tôi đã so sánh cách ChatGPT và Google trả lời các câu hỏi phổ biến về ung thư.

Chúng bao gồm những câu hỏi đơn giản dựa trên thực tế như “Ung thư chính xác là gì?” và “Các loại ung thư phổ biến nhất là gì?”. Ngoài ra còn có những câu hỏi phức tạp hơn về các triệu chứng ung thư, tiên lượng (tình trạng bệnh có khả năng tiến triển như thế nào) và tác dụng phụ của điều trị.

Đối với các truy vấn đơn giản dựa trên thực tế, ChatGPT đã cung cấp các câu trả lời ngắn gọn có chất lượng tương tự như đoạn trích tính năng của Google. Đoạn mã tính năng là “câu trả lời” mà thuật toán của Google nêu bật ở đầu trang.

Mặc dù có những điểm tương đồng, nhưng cũng có những khác biệt lớn giữa các câu trả lời của ChatGPT và Google. Google đã cung cấp các tham chiếu dễ thấy (liên kết đến các trang web khác) cùng với các câu trả lời của nó. ChatGPT đã đưa ra các câu trả lời khác nhau khi được hỏi nhiều lần cùng một câu hỏi.

Ho có phải là dấu hiệu ung thư phổi? (Shutterstock)

Chúng tôi cũng đánh giá câu hỏi phức tạp hơn một chút: “Ho có phải là dấu hiệu của ung thư phổi không?”.

Đoạn trích đặc trưng của Google chỉ ra rằng ho không biến mất sau ba tuần là triệu chứng chính của bệnh ung thư phổi.

Nhưng ChatGPT đã đưa ra nhiều phản hồi sắc thái hơn. Nó cho thấy ho lâu ngày là triệu chứng của ung thư phổi. Nó cũng làm rõ rằng ho là một triệu chứng của nhiều bệnh và cần phải có bác sĩ để được chẩn đoán chính xác.

Nhóm lâm sàng của chúng tôi nghĩ rằng những lời giải thích rõ ràng này rất quan trọng. Chúng không chỉ giảm thiểu khả năng cung cấp thông tin không đầy đủ mà còn cung cấp cho người dùng hướng dẫn rõ ràng về các hành động cần thực hiện tiếp theo – gặp bác sĩ.

Làm thế nào về những câu hỏi thậm chí phức tạp hơn?

Sau đó, chúng tôi đặt một câu hỏi về tác dụng phụ của một loại thuốc điều trị ung thư cụ thể: “Pembrolizumab có gây sốt không và tôi có nên đến bệnh viện không?”.

Chúng tôi đã hỏi ChatGPT điều này năm lần và nhận được năm câu trả lời khác nhau. Điều này là do tính ngẫu nhiên được tích hợp trong ChatGPT, có thể giúp giao tiếp theo cách gần giống con người nhưng sẽ đưa ra nhiều câu trả lời cho cùng một câu hỏi.

Tất cả năm câu trả lời đề nghị nói chuyện với một chuyên gia chăm sóc sức khỏe. Nhưng không phải tất cả đều nói rằng đây là trường hợp khẩn cấp hoặc xác định rõ ràng mức độ nghiêm trọng của tác dụng phụ này. Một phản hồi cho biết sốt không phải là tác dụng phụ phổ biến nhưng không nói rõ ràng là nó có thể xảy ra.

Nhìn chung, chúng tôi đã xếp loại chất lượng phản hồi từ ChatGPT cho câu hỏi này là kém.

Pembrolizumab có gây sốt không và tôi có nên đến bệnh viện không? (Shutterstock)

Điều này trái ngược với Google, vốn không tạo đoạn trích nổi bật, có thể là do sự phức tạp của câu hỏi.

Thay vào đó, Google dựa vào người dùng để tìm thông tin cần thiết. Liên kết đầu tiên hướng họ đến trang web sản phẩm của nhà sản xuất. Nguồn này chỉ rõ rằng mọi người nên tìm kiếm sự chăm sóc y tế ngay lập tức nếu bị sốt với pembrolizumab.

Tiếp theo là gì?

Chúng tôi đã chỉ ra rằng ChatGPT không phải lúc nào cũng cung cấp các tham chiếu rõ ràng cho các phản hồi của nó. Nó đưa ra các câu trả lời khác nhau cho một truy vấn nhất định và nó không được cập nhật theo thời gian thực. Nó cũng có thể tạo ra những câu trả lời không chính xác theo cách nghe có vẻ tự tin.

Chatbot mới của Bing, khác với ChatGPT và đã được phát hành kể từ nghiên cứu của chúng tôi, có quy trình rõ ràng và đáng tin cậy hơn nhiều để phác thảo các nguồn tham khảo và nhằm mục đích cập nhật thông tin mới nhất có thể. Điều này cho thấy loại công nghệ AI này đang phát triển nhanh như thế nào và sự sẵn có của các chatbot AI tiên tiến hơn có khả năng tăng lên đáng kể.

Tuy nhiên, trong tương lai, bất kỳ AI nào được sử dụng làm trợ lý ảo chăm sóc sức khỏe sẽ cần có khả năng truyền đạt bất kỳ sự không chắc chắn nào về các câu trả lời của nó cho những câu hỏi phù hợp với tình huống thay vì cố tạo ra một câu trả lời không chính xác và luôn tự tin rằng các câu trả lời đó là đáng tin cậy.

Chúng ta cần phát triển các tiêu chuẩn chất lượng tối thiểu cho các can thiệp của AI trong chăm sóc sức khỏe. Điều này bao gồm đảm bảo chúng tạo ra thông tin dựa trên bằng chứng.

Chúng ta cũng cần đánh giá cách triển khai trợ lý ảo AI để đảm bảo chúng cải thiện sức khỏe của mọi người và không gây ra bất kỳ hậu quả không mong muốn nào.

Cũng có khả năng các trợ lý AI tập trung vào y tế sẽ đắt đỏ, điều này đặt ra câu hỏi về tính công bằng và ai có quyền truy cập vào các công nghệ đang phát triển nhanh chóng này.

Cuối cùng, các chuyên gia chăm sóc sức khỏe cần nhận thức được những đổi mới AI như vậy để có thể thảo luận về những hạn chế của chúng với bệnh nhân.

Nguồn: The Conversation.


Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *