
Hội thảo trực tuyến “Trí tuệ Nhân tạo và các Ứng dụng – Artificial Intelligence and Its applications” đã được tổ chức thành công với 34 người tham dự, bao gồm sinh viên, kỹ sư, nghiên cứu sinh, nghiên cứu viên sau tiến sĩ, giảng viên trong lĩnh vực AI và các lĩnh vực liên quan, trên nền tảng Ms Teams và thu hút gần 500 lượt theo dõi qua Fanpage của VNEAT. Hội thảo tập trung vào 3 chủ đề: “Cuộc phiêu lưu Trí tuệ Nhân tạo: Khám phá nghề nghiệp trong tương lai”, “Tai và mắt của AI: Xây dựng mô hình Ngôn ngữ Thị giác tiên tiến”, và “Cầu nối giữa nghiên cứu và công nghiệp: Nền tảng chuyển đổi sức khoẻ số”, với sự đóng góp của ba chuyên gia hàng đầu trong lĩnh vực AI: NCS. Mai Tấn Hà từ Đại học Quốc gia Đài Loan, Phó giáo sư Lê Thị Phượng từ Đại học Công giáo Phụ Nhân, và Phó giáo sư Nguyễn Phùng Anh từ Đại học Y Đài Bắc.
Dưới đây là bài học suy ngẫm và tóm tắt nội dung quý giá mà VNEAT đã rút ra sau buổi Hội thảo, nhằm chia sẻ với những độc giả quan tâm đến công nghệ AI và cũng là một sự tri sâu sắc đến sự đóng góp nhiệt tình của các diễn giả.
1. Cuộc phiêu lưu Trí tuệ Nhân tạo (AI): Khám phá nghề nghiệp trong tương lai
Trí tuệ Nhân tạo là một lĩnh vực của khoa học máy tính nhằm tạo ra các hệ thống có khả năng tự học, tự cải thiện và thực hiện các nhiệm vụ mà trước đây chỉ có con người mới có thể thực hiện được (Hình 1). Với sự phát triển nhanh chóng của công nghệ và khả năng ứng dụng rộng rãi, AI đang trở thành một trong những trọng tâm của cuộc cách mạng công nghệ hiện đại, đem lại tiềm năng lớn cho sự tiến bộ và cải thiện chất lượng cuộc sống của con người.

Hệ thống máy tính được lập trình để tự động phân tích dữ liệu, nhận biết mẫu, và tạo ra các quyết định dựa trên những phân tích đó. Các phương pháp tiên tiến trong AI bao gồm học máy (machine learning), mạng nơ-ron nhân tạo (artificial neural networks) (Hình 2), và xử lý ngôn ngữ tự nhiên (natural language processing), giúp máy tính có khả năng hiểu và tương tác với con người thông qua ngôn ngữ tự nhiên. Sự phát triển của các công nghệ như “Deep Learning” đã thúc đẩy sự phát triển của AI, mang lại những tiến bộ đáng kể trong các ứng dụng thực tiễn như xe tự lái, chẩn đoán y khoa, dịch thuật tự động, và nhiều lĩnh vực khác.

Trí tuệ Nhân tạo (AI) đang phát triển mạnh mẽ và trở thành một trong những lĩnh vực công nghệ quan trọng nhất trong tương lai. Xu hướng phát triển của AI được dự đoán sẽ tập trung vào ba lĩnh vực chính: tự động hóa, tương tác người-máy, và học máy (Hình 3).

Thay đổi cấu trúc nghề nghiệp
Công nghệ Trí tuệ Nhân tạo đang dần thay đổi cách thức hoạt động của nhiều ngành nghề truyền thống, đặc biệt là những lĩnh vực có tính lặp lại cao và dựa vào công việc cơ bản như nhập liệu dữ liệu, xử lý hóa đơn, và kiểm tra hàng hóa. Các ngành như sản xuất, dịch vụ khách hàng, và kế toán đang phải đối mặt với nguy cơ bị thay thế bởi tự động hóa và máy học. Theo dự báo, đến năm 2030 tự động hóa sẽ làm biến mất khoảng 73 triệu việc làm tại Mỹ (Hình 4). Ngoài ra, các lĩnh vực như tài chính, y tế và giáo dục cũng đang chứng kiến sự gia tăng của các giải pháp AI, có thể ảnh hưởng đến công việc của những người làm trong các ngành này.
Công nghệ Trí tuệ Nhân tạo có thể hỗ trợ trong việc tìm kiếm thông tin và đưa ra các giải pháp hoặc lựa chọn cho các vấn đề cụ thể, nhưng vẫn cần con người đưa ra quyết định cuối cùng. AI cũng cần sự sáng tạo và can thiệp của con người để đối phó với các tình huống mới, không xác định. Sự kết hợp giữa khả năng tự động hoá của công nghệ AI và tính sáng tạo của con người có thể tạo ra một môi trường làm việc tối ưu nhất.

Các rủi ro đối với người dùng AI, đặc biệt là học sinh, sinh viên
Sự phụ thuộc quá mức vào công nghệ có thể dẫn đến mất khả năng tư duy sáng tạo và khả năng tự giải quyết vấn đề, thiếu kỹ năng xã hội và rủi ro an ninh thông tin. Để giảm thiểu những rủi ro này, cần có sự giám sát và hướng dẫn từ giáo viên và phụ huynh, rèn luyện kỹ năng tự quản lý và ý thức về an ninh thông tin cho học sinh.
Công nghệ AI sẽ tạo ra khoảng cách ngày càng lớn giữa những người có kỹ năng sử dụng công nghệ và những người không có, nên học sinh cần được hướng dẫn tiếp cận công nghệ sớm hơn nhưng cần có kiểm soát. Phụ huynh và giáo viên cần huấn luyện học sinh hình thành ý thức tự học, biết chọn lọc thông tin, sẵn sàng tiếp thu và hướng đến làm chủ các công nghệ mới.
Trong xã hội hiện nay nhiều người bị cuốn hút vào những video và nhiều nội dung nhảm nhí trên các nền tảng mạng xã hội. Các nội dung này mang tính giải trí, dễ gây nghiện nhưng không mang lại nhiều giá trị. Đây là một hiện tượng xã hội đáng báo động, hệ quả là một bộ phận ngày càng lớn người dùng sẽ bị dẫn dắt, theo dõi, đánh cắp thông tin, mất đi thời gian dành cho gia đình, cho học tập, dần trở thành những người không có giá trị, thậm chí trở thành “nô lệ” của công nghệ hoặc của những người tạo ra các nội dung đó.
Các kiến thức và kỹ năng cần có cho giới trẻ để thích ứng và phát triển trong thời đại AI
Để thành công trong môi trường công nghệ AI và số hóa, thế hệ trẻ cần phát triển một số kỹ năng quan trọng sau đây. Thứ nhất, cần có tư duy sáng tạo, cần rèn luyện kỹ năng ra quyết định và quản lý thời gian. Thứ hai, thành thạo sử dụng công nghệ và các công cụ kỹ thuật số, bao gồm các phần mềm, ứng dụng, các nền tảng học trực tuyến, cũng như có kỹ năng lập trình cơ bản. Thứ 3, rèn luyện ý thức học tập tự chủ và liên tục cập nhật kiến thức mới là điều vô cùng quan trọng để thích nghi với sự thay đổi nhanh chóng của môi trường công nghệ. Thứ 4, khả năng giao tiếp và làm việc nhóm cũng cần được phát triển để giải quyết xung đột trong môi trường làm việc và xã hội. Thứ 5, ý thức cao về việc kiểm tra kết quả, bằng cách tự kiểm nghiệm, đối chiếu và so sánh thông tin, đặc biệt nắm chắc nguồn gốc thông tin. Cuối cùng, hiểu rõ về quyền riêng tư và đạo đức trong việc sử dụng dữ liệu và công nghệ AI.
2. Xây dựng Mô hình Ngôn ngữ Thị giác tiên tiến
Trong bối cảnh phát triển của trí thông minh nhân tạo, các mô hình Ngôn ngữ-Thị giác (Vision-Language Models) [VLMs] là đại diện cho sự giao thoa tiên tiến giữa thị giác máy tính và xử lý ngôn ngữ tự nhiên. Các mô hình được thiết kế để nhận diện, hiểu và xử lý thông tin dựa trên cả hình ảnh và ngôn ngữ, cho phép máy thực hiện một số nhiệm vụ thay thế con người. VLMs có khả năng diễn giải thế giới xung quanh thông qua hình ảnh và ngôn ngữ, giống như cách chúng ta nhìn và hiểu thế giới xung quanh mình.
Ứng dụng của VLMs là rất đa dạng, Chat GPT là một ứng dụng xây dựng dựa trên VLMs. VLMs có thể thiết kế để tự động trả lời các câu hỏi, giải bài toán, chú thích hình ảnh, viết thơ, viết các bài quảng cáo. Ngoài ra, có thể ứng dụng để phát hiện hành vi và hành động trong video/ảnh, thậm chí phát hiện các bất thường và đe dọa trong môi trường an ninh. Trong lĩnh vực y tế, VLMs cũng có thể được sử dụng để giúp chẩn đoán các bệnh lý bằng cách liên kết hình ảnh y tế với các báo cáo lâm sàng, do đó nâng cao độ chính xác và hiệu quả của chẩn đoán. VMLs hỗ trợ tăng cường trải nghiệm người dùng thông qua nhiều ứng dụng khác trong giáo dục, nông nghiệp, vv. (Hình 5). Hơn nữa, sự kết hợp giữa ngôn ngữ và hình ảnh đã mở ra những hướng mới trong nghiên cứu AI, thúc đẩy tiến bộ trong kiến trúc mô hình và kỹ thuật đào tạo. Các mô hình như CLIP (Contrastive Language-Image Pre-training) của OpenAI và ViLT (Vision-and-Language Transformer) của Google là những bước đột phá minh chứng sử dụng các bộ dữ liệu quy mô lớn và kiến trúc mạng nơ-ron sáng tạo để đạt được kết quả ấn tượng.

Thiết kế VLMs
Cơ chế để thiết kế VLMs đòi hỏi sự tích hợp của các công nghệ thị giác máy tính và xử lý ngôn ngữ tự nhiên, cho phép diễn giải đồng thời dữ liệu hình ảnh và văn bản. Kiến trúc thường bắt đầu với các con đường xử lý riêng biệt: sử dụng các mạng nơ-ron tích chập (CNNs) hoặc bộ biến đổi hình ảnh (ViTs) để phân tích các đầu vào hình ảnh, trích xuất các đặc điểm phức tạp như kết cấu và đối tượng từ hình ảnh. Đồng thời, các đầu vào văn bản được xử lý thông qua các mô hình ngôn ngữ tự nhiên, thường sử dụng các bộ biến đổi để chuyển đổi văn bản thành các mạng chuyển ngữ nghĩa. Trong thiết kế VLMs là sự hợp nhất các đặc điểm ở giai đoạn đầu, cho phép mô hình học các tương tác giữa các chế độ ngay từ đầu, trong khi đó cho phép các kết nối sau đó ở một lớp sâu hơn giúp xử lý độc lập bằng các phương pháp đặc thù cho từng chế độ trước khi tích hợp. Các phương pháp tiên tiến hơn bao gồm các cơ chế chú ý chéo chế độ trong khuôn khổ bộ biến đổi, nâng cao khả năng của mô hình tập trung vào các phân đoạn dữ liệu liên quan từ mỗi chế độ, cải thiện tính nhất quán và liên quan của các đầu ra mô hình. Các thành phần của VLM thường được tiền huấn luyện trên các tập dữ liệu lớn để thu thập một loạt các đặc điểm trước khi được tinh chỉnh trên các nhiệm vụ ngôn ngữ-hình ảnh. Các chiến lược đào tạo như học tương phản, nơi mô hình học cách sắp xếp chặt chẽ các cặp hình ảnh-văn bản phù hợp, và đào tạo chung, tối ưu hóa một hàm mục tiêu kết hợp trên cả hai chế độ, là rất quan trọng. Sau khi đào tạo ban đầu, các mô hình này thường được tinh chỉnh trên các nhiệm vụ cụ thể như chú thích hình ảnh hoặc trả lời câu hỏi hình ảnh để tinh chỉnh khả năng của chúng, làm cho VLMs trở nên hiệu quả cao đối với nhiều ứng dụng đòi hỏi sự hiểu biết đa chế độ tinh vi. Hiệu quả của VLMs được đánh giá dựa trên nhiều tiêu chuẩn khác nhau, MMMU là một tiêu chuẩn mới được thiết kế gần đây để đánh giá hiệu quả của VLMs (Hình 5).
Các tập dữ liệu huấn luyện điển hình cho VLMs
Tập dữ liệu huấn luyện là trụ cột của việc phát triển Mô hình Ngôn ngữ Thị giác, cung cấp cho chúng những ví dụ cụ thể để học. Thông qua việc tiếp xúc với hàng triệu hình ảnh và video được gắn nhãn, VLMs có thể phát triển kỹ năng nhận dạng và phân loại các đối tượng, cảnh quan và hoạt động. Từ những tập dữ liệu phổ biến như ImageNet, Visual Genome, COCO đến những bộ dữ liệu chuyên biệt như Cityscapes và ADE20K, các VLMs có thể học từ đa dạng các đối tượng, cảnh quan và hoạt động, từ đó nâng cao khả năng hiểu và xử lý thông tin từ hình ảnh và video (Hình 6).

3. Cầu nối giữa nghiên cứu và công nghiệp: Nền tảng chuyển đổi sức khỏe số
Trí tuệ Nhân tạo đã mang đến những cơ hội mới trong việc cải thiện chăm sóc sức khỏe và đổi mới y tế. Tích hợp AI trong y tế không chỉ mở ra khả năng chẩn đoán và điều trị nhanh chóng và chính xác hơn, mà còn giúp tối ưu hóa quản lý bệnh tật, dự báo dịch bệnh, và tăng cường hiệu quả của các quy trình y tế. Bằng việc kết hợp sức mạnh của dữ liệu lớn, học máy và các công nghệ tiên tiến khác, AI sẽ mở ra một tương lai của y tế cá nhân hóa, hiệu quả hơn và phù hợp hơn với nhu cầu của từng bệnh nhân.
Y học chính xác: Ứng dụng AI trong ngành y tế
Sai sót y khoa (Medical error) là những sai sót xảy ra trong quá trình chăm sóc sức khỏe, gây ra sự tổn thất hoặc nguy hại cho bệnh nhân. Đây có thể là kết quả của nhiều yếu tố, bao gồm nhưng không giới hạn trong việc chẩn đoán sai, sai sót trong quản lý thuốc, phẫu thuật không chính xác, hoặc không tuân thủ quy trình y tế đúng cách. Makary và nnk. (2016) đã chỉ ra số bệnh nhân chết do sai sót y khoa cao thứ 3 trong lĩnh vực y tế tại Mỹ vào năm 2016 (Hình 7).

Y học chính xác (Precision Medicine) là phương pháp y học cá nhân hóa, tập trung vào việc đưa ra quyết định điều trị và cải thiện sức khỏe dựa trên thông tin cá nhân hóa của từng bệnh nhân. Thay vì áp dụng một phương pháp điều trị chuẩn cho tất cả mọi người, y học chính xác sử dụng thông tin về di truyền, môi trường sống và lối sống cá nhân để tùy chỉnh điều trị cho từng người. Điều này giúp tối ưu hóa hiệu quả điều trị, giảm thiểu tác dụng phụ và cải thiện chất lượng cuộc sống của bệnh nhân (Hình 8A).
PGS. Nguyễn Phùng Anh và nhóm nghiên cứu đã có những công trình nghiên cứu ứng dụng các công nghệ AI trong xử lý các vấn đề sai sót y khoa (Hình 8B, Huang và nnk., 2019; Nguyễn và nnk., 2013), chẩn đoán ung thư sớm (Hình 8C, Li và nnk., 2022), và xây dựng nền tảng chuyển đổi sức khoẻ số (Hình 8D).

Dữ liệu huấn luyện AI trong lĩnh vực y tế
Dữ liệu huấn luyện cho công nghệ AI trong lĩnh vực y tế mang tính chất đặc thù. Dữ liệu cần phải đa dạng, đầy đủ và chính xác, bao gồm một loạt các thông tin về sức khỏe từ nhiều nguồn khác nhau như hồ sơ bệnh án, hình ảnh y khoa, kết quả xét nghiệm và thông tin di truyền. Ngoài ra, tính bảo mật và đối xứng của dữ liệu cũng cần được đảm bảo để đảm bảo tính riêng tư của bệnh nhân và đại diện cho đủ các nhóm dân số. Các tập dữ liệu cần được chuẩn bị và chẩn đoán đúng bởi các chuyên gia y tế để đảm bảo tính chính xác và đáng tin cậy của thông tin, từ đó giúp tăng cường hiệu suất và độ chính xác của các ứng dụng AI trong việc chẩn đoán, dự báo và điều trị bệnh tật.
Khởi nghiệp AI y tế
Tự động hóa và ứng dụng trí tuệ nhân tạo trong lĩnh vực y tế không chỉ mở ra những cơ hội lớn mà còn mang lại sự đổi mới và tiến bộ trong cách chăm sóc sức khỏe. Những công nghệ này không chỉ giúp tối ưu hóa quy trình y tế, tăng cường chẩn đoán và điều trị bệnh tật mà còn mang lại những giải pháp cá nhân hóa và hiệu quả hơn cho bệnh nhân.
Công nghệ trí tuệ nhân tạo mang lại nhiều tiềm năng, nhưng cũng đặt ra nhiều thách thức. Dữ liệu y tế phức tạp và không đồng nhất gây khó khăn trong việc xử lý và bảo mật thông tin. Các sản phẩm AI phải tuân thủ các quy định và quy trình phê duyệt nghiêm ngặt. Xây dựng mối quan hệ với các tổ chức y tế và thu hút tài chính đòi hỏi nỗ lực và sự bền bỉ. Hành trình từ nghiên cứu công nghệ AI trong y tế đến sản phẩm công nghiệp cần sự kết nối, tin tưởng và hợp tác của các chuyên gia, y-bác sĩ, trung tâm nghiên cứu, bệnh viện, sự tham gia của bệnh nhân và sự ủng hộ của các cơ quan quản lý nhà nước (Hình 8D, 9).
Các diễn giả cũng như Hội chuyên gia Việt Nam tại Đài Loan rất sẵn sàng kết nối và hợp tác với các đơn vị, cá nhân có cùng mối quan tâm với các nghiên cứu và ứng dụng AI liên quan đến các chủ đề đã chia sẻ trong buổi hội thảo. VNEAT rất mong nhận được sự hưởng ứng và đóng góp ý kiến của các bạn độc giả, các chuyên gia trong và ngoài nước để cùng kết nối và hợp tác xây dựng những chương trình thực sự ý nghĩa cho cộng đồng trong tương lai.

Lời cảm ơn
VNEAT chân thành cảm ơn diễn giả, các thành viên trong ban tổ chức VNEAT, sự đồng hành của Trung tâm nghiên cứu và Phát triển hội nhập khoa học và công nghệ quốc tế (VISTIP) – Bộ KHCN và cộng đồng người Việt Nam ở trong và ngoài nước đã tham dự và đóng góp ý kiến cho buổi hội thảo này được thành công tốt đẹp.
VNEAT xin đặc biệt cảm ơn sự quan tâm và ủng hộ của Văn phòng Kinh tế và Văn hoá Việt Nam tại Đài Bắc, sự đồng hành của các nhà tài trợ BIDV, Vietnam Airlines, IET Taipei Local Network, SYM, VNEX, VIVUDIDU… trong thời gian vừa qua.
VNEAT sẽ tổ chức nhiều chương trình mang nhiều giá trị đến cho cộng đồng người Việt Nam, đặc biệt hướng đến các bạn học sinh, sinh viên đang phân vân trong việc lựa chọn ngành nghề, các bạn kỹ sư trẻ còn đang mông lung trên con đường phát triển sự nghiệp, các cá nhân, doanh nghiệp đang muốn thúc đẩy hợp tác và chuyển giao công nghệ.
Tham khảo
Huang, C.Y., Nguyen, P.A., Yang, H.C., Islam, M.M., Liang, C.W., Lee, F.P. and Li, Y.C.J., 2019. A probabilistic model for reducing medication errors: A sensitivity analysis using electronic health records data. Computer Methods and Programs in Biomedicine, 170, pp.31-38.
Le, T.P., 2024. Eyes and Ears of AI: Building Advanced Vision-Language Model. Science and Technology Talking, Vietnamese Experts Association in Taiwan (VNEAT), No. 1, April 20th, 2024.
Li, Y.C., Hsuan-Chia, Y.A.N.G., Huang, C.W., Nguyen, P.A. and Liang, C.W., Taipei Medical University TMU, 2022. Computer-implemented method and computing device for predicting cancer. U.S. Patent Application 17/001,463.
Mai, T.H., 2024. The AI adventure: Exploring Tomorrow’s Jobs. Science and Technology Talking, Vietnamese Experts Association in Taiwan (VNEAT), No. 1, April 20th, 2024.
Makary, M.A. and Daniel, M., 2016. Medical error—the third leading cause of death in the US. Bmj, 353.
Nguyen, P.A., 2024. Bridging the Gaps between Academic and Industry: The Digital Health Translation (DHT) Platform. Science and Technology Talking, Vietnamese Experts Association in Taiwan (VNEAT), No. 1, April 20th, 2024.
Nguyen, P.A., Syed-Abdul, S., Iqbal, U., Hsu, M.H., Huang, C.L., Li, H.C., Clinciu, D.L., Jian, W.S. and Li, Y.C.J., 2013. A probabilistic model for reducing medication errors. PloS one, 8(12), p.e82401.
OpenAI. (2024). ChatGPT (3.5) [Large language model]. https://chat.openai.com