
Các chuyên gia trong lĩnh vực dữ liệu chia sẻ tại tọa đàm.
Trong bối cảnh dữ liệu ngày càng trở thành nguồn tài nguyên chiến lược, tư liệu sản xuất chính, đóng vai trò then chốt trong tiến trình phát triển kinh tế số và chuyển đổi số quốc gia, việc nâng cao năng lực phân tích, xử lý và quản trị dữ liệu là yêu cầu cấp thiết đối với mọi tổ chức, doanh nghiệp và cá nhân.
Theo báo cáo của IDC, hiện có khoảng 175 Zettabyte (175 tỷ Terabytes) dữ liệu được sinh ra, trong đó 80% là dữ liệu phi cấu trúc (hình ảnh, văn bản, email, video…). Ước tính 7,8 tỷ người phải mất 600 năm để đọc hết lượng dữ liệu nếu là văn bản, hoặc mất 7 tháng liên tục để xem hết lượng dữ liệu trên nếu là video.
Chia sẻ tại Tọa đàm “Xử lý và phân tích dữ liệu - Động lực cho chuyển đổi số quốc gia” do Hiệp hội Dữ liệu quốc gia tổ chức ngày 28/5, bà Hạnh Phạm, Giám đốc Dữ liệu, Khoa học dữ liệu người dùng tại Pinterest, thành viên Mạng lưới Đổi mới sáng tạo Việt Nam, con số này cho thấy, nếu không có giải pháp xử lý hiệu quả, khối lượng “thô” ấy sẽ chỉ gây lãng phí tài nguyên và làm chậm tiến độ chuyển đổi số.
Trong thời đại hiện nay, khi dữ liệu được đánh giá là “tài nguyên mới” thì câu chuyện nền kinh tế dữ liệu đang nổi lên như một động lực then chốt trong việc định hình thế giới. Nền kinh tế dữ liệu đang mở ra tương lai của việc tạo ra giá trị dựa trên thông tin. Nền kinh tế mới này được hỗ trợ bởi lượng dữ liệu khổng lồ tạo ra hàng ngày, không chỉ định nghĩa lại các ngành công nghiệp truyền thống mà còn tạo ra các thị trường và cơ hội mới.
Chính vì vậy, việc xây dựng nền tảng tái cấu trúc dữ liệu và công cụ phân tích thông minh không chỉ cải thiện năng lực quản trị mà còn là chìa khóa để khai thác triệt để giá trị ẩn chứa bên trong.
Chia sẻ kinh nghiệm trên cương vị từng là Trưởng ban Khoa học dữ liệu bán hàng, Bộ phận Thông tin và Phân tích trung tâm, Khoa học dữ liệu tăng trưởng tại Tập đoàn công nghệ AirBnB (Hoa Kỳ), bà Hạnh Phạm cho biết, nhờ khai thác hiệu quả dữ liệu lịch đặt phòng, AirBnB đã cải tiến thuật toán gợi ý, ưu tiên hiển thị các căn hộ có lịch trống phù hợp, qua đó giúp tăng 4% tỷ lệ đặt phòng thành công. "Đây là con số lớn với một nền tảng có doanh thu hàng tỷ USD", bà nói.
Bà Đặng Thị Ánh Tuyết, CEO sáng lập CTCP MedCAT cho biết, để chuyển đổi khối lượng dữ liệu khổng lồ từ trạng thái “thô” thành tài nguyên có cấu trúc, các tổ chức thường sử dụng OCR truyền thống: Giúp số hóa văn bản từ ảnh, PDF; Key Information Extraction (KIE): Trích xuất thông tin quan trọng từ các tài liệu phi cấu trúc; Chuẩn hóa dữ liệu: Đồng bộ định dạng, đơn vị, cấu trúc trường dữ liệu. Tích hợp dữ liệu lịch sử: Kết nối nhiều nguồn, tạo nên một kho dữ liệu thống nhất.
Theo bà Tuyết, mỗi phương pháp đều đóng góp vào việc xây dựng “dữ liệu cho AI” và "dữ liệu cho quản trị”, hai loại dữ liệu không thể thiếu trong kỷ nguyên kinh tế số.
![]() |
Thiếu tá Đào Đức Triệu, Tổng thư ký Hiệp hội Dữ liệu quốc gia chia sẻ tại tọa đàm. |
Giới thiệu về ứng dụng trí tuệ nhân tạo (AI) trong xử lý dữ liệu trong ngành y tế, chăm sóc sức khỏe, CEO của MedCAT khẳng định, ứng dụng AI xử lý dữ liệu trong y tế từng là giấc mơ của con người nhưng nay đang dần được hiện thực hóa, mang đến sự thay đổi lớn trong cuộc sống, giúp đội ngũ làm công tác y tế nâng cao độ chính xác và rút ngắn thời gian ra các quyết định điều trị, chăm sóc y tế.
Cũng tại tọa đàm, các chuyên gia và nhà quản lý đã nhấn mạnh, dữ liệu là nguồn tài nguyên chiến lược, cần được bảo đảm an toàn thông tin, an ninh mạng và bảo vệ dữ liệu cá nhân. Bên cạnh đó, chủ quyền số phải được duy trì đối với dữ liệu của Việt Nam, tránh phụ thuộc hoàn toàn vào giải pháp nước ngoài. Ngoài ra, việc làm chủ công nghệ xử lý và khai thác dữ liệu chính là yếu tố quyết định để thực thi thành công Chiến lược Chuyển đổi số quốc gia.
“Dữ liệu có nhiều giá trị thặng dư. Nếu khai thác dữ liệu tốt, có tính kết nối thì chúng có thể mang lại giá trị lâu bền. Bên cạnh đó, chúng ta cũng cần thảo luận làm sao quản lý dữ liệu hiệu quả để bảo vệ quyền riêng tư cá nhân”, Thiếu tá Đào Đức Triệu, Tổng thư ký Hiệp hội Dữ liệu quốc gia chia sẻ.
Đại diện hiệp hội cũng cho biết sẽ tiếp tục thực hiện hoạt động nâng cao nhận thức và trang bị kiến thức chuyên sâu về phân tích, xử lý dữ liệu, thúc đẩy ứng dụng các công nghệ dữ liệu hiện đại vào tiến trình phát triển kinh tế số và chuyển đổi số quốc gia.
Các hoạt động cũng nhằm kết nối cộng đồng dữ liệu, tạo diễn đàn để trao đổi kinh nghiệm, thảo luận giải pháp công nghệ, thúc đẩy ứng dụng thực tiễn, khuyến khích doanh nghiệp triển khai thử nghiệm và mở rộng quy mô công nghệ dữ liệu hiện đại. Mục tiêu cuối cùng là hình thành một chuỗi giá trị dữ liệu khép kín, từ thu thập, xử lý, phân tích đến ứng dụng, đảm bảo Việt Nam không chỉ là người tiêu thụ mà còn là nhà cung cấp giải pháp công nghệ dữ liệu.