Sự phổ biến của smartphone và Internet làm cho dữ liệu trở nên phong phú và ngày càng có giá trị. Cho dù người dùng chạy bộ, xem tivi hay tham gia giao thông, hầu như mọi hoạt động của con người đều tạo ra dấu vết kỹ thuật số, và đó cũng chính là nguyên liệu thô cho “những nhà máy chưng cất” hoạt động.
Các chuyên gia nhận định, hiện 60% dân số thế giới đang trực tuyến và những công nghệ tiên tiến bao gồm trí tuệ nhân tạo (AI), chuỗi khối (blockchain), Internet vạn vật và robot được ước tính sẽ trở thành thị trường trị giá 3,2 nghìn tỷ USD vào năm 2025.
“Nếu số hoá là động cơ của nền kinh tế tương lai, thì dữ liệu chính là nhiên liệu của động cơ này”, Tổng giám đốc Tổ chức Quyền sở hữu trí tuệ thế giới (WIPO) Daren Tang cho biết. “Khả năng kết nối ngày càng tăng và luồng dữ liệu thu được đang thúc đẩy sự phát triển của các công nghệ tiên tiến khác. Trong một thế giới kết nối, hiểu được bản chất và giá trị của dữ liệu là một yếu tố rất quan trọng”.
Giá trị dữ liệu ngày càng tăng lên
Dữ liệu trong kỷ nguyên này trở thành động lực cho tăng trưởng và thay đổi, tương tự như cách dầu mỏ đã tác động đến thế giới từ trước đến nay. Thông tin kỹ thuật số không giống bất kỳ nguồn tài nguyên nào con người từng sở hữu trước đó. Nó được chiết xuất, tinh chế, định giá, mua và bán theo những cách khác nhau. Dữ liệu làm thay đổi quy tắc dành cho thị trường và đòi hỏi cách tiếp cận mới từ cơ quan quản lý.
Facebook và Google ban đầu sử dụng dữ liệu thu thập được từ người dùng để nhắm mục tiêu quảng cáo tốt hơn. Song, các công ty nhận ra rằng dữ liệu có thể được sử dụng để huấn luyện trí tuệ nhân tạo hoặc máy học để tạo ra nguồn doanh thu mới ngoài quảng cáo.
Các dịch vụ này bao gồm dịch thuật, nhận dạng hình ảnh và đánh giá tính cách của người dùng bằng cách sàng lọc các bài viết trên mạng của họ. Các thuật toán kèm dữ liệu có thể được bán cho bên thứ ba để phát triển những sản phẩm trong nhiều lĩnh vực khác nhau.
Chất lượng của dữ liệu cũng đã thay đổi, chúng không còn chủ yếu là kho lưu trữ thông tin số như tên tuổi, tuổi tác, giới tính hay thu nhập. Nền kinh tế mới tập trung nhiều hơn vào việc phân tích luồng dữ liệu phi cấu trúc theo thời gian thực, chẳng hạn như luồng ảnh và video do người dùng mạng xã hội, thông tin định vị người dùng trên đường đi làm, dữ liệu từ các cảm biến trên phương tiện giao thông từ tàu điện ngầm, tua-bin gió đến cả toilet và máy nướng bánh mì.
Thay đổi bản chất cạnh tranh
Các công ty công nghệ lớn (big tech) như Amazon, Apple và Google đã đạt được sức mạnh độc quyền hoặc chi phối phần lớn thị trường, thường xuyên lạm dụng kho dữ liệu của mình để phân hoá sâu sắc thêm lợi thế của họ và duy trì vị thế dẫn đầu.
Sự lạm dụng này bao gồm từ việc thu thập dữ liệu thị trường của chính những đối thủ cạnh tranh nhỏ hơn hoặc sử dụng sức mạnh độc quyền trong một phân khúc thị trường để đạt lợi thế ở một phân khúc thị trường khác.
Cả Amazon và Google đều lấy dữ liệu của bên thứ ba và tận dụng luồng thông tin này để cạnh tranh ngược trở lại. Ví dụ, nhân viên của Amazon bị cáo buộc đã truy cập dữ liệu bán hàng của công ty đồ văn phòng Upper Echelon trụ sở Austin, từ đó ra mắt mẫu ghế văn phòng Amazon Basics vào tháng 9/2019.
Tương tự, Google tận dụng sự phổ biến của hệ điều hành Android (2,5 tỷ người dùng trên khắp 190 quốc gia và vùng lãnh thổ – tính đến cuối tháng 2/2023) để theo dõi xu hướng sử dụng và mô hình tăng trưởng của các ứng dụng bên thứ ba trên nền tảng này, từ đó xây dựng chi tiết danh mục ứng dụng cạnh tranh khác nhau.
Theo phóng sự điều tra của WSJ, Amazon từng gây sức ép với nhà sản xuất điều nhiệt thông minh Ecobee rằng, nếu họ không chịu chia sẻ dữ liệu từ các thiết bị điều khiển giọng nói thì “sẽ gặp khó khăn đến khả năng bán sản phẩm trên sàn Amazon” hoặc “quyền tham gia những sự kiện lớn như Amazon Prime Day”.
Cuộc chơi nằm trong tay Big Tech
Diễn đàn kinh tế thế giới (WEF) ước tính trong ba năm tới thế giới có thể tạo ra nhiều dữ liệu hơn tổng cộng 30 năm trước đó. Sự bùng nổ của dữ liệu không chỉ nhờ vào hoạt động của con người, mà còn có tới 40% lưu lượng truy cập Internet là do các thiết bị máy móc. Xu hướng này sẽ tiếp tục tăng tốc trong thời gian tới và dự kiến đạt con số 125 tỷ thiết bị kết nối vào năm 2030.
Dù vậy, trong lĩnh vực tư nhân, các công ty đang đối mặt với khái niệm về “nghịch lý dữ liệu”. Cuộc khảo sát gần đây của Forrester với 4.036 giám đốc điều hành cấp cao doanh nghiệp, ghi nhận 70% người ra quyết định dựa trên dữ liệu đang thu thập thông tin dữ liệu nhanh hơn tốc độ họ có thể sử dụng, nhưng 67% vẫn khẳng định cần thêm nhiều nguồn tài nguyên này hơn nữa.
Không chỉ vậy, sự bùng nổ của ChatGPT do OpenAI phát triển cho thấy bất kỳ ai cũng có thể sử dụng các công cụ, tài nguyên và sức mạnh tính toán thô để xây dựng mô hình dữ liệu. Song, để trở thành nền tảng phát triển chuyên sâu hơn đòi hỏi các doanh nghiệp cần có cơ sở hạ tầng kỹ thuật và khả năng hỗ trợ ứng dụng AI chuyên biệt.
Đến nay, gần như mọi công cụ AI trên thế giới đều hoạt động trên các nền tảng đám mây như Amazon Web Services (AWS), Microsoft Azure và Google Cloud hoặc một số kết hợp của cả ba nhà cung cấp hàng đầu này. Điều này đồng nghĩa, những startup AI cạnh tranh với Big Tech nhưng cũng đang đóng góp vào lợi nhuận của chính những gã khổng lồ này.
Báo cáo hồi tháng 4/2023 của Viện nghiên cứu AI Now (trụ sở tại Đại học New York) cho thấy, sự phát triển của AI “về cơ bản là phụ thuộc” vào các tài nguyên do các công ty công nghệ lớn kiểm soát, bao gồm cả dữ liệu và sức mạnh điện toán.
(Theo Forbes, WSJ, Insider)
Mỹ – EU tháo gỡ “nút thắt” thoả thuận chia sẻ dữ liệu xuyên Đại Tây Dương
Sở hữu nguồn dữ liệu khổng lồ, Trung Quốc có thể vượt lên trong cuộc đua AI?