A- A A+ | Tăng tương phản Giảm tương phản

Bán dữ liệu cho AI, nguồn thu mới đầy tiềm năng của báo chí

Sự bùng nổ của trí tuệ nhân tạo đang làm thay đổi sâu sắc ngành truyền thông toàn cầu. Trong khi nhiều tòa soạn vẫn loay hoay với bài toán doanh thu, một hướng đi mới đang dần hình thành: bán dữ liệu và nội dung báo chí cho các công ty phát triển AI. Những hợp đồng trị giá hàng trăm triệu USD giữa các tập đoàn truyền thông và hãng công nghệ cho thấy dữ liệu báo chí đang trở thành loại tài sản đặc biệt có giá trị trong kỷ nguyên AI.

Dữ liệu báo chí: “Dầu mỏ” của nền kinh tế số

Trong nhiều năm, các cơ quan báo chí trên thế giới phụ thuộc chủ yếu vào quảng cáo và thuê bao để duy trì hoạt động. Tuy nhiên, sự suy giảm doanh thu quảng cáo cùng thói quen tiêu thụ tin tức thay đổi khiến nhiều tòa soạn rơi vào khủng hoảng tài chính. Giữa bối cảnh đó, sự phát triển mạnh mẽ của trí tuệ nhân tạo (AI) lại mở ra một nguồn thu hoàn toàn mới: bán dữ liệu cho các công ty công nghệ.

Các mô hình ngôn ngữ lớn (LLM) như ChatGPT của OpenAI, Gemini của Google hay Claude của Anthropic đều cần khối lượng dữ liệu khổng lồ để huấn luyện. Nhưng không phải dữ liệu nào trên Internet cũng có giá trị như nhau. Những nội dung được kiểm chứng, có tính chính xác cao và được cập nhật liên tục từ các cơ quan báo chí uy tín đang trở thành “nguyên liệu” đặc biệt quan trọng đối với AI.

Đó là lý do các công ty công nghệ sẵn sàng chi những khoản tiền rất lớn để tiếp cận kho dữ liệu của các hãng tin. Một trong những thương vụ gây chú ý nhất là thỏa thuận giữa OpenAI và tập đoàn truyền thông News Corp hồi tháng 5/2024. Theo Wall Street Journal, giá trị hợp đồng có thể vượt 250 triệu USD trong vòng 5 năm.

Thỏa thuận này cho phép OpenAI sử dụng nội dung từ nhiều cơ quan báo chí thuộc News Corp như The Wall Street Journal, New York Post, Barron’s hay MarketWatch để huấn luyện AI và hiển thị nội dung trong ChatGPT. Không chỉ tin tức mới, kho lưu trữ hàng chục năm của các tờ báo cũng trở thành nguồn dữ liệu có giá trị lớn.

Nhiều chuyên gia xem đây là bước ngoặt của ngành truyền thông. Nếu trước đây dữ liệu lưu trữ chỉ đóng vai trò tư liệu, nay chúng đã trở thành tài sản có thể thương mại hóa trực tiếp. Trong cuộc đua AI, dữ liệu báo chí đang được ví như “dầu mỏ” của nền kinh tế số.

ai2-large.png

Dữ liệu báo chí là “mỏ vàng” cho AI. Nguồn: Adobestock.

Cuộc đua săn dữ liệu

Không riêng OpenAI, hàng loạt tập đoàn công nghệ lớn cũng đang tăng tốc ký kết với các nhà xuất bản và hãng tin trên toàn cầu. Associated Press (AP) là một trong những đơn vị đầu tiên hợp tác với OpenAI để cấp phép sử dụng một phần kho dữ liệu tin tức phục vụ phát triển AI.

Điều đáng chú ý là các thỏa thuận này không chỉ dừng ở việc bán nội dung. Đổi lại, nhiều tòa soạn cũng được tiếp cận công nghệ AI để hỗ trợ quy trình sản xuất tin tức, tối ưu tìm kiếm dữ liệu và tự động hóa một số công việc trong newsroom.

OpenAI hiện đã ký kết với hơn 20 tổ chức truyền thông trên thế giới. Financial Times, Axel Springer hay Washington Post đều tham gia làn sóng hợp tác này. Trong khi đó, Meta và Google cũng liên tục mở rộng các chương trình cấp phép nội dung để phục vụ phát triển AI tạo sinh.

Theo Reuters, thị trường dữ liệu phục vụ huấn luyện AI hiện có giá trị khoảng 2,5 tỷ USD và được dự báo tiếp tục tăng mạnh trong những năm tới. Các công ty AI đang đối mặt với tình trạng thiếu dữ liệu chất lượng cao khi nguồn dữ liệu miễn phí trên Internet dần trở nên kém hiệu quả hoặc vướng rào cản pháp lý.

Đối với AI, dữ liệu báo chí có giá trị đặc biệt bởi đây là nguồn thông tin đã qua kiểm chứng. Một trong những vấn đề lớn của AI hiện nay là hiện tượng “ảo giác”, khi hệ thống tạo ra nội dung sai lệch hoặc bịa đặt. Việc sử dụng dữ liệu từ các cơ quan báo chí uy tín giúp giảm đáng kể nguy cơ này.

Ngoài ra, các công ty công nghệ còn đặc biệt quan tâm đến dữ liệu thời gian thực. Những thông tin mới về kinh tế, chính trị, tài chính hay thể thao giúp AI duy trì khả năng cập nhật liên tục. Điều này mở ra khả năng các tòa soạn có thể xây dựng mô hình doanh thu định kỳ từ việc cung cấp dữ liệu trực tiếp cho các nền tảng AI.

Sự thay đổi này đang khiến vai trò của báo chí dịch chuyển đáng kể. Nếu trước đây các tòa soạn chủ yếu là đơn vị sản xuất nội dung cho độc giả, nay họ còn có thể trở thành nhà cung cấp dữ liệu cho nền kinh tế AI toàn cầu.

ai1-large.png

Hình minh hoạ. Nguồn: Ejo.

Cơ hội lớn nhưng đầy lo ngại

Dù được xem là nguồn thu đầy triển vọng, việc bán dữ liệu cho AI cũng kéo theo nhiều tranh cãi trong ngành truyền thông.

Cuối năm 2023, New York Times đã khởi kiện OpenAI và Microsoft với cáo buộc sử dụng trái phép hàng triệu bài báo để huấn luyện AI. Tờ báo cho rằng các hệ thống AI có thể tạo ra nội dung cạnh tranh trực tiếp với báo chí mà không chia sẻ doanh thu tương xứng.

Đây cũng là nỗi lo chung của nhiều cơ quan truyền thông. Khi người dùng ngày càng có xu hướng đọc bản tóm tắt do AI tạo ra thay vì truy cập trực tiếp vào website báo chí, lượng truy cập và doanh thu quảng cáo có nguy cơ sụt giảm mạnh.

Một số chuyên gia cảnh báo nếu không xây dựng được cơ chế chia sẻ lợi ích hợp lý, báo chí có thể bị đẩy xuống vai trò chỉ còn là “nhà cung cấp nguyên liệu” cho các nền tảng công nghệ lớn. Khi đó, phần lớn giá trị kinh tế sẽ rơi vào tay các công ty AI.

Tuy nhiên, trong bối cảnh ngành truyền thông toàn cầu vẫn gặp khó khăn về tài chính, nhiều tòa soạn cho rằng hợp tác với AI là lựa chọn khó tránh khỏi. Những hợp đồng trị giá hàng chục hoặc hàng trăm triệu USD đang cho thấy dữ liệu báo chí đã trở thành một loại tài sản có giá trị kinh tế thực sự.

Quan trọng hơn, sự bùng nổ của AI cũng khiến giá trị cốt lõi của báo chí chuyên nghiệp được nhìn nhận rõ hơn. Trong thời đại mà nội dung do AI tạo ra xuất hiện khắp nơi, thông tin chính xác, đáng tin cậy và được kiểm chứng lại càng trở nên quan trọng.

Cuộc đua AI vẫn đang ở giai đoạn đầu và nhu cầu dữ liệu chất lượng cao được dự báo sẽ tiếp tục tăng mạnh trong nhiều năm tới. Với báo chí, đây không chỉ là cơ hội tạo thêm nguồn thu mà còn là dịp để khẳng định vai trò không thể thay thế của mình trong hệ sinh thái thông tin số.


Tổng số điểm của bài viết là: 0 trong 0 đánh giá
Click để đánh giá bài viết