Khi trí tuệ nhân tạo tham gia viết báo

Thứ Tư, 04/07/2012, 14:55

Cách đây không lâu, trên trang web của tạp chí Forbes (Mỹ) đã cho công bố một bài báo, tác giả của nó được nêu đích danh là "Narrative Science" (tạm dịch là "Khoa học kể chuyện"). Đó thực chất là một công nghệ cho phép xây dựng được một văn bản mạch lạc mà không cần có sự tham gia của con người.

Đây có thể coi là một bước tiến lớn, nếu như biết rằng các "robot-nhà báo" sơ khai trước đây chỉ có thể làm việc với những con số thống kê cứng nhắc, viết về kết quả các trận đấu thể thao hay các bản dự báo về tài chính. Giờ đây với  "Narrative Science" (NS), các "robot-nhà báo" có thể viết ra những bài báo có nội dung gần với lĩnh vực chính trị.

Một số cây bút tại phương Tây, giờ đây đã bắt đầu phải nhìn nhận robot như những đối thủ cạnh tranh trong tương lai, đã bắt đầu tranh luận về những lợi ích cũng như bất lợi mà công nghệ NS có thể đem lại cho ngành báo chí. Biết đâu với khả năng hoàn thiện hơn nữa trong tương lai, những công nghệ như NS có thể đoạt được giải thưởng Pulitzer!

Viết bởi… robot

Nói chính xác, "Narrative Science" không chỉ là tên của một công nghệ, mà trên thực tế còn là tên gọi của một công ty tại Chicago, nơi đã sáng chế ra một thuật toán cho phép máy tính có thể biến đổi những dữ liệu khô khan trở thành văn bản. Công ty trên được thành lập từ năm 2010 bởi ba sáng lập viên - Larry Birnbaum, Kris Hammond và Stuart Frankel.  Birnbaum và Hammond là hai cựu sinh viên của Trường đại học Tổng hợp Yale (có trình độ về ngôn ngữ và lập trình), còn Frankel là một trong những cựu quan chức hàng đầu của DoubleClick (hãng đang đảm nhiệm các dịch vụ quảng cáo cho Google).

Câu chuyện đầu tiên được giao cho robot-phóng viên viết có liên quan đến kết quả một trận đấu bóng chày. Phần lớn các bài báo được công ty đem thử nghiệm ban đầu hoặc là thuộc lĩnh vực thể thao, hoặc là chuyện thống kê tài chính: robot dựa trên cơ sở của một bảng thống kê hay báo cáo tài chính, làm rõ những sự kiện chính, triển khai soạn thảo, thậm chí còn nghĩ ra tiêu đề giúp phản ánh được nội dung chính.

Các cha đẻ của NS khẳng định rằng, đứa con của họ có thể làm việc với bất kỳ dạng thông tin hay đề tài nào. Để làm được điều này, họ đã nhờ đến sự giúp đỡ của một đội ngũ các phóng viên. Công nghệ NS cho dù chỉ sử dụng một thuật toán cơ sở, nhưng lại có thể thay đổi linh hoạt các chi tiết tùy thuộc vào mỗi một khách hàng mới. Phần đơn giản nhất chính là việc thay đổi định dạng (tên tuổi, ngày tháng, kiểu chữ).

Tuy nhiên đối với các phóng viên tham gia cộng tác, nhiệm vụ sẽ nặng nề hơn nhiều: phải xác định được văn phong của các bài báo, lựa chọn một bộ từ ngữ và câu văn đặc trưng để robot có thể sử dụng. Nhờ sự hợp tác của các phóng viên giúp xác định cho robot các chuẩn và ngôn ngữ báo chí thông thường, các bài báo của NS không hề giống như máy tính viết trước đây. 

Vào thời điểm hiện tại, Narrative Science đã có hơn 30 khách hàng, cùng với khoản lợi nhuận riêng trong năm 2011 khoảng 6 triệu USD. Nếu như ban đầu chỉ tập trung vào loại khách hàng là các công ty xây dựng và tài chính (sử dụng robot để làm các báo cáo nội bộ), công nghệ này đã có bước chân đầu tiên vào lĩnh vực báo chí - Narrative Science ký hợp đồng với Forbes, xây dựng các tài liệu báo cáo về thu nhập của họ. Chưa thể nói rằng, văn phong trong các bài báo của NS là rất hay và sống động, tuy nhiên người đọc có thể lĩnh hội từ đó tất cả những chi tiết cần thiết.

"Robot-nhà báo" trong tương lai không xa sẽ trở thành đối thủ cạnh tranh với các nhà báo bằng xương bằng thịt.

Narrative Science hiện vẫn đang tiếp tục phát triển và hoàn thiện công nghệ của mình. Tháng 2 vừa qua, họ đã cho xuất xưởng một bài báo có đề tài chính trị đầu tiên trên cơ sở phân tích các bản ghi trên Twitter, cũng như tần suất tên tuổi các ứng cử viên đảng Cộng hòa được nhắc tới trên mạng. Robot-phóng viên đã có được những kết luận (dù chưa phải là quá sâu sắc) dựa trên các dữ liệu thu thập được: "Dù đánh giá trên cộng đồng Twitter về Newt Gingrich là khả quan, nhưng ý kiến chung của công luận về ứng cử viên trên và phong cách của ông ta lại mang chiều hướng bất lợi".

Hãng Narrative Science tất nhiên vẫn đặt ra cho mình nhiều tham vọng hơn so với việc chỉ phân tích các thống kê và bản ghi trên mạng. Theo tạp chí The Atlantic, các cha đẻ của công nghệ này đang tập trung nghiên cứu một dự án nhằm dạy cho NS tạo ra những văn bản dành cho một người hay một nhóm người nhỏ nào đó. Cụ thể hơn, các bài báo sẽ được "viết ra" để phục vụ cho quyền lợi của những người cụ thể, với các đề tài đa dạng hơn từ việc đánh giá thị trường chứng khoán và đề xuất mua cổ phiếu cho tới giải thích các số liệu phân tích y khoa của khách hàng.

Đối thủ hay đối tác?

Khả năng ứng dụng "Narrative Science" vào thế giới truyền thông đã gây ra rất nhiều ý kiến phản hồi khác nhau từ phía các nhà báo, những người đã nhìn thấy tay "robot-nhà báo" trên như một đối thủ cạnh tranh, hay như một trợ lý thân cận. Kể từ khi một tạp chí có uy tín như Forbes cho công bố một số "tác phẩm" của NS, trên báo chí đã xuất hiện vô số những nhận xét đao to búa lớn về những bài báo do robot sáng tác. Phần lớn ý kiến đều cho rằng chúng có nội dung tẻ nhạt, thô thiển, khả năng phân tích thấp, thậm chí còn có cả dẫn chứng về tỉ lệ khán giả quan tâm để mắt tới không hề cao.  

Các nghiên cứu về Narrative Science trên thực tế được xếp vào lĩnh vực gọi là "Xử lý ngôn ngữ tự nhiên" (Natural Language Processing, NLP), một lý thuyết nằm trong vùng giao thoa giữa các nghiên cứu về trí tuệ nhân tạo và ngôn ngữ toán học. NLP nghiên cứu các vấn đề về phân tích thông tin văn bản bằng máy tính, cũng như khả năng tự động tổng hợp thành văn bản đúng ngữ pháp (phù hợp với các quy tắc của ngôn ngữ tự nhiên).

Bất chấp thực tế có rất nhiều phê phán, nhiều nhà báo vẫn nhìn nhận NS như một đối thủ cạnh tranh với mình ở một mức độ nào đó - đầu tiên là khác với phóng viên bằng xương bằng thịt, "robot-nhà báo" chỉ cần… vài giây là có thể viết xong một bài báo. Máy tính có thể rất dễ dàng và nhanh chóng khai thác hàng núi thông tin dựa trên việc giám sát những bản ghi trên các mạng xã hội. Tuy nhiên, nó còn kèm theo một nhược điểm cố hữu so với con người là khó có thể nhận ra tính chất thiếu khách quan của thông tin. 

Mặt khác, đối với giới lãnh đạo các phương tiện truyền thông đại chúng, "robot - nhà báo" chắc chắn sẽ đòi "lương" thấp hơn nhiều người bình thường. Chẳng hạn như theo tờ The New York Times, khách hàng chỉ phải trả chưa tới 10 USD cho một bài báo khoảng 500 từ do NS viết ra. Ngoài ra, những nhà báo thế hệ mới này còn giúp cho các ông chủ tiết kiệm hàng loạt những chi phí về đảm bảo điều kiện làm việc, chi trả bảo hiểm hay nghỉ phép v.v… Trên thực tế, khách hàng chỉ phải trả tiền cho thuật toán, còn tất cả những chi phí còn lại đều do "Narrative Science" bao hết.

Trước nhiều mối lo ngại và chỉ trích của báo chí, những cha đẻ của NS khẳng định rằng, công nghệ của họ sẽ giúp giảm nhẹ công việc của các nhà báo - nó có thể nhanh chóng phân tích một lượng thông tin khổng lồ (qua các báo cáo thống kê hay mạng xã hội), giúp các phóng viên tiết kiệm thời gian nhưng vẫn cho ra được một bài báo phân tích có chất lượng.

Tóm lại, sự xuất hiện của những công nghệ kiểu NS sẽ khiến mức độ cạnh tranh trong lĩnh vực truyền thông đại chúng tăng lên. Nhưng đó cũng trở thành động cơ khiến các phóng viên cần phải nỗ lực hơn nữa để những bài báo của mình trở nên hấp dẫn hơn trên cơ sở những dữ liệu phong phú đã được robot tổng hợp. 

Hồng Sơn (tổng hợp)
.
.