Công cụ AI sinh tạo hỗ trợ bảng tính và làm sạch dữ liệu
Công nghệ AI sinh tạo, đại diện bởi ChatGPT và Gemini, đang trở thành trợ thủ đắc lực trong việc xử lý dữ liệu trên bảng tính. Bài viết này, nằm trong chuỗi bài về ứng dụng AI trong báo chí điều tra tại Trường hè báo chí điều tra của Trung tâm Báo chí Điều tra, sẽ trình bày chi tiết cách sử dụng các công cụ này để tối ưu hóa công thức bảng tính và làm sạch dữ liệu.
(Phần mở đầu) – Khái quát về tầm quan trọng của việc sử dụng AI trong xử lý dữ liệu bảng tính:
Trong quá trình nghiên cứu và thu thập dữ liệu, các nhà báo thường phải đối mặt với những dữ liệu phức tạp trên bảng tính. Việc viết công thức phức tạp, chỉnh sửa và định dạng lại dữ liệu tốn nhiều thời gian và nỗ lực. Công cụ AI sinh tạo có thể giải quyết hiệu quả những thách thức này, giúp tiết kiệm thời gian và nâng cao chất lượng dữ liệu.
(Văn phong) – Cách viết công thức bảng tính với ChatGPT và các công cụ AI sinh tạo khác:
Viết prompt (yêu cầu) hiệu quả cho công cụ AI là yếu tố then chốt. Prompt tốt cần bao gồm các yếu tố sau:
- Xác định rõ ràng các cột/ô cần sử dụng: Công cụ AI cần biết rõ dữ liệu nằm ở đâu trong bảng tính.
- Cung cấp ví dụ cụ thể: Nêu ví dụ về dữ liệu trong các cột, thể hiện sự đa dạng trong dữ liệu.
- Mô tả rõ ràng đầu ra mong muốn: Công cụ AI cần biết kết quả cuối cùng mong muốn như thế nào.
- Chỉ định các hàm cần sử dụng hoặc tránh sử dụng: Nếu có thể, hãy hướng dẫn công cụ AI loại hàm nào để tránh phức tạp không cần thiết.
- Tối ưu hoá sự đơn giản: Yêu cầu công cụ AI tối thiểu hoá việc lồng ghép các công thức (nesting) trong công thức chính.
- Lặp lại prompt: Thử nhiều cách khác nhau để cải thiện và hoàn thiện công thức AI tạo ra.
(Ví dụ) – Minh họa một prompt cụ thể:
Prompt: "Tôi có một bảng tính, cột D chứa mã bưu chính của Anh. Mỗi mã bắt đầu bằng một hoặc hai chữ cái, tiếp theo là một hoặc hai số. Ví dụ: SY23 3FL, EH6 8NU, W4 1DB. Tôi muốn tách lấy các chữ cái đầu tiên (ví dụ: EH, W) từ mã bưu chính. Hãy viết công thức làm việc này, với tối thiểu hoá lồng ghép công thức."
(Phần thân) – Sử dụng trí tuệ nhân tạo tích hợp trong Google Sheets:
Google Sheets đã tích hợp tính năng gợi ý công thức AI từ năm 2021. Để công cụ hoạt động tối ưu, hãy chú trọng đặt tên cho các cột/hàng sao cho rõ ràng, chính xác (ví dụ: "Tỉ lệ phần trăm thay đổi", "Tội phạm trên đầu người"). Điều này giúp công cụ AI hiểu rõ hơn về dữ liệu và đưa ra gợi ý công thức chính xác hơn. Tuy nhiên, cần kiểm tra kỹ lưỡng kết quả đề xuất của công cụ AI trước khi áp dụng vào báo cáo.
(Phần thân) – Khai thác thêm tính năng của AI thông qua các tiện ích mở rộng:
Các tiện ích mở rộng như "Claude for Sheets" tích hợp Claude vào Google Sheets, mở ra những khả năng mới như phân loại dữ liệu (ví dụ: phân tích ý nghĩa), bổ sung dữ liệu mới. Tuy nhiên, cần nhận thức về những hạn chế của công cụ AI sinh tạo, đặc biệt trong việc cung cấp thông tin chính xác và cập nhật. Hãy xem AI như một công cụ hỗ trợ, tìm kiếm gợi ý, chứ không phải nguồn thông tin chính xác tuyệt đối.
(Phần thân) – Tái cấu trúc dữ liệu bằng AI:
Công cụ AI cũng hữu ích trong việc thay đổi cấu trúc dữ liệu ("wide to long" hoặc "long to wide"). Lưu ý:
- Hướng dẫn cụ thể việc sắp xếp lại dữ liệu: Hãy chỉ rõ hình dạng dữ liệu mong muốn, các cột cần chuyển đổi thành dữ liệu ô, hoặc cột cần bỏ qua.
- Kiểm tra kết quả: Cần kiểm tra cẩn thận kết quả tái cấu trúc với dữ liệu ban đầu để đảm bảo chính xác.
- Sử dụng các công cụ khác nếu dữ liệu quá lớn: Nếu dữ liệu quá lớn để kiểm tra trực tiếp, hãy sử dụng các ngôn ngữ lập trình như R hoặc Python để xử lý dữ liệu.
(Phần thân) – Làm sạch bảng tính với tiêu đề trải rộng nhiều hàng:
- Nên tải lên file trực tiếp: Để làm việc với bảng tính có tiêu đề trải rộng trên nhiều hàng, nên tải file trực tiếp thay vì sao chép dữ liệu vào phần prompt.
- Prompt cải tiến: Viết prompt kèm theo hướng dẫn rõ ràng về việc kết hợp các hàng tiêu đề để tạo tiêu đề mới.
- Kiểm tra kỹ càng: Kiểm tra kết quả thu được để đảm bảo chính xác.
(Kết luận) – Lời khuyên và khuyến nghị:
- Công cụ AI sinh tạo là một công cụ hỗ trợ mạnh mẽ cho việc xử lý dữ liệu trong báo chí điều tra.
- Viết prompt rõ ràng, chính xác là rất quan trọng.
- Luôn kiểm tra lại dữ liệu để đảm bảo chính xác.
- Xem AI là công cụ hỗ trợ, chứ không phải nguồn thông tin cuối cùng.
Bằng việc hiểu rõ những ưu điểm và hạn chế của công cụ AI sinh tạo, các nhà báo có thể tận dụng tối đa tiềm năng của chúng để nâng cao chất lượng bài viết.

0 comments Blogger 0 Facebook
Đăng nhận xét