Mục lục

  1. Giới thiệu về Chế độ Giọng nói Nâng cao với Thị giác của ChatGPT
  2. Khả năng Thị giác và Âm thanh của ChatGPT
  3. Tính năng nổi bật: Giọng nói Ông già Noel và Chia sẻ Màn hình
  4. So sánh với các công nghệ tương tự
  5. 12 Ngày của OpenAI: Những thông báo quan trọng khác
  6. Kết luận

1. Giới thiệu về Chế độ Giọng nói Nâng Cao với Thị giác của ChatGPT

Trong khuôn khổ sự kiện "12 Ngày của OpenAI", OpenAI đã chính thức ra mắt tính năng được mong chờ từ lâu: Chế độ Giọng nói Nâng cao với Thị giác cho ChatGPT. Tính năng này, lần đầu tiên được giới thiệu vào tháng 5, cho phép ChatGPT "nhìn thấy" và "nghe thấy" người dùng trong thời gian thực, mang đến trải nghiệm tương tác tự nhiên hơn bao giờ hết.

ChatGPT Vision feature

2. Khả năng Thị giác và Âm thanh của ChatGPT

Với Chế độ Giọng nói Nâng cao và Thị giác, ChatGPT không chỉ hiểu được giọng nói của bạn mà còn có thể phân tích hình ảnh từ camera của thiết bị. Trong các buổi trình diễn, ChatGPT đã chứng minh khả năng ghi nhớ thông tin từ cả giọng nói và hình ảnh, ví dụ như nhớ tên của người xuất hiện trên camera chỉ bằng mô tả giọng nói. Hơn nữa, khả năng đa phương thức (multimodal) của ChatGPT tạo nên cuộc hội thoại tự nhiên và linh hoạt hơn so với các mô hình khác.

3. Tính năng nổi bật: Giọng nói Ông già Noel và Chia sẻ Màn hình

Bên cạnh khả năng thị giác, OpenAI còn mang đến một bất ngờ thú vị: giọng nói Ông già Noel với chất giọng Anh đặc trưng sẽ có mặt trong suốt tháng 12. Đây chắc chắn là điểm nhấn hấp dẫn thu hút trẻ em.

Một tính năng đáng chú ý khác là chia sẻ màn hình. Người dùng có thể chia sẻ ứng dụng trên điện thoại của mình với ChatGPT để được hỗ trợ giải quyết vấn đề. ChatGPT thậm chí còn có thể nhận diện ứng dụng đang được mở. Ví dụ, bạn có thể mở một tin nhắn và yêu cầu ChatGPT tư vấn cách trả lời.

Tính năng chia sẻ màn hình và video sẽ được triển khai trên ứng dụng di động ChatGPT bắt đầu từ hôm nay dành cho người dùng đăng ký gói Teams, Plus và Pro (ngoại trừ khu vực Châu Âu). Giọng nói Ông già Noel sẽ có sẵn trên tất cả các nền tảng hỗ trợ Chế độ Giọng nói Nâng cao.

4. So sánh với các công nghệ tương tự

Chế độ Giọng nói Nâng cao với Thị giác của ChatGPT tương tự như dự án Project Astra của Google, được cập nhật trong thông báo về Gemini 2.0 của Google vào ngày hôm qua. Tuy nhiên, OpenAI vẫn chưa công bố chi tiết so sánh hai công nghệ này.

5. 12 Ngày của OpenAI: Những thông báo quan trọng khác

Sự kiện "12 Ngày của OpenAI" không chỉ giới thiệu Chế độ Giọng nói Nâng cao với Thị giác. Dưới đây là tóm tắt những thông báo đáng chú ý khác:

12 Days of OpenAI

  • Ngày Sáu: ChatGPT với Giọng nói Nâng cao: Tính năng này cho phép ChatGPT nhìn thấy bạn, thế giới xung quanh và cả màn hình điện thoại của bạn nhờ vào Thị giác. Giọng nói Ông già Noel cũng được ra mắt trong tháng 12.
  • Ngày Năm: ChatGPT với Apple Intelligence: Cập nhật lớn cho Apple Intelligence trên iOS 18.2 tích hợp ChatGPT, nâng cao khả năng thị giác và văn bản ngay trên cửa sổ Siri.
  • Ngày Bốn: Ra mắt ChatGPT Canvas: OpenAI chính thức phát hành ChatGPT Canvas, trình soạn thảo văn bản và mã cho tất cả người dùng, hỗ trợ Custom GPTs và chạy mã Python.
  • Ngày Ba: OpenAI ra mắt Sora: Công cụ tạo video AI Sora cho phép tạo video và hình ảnh ở nhiều phong cách, từ chân thực đến trừu tượng.
  • Ngày Hai: Điều chỉnh tinh chỉnh mô hình AI: OpenAI tập trung vào sức mạnh của các mô hình và việc tinh chỉnh bằng cách củng cố cho các mô hình AI được thiết kế cho các nhiệm vụ phức tạp, cụ thể.
  • Ngày Một: Gói ChatGPT Pro và mô hình o1: Ra mắt gói ChatGPT Pro dành cho nghiên cứu khoa học và giải quyết vấn đề toán học phức tạp, cùng với việc phát hành đầy đủ mô hình o1.

6. Kết luận

Chế độ Giọng nói Nâng cao với Thị giác là một bước tiến đáng kể của OpenAI trong việc phát triển trí tuệ nhân tạo, mang đến trải nghiệm tương tác tự nhiên và trực quan hơn. Sự kiện "12 Ngày của OpenAI" cho thấy sự nỗ lực không ngừng của OpenAI trong việc cải tiến và mở rộng ứng dụng của ChatGPT. Chúng ta có thể mong đợi nhiều đột phá công nghệ hơn nữa từ OpenAI trong tương lai.

0 comments Blogger 0 Facebook

Đăng nhận xét

 
Agent.ai.vn © 2024 - Nắm bắt tương lai
Top