Mục lục

  1. Mô hình âm thanh AI Fugatto của Nvidia
  2. Các tính năng mới của Claude
  3. Vòng gọi vốn 56 triệu đô la của startup AI /dev/agents
  4. Mô hình tạo ảnh Frames của Runway
  5. Mô hình tạo ảnh đầu tiên của Luma

1. Mô hình âm thanh AI Fugatto của Nvidia

Nvidia headquarters - Image: Nvidia

Nvidia (NVDA) đã công bố mô hình âm thanh AI mới của mình, Fugatto, trong tuần này. Mô hình này có khả năng tạo ra hoặc biến đổi "bất kỳ sự kết hợp nào của nhạc, giọng nói và âm thanh được mô tả bằng các lời nhắc sử dụng bất kỳ sự kết hợp nào của văn bản và tệp âm thanh". Fugatto, viết tắt của Foundational Generative Audio Transformer Opus 1, cho phép người dùng nhập lời nhắc văn bản và tạo ra đoạn nhạc ngắn, loại bỏ hoặc thêm nhạc cụ vào một bài hát đã có, thay đổi giọng điệu hoặc cảm xúc trong giọng nói, và thậm chí "tạo ra những âm thanh chưa từng được nghe trước đây". Nvidia cho biết Fugatto là mô hình AI thế hệ đầu tiên thể hiện các thuộc tính nổi bật – khả năng phát sinh từ sự tương tác của các khả năng được đào tạo khác nhau của nó – và khả năng kết hợp các hướng dẫn tự do.

2. Các tính năng mới của Claude

Claude’s styles feature - Image: Anthropic

Anthropic đã công bố các bản cập nhật mới cho chatbot AI Claude của mình trong tuần này. Với tích hợp Google Docs mới, Claude có thể sử dụng ngữ cảnh từ tài liệu của người dùng để cải thiện tính phù hợp và độ chính xác của phản hồi. Claude có thể tóm tắt các tài liệu dài và "tham chiếu ngữ cảnh lịch sử" từ các tệp Google Docs. Tính năng tích hợp này hiện khả dụng cho người dùng Claude Pro, Team và Enterprise.

Một tính năng đáng chú ý khác là tính năng "style" (phong cách) mới. Tính năng này cho phép người dùng tùy chỉnh cách chatbot phản hồi để phù hợp với phong cách giao tiếp và yêu cầu công việc ưa thích. Người dùng có thể chọn phong cách trang trọng, ngắn gọn hoặc giải thích. Claude cũng có thể tạo ra các phong cách tùy chỉnh từ nội dung mẫu được tải lên. Anthropic cũng đã thêm khả năng bổ sung tùy chọn hồ sơ toàn cầu cho chatbot để hướng dẫn nó "về những điều bạn luôn muốn nó ghi nhớ", chẳng hạn như ngôn ngữ lập trình ưa thích.

3. Vòng gọi vốn 56 triệu đô la của startup AI /dev/agents

/dev/agents website - Screenshot: /dev/agents

Startup AI /dev/agents đã chính thức ra mắt và công bố vòng gọi vốn hạt giống trị giá 56 triệu đô la. Vòng gọi vốn này được dẫn dắt bởi Index Ventures và CapitalG. Startup này đang xây dựng một hệ điều hành cho các tác nhân AI. Các nhà sáng lập của /dev/agents bao gồm cựu giám đốc công nghệ của Stripe, David Singleton, và các cựu phó chủ tịch của Google và Meta (META): Hugo Barra, Ficus Kirkpatrick, và Nicholas Jitkoff. Singleton chia sẻ: "Ngày nay, bạn có thể xây dựng một bản demo AI chỉ trong vài giờ, nhưng việc tạo ra thứ gì đó mà người tiêu dùng thực sự có thể tin tưởng với thẻ tín dụng của họ gần như là không thể. Cũng giống như Android đã giúp phát triển ứng dụng di động trở nên dễ dàng hơn với hầu hết các nhà phát triển, chúng tôi đang xây dựng nền tảng sẽ giúp đưa các tác nhân AI trở nên phổ biến."

4. Mô hình tạo ảnh Frames của Runway

Runway CEO Cristobal Valenzuela and artist and musician Claire L. Evans at the 2024 AI Film Festival Los Angeles on May 1, 2024 in Los Angeles, California - Photo: Tommaso Boddi (Getty Images)

Runway đã công bố mô hình cơ sở mới để tạo ảnh, Frames, trong tuần này. Startup AI này chuyên phát triển các hệ thống AI đa phương thức để tạo video, hình ảnh và âm thanh cho biết mô hình mới này thể hiện "một bước tiến lớn về khả năng kiểm soát phong cách và độ trung thực hình ảnh". Frames có thể duy trì tính nhất quán về mặt phong cách khi tạo hình ảnh. Frames hiện đang được triển khai trong mô hình cơ sở Gen-3 Alpha và thông qua API của Runway.

5. Mô hình tạo ảnh đầu tiên của Luma

Luma AI Dream Machine - Image: Luma

Nền tảng AI hình ảnh Luma đã cho ra mắt mô hình tạo ảnh đầu tiên của mình, Luma AI Photon Image Model, trong tuần này. Mô hình cơ sở văn bản thành hình ảnh này được xây dựng trên kiến trúc Universal Transformer của Luma. Luma cho biết mô hình này nhanh hơn và rẻ hơn 800% so với các mô hình khác. Luma cũng đã công bố dịch vụ miễn phí và trả phí theo thuê bao cho dịch vụ AI hình ảnh Dream Machine trên web và iOS. Mô hình Dream Machine được phát hành vào tháng 6 và đã có 25 triệu người dùng đăng ký.


0 comments Blogger 0 Facebook

Đăng nhận xét

 
Agent.ai.vn © 2024 - Nắm bắt tương lai
Top