Microsoft vừa tung ra ba mẫu mới trên MAI Playground, bao gồm MAI-Transcribe-1, MAI-Voice-1 và MAI-Image-2, nhằm hỗ trợ các nhà phát triển trong việc xử lý giọng nói, âm thanh và hình ảnh TestingCatalog. Các mẫu này hiện đã có sẵn trong Foundry, cho phép người dùng chuyển đổi giọng nói thành văn bản, tạo giọng nói tùy chỉnh và tạo hình ảnh TestingCatalog.
Microsoft ra mắt 3 mẫu mới trên MAI Playground

Tóm tắt bởi AI
1 nguồnĐiểm chính
- Microsoft ra mắt 3 mẫu mới hỗ trợ xử lý giọng nói, âm thanh và hình ảnh [1]
- MAI-Transcribe-1 chuyển đổi giọng nói thành văn bản [1]
- MAI-Voice-1 tạo giọng nói tùy chỉnh, MAI-Image-2 tạo hình ảnh [1]
- Các mẫu mới có sẵn trong Foundry, MAI Playground cho người dùng Mỹ [1]
Các mẫu mới và tính năng
MAI-Transcribe-1 giúp chuyển đổi giọng nói thành văn bản, MAI-Voice-1 tạo ra giọng nói và giọng nói tùy chỉnh, trong khi MAI-Image-2 được dùng để tạo hình ảnh TestingCatalog. Các mẫu này được Microsoft cung cấp cho các nhà phát triển trong Foundry TestingCatalog.
Khả năng tiếp cận và chi phí
Hiện tại, các mẫu mới đã có sẵn trong Foundry, trong khi MAI Playground vẫn chỉ dành riêng cho người dùng tại Mỹ để thử nghiệm TestingCatalog. Chi phí sử dụng các dịch vụ này bắt đầu từ 0,36 USD/giờ đối với dịch vụ chuyển đổi văn bản, 22 USD/1 triệu ký tự đối với giọng nói và 5 USD/1 triệu mã thông báo đầu vào văn bản cộng với 33 USD/1 triệu mã thông báo đầu ra hình ảnh để tạo hình ảnh TestingCatalog.
Nghe tóm tắt
Tính năng nghe audio — sắp ra mắt






