tinLướt

OpenAI ra mắt các mô hình AI giọng nói và dịch thuật theo thời gian thực mới

Công nghệ
OpenAI ra mắt các mô hình AI giọng nói và dịch thuật theo thời gian thực mới
Tóm tắt bởi AI
1 nguồn
TestingCatalog

ChatGPT News OpenAI launches new realtime voice and translation AI models OpenAI introduces three advanced, real-time audio models for developers, supporting live voice agents, instant translation, and streaming transcription via API. Alexey Shabanov 8 May 2026 · 2 min read Share: OpenAI is advancin

Điểm chính

  • OpenAI ra mắt 3 mô hình AI âm thanh mới: GPT-Realtime-2, Translate, Whisper
  • GPT-Realtime-2 có khả năng suy luận tương đương GPT-5 trong hội thoại
  • Các mô hình mới hỗ trợ phát triển tác nhân giọng nói, dịch thuật, phiên âm

OpenAI vừa trình làng ba mô hình AI âm thanh theo thời gian thực mới, bao gồm GPT-Realtime-2, GPT-Realtime-TranslateGPT-Realtime-Whisper TestingCatalog. Các mô hình này được thiết kế để hỗ trợ các nhà phát triển trong việc tạo ra các tác nhân giọng nói trực tiếp, công cụ dịch thuật và sản phẩm phiên âm trực tuyến TestingCatalog. Động thái này cho thấy sự tiến bộ đáng kể của OpenAI trong lĩnh vực trí tuệ nhân tạo, đặc biệt là khả năng xử lý và tương tác bằng giọng nói.

Các tính năng nổi bật

GPT-Realtime-2 là mô hình giọng nói chủ chốt, được OpenAI khẳng định có khả năng suy luận tương đương GPT-5 trong các cuộc hội thoại TestingCatalog. Điều này cho phép các tác nhân giọng nói xử lý các yêu cầu phức tạp hơn và quản lý các cuộc trò chuyện một cách hiệu quả TestingCatalog. Hai mô hình còn lại, GPT-Realtime-Translate và GPT-Realtime-Whisper, tập trung vào dịch thuật tức thì và phiên âm trực tuyến, mở ra nhiều ứng dụng mới trong giao tiếp và truyền thông TestingCatalog.

Ảnh hưởng đến người dùng

Việc ra mắt các mô hình AI giọng nói theo thời gian thực có thể mang lại nhiều lợi ích cho người dùng. Các công cụ dịch thuật tức thì sẽ giúp phá bỏ rào cản ngôn ngữ, tạo điều kiện giao tiếp dễ dàng hơn giữa mọi người trên toàn cầu TestingCatalog. Các tác nhân giọng nói thông minh hơn có thể hỗ trợ người dùng trong nhiều lĩnh vực, từ giải trí đến công việc, bằng cách cung cấp thông tin và dịch vụ một cách nhanh chóng và hiệu quả TestingCatalog.

Triển vọng phát triển

OpenAI đang tiếp tục phát triển các khả năng AI giọng nói thông qua nền tảng API của mình TestingCatalog. Việc giới thiệu các mô hình mới này cho thấy cam kết của công ty trong việc đổi mới và cải thiện trải nghiệm người dùng. Trong tương lai, chúng ta có thể mong đợi sự xuất hiện của nhiều ứng dụng và dịch vụ dựa trên công nghệ AI giọng nói tiên tiến hơn, mang lại những thay đổi tích cực trong cuộc sống hàng ngày TestingCatalog.

Nghe tóm tắt
Tính năng nghe audio — sắp ra mắt
Tổng hợp từ 1 nguồn tin