Chuyên mục  


Thời gian vừa qua, công cụ AI Gemini của Google đã khuấy động thị trường với tốc độ vượt trội, được quảng cáo là nhanh gấp 5 lần và mạnh hơn GPT-4 trong khi tiêu tốn ít GPU hơn. Điều này thúc đẩy OpenAI nhanh chóng cải tiến và cho ra mắt GPT-4o, một phiên bản nhanh hơn nhiều so với GPT-4, thậm chí khiến GPT-4 trở nên lỗi thời.

GPT-4 đã từng là lựa chọn tốt cho nhiều người dùng, nhưng tốc độ của nó so với các mô hình AI khác như Gemini của Google hay Claude 3 từ Anthropic khá chậm, khiến đây trở thành một nhược điểm lớn. Tuy nhiên, GPT-4o đã khắc phục hoàn toàn vấn đề này. Trong các thử nghiệm gần đây, GPT-4o có thể tạo ra câu trả lời lên đến 488 từ trong vòng chưa đầy 12 giây, trong khi GPT-4 cần gần một phút cho tác vụ tương tự.

Giám đốc công nghệ của OpenAI, Mira Murati, đã khẳng định GPT-4o nhanh hơn nhiều so với phiên bản trước đó, cùng với đó là được cải thiện về khả năng xử lý văn bản, video và âm thanh. Điều này không chỉ giúp công cụ này trở nên tiện dụng hơn mà còn giảm đáng kể chi phí cho các nhà phát triển, đạt hơn 50% cùng tốc độ xử lý tăng gấp đôi so với GPT-4 Turbo.

5ukd96zn351-5y38vo2l3p2-xcondymxvn3.jpg Giám đốc công nghệ OpenAI Mira Murati tại sự kiện ra mắt. Ảnh: OpenAI.

Không chỉ nhanh hơn, GPT-4o còn mở rộng cách người dùng tương tác qua ứng dụng trên smartphone hay PC. Ngoài ra, phiên bản ChatGPT mới này còn được tích hợp trợ lý giọng nói để cạnh tranh với Alexa của Amazon, cho phép người dùng trò chuyện tự nhiên với những phản hồi chân thực và đa dạng.

Trong các bản demo, GPT-4o thể hiện khả năng hiểu và phản ứng với giọng nói của con người một cách ấn tượng. Ví dụ, khi người dẫn chương trình thở dốc vào điện thoại, ChatGPT đã phản ứng bằng một câu châm biếm và sau đó đưa ra lời khuyên về kỹ thuật thở. Điều này cho thấy khả năng nghe - hiểu và tương tác với các sắc thái về giọng nói con người của công cụ này.

GPT-4o cũng có khả năng dịch thuật nhanh chóng và chính xác. Trong một bản demo khác, nó đã cung cấp bản dịch từ tiếng Ý sang tiếng Anh và ngược lại, giúp hai người thuyết trình có thể trò chuyện một cách liền mạch. Hơn nữa, GPT-4o không chỉ hiểu giọng nói mà còn có thể phân tích hình ảnh, ví dụ như mô tả trang phục hoặc cảm xúc trong một bức ảnh selfie.

Một điểm nổi bật khác là khả năng phát hiện và phản ứng với cảm xúc của người dùng. Trong một bản demo, GPT-4o đã nhận biết được khuôn mặt tươi cười của người dùng và hỏi về lý do khiến tâm trạng họ vui vẻ. Khả năng này không chỉ giúp tăng cường sự tương tác mà còn mang lại trải nghiệm người dùng tốt hơn.

Ngoài ra, GPT-4o còn hỗ trợ các nhà phát triển thông qua API, cho phép xây dựng các mô hình AI với chi phí thấp hơn và tốc độ nhanh hơn. GPT-4o cũng hỗ trợ đến 50 ngôn ngữ, đáp ứng nhu cầu của 97% dân số thế giới, mở ra nhiều cơ hội ứng dụng trong nhiều lĩnh vực khác nhau.

Theo Tom’s Guide, GPT-4o không chỉ là một bước tiến lớn của OpenAI mà còn đặt ra những tiêu chuẩn mới trong cuộc đua AI, vượt qua các đối thủ như Siri, Google Assistant/Gemini và Alexa. Với nhiều cải tiến liên tục, cuộc đua AI hứa hẹn sẽ ngày càng hấp dẫn hơn.

Thông tin

Tổng hợp tin tự động tinmoi-247.com (r) © 2020