Ngày 25/3, công ty khởi nghiệp AI của Trung Quốc DeepSeek đã phát hành bản nâng cấp cho mô hình ngôn ngữ lớn V3, tăng cường cạnh tranh với các công ty công nghệ hàng đầu của Mỹ như OpenAI và Anthropic.
Mô hình mới có tên DeepSeek-V3-0324 được cung cấp thông qua nền tảng phát triển AI Hugging Face, đánh dấu bước tiến mới nhất của công ty nhằm khẳng định vị thế trên thị trường AI đang phát triển nhanh chóng.
Mô hình mới nhất cho thấy những cải tiến đáng kể trong các lĩnh vực như khả năng lập luận và mã hóa so với bản trước đó, với các bài kiểm tra chuẩn cho thấy hiệu suất được cải thiện trên nhiều số liệu kỹ thuật được công bố trên nền tảng phát triển AI Hugging Face.
Điểm nổi bật nhất trong bản cập nhật này chính là việc mô hình được phát hành dưới giấy phép MIT, cho phép sử dụng miễn phí cho mục đích thương mại.
Theo các báo cáo ban đầu, DeepSeek-V3-0324 có thể chạy trực tiếp trên phần cứng tiêu dùng cao cấp như Apple Mac Studio với chip M3 Ultra.
Theo các nhà phân tích, với nhiều đột phá được cung cấp miễn phí, DeepSeek-V3-0324 đang thách thức trực tiếp mô hình kinh doanh độc quyền của OpenAI.
Trong những tháng gần đây, DeepSeek nhanh chóng nổi lên như một nhân tố đáng chú ý trong lĩnh vực AI toàn cầu khi tung ra một loạt các mô hình cạnh tranh với các đối thủ phương Tây trong khi vẫn cung cấp chi phí vận hành thấp hơn.
Công ty đã ra mắt mẫu V3 vào tháng 12, tiếp theo là phát hành mẫu R1 vào tháng 1.