DeepSeek – Mô hình AI giá rẻ thách thức Thung lũng Silicon

Được ví như “Temu trong lĩnh vực AI”, DeepSeek – Startup AI của Trung Quốc đang thách thức vị thế thống trị của các gã khổng lồ công nghệ tại Thung lũng Silicon. Cùng Techie cập nhật ngay!

DeepSeek – Mô hình AI hiệu quả với chi phí cực thấp

Thung lũng Silicon đang phải đối mặt với thực tế rằng việc tạo ra một mô hình trí tuệ nhân tạo tiên tiến có thể không còn là một nhiệm vụ đặc biệt như trước đây.

Tín hiệu cảnh báo đến từ DeepSeek. Là một startup mới chỉ được thành lập một năm tại Trung Quốc, nhưng mô hình AI mã nguồn mở của DeepSeek đang được đánh giá ngang bằng, thậm chí là vượt trội hơn cả các mô hình tiên tiến hiện tại. Điều đang chú ý là mô hình này được xây dựng với chi phí thấp hơn đáng kể, với công nghệ chip kém tiên tiến hơn và tiêu tốn ít năng lượng hơn.

Theo công bố của DeepSeek, mô hình R1 được đào tạo trên các chip H800 của Nvidia, mã nguồn mở 100%, rẻ hơn 96,4% so với OpenAI o1 trong khi mang lại hiệu suất tương tự. Thậm chí đáng kinh ngạc hơn, DeepSeek chỉ mất vỏn vẹn 2 tháng và dưới 6 triệu USD để xây dựng nên mô hình này.

DeepSeek được ví như Temu trong lĩnh vực AI
DeepSeek được ví như Temu trong lĩnh vực AI

Ngoài ra, khác với nhiều công ty công nghệ thường săn đón nhân tài đa quốc gia, đội ngũ của DeepSeek đều là nguồn lực “nội địa”, đến từ các trường Đại học trong nước. Công ty đã chiêu mộ các kỹ sư AI hàng đầu Trung Quốc, trả lương cao ngang ByteDance – công ty sở hữu TikTok.

Vốn dĩ cho đến nay, quan điểm được chấp nhận rộng rãi trong giới công nghệ Mỹ là các gã khổng lồ công nghệ có thể duy trì vị thế dẫn đầu bằng cách chi hàng tỷ USD. Về cơ bản, họ là những công ty giàu nhất thế giới, và việc “đổ” nhiều nguồn lực là cách để dẫn đầu cuộc chơi. Nhưng giờ đây, Deepseek đang đặt ra dấu hỏi cho tất cả những quan điểm trên!

Động thái của Thung lũng Silicon

Trong một bài đăng trên X hôm 28/1, Sam Altman – Giám đốc điều hành của OpenAI đánh giá R1 của DeepSeek là “mô hình ấn tượng” đồng thời cho biết sẽ đẩy nhanh việc phát hành các mô hình mới. “Chúng tôi chắc chắn sẽ mang đến các mô hình vượt trội hơn rất nhiều và thật sự thú vị khi có một đối thủ cạnh tranh mới! Chúng tôi sẽ đẩy nhanh tốc độ ra mắt một số sản phẩm sắp tới”, trích bài đăng vị CEO.

Giám đốc sản phẩm của OpenAI là Kevin Weil cũng thừa nhận DeepSeek là một đối thủ đáng gớm, và sự xuất hiện của startup Trung Quốc đã thúc đẩy tinh thần cạnh tranh của công ty. “Đây là một ngành công nghiệp siêu cạnh tranh, phải không? Và điều này cho thấy rằng sự cạnh tranh diễn ra trên toàn cầu, không chỉ trong nội bộ Hoa Kỳ,” Weil nói trong cuộc phỏng vấn với CNN. “Chúng tôi cam kết sẽ hành động để duy trì vị thế dẫn đầu.”

mô hình Deepseek
DeepSeek đặt ra thách thức cho Thung lũng Silicon

Các nhà phân tích dự đoán rằng, các Big Tech sẽ phải cắt giảm kế hoạch chi tiêu cho trung tâm dữ liệu và có thể xem xét lại mức phí mà họ đang tính cho người tiêu dùng. “Tất cả các phòng thí nghiệm mô hình tiên phong khác – OpenAI, Anthropic, Google – sẽ xây dựng các mô hình hiệu quả hơn nhiều dựa trên những gì họ đang học được từ DeepSeek,” Gil Luria, trưởng bộ phận nghiên cứu công nghệ tại công ty đầu tư D.A. Davidson, cho biết. “Và bạn sẽ có thể sử dụng chúng với một phần nhỏ chi phí so với hiện tại, bởi vì chi phí chạy các mô hình đó sẽ giảm đáng kể.”

Được biết chỉ mới tuần trước, đại diện các công ty OpenAI, Oracle và SoftBank đã đến thăm Nhà Trắng để công bố việc thành lập một công ty mới và khoản đầu tư 500 triệu USD vào cơ sở hạ tầng AI của Hoa Kỳ. Giám đốc điều hành của Microsoft, Sundar Pichai, khẳng định ông “ủng hộ” khoản đầu tư 80 tỷ USD dự kiến ​​của công ty vào phát triển và cơ sở hạ tầng AI trong năm nay. Trong khi đó, Mark Zuckerberg của Meta cho biết chi tiêu cho AI của công ty trong năm 2025 có thể lên tới 65 tỷ USD.

Những tranh cãi và hoài nghi

Mặc dù “gây bão” ngay sau khi phát hành, tuy nhiên DeepSeek cũng bị đánh giá là không đạt như kỳ vọng. Nhóm nghiên cứu đến từ NewsGuard đánh giá chatbot AI của startup Trung Quốc chỉ đạt 17% độ chính xác khi trả lời các câu hỏi liên quan đến tình hình thời sự tin tức.

Ngoài ra, chatbot vẫn có một số hạn chế nhất định. Ví dụ như không hỗ trợ giọng nói hoặc khả năng tạo hình ảnh ngay lập tức như ChatGPT, tốc độ phản hồi cũng không ổn định. Hiện, nhiều công ty và cơ quan chính phủ trên toàn cầu đã ban hành lệnh cấm DeepSeek vì lo ngại về chính sách bảo mật lỏng lẻo và nguy cơ rò rỉ dữ liệu sang Trung Quốc.

DeepSeek
Vẫn còn nhiều tranh cãi và hoài nghi quanh mô hình AI gây sốc từ Trung Quốc

Trong khi đó, nhà đầu tư lớn nhất của OpenAI là tập đoàn Microsoft đang điều tra về nghi vấn DeepSeek đã đánh cắp dữ liệu đầu ra từ công nghệ của OpenAI. Theo Bloomberg đưa tin, các nhà nghiên cứu bảo mật của Microsoft đã phát hiện hoạt động đáng ngờ vào mùa thu năm 2024. Một số cá nhân được cho là có liên hệ với DeepSeek đã lấy đi một lượng lớn dữ liệu thông qua giao diện lập trình ứng dụng (API) của OpenAI. API này là kênh chính giúp các nhà phát triển phần mềm và khách hàng doanh nghiệp tiếp cận các dịch vụ AI của OpenAI, bao gồm các mô hình tiên tiến như ChatGPT và GPT-4.

Bất kể những điều trên, thành tựu của DeepSeek đang thổi bùng lên ngọn lửa trong ngành AI tại Silicon Valley, đặt ra những thách thức mới trong cuộc đua trí tuệ nhân tạo.

>>Xem thêm: ChatGPT được tìm kiếm gấp 20 lần các đối thủ cạnh tranh trong năm 2024

Khám phá thêm
Mối quan hệ tình yêu luôn là một chủ đề hấp dẫn và phức tạp. Cũng dễ hiểu khi nhiều...
“Chúng ta đang sống trong thế giới VUCA” – Câu nói này đã diễn tả đúng tình trạng thế giới...
Trong bài viết này, Techie sẽ giới thiệu đến bạn bản chất của tính năng constraints và auto-layout figma, cũng...
Temu, một ứng dụng mua sắm Trung Quốc, đang gây chấn động trên internet với những sản phẩm rất rẻ....
Theo một “nguồn tin mật” cho hay, Ghibli chính thức công bố trailer phần tiếp theo của tựa phim Vùng...
Cảm biến sinh học (Biosensor) đã đánh dấu một thành tựu quan trọng trong cuộc chiến chống đại dịch COVID-19 khi...
Với tỷ lệ dân số sử dụng Internet chiếm đến hơn 70%, Việt Nam luôn được coi là thị trường...
Thuật toán Dijkstra là một công cụ quan trọng trong lý thuyết đồ thị và tối ưu hóa. Với khả...