DeepSeek của Trung Quốc là gì và tại sao nó khiến thế giới AI dậy sóng?

DeepSeek, một startup AI Trung Quốc mới hơn một năm tuổi, đã gây ra sự kinh ngạc và lo lắng tại Thung lũng Silicon sau khi trình diễn các mô hình trí tuệ nhân tạo đột phá, mang lại hiệu suất tương đương với các chatbot hàng đầu thế giới với chi phí dường như chỉ bằng một phần nhỏ.

Sự xuất hiện của DeepSeek có thể là một điểm phản biện cho niềm tin phổ biến rằng tương lai của AI sẽ đòi hỏi ngày càng nhiều năng lượng và tài nguyên để phát triển.

Cổ phiếu công nghệ toàn cầu đã giảm mạnh vào cuối tháng 1 khi cơn sốt xung quanh sự đổi mới của DeepSeek tăng cao và các nhà đầu tư bắt đầu cân nhắc những tác động đối với các đối thủ tại Mỹ và các nhà cung cấp phần cứng của họ.

DeepSeek chính xác là gì?

DeepSeek được thành lập vào năm 2023 bởi Liang Wenfeng, người đứng đầu quỹ phòng hộ định lượng sử dụng AI High-Flyer. Công ty phát triển các mô hình AI mã nguồn mở, nghĩa là cộng đồng nhà phát triển có thể kiểm tra và cải tiến phần mềm. Ứng dụng di động của họ đã vươn lên dẫn đầu bảng xếp hạng tải xuống trên iPhone tại Hoa Kỳ sau khi ra mắt vào đầu tháng 1.

Ứng dụng này khác biệt so với các chatbot khác như ChatGPT của OpenAI bằng cách trình bày lập luận trước khi đưa ra phản hồi cho một yêu cầu. Công ty tuyên bố rằng phiên bản R1 của họ có hiệu suất ngang ngửa với phiên bản mới nhất của OpenAI và đã cấp phép cho các cá nhân quan tâm đến việc phát triển chatbot sử dụng công nghệ này để xây dựng dựa trên nó.

DeepSeek R1 so sánh thế nào với OpenAI hoặc Meta AI?

Mặc dù chưa được công ty công bố đầy đủ chi tiết, nhưng chi phí đào tạo và phát triển các mô hình của DeepSeek dường như chỉ bằng một phần nhỏ so với những gì cần thiết cho các sản phẩm tốt nhất của OpenAI hoặc Meta Platforms Inc. Hiệu suất vượt trội của mô hình này đặt ra câu hỏi về sự cần thiết của việc chi tiêu lớn vốn để mua các bộ tăng tốc AI mới nhất và mạnh mẽ nhất từ các công ty như Nvidia Corp. Điều này cũng làm gia tăng sự chú ý đến các hạn chế xuất khẩu của Hoa Kỳ đối với các loại chất bán dẫn tiên tiến sang Trung Quốc — vốn được áp dụng để ngăn chặn một bước đột phá kiểu như DeepSeek đang thể hiện.

DeepSeek cho biết R1 gần ngang bằng hoặc vượt trội hơn so với các mô hình đối thủ trong một số tiêu chuẩn hàng đầu như AIME 2024 cho các nhiệm vụ toán học, MMLU cho kiến thức tổng quát và AlpacaEval 2.0 cho hiệu suất hỏi đáp. Nó cũng nằm trong số những mô hình dẫn đầu trên bảng xếp hạng Chatbot Arena do UC Berkeley liên kết.

Điều gì đang gây báo động tại Hoa Kỳ?

Washington đã cấm xuất khẩu các công nghệ cao cấp như chất bán dẫn GPU sang Trung Quốc, nhằm làm chậm tiến bộ của nước này trong lĩnh vực AI — tiền tuyến quan trọng trong cuộc cạnh tranh công nghệ giữa Hoa Kỳ và Trung Quốc. Tuy nhiên, sự tiến bộ của DeepSeek cho thấy các kỹ sư AI Trung Quốc đã tìm cách vượt qua các hạn chế, tập trung vào hiệu quả cao hơn với nguồn lực hạn chế. Mặc dù vẫn chưa rõ DeepSeek đã tiếp cận được bao nhiêu phần cứng đào tạo AI tiên tiến, nhưng công ty đã chứng minh đủ để cho thấy các hạn chế thương mại chưa hoàn toàn hiệu quả trong việc ngăn chặn tiến bộ của Trung Quốc.

Thời điểm DeepSeek thu hút sự chú ý toàn cầu?

Nhà phát triển AI này đã được theo dõi sát sao kể từ khi ra mắt mô hình đầu tiên vào năm 2023. Sau đó, vào tháng 11, họ đã cho thế giới cái nhìn thoáng qua về mô hình lập luận DeepSeek R1, được thiết kế để mô phỏng tư duy con người. Mô hình này là nền tảng cho ứng dụng chatbot di động của họ, cùng với giao diện web ra mắt vào tháng 1, đã nhanh chóng nổi tiếng toàn cầu như một giải pháp thay thế rẻ hơn nhiều so với OpenAI, với nhà đầu tư Marc Andreessen gọi đây là “khoảnh khắc Sputnik của AI.”

Theo dữ liệu từ công ty theo dõi thị trường App Figures, ứng dụng di động DeepSeek đã được tải xuống 1,6 triệu lần tính đến ngày 25 tháng 1 và đứng đầu bảng xếp hạng cửa hàng ứng dụng iPhone tại Úc, Canada, Trung Quốc, Singapore, Mỹ và Anh.

Người sáng lập DeepSeek là ai?

Sinh năm 1985 tại Quảng Đông, Liang Wenfeng nhận bằng cử nhân và thạc sĩ về kỹ thuật điện tử và công nghệ thông tin từ Đại học Chiết Giang. Ông thành lập DeepSeek với số vốn đăng ký 10 triệu nhân dân tệ (1,4 triệu USD), theo cơ sở dữ liệu công ty Tianyancha.

Trong một cuộc phỏng vấn với trang tin Trung Quốc 36kr, Liang cho biết điểm nghẽn để tiến xa hơn không phải là huy động thêm vốn, mà là các hạn chế của Hoa Kỳ đối với việc tiếp cận các chip tốt nhất. Ông chia sẻ rằng phần lớn các nhà nghiên cứu hàng đầu của mình là những sinh viên mới tốt nghiệp từ các trường đại học hàng đầu Trung Quốc, đồng thời nhấn mạnh sự cần thiết của việc Trung Quốc phát triển hệ sinh thái nội địa giống như hệ sinh thái xung quanh Nvidia và các chip AI của họ.

“Đầu tư nhiều hơn không nhất thiết dẫn đến nhiều đổi mới hơn. Nếu không, các công ty lớn sẽ chiếm lĩnh mọi sáng tạo,” Liang nói.

DeepSeek đứng ở vị trí nào trong bức tranh AI của Trung Quốc?

Các ông lớn công nghệ Trung Quốc, từ Alibaba Group Holding Ltd., Baidu Inc. đến Tencent Holdings Ltd., đã đổ một lượng tiền và tài nguyên đáng kể vào cuộc đua để giành lấy phần cứng và khách hàng cho các dự án AI của họ. Cùng với startup 01.AI của Kai-Fu Lee, DeepSeek nổi bật với cách tiếp cận mã nguồn mở — được thiết kế để thu hút lượng người dùng lớn nhất một cách nhanh chóng trước khi phát triển các chiến lược kiếm tiền trên cơ sở lượng khán giả lớn đó.

Vì các mô hình của DeepSeek có giá cả phải chăng hơn, nó đã đóng một vai trò trong việc giúp giảm chi phí cho các nhà phát triển AI tại Trung Quốc, nơi các công ty lớn hơn đã tham gia vào một cuộc chiến giá cả với nhiều đợt giảm giá liên tiếp trong một năm rưỡi qua.

Những tác động đối với thị trường AI toàn cầu là gì?

Thành công của DeepSeek có thể thúc đẩy OpenAI và các nhà cung cấp khác của Hoa Kỳ giảm giá để duy trì vị thế dẫn đầu của họ. Nó cũng đặt ra câu hỏi về việc chi tiêu lớn của các công ty như Meta và Microsoft Corp. — mỗi công ty đã cam kết chi tiêu vốn (capex) 65 tỷ USD hoặc hơn trong năm nay, chủ yếu cho cơ sở hạ tầng AI — nếu các mô hình hiệu quả hơn có thể cạnh tranh với mức đầu tư nhỏ hơn nhiều.

Điều này đã làm chao đảo thị trường chứng khoán toàn cầu khi các nhà đầu tư bán tháo cổ phiếu của các công ty như Nvidia Corp. và ASML Holding NV, vốn được hưởng lợi từ nhu cầu bùng nổ cho các dịch vụ AI. Trong khi đó, cổ phiếu của các công ty Trung Quốc liên quan đến DeepSeek, như Iflytek Co., đã tăng giá.

Các nhà phát triển trên khắp thế giới đã bắt đầu thử nghiệm phần mềm của DeepSeek và tìm cách xây dựng các công cụ dựa trên nó. Điều này có thể đẩy nhanh việc áp dụng các mô hình lập luận AI tiên tiến — đồng thời cũng có khả năng làm dấy lên thêm lo ngại về sự cần thiết của các biện pháp kiểm soát xung quanh việc sử dụng chúng. Những tiến bộ của DeepSeek có thể thúc đẩy quá trình điều chỉnh quy định để kiểm soát cách thức phát triển AI.

Những điểm yếu của DeepSeek là gì?

Giống như tất cả các mô hình AI khác của Trung Quốc, DeepSeek tự kiểm duyệt các chủ đề được coi là nhạy cảm ở Trung Quốc. Nó chuyển hướng các truy vấn về các cuộc biểu tình ở Quảng trường Thiên An Môn năm 1989 hoặc các câu hỏi căng thẳng về mặt địa chính trị như khả năng Trung Quốc xâm lược Đài Loan. Trong các cuộc thử nghiệm, bot DeepSeek có khả năng đưa ra các phản hồi chi tiết về các nhân vật chính trị như Thủ tướng Ấn Độ Narendra Modi, nhưng từ chối làm như vậy về Chủ tịch Trung Quốc Tập Cận Bình.

Cơ sở hạ tầng đám mây của DeepSeek có thể sẽ bị thử thách bởi sự phổ biến đột ngột của nó. Công ty đã gặp sự cố ngừng hoạt động lớn trong thời gian ngắn vào ngày 27 tháng 1 và sẽ phải quản lý nhiều lưu lượng truy cập hơn nữa khi người dùng mới và người dùng cũ đổ thêm nhiều truy vấn vào chatbot.

Bản tiếng Việt của The Canada Life

Danh mục tin tức

DeepSeek của Trung Quốc là gì và tại sao nó khiến thế giới AI dậy sóng?

ĐỌC THÊM