DeepSeek của Trung Quốc và các mô hình AI mã nguồn mở của nó

Cảnh quan trí tuệ nhân tạo (AI) của Trung Quốc đã chứng kiến một sự phát triển đột phá đang định hình lại nhận thức toàn cầu về đổi mới và khả năng cạnh tranh. DeepSeek, một công ty khởi nghiệp AI của Trung Quốc, đã làm kinh ngạc thế giới công nghệ với cách tiếp cận hiệu quả về tài nguyên và mô hình AI R1 tiên tiến.

Hoạt động dưới các hạn chế từ các kiểm soát xuất khẩu chất bán dẫn của Mỹ, công ty có trụ sở tại Hàng Châu đã đạt được điều mà nhiều người cho là không thể—xây dựng một mô hình ngôn ngữ lớn (LLM) cạnh tranh với chi phí chỉ bằng một phần nhỏ so với các hệ thống như vậy. Thành tựu này đã gửi sóng chấn động trên các thị trường, với các cổ phiếu công nghệ của Mỹ, đặc biệt là trong lĩnh vực AI, bị ảnh hưởng khi các nhà đầu tư đánh giá lại sự thống trị lâu dài của các công ty Mỹ như OpenAI và Google.

Sự trỗi dậy của DeepSeek là biểu tượng của Chiến lược rộng lớn hơn của Trung Quốc để vượt qua các hạn chế, tối đa hóa đổi mới và định vị mình là một nhà lãnh đạo toàn cầu trong lĩnh vực AI vào năm 2030. Bài viết này xem xét cách DeepSeek đã đạt được thành công của mình, những gì nó tiết lộ về tham vọng AI của Trung Quốc và những tác động rộng hơn đối với cuộc đua công nghệ toàn cầu.

DeepSeek là gì và tại sao nó nổi bật?

DeepSeek đã nổi lên như một cái tên nổi bật trong lĩnh vực AI của Trung Quốc, được công nhận nhờ cách tiếp cận sáng tạo và khả năng thu hút nhân tài hàng đầu. Công ty, được thành lập vào năm 2023 tại Hàng Châu—một trung tâm công nghệ nổi tiếng và là nơi có các công ty như Alibaba—đã tuyển dụng các nhà nghiên cứu AI xuất sắc từ các trường đại học hàng đầu bằng cách cung cấp mức lương cạnh tranh và cơ hội làm việc trên các dự án tiên tiến. Được lãnh đạo bởi doanh nhân Liang Wenfeng, người cũng đứng đầu công ty mẹ High-Flyer, DeepSeek đã nhanh chóng định vị mình là một người chơi quan trọng trong bối cảnh AI toàn cầu.

Mặc dù hoạt động dưới các hạn chế, bao gồm cả các hạn chế của Mỹ đối với phần cứng AI tiên tiến, DeepSeek đã thể hiện hiệu quả đáng kể trong quá trình phát triển của mình. Mô hình AI R1 mới nhất của nó, được ra mắt vào tháng 1 năm 2025, được báo cáo là hoạt động ngang bằng với ChatGPT của OpenAI, thể hiện khả năng của công ty trong việc cạnh tranh ở cấp độ cao nhất. Mô hình cơ sở V3 trước đó, được phát triển chỉ trong hai tháng với ngân sách dưới 6 triệu USD, minh họa cách tiếp cận hiệu quả về tài nguyên của nó—đứng trong sự tương phản rõ rệt với hàng tỷ đô la được chi tiêu bởi các công ty lớn của Mỹ như OpenAI, Meta và Anthropic.

Cách tiếp cận này thách thức các giả định truyền thống về chi phí và cơ sở hạ tầng cần thiết để xây dựng các hệ thống AI cạnh tranh, có khả năng định hình lại nhận thức toàn cầu về khả năng mở rộng và khả năng tiếp cận AI. Nvidia, một nhà cung cấp chip AI hàng đầu, đã khen ngợi việc sử dụng sáng tạo của DeepSeek về test-time scaling, một phương pháp nâng cao hiệu suất trong quá trình triển khai mô hình. Sự công nhận như vậy làm nổi bật cách chiến lược của DeepSeek đang định nghĩa lại các tiêu chuẩn ngành, với những tác động vượt xa Trung Quốc.

DeepSeek đứng ở đâu so với các nhà lãnh đạo toàn cầu như OpenAI và Google?

Công nghệ AI của DeepSeek đã thu hút sự chú ý đáng kể nhờ khả năng của nó, đặc biệt là so với các nhà lãnh đạo toàn cầu đã được thiết lập như OpenAI và Google. Mô hình trước đó của nó, DeepSeek-V3, đã thể hiện khả năng ấn tượng trong việc xử lý một loạt các nhiệm vụ bao gồm trả lời câu hỏi, giải quyết các vấn đề logic và thậm chí viết các chương trình máy tính. Những chức năng này ngang bằng với các hệ thống AI tốt nhất hiện có, như được thể hiện qua các bài kiểm tra tiêu chuẩn.

Tuy nhiên, ngay trước khi DeepSeek ra mắt, OpenAI đã giới thiệu hệ thống tiên tiến của riêng mình, OpenAI o3, mà một số chuyên gia tin rằng đã vượt qua DeepSeek-V3 về mặt hiệu suất. OpenAI o3 được thiết kế đặc biệt để "lý luận" qua các vấn đề phức tạp trong các lĩnh vực như toán học, khoa học và lập trình—những lĩnh vực được coi là quan trọng cho tương lai của AI. Mặc dù DeepSeek chưa phát hành một mô hình lý luận tương đương, nhiều người quan sát đã lưu ý đến khoảng cách này.

Trong một động thái bất ngờ, DeepSeek đã đáp lại thách thức này bằng cách ra mắt mô hình lý luận của riêng mình, DeepSeek R1, vào ngày 20 tháng 1 năm 2025. Mô hình này đã gây ấn tượng với các chuyên gia trong lĩnh vực và việc phát hành của nó đã đánh dấu một bước ngoặt. Cộng đồng AI, cùng với các nhà đầu tư toàn cầu, nhanh chóng nhận ra tầm quan trọng tiềm năng của những tiến bộ của DeepSeek, gây ra mối lo ngại rộng rãi và sự biến động thị trường, đặc biệt là trong số các nhà đầu tư có trụ sở tại Mỹ.

Với sự ra mắt của DeepSeek R1, công ty đã củng cố vị thế của mình như một đối thủ đáng gờm trong cuộc đua AI toàn cầu, thể hiện khả năng cạnh tranh với các đối thủ lớn như OpenAI và Google—mặc dù hoạt động dưới những hạn chế đáng kể, bao gồm cả các hạn chế xuất khẩu của Mỹ đối với phần cứng quan trọng. Sự phát triển này định vị DeepSeek không chỉ là một người chơi quan trọng trong lĩnh vực AI của Trung Quốc mà còn là một lực lượng đang lên trên sân khấu toàn cầu.

Cách Trung Quốc đang thúc đẩy đổi mới AI bất chấp các hạn chế về chất bán dẫn

Tiến bộ của Trung Quốc trong AI, bất chấp các hạn chế xuất khẩu chất bán dẫn của Mỹ, cho thấy khả năng thích ứng và đổi mới đáng kể của nước này trong bối cảnh hạn chế. Thành công được thúc đẩy bởi ba yếu tố chính: sử dụng tài nguyên hiệu quả, lập kế hoạch chiến lược và một nguồn nhân lực AI mạnh mẽ. Các công ty Trung Quốc, bao gồm cả các công ty khởi nghiệp như DeepSeek và các gã khổng lồ công nghệ như Tencent, đã đạt được những đột phá đáng kể trong AI bằng cách tối ưu hóa việc sử dụng phần cứng kém mạnh mẽ hơn. Ví dụ, mô hình Hunyuan-Large của Tencent đã vượt trội hơn Llama 3.1 của Meta trên nhiều tiêu chuẩn, cho thấy khả năng cạnh tranh của Trung Quốc trên sân khấu toàn cầu bất chấp những thách thức về phần cứng. Tương tự, mô hình AI mới của DeepSeek, DeepSeek R1, đã thu hút sự chú ý vì phù hợp hoặc thậm chí vượt qua ChatGPT o1 của OpenAI trong một số tiêu chuẩn, nhưng với chi phí chỉ bằng một phần nhỏ, cung cấp một giải pháp thay thế cho các nhà nghiên cứu và nhà phát triển có nguồn lực hạn chế.

Những thành tựu này phần lớn có thể thực hiện được nhờ các đổi mới phần mềm tiên tiến và các kỹ thuật hiệu quả tối đa hóa đầu ra tính toán trong khi giảm thiểu yêu cầu phần cứng. Mặc dù phải đối mặt với việc tiếp cận hạn chế với các GPU Nvidia tiên tiến, các phòng thí nghiệm AI của Trung Quốc đã có thể sản xuất các mô hình đẳng cấp thế giới, minh họa tầm quan trọng của đổi mới thuật toán trong việc vượt qua các hạn chế phần cứng. Cách tiếp cận của DeepSeek, chẳng hạn, đã giảm sử dụng bộ nhớ và tăng tốc tính toán mà không làm giảm độ chính xác, cho phép công ty tiếp tục phát triển các mô hình hiệu suất cao với các nguồn lực phần cứng hạn chế.

Một phản ứng chiến lược quan trọng đối với các biện pháp kiểm soát xuất khẩu của Mỹ là khả năng của Trung Quốc trong việc tích trữ GPU Nvidia trước khi các hạn chế được thực hiện. DeepSeek, chẳng hạn, được cho là đã tích lũy hàng chục nghìn chip này, điều này đã đảm bảo quyền truy cập liên tục vào các nguồn lực thiết yếu để đào tạo các mô hình AI. Một số công ty Trung Quốc cũng đã phải thuê quyền truy cập GPU từ các nhà cung cấp đám mây nước ngoài hoặc mua phần cứng thông qua các trung gian để vượt qua các hạn chế. Những phương pháp này đã cho phép các công ty duy trì đà phát triển AI bất chấp những hạn chế, làm nổi bật những hạn chế của chính sách của Mỹ. Mặc dù các biện pháp kiểm soát xuất khẩu đã khiến các công ty Trung Quốc khó tiếp cận phần cứng tiên tiến, nhưng chúng không hoàn toàn kìm hãm được tiến bộ AI của Trung Quốc.

Kho tài năng AI rộng lớn của Trung Quốc là một yếu tố quan trọng khác trong khả năng duy trì tính cạnh tranh của nước này. Với số lượng ngày càng tăng các nhà nghiên cứu AI hàng đầu, vượt qua cả Mỹ, đất nước này là nơi có dòng chảy liên tục của chuyên môn và đổi mới. Các nguyên tắc mã nguồn mở cũng được đón nhận rộng rãi, với các công ty như Alibaba và các công ty khởi nghiệp như DeepSeek và 01.AI đóng góp vào hệ sinh thái AI mở, thúc đẩy phát triển và thúc đẩy hợp tác. Hơn nữa, khả năng tiếp cận các tập dữ liệu phong phú và sự hỗ trợ đáng kể của chính phủ đảm bảo dòng chảy liên tục của tài năng và nguồn lực cần thiết để đẩy lùi ranh giới AI.

Mặc dù có những tiến bộ này, nhưng vẫn còn những thách thức. Các biện pháp kiểm soát xuất khẩu của Mỹ nhằm hạn chế quy mô và hiệu quả của việc đào tạo AI bằng cách giảm khả năng tiếp cận các chip tiên tiến, tạo ra những trở ngại cho các công ty Trung Quốc phát triển các mô hình quy mô lớn. Tuy nhiên, hiệu quả lâu dài của chiến lược này vẫn chưa chắc chắn. Khi phát triển AI ngày càng phụ thuộc vào tính toán hiệu suất cao, Mỹ có thể cần phải xem xét lại các hạn chế rộng rãi của mình và chuyển trọng tâm sang các chính sách nhắm mục tiêu giải quyết các mối quan tâm cụ thể, chẳng hạn như phát triển các hệ thống AI quân sự, thay vì cố gắng hạn chế quyền truy cập vào các công nghệ AI thương mại.
Khả năng của Trung Quốc trong việc biến các hạn chế về chất bán dẫn thành cơ hội đổi mới báo hiệu khả năng phục hồi và khả năng thích ứng ngày càng tăng của nước này trước những thách thức địa chính trị. Sự xuất hiện của các công ty như DeepSeek và các mô hình AI ấn tượng của nó đánh dấu một giai đoạn mới trong hành trình AI của Trung Quốc, một giai đoạn được đánh dấu bằng hiệu quả, hợp tác và đóng góp mã nguồn mở ngày càng tăng, củng cố vị thế cạnh tranh của nước này trên toàn cầu.

Tại sao tiến bộ AI của Trung Quốc lại quan trọng trên quy mô toàn cầu?

Những bước tiến nhanh chóng của Trung Quốc trong lĩnh vực AI đang định hình lại bối cảnh công nghệ toàn cầu, với những tác động đáng kể đến cạnh tranh, hợp tác và chính sách quốc tế. Bất chấp những thách thức do các hạn chế xuất khẩu của Mỹ đối với các chip tiên tiến, các công ty Trung Quốc, chẳng hạn như trong trường hợp của DeepSeek, đang chứng minh rằng đổi mới có thể phát triển mạnh mẽ trong điều kiện hạn chế tài nguyên.

Trên quy mô toàn cầu, những tiến bộ AI của Trung Quốc đang ảnh hưởng đến động lực cạnh tranh giữa các quốc gia và thúc đẩy các cuộc thảo luận mới về quản trị AI. Trong khi các công ty Mỹ, bao gồm OpenAI, tập trung vào việc nâng cao sức mạnh tính toán để cung cấp các mô hình tinh vi hơn, hệ sinh thái AI của Trung Quốc đã đi theo một con đường khác, ưu tiên hiệu quả và đổi mới bất chấp những hạn chế về phần cứng. Cách tiếp cận chiến lược này không chỉ thu hẹp khoảng cách giữa Trung Quốc và Mỹ mà còn đưa ra một mô hình phát triển AI mới mà các quốc gia khác có thể muốn noi theo. Sự thay đổi trong cân bằng quyền lực AI có những tác động rộng lớn hơn, với các quốc gia trên thế giới có thể đánh giá lại chiến lược của mình và tìm kiếm cơ hội hợp tác mới với các công ty Trung Quốc.

Hơn nữa, tiến bộ AI của Trung Quốc đang buộc phải suy nghĩ lại về chính sách AI toàn cầu. Khi cạnh tranh nóng lên, các quốc gia ngày càng tập trung vào việc điều chỉnh AI để quản lý các tác động đạo đức và an ninh của nó. Tuy nhiên, cách tiếp cận mã nguồn mở của Trung Quốc, như đã thấy với quyết định của DeepSeek phát hành các mô hình tốt nhất của mình miễn phí, thách thức mô hình dựa trên tường phí được các công ty Mỹ như OpenAI ưa chuộng. Điều này đặt ra những câu hỏi quan trọng về quyền truy cập, công bằng và đổi mới trong AI. Nó cũng cho thấy sự căng thẳng giữa việc thúc đẩy đổi mới thông qua sự cởi mở và nhu cầu bảo vệ quyền sở hữu trí tuệ và kiểm soát các công nghệ tiên tiến.

Những tiến bộ về AI của Trung Quốc cũng mang lại cơ hội hợp tác mới. Với kho tài năng rộng lớn và cam kết nghiên cứu mã nguồn mở, Trung Quốc đang đóng góp vào hệ sinh thái AI toàn cầu, nơi kiến thức được chia sẻ có thể dẫn đến tiến bộ nhanh hơn. Khi các quốc gia tìm cách khai thác tiềm năng của AI cho tăng trưởng kinh tế và công nghệ, vai trò ngày càng tăng của Trung Quốc với tư cách là một nhân tố chủ chốt trong phát triển AI sẽ định hình tương lai của đổi mới toàn cầu và ảnh hưởng đến các khuôn khổ chính sách AI trong nhiều năm tới.

Thông tin tác giả gốc

China Briefing là một trong năm ấn phẩm khu vực của Asia Briefing, được hỗ trợ bởi Dezan Shira & Associates. Để đăng ký miễn phí các sản phẩm nội dung của China Briefing, vui lòng nhấp vào đây.

Dezan Shira & Associates hỗ trợ các nhà đầu tư nước ngoài vào Trung Quốc và đã làm như vậy từ năm 1992 thông qua các văn phòng tại Bắc Kinh, Thiên Tân, Đại Liên, Thanh Đảo, Thượng Hải, Hàng Châu, Ninh Ba, Tô Châu, Quảng Châu, Hải Khẩu, Trung Sơn, Thâm Quyến và Hồng Kông. Chúng tôi cũng có văn phòng tại Việt Nam, Indonesia, Singapore, Hoa Kỳ, Đức, Ý, Ấn Độ và Dubai (UAE) và các công ty đối tác hỗ trợ các nhà đầu tư nước ngoài tại Philippines, Malaysia, Thái Lan, Bangladesh và Úc. Để được hỗ trợ tại Trung Quốc, vui lòng liên hệ với công ty theo địa chỉ [email protected] hoặc truy cập trang web của chúng tôi tại www.dezshira.com.