Qwen2.5-Coder – 阿里Qwen團隊推出的編程語言模型，支持92種編程語言

AI工具2年前 (2024)發佈新公告 AI管理員

1 0 0

Qwen2.5-Coder是什麼

Qwen2.5-Coder 是由阿里巴巴集團 Qwen 團隊推出的編程語言模型，是 Qwen2.5 系列的一部分。模型爲編程任務設計，支持92 種編程語言，在代碼生成、代碼推理、代碼修復等任務上表現出色。Qwen2.5-Coder 包括不同規模的模型，如 1.5B、7B 和即將推出的 32B 版本。Qwen2.5-Coder 在提升編程能力的同時，注重數學和通用任務的能力，支持長文本處理，能生成最多 8K tokens 的內容，保持對多種語言的支持。

Qwen2.5-Coder的主要功能

代碼生成：Qwen2.5-Coder 根據給定的編程提示生成代碼片段，支持多種編程語言。
代碼推理：模型具備代碼推理能力，理解代碼邏輯並提供相關的代碼建議。
代碼修復：幫助識別和修復代碼中的錯誤。
多語言支持：支持多達 92 種編程語言，包括常見的如 Python、Java、C++ 以及小衆語言。
長文本處理：處理長達 128K tokens 的上下文，並生成最多 8K tokens 的文本。

Qwen2.5-Coder的技術原理

自迴歸語言模型：Qwen2.5-Coder 採用自迴歸機制，即模型根據已有的文本序列預測下一個最可能的 token，使模型在文本生成和補全任務中表現出色。
大規模數據預訓練：模型在大規模的編程語言數據集上進行預訓練，數據包括源代碼、文本代碼混合數據和合成數據，總計達到 5.5 萬億 tokens，爲模型提供豐富的編程語境理解能力。
多語言支持：Qwen2.5-Coder 支持多達 92 種編程語言，使其能處理和生成多種語言的代碼，得益於模型在預訓練階段對多種編程語言數據的學習和理解。
長文本處理：模型能理解和生成長達 128K tokens 的文本，對於處理複雜的編程項目和長代碼文件尤爲重要。

Qwen2.5-Coder的項目地址

項目官網：qwenlm.github.io/blog/qwen2.5-coder
GitHub倉庫：https://github.com/QwenLM/Qwen2.5-Coder
HuggingFace模型庫：https://huggingface.co/collections/Qwen/qwen25-coder-66eaa22e6f99801bf65b0c2f