gpt-oss 是 OpenAI 推出的一系列開源模型,旨在支持強(qiáng)大的推理、代理任務(wù)和通用開發(fā)者使用場(chǎng)景。該系列模型提供了兩種不同規(guī)模的模型:gpt-oss-120b 和 gpt-oss-20b,分別適用于生產(chǎn)環(huán)境和低延遲、本地或特定用途的場(chǎng)景。這些模型在訓(xùn)練過程中使用了 OpenAI 的 harmony 響應(yīng)格式,并且僅支持該格式的輸入,否則無法正常工作。
- gpt-oss開源項(xiàng)目地址:https://github.com/openai/gpt-oss
- gpt-oss官網(wǎng)入口網(wǎng)址:https://openai.com/zh-Hans-CN/open-models/

gpt-oss 模型具有多項(xiàng)優(yōu)勢(shì),包括可配置的推理能力、完整的鏈?zhǔn)酵评磉^程、可微調(diào)的模型、代理能力、MXFP4 量化支持等。這些特性使得模型在推理效率和性能上具有顯著優(yōu)勢(shì)。此外,模型采用 Apache 2.0 許可,允許自由使用、定制和商業(yè)部署。
用戶可以通過多種方式使用 gpt-oss,包括使用 Transformers 庫、vLLM、Ollama、LM Studio 等工具進(jìn)行推理。此外,gpt-oss 提供了多種參考實(shí)現(xiàn),包括 PyTorch、Triton、Metal 等,以滿足不同硬件和場(chǎng)景的需求。
gpt-oss 是一個(gè)開源、高性能的模型系列,適合開發(fā)者和研究人員在多種場(chǎng)景下進(jìn)行推理和開發(fā)。
相關(guān)導(dǎo)航
暫無評(píng)論...