大模型
文本
多模态
语音
视觉
Baichuan-M2-32B
百川-M2-32B 是百川AI的医疗增强推理模型,是百川发布的第二个医疗模型。
2025-08-19更新
gpt-oss-120b
适用于生产环境、通用且高推理需求的应用场景,可以在单个 80GB GPU(如 NVIDIA H100 或 AMD MI300X)上运行(117B 参数,其中 5.1B 活跃参数)
2025-08-19更新
gpt-oss-20b
适用于低延迟和本地或特定应用场景(21B 参数,其中 3.6B 活跃参数)
2025-08-19更新
Qwen3-32B
Qwen3-32B是通义千问系列中参数规模达320亿的高性能语言模型,具备更强的语义理解、逻辑推理和多轮对话能力,适用于复杂、高精度的自然语言处理任务。
2025-08-19更新
Qwen3-8B
Qwen3-8B是通义千问系列的最新一代大语言模型,具备强大的语言理解与生成能力,支持多轮对话、内容创作、逻辑推理等多样化任务。
2025-08-19更新
Qwen3-4B
Qwen3-4B 是通义千问系列中一个拥有40亿参数的高效语言模型,适用于对性能和资源消耗有平衡要求的中等复杂度任务。
2025-08-19更新
MiniCPM4-8B
MiniCPM4 系列是专为终端设备设计的高度高效的大语言模型 (LLMs),通过在四个关键维度上的系统性创新实现了这一效率:模型架构、训练数据、训练算法和推理系统。
2025-08-19更新
Hunyuan-A13B-Instruct
拥有800亿总参数和130亿激活参数。不仅在效果上达到了高标准,而且在尺寸上也做到了极致的优化,成功平衡了模型性能与资源占用。
2025-08-19更新
