大模型推理一体机集成了业界领先的硬件和软件,为企业提供从测试到应用的私有化部署方案
以存换算全系统推理架构,深度优化 HBM / DRAM / SSD 与 CPU / GPU / NPU 的协同,突破显存容量限制,充分释放系统存力与算力。
内置 DeepSeek 系列大模型,多种算力配置,兼容业界主流大模型的不同参数,丰富的 API 接口,提供使用页面,支持Agent,开箱即用。
本地部署,离线数据,满足企业数据安全与合规要求。支持私有化定制,打造专属智能体。
一体化设计,即插即用,无需复杂配置。提供完整的管理界面,简化运维工作,降低使用门槛。
仅需单个消费级 GPU 即可在本地运行 Mixtral 8x22B 和 DeepSeek-Coder-V2 等千亿级大模型。
仅需单 GPU 卡跑1M超长上下文的高性能推理框架,生成速度达 17 token/s。
Prefill 和 Generate 性能大幅领先业界方案:Prefill(响应延迟)、Generate(生成速度)相比业界方案快 3倍 以上。
大模型推理一体机提供多种价位配置,满足不同发展阶段的需求
产品名称 | 千亿大模型开发测试平台 | 千亿大模型单路应用版 | 千亿大模型团队应用版 |
---|---|---|---|
CPU | ≥32 核 | ≥32 核 | ≥64 核 |
内存 | ≥ 512GB | ≥ 512GB | ≥ 1TB |
GPU | ≥ 20G 显存 | ≥ 20G 显存 | ≥ 24G 显存 |
存储 | NVMe/2T/PCIe4.0 | NVMe/2T/PCIe4.0 | NVMe/2T/PCIe5.0, NVMe/4T/PCIe4.0 |
操作系统 | Ubuntu 22.04 LTS | Ubuntu 22.04 LTS | Ubuntu 22.04 LTS |
深度学习框架 | PyTorch 2.0, TensorFlow 2.12 | PyTorch 2.0, TensorFlow 2.12 | PyTorch 2.0, TensorFlow 2.12 |
CUDA版本 | CUDA 12.1 | CUDA 12.1 | CUDA 12.1 |
预装模型 | DS-R1-671B-Q4/Q2, DS-V3-685B-Q4/Q2 | DS-R1-671B-Q4/Q2, DS-V3-685B-Q4/Q2 | DS-R1-671B-Q8/Q4/Q2, DS-V3-685B-Q8/Q4/Q2 |
专注深度学习技术创新,推动人工智能产业化落地
福州市姜尚科技开发有限公司是一家专注于深度学习技术的AI公司。在GAN对抗生成网络,强化学习,集成学习,时间序列建模等领域有着深入的研究。姜尚科技积极拥抱国产AI软硬件平台,探索自主可控的AI解决方案,推动人工智能在各个领域的产业化落地。
深耕深度学习核心技术,持续突破AI技术边界
自主可控的AI解决方案,支持国产化平台
深度服务大模型私有化部署,推动AI产业化落地
《第三届全国人工智能大赛》 AI+视觉特征编码赛道冠军
在众多参赛团队中脱颖而出,展现卓越技术实力
突破性的视觉特征编码技术,推动行业发展
2019年开始ALL IN人工智能;
行业的发展有起伏,我们的追求没有终点
大模型推理一体机适用于多种行业场景
通过AI技术实现个性化教学、智能教务管理及教学质量优化,推动教育资源公平化与教学效率升级。
辅助医学影像诊断、药物研发、病历分析和个性化治疗方案制定,提高医疗效率和精准度。
实现生产线优化、质量控制、预测性维护和供应链管理,提升生产效率和产品质量。
来自各行各业的企业已经通过大模型知识推理一体机实现了业务创新和效率提升
电力服务行业
"大模型知识推理一体机帮助我们构建了智能运维系统,通过分析海量电力数据,为客户提供更精准的运维建议,客户满意度提升了35%,咨询转化率提高了 28%。"
医疗健康行业
"通过部署大模型知识推理一体机,我们建立了医学影像辅助诊断系统,诊断准确率提高了 23%,医生的工作效率提升了40%,大大缩短了患者等待时间。"
科学研究与技术开发行业
"通过部署大模型知识推理一体机,我们以极低的改造成本,无缝对接了材料计算模拟平台和晶体结构数据库。该系统自动解析海量文献与实验数据,快速生成材料性能预测模型,将新材料的研发周期缩短40%,实验试错成本降低32%,并为新能源材料设计提供了98% 可验证的理论方案。"
教育行业
“大模型知识推理一体机以近乎零代码改造的方式,无缝接入了学院原有的教务管理平台和在线学习系统,构建了跨课程的知识推理引擎。该系统实时分析学生作业、实验报告及课堂交互数据,自动生成个性化学习路径,使挂科率下降33%,学生课题参与度提升50%,教师因材施教效率提高3倍以上。”