无问芯穹(Infinigence AI)是一家聚焦于人工智能算力基础设施的科技公司,致力于解决异构算力整合与大模型部署效率问题。
- 成立时间:2023 年 5 月,总部位于上海。
- 核心团队:由清华大学电子工程系主任汪玉教授发起,CEO 夏立雪、CTO 颜深根均为清华系成员,研发人员占比超 70%,技术积累深厚。
- 股东阵容:获百度、腾讯、智谱 AI、红杉中国、真格基金等顶级机构投资,累计融资近 10 亿元(截至 2024 年 9 月)。
-
异构算力平台
- Infini-AI 大模型开发与服务平台:支持 20 + 主流模型(如 Baichuan2、ChatGLM3、Llama2 等)和 10 余种国产 / 国际芯片(AMD、壁仞、寒武纪等),提供跨芯片的软硬件联合优化,降低大模型部署成本。
- 千卡规模异构混训平台:支持 6 种芯片混训,可发起 700 亿参数模型训练,提升算力集群利用率。
-
端侧模型开源
- Megrez-3B-Omni:首个端侧全模态理解模型(文本、图像、语音),适配手机、平板等设备,通过软硬件协同优化实现高效推理。
- Megrez-3B-Instruct:纯语言模型,推理速度领先同精度模型 300%,支持 AI 搜索功能。
- 软硬协同优化:通过稀疏计算、低比特量化、算子融合等技术,提升模型在中端硬件上的性能,部分场景推理速度超商用软件 3 倍。
- 生态整合能力:与国内主流芯片厂商(如壁仞、摩尔线程)、算力集群(上海仪电、宁夏电信)及大模型公司(Kimi、智谱 AI)深度合作,构建 “M 种模型 ×N 种芯片” 的开放生态。
- 角色:扮演 “算力运营商”,将异构算力资源标准化,提供类似水电煤的即用型服务。
- 目标:通过技术创新,使大模型落地成本降低 10000 倍,推动 AI 普惠化。
- 盈利模式:以算力云服务为主,预计 3-5 年内实现规模化盈利。
- 解决国产算力痛点:针对国内算力资源分散、异构芯片兼容性差的问题,提供高效整合方案,助力国产 AI 生态自主化。
- 技术验证:与 AMD、商汤等企业合作,在模型训练和推理性能上取得显著突破,获得行业认可。
无问芯穹凭借清华系技术背景、资本支持及清晰的战略定位,已成为国产 AI 算力基础设施领域的重要玩家,其发展路径反映了中国在大模型时代对算力效率的迫切需求。