AI开发平台

无问芯穹

AI大模型服务平台,提供从算力、模型到应用的全方位一站式服务。

标签:
无问芯穹(Infinigence AI)是一家聚焦于人工智能算力基础设施的科技公司,致力于解决异构算力整合与大模型部署效率问题。

公司背景

  • 成立时间:2023 年 5 月,总部位于上海。
  • 核心团队:由清华大学电子工程系主任汪玉教授发起,CEO 夏立雪、CTO 颜深根均为清华系成员,研发人员占比超 70%,技术积累深厚。
  • 股东阵容:获百度、腾讯、智谱 AI、红杉中国、真格基金等顶级机构投资,累计融资近 10 亿元(截至 2024 年 9 月)。

技术与产品

  1. 异构算力平台
    • Infini-AI 大模型开发与服务平台:支持 20 + 主流模型(如 Baichuan2、ChatGLM3、Llama2 等)和 10 余种国产 / 国际芯片(AMD、壁仞、寒武纪等),提供跨芯片的软硬件联合优化,降低大模型部署成本。
    • 千卡规模异构混训平台:支持 6 种芯片混训,可发起 700 亿参数模型训练,提升算力集群利用率。
  2. 端侧模型开源
    • Megrez-3B-Omni:首个端侧全模态理解模型(文本、图像、语音),适配手机、平板等设备,通过软硬件协同优化实现高效推理。
    • Megrez-3B-Instruct:纯语言模型,推理速度领先同精度模型 300%,支持 AI 搜索功能。

核心竞争力

  • 软硬协同优化:通过稀疏计算、低比特量化、算子融合等技术,提升模型在中端硬件上的性能,部分场景推理速度超商用软件 3 倍。
  • 生态整合能力:与国内主流芯片厂商(如壁仞、摩尔线程)、算力集群(上海仪电、宁夏电信)及大模型公司(Kimi、智谱 AI)深度合作,构建 “M 种模型 ×N 种芯片” 的开放生态。

市场定位与愿景

  • 角色:扮演 “算力运营商”,将异构算力资源标准化,提供类似水电煤的即用型服务。
  • 目标:通过技术创新,使大模型落地成本降低 10000 倍,推动 AI 普惠化。
  • 盈利模式:以算力云服务为主,预计 3-5 年内实现规模化盈利。

行业影响

  • 解决国产算力痛点:针对国内算力资源分散、异构芯片兼容性差的问题,提供高效整合方案,助力国产 AI 生态自主化。
  • 技术验证:与 AMD、商汤等企业合作,在模型训练和推理性能上取得显著突破,获得行业认可。
无问芯穹凭借清华系技术背景、资本支持及清晰的战略定位,已成为国产 AI 算力基础设施领域的重要玩家,其发展路径反映了中国在大模型时代对算力效率的迫切需求。

相关导航