中国AI正掀起全球"算(suan)力平权(quan)"革命(ming)。
当中国AI初创企业DeepSeek以557.6万(wan)美金的训练成本,在(zai)数学推理(li)、代码生成等(deng)核心指标上(shang)追平硅谷巨头耗资数亿美金打造的模型时,这场由算(suan)法创新与开源生态共同驱动的技(ji)术革命(ming),正在(zai)将科技(ji)巨头垄断的算(suan)力资源转化为普惠(hui)化基础设施。
在(zai)这场由中国企业主导的变革中,本土(tu)生态的构建正在(zai)提速。尽管与国际先进水平仍存(cun)差距,但政策支撑与市场倒逼的双重驱动下,从国产硬(ying)件到(dao)端侧应(ying)用的自主化链条逐步(bu)成型。同时,随(sui)着推理(li)侧算(suan)力成本的降低,“算(suan)力平权(quan)”将有望加速端侧AI和Agent应(ying)用的落地,同时落地应(ying)用也将带来信(xin)创建设需求(qiu),相关板块将迎来新的投资布局机会。
在(zai)这一(yi)背景下,AI技(ji)术的普惠(hui)化和应(ying)用场景的拓展(zhan)成为行业关注的焦点。2025年2月23日,以“模塑全球 无限可能”为主题的全球开发者先锋大会(GDC)圆满落幕。在(zai)这场汇聚全球开发者与创新者的大会上(shang),星(xing)环科技(ji)(688031.SH)正式发布"三位一(yi)体"的DeepSeek全场景解决方(fang)案,涵盖省力版、高阶版和端侧版,全面覆盖个人用户(hu)、企业客户(hu)及行业场景需求(qiu),为用户(hu)提供从个人到(dao)企业、从云端到(dao)本地的全方(fang)位AI应(ying)用支撑。
这种覆盖个人用户(hu)到(dao)企业级(ji)场景的全栈能力,正在(zai)为这场算(suan)力平权(quan)运动提供关键基础设施。
一(yi)、云端协同新范式
在(zai)AI技(ji)术快速普及的当下,星(xing)环科技(ji)通过云端协同与端侧智能的结(jie)合,为用户(hu)提供了即开即用的高效体验(yan)。针对轻量化需求(qiu)场景,星(xing)环科技(ji)推出了网页版及小程序服务,用户(hu)无需下载或配(pei)置(zhi),即可直接调用DeepSeek 671B满血(xue)版模型的AI搜索能力。这种“打开即AI”的模式,让普通用户(hu)能够快速体验(yan)大模型的语义(yi)理(li)解、信(xin)息检(jian)索等(deng)核心功能。
然(ran)而,纯在(zai)线模式存(cun)在(zai)一(yi)些局限性。首先,在(zai)线模式需要将用户(hu)数据上(shang)传至云端处理(li),高度依赖网络稳(wen)定性。弱网环境可能导致(zhi)响应(ying)延迟或服务中断,影(ying)响对实时性要求(qiu)较高的场景,如(ru)实时翻译和AR交互。其次(ci),用户(hu)原始数据(如(ru)照片、语音)需传输(shu)至云端,存(cun)在(zai)被截获(huo)或滥用的风险,尤其在(zai)金融、医(yi)疗等(deng)敏感领域难以满足合规要求(qiu)。此外,部(bu)分场景因政策或物理(li)限制无法联网,纯在(zai)线模式无法提供服务。
为解决这些问题,星(xing)环科技(ji)推出了“无涯问知 AI PC”版,并接入DeepSeek,实现大模型在(zai)个人电脑端的本地化流畅运行。通过分层常识蒸馏技(ji)术,星(xing)环科技(ji)将参数量高达6710亿的原始大模型压缩至轻量级(ji)版本。这一(yi)技(ji)术并非简单缩小模型,而是通过保留核心能力,攻克了终(zhong)端部(bu)署的三大瓶颈——存(cun)储空间、算(suan)力消耗与推理(li)延迟,使端侧AI从“能用”进阶为“好用”。
星(xing)环科技(ji)的解决方(fang)案不仅让端侧AI“好用”,更在(zai)隐私与效能之间找(zhao)到(dao)了完美的平衡。数据全程封闭处理(li),结(jie)合本地RAG(检(jian)索增强生成)技(ji)术,用户(hu)可以离(li)线分析敏感文件。某律所的实测结(jie)果显示,法律案例解析效率(lu)提升了50%,且数据零出网,充分保障了用户(hu)隐私。同时,通过Intel Ultra处理(li)器的专项优化,性能提升了30%,彻(che)底打破了“AI必须依赖高端硬(ying)件”的固有认知,仅需8GB内存(cun)即可运行大模型。此外,星(xing)环科技(ji)还实现了云端协同的“双模智能”。这种动态调度能力,让一(yi)台普通笔记本电脑同时具备了安全性与高阶智能,兼顾了实时体验(yan)与功能深度。
星(xing)环科技(ji)的这一(yi)布局,填补了国产AI本地化部(bu)署的空白,并为金融、法律等(deng)数据敏感行业提供了安全可控的解决方(fang)案。
市场分析人士指出,端侧AI的“苹果 4时刻”已经到(dao)来。未来,随(sui)着分布式计算(suan)与Agent技(ji)术的深化,终(zhong)端设备将逐步(bu)具备自主任务处理(li)能力,推动AI从工具向(xiang)智能化基石的质变,背后可能是万(wan)亿级(ji)的市场空间。
星(xing)环科技(ji)正与硬(ying)件厂商(shang)深度合作,未来将有更多预(yu)装AI模型的终(zhong)端设备面世。
2025年,星(xing)环科技(ji)与宏碁合作开发了宏碁专属的AI助手(shou)——A星(xing)人专业版,并定制推出了全新的AIPC产品——宏碁优跃PRO。该产品预(yu)装了无涯问知AI系统(tong)和单机版向(xiang)量数据库。此前,星(xing)环科技(ji)已与惠(hui)普合作,推出了预(yu)装无涯问知AI系统(tong)的AI PC套装,旨在(zai)为个人电脑用户(hu)提供本地化AI服务。目前,内置(zhi)星(xing)环科技(ji)AI PC服务的AI PC电脑已在(zai)各(ge)大电商(shang)平台上(shang)线,标志着星(xing)环科技(ji)在(zai)端侧AI领域的布局已初见成效。
二、全栈技(ji)术与场景化服务融合
AI浪潮席卷全球,企业智能化转型已成大势(shi)所趋。在(zai)这场变革中,星(xing)环科技(ji)凭借“全栈技(ji)术+国产化生态”的双重壁垒,构建了企业级(ji)AI部(bu)署的核心竞争力。其战略布局围绕全栈技(ji)术闭环与场景化服务能力两大支点,成功打破传统(tong)AI在(zai)企业级(ji)部(bu)署时的碎(sui)片化困局。
1. 技(ji)术壁垒:全链路能力构建护城河
星(xing)环科技(ji)的核心武(wu)器,是其自主研发的Sophon LLMOps平台。与仅聚焦模型训练或推理(li)的竞品不同,该平台覆盖了从语料处理(li)、提示工程、模型训练调优到(dao)应(ying)用落地的全生命(ming)周(zhou)期管理(li)。例如(ru),在(zai)语料处理(li)环节(jie),平台支撑多模态数据从多源接入,通过转换、过滤、去(qu)重及安全隐私处理(li),解决企业数据分散、质量参差的痛点。
国产化适配(pei)能力,则是另(ling)一(yi)道护城河。星(xing)环科技(ji)的解决方(fang)案支撑国内外GPU/NPU的混合调度,为企业提供了灵活的算(suan)力选择(ze)。此外,平台针对国产GPU(如(ru)寒武(wu)纪、海光(guang)、昇腾等(deng))进行底层优化,充分发挥硬(ying)件性能,支撑FP8等(deng)混合精(jing)度计算(suan)。这不仅提升了资源利用效率(lu),还使得企业能够在(zai)国产化硬(ying)件平台上(shang)实现高性能计算(suan)。这一(yi)自主可控的算(suan)力底座(zuo),可以满足了不同行业对数据安全与合规的要求(qiu)。
凭借这些技(ji)术优势(shi),Sophon LLMOps平台实现了全栈能力覆盖,支撑开源、商(shang)业化及自研模型的统(tong)一(yi)管理(li)。它已成功帮助客户(hu)搭建大模型管理(li)平台,纳管超过30种开闭源的生成式大模型及70余个大模型服务。平台提供基于671B参数规模大模型(R1版本)的训练、推理(li)及应(ying)用开发服务,支撑FP8混合精(jing)度计算(suan),显著提升训练效率(lu)并降低显存(cun)占用,实现了“满血(xue)”性能释放。这种从底层硬(ying)件到(dao)上(shang)层应(ying)用的全方(fang)位优化,不仅提升了技(ji)术的实用性,更为企业级(ji)AI部(bu)署提供了高效、安全、可控的解决方(fang)案。
2、场景化服务能力:垂直场景的“外科手(shou)术式”适配(pei)
技(ji)术优势(shi)向(xiang)商(shang)业价值的转化,则依托于场景化服务能力的精(jing)耕细作。
然(ran)而,下游应(ying)用场景日益(yi)碎(sui)片化与纵深化,技(ji)术提供商(shang)需要对垂直场景进行深度解构,以实现技(ji)术与业务的深度融合。这意味着他(ta)们不仅要具备通用化的技(ji)术能力,更需要深入理(li)解各(ge)行业的Know-How,从而为客户(hu)提供真正贴合业务需求(qiu)的解决方(fang)案。
星(xing)环科技(ji)的Sophon LLMOps平台正是基于这一(yi)理(li)念而构建,以打造"技(ji)术解耦+常识融合"的双轮驱动模式。
平台内置(zhi)高效的分布式训练框架、微调工具链及模型压缩技(ji)术,能够支撑企业快速适配(pei)业务数据,显著降低大模型的应(ying)用门(men)槛。这种场景化开发支撑能力,使得企业能够在(zai)短时间内将AI技(ji)术落地到(dao)实际业务中,提升运营效率(lu)。
此外,Sophon LLMOps平台还结(jie)合金融、政务、医(yi)疗等(deng)行业常识库,打造领域专属的大模型。这些模型针对特定行业的需求(qiu)进行了优化,能够在(zai)业务场景中提供更高的准确性和实用性。例如(ru),在(zai)金融领域,专属模型可以精(jing)准识别风险并辅助投资决策;在(zai)医(yi)疗领域,模型能够支撑辅助诊(zhen)断,提高诊(zhen)断效率(lu)和准确性。
展(zhan)望未来,Sophon LLMOps平台将继续拓展(zhan)其应(ying)用场景,面向(xiang)研发、采购、生产、HSE、营销、综合办公等(deng)多个领域提供集约化的平台服务。通过这种一(yi)站式的服务模式,平台将助力企业核心业务实现智能化转型升级(ji),为企业带来更高效、更智能的运营体验(yan)。
在(zai)技(ji)术优势(shi)与场景化服务能力的双重加持下,企业智能化转型似乎已步(bu)入快车道。然(ran)而,当AI技(ji)术真正触及数据主权(quan)与成本效益(yi)的深水区时,一(yi)个更为复杂的挑战浮出水面——如(ru)何破解企业级(ji)AI部(bu)署中的"不可能三角"?
三、破解企业级(ji)AI部(bu)署中的“不可能三角”
在(zai)AI技(ji)术加速普及的浪潮中,企业级(ji)AI部(bu)署正面临一(yi)场前所未有的挑战。政府机构、央国企以及金融、医(yi)疗等(deng)数据敏感型行业,需要在(zai)保障数据主权(quan)安全的同时,实现AI应(ying)用的高效落地,并有效控制成本。这一(yi)难题被形象地称为企业级(ji)AI部(bu)署的“不可能三角”。
据第(di)三方(fang)测试(shi)数据显示,传统(tong)云端AI方(fang)案的平均响应(ying)延迟高达1.2秒,难以满足实时风控、智能客服等(deng)对时效性要求(qiu)极高的业务场景。与此同时,政府、央国企以及金融、医(yi)疗等(deng)行业涉及大量公民隐私、国家安全和商(shang)业机密数据。随(sui)着《关键信(xin)息基础设施安全保护条例》等(deng)法规的落地,私有化部(bu)署的合规性需求(qiu)愈发凸显。在(zai)此背景下,浙商(shang)证券预(yu)估,随(sui)着DeepSeek等(deng)大模型带动的快速部(bu)署需求(qiu)增长,约80%的央国企大模型使用场景将转向(xiang)私有化部(bu)署。然(ran)而,自建算(suan)力中心的高昂显性成本——动辄千万(wan)级(ji)的投入,以及私有化部(bu)署的隐性成本——高筑的技(ji)术门(men)槛与时间投入,让众多中小机构乃至大机构望而却步(bu)。因此,第(di)三方(fang)服务商(shang)的支撑成为破局的关键。
46万(wan)家央国企的存(cun)量需求(qiu)正在(zai)引(yin)爆一(yi)个千亿级(ji)市场,吸引(yin)众多企业入局。星(xing)环科技(ji)就是其中的范例。
星(xing)环科技(ji)如(ru)何破解这一(yi)“不可能三角”?
星(xing)环科技(ji)通过其Sophon LLMOps平台,为企业提供了一(yi)站式的私有化部(bu)署解决方(fang)案。企业可以利用该平台快速部(bu)署DeepSeek R1模型,实现具备深度思考能力的服务和应(ying)用开发。通过将常识库和工具调用集成到(dao)企业内部(bu),星(xing)环科技(ji)加速了基于大模型的企业级(ji)应(ying)用落地,满足了数据安全与合规的严格要求(qiu)。
此外,星(xing)环科技(ji)还提供全栈私有化交付服务,支撑将R1大模型及其配(pei)套工具链部(bu)署到(dao)企业本地数据中心或专属云环境中。这种定制化服务可根据企业需求(qiu)提供硬(ying)件选型引导、性能调优以及模型轻量化适配(pei),确保在(zai)私有环境下实现高效运行。
以某头部(bu)券商(shang)为例:通过应(ying)用Sophon LLMOps建设自有大模型管理(li)平台,该券商(shang)成功纳管了超过30种开闭源的生成式大模型及70余个大模型服务。平台的易(yi)用性和系统(tong)稳(wen)定性极高,恢复时间目标(RTO)不超过4小时,恢复点目标(RPO)不超过5分钟。基于分布式和容器化的部(bu)署架构,该平台持续稳(wen)定地为招商(shang)证券创意中心、研报助手(shou)、托管助手(shou)和金投客户(hu)智能询价等(deng)场景提供服务,并通过建设国产算(suan)力池,实现了国产NPU算(suan)力与GPU的统(tong)一(yi)管理(li)。
据悉,该项目是国内较早完成国产化推理(li)引(yin)擎、国产化GPU、国内外GPU混合部(bu)署统(tong)一(yi)管理(li)、卡切分及多级(ji)多卡、大/小模型统(tong)一(yi)纳管监控等(deng)前沿技(ji)术的案例。
星(xing)环科技(ji)在(zai)金融场景的深度突破,得益(yi)于其在(zai)金融、政企等(deng)场景的深厚的Know-How积累。
截至2024年6月,星(xing)环科技(ji)已拥有约1600家终(zhong)端用户(hu),覆盖金融、政府、能源、交通、制造等(deng)众多国民经济支柱领域;其中企业服务超过300家金融机构。2024年上(shang)半年,金融行业客户(hu)收入占企业主营业务收入的39.69%。
而金融领域是企业私有化部(bu)署的先行场景。截至2024年2月12日,已有近20家券商(shang)完成DeepSeek的本地化部(bu)署,多家券商(shang)正积极推进部(bu)署工作。国泰君安、国金证券、广发证券等(deng)券商(shang)均已接入DeepSeek系列模型,加速企业智能化转型。
随(sui)着大模型技(ji)术的渗(shen)透率(lu)提升,其应(ying)用场景将更加广泛。
券商(shang)接入DeepSeek大模型后,可应(ying)用于智能客服、智能系统(tong)运维、行业研究(jiu)、风险管理(li)、智能办公和智能投顾等(deng)多个场景。同时,DeepSeek还能深入行业研究(jiu)、投资分析和App开发等(deng)业务部(bu)门(men),助力业务部(bu)门(men)实现智能化转型。在(zai)银(yin)行领域,本地化部(bu)署的DeepSeek大模型,可应(ying)用于智能合同管理(li)、智能风控、资产托管与估值对账、客服助手(shou)和智库等(deng)多个场景。在(zai)保险行业,智能客服、销售赋能、日程管理(li)、产品培训和智能核保等(deng)多个AI应(ying)用场景将显著提升了保险从业者的工作效率(lu)。
随(sui)着大模型私有化部(bu)署需求(qiu)的增加,星(xing)环科技(ji)凭借其技(ji)术优势(shi)和丰富的客户(hu)资源,有望进一(yi)步(bu)扩(kuo)大市场份额。
结(jie)语
星(xing)环科技(ji)的实践只(zhi)是冰山一(yi)角。
它生动地展(zhan)示了AI技(ji)术如(ru)何跨越云端与端侧的界限,深入企业级(ji)应(ying)用与个人生活的每一(yi)个角落。在(zai)这场由算(suan)法创新与开源生态共同推动的技(ji)术革命(ming)中,越来越多的企业仿(fang)佛(fo)智能革命(ming)的神经元节(jie)点,正以前所未有的速度和规模生长,并推动AI的触角延伸至社会的各(ge)个层面。
人与智能世界的互动模式正经历着翻天覆地的变化,算(suan)力平权(quan)的理(li)想正逐步(bu)从理(li)想照进现实,开启了一(yi)个全新的智能时代篇(pian)章(zhang)。