数据要素很重要缘何数据赛道却静悄悄

2023-07-20 07:26:58 证券时报
证券时报记者 周春媚
最近,关于大模子的政策与措施麋集出台,好消息不时传来。7月13日,国度网信办等七部门结合公布了《天生式人工智能效劳管理暂行办法》,鼓舞天生式人工智能技术在各行业、各范畴的创新使用;而就在消息公布前的一周,上海人工智能实验室正式开源了“墨客·浦语”大模子70亿参数轻量级版本InternLM-7B,支持免费商用,基于这一基座模子,各企业与研究机构能开发打造各自垂直范畴的大模子。
这些政策措施,表现了国度增进天生式人工智能健康开展和标准使用的态度,也给行业大模子减速使用带来了更多确实定性。采访过程中,几乎每个采访对象都向记者表示,行业大模子海潮下,数据直接决议行业大模子的专业度与精准度,重要性正不时凸显。
这样的结论仿佛成了一种“行业正确”,可一个问题却一直环绕在记者心头:都说数据、算力、算法是人工智能的三大根底要素,为何算力赛道如此哗闹,芯片、效劳器、光模块等市场热点层见叠出,数据赛道却显得有些“为难”和不温不火?
事实上,这也是业内许多人士的相反感受。综合来看,背后的原因与数据产品的特殊性、今朝数据交易市场的不成熟等多重要素有关。
就数据产品自身而言,其“非标准化”和“难以通用”的特征,决议了数据产品很难在市场上构成一致和“公道”的代价。算力要素中的根底硬件常常是密码标价的“硬通货”,芯片、效劳器等成本均能计算,能够在不同的行业大模子研发中通用,市场代价较易表现。可是数据代价需在特定的场景中完成,数据的规模、质量也无法一致权衡。大量零碎、非标准、定制化的场景使用,让数据产品难以完成大规模流转。
就数据交易市场而言,今朝我国在数据合规确权、计量估价、和谐分派、平安隐衷保护等方面的根底性困难仍待破解,特别是在数据确权方面,还没有构成明白的标准。对于行业大模子而言,数据具有私域属性,有一定的获得壁垒,在平安和隐衷性上面有更高的要求。一直以来,数据源违规收集、个人隐衷保守等平安危害是列国羁系机构对天生式人工智能的最大顾忌,也是影响大模子落地的最大不确定性要素之一。在根底性制度和规则还没有明白的情况下,数据交易和数据效劳也面临各种限制和阻碍。
不过,跟着大模子在各个范畴的使用不时走深,行业内对高质量数据集的“饥渴”将增进数据财产链的整体开展,相关方面也曾经积极行动起来。工信部电子第五研究所副长处王蕴辉介绍,今朝所里曾经结合财产侧成立了“大模子财产使用工作组”,从减速数据要素市场化、完善数据要素平安管理体系等方面领导并标准行业开展。在大模子商业化使用需求的安慰动员下,数据生态系统建设无望加快,数据要素市场也或将迎来长足的昌盛。
温馨提示:投资有危害,选择需慎重。










