欢迎光临青岛华慧泽知识产权代理有限公司官网!

  • 国家知识产权局备案商标代理机构
  • 国家知识产权局备案专利代理机构(机构代码37247)
  • 青岛市技术合同服务点 青岛市科技成果标准化评价机构

全国统一咨询电话:

(0532)81117588

科技金融

当前位置: 首页 > 快速导航 > 科技金融 >

科技企业如何安全用“数”

发布时间:2024-10-23来源:中国金融新闻网点击:返回列表

      《关于加快公共数据资源开发利用的意见》(以下简称《意见》)出台,对科技企业有何影响?一些科技企业表示,系统性、规范性地进行公共数据资源的开发利用,对科技企业将是一大利好,而且多元公共数据的开发与利用,有助于大模型的训练和优化。

      促进公共数据资源更好运用

      在科技从业者看来,一方面,公共数据的开放为企业和创业者提供了丰富的资源,能够促进数据驱动的创新,催生新产品和服务;另一方面,鼓励不同机构和企业之间的数据共享与合作,有助于打破信息孤岛,实现资源的有效配置和协作。

      《意见》提出,支持人工智能政务服务大模型开发、训练和应用,提高公共服务和社会治理智能化水平。业内人士认为,多元公共数据的开发与利用,有助于大模型的训练和优化。

      硅心科技大模型算法专家蒋思源在接受《金融时报》记者采访时表示,科技企业可以基于公共数据开发各种应用和服务,如利用先进的大模型技术,对公共数据进行高效处理和分析,提取有价值的洞察信息,通过创新应用提升公共服务的质量和效率。

      政务大模型是加快推进政务工作数智化转型的有力工具。因涉及经济社会运行的多个领域,政务大模型的优化与训练,往往需要海量、可信且更高质量的数据资源支持。

      据国家数据局数据,截至今年7月份,我国已经有243个省级和城市的地方政府上线了数据开放平台,开放的有效数据集超过了37万个,最近8年来增长了44倍。

      然而,随着数据技术的发展,公共数据的开发利用方式更加多元化,也会产生安全风险。数据资源开发和利用程度越深,数据安全和个人信息保护的重要性也随之增强。

      针对公共数据安全问题,政府层面已有相应部署。国家数据局局长刘烈宏在发布会上表示,国家数据局将围绕公共数据资源“供得出、流得动、用得好、保安全”,强化政策保障,加大项目和经费支持力度,提高技术能力和安全水平,加快释放公共数据的要素价值。

      平衡开放创新与合规安全

      从应用端来看,当前,一些科技企业会将其研发训练的大模型进行开源,而另外一些通用或垂直大模型也会使用这些开源数据进行训练,因此,开源的模型数据就是一类公共数据。对科技企业而言,这类公共数据的开发与利用是否存在难点?

      “公共数据的采集和更新频率不高,导致数据过时或不准确,影响后续分析和决策,无法满足动态化业务需求。此外,公共数据绝大部分是结构化数据,采集与处理过程会损失很多关键信息。”蒋思源直言,以公共开源代码数据为例,当前的公共开源代码数据会存在大量有语法、编译、逻辑错误低质量数据,这会大大限制训练出来的代码大模型。

      另外,“在利用公共数据时,需确保个人隐私得到保护,防止数据泄露和滥用,尤其是涉及敏感信息或者代码时,需要采用命名实体识别等敏感信息去除技术和管理措施,保障数据的安全性和用户隐私。”蒋思源表示。

      如何兼顾开放创新与合规安全?

      首先,要建立健全的数据管理制度,对数据采集、存储、共享和使用进行全生命周期管理,确保数据质量。对此,《意见》提出,强化数据安全和个人信息保护,加强对数据资源生产、加工使用、产品经营等开发利用全过程的监督和管理。

      其次,建立易于使用的数据共享平台,提供数据访问和分析工具,降低使用门槛。

      “《意见》进一步提出了要推动实现‘一数一源’‘主动共享与按需共享相结合、完善共享责任清单’等一系列工作要求,后续政务数据共享工作力度将会进一步加大,以更好的服务支撑数字政府建设。”国家数据局副局长陈荣辉表示。

      在保证数据隐私与安全的前提下,通过优化算法与架构设计,有助于提高大模型在处理公共数据时的效率与准确性,促进大模型在各行业的广泛应用与创新。

      那么,科技企业该如何更安全、高效地应用公共数据?

      蒋思源认为,可以从以下方面着手,一方面,选择可靠的公共数据源,确保数据的准确性和完整性,以提高模型的训练效果;利用众多数据预处理技术尽可能提升数据质量。另一方面,科技企业在大模型的公共数据使用上还要更加注重安全性与风险管理。“以我们关注的代码数据来说,可以利用传统软件工程的语法分析、静态分析、运行时分析等技术逐一检测代码项目的质量,并治理出一批高质量的公共开源代码。”蒋思源说。

      陈荣辉强调,对于公共数据资源,开发开放是导向,安全依规是前提。对那些潜在价值高,具有一定敏感性的数据,无法直接向社会开放,需要依托更加专业的力量,付出一定的治理和开发成本,形成数据产品和服务供社会各方调用。

      基于这一原则,蒋思源建议,大模型企业需要定期进行安全审计,评估大模型数据使用及存储的安全性,及时发现和修复潜在的安全漏洞;实施严格的数据访问权限管理,确保大模型只能看到或者训练到合法合规的数据。

      针对当前存在的一些开源数据使用程序不够明确、运营情况不够透明等问题,科技企业还应加强自我约束,在开发大模型时,注重模型的可解释性,确保用户能够理解模型的决策过程,从而增强信任感;此外,明确告知用户数据的使用目的和方式,提升透明度。

关闭

  • 高品质服务

    一对一,服务贴心周到,价格公开透明
  • 快速响应客户需求

    一站式手续办理,完成交易流程
  • 全程跟踪服务

    随时沟通客户,助力通过
  • 专家级指导

    专业的谈判及指导,一对一经纪人
  • 资深服务团队

    专业诚信,优质高效,严格风险把控与告知
  • 平台保障全程服务

    专业顾问一站式一对一引导服务