甬数协喜迎2026系列宣传报道丨多模态AI语料库生产技术赋能文化数据新价值
宁波
宁波 > 社会热点 > 正文

甬数协喜迎2026系列宣传报道丨多模态AI语料库生产技术赋能文化数据新价值

【编者按】

知数智之道,行创新之能。

2025 年,我国数据产业规模已突破5.8万亿元,数据要素市场化价值化改革加速推进。国家发改委、国家数据局联合多部门印发《关于完善数据流通安全治理 更好促进数据要素市场化价值化的实施方案》,从七大维度明确发展路径。宁波以“数字宁波”为抓手,在人工智能+制造、智慧城市等领域涌现大批创新实践,为“数据要素场景落地提供坚实支撑。

宁波市大数据发展协会的会员单位积极参与各项数据工作,为展现会员单位 2025 年在“数据要素x”领域的优秀成果,市大数据协会特推出《“数智赋能新征程”喜迎 2026 系列宣传报道》,展现数字宁波建设风采,展示宁波数据企业发展风貌。

文化数字化传承与智能应用的核心是以技术激活传统,也是文化产业数字化转型的重要课题之一。数山智能立足多模态数据处理平台,整合服饰影像、非遗文献、实物扫描等核心资源,结合专家知识库与多模态AI技术,实现戏曲服饰数据的精准采集、专业标注与结构化处理,筑牢安全合规的数据根基。其理念在于打破文化资源壁垒,通过标准化语料库,让戏曲服饰的工艺密码与文化内涵可追溯、可复用。既为文创设计、数字展示、虚拟体验等场景提供精准赋能,又构建起“数据采集-加工-应用”的全链路体系,推动传统服饰文化从静态留存走向动态传播,从小众欣赏迈向大众共享,实现文化价值与产业价值的双重焕新。

在自研多模态数据处理平台上,数山智能通过各戏曲院团珍藏戏曲服饰影像、非遗戏曲服饰技艺文献、经典戏曲服饰实物扫描等核心数据源,完成语料基础信息的采集与归集;通过引入戏曲服饰领域专家知识库,对服饰款式、面料材质、刺绣工艺、色彩体系等关键维度进行专业标注与属性拆解;通过融合自然语言处理与计算机视觉技术,实现文本描述、图像特征、工艺参数等多类型语料的关联映射与结构化处理。针对部分珍贵服饰数据的安全保护需求,项目采用数据脱敏与权限分级管控技术,在确保文化数据安全合规的前提下,实现语料资源的高效调用与加工。

“戏曲服饰语料库”支持根据文化数字化应用场景自主配置语料分类维度与检索参数,经过多轮专家评审与迭代优化,最终形成涵盖20余类戏曲服饰品类、100余项工艺属性、5000余条结构化语料的高质量数据集。产出的标准化语料资源可支撑中国数字文化集团开展多维度应用:既能为戏曲服饰文创设计提供精准的文化元素提取与灵感支撑,也能为数字戏曲服饰展示、虚拟试穿等沉浸式体验项目提供核心数据底座,还可助力构建戏曲服饰文化知识图谱,推动戏曲服饰文化的传承与传播。项目通过先进的数据处理技术与文化资源深度融合,为数字文化产业发展提供高质量数据支撑,助力传统文化资源的活化利用与创新转化。

数山智能基于自研的多模态数据处理平台底座,还为文博、文旅、文创等多个文化产业领域设计了专项数据服务方案,已有多家文化单位、文创企业采用公司的文化数据服务赋能业务场景。例如,在文博领域,基于“文物数据标准化处理系统”帮助多家博物馆完成馆藏文物影像的数字化修复、属性标注与知识库构建,提升文物数字化管理效率;在文旅领域,依托“地域文化元素语料库”为文旅IP开发、智慧导览系统建设提供文化数据支撑,增强文旅体验的文化内涵与互动性。

简介丨宁波数山智能科技有限公司

宁波数山智能科技有限公司专注数据价值运营,开发了中国领先的数据运营平台。公司创始团队来自蚂蚁、华为、IBM等世界五百强企业,在数据要素市场有多年实践经验,已经为多部委和多地政府提供了公共数据运营服务。

公司帮助客户挖掘数据价值,形成数据产品与数据资产,并进行入表、抵押融资等资本化运作,为多个产业客户提供数据全维度服务,已为多个大型国有企业完成数据资产化业务,并开展产业链数据服务。其中在文旅产业,已支持某国企客户获得2024年“数据要素×”大赛浙江赛区文化旅游赛道一等奖。

公司是国家级数据要素课题参编单位,服务于多家金融、央企、互联网平台客户,真正实现数据资产化与价值化运营,公司自主研发的数据运营平台已经获批15项软件著作权。