山东省计算中心年月至月政府采购意向 为便于供应商及时了解政府采购信息,根据《财政部关于开展政府采购意向公开工作的通知》(财库〔〕号)等有关规定,现将山东省计算中心年月至月政府采购意向公开如下: 序号 采购项目名称 采购需求概况 预算金额 (万元) 拟面向中小企业预留 预计采购时间 (填写到月) 备注 多源跨媒体大数据信息采集与数据清洗服务 ()数据采集内容:采集覆盖公开网络数据(新闻、社交媒体、论坛、视频、音频等)、行业数据库、接口、物联网设备等多源异构数据; ()采集能力要求:支持实时/定时采集,具备高并发、分布式爬虫技术;支持动态网页渲染(如)、反爬虫策略绕过;提供合法合规的采集方案,避免侵犯隐私或违反平台协议。 ()数据清洗内容:去重、去噪(广告、无关内容)、缺失值填充、异常值处理;非结构化数据(文本、图片、音视频)的标准化处理(如文本分词、音视频转文本、元数据提取);实体识别(人名、地名、机构等)、情感分析、关键词提取等处理。 ()数据采集和清洗指标:信息采集覆盖率≥%;清洗后数据准确率≥%;实时数据延迟≤分钟。 . 是 年月 本次公开的采购意向是本单位政府采购工作的初步安排,具体采购项目情况以相关采购公告和采购文件为准。 山东省计算中心(国家超级计算济南中心) 年月日
快捷阅读