一、项目编号:()(招标文件编号:())
二、项目名称:海关查验异常智能分类二期子模型技术服务(二次)
三、中标(成交)信息
供应商名称:北京魔带互联科技有限公司
供应商地址:北京市丰台区广安路幢-层
中标(成交)金额:.(万元)
四、主要标的信息
序号
供应商名称
服务名称
服务范围
服务要求
服务时间
服务标准
北京魔带互联科技有限公司
海关查验异常智能分类二期子模型技术服务(二次)
目前,海关检查作业的人工记录往往是一键生成的大段文本,并且每份报关单的检查记录会包含多项检查内容、多条商品项的检查结果描述,其中包含的信息量非常庞杂且不规范。虽然现在已经有标准的四级查获类型分类规范,但是无法直接与检查记录这样的非结构化文本数据建立对应关系,考虑到海关的海量检查查获数据,仅通过人工查看并分类的方式难以实现。 为贯彻落实智慧海关建设要求,在大数据智能布控模型体系下,风控司针对进口检查异常报关单开发了一期分类模型,该模型三级分类准确率大概为%-%,四级分类缺失的比较严重,分类水平与专家还存在差距,还有较大提升空间。因此,为进一步提升模型在异常报关单的自动分类准确率,需小步快跑加快新模型建设,尽早完成自动分类模型辅助。
通过对历史进出口异常报关单数据的总结分析,结合人工经验和模型等有监督机器学习算法与无监督机器学习算法,围绕异常报关单的自动查获类型分类进行数据挖掘和建模,整体架构包括训练和预测两个部分。 训练部分,主要针对历史数据进行训练。查获类型为最新定义的四级分类,其中三级分类个。通过对海量的历史数据进行特征工程,发现规律,提取语义特征。在此基础上基于业务人工标记的样本建立多分类算法模型并进行训练,实现机器对异常报关单查获类别的自动分类。模型的分类结果,结合实验系统等进行报关单号匹配,以及查获结果的文字相似性匹配,用外部系统的准确结果对模型进行校对修正。另外通过每日的数据更新,以及样本量的增长,结合人工反馈,持续对模型进行修正。 预测部分,包括数据处理与模型计算两个模块。以+的处理方....
快捷阅读