大数据应用

大数据应用

    您当前的位置是:大数据应用开发平台>大数据应用

温州市智慧交通综合信息中心

温州市智慧交通综合智慧交通中心项目是通过对交通运输系统信息化基础设施和信息资源的逐步整合,促进智慧化管理决策机制的逐步创建,为公众提供人性化、综合化、智慧化的交通出行服务,为行业管理提供科学决策和应急指挥调度的信息化支撑,同时为“智慧交通”搭建一个基础运行平台。
温州市智慧交通综合智慧交通中心项目是通过对交通运输系统信息化基础设施和信息资源的逐步整合,促进智慧化管理决策机制的逐步创建,为公众提供人性化、综合化、智慧化的交通出行服务,为行业管理提供科学决策和应急指挥调度的信息化支撑,同时为“智慧交通”搭建一个基础运行平台。

1.项目简介

温州市智慧交通综合智慧交通中心项目是通过对交通运输系统信息化基础设施和信息资源的逐步整合,促进智慧化管理决策机制的逐步创建,为公众提供人

性化、综合化、智慧化的交通出行服务,为行业管理提供科学决策和应急指挥调度的信息化支撑,同时为“智慧交通”搭建一个基础运行平台。

智慧交通中心项目建成后将实现综合动态监测、科学应急指挥、智慧出行服务三大功能。

(1)综合动态监测:海陆空交通运输枢纽全监控;道路路网通堵状况全可视;车辆运输动态状况全掌控。
(2)科学应急指挥:紧急事件可视、可判、可控。
(3)智慧出行服务:“人、车、路”智慧协同。通过全面感知,智慧决策,提供公众“无处不在”、“无时不有”、“所想即得”的出行交通信息服务。

温州市智慧交通综合信息中心建设包括五大平台,分别是交通基础云平台、交通数据平台、交通支撑平台、指挥监测平台和出行服务平台。其中,交通基础

云平台为智慧交通系统运行提供硬件基础环境;交通数据平台包括交通资源整合和交通大数据分析处理,通过整合交通信息资源实现共享服务;交通支撑平台为智慧交通中心的应用提供应用资源整合和应用智慧化支撑;指挥监测平台用于实现交通运输行业的应急指挥及日常监测;出行服务平台是结合公众出行需求建设的一个综合性服务平台。

2.技术说明

智慧交通综合信息中心通过利用曙光XData大数据平台、曙光ParaStor分布式文件系统、CloudView云操作系统搭建“智慧交通”基础支撑平台,逐步实现

交通运输信息化基础设施和信息资源整合,智慧化管理决策机制的逐步创建,实现综合动态监测、科学应急指挥、智慧出行服务三大功能,为公众提供人性化、综合化、智慧化的交通出行服务,为行业管理提供科学决策和应急指挥调度的信息化支撑,总体框架如下图所示:

客户收益包括:

1. 海里数据存储:能够应对上十亿条记录的存储需求。
2. 海量数据的快速检索:高并发的并行海量数据检索,满足公众和交通管理人员的实时检索需求。
3. 统计分析:开放的统计分析架构,接近实时的统计分析能力。
4. 平滑扩容:横向扩展性能卓越,能够应对未来业务和数据量的不断增长。
5. 数据实现高速导入:数据从前端平均导入速度为每秒28.5万条记录。
6. 数据查询高效简单:XData能完全胜任合作方J2EE应用程序要求的秒级查询性能要求,XData提供的JDBC和C++ API接口可以非常简单地与现有系统进行集成从而实现数据查询。

同济大学柔性处理平台

同济大学是教育部直属重点大学。她创建于1907年,早期为德国医生在上海创办的德文医学堂,取名”同济”意蕴合作共济。目前是一所拥有理、工、医、
文、法、哲、经济、管理、教育9大学科门类的综合性大学。作为研究型大学,学校是首批被国务院批准成立研究生院的高校之一;作为全国重点大学,学校被列入国家财政立项资助的”211工程”和国家教育振兴行动计划与地方重点共建的高水平大学行列。同济大学大数据柔性处理平台由同济大学电信学院承建,该平台应用将涵盖三个服务分区和一个共享存储中心,即网络信息服务、交通信息分析、医疗数据分析和存储中心。
1.项目简介

同济大学是教育部直属重点大学。她创建于1907年,早期为德国医生在上海创办的德文医学堂,取名”同济”意蕴合作共济。目前是一所拥有理、工、医、

文、法、哲、经济、管理、教育9大学科门类的综合性大学。作为研究型大学,学校是首批被国务院批准成立研究生院的高校之一;作为全国重点大学,学校被列入国家财政立项资助的”211工程”和国家教育振兴行动计划与地方重点共建的高水平大学行列。同济大学大数据柔性处理平台由同济大学电信学院承建,该平台应用将涵盖三个服务分区和一个共享存储中心,即网络信息服务、交通信息分析、医疗数据分析和存储中心。

2.技术说明

曙光公司基于客户的需求为其构建的柔性处理平台,将助力同济大学在信息学科及其交叉学科研究领域的迈上一个新的台阶。方案架构如下:

本方案基于分区方式构建,全面整合云计算平台和同济大学现有资产(IBM, Dell, Hp的服务器),其中集中存储系统采用曙光DS800-F20构建,稳定且高

效,其他分析节点和服务节均采用曙光高效能服务器。服务器管理均基于曙光在各个云计算中屡经考验的大规模机群管理系统Gridview。
客户收益包括:

1. 充分整合现有资源,包括云平台,现有的服务器,降低了用户的成本;
2. 整个分布式搜索引擎架构方面,才用分区形式,使得系统各个组件之间充分解耦,使得上层软件部署更加灵活,极大的方面科研用户进行各种系统的调整和部署;
3. 针对不同组件采用分区管理,分区配置物理机和虚拟机资源,强调资源的优化配置,获得了极高的性价比;
4. 数据网和业务网分离,这样就达到了数据通信和业务通信运行时互不影响的目标;
5. 管理网通信负载较轻,管理操作依托数据网构建,实现全网统一管理,同时管理网不必在配置其他交换机,降低了用户成本;
6. 本方案网络以数据为中心,围绕XData分析集群和集中存储系统来搭建,消除资源孤岛,各点按照业务强度均衡互联,同时其可伸缩性能够随着随着数据膨胀而随需扩展,达到真正柔性计算平台标准

中国银联海量数据分析平台

1.项目简介

为了创新业务的需求,更好地服务银行业,中国银联积极探索新的技术,进军大数据领域。作为首期应用示范,需要用hadoop构建字段合规性分析系统,

商户推荐系统,据规模是30TB,数据导入性能每小时80GB,全年数据30TB左右,每条记录模式是刷卡交易信息,每条大小200~500字节不等。

2.技术说明

曙光公司给上海银联提供的整个方案采用14 台曙光高性能 A620 服务器构建 Hadoop 海量数据分析平台,交换环境千兆以太网,整个集群平均导入速度为

10W/s, 随机单条记录查询时间少于 3s。完全达到首期平台建设要求。

客户收益包括:

1. 高可靠性:系统全年7× 24 小时无间断服务。
2. 高可用性:服务器故障情况下,系统仍能稳定工作,并保证数据完整性和可用性。
3. 灵活扩展:通过增加存储设备,容量可以平滑的扩展,性能可以同比提高。当性能(并发访问、IO带宽)不足时,简单通过扩展硬件即可同比地扩展系统的总体性能。
4. 高性能:提供每秒数十万的记录导入速度,百亿级规模记录随机点查询秒级返回。
5. 低成本:在大规模部署时,该系统有总体价格优势。
6. 易开发:系统对外呈现单一入口,并提供类JDBC和SQL访问接口,便于业务的开发及移植。
7. 易管理:提供图形化管理界面,方便用户对系统进行管理和监控。

新华社大数据处理平台

1.项目简介

新华社多媒体数据库中的数据资源超过1.5亿条,如何更好使用和盘活这些数据资产,使之转化为新的生产力,服务于新华社战略转型,是新时期新华社信息

化建设的一个历史使命。现有的文本检索系统检索精度差,基于规则的静态分词不适应业务发展需要。同时,对于历史新闻数据的语义分析,新闻文档对象之间的关系理解,都需要借助新的技术手段予以实现。另外,对于多语言的分析处理,海量多媒体资源(图像,音视频)识别和标引的需求也亟待被满足。

从业务角度上看,新华社业务种类的日益丰富,原有的IT系统已显露出诸多的不足和问题,难以对新业务和新的需求进行快速的响应和有力的支撑。另外,

随着新华社新闻稿件半结构化、非结构化数据的日益增长,信息管理平台应用已面临着数据备份恢复时间、运维成本高、存储弹性扩展能力差、存储成本高、无法满足业务多维查询的问题;文档服务平台存在海量历史数据离线检索不便、数据备份恢复时间长的问题。同时,随着近年来业务的发展,产生了结构化数据与非结构化数据整合存储与联动查询的新需求。

2.技术说明

曙光公司大数据一体机在解决如上问题和新需求方面较传统技术手段更有优势,并具备现实可行性。非结构化数据分析采用xdata-hadoop,结构化数据分

析采用XData并行数据库,系统架构如图:

客户收益包括:

1. 对各应用系统进行整合,避免之前的独立建设造成的IT资源浪费;
2. 实现了音像资料、金融信息的共享,能够很好地满足新媒体发展和全媒体融合的需要;
3. 基于标准规范构建的多媒体数据库数据共享服务,实现了系统间数据复用功能;
4. 能够很好地满足新华社对结构化和非结构化数据整合存储与联动查询的新需求;
5. 架构上采用松耦合的技术原则,能够实现系统的灵活扩展;
6. 平台针对不同子系统的需求特点,选用合适的技术,能够突破性能瓶颈提升单台设备的处理性能;
7. 系统具备良好的扩展能力,能够在适应当前需求的基础上尽量为将来可预见和不可预见的功能、性能扩充留有余地;
8. 新功能、新业务的增加能够在不影响系统运行的情况下实现;
9. 系统采用HA、负载匀衡、云计算虚拟化、副本式存储计算冗余等技术,从系统级、设备级和业务级等多个层面进行高可用设计;
10. 有全面、完善、便捷、统一的网管系统和网络性能监控系统,支持多种故障报警,一旦发生问题能够在最短的时间内处理解决。

珠江数码互动电视用户收视分析平台

1.项目简介

广州珠江数码集团有限公司(以下简称“珠江数码”)紧紧把握“三网融合”所带来的发展机遇,加快高清交互数字电视的推广, 将家庭电视机变成多媒体

信息终端,为广大用户带来全新的数字媒体体验。由于众多新媒体业务的推出和普及,需要建设一个数据分析平台,通过这个平台可以收集到所有双向用户、所有业务的用户收视行为数据,建立一套完整的数据分析及挖掘机制,用于更好地了解用户需求,促进各项业务的发展。

本次项目建设,需要解决如下几个问题:

1. 数据采集、存储和转发。通过大数据技术满足海量、多种来源、多样性数据的存储、管理要求,支持平台硬件的线性扩展,并提供快速实时的数据分析结

果,并迅速作用于业务;

2. 个性化用户推荐。不仅局限于数据本身的分析和决策价值,还通过构建大数据平台,整合业务能力,为用户提供融合、个性化的内容推荐服务;

3. 从内容传输到内容制造。使用大数据挖掘技术提前先于观众知道他们的需求,预知将受到追捧的电视。另外,还可通过观众对演员、情节、基调、类型等

元数据的标签化,了解受众偏好,从而进行分析观测,为后续的影视制作等内容开发做好准备。

2.技术说明

根据曙光在广电行业多年的建设经验和业内其他客户大数据分析平台的建设经验,曙光设计如下图所示的平台整体逻辑架构:

整个收视行为分析平台设计分为4 个层次,即数据源、数据预处理层(数据抽取、转换、脱敏、加载、规约等)、大数据支撑平台(数据存储,数据处

理)、业务应用层等。

首先,数据由数据源经过统一的数据抽取和转换平台进行抽取、格式转换、脱敏等操作;通过ETL 工具,将清洗好的数据加载到大数据平台中进行存储。由

于汇聚了多个源的数据,通常数据量非常大,所以大数据平台需要具有良好的可扩展性。

其次,加载到大数据平台中的数据将被用于进行最终的数据分析和数据挖掘。同时,还可以根据具体的分析和挖掘需求,设计针对用户具体业务的查询任务

流及更多的应用系统。

最后,大数据应用层通过建模对大数据平台中经过初步加工的数据进行进一步的分析挖掘,通过大数据可视化工具对分析挖掘结果进行展现;展现形式丰富

多样,可以是图表,也可以是文档等易于理解的形式。

本次项目建设,需要整合机顶盒、BOSS 系统、运维系统、媒资系统等多种来源系统数据, 构建用户收视行为分析平台,完成对用户收视行为相关数据的统

计分析,提升用户的满意度,提高广告投放的精准度。

本项目采用中科曙光自主研发并具有多年实践经验的XData大数据处理平台,实现了面向海量用户收视行为的及时高效处理。平台主要特点如下:

1. 支持千万级别用户的收视热点/趋势实时分析;

2. 支持百亿级别机顶盒日志、VOD系统日志等信息的及时抓取和分析;

3. 支持用户特征提取和用户群体细分,支持基于用户和节目的协同过滤,实现基于富标签的智能化推荐系统。

意尔康大数据分析平台

1.项目简介

对于销售行业,数据可以分成两类,一种交易数据,一种是过程数据。目前大多数企业都只看重交易数据,尤其是传统销售企业,只有pos机数据、历史交

易数据。他知道用户买了什么商品,但是不知道他看了什么商品,在哪个商品旁停留的时间更长。相反,电商除了交易数据外,更重要的是具有用户行为路径的数据,就是点击流的数据。而后者越来越得到线上线下的重视,甚至比交易数据更有价值。

意尔康鞋业集团是一家主营设计、生产和销售中高档真皮皮鞋业务的公司。历经多年的消费积淀,意尔康品牌也在广大消费者心目中拥有了声誉卓著的口

碑。意尔康鞋业认识到了数据的价值,在技术领域不断探索,在信息化推动企业发展的道路上走在了浙江省各个鞋业厂商的前面。意尔康将线下(实体店铺)的交易数据存储在小型机中的oracle数据库中,将线上(天猫交易数据)数据托管在阿里云的mysql数据库中。意尔康利用对线上,线下数据的分析结果辅助其制定相应的销售策略,推动着企业的发展。 为了充分利用已有数据资源,推动企业更好的发展,意尔康鞋业希望整合线上,线下数据,同时分离在线和离线分析,构建一个统一高效的大数据分析平台。

2.技术说明

曙光为意尔康的构建大数据分析平台。整合线上,线下数据,将其存储在XData大数据平台上,为减轻oracle的小型机的压力,将每天的实时查询作业交给

oracle小型机完成,而对于统计分析型的作业在XData大数据平台上完成。将实时计算和离线计算相分离,提高了系统的执行效率。在XData平台上架构大数据应用,实现挖掘分析,报表展现等功能。方案架构如下:

客户收益包括:

1. 本方案以数据为中心,充分整合现有数据,围绕XData分析集群和集中存储系统来搭建,消除资源孤岛,各点按照业务强度均衡互联,同时其可伸缩性能够随着随着数据膨胀而随需扩展。
2. 实现在线分析和离线分析分离,提升业务处理效率。
3. 易开发:系统对外呈现单一入口,提供类JDBC访问接口,便于业务的开发及移植。
4. 易管理:提供图形化管理界面,方便用户对系统进行管理和监控。

基于语义技术的柑橘精准生产管理决策支持系统

1. 项目简述

柑橘精准生产管理决策支持系统,是利用语义科技,构建本地化、可计算、易扩展的柑橘相关的知识库,在施肥、生理病害防治以及排灌三个方面提供决策

支持服务。该系统提供了实现精准农业和个性化农业信息服务的有效方法,并且该方法能够被直接应用于其它农业产业。

柑橘精准生产管理是一个难题。经过多年培育和发展,柑橘种植研究方面形成了大量专家知识,以学术文章、技术报告、发明专利等形式分散存在,很难整

合施肥、生理病害、灌溉等方面的专家知识,使得以文档形式的知识能够为计算机系统所理解和应用,能够为产加销一体化现代农业提供整体性、连贯性的技术支撑。一般的专家系统根据用户的输入,难以自动生成个性化的柑橘生产指导信息,无法提供实现精准农业和个性化农业信息服务的有效方法,并且方法不能被直接应用于其它农业产业。

针对重庆市柑橘产业的精准生产管理难题,项目研发了一个基于语义技术的决策支持系统,实现了柑橘的施肥、生理病害、以及排灌管理的功能。利用语义

科技,将终端设备实时或者定期采集的柑橘果园信息,以及相关柑橘种植专家知识等进行描述、存贮、分析和处理,实现柑橘果园信息化精准施肥的决策支持,通过移动信息发布平台及互联网等渠道,为柑橘园区的普通果农和企业提供主动的、个性化的、有实用价值的柑橘生产管理的信息服务,提高柑橘园养分和水分利用率,降低生产成本,减少农业投入品浪费和对环境的不良影响,增加果农和企业的收入,实现节本增效和低碳环保的最终目的。

系统由三个主要功能模块组成:施肥知识库查询系统、病症知识库查询系统和排灌监测系统。

初次使用施肥知识库查询系统时,果农需要输入果园的基本信息,包括种植年份、果园名称、去年产量、果园的土壤质地、地形等,系统根据输入的数据,

查询语义数据库,给出相应的施肥建议。当用户初次使用后,系统能够根据已有信息,在适当时间推送施肥提醒和建议。

该系统目前已在重庆市忠县果业局、重庆三甲生态农业发展有限公司等地成功开展示范应用,获得良好反馈。

图1 柑橘施肥决策支持系统

当要获取柑橘生理病害防治建议时,果农通过柑橘病症知识查询系统的下拉菜单选择果树各部位相符的病症,系统根据输入信息,查询语义数据库,获取病

症查询的结果和显示防治方法。

图2 施肥知识查询

2. 技术说明

该系统以语义技术对柑橘管理数据和专家知识进行基于本体的知识整合,利用语义本体有效集成海量、异构、多源涉农数据和知识,为应用程序提供单一接

口和支撑,实现柑橘信息化文档、图片形式的知识转换为计算机可直接计算和推理的资源的方法,形成可计算的本地化柑橘生产与管理信息服务资源(知识库),并在此基础上开发了的决策支持服务系统。

图3 基于语义技术的决策支持系统

柑橘语义本体是决策支持系统的关键部分,它以三元组的形式整合了施肥、生理病害、灌溉这三方面的专家知识,使得以文档形式的知识能够为计算机系统

所理解和应用。

柑橘语义知识库是对数据进行高端分析的前提,它从大数据中先抽取出有价值的知识,实现了知识库的构建、多源知识的融合与知识库的更新,可支持查询、分

析和计算。通过关系数据库、图形数据库等不同架构的有机组合,分别存储处理实时数据和知识库数据,使得数据库具有良好扩展性,解决了知识复用和共享问题,自动识别知识变化,动态响应变化更新。基于RDF三元组的本体及语义数据库具有良好扩展性,农户通过移动终端与系统的交互信息及反馈信息、新的专家知识、产生的历史数据等信息可灵活、快速地写入现有语义数据库,对已有知识进行补充和完善,继而为农户提供更准确、更及时的农业信息服务,形成可持续发展的农业信息服务平台。

利用本体对海量、多源、异构的涉农信息进行语义集成,生成RDF语义数据库。利用基于RDF的大规模语义推理技术以及其他推理技术作为有效补充,为农

户自动提供个性化的辅助决策服务,帮助用户利用丰富的专家知识来更好地进行农业生产,如在当前的气候、土壤、环境条件下,何时对柑橘进行追肥;结合农户耕作的情况,推荐适合农户使用的柑橘种植品种和种植方法等。农户可以通过现有通讯设施,如移动互联网、3G、无线网络等,以手机短信、智能手机应用等方式接受系统推送的实时信息。

 

图4 基于语义技术的柑橘精准生产管理

3. 应用成果

本成果已在重庆市忠县果业局、重庆三甲生态农业发展有限公司等地开展示范应用。重庆市忠县果业局通过本项目成果手机客户端,随时随地监控、督促、

指挥所辖农业生产现场区域的果园修枝剪叶、肥水管理、农机耕作等;通过计算机远程辅助决策平台开展多方远程病症会诊、作物长势预测等指挥调度工作。根据用户反馈意见,本成果示范取得了良好的应用效果。

图5 柑橘物联网手机客户端

图6 示范基地远程监测中

基于语义技术的种猪疾病查询和预防系统

单位:西南大学

1. 项目简述

种猪疾病知识库涵盖了种猪的各个品种、各个疾病以及对应症状、治疗方法等信息,同时由于语义技术能很好地发掘信息之间的关系,而且语义知识库的修

改非常快捷容易,这使得知识库的维护费用大幅减少,具有极大的实用性。

2. 系统演示

SPARQL查询是用来测试所建本体的合理性。也就是说,机器理解的三元组要和我们拆分后的三元组一致,假如查询得不到预期的结果,构建的语义本体就

存在问题,需要重新定义。我们采用的方法是随时“测试”所构建本体的合理性,因为一旦RDF 三元组的数量很大以后,排查错误就很费时间。总体上,我们会选择简单的测试案例从局部到整体展开测试,避免延迟。例如,我们想知道“导致难产的致病因素?”。图12是母猪难产的致病因素示意图(SPARQL查询)。由图可知导致难产的因素有8种之多。查看专家给出的知识库,结果一致。这个测试案例示例了“由疾病找病因”这一模式。改变其中的某个宾语或者主语即可测试出这一模式下的所有三元。

 
图2 母猪难产的致病因素示意图(SPARQL查询)

为方便应用,我们开发了Web查询。如图3所示,当用户输入或选中“症状”分组或“因素”分组时,接着可以挑选/选中相应的项,进入最右边的输入框,

开始查询。多重症状诊断功能部分为应用的主要部分,用户可以根据饲养生猪的实际情况勾选对应症状,再点击诊断按钮,应用就将按照用户输入的各类症状,结合后台语义分析与推断给出诊断结果。在结果界面,用户可以进一步根据诊断结果中描述的症状对生猪的病症进行多次复诊,提高诊断准确性。

 
图3 web查询

种猪疾病查询和预防系统最初研发的目的是降低重庆市种猪养殖的成本、提高种猪繁殖成活率、提高养猪个体户和大型养猪场对种猪养殖过程中遇到的疾病

防治成功率、形成一套具有专家级权威的诊断机理。它采用语义网技术整合种猪品种、养殖、医疗诊断等复杂信息,形成种猪疾病知识库,并在此基础上利用语义推理技术,使养猪大户可通过可视化界面查询或向系统提问的方式使用该系统。

种猪在生长发育过程中涉及诸多阶段,种猪疾病诊断需要整合种猪品种、养殖、医疗诊断等复杂信息。种猪疾病查询和预防系统采用基于群体的模糊TOPSIS

生猪疾病决策算法,通过用户的输入,从知识库提取相应专家知识,构造个体专家知识矩阵。通过衡量专家的重要程度,给每位专家确定权重,将多个个体专家知识矩阵进行融合,得到群体决策矩阵。然后,衡量每个决策属性对于诊断各个疾病的重要程度,得到最终加权决策矩阵,通过TOPSIS方法找到最优解。目前,通过构建人员和知识库自身两种途径,专家知识库仍在不断更新,并进一步满足用户对知识的实时更新需求。

图1 基于语义的生猪养殖智能决策支持系统体系

农业农村信息化综合服务平台

单位:西南大学

1. 项目简介

平台可适合于各种不同类型的网络环境,基于网络搭建基础平台,构建各种业务应用,整合各类应用。通过云综合门户,用户可通过各种不同终端访问。

在该平台上开发的基于语义技术的柑橘和精准生产管理系统系统目前已在重庆市忠县果业局、重庆三甲生态农业发展有限公司等地成功开展示范应用,获得

良好反馈。

农村信息化综合服务平台是以云计算为技术核心,相关政府部门和企事业单位信息资源为支撑,集成整合涉农信息平台和基础数据资源,实现对农业产前、产

中、产后以及农村民生的全方位信息服务。通过对该平台的建设和完善,可以逐步实现城乡、社区、基地和田间网络全覆盖,实现乡镇、行政村政务信息化,涉农企业/合作组织管理信息化,农村民生信息化,达到农业农村信息供需有效对接的目的。

2. 技术说明

平台建设经过顶层设计、接口规范编制以及子系统间数据存储、交互和共享技术、系统内部集成技术、异构平台间资源整合与集成技术、多模式信息发布技

术等攻关研发后,综合集成12316、12396、农业农村信息网、农业科技信息服务系统、农信通、农村党员干部现代远程教育平台等已有平台资源,最终构建起农业农村物联网综合信息云服务平台。

通过统一规划形成完备的顶层设计,主要包括云服务平台的功能模型、数据模型、体系结构模型等设计。通过吸收国内外先进的理论方法和长期的探索积

累,制定农业农村信息资源规划、云服务平台顶层设计的有关规范和具体技术标准。包括数据接口、数据管理机制、数据存储及交互格式、系统集成等规范。

采用云计算技术实现海量数据存储。在物理层面,云计算管理中心是整个云计算农业农村信息化综合服务平台的中心枢纽,底层有数量庞大的服务器群和虚

拟化管理软件构成,通过VCenter等虚拟化管理软件和虚拟化计算分配策略实现虚拟化资源均衡分配,平衡底层服务器的计算能力,结合虚拟化存储和云分布文件系统,为用户提供虚拟化存储服务、虚拟计算服务、数据安全服务、分权分域隔离等服务。在逻辑层面,平台采用语义技术的分类方法进行农业信息元数据组织,将农业海量异构分布的品种、土壤、气象、栽培和饲养等数据库,及包含不同权威农业专家知识的大规模知识库、模型库等各类数据资源进行统一描述。大容量、高集成的云计算中心提供了农业综合信息服务平台的稳定性,避免了重复建设,简化了用户的信息检索操作。

经过多方反复磋商形成一致的接口规范与标准。利用语义技术开展异构平台间数据资源整合、系统集成和数据管理机制等接口规范研究,为第三方涉农信息服

务商提供农村信息化云服务平台服务总线统一接口规范;在国家农业农村信息标准的基础上,完善和细化适应区域农业产业特点的信息标准体系。

聚集社会各界逐步完成平台集成。结合已有成熟信息存储交互及集成技术,研发子系统间数据存储和交互技术、系统集成技术、异构平台间资源整合技术和多

模式信息发布系统,综合集成12316、12396、农村信息网、农业科技信息服务系统、农信通、农村党员干部现代远程教育平台等已有平台,围绕农村民生、种植业、养殖业、市场流通四大类信息资源,整合并完善农业气象、土壤、农资、水利、农业装备、农村“三资”、品种资源、地理空间、生态环境、生产经营管理、农产品市场等数据资源,构建农业农村综合信息云服务平台,实现面向农村农业发展的全面优质的信息服务。

平台可适合于各种不同类型的网络环境,基于网络搭建基础平台,构建各种业务应用,整合各类应用。通过云综合门户,用户可通过各种不同终端访问。

图1 系统总体业务架构

平台通过前置机和ESB统一接口,实现异构、多元化、分布式的数据库之间互联互通,采用大型关系数据库进行数据存储服务,对时效性不强而数据交换量

大的应用,通过集中服务器方式,将各个不同类型数据库的数据抽取到集中数据库,实现统一访问。

图2 数据库架构

平台基于SOA架构,无缝集成农业生产服务信息系统、信息推送平台、物联网测控系统、远程监控平台、决策支持系统与平台管理系统等,建立对应管理体

系和安全体系,确保系统正确管理和运行,提供单点登录、统一身份认证、访问控制、交换策略服务。

图3 系统开发架构

平台按功能的不同,划分为安全互联区、DMZ区、内网服务器区及内网接入区。采用防火墙、病毒防护、安全审计、漏洞扫描、数据中转等技术,实现系统

及内网多重安全防护。采用链路负载均衡、应用负载均衡、双链路双设备、高性能SAN等技术,应对突发高并发访问,提高用户体验度以及系统高可用性。

图4 平台物理架构

平台云综合门户为公众、政府、学校、养殖大户等用户提供统一的访问窗口,并与各类实际业务系统连接,实现对企业信息、资源、应用的整合与协同。

图5 平台门户

3. 应用成果

近年来,西南大学在“一带一路”国家战略框架下与西部地区、特别是重庆市产业发展紧密结合,培育特色学科形成重庆优势农业产业产生智能支撑能力,

围绕农业农村信息化服务平台集成与资源整合关键技术、农业数据资源的开发利用方法与技术、农业物联网关键技术、农业智能装备关键技术开展跨学科交叉研究,形成了一批具有鲜明特色的农业物联网、农业大数据处理等研究成果。通过联合涉农部门、种养企业推广示范,建立柑橘果园生产管理决策支持系统、规模化猪场病害远程诊断系统等具体应用场景,升级并完善农业物联网软硬件设备设施和系统功能,建立应用示范基地,搭建农业物联网生产管理系统服务平台,提档升级重庆市“互联网+农业”系统,并逐步建设和完善农业大数据云平台,构建全国领先的农业物联网智能化生产示范基地,总结示范推广模式,推动农业物联网、大数据、人工智能技术在应用领域的进程。目前已形成重庆忠县、荣昌等示范基地,着力打造核心示范区共计3千亩,辐射带动周边果园3万亩。

图6 示范基地远程监测中心

北京市路网可靠性研究

单位:许昌学院

1、项目简介

“北京市路网可靠性研究”是北京市科委课题。本课题的研究目的在于通过对城市路网可靠性评估关键技术的研究,建立适用于北京市的路网可靠性评价技

术,为北京市未来的路网规划、建设提供参考依据和辅助分析工具;同时,根据北京市当前的交通现状和需求,应用项目研究的路网可靠性评估技术,分析北京市路网状态和功能,提出北京市路网建设、交通管理和交通信息发布等方面的原则或建议;此外,针对大型活动(特别是奥运会)的需求和影响,对大型活动下路网的可靠性进行具体分析,并提出相应的管理措施和保障方案建议,从而提高北京市路网的交通运输性能,提高北京市大型活动交通管理的能力,保障奥运交通专线的顺利运行。

本项目的研究主要包括四项内容:

1)将在分析北京市交通特点和需求的基础上,研究城市路网可靠性评价技术的范畴和适用性,提出适合北京市的路网可靠性评价指标和评价方法;
2)综合分析北京市路网物理结构和交通流数据,应用项目研究的路网可靠性评价技术,分析北京市路网状态和功能,识别现有路网的关键路段、节点和路网中承受突发事件的薄弱点,提出路网建设、交通管理和交通信息发布等方面的原则或建议;
3)选取典型的大型活动,应用交通模拟分析等技术方法,通过路网可靠性的评估,定量分析出大型活动对周边路网的影响,并提出相对应的大型活动交通组织和管理的对策建议;
4)针对奥运交通服务需求,分析奥运交通专线运行状态,研究专线运行保障方案,从而保障奥运交通专线的顺利运行。

2、应用成果

本项目提出适合北京市的路网可靠性评价指标和评价方法,应用项目研究的路网可靠性评价技术,分析北京市路网状态和功能,并以大型活动为例,提出相

对应的大型活动交通组织和管理的对策建议,针对奥运交通服务需求,分析奥运交通专线运行状态,从而保障奥运交通专线的顺利运行。可以使政府部门充分掌握北京市现有路网在日常交通运行以及奥运会等大型活动条件下的可靠程度,明确北京市现有路网状态,从而为深入分析交通问题、判断交通建设需求提供科学、合理的辅助分析工具支持,进而为迎接2008 年北京奥运及实现北京市交通系统的可持续发展奠定坚实的基础。

图 1 北京市五环内路网的薄弱点段分布图

图 2 奥运专线上的关键路段

县域遥感技术应用与示范

单位:北华航天工业学院

1. 项目简介

卫星数据以其快速、连续、覆盖范围广、信息量大等特点,在农业、林业、环保、国土调查、防灾减灾、城市和交通精细化管理等重点领域中发挥着越来越

重要的作用,已逐步成为国家基础性、战略性资源。随着经济社会的发展,区域以及企业公众对遥感数据的需求日益扩大,仅在河北省每年高分遥感数据的订购量就达上亿元。

面对区域及企业公众日益迫切的遥感数据需求,北华航天工业学院积极探索,深入调研地方实际应用需求,近年来着力开展“县域遥感技术应用与示范”工

作,在农业、林业、环保、国土调查等领域开展技术攻关和示范应用,从数据获取、分析到数据的实际应用构建了完备的服务框架体系,助力县域经济社会发展。

县域遥感技术应用与示范,是基于国产高分卫星数据,实现对多类遥感要素快速提取与监测,为政府部门、行业企业提供高空间/时间分辨率的海量数据信

息,并通过构建基于云平台的高分卫星数据综合应用服务框架,实现对海量数据的查询检索、展示浏览、共享下载、综合分析等功能,对数据的深入挖掘和分析,为相关应用单位提供分析和动态检测,支撑并辅助相关决策的制定。目前该项目已在河北省廊坊市各县(市、区)、邢台市巨鹿县、张家口市等地展开应用,为相关应用部门布设系统,实现高分卫星数据常态化监测与分析工作,取得了不错的经济效益与社会效益。

2. 技术说明

通过四年的探索,目前县域遥感技术应用与示范已形成了较为成熟的服务框架体系,即根据市域、县域应用部门的实际需求,对目标区域进行遥感监测,生

产遥感专题产品,通过搭建县域高分卫星数据综合应用服务云平台,以互联网、移动终端(遥感云屏、遥感云书等)的形式实现信息共享、产品推送以及综合分析服务(图1)。该平台面向县域遥感经济社会发展中所关心的重点问题,基于航天、航空、无人机、地面传感器等多源数据融合技术进行大数据挖据,整合遥感要素信息提取算法,通过同一地区不同数据源间的信息互补为多源遥感图像的处理、分析和应用提供最有效的应用,大大减少单一信息源对被感知对象或环境解译中可能存在的不确定性、不完全性和误差,最大限度地利用各种数据所包含的信息做出决策。

图1 县域遥感技术应用与示范服务框架

制作遥感专题产的数据主要来自于国产高分卫星数据和无人机监测数据,其中卫星数据的空间分辨率可达亚米级,无人机监测数据可达厘米级,这为高精度

提取遥感要素信息提供了数据保障。目前,项目所制作的主要专题产品包括资源调查与监管、生态环境保护、城市精细化管理3大类、23小类专题产品(图2),并且根据用户单位的实际需求,不断扩充遥感产品库,为用户提供业务化标准化高分县域应用信息产品服务。

图2 高分县域应用信息产品服务

以玉米遥感专题产品为例,利用GF-1/2/4卫星影像数据的时序特征,针对典型区域玉米的物候特征,在生长季选取多时相影像数据构建时间序列,并提取

NDVI形成NDVI时间序列,结合玉米物候特征,通过时序特征匹配,实现玉米种植面积的监测(图3)。在提取各类遥感要素信息后,制作专题产品(图4)。所有的专题产品加载于信息化管理平台,实现监测成果的多尺度空间可视化、信息查询统计、图表分析与变化监测,充分挖掘遥感数据的应用价值,保障信息的实时分享,为政府管理和决策分析提供服务(图5-图7)。

图3玉米种植面积监测模块

图4 遥感专题产品

图5 遥感资源展示

图6 遥感资源分布及查询

图7 遥感数据图表分析

3. 应用成果

近年来,项目已在河北省廊坊市、邢台市、张家口市开展了多个方面的深度应用。为廊坊市政府部门安装部署了遥感监测与分析系统,定期报送耕地、农作

物、道路、河流、经济作物等近20种地物的遥感专题产品和工作简报,该项工作已成为政府部门科学决策依据;利用高分卫星数据开展利用卫星遥感、无人机和地面传感器监测点,对廊坊市及周边区域大气环境、水环境进行遥感监测与数据分析,协助廊坊市开展大气污染和水污染防治监督工作;在邢台市巨鹿县协助当地农业部门开展串枝红杏、油葵、枸杞、金银花等特色经济作物普查工作;协助张家口市长城管理处进行了古长城监测与保护,利用遥感数据监测古长城破坏和损毁情况。

从实际效果来看,利用高分卫星进行数据的获取与分析,取得了巨大的经济效益与社会效益。如农林资源普查方面,传统手段需要投入车辆、人力和时间实

地勘察,而使用遥感技术,只需要若干工作人员在室内调用高分卫星数据,即可在很短的时间内完成资源普查工作,对于县级应用部门来讲,每年可节约开支十几万元。并且,这种新型的资源普查方式,好地取代了传统抽样调查、层层上报的工作模式,既节约了成本,又有效遏制了统计数据的瞒报、虚报和漏报现象,提高统计数据的准确性和真实性,为当地政府部门部署相关工作提供了准确可靠的第一手资料。

光伏行业大数据

单位:湖北大学

1. 项目简介

信息技术与光伏产业的结合是发展的必然趋势。智能光伏解决方案对于光伏电站成本的降低、效率的提升有明显的推动作用。通过各种方式期望借助大数据

让光伏电站产生最高效益,借助大数据和高性能计算技术,以云服务的方式为行业提供免费平台,助力投资商、开发商全面管控新能源投资风险。

上述课题的目标,通过脱密大数据,推动光伏产业应用规模的扩大和管理水平的提高,并为光伏产业的发展提供科技支撑和公共服务平台支撑,从而促进产

业结构调整、解决环境污染,以及进一步提升传统支柱产业和发展战略性新兴产业。

2. 应用成果

依托大数据中心,结合光伏自身行业特点,提出拟开展的行业创新方案。

1)紧跟光伏信息化发展前沿水平

2)面向光伏信息化行业应用的数字化光伏电站

数字化光伏电站,首先是对现有的光伏发电部分进行智能化改造,使传统的逆变器不仅仅是发电部件,而且是一个集电力变换、远程控制、数据采集、在线

分析、环境自适应等于一体的智能控制器,成为电站的神经末梢与区域控制的中心;其次,通过对现有RS485等低速传输通道的升级,使整个电站形成融合语音与视频通信、快速灵活部署、免维护的高速互联网络,铺设电站信息流通的高速公路;最后,收集到的电站完整信息统一上传到云端存储,利用大数据分析与挖掘引擎,实现对电站的智能化管理及电站性能的持续优化。

3)智能光伏电站解决方案

光伏电站解决方案,包括:集电力变换、远程控制、数据采集、在线分析、环境自适应等于一体的智能化改造;升级RS485等低速传输通道,铺设电站信息

流通的高速公路;收集电站完整信息,利用大数据分析与挖掘引擎,实现对电站的智能化管理及电站性能的持续优化;实现前后方远程协同运维,降低一线运维人员的技能要求,最大化的复用总部专家资源,实现人员的最优化配置,提高系统的维护效率。

4)“园区智能微电网关键技术研究与集成示范”课题

该课题主要围绕基于分布式能源的智能微电网

的友好接入及与配电网互动运行中的关键问题进行技术攻关,重点针对国内基于分布式光伏发电的智能微电网的应用前景,结合国外类似的工程实践经验,对基于分布式光伏发电的智能微电网的关键技术及系统集成展开深入研究。采用储能缓解分布式光伏发电自身的间歇性和波动性,提高分布式光伏发电的接入能力和并网电能质量,并对分布式光伏/储能的智能微电网系统拓扑结构、控制策略、运行模式、计量及能效管理等方面进行研究,建立分布式用户侧光伏及光伏/储能的微电网系统集成示范平台。

5)预期建设目标

在光伏行业,尤其是光伏信息化领域,学校优势凸显。近6年,研发了区域建筑光伏发电电站信息化管理系统、光伏电站综合营运管理系统,能量预测对比

分析系统、户用光伏器件及管理平台系统,在光伏龙头企业武汉日新科技有限公司进行应用推广。该类项目研发与推广,对保持武汉市在光伏的应用领域特别是建筑光伏大规模商业化的技术优势,推动武汉市光伏产业应用规模的扩大和管理水平的提高,并为湖北光伏产业的发展提供科技支撑和公共服务平台支撑,从而促进了我省产业结构调整、解决环境污染以及进一步提升我省传统支柱产业和发展战略性新兴产业具有十分重要的意义。这些项目研发与推广累计经费达800多万元,高质量论文达30余篇,发明专利2项,实用新型专利10项,软件著作权3项。并和日新公司联合成立了“湖北省光伏技术工程研发中心”。通过项目驱动累计培养研究生50余名,直接参与项目实践本科生达120名,为产教学研起了很的示范作用。

奥林匹克公园周边地区道路交通仿真系统

单位:许昌学院

1.项目简介

奥林匹克公园周边地区道路交通仿真系统研究“是北京市科委项目。本项目为北京市科委 2005 年度科技计划重大项目“奥运交通仿真系统研究”之分课

题,本项目建立奥林匹克公园周边路网交通仿真系统平台,并模拟关键时段下的各种交通组织方案,分析其优缺点。

本项目的主要研究内容包括以下四方面:

1 )中、微观结合为特色的奥运公园周边路网交通方案仿真测试系统的开发:采用INTEGRATION 模型建立了奥运公园周边路网交通方案仿真测试系统,该系统可用于奥林匹克公园周边道路网中社会车辆以及 T1-T5 运行状态的交通仿真,并可以有效地测试公交线路、有无专用道以及事故发生等各种仿真方案;

2 )中观和微观仿真评价指标体系的建立:从路网交通运行状况评价、重点拥堵路段分析和公交场站规模分析三个方面建立了评价指标体系,并提出了系统化的评价方法;

3 )关键时段条件下交通组织预案的仿真 分析:根据奥运交通管理、服务预案,基于中观和微观交通仿真模型,完成了奥运公园周边路网的机动车仿真分析案例,并仿真测试关键时段(奥运会开、闭幕式,奥运期间平日和高峰日)以及突发事件条件下的奥运交通组织方案;

4 )提出了奥运公园周边路网交通运营计划建议:项目针对开、闭幕式、平日以及高峰日关键时段下仿真方案结果进行分析,提出了奥运场馆区道路交通组织运行方案在交通诱导措施、信号配时以及公交场站规模方面的改善建议。

本项目为交通管理者提供了奥运赛事期间交通组织管理的多项建议,为保证路网畅通运行,确保各国官员、运动员以及观众等五大类客户群体能够快捷、及

时地到达比赛场馆提供了保障,并有助于提高北京市的交通服务水平。

2.系统演示

本项目采用 INTEGRATION 模型建立了奥运公园周边路网交通方案仿真测试系统,建立中观和微观仿真评价指标体系,根据奥运交通管理、服务预案,基于

中观和微观交通仿真模型,完成了奥运公园周边路网的机动车仿真分析案例,并仿真测试关键时段(奥运会开、闭幕式,奥运期间平日和高峰日)以及突发事件条件下的奥运交通组织方案,并提出相关运营计划建议。

图 1 奥林匹克公园基础路网构建图

图 2 INTEGRATION 仿真运行界面图

图 3 开幕式进场方案优化前后快速路速度对比图

北京市 ITS 框架

单位:许昌学院

1、项目简介

“北京市 ITS  框架与规划研究”是北京市科技攻关项目,本项目通过收集和分析世界各国的国家 ITS 框架资料和应用信息,从国家 ITS 框架的设计原则、用

户服务、逻辑框架、物理框架、标准和协议五个方面分析、比较其成果和经验,得出各自的特点,研究国家 ITS 框架开发的理论方法和侧重点;收集部分地区的区域 ITS 框架资料,详细阐述世界先进国家的区域 ITS 框架开发的方法;最后结合我国、北京市的实际特点,为我国和北京市区域 ITS 框架设计及发展提供理论参考。

本项目主要开发了北京市区域 ITS 体系框架。北京市区域 ITS 体系框架是在首轮调研的基础上,获得北京市 ITS 用户需求;

并通过归纳分析得出功能需求;功能需求映射到国家框架确定出北京市 ITS 用户服务;用户服务进一步分解到可实施的实施服务模块层次;确定物理实体及框架流,得到北京市 ITS 的物理框架;最后根据物理框架识别与确定标准需求。

在综合分析北京市未来发展目标、北京市交通发展现状、ITS 发展现状、存在问题和需求的基础上,定位北京市 ITS 发展,制订其 ITS 发展的总体目标;结

合所开发的北京市区域 ITS 体系框架规划北京市主要的应用系统;进一步识别北京市 ITS 建设项目,并根据多因素分析方法确定出所推荐的北京市 ITS 项目实施顺序;论证保障北京市 ITS顺利实施的运营机制、融资、宣传教育培训等关键问题;最后,执行北京市 ITS 系统评价。

2、框架演示

本项目开发了北京市 ITS 物理框架,ITS 物理框架的顶层物理框架图如图 1 所示。从北京市 ITS 长远发展的角度出发,规划了先进的交通管理系统

(ATMS)、先进的出行者信息系统 (ATIS)、先进的公共交通系统(APTS)、先进的车辆安全系统(AVSS)、紧急事件管理系统 (EMS)、长途客货运运营管理系统(CVOS)、维护和建设管理系统(MC),并确定了每个系统的框架图。

本项目还识别出了规划期内 43 项北京市 ITS 建设和研究的重点项目,并对项目集进行分期排序。分别对交通管理领域、电子收费领域、公共交通领域等等

多领域进行近期、中期、远期规划。先进的交通管理系统框架图如图 2 所示。

图 1 北京市 ITS 物理框架的顶层物理框架图

图 2 先进的交通管理系统框架图

城市路网动态评估与分析预报模型

单位:许昌学院

1.项目简介

城市路网动态评估与分析预报模型“是北京交通发展研究中心项目。本项目的最终目标是分阶段建立完整、可靠、实用的城市路网动态评估与分析预报模

型。主要研究内容分为五个部分,具体包括:

1 )城市路网动态评估与分析预报模型及技术研究:在该部分,从动态交通分配与交通预测模型、动态交通需求模型、路径选择行为与诱导策略、动态交通流模型参数的标定等方面总结及分析已有的理论及技术,旨在为动态交通模型奠定坚实的理论和技术应用基础。

2 )北京市区域网络动态评估与分析预报仿真平台的构建:基于 INTEGRATION 和TransModeler 两个基于不同开发目的的动态交通基础仿真平台,针对北京市的特色,进行源代码修改及二次开发,对基础仿真平台的功能进行拓展,并为评价指标体系模块预留接口,实现北京市区域网络动态评估与分析预报仿真平台的构建,完善平台功能。

3 )北京市典型区域动态交通流评估与分析预报仿真平台的搭建:在构建北京市区域网络动态评估与分析预报仿真平台后,在此研究成果基础上,搭建北京市典型区域动态交通流仿真平台。该平台以北京西三环交通走廊为典型区域,在北京市区域网络动态评估与分析预报仿真平台上实现典型区域的路网构建和数据输入,主要用于北京市典型区域的动态交通流评估及分析预报,从而实现针对不同特点的区域的动态交通模型的构建。

4 )数据采集及调研:对于在区域路网平台搭建、动态 OD 获取及交通流参数标定的过程中所需要的数据,本课题将针对特定的调研内容,分别制定科学的调研方案,在保证样本量的前提下,利用先进的设备对相关数据进行充分的采集和调研。

5 )方案测试及分析评价:在搭建北京市典型区域动态交通流仿真平台并完成标定后,可以在此平台基础上进行多种方案测试,并进行分析评价,如分时段动态交通流演变规律的分析、交通诱导方案下的评估与分析预报、公交专用道评估与分析等。

2.模型演示

本项目对城市路网动态评估与分析预报模型及技术进行深入研究的基础上,针对北京市区域交通网络特征,通过对基础仿真平台进行源代码修改及二次开

发,构建北京市区域动态评估与分析预报仿真平台。在开展基本参数数据采集、分等级交通流特性数据采集、动态 OD 数据采集的基础上,利用该平台针对西三环交通走廊建立北京市典型区域动态交通流评估与分析预报仿真平台,获取动态交通需求,实现动态交通控制方案的再现及不同等级道路交通流参数的标定,并进行多种方案测试与分析评价,从而实现辅助决策支持。

图 1 ITSS(Integration Traffic Simulation Shell)操作界面图

图 2 西三环交通走廊研究区域

图 3 西三环交通走廊区域基础路网图

税务大数据

单位:湖北大学

1. 项目简介

依托大数据中心,结合税务自身行业特点,提出拟开展的税务行业的应用研发:

1)国家税务行业的信息化发展水平

当前,税务信息化系统的税收综合征管、防伪税控、稽核协查等主体应用系统已经实现了全国统一和省级集中,地税系统所有单位部署了货物运输发票管理

系统,27个省实现了征管信息系统省级集中,20个省部署使用了国家税务总局统一的个人所得税管理系统,提高了税收业务的规范性和调整时效,促进了系统整合,减少了“信息孤岛”,支撑了分析决策。

2)面向税务信息化行业应用的贵州省大数据综合治税平台建设

贵州省作为国家云计算中心,具备采用大数据、云计算、块数据等最新的技术搭建综合治税平台的优势。在大数据综合治税平台方案中,贵州省将搭建涉税

法人基础信息库、涉税个人基本信息库、涉税行业信息库等相关数据库,接收来自政府数据交换共享平台的“块数据”,同时完成原综合治税系统历史数据迁移工作,形成大数据综合治税主题库。贵州省将以大数据、云计算、“块数据”、商业智能(BI)等最新的技术成果为抓手,以政府数据为核心,以“块数据”为突破,通过打造一个开放、共享的“块数据”政府公共平台,构建一个以财政、国税、地税为主要应用方的大数据综合应用生态系统。

3)税务信息系统数据中心应用方案

建设综合治税平台的核心,是拥有完备的税务信息系统数据中心。数据中心包括灾备(同城或异地灾备)及相关安全设备和网络设备。数据中心主要承载核

心数据库、统一信息门户、税务资源管理、税务安全管理、税务服务管理等,同时,数据中心建设需考虑通过专线与各地税务服务器实现互联。数据中心在满足现在业务需求的同时,其系统架构还需要考虑扩张性,使其满足未来业务拓展和业务5-8年的发展需要,未来可以按照实际需求自主扩展。为实现上述建设目标,规划建设的数据中心架构将网络划分为外部互联网区域、外网业务访问区域、数据交换区、内部办公区域、灾备中心五个部分,综合利用防火墙、入侵检测系统、网页防篡改系统、VPN、数字CA证书等信息安全技术手段实现区域间的隔离,以保障数据传输的安全性和生产数据的机密性。

4)“基于云计算的税务信息化运维服务平台”课题

围绕税务信息系统数据中心的建设,可以开展“基于云计算的税务信息化运维服务平台”课题,遵循国家税务信息化建设原则,基于ITIL的全生命周期流程

平台级别实现全面运维管理,专人支持的税务信息化运维云服务平台。整合呼叫中心、业务调度中心、服务运维中心、统计分析中心业务单元,有机结合到税务信息化运维云服务平台中,为税务机关和纳税人提供“统一入口、统一调度、统一标准、统一管理、统一考核”的税务信息化系统运维的统一平台。

5)预期建设目标

上述课题的目标,是在国内税务信息化运维服务平台开发中利用脱密大数据实现云计算技术、ITIL框架技术、物联网技术、软件重用技术的应用集成创新。

建立面向纳税人的税务信息化运维服务管理体系,适应纳税人多元化、个性化、快捷高效的税务运维服务需求,提高税务信息化资源利用率,实现税务信息化运维服务集中管理。

2. 应用成果

在税务行业领域,湖北大学已服务税务系统信息化建设18年,硕果累累,研发了税务征收、稽查、查询等税务信息化的多种重要核心系统,并在贵州、海

南、湖南、湖北、陕西、北京等多地税务部门推广和使用。1998年为海南省开发和部署了全省税务征管系统;2000年研发的发票管理信息系统得到国家税务总局的表彰,该系统在多个省市国、地税部门得到推广使用,并于2006年荣获海南省科学技术奖三等奖;2001由中国税务信息网络中心与湖北大学联合成立了信息网络工程研究所;2008年以来承担了贵州省地税局全省重大核心系统的研制、运维和咨询工作,仅软件研发和培训维护经费累计已3000多万元,申请软件著作权7项,成果鉴定3项,三个项目成果分别获得贵州贵阳市和六盘水市科技进步一、二、三等奖。湖北大学与贵州地税签订了湖北大学-贵州地税税务信息化建设战略合作协议,双方共同成立了“湖北大学-贵州地税电子税务研究中心”和“湖北大学-贵州地税研究生工作站”。累计培养研究生150名,直接参与团队项目实践本科生200名,通过项目驱动培养各方面优异的高素质人才。

教育大数据

单位:湖北大学

1. 项目简介

依托大数据中心,结合教育自身行业特点,提出拟开展的教育行业的应用研发:

1)教育信息化发展水平

近年来,湖北省的教育事业得到了飞速的发展,积累了较丰富的教育工作经验,在很多方面存在着优势,但是也存在一些突出的问题,主要表现在:1)从

全省范围来看教育信息化的发展还极不平衡,部分地区仍然存在信息化建设与应用相对滞后,基层信息化基础薄弱;2)部分地区教育信息化基础设施与相关技术人员及维护人员不对等;3)信息化技术人员的教育培训工作相对薄弱,相关制度、规范还未建立或刚起步,致使教育信息化建设工作难以顺利推进,信息化没能充分发挥作用;4)仍缺乏优秀数字化教育资源的汇聚融合及共享机制。因此,为了尽快落实国家、省制定的“教育规划”发展实施方案,必须加快教育信息化发展的步伐。

2)面向教育信息化行业应用的省级教育公共信息服务网站群门户建设

以各类管理系统产生的教育基础数据库为基础,面向学生、教师、学校、家长和社会公众提供信息服务;立足政务公开和便民服务,不断改进和完善公共服

务平台,实现了信息公开、网上互动和在线办事;提供了学籍学位查询、教师资格申请、高中与中职学历查询、高校毕业生就业信息查询等在线办事服务;

3)教育数字资源共享机制与平台建设解决方案

实现教育数字资源共享与平台建设,可以开展教育资源规范化和标准化处理,实现多源、多格式、异构数字教育资源的转换,通过多源、异构大数据融合技

术,形成教育资源的整合、聚类和重组的规范。同时,完善教育大数据集群架构,解决教育大数据处理的高可靠性和高智能化需求,并基于大数据预处理、组织、去重与压缩、汇聚、分析与挖掘等关键技术,建立与云计算技术融合的大数据处理平台。

4)“基于MOOC开源平台的大规模网络开放课程平台”课题

教育数字资源共享与平台建设需要在线大规模学习平台的支撑。本课题是基于MOOC开源平台edX进行本地化处理与深度二次开发,并与云计算平台结合,

确定数据中心的基础构架,开展如下研发工作:①教育大数据存储系统参考架构;②教育大数据分布式存储方式与高速加载技术,提高系统处理效率;③基于NoSQL的非结构化大数据统一存储模型,实现大数据存储的透明性、高性价比、容错性、可扩展性、一致性、可用性;④大数据的高效压缩技术,提高教育资源存取和处理的性能;⑤数据高效索引技术及其基于数据划分的查询优化,实现海量教育资源的高并发数据存取;⑥研究大数据的存储模型与数据压缩、数据去重及其查询的路由选择等技术,建立更为智能的教育大数据存储层。

5)预期建设目标

上述课题的目标,利用脱密大数据能切实满足湖北省教育信息化发展的重大技术需求,即重点围绕教育信息化应用平台、教育资源数字化建设、教育信息化

安全建设等方面开展研发工作和技术服务;能面向市场、面向企业积极开展共性技术攻关,促进科技成果转化并实现产业化;加快培养湖北省教育信息化人才,并提高教育质量、促进教育公平,促进优质教育资源普及共享,推进信息技术与教育教学深度融合。

2. 应用成果

在教育大数据领域,湖北大学得到了湖北省教育厅、湖北省科技厅等单位的大力支持,多年来湖北大学与湖北省教育厅直属单位“湖北省教育信息化发展中

心”倾力合作,长期服务于包括教育部、省教育厅、各地市局教育机构在内的各级教育管理部门,形成了长期、紧密、稳定可持续的合作关系,取得了丰硕的成果,研发了教育信息化相关应用平台30余项,项目经费累计2000余万元,在教育行业积累了丰富的项目研发经验和行业优势。并于2014年由湖北大学作为牵头单位、“湖北省教育信息化发展中心”作为合作单位成功申报了省级工程技术研究中心“湖北省教育信息化工程技术研究中心”。

中原农村智库平台

单位: 许昌学院

面向生态的城市机动车行驶轨迹实时监测与诱导模型

单位:许昌学院

1、项目简介

准确地量化机动车尾气排放是制定合理有效的交通节能减排政策的前提。机动车的运行模式分布是能够直接反映交通网络动态变化特性重要参数,而在不同

运行模式下的排放,是准确量化机动车总排放量的基础,因此,运行模式分布是不同交通策略下环境效益评价的决定因素。在现有的机动车排放的相关研究中,尚缺乏既能反映交通网络的动态变化特性,又能有效衔接机动车排放模型的方法,使交通策略在路网中的排放效益量化评价困难。

在此背景下,本项目通过在 46 辆轻型汽油车安装 GPS(Global Position System,GPS)设备,收集了覆盖不同道路类型和时间段(工作日/周末、高峰/

平峰)的海量车辆运行轨迹数据,共计 88 万余条。本项目首先通过对时间集成粒度、速度区间划分粒度以及运行模式区间划分方法等机动车运行模式模型构建中的关键问题展开分析,发现时间集成粒度越小,速度划分的间隔粒度越小,污染物排放计算的准确性越高,而运行模式区间划分方法的影响较小。其次,本项目利用高斯函数拟合了不同平均速度下的路段运行模式分布,建立了随平均速度变化的高斯参数模型,从而通过函数拟合实现了由平均速度向车辆运行模式分布的直接转换。然后,本项目通过对交叉口区域的运行模式分布特征分析,提取了交叉口运行模式特征参数,提出了基于逐步回归和运行模式分布率的参数权重确定方法,在此基础上,建立了基于粒子群聚类方法的交叉口运行模式分布模型。最后,本项目分别以北京市实行尾号限行措施和交叉口的排放评价为例,对路段运行模式分布模型和交叉口运行模式分布模型的应用方法进行了实例验证。

本项目基于现有交通运行数据采集系统和机制,构建了用于动态交通路网排放预测的运行模式分布模型,使得车流运行与交通排放有效衔接,有助于实现对

路网排放的量化,从而为政府节能减排政策的制定提供决策依据。

2、模型演示

本项目通过采集海量的车辆轨迹数据,构建了城市不同等级道路的交通运行数据库,包括逐秒的车辆速度、加速度数据等。随后,项目组探索和分析了划分

运行模式的数据集成方法,形成面向运行模型分析的数据集成系统,并在此基础上,分析了北京市不同交通指数下的速度分布规律。结合人工智能算法和排放测算模型,本项目构建了基于遗传算法的路段运行模式分布模型和基于粒子群的交叉口运行模式分布模型,并进行了案例应用。

图 1 路段运行模式建模数据收集线路图

图 2 限行前后各路段污染物排放总量对比

智慧城市方案

单位:中国信息通信研究院(工业和信息化部电信研究院)


学前教育教学能力数字化项目

单位:北京中科特瑞科技有限公司

  1. 项目简介

当前,当国家重视发展学前教育,大力推行《幼儿园教师专业化标准(试行)》形式下,幼儿教师应该重视并善于利用MOOC(Massive Open Online

Courses, MOOC)等新的信息技术学习途径,自主实现专业发展。

该项目的主要内容是与学前教育专家合作,采集整理早幼教教师的教学行为的视频数据以及专家对教学行为进行系统评估的数据,在这些数据资源的基础

上,(1)建立教学评估模型,并与教学行为的数字化资源的系统关联,为幼教教师的实践性知识增长和专业能力发展提供资源密集型、智能反应型的学习及教

学支持服务;(2)可以根据幼教的五大教育领域,建设基于MOOC开源平台的大规模网络开放课程。

  1. 技术说明

该项目包括如下研发工作:

(1)教育大数据存储系统参考架构;
(2)教育大数据分布式存储方式与高速加载技术,提高系统处理效率;
(3)基于NoSQL的非结构化大数据统一存储模型,实现大数据存储的透明性、高性价比、容错性、可扩展性、一致性、可用性;
(4)大数据的高效压缩技术,提高教育资源存取和处理的性能;
(5)数据高效索引技术及其基于数据划分的查询优化,实现海量教育资源的高并发数据存取;
(6)研究大数据的存储模型与数据压缩、数据去重及其查询的路由选择等技术,建立更为智能的教育大数据存储层。
(7)基于MOOC开源平台edX进行本地化处理与深度二次开发;
(8)使用大数据分析技术建立幼教教学评估模型。

该项目的行业应用前景在于:

(1)它可以作为幼教教师在线实践社区的核心大数据技术,与幼教专家合作,可以为幼教教师提供正式学习与非正式学习相混合的学习环境;
(2)解决偏远地区的师资问题。

儿童自适应学习大数据系统

单位:北京中科特瑞科技有限公司

  1. 项目简介

在线教育的发展经历了多个阶段,第一阶段改变了原有的信息流动的方式,第二阶段是通过一些工具优化教育的部分流程和环节;在Minerva、altschool之后

进入了第三阶段,通过重塑知识架构,利用数据技术采集分析学习行为,带来个性化教育。

自适应学习系统是指能够为学习者提供一种个性化学习服务,实现系统根据学习者的多种特点和行为倾向,如学习目标、偏好、认知水平等,采用相应的教

学策略,推荐个性化的学习路径和学习资源。

本项目的主要工作是利用早幼教在线教育网站的儿童学习行为的数据资源,结合早幼教专家确立适当的学习行为模型、用户模型和领域模型,同时研发自适

应模型、自适应引擎、呈现模型。实现以本体技术为核心,以用户模型为依据的个性化学习资源和学习路径推荐。

  1. 技术说明

用户模型描述用户的个体特征,包括学习者基本信息描述、学习风格、认知水平和兴趣爱好等;学习行为记录学习者的学习历史过程,包括学习者访问学习

资源的媒体类型、学习时间、访问频度等,系统可以根据用户的学习历史记录不断的更新用户模型;领域模型则描述领域知识的结构。自适应模型定义了根据用户模型中的信息访问领域模型各个部分,以及如何修改用户模型的规则集,这些规则将体现教学设计的内在思路;自适应引擎对应着系统的实现,根据用户模型选择、组装和呈现页面,执行适应性规则,实现根据用户学习历史记录来修改与维护用户模型。呈现模型是系统根据用户模型、领域模型、自适应模型,通过自适应引擎实现内容、导航和学习活动序列等三方面的适应性显示。在内容显示方面,要能够做到系统根据用户的学习风格呈现出不同的媒体类型、事实或抽象等特性的学习内容;在导航方面,系统要根据学习风格、认知水平及兴趣爱好等确立导航方式;在学习活动序列方面,系统可以根据学习者的学习风格适应推荐适当的学习序列。

目前自适应学习系统主要参考模型包括:

(1) 自适应超媒体应用模型(AHAM),典型系统有AHA!;
(2) LAOS(Layered WWW AHS Authoring Model),典型系统有MOT(My Online Teacher);
(3) XML自适应超媒体模型(XAHM),典型系统有DISAS;
(4) WebML,这是一种可视化语言,用于具体说明Web应用程序的内容结构和内容组织呈现并将其转化为超文本形式。典型系统有CMS(Conference Management System)

从学习风格角度考虑的自适应学习系统目前有:

(1) 基于蚁群算法ACS;
(2) 基于关联规则挖掘算法IDEAL;
(3) 基于Felder-Silverman(菲尔德-希尔佛曼)学习风格模型CS388、Tangow、MANIC、MASPLANG、LSAS等;
(4) 基于Honey&Mumford(哈尼-芝福)学习风格模型INSPIRE

从认知水平角度考虑的自适应学习系统目前有:

(1) 基于遗传算法PELS;
(2) 基于关联规则算法ELM-ART

在用户模型构建方面,目前国际上最为重要的用户建模标准是IMS LIP和IEEE PAPI,国内用户建模标准是教育部教育信息化技术标准委员会在CELTS中定义

的学习者模型CELTS-11、学生身份标识CELTS-13和学力定义规范CELTS-14。在用户模型中,学习风格的确定较多采用Felder-Silverman学习风格模型(所罗门学习风格量表),它在网络教学环境下具有良好的适用性。认知水平的估算主要通过学生的练习测验记录估算出学生对某一知识点的掌握情况,然后根据用户的认知水平不同推荐相应层次的知识资源,从而制定更加个性化的学习过程和学习目标。

领域模型的构建,目前主要依据Dubin Core和IEEE LOM两大元素标准,从章、节、知识点和学习对象四部分设计领域模型,学习对象本体描述知识点的各

种属性映射实体,包括与学习者模型相匹配的媒体类型、抽象系数、活动序列、呈现顺序等。

学习分析技术在学前教育的应用

单位:北京中科特瑞科技有限公司

1. 项目简述

学习分析(Learning Analytics)是近年来教育技术领域内迅速发展的新热点,它是运用先进的分析方法和工具预测学习结果、诊断学习中发生的问题、优

化学习效果的一类教学技术集合。学习分析技术除了传统的数据分析方法外, 充分吸收了大数据时代下各个领域的新技术, 包括社会网络分析法、话语分析法和内容分析法。这些新技术的引入,使得学习分析逐渐科学化、现代化和智能化。

本项目的主要工作是将学习分析技术拓展应用于学前教育领域,使用的利用学习分析技术进行学前教育数据的挖掘,可以为相关单位(如E-learning)提供

技术支持,通过技术来提供新的教育形态,改变教育的基本结构,提高教育的成本收益。包括:

(1)向教师、家长及管理人员及时反馈可视化的分析结果;
(2)对儿童发展评估数据、课堂行为数据进行比较、聚类等分析后,将儿童分类来推荐相关学习资源,干预学习进程,建议儿童的协作学习的最佳组合。

2. 技术说明

该项目的研究工作要解决的问题包括:

(1)学习分析要求收集并梳理不同来源的数据,且数据格式各不相同,没有统一的陈述标准,从而在系统中阻止了有关数据的共享和重复使用。另外,如果学习者的一个自定义的数据信息格式没有被记录,当其他人使用这一数据时就很难理解被存储数据信息的意义,想要对这些数据进行重复使用则很难;
(2)学习分析涉及学生隐私和档案等问题,如何合理利用这些数据,这是有关隐私权和教育数据收集许可的问题;
(3)提高数据搜集相关数据,在学习分析探究性研究中,数据跟踪为学习管理提供了一个良好的基础。学习者除了使用学习管理系统外,还经常使用各种各样的工具和相关的学习服务,所以提高相关技术来获得更多的数据非常重要;
(4)尚未有较好的分析模型,现有的多个应用项目也仅完成对学习数据的表面挖掘,在学前教育领域仍属空白;
(5)传统观念的改变是一个逐步的过程,必须要教育和引导用户,并且提供适当的培训和技术支持。

虽然学习分析在教育技术领域中是一类新兴的技术,但是其使用的技术早已应用于商业和信息技术产业的多个领域,如商业智能(BusinessIntelli-

gence)、网络分析(Web Analytics)、 教育数据挖掘(Educational Data Mining,EDM)、 学术分析Aca-demic Analytics)等。除了这些一般的分析技术外,学习分析也整合了其它的新的技术方法:

1.社会网络分析法(Social Network Analysis)原先是一种社会学研究方法, 它是对社会网络的关系结构及 其属性加以分析的一套规范和方法, 现已广泛运用于

教育领域。如果将学习者个体作为研究对象,通过社会网络分析法, 我们不难判断学习者个体向哪些同伴寻求了学习帮助,在哪些方面产生了学习认知上的困难, 又有哪些具体的情境因素影响了学习者个体的学习过程等。 如果将整个网络作为研究对象,社会网络分析法 主要关注的是网络学习过程中信息的分布和个体学习的进展情况。

2.话语分析法(Discourse Analysis)原先是一种语言学研究方法, 是在课堂对话基础上建立的口语分析方法,经过不断发展引入到教育领域,在课堂教学实践中得

到了广泛应用。 在大数据时代下,话语分析的对象不仅仅只是教学过程中面对面的对话内容, 还涉及网络课程与会议中产生的文本内容, 以及网络背景下的异步交流内容等。通过话语分析技术,我们可以对网上学习交流过程中话语的文本性含义有更深入的了解,从而探究知识建构的本质,对整个学习发生的过程获得更加清晰的认识。

3.内容分析法(Content Analysis)是一种对传播内容进行客观、系统和定量描述的研究方法。 内容分析的过程是一个层层推理的过程, 其实质是对传播内容所

含信息量及其变化的分析, 即由表征的有意义的词句推 断出准确意义的过程。在教育领域中运用内容分析法,不仅可以对学习者的学习过程数据进行定量分析, 探寻学习者的行为模式;还可对其进行定性分析,运用积累的大量经验来预测当前的学习者行为, 为学习者 提供个性化的学习资源服务。

在分析工具方面,学习分析工具可分为专用和通用工具两类。“专用工具”是专门开发用于分析学习活动和评估学习者的工具。典型的专用工具有

Socrato、SNAPP和LOCO-Analyst等。专用工具一般都是学习分析项目中的核心分析工具和开发成果,即专门针对某一项目的要求设计和开发,在项目实施中运用该工具搜集和分析学习者数据,并指导教学。而“通用工具”则是原来应用于互联网、可用性设计等其他领域内,被转用于教育情景下,用来分析学习者如何使用教学系统的工具,主要有Mixpanel Analytics、Userfly、Gephi 等几种。