大数据量对应着海量噪杂的信息,不可避免的带来大数据困惑。如何从大数据中提取关键性的代表性特征,可能是某些词汇,也可能是某些短语、命名实体或流行用语,则成为大数据分析的一把利器。 同时,大数据特征提取脱胎于语言自动分词技术,又是对分词技术的有效提升和补充,能够有效发现关键特征和行业术语。灵玖Lingjoin采用基于语义的统计语言模型,所处理的大数据不受行业领域限制,能够有效地挖掘出新出现的特征词汇,所输出的词汇可以配以权重。
系统简介:
大数据的特点有四个层面:第一,数据体量巨大。从TB级别,跃升到PB级别;第二,数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三,价值密度低。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。第四,处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume,Variety,Value,Velocity。大数据搜索引擎的主要挑战在于:海量处理规模、多字段多类型数据融合、高效的索引压缩技术及毫秒级的索引更新技术。
JZSearch大数据搜索引擎是灵玖软件联合中科院与北理工的信息检索专家,针对大数据搜索业务需求而打造的一套搜索引擎,具有专业精准、高扩展性和高通用性的特点。可支持文本、数字、日期、字符串等各种数据类型的高效索引,支持邻近搜索、负面搜索、语义关联搜索,可提供各类数据库的实时搜索服务,并支持少数民族语言。目前已经应用于中国邮政搜索引擎、河北省标准搜索引擎、富基融通(纳斯达克上市公司:EFUT)商品搜索以及新疆维文搜索引擎。
大数据培训进修班第二期来临,更强的师资阵容,全新的课程安排,多面的大数据讲解与现场实训,还在等什么,马上报名吧。
参加相关培训并通过考试的学员,可以获得: 1.由人力资源和社会保障部中国高级公务员培训中心、全国信息化计算机应用技术水平教育培训管理中心颁发《大数据技术工程师技术水平教育培训》证书。该证书可在人社部中国国家人事人才培训网查询(http://www.chinanet.gov.cn),可作为能力评价、考核和任职的重要依据。 2.中国科学院计算技术研究所教育中心颁发的《大数据技术工程师》培训证书。
大数据技术已经成为互联网后的又一个里程碑意义的科技革命与生产力革命,也是产业结构战略调整的战略机遇。如何管理自身的业务大数据,从中获取智慧,对传统业务再造并实巨大价值的产品和服务?如何将大数据困境转换为大数据宝藏?如何从大数据概念炒作到实践落地?
由北京理工大学大数据搜索挖掘实验室、中国科学院计算技术研究所教育中心联合主办,大数据论坛联合承办,开设大数据技术进修班。聘请北京理工大学赵燕平教授、张华平博士、北京市外办信息中心姜伟主任、英特尔中国研究院首席工程师吴甘沙、清华大学马宝君博士等知名专家全面讲授大数据架构、大数据搜索、大数据挖掘以及大数据应用四大板块,分享亲身经历的大数据应用,并为学员提供大数据搜索挖掘工具的实训。
本次培训讲师:
张华平:北京理工大学大数据搜索挖掘实验室主任,博士,副教授 李德伟:国家工商总局行政学院副院长 赵燕平:北京理工大学教授,教育部电子商务专家 姜伟:北京市外事办信息中心主任 吴甘沙:英特尔中国研究院首席工程师 马宝君:清华大学搜索评价与推荐系统专家
杨泽明:中科院高能物理研究所副研究员
价格:4980元 (包含发票,讲义,教材,工作餐,与讲师互动自助晚餐会); 老学员或同单位三人以上报名九折优惠;全日制学生凭学生证优惠价格2980元,不含发票。差旅及食宿费用自理。
地址:北京理工大学理工国际交流中心
课程介绍:
13日
张华平 《科学的大数据观》
李德伟 《大数据的哲学思考》
吴甘沙 《大数据架构、计算范式与应用实践》
杨泽明 《云计算关键技术与应用实训》
14日
张华平 《大数据精准搜索关键技术》
李望 《实训演练》(JZSearch大数据精准搜索引擎实训演练)
张华平 《大数据挖掘关键技术》
学员互动 《NLPIR大数据挖掘平台学员实训》
15日
姜伟 《大数据背景下的电子政务实践》
马宝君 《大数据背景下的电子商务实践》
张华平 《大数据答疑解惑》(针对每个学员事先准备的问题,每个人3分钟机会;然后根据投票结果选取3个经典问题进行综述。)
【报名通道】: http://118.192.14.52/bigdatatrain/
报名电话:13681251543 010-62648067