汉语分词系统NLPIR 2014
发布于 1年前 作者 562761013 1482 次浏览

汉语分词系统NLPIR(前身ICTCLAS)从2000年诞生以来,历时14年,全球用户突破30万,先后获得了2010年钱伟长中文信息处理科学技术奖一等奖,2003年国际SIGHAN分词大赛综合第一名,2002年国内973评测综合第一名,已经成为中文信息处理领域标杆性的工作。ICTCLAS创始人张华平博士倾力打造,即将推出的NLPIR2014版,是迄今为止最大的一次更新,在汉语分词体系架构下增加了对英文词法分析的支持,可以自动识别英文词汇的原型、词性标注、命名实体与关键词;并在当前汉语词法分析的基础上,实现了文档的完整语义分析,自动提取文档的人名、地名、机构名、文章作者、发布的媒体、关键词与摘要,是当前中文信息处理的必备神器,值得期待! 我们即将召开NLPIR2014发布暨ICTCLAS用户大会,由北京理工大学大数据搜索挖掘实验室主办,计算机世界与大数据论坛联合承办。张华平博士诚邀历年来所有支持我们前行的ICTCLAS用户,中文分词及中文信息处理的技术爱好者莅临参加,分享中文语言智能理解的美妙。届时,张华平博士将亲自讲解NLPIR2014背后的技术原理与最新进展,并由资深工程师在不同操作系统不同开发语言下NLPIR的实训技巧,同时还有不同背景的资深用户分享他们的使用开发经验。 在线报名:http://118.192.14.52/bigdatatrain/bm.jsp (请注明NLPIR2014;场地有限,只接收前100名) 基本信息 会议形式 (a) PPT算法讲解; (b) NLPIR2014系统演示与实际开发操作; © 针对学员具体需求的互动交流会 (d) 提供专属U盘:保护NLPIR2014的演示系统、各类试用的API以及新版开发手册; 会议时间 12月21日上午9:00-12:00,下午13:30-17:00 ( 17:00-18:00 开放式讨论答疑 ) 门票费用 (a)1400元 (包含门票,NLPIR2014演示系统、开发包与文档, U盘,工作餐,赠送由张华平博士亲笔签名的《大数据搜索与挖掘》专著); (b) 12月10日前缴费优惠价1300元;老学员或同单位三人以上报名九折优惠;全日制学生凭学生证会费优惠价格980元,不含发票。 ©名额有限,参会者需在参会前提前购买门票。 (d)差旅及食宿费用自理。 与会嘉宾 主讲人:张华平:NLPIR(ICTCLAS)创始人与开发者,北京理工大学大数据搜索挖掘实验室主任,博士,副教授 主持人:赵燕平:北理工经管学院教授,北京理工大学大数据搜索挖掘实验室副主任 特邀ICTCLAS典型用户嘉宾待定(将包括跨国企业、金融、政府机关、科研院所、投资与互联网等代表性用户) 会议地址 北京理工大学理工国际交流中心 在线报名:http://118.192.14.52/bigdatatrain/bm.jsp (请注明NLPIR2014;场地有限,只接收前100名) ICTCLAS创始人张华平博士简介 2005年博士毕业于中科院计算所,研究方向为:微博计算、自然语言处理、信息检索与信息安全、大数据搜索与挖掘。曾先后获得2010年度钱伟长中文信息处理科学技术奖一等奖,中科院院长优秀奖、中科院计算所所长特别奖,中科院计算所“百星计划”首批入选者。张华平作为课题组长主持开发了国家自然科学基金、863、973、242等科研课题十余项,发表《大数据搜索与挖掘》《信息检索:算法与启发式规则》《自然语言理解》等专译著3部,所研制的ICTCLAS分词系统已经向国内外的企业和学术机构颁发了三十万多份授权,在学术界和产业界得到了广泛的应用。并作为特邀技术专家,先后在中央电视台、全国网络侠客行大会、全球大数据技术峰会、中国网络科学大会上做大数据相关的主题演讲,广受好评。 会议日程 时间 讲师 环节 主要内容 8:00-9:00 各位参会人员 会议报到 签到,领取各项资料。 9:00-9:20 赵燕平教授 大会开幕式 开幕式致辞,嘉宾与学员介绍 9:20-09:50 张华平博士 NLPIR2014发布

  1. NLPIR2014功能展示:分词、词性标注、命名实体识别、新词识别、英文分析、关键词提取;
  2. NLPIR2014开发包介绍 09:50-10:10 合影留念及茶歇 10:10-12:00 张华平博士 NLPIR2014汉语分词关键技术及最新进展
  1. ICTCLAS的层叠隐马分词模型(汉语分词、未登录词识别、词性标注)
  2. ICTCLAS的典管理专利算法:完美双数组TRIE树;
  3. 新词识别与关键词提取算法原理;
  4. NLPIR2014英语词法分析技术; 12:00-13:30 工作午餐 13:30-15:00 张华平博士 康肖钰硕士生 张冰波硕士生 NLPIR2014汉语分词开发包使用实训
  5. NLPIR2014 C/C++语言调用实训
  6. NLPIR2014 Java语言调用实训
  7. NLPIR2014 Linux调用实训
  8. NLPIR2014 高级编程实训(多程安全、用户自适应分词、python调用、关键词提取等) 15:00-15:40 朱勇高级工程师 NLPIR示范应用:黄金眼Web大数据搜索与挖掘平台 主要介绍利用NLPIR系统开发的黄金眼Web大数据搜索与挖掘平台,展示主要功能与背后的实战应用经验 15:00-15:30 朱勇高级工程师 NLPIR示范应用:黄金眼Web大数据搜索与挖掘平台 主要介绍利用NLPIR系统开发的黄金眼Web大数据搜索与挖掘平台,展示主要功能与背后的实战应用经验,目前已经应用于工信部、总参、财经杂志等单位。 15:30-16:00 姜伟(北京外事办信息中心主任) NLPIR示范应用:政务公文主题词提取系统 主要介绍利用NLPIR系统开发的政务公文主题词系统,历经十余年,目前已经应用于大部分政府机关。 16:00-16:30 罗文川(缔元信CTO) NLPIR示范应用:缔元信网站统计数据挖掘与应用 主要介绍缔元信利用NLPIR系统开发的互联网网站统计数据挖掘与应用,是目前网站统计方面权威的机构。 16:30-17:00 待定 17:00-18:00 张华平博士 交流沙龙 可与ICTCLAS创始人张华平博士直接交流讨论 名额有限,先到先得,参会报名热线: 张老师 :13681251543 Email: zhangjie@bigdatabbs.com 官网支持:http://ictclas.nlpir.org 在线报名:http://118.192.14.52/bigdatatrain/bm.jsp (请注明NLPIR2014;场地有限,只接收前100名)
1 回复

2013年12月21日,在北京理工大学召开ICTCLAS的分词用户大会,发布最新版本,ICTCLAS的作者张华平博士将现场讲解分词算法的原理,并集中培训分词在Windows,Linux下C/C#/Java调用的各类使用方法与技巧。 参加发布会在线报名:http://ictclas.nlpir.org/newsDetail?DocId=387

回到顶部