Tuesday, January 17, 2006

Chinese Article Evaluation Tool

Chinese Article Evaluation Tool will evalute your article by counting number of unique Chinese characters in the article, how many of them is not in the first 500 character list (cover 72.1% usages in classical and modern Chinese texts so to learn Chinese effectively, we'd better first learn those characters), thus to determine if this is an easy article for beginers or not. It is a good Chinese Character Counting Tool too. The stripped text with puctuation marks removed can be used as materials to have students practice Chinese style punctuation marks.

Version 0.2 may include unspecified updates, enhancements, or bug fixes. More anhancements are coming soon by adding word counting and level determining engine so it makes it easier for teachers/tutors to select appropriate reading materials for their students, and to evaluate how well their students perform in their Chinese writing. The output format will be refined once I have a little bit more time.
Try it at www.dengsoft.com/pub/xuezhongwen/evaluate.php?enc=gb2312

Monday, January 09, 2006

中国计算语言学综述 - 资料汇编(未完成稿)


人文背景:


上海师范大学应用语言学研究所


教育部语言文字应用研究所计算语言学研究室


中国社科院语言所应用语言学研究室


国家语言文字工作委员会语言文字应用研究所,计算语言学研究室


北大计算语言学所


南师大语言科技系


IBM、微软、富士通、东芝、TRS、哈工大惠通


中国社会科学院民族学与人类学研究所语音学与实验语言学研究室


中国民族语言研究中心及语音学与计算语言学重点实验室


纯理工背景:


哈工大计算机学院 (李生)


上海交通大学计算语言学虚拟信息中心


教学:


Shanghai Normal University

会议:


汉语字本位理论专题研讨会

全国计算语言学联合学术会议



全国学生计算语言学研讨会(SWCL)



学会:


中国中文信息学会


中华民国计算语言学学会

http://www.aclclp.org.tw/index_c.php


期刊:


《中文信息学报》


人物:


陆汝占


詹卫东的[语言学光标]个人主页


俞士汶


冯志伟,1939年4月15日生,云南省昆明市人,1957年考入北京大学地球化学专业本科学习,1959年转入北京大学中文系汉语专业本科学习,1964年考入北京大学中文系语言学专业读研究生,1967年毕业,改行到昆明五中当物理教员,1978年考入中国科学技术大学研究生院信息科学系机器?shy;译专业学习,接着被选派到法国格勒诺布尔理科医科大学应用数学研究所(IMAG)自动?shy;译中心(CETA)师从法国著名数学家、国际计算语言学委员会主席沃古瓦(B.Vauquois)教授专门研究数理语言学和机器?shy;译问题。1981年回国,在中国科学技术情报研究所计算中心担任机器?shy;译研究组组长,1985年调入国家语言文字工作委员会语言文字应用研究所,担任计算语言学研究室主任。1986-1988年在德国夫琅禾费研究院(FhG)新信息技术与通信系统研究所担任客座研究员,1990-1993年在德国特里尔大学担任客座教授,1996年在德国康斯坦茨高等技术学院国际术语学和应用语言学中心(CiTaL)担任技术顾问。现为语言文字应用研究所研究员、博士生导师(与北京广播学院联合建立博士点)。1998年5月退休。1999年10月-2000年8月再次在德国特里尔大学担任客座教授。2000年8月-2001年8月担任桑夏自然语言处理研究院高级研究员。2001年9月到现在担任韩国科学技术大学(KAIST)电子工程与计算机科学系(EECS)教授。



http://www.china-language.gov.cn/jgsz/jss/images/feng/feng.htm



计算语言学文献选录



陈力为,袁琦主编.《中文信息处理应用平台工程》,北京:电子工业出版1995.
































俞士汶.关于现代汉语词语的语法功能分类.  
张普.论语义场.又见:<<机器?shy;译研究进展>>,电子工业出版社,1992年8月.
张普.信息处理用现代汉语语义分析的理论与方法.又见:《中文信息学报》,1991年第3期Vol.5,-No.3
陈群秀,张普.信息处理用现代汉语语义分类体系:属性分类.  
陈群秀,张普.信息处理有现代汉语语义词典支撑环境的初步构想. 
陈群秀.有关语义分类体系研究的几个问题. 
鲁川.现代汉语的语义网络.


http://www.hackchi.com/hnc/papers/compulin/paperml.htm)


计算语言学和自然语言信息处理研究和应用综述(http://www.cass.net.cn/chinese/s18_yys/yingyong/courses/nlpbase.htm)


俞士汶《计算语言学论文集(4)》(北京大学计算语言研究所)


Friday, December 30, 2005

http://www.dengsoft.com

Check out http://www.dengsoft.com

Gonna try this:
http://www.dengsoft.com


Very informative web site.

Friday, June 03, 2005

Chinese Text Annotator

Chinese Text AnnotatorBreak a text into words and add links to dictionary entries.