资源列表
[中文信息处理] GB2312ToUnicode
说明:GBK 转 unicode 提供二分法查询-translate the gbk to the unicode,with the bianary search way<周飛> 在 2025-06-20 上传 | 大小:72kb | 下载:0
[中文信息处理] ngramtool
说明:This is a small program to extract and display user-definable ngrams in a collection of English texts.<frank liang> 在 2025-06-20 上传 | 大小:117kb | 下载:0
[中文信息处理] VTVectorSubtract
说明:字符串列表相减器 工作中常遇到重复处理事务,比如求职过程中,经过一段时间后以前考虑过的职位又被重新考虑造成时间浪费。该工具帮助挑选出重复内容、不同内容,应用在多种场合,帮助减少重复工作: 给出A,B列表,计算A-B, (A-(A-B)), (B-(A-B))。-Strings list subtraction program. Frequently encountered in the work of double handling of affairs, such as job s<黄维特> 在 2025-06-20 上传 | 大小:164kb | 下载:0
[中文信息处理] IKAnalyzer3.1.1_userguide
说明:java分词程序,能够精确分词,包含词库等-java word program, word accurately, including the thesaurus, etc.<novo> 在 2025-06-20 上传 | 大小:465kb | 下载:0
[中文信息处理] Multilizer_2007_Enterprise_v7.1.8.774
说明:Multilizer 2007 Enterprise - a powerful program designed for transfer programs. Understand the immense number of formats, can distinguish between the type of programming language used in the program. It is possible to edit files for different OS plat<Fire> 在 2025-06-20 上传 | 大小:26.82mb | 下载:0
[中文信息处理] windows_c_32(1)
说明:中国科学院的分词软件,正确率98 以上,目前最好的分词工具-Chinese Academy of Sciences word software, over 98 accuracy rate is currently the best tool for sub-word<fangcao> 在 2025-06-20 上传 | 大小:10.98mb | 下载:0
[中文信息处理] chinese-text
说明:文本分类语料库,经过编辑手工整理与分类的新闻语料与对应的分类信息。其分类体系包括几十个分类节点,网页规模约为十万篇文档-Text classification corpus, edited manually compiled and classification of news corpus and the corresponding classification information. Their classification system includes dozens of classi<Alec> 在 2025-06-20 上传 | 大小:740kb | 下载:0