资源列表
[其它资源] BiHZFreqCode
说明:汉字二字组频度统计。可以统计汉字文本中二字组的频度。很好用。中文文本分词很有用的工具。-Chinese word frequency statistics group. Chinese statistics can text the word frequency group. Good use. Chinese text segmentation useful tool.<housxu> 在 2025-06-10 上传 | 大小:5.03mb | 下载:0
[其它资源] bianliwenjianjia
说明:该源码可以从一个文件夹中撮所有的文件及文件夹名,并形成目录树,显示在控件中,供你查看。-the source code from a folder summarized all the documents and folders, and create directory tree and, displayed on the controller, you look for.<郑明> 在 2025-06-10 上传 | 大小:17kb | 下载:0
[其它资源] ChineseTokenizer20060426
说明:分词文件,是一个比较简单词库.简单的说就是个强大的搜索-word document is a relatively simple thesaurus. Simply means that the powerful search<杨占成> 在 2025-06-10 上传 | 大小:982kb | 下载:0
[其它资源] jiangyutang_A0617389_homework1
说明:分析一个英文文本文件中所有单词出现的频率,用linux下的标准c语言实现,是我的internet高级编程的第一次作业。编译后在可执行文件后跟上一个英文文本文件名字就可以了,程序会在屏幕打印出该文件中每个单词出现的次数。可以作为linux下的c语言学习例程使用。-an analysis of the English text document, all words, the frequency, linux using the standard c language, the internet i<糖糖> 在 2025-06-10 上传 | 大小:1kb | 下载:0
[其它资源] bigram
说明:程序主要是对corpus进行统计,然后计算每句话的概率。由于考虑到汉字GB码的特性,在统计时先对内码进行处理,然后把统计结果直接放入对应的数组元素中,因此可以节省统计时字与间相互比较及词与词间相互比较的时间。-procedures are the major corpus statistics, and then calculate the probability of everything. Taking into consideration that the Chinese GB code,<王磊> 在 2025-06-10 上传 | 大小:10kb | 下载:0
[其它资源] hisense
说明:程序的主要思想是先对数组进行处理,使其有序,处理后的结果存放在t1.txt文件中。。然后在此基础上建立索引,使在查字典时可以减少比较的次数,节省程序的时间。再利用最大匹配算法对程序进行分词,分词的结果保存在t2.txt文件中。然后再拿分好词的文件与libing_test文件进行比较匹配率,匹配结果存放在result.txt文件中。-procedures main idea is first to array processing, it orderly, After processing the<王磊> 在 2025-06-10 上传 | 大小:181kb | 下载:0