搜索资源列表
编译原理及实践
目 录
译者序
前言
第1章 概论 1
1.1 为什么要用编译器 2
1.2 与编译器相关的程序 3
1.3 翻译步骤 5
1.4 
Greta
- 正则表达式计算,可以快速地从一个字符串中提取有效字符
WeatherForecast
- java写的天气预报信息获取、提供,HttpURLConnection抓取信息,正则表达式提取。-the weather information access, delivery, HttpURLConnection crawls information, Regular expressions are extracted.
RegExTest_new
- VC下实现正则表达式的基本功能,可以根据定义的reg expressions解析日志,提取相应提取项,本人在MFC下测试通过.-under VC expression is the basic functions under the definition of analytic expressions reg logs extracted from the corresponding item, I MFC test.
Jianyang
- 在VC 6.0平台下,读取G代码文件,利用Boost中Regex正则表达式逐行提取数控G代码中的数值,分析两行G代码之间各轴速度变化。提供保存分析结果功能-in VC 6.0 platform, reading the G code files, Boost China Regex using regular expression Progressive extraction G NC numerical code, Analysis
GetTestSpeed_Proxy
- 1.通过正则表达式来提取代理网站中地址和端口. 2.通过多线程验证代理的可用性并测试的代理的连接速度. 3.可以处理如\"代理中国\",\"Proxy4free\",\"www.aliveproxy.com\"等国内外知名代理网站的数据. 4.自动保存结果.-1. Through the regular expression to extract agency website addresses and ports. 2.
try
- 利用正则表达式,进行文件的匹配提取,替换,添加等功能,可以保存为二进制格式或ascii码形式的文件.
html_2_text
- 提供以下功能:HTML->TXT转换、文件合并、TXT文件段落合并、TXT文件分行、编码(GB/GBK/Big5/Shift-JIS/Unicode)转换(只能用于Win 2k/XP)、文本替换、HTML代码整理、文件切分、文本提取、正则表达式、TCR批量压缩/解压,用于整理从Internet上下载的小说。软件原名FineReader,后更名为TextForever。
collectEmail
- 最近一直琢磨着写一个网络蜘蛛程序,专门负责收集一些自己感兴趣的东西。用.net写程序从网上取得网页源码比较容易实现,蜘蛛程序的难点在于两个方面,一是如何多线程的自动化处理(即从一个地址跳到另一个地址),另一个是从网页中提取指定的信息。自动化处理方面正在研究,从网页中提取信息,我觉得网上某些网友用String/StringBuilder来处理的方法不可取,用“正则表达式”无疑是最好的。尽管“正则表达式”不容易书写,但查一查资料,还是不难
webharvest1-project
- Web-Harvest是一个Java开源Web数据抽取工具。它能够收集指定的Web页面并从这些页面中提取有用的数据。Web-Harvest主要是运用了像XSLT,XQuery,正则表达式等这些技术来实现对text/xml的操作
apache-tika-0.1-incubating-src.tar
- apache基金项目tika,是一个可以对内容进行分析、提取的开发包,结合正则开发包,可以开发基于垂直搜索引擎,目前正处于孵化阶段,这里是目前的最新版本
TestOfWebharvest05-all
- Web-Harvest是一个Java开源Web数据抽取工具。它能够收集指定的Web页面并从这些页面中提取有用的数据。Web-Harvest主要是运用了像XSLT,XQuery,正则表达式等这些技术来实现对text/xml的操作。测试版本。
javaGetWeather
- java获取天气预报的程序,是利用正则式的方式从Web中提取天气预报的信息
chinese_get
- 从网页中提取出汉字信息,运用正则表达式提取。
ProxyTest
- 用于查找一个合适的代理服务器。方法是从某代理网站(经作者多次测验,该网站提供的代理网址比较好用,但连接某个特定网站可能会有问题)的网页中提取出代理网址和端口,依次测试,直到找到一个可以连接的为止。免去作者每次都要手工的在IE里面测试的麻烦。纯属个人的玩具程序。-looking for a suitable proxy. Method Acting is a website (repeated tests by the author, t
ContentAnalyzer
- 搜索引擎正文提取程序,通过html分析和正则,去掉html代码,保留网页正文,只针对中文有效。英文稍加修改即可使用。-The body of the search engine extraction process, through analysis and regular html remove html code to retain the page text, only effective against the Chinese.
PBS_monitor
- C# 实现的一个完整的web页面定时监测程序,支持APSX编写的登入页面,先登入后读出想要监测页面面,然后调用正则表达式实现特殊信息的提取,并从XLS中读出相关的信息,然后发送信息(Windows MSMQ),可以实现在线短信等的功能。 所有要监控的信息和条件都在config文件中设置。-C# to achieve a complete web page from time to time to monitor the proces
HtmlRegex
- C++下用于对HTML标签进行正则提取的演示代码。测试环境VS2010。-In C++ is used to extract the HTML tags for regular demo code. Test environment VS2010.
zeroCrawer
- 爬虫,多线程,生成日志文件,可以设置任务循环,正则提取需要信息!-Reptiles, multi-threaded, generate a log file
crawl-master
- php爬虫系统 * 程序只支持CLI # 安装程序 ### 1.dbconfig.php 添加正确的数据库配置 ### 2. 安装程序 ```PHP php run install # 启动程序 ### 安装完成后,在setting表添加来源站点及正则提取规则。 ### 启动程序 (参数是 setting 表id)(* program only supports CLI # setup ### 1.dbconfig